Animais

Um motor de busca de sequências para uma nova era da genômica da conservação – ScienceDaily


Uma equipe de pesquisadores dos Institutos Max Planck de Biologia do Desenvolvimento em Tübingen e do Max Planck Computing and Data Facility em Garching está desenvolvendo novos recursos de pesquisa que permitirão comparar a composição bioquímica de diferentes espécies de toda a árvore da vida. Sua combinação de precisão e velocidade é incomparável até agora.

Os humanos compartilham muitas sequências de nucleotídeos que constituem nossos genes com outras espécies, especialmente porcos, mas também camundongos e até bananas. Consequentemente, algumas proteínas em nosso corpo (cadeias de aminoácidos montadas de acordo com o modelo de genes) também podem ser as mesmas (ou semelhantes) a algumas proteínas de outras espécies. Essas semelhanças podem, às vezes, indicar que duas espécies têm um ancestral comum, ou podem simplesmente surgir se a necessidade evolutiva de um determinado recurso ou função molecular surgir nas duas espécies.

Ultrapassando o padrão ouro da pesquisa genômica comparativa

Mas é claro que descobrir o que você compartilha com um porco ou uma banana pode ser uma tarefa monumental; Encontrar um banco de dados com todas as informações sobre você, o porco e a banana é bastante complicado computacionalmente. Os pesquisadores esperam que os genomas de mais de 1,5 milhão de espécies eucarióticas, que incluem todos os animais, plantas e fungos, sejam sequenciados na próxima década. “Mesmo agora, com apenas centenas de milhares de genomas disponíveis (a maioria representando pequenos genomas de bactérias e vírus), já estamos analisando bancos de dados com até 370 milhões de sequências. A maioria das ferramentas de pesquisa atuais seria simplesmente impraticável e demoraria muito para analisar os dados – da magnitude que esperamos em um futuro próximo “, explica Hajk-Georg Drost, líder do grupo de Biologia Computacional no Departamento de Biologia Molecular do Instituto Max Planck de Biologia do Desenvolvimento em Tübingen.

“Por muito tempo, o padrão ouro para esse tipo de análise era uma ferramenta chamada BLAST”, lembra Drost. “Se você tentou rastrear como uma proteína foi mantida por seleção natural ou como ela se desenvolveu em diferentes linhagens filogenéticas, o BLAST deu a você as melhores correspondências nesta escala. Mas é previsível que em algum ponto os bancos de dados crescerão muito para BLAST abrangente pesquisas. “.

Encontre a agulha no palheiro, mas rápido!

No cerne do problema está uma troca entre velocidade e sensibilidade: assim como alguns ovos de Páscoa pequenos ou bem escondidos serão perdidos se você fizer uma varredura em uma sala apenas brevemente, geralmente ocorre acelerar a busca por semelhanças de sequência de proteínas em um banco de dados com a desvantagem de perder algumas das coincidências menos óbvias.

“É por isso que há algum tempo começamos a projetar o algoritmo DIAMOND, na esperança de que nos permitisse lidar com grandes conjuntos de dados em um período de tempo razoável”, lembra Benjamin Buchfink, colaborador e aluno de doutorado do grupo de pesquisa do Drost, que tem desenvolvido o DIAMOND desde 2013. “Sim, mas também teve uma desvantagem: não conseguiu capturar algumas das relações evolutivas mais distantes.” Isso significa que, embora o DIAMANTE original possa ter sido sensível o suficiente para detectar uma certa sequência de aminoácidos humana em um chimpanzé, ele pode ter sido cego para a ocorrência de uma sequência semelhante em uma espécie evolutiva mais remota.

Uma ferramenta poderosa para pesquisas futuras

Embora útil para estudar material que foi extraído diretamente de amostras ambientais, outros objetivos de pesquisa requerem ferramentas mais sensíveis do que o algoritmo de pesquisa DIAMOND original. A equipe de pesquisadores de Tübingen e Garching agora foi capaz de modificar e estender o DIAMOND para torná-lo tão sensível quanto o BLAST, mantendo sua velocidade superior: com o DIAMOND aprimorado, os pesquisadores serão capazes de conduzir pesquisas genômicas comparativas com a precisão do BLAST em um computador aceleração de 80 a 360 vezes. “Além disso, o DIAMOND permite que os pesquisadores realizem alinhamentos de sensibilidade do tipo BLAST em um supercomputador, cluster de computação de alto desempenho ou na nuvem de uma maneira verdadeiramente paralela, permitindo alinhamentos de sequência em grande escala em um tempo gerenciável.” Acrescenta Klaus Reuter, colaborador para Max Planck Computing and Data Facility. “

Algumas consultas que outras ferramentas levariam dois meses em um supercomputador podem ser concluídas em várias horas com a nova infraestrutura DIAMOND. “Considerando o crescimento exponencial no número de genomas disponíveis, a velocidade e a precisão do DIAMOND é exatamente o que a genômica moderna precisa aprender com a coleção inteira de todos os genomas, em vez de ter que se concentrar apenas em um número menor de espécies. Especialmente devido a uma falta de capacidade de pesquisa responsiva “, prevê Drost. Portanto, a equipe está convencida de que todos os benefícios do DIAMOND se tornarão aparentes nos próximos anos.

Fonte da história:

Materiais fornecido por Max-Planck-Gesellschaft. Nota: o conteúdo pode ser editado quanto ao estilo e comprimento.


Traduzido de Science Daily

Source link

Artigos relacionados

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo