Um motor de busca de sequências para uma nova era da genômica da conservação – ScienceDaily

Kora SilvaÚltima Atualização abril 19, 2021

A importância dos caranguejos deve ser considerada ao observar o aumento da pressão humana na Reserva Natural Barr Al Hikman - ScienceDaily

[ad_1]

Uma equipe de pesquisadores dos Institutos Max Planck de Biologia do Desenvolvimento em Tübingen e do Max Planck Computing and Data Facility em Garching está desenvolvendo novos recursos de pesquisa que permitirão comparar a composição bioquímica de diferentes espécies de toda a árvore da vida. Sua combinação de precisão e velocidade é incomparável até agora.

Os humanos compartilham muitas sequências de nucleotídeos que constituem nossos genes com outras espécies, especialmente porcos, mas também camundongos e até bananas. Consequentemente, algumas proteínas em nosso corpo (cadeias de aminoácidos montadas de acordo com o modelo de genes) também podem ser as mesmas (ou semelhantes) a algumas proteínas de outras espécies. Essas semelhanças podem, às vezes, indicar que duas espécies têm um ancestral comum, ou podem simplesmente surgir se a necessidade evolutiva de um determinado recurso ou função molecular surgir nas duas espécies.

Ultrapassando o padrão ouro da pesquisa genômica comparativa

Mas é claro que descobrir o que você compartilha com um porco ou uma banana pode ser uma tarefa monumental; Encontrar um banco de dados com todas as informações sobre você, o porco e a banana é bastante complicado computacionalmente. Os pesquisadores esperam que os genomas de mais de 1,5 milhão de espécies eucarióticas, que incluem todos os animais, plantas e fungos, sejam sequenciados na próxima década. “Mesmo agora, com apenas centenas de milhares de genomas disponíveis (a maioria representando pequenos genomas de bactérias e vírus), já estamos analisando bancos de dados com até 370 milhões de sequências. A maioria das ferramentas de pesquisa atuais seria simplesmente impraticável e demoraria muito para analisar os dados – da magnitude que esperamos em um futuro próximo “, explica Hajk-Georg Drost, líder do grupo de Biologia Computacional no Departamento de Biologia Molecular do Instituto Max Planck de Biologia do Desenvolvimento em Tübingen.

“Por muito tempo, o padrão ouro para esse tipo de análise era uma ferramenta chamada BLAST”, lembra Drost. “Se você tentou rastrear como uma proteína foi mantida por seleção natural ou como ela se desenvolveu em diferentes linhagens filogenéticas, o BLAST deu a você as melhores correspondências nesta escala. Mas é previsível que em algum ponto os bancos de dados crescerão muito para BLAST abrangente pesquisas. “.

Encontre a agulha no palheiro, mas rápido!

No cerne do problema está uma troca entre velocidade e sensibilidade: assim como alguns ovos de Páscoa pequenos ou bem escondidos serão perdidos se você fizer uma varredura em uma sala apenas brevemente, geralmente ocorre acelerar a busca por semelhanças de sequência de proteínas em um banco de dados com a desvantagem de perder algumas das coincidências menos óbvias.

“É por isso que há algum tempo começamos a projetar o algoritmo DIAMOND, na esperança de que nos permitisse lidar com grandes conjuntos de dados em um período de tempo razoável”, lembra Benjamin Buchfink, colaborador e aluno de doutorado do grupo de pesquisa do Drost, que tem desenvolvido o DIAMOND desde 2013. “Sim, mas também teve uma desvantagem: não conseguiu capturar algumas das relações evolutivas mais distantes.” Isso significa que, embora o DIAMANTE original possa ter sido sensível o suficiente para detectar uma certa sequência de aminoácidos humana em um chimpanzé, ele pode ter sido cego para a ocorrência de uma sequência semelhante em uma espécie evolutiva mais remota.

Uma ferramenta poderosa para pesquisas futuras

Embora útil para estudar material que foi extraído diretamente de amostras ambientais, outros objetivos de pesquisa requerem ferramentas mais sensíveis do que o algoritmo de pesquisa DIAMOND original. A equipe de pesquisadores de Tübingen e Garching agora foi capaz de modificar e estender o DIAMOND para torná-lo tão sensível quanto o BLAST, mantendo sua velocidade superior: com o DIAMOND aprimorado, os pesquisadores serão capazes de conduzir pesquisas genômicas comparativas com a precisão do BLAST em um computador aceleração de 80 a 360 vezes. “Além disso, o DIAMOND permite que os pesquisadores realizem alinhamentos de sensibilidade do tipo BLAST em um supercomputador, cluster de computação de alto desempenho ou na nuvem de uma maneira verdadeiramente paralela, permitindo alinhamentos de sequência em grande escala em um tempo gerenciável.” Acrescenta Klaus Reuter, colaborador para Max Planck Computing and Data Facility. “

Algumas consultas que outras ferramentas levariam dois meses em um supercomputador podem ser concluídas em várias horas com a nova infraestrutura DIAMOND. “Considerando o crescimento exponencial no número de genomas disponíveis, a velocidade e a precisão do DIAMOND é exatamente o que a genômica moderna precisa aprender com a coleção inteira de todos os genomas, em vez de ter que se concentrar apenas em um número menor de espécies. Especialmente devido a uma falta de capacidade de pesquisa responsiva “, prevê Drost. Portanto, a equipe está convencida de que todos os benefícios do DIAMOND se tornarão aparentes nos próximos anos.

Fonte da história:

Materiais fornecido por Max-Planck-Gesellschaft. Nota: o conteúdo pode ser editado quanto ao estilo e comprimento.

[ad_2]
Traduzido de Science Daily

Source link

Kora SilvaÚltima Atualização abril 19, 2021

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Um motor de busca de sequências para uma nova era da genômica da conservação – ScienceDaily

Kora Silva

Deixe um comentário Cancelar resposta

Aves insulares e o ecossistema costeiro voltam ao equilíbrio natural após a eliminação de roedores invasores

Principais ramos da biologia

Como Planejar Uma Aula de Biologia

O que é Endoesqueleto: Um Guia Completo para Entender seu Funcionamento e Importância

Dicas para estudar biologia de maneira produtiva

Entenda porque você deve usar slides de histórias em sua aula

Artigos relacionados

Deixe um comentário Cancelar resposta