IA classifica potencial de causar doenças para todas as variações genéticas humanas

Na prática, o sequenciamento do genoma humano foi como desvendar a receita para o ser humano, mas entender essa receita não é trivial, já que ela está escrita em um idioma que ainda não compreendemos totalmente. A grande maioria do genoma é compartilhado entre todas as pessoas, mas é na pequena proporção diferente que reside toda a diversidade entre cada um de nós, sejam elas benignas como cor da pele, altura e aptidões, ou malignas como doenças. Apesar de já sabermos onde procurar a origem dessa variação, ainda não conhecemos sua relação com as manifestações biológicas que causam.

Em um trabalho publicado em outubro na renomada revista Nature, cientistas associados à Universidade de Oxford e de Harvard, nos Estados Unidos, relataram como desenvolveram uma ferramenta com inteligência artificial para ajudar nesta elucidação. Batizada de EVE – Evolutionary Model of Variant Effect, ou modelo evolucionário de efeito variante -, a ferramenta foi aplicada para predizer o risco de doenças em formas variantes de genes.

A pesquisa começou com o treinamento da ferramenta utilizando 250 milhões de sequências de proteínas de 140 mil espécies não humanas para encontrar padrões de variação genética e assim determinar se uma forma variante era benéfica ou causadora de doença. Os genes conservados em diferentes espécies tendem a ser benéficos, já que do contrário eles teriam sido eliminados pelo processo de evolução. Com base nesses resultados, os cientistas utilizaram a EVE para analisar 3219 genes humanos com conhecido efeito negativo, para validar a ferramenta. Animados com o resultado notadamente preciso, eles avaliaram então as predições da EVE com experimentos clínicos de mutações bem estudadas de outros cinco genes, incluindo um causador de câncer, e observaram que os resultados de ambos os métodos eram convergentes. Finalmente, a ferramenta foi aplicada para fazer predições em toda a coleção de variações presente no genoma humano, classificando mais de 256 mil sequências sem significância clínica conhecida como benignas ou malignas.

O maior trunfo do trabalho é ter possibilitado as predições sem o uso de um dataset rotulado, baseando-se somente nas frequências das mutações ao longo da evolução. Isto não só facilita o trabalho como elimina fontes de viés, dado que não há qualquer informação relevante para a grande maioria das sequências.

A expectativa é utilizar a EVE para fornecer mais informações aos médicos, que junto com outros dados como aqueles de demografia, sintomatologia e histórico clínico poderão fazer diagnósticos, prognósticos e decisões de tratamento mais precisas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.