IA cria genomas artificiais: sequências verossímeis de DNA que não pertencem a uma pessoa real

O genoma humano é composto por cerca de 30 mil genes, e cada gene tem um número variável de variantes (alelos) cujas combinações formam as características genéticas únicas de cada indivíduo. Para garantir sua generalização em relação a toda a espécie humana, as pesquisas científicas que envolvem o genoma devem envolver a comparação dos dados gerados com genomas de referência, que devem refletir nossa diversidade genética. Entretanto, por questões plausíveis de privacidade, os bancos de dados genômicos humanos não costumam estar disponíveis publicamente, sendo o acesso submetido a um longo protocolo de aprovação.

Uma alternativa aventada por pesquisadores de genética populacional seria o uso de “genomas artificiais”, ou seja, sequências genéticas que contenham as mesmas características de diversidade presentes na população mas não pertençam a nenhuma pessoa específica. Montar um genoma artificial, entretanto, tem seus próprios desafios, já que as correlações entre a presença dos diferentes alelos em diferentes conjuntos populacionais devem ser mantidas. No final das contas, são muitas as combinações possíveis para que este processo seja eficiente se desenvolvido de forma tradicional.

Mas um estudo publicado no início de fevereiro mostrou ser possível construir genomas artificiais usando inteligência artificial. Os autores recorreram às redes neurais generativas, que são especializadas em criar “novos dados”, com as mesmas características dos dados originais, depois de treinadas com dados reais. Estas redes são compostas por dois módulos, um denominado de gerador, e outro de discriminador. O módulo gerador cria novos dados, e o discriminador é quem determina se os dados, reais ou criados, passam por dados reais. O modelo criado pelos cientistas foi treinado usando sequências reais de 2500 pessoas. No final do processo, a rede se mostrou incapaz de separar os genomas reais daqueles que ela mesma criou, ou seja, ela produziu genomas plausíveis de pessoas inexistentes.

Devido a limitações computacionais, ainda não é possível gerar um genoma inteiro de uma única vez, devendo o processo ser realizado em etapas. Além disso, o sistema ainda não consegue representar adequadamente alelos muito raros, alguns dos quais podem estar associados à presença de doenças. Estes tópicos estão sendo levados em consideração pelos pesquisadores na continuidade do trabalho, assim como a investigação da originalidade dos novos genomas, ou seja, o quanto eles diferem dos genomas reais.

De acordo com os pesquisadores, esta linha de pesquisa deve contribuir para trabalhos que vão desde o entendimento de nosso passado evolucionário até episódios epidemiológicos, pela incorporação de maior diversidade genética nem sempre prontamente disponível nos bancos de dados existentes.

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.