Simulação por ML abre novas fronteiras no estudo dos processos químicos causados pela luz

A fotodinâmica é o estudo dos processos que ocorrem quando uma molécula é exposta à luz, como por exemplo na fotossíntese e nos danos que a luz ultravioleta pode ocasionar ao DNA, o que pode levar ao surgimento de câncer. Esses estudos são comumente realizados através de simulações computacionais. As simulações podem se tornar muito dispendiosas, uma vez que exigem cálculos complexos das propriedades das moléculas governadas pela química quântica. Mas uma equipe de físicos da Universidade de Viena, na Áustria, e da Universidade Técnica de Berlim, na Alemanha, acaba de publicar uma abordagem que usa machine learning para facilitar a implementação dessas simulações. Seu método é capaz de descrever todas as propriedades necessárias para simular a dinâmica molecular sob efeito da luz na escala de tempo relevantes aos ensaios.

O algoritmo começa com um set inicial de cálculos de química quântica, que são usados no treinamento de duas redes neurais. Essas redes são responsáveis por determinar as propriedades químicas que serão utilizadas na simulação. Acontece que as propriedades são determinadas pela geometria das moléculas, e como o espaço geométrico é praticamente infinito, é inviável fazer todos os cálculos possíveis. É aí que a estrutura da rede faz a diferença: se as saídas das duas redes forem suficientemente similares, os dados são considerados válidos; caso contrário, considera-se que a geometria em questão não estava bem representada no set inicial de treinamento, as propriedades são recalculadas de acordo com os princípios da química quântica, e incluídas no set de treinamento para que as redes neurais sejam treinadas novamente. Esse processo é chamado de amostragem adaptativa.

Os autores primeiro testaram a eficiência do algoritmo na simulação fotodinâmica do metilenimônio, uma molécula que sofre alterações ultrarrápidas entre diferentes estados eletrônicos após a excitação com luz. Os resultados obtidos pela rede neural foram muito similares àqueles calculados com as equações da química quântica, e também com os dados de literatura. Além disso, devido ao baixo custo computacional, o método permitiu a simulação por até 1 nanossegundo, que é um período 10.000 vezes mais longo que aquele possível pelo método usado como referência – e também a escala de tempo na qual os processos fotoquímicos ocorrem. Os cálculos levaram 59 dias, enquanto que pelo método de referência a estimativa de tempo para gerar a mesma simulação é de 19 anos.

Na publicação, os autores comentam que seu método pode ser usado para prever outras propriedades químicas além daquelas usadas no seu estudo, além de ser aplicável para moléculas mais complexas como ácidos nucleicos (os constituintes do DNA) ou aminoácidos (os constituintes das proteínas). Tanto que na próxima fase do estudo, eles vão estudar a tirosina, um aminoácido suspeito de causar cegueira e envelhecimento da pele quando danificado pela influência da luz. Eles também esperam que, oferecendo acesso à precisão dos métodos da química quântica com apenas uma fração do seu custo computacional, o algoritmo se torne uma ferramenta poderosa em várias áreas de pesquisa relacionadas.