Redes neurais baseadas em conhecimento permitem a interpretação de processos biológicos

A área de deep learning tem se mostrado muito útil na predição de fenômenos biológicos complexos, como os fenótipos originados de dados genômicos. Entretanto, sua aplicação é bastante limitada na compreensão do que ocorre dentro das células, o que lhe garante pouco espaço na descoberta científica. Isto se deve ao fato de que a interpretabilidade das redes neurais profundas é baixa, e nem sempre seus parâmetros têm algum significado concreto.

Pesquisadores da Academia Austríaca de Ciências buscaram resolver este problema aplicando os conceitos de deep learning diretamente nas redes biológicas, ao invés de usar as estruturas genéricas geralmente empregadas. Para tanto, eles desenvolveram redes neurais baseadas em conhecimento (KPNNs, knowledge-primed neural networks), cuja estrutura é baseada nas vias de sinalização e redes de regulação que ocorrem dentro da célula. Desta forma, cada nó da rede neural representa um gene ou uma proteína, e as conexões entre os nós têm uma interpretação biológica mecanística, como a interação entre estas moléculas. É como se a própria estrutura da rede neural já tivesse embutida em si parte do conhecimento sobre os mecanismos biológicos, sobrando ao processo de treinamento a simples tarefa de ajustar seus parâmetros para refletir o funcionamento celular determinado experimentalmente, com a vantagem de que agora estes parâmetros são interpretáveis.

No trabalho publicado agora em agosto, os autores detalharam que algumas estratégias computacionais precisaram ser implementadas para garantir a estabilização dos pesos dos nós na presença de redundância, melhorar a interpretabilidade quantitativa destes pesos, e controlar a conectividade inerentemente assimétrica das redes biológicas. Como resultado, eles demonstram que esta abordagem mantém o poder de predição das redes neurais tradicionais, mas proporciona adicionalmente insights importantes sobre os processos biológicos que governam os fenômenos investigados.

O método foi testado em datasets com dados biológicos de células unitárias, mostrando por exemplo pela primeira vez que células do sistema imune da medula óssea e do cordão umbilical têm redes regulatórias diferentes, algo que até então não tinha nem sido cogitado.

A implementação deste tipo de rede neural vem em boa hora, já que recentemente passou a ser possível sequenciar células individuais, para avaliar tanto sua informação genética quanto dados relacionados ao seu estado de funcionamento. Potencialmente, a metodologia pode ser usada para elucidar a sinalização celular e a regulação genética em sistemas saudáveis e doentes, para identificar novos alvos para drogas, e para possibilitar a geração de novas hipóteses testáveis a partir de dados de sequenciamento. Além disso, outras áreas da biologia onde o conhecimento pode ser representado na forma de redes podem se beneficiar do trabalho.