Nova rede neural “líquida” aprende em tempo real

Atualmente, as redes neurais têm fases bem definidas de treinamento e uso prático; na primeira, elas usam vários exemplos para aprender a tarefa, ajustando seus parâmetros, e na segunda, ela usa este aprendizado para fazer predições a partir de dados novos. Para problemas clássicos cuja natureza dos dados é relativamente estática, este regime é eficiente, mas muitos problemas são descritos por dados de natureza muito dinâmica, que está em constante transformação. Nestes casos, sempre que a natureza dos dados muda, a rede treinada perde sua eficiência, e deve passar pela fase de treinamento novamente.

Buscando dar maior flexibilidade a estes algoritmos, cientistas do Instituto de Tecnologia de Massachusetts (MIT) desenvolveram uma nova estrutura que eles batizaram de rede neural líquida. A ideia é que esta rede possa se ajustar em tempo real, adaptando seu aprendizado a novas situações ao mesmo tempo em que faz predições com dados muito diferentes daqueles com que foi treinada.

Para o desenvolvimento da nova arquitetura, os pesquisadores se basearam no sistema nervoso do nematoide Caenorhabditis elegans. Este pequeno verme possui apenas 302 neurônios, mas mesmo assim consegue se comportar de forma relativamente complexa. Esta simplicidade estrutural faz com que o sistema nervoso de C. elegans seja muito bem compreendido pelas áreas competentes. Graças a isso, os cientistas do MIT levaram em consideração a forma com que estes neurônios são ativados e se comunicam entre si, traduzindo estas características como funções diferenciais aninhadas na nova rede neural artificial. A escolha adequada desta configuração permitiu que os parâmetros mudem com o tempo, garantindo à rede a flexibilidade necessária para que o aprendizado seja dinâmico, ocorrendo em tempo real.

O trabalho também se preocupou em criar neurônios expressivos, mas de quantidade reduzida. Isto faz com que a estrutura final seja muito mais interpretável que as redes neurais tradicionais, permitindo entender como a rede tomou determinada decisão.

Em um artigo publicado em dezembro, os autores compararam o desempenho desta nova estrutura com modelos clássicos, usando séries temporais para simular datastreams reais. A performance foi superior em problemas tão diversos como análise química atmosférica e padrões de tráfego. Além disso, o tamanho menor da estrutura lhe dá vantagem em termos de custo computacional.

Entre as aplicações futuras possíveis, é possível citar sistemas de direção autônoma, onde um veículo se adaptaria rapidamente a condições ambientais inéditas; modelos de processamento de linguagem natural, que aprendem a cada nova tarefa a que sejam submetidos; e algoritmos para diagnóstico médico, que poderiam, por exemplo, se adaptar a novas características de uma doença conforme uma pandemia evolui.