As redes neurais devem boa parte de seu desempenho ao fato de imitarem em estrutura e funcionamento como o cérebro funciona, mas justamente por se basearem em uma estrutura biológica, elas trazem um benefício adicional à realização de tarefas por via computacional: também nos ajudam a entender como o cérebro funciona. É o que demonstra um trabalho publicado por pesquisadores do Instituto de Tecnologia de Massachusetts, nos Estados Unidos.
Os cientistas se dedicaram a analisar o funcionamento das redes neurais usadas nos modelos mais recentes de processamento de linguagem natural, especificamente na tarefa de predizer a próxima palavra dada um texto inicial. Esta é a tarefa que nosso navegador e os teclados dos nossos smartphones realizam quando completam o que estamos escrevendo. Apesar da inspiração no cérebro, estes modelos não são especificamente desenhados para imitar como o próprio órgão realiza esta tarefa, ou seja, eles têm a “liberdade” de aprender a realizá-la por conta própria.
O trabalho envolveu 43 modelos, que foram comparados com dados de ressonância magnética funcional que mostram as áreas ativas do cérebro quando participantes humanos estavam realizando tarefas relacionadas à linguagem, como ouvindo histórias, lendo frases inteiras ou lendo texto onde as palavras eram reveladas sequencialmente. Os resultados mostram que os modelos de melhor performance na predição da próxima palavra tinham padrões de atividade muito similares ao que acontece no cérebro humano, sendo consistentes com uma hipótese anterior que sugere que a predição é uma das principais funções no processamento de linguagem.
Esta pesquisa mostra que, de certa forma, as redes neurais seguiram a mesma estratégia evolutiva dos cérebros humanos para o processamento de linguagem. Ou seja, dado um “hardware” análogo para operar, o “software” acaba sendo muito similar na realização desta tarefa específica, mesmo que os dois sistemas pudessem tentar caminhos diferentes. Isto, por sua vez, sugere que a compreensão textual pode ser uma tarefa que tenha poucas, se não somente uma, solução prática. É uma descoberta de enorme impacto na área, pois não só esclarece aspectos fundamentais do processamento de linguagem, mas abre novas oportunidades para construir modelos ainda mais eficientes, possivelmente em domínios ainda mais amplos do que apenas o da linguagem.