AlphaTensor: a IA que descobriu algoritmos inéditos para multiplicação matricial eficiente

Os algoritmos são sistemas matemáticos e, atualmente, computacionais, que facilitam a resolução de problemas matemáticos de complexidade variada. Apesar de sua ampla utilização, a descoberta de algoritmos não é nada trivial, surgindo quase ao acaso a partir do trabalho de algum matemático habilidoso e dedicado. Até agora, esta tarefa que depende muito da capacidade de abstração, intuição e habilidade de raciocínio tem sido realizada exclusivamente pela mente humana.

Mas até neste terreno exclusivo a inteligência artificial conseguiu adentrar. No início do mês, uma equipe da DeepMind publicou um trabalho descrevendo o AlphaTensor, “o primeiro sistema de inteligência artificial para a descoberta de algoritmos inéditos, eficientes e comprovadamente corretos para tarefas fundamentais como a multiplicação de matrizes”. E foi esta a exata tarefa com a qual o AlphaTensor foi desafiado.

A multiplicação de matrizes é uma das operações algébricas mais simples, fazendo parte do currículo do ensino médio. Na prática, ela tem enorme aplicação no mundo digital, sendo extensivamente aplicada, por exemplo, no processamento que ocorre dentro das redes neurais. Essas operações são tão disseminadas que grandes empresas de hardware têm dedicado boa parte de seus esforços no desenvolvimento de chips especializados em cálculo matricial, como GPUs e TPUs, que agem como aceleradores de processamento. Entretanto, esses chips devem o ganho de performance mais à sua capacidade de realizar cálculos em paralelo do que em inovações na forma com que os cálculos são feitos.

Agora, após décadas de estagnação na área, o AlphaTensor trouxe a primeira grande novidade do lado do software ao descobrir algoritmos mais eficientes para realizar multiplicação matricial. A inteligência artificial foi desenvolvida usando a abordagem de aprendizagem por reforço, onde ela foi desafiada a encontrar soluções para o problema com o menor número de passos possível. Como o número de soluções possíveis é gigantesco, os pesquisadores criaram uma nova arquitetura neural que incorpora o chamado viés indutivo específico ao problema, um procedimento para gerar dados sintéticos úteis, e uma fórmula para aproveitar simetrias do problema. Assim, as soluções com maior potencial são selecionadas com maior probabilidade.

Na etapa de avaliação, os pesquisadores observaram que, partindo de um ponto onde o AlphaTensor não tinha qualquer conhecimento sobre algoritmos de multiplicação matricial, ele logo redescobriu os algoritmos clássicos de multiplicação rápida, mas em seguida ultrapassou o domínio da intuição humana para descobrir algoritmos inéditos ainda mais rápidos. Numa segunda fase, o AlphaTensor foi desafiado a encontrar algoritmos eficientes em um hardware específico habilitado com aceleradores, e suas descobertas se mostraram 10-20% mais rápidas que os algoritmos atualmente em uso.

As aplicações potenciais dos novos algoritmos descobertos são praticamente ilimitadas dada a quase onipresença de computadores na nossa vida. Mas além disso, os autores do trabalho esperam que o trabalho no AlphaTensor sirva como inspiração para o uso de inteligência artificial na descoberta de algoritmos para outras tarefas computacionais fundamentais. E quem sabe este seja o precursor da inteligência artificial capaz de melhorar a si mesma.

Deixe um comentário

O seu endereço de e-mail não será publicado.

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.