Aristo, a inteligência artificial que passou no oitavo ano da escola

O Instituto Allen, fundado por Paul Allen – cofundador da Microsoft – possui um braço dedicado à Inteligência Artificial, o AI2, situado em Washington. Nessa semana, o instituto anunciou o lançamento de Aristo, um sistema de inteligência artificial que alcançou uma façanha inédita: ele foi capaz de passar em uma prova de ciências aplicada para alunos do oitavo ano.

Tarefas como essa são desafiadoras porque responder perguntas em um teste não depende apenas de memória, mas também de habilidades cognitivas associadas à lógica. Imagine, como sugerem os pesquisadores, a pergunta: “Como podemos separar uma mistura de mini-esferas de ferro e pimenta-do-reino?” A resposta não depende apenas do conhecimento das propriedades do magnetismo, mas também das noções de mistura e de pimenta-do-reino, já que a resposta seria diferente se as esferas estiverem submersas em água. É preciso, portanto, não só reter informações, mas também entender as relações entre elas e ser capaz de produzir inferências. Além disso, o sistema deve ter domínio da linguagem, para poder num primeiro momento consumir informações em formato de texto, e num segundo expressar seus resultados de forma inteligível para as pessoas – respondendo a uma pergunta, por exemplo. Essas características fazem desses testes adequados para mensurar o desempenho de sistemas de inteligência artificial em um espectro mais amplo que o de vencer partidas de xadrez.

O projeto Aristo começou com o desejo de Paul Allen de desenvolver um Aristóteles Digital, capaz de responder às dúvidas das pessoas em qualquer área de conhecimento. Os pesquisadores logo adotaram o teste de oitavo ano (“Aristo” tem a conotação de Aristóteles enquanto criança) como objetivo porque já haviam outros trabalhos tendo esse foco, mas o desempenho ainda era baixo – em 2016, o melhor sistema alcançava precisão de apenas 60%. No decorrer dos anos, o Aristo foi incorporando novos módulos, que lhe permitiram melhorar seu desempenho gradualmente. Atualmente o sistema contém oito módulos, cada um usando uma abordagem diferente. Os primeiros módulos incorporados usavam métodos estatísticos e de recuperação de informação, depois foram incluídos métodos de raciocínio, mas o resultado atual – 91% de precisão – se deve à incorporação recente de modelos de linguagem de larga escala. Nesse quesito, o Aristo faz uso do BERT, um modelo de linguagem do Google treinado no corpus inteiro da Wikipedia e no Google Book Corpus, que contém mais de 10.000 livros. Basicamente, o BERT converte o texto que o sistema lê em um formato que seja informativo para a tarefa em questão. Do trabalho também resultaram dez novos datasets e cinco fontes de conhecimento amplas, desenvolvidos para testar o sistema e atualmente disponíveis à comunidade.

Os ganhos de desempenho do Aristo ao longo dos anos.
Fonte: adaptado do artigo original.

O sistema ainda está limitado a responder perguntas do tipo múltipla escolha no domínio da ciência, mas os resultados são impressionantes mesmo assim dado que a precisão aumentou de 60% para 90% em apenas três anos. O desempenho alcançado demonstra que os métodos modernos de NLP podem permitir o domínio da tarefa para a qual o Aristo foi treinado. Dada sua complexidade, também é possível sugerir que o método permitiu ao sistema aprender sobre a linguagem e o mundo, e como manipular esse conhecimento. Novos avanços na área devem permitir que a inteligência artificial “gere suas próprias alternativas” a partir dos documentos a que tem acesso, e a partir daí responda às questões que lhe estão sendo perguntadas. O Aristóteles Digital nunca esteve tão próximo.

É possível ver o Aristo em ação numa página demo onde, além de responder às perguntas selecionadas, o sistema explica seu raciocínio quando cabível. Os pesquisadores documentaram a história por trás do desenvolvimento do Aristo, e sua configuração e resultados atuais, num artigo publicado no dia 4.