Muitas habilidades cognitivas dos sistemas de inteligência artificial podem ser testadas usando jogos. Comparar o desempenho desses sistemas com jogadores humanos profissionais torna possível determinar se ele já é equivalente, e algumas vezes superior, ao melhor raciocínio humano. Foi dessa forma que ficou demonstrada a habilidade da inteligência artificial resolver problemas como o jogo de xadrez ou o Go. Entretanto, por mais complicados que esses jogos pareçam, eles seguem poucas regras básicas, limitadas, por exemplo, pelos movimentos possíveis das peças. Mas e quando os jogos envolvem o emprego de linguagem para negociar, persuadir e trabalhar junto com pessoas?
Na semana passada, a Meta anunciou o CICERO, uma inteligência artificial que alcançou o desempenho de profissionais humanos no jogo de estratégia Diplomacy. Como o nome deixa evidente, os jogadores devem exercer seu poder de influência para convencer os outros participantes a cooperarem com seu objetivo, o que envolve negociações, acordos mútuos e até blefes. A complexidade envolve entender as motivações dos jogadores, fazer e atualizar estratégias, e usar linguagem natural para persuasão, tarefas bastante difíceis de traduzir em modelos de inteligência artificial. Ainda assim, o CICERO atingiu mais que o dobro da pontuação média em uma versão online do jogo, se posicionando no ranking entre os 10% mais bem sucedidos. Os jogadores que interagiram com o CICERO acharam sua habilidade de comunicação tão avançada que até preferiam negociar com ele do que com outros competidores humanos.
Este sucesso surpreendente foi possível graças a avanços técnicos na intersecção entre o raciocínio estratégico e um modelo de linguagem. A cada jogada, o sistema observa o tabuleiro e o histórico de conversas, e modela a atuação mais provável dos outros jogadores. Ele então traça um plano que, em conjunto com o sistema conversacional, gera diálogo em formato livre, informando seu plano e propondo ações razoáveis com as quais os demais jogadores estarão propensos a concordar. O modelo de linguagem foi desenvolvido a partir de um sistema pré-treinado com textos da internet, e ajustado pelo processo de fine-tuning com diálogo real de jogadores de Diplomacy. Essas conversas foram anotadas automaticamente com as jogadas correspondentes, de forma que o CICERO pudesse aprender a correlacionar o diálogo com a ação escolhida. O texto produzido passa por mecanismos finais de filtro, de forma a garantir sua sensatez, consistência e alinhamento estratégico.
As implicações deste trabalho são muito relevantes, já que, pela primeira vez, uma inteligência artificial foi capaz de convencer pessoas a agir de acordo com um objetivo externo. Entretanto, um sistema com esta habilidade também pode ajudar a resolver conflitos no mundo real, agindo como um agente diplomata altamente qualificado. Em outras aplicações mais cotidianas, a IA poderia receber um objetivo que seja de nosso interesse pessoal, como aprender uma nova habilidade, e agir como assistente motivador, nos direcionando rumo ao sucesso.
O trabalho que deu origem ao CICERO foi publicado na renomada revista científica Science, e o código está disponível para consulta em formato open-source.
Considero muito interessante, principalmente por se manter a perspectiva de isso servir para melhorar a qualidade de vida humana. Como disse Crozier em L’Acteur et le Système, tudo o que possa aumentar a inteligência das situações e o nível de complexidade do nosso raciocínio será um passo em frente para a realização humana, individual e coletiva