IA consegue prever a confiança de usuários com base em textos publicados por eles

Um dos pilares da vida em sociedade são os laços de confiança que as pessoas formam entre si. É a confiança que cimenta as relações interpessoais, pois ela define as pessoas com quem estabeleceremos algum tipo de negociação. A confiança é tão importante para o sucesso de nossa espécie que, ao longo da evolução, nós desenvolvemos vários mecanismos para nos ajudar a construí-la. Um desses mecanismos é o cognitivo, aquele que depende da análise do comportamento das pessoas ao longo do tempo; se alguém é repetidamente honesto e íntegro, nós tendemos a lhe atribuir confiança. Mas esse mecanismo tem um desenvolvimento lento, justamente porque temos que avaliar a consistência do comportamento durante várias interações. Por isso temos outro mecanismo, mais rápido, que depende bastante da nossa intuição. A intuição costuma nos indicar suas conclusões através do que é conhecido como paradigma afetivo, analisando a personalidade das pessoas, o que é possível fazer de forma muito mais rápida. É esse mecanismo que está funcionando quando, logo após conhecermos uma pessoa nova, nós comentamos que ela parece ou não parece ser confiável.

Se para nós a avaliação pelos paradigma afetivo é simples – de fato, ela ocorre natural e automaticamente -, é muito mais difícil implementá-la em um computador. Mas conforme nossas relações dependem cada vez mais das interações que ocorrem na internet, a necessidade de atribuir confiança aos agentes no mundo virtual é urgente.

Em um trabalho publicado recentemente, o Dr. Jones Granatyr – fundador e professor responsável pela plataforma IA Expert – e colaboradores apresentaram o resultado do desenvolvimento de um algoritmo capaz de atribuir confiança através de textos publicados na internet. A pesquisa envolveu o uso de datasets contendo reviews publicados nas plataformas do TripAdvisor e do Ebay. Além dos metadados dos reviews, informando por exemplo a idade, o sexo, o número de fotos do autor e o número de avaliações publicadas, e também algumas relacionadas ao feedback dado pela comunidade, como o número de avaliações consideradas úteis e a reputação, os textos foram submetidos a várias ferramentas já estabelecidas para classificação do autor (com base em seus textos) em diferentes sistemas de definição de personalidade. Assim, os autores eram classificados através de vários eixos de personalidade, o que foi utilizado pelo algoritmo como um próxi para a personalidade que seria percebida na interação dos autores com outras pessoas. Então, os dados foram processados por machine learning usando várias estratégias diferentes, e os resultados na predição de confiança foram comparados com aqueles valores presentes originalmente no dataset.

Os resultados mostraram que, para o dataset do TripAdvisor, que foi tratado como um problema de regressão, cinco das oito estratégias de atribuição de personalidade performaram melhor na predição do score de confiança do que o modelo treinado somente com os metadados. Curiosamente, o modelo treinado usando as variáveis de personalidade geradas por todas as estratégias apresentou o pior resultado. O melhor modelo de regressão foi o método Random Forest, onde a correlação mais alta entre os resultados preditos e os conhecidos foi de 0,80. Os fatores que tiveram mais impacto na escala de confiança foram a avaliação de utilidade feita pela comunidade, o número total de reviews, e o status como revisor dado pela plataforma. Logo depois apareceram características de personalidade como abertura a novas ideias, conscienciosidade e concordância. No caso do dataset do Ebay, modelado como um problema de classificação binária, seis estratégias de atribuição de personalidade mostram desempenho superior ao baseline. O melhor modelo também foi o método Random Forest, e nesse caso a estratégia de usar todas as variáveis de personalidade foi a mais bem sucedida, alcançando precisão de 72,80%.

O estudo demonstra, portanto, que é possível utilizar inteligência artificial para melhorar a atribuição de confiança em interações virtuais através da integração do paradigma afetivo à análise, o que pode ser alcançado pela extração de aspectos de personalidade a partir dos textos dos autores. Os pesquisadores acreditam que, com a evolução dos extratores de personalidade, pode até ser possível descartar os metadados associados às publicações, alcançando desempenhos superiores utilizando apenas os textos para predizer confiança. Esta é uma área promissora de pesquisa, que deve melhorar a qualidade dos laços que formamos pela internet.