Algumas imagens ficam gravadas na nossa memória, enquanto outras são rapidamente esquecidas. Toda campanha de marketing bem sucedida busca fazer uso desse fato. Mas as características que tornam uma imagem memorável ainda são pouco conhecidas. Muitas vezes, nem nós mesmos sabemos dizer ao certo o que é que nos atrai em uma imagem.
Um trabalho de pesquisadores do Instituto de Tecnologia de Massachusetts, apresentado na Conferência Internacional de Visão Computacional, que aconteceu no final de outubro em Seul, na Coreia do Sul, oferece algumas explicações derivadas da aplicação de machine learning. O trabalho partiu de um modelo anterior, chamado de MemNet, que foi treinado com 60.000 imagens avaliadas no quanto pessoas conseguiam se lembrar delas. A rede então se tornou capaz de gerar um score de memorabilidade. O novo modelo, batizado de GANalyze, é estruturado como uma rede adversarial generativa (GAN), composta por três módulos: o MemNet age como módulo assessor, avaliando a memorabilidade de uma imagem e sugerindo as alterações necessárias para que esse score aumente ou diminua; um transformador, que executa as instruções passadas pelo assessor; e um gerador, que constrói a imagem alterada. Dessa forma, é possível alimentar o modelo com uma imagem qualquer e observar os resultados gerados pelo tuning gradual da sua memorabilidade.
Os pesquisadores observaram que as imagens mais memoráveis tinham algumas características em comum: elas tinham cores brilhantes, fundos simples, e o objeto retratado estava em destaque, centralizado na imagem. A figura abaixo, gerada pelo modelo, dá uma ideia dos resultados.
Numa segunda fase do estudo, os pesquisadores buscaram elencar quais características têm maior influência na memorabilidade. Eles apresentaram várias imagens com grau variado de memorabilidade a pessoas, e pediram para que elas indicassem duplicatas. As duplicatas reconhecidas com maior frequência apresentavam os objetos em close, fazendo com que parecesse maior. As próximas características mais importantes eram o brilho, a centralidade do objeto, e o formato da imagem, se circular ou quadrado.
Finalmente, eles observaram a relação entre memorabilidade, estética e emocionalidade. As imagens com maior score estético e emocional tiveram grande sobreposição com as imagens mais memoráveis, sendo mais brilhantes, coloridas, e com fundo desfocado. Entretanto, nem todas as imagens mais estéticas figuravam entre as mais memoráveis, o que indica que nem toda imagem tecnicamente “bonita” é facilmente lembrada.
Estes resultados mostram como as técnicas de machine learning podem ser usadas em estudos científicos que busquem descrever o mundo, e não só por seu potencial prático. Ainda assim, o campo de aplicação é vasto. Os pesquisadores imaginam usar esse conhecimento para gerar imagens em ambientes virtuais ou de realidade aumentada, auxiliando no tratamento de perda de memória. É possível também usá-lo como ferramenta pedagógica, facilitando a retenção de conhecimento. E, claro, potencializar o impacto positivo das campanhas de marketing.