IA identifica autoria de fotografias históricas

Os pintores mais conhecidos têm estilos pessoais bastante característicos, de forma que é fácil reconhecer a autoria de uma obra mesmo quando é a primeira vez que a gente a vê. Fotógrafos também costumam ter estilos próprios, mas eles não têm tanta liberdade artística quanto um pintor, de forma que é muito mais difícil atribuir autoria, ficando esta tarefa a cargo de especialistas.

Mas pesquisadores da Universidade Aarhus e da Universidade Tampere, na Finlândia, mostraram que os algoritmos de machine learning para processamento de imagens são capazes de fazer esta distinção. Eles usaram um dataset público contendo mais de 160 mil fotografias da Segunda Guerra Mundial, tiradas por 23 fotógrafos finlandeses, num estudo voltado para revelar como a inteligência artificial pode ajudar a estudar fotografias históricas. Durante o estudo, eles observaram que o estilo dos fotógrafos podia ser representado pelas características identificadas pela rede neural utilizada, que por sua vez codificam o conteúdo das fotos. Usando esta “assinatura”, foi possível identificar a autoria das fotografias com precisão média de 41%, um desempenho considerado surpreendente já que haviam mais de 20 fotógrafos no dataset. Eles também descobriram que alguns artistas tinham estilos bastante característicos e fáceis de reconhecer, mas outros eram menos especializados. O fotógrafo mais identificável é Heikki Roivainen, um professor de botânica que trabalhou como fotógrafo oficial durante a guerra.

Fotografia de Heikki Roivanen, tirada em 5 de setembro de 1941 em Porlammi, Finlândia. Créditos: SA-kuva.

Além da autoria, o estudo mostrou ser capaz de identificar outros atributos do conteúdo das fotografias usando inteligência artificial, como enquadramento, close-up e número de pessoas.

Os modelos gerados no estudo devem ajudar os curadores de material histórico a se adequar a uma diretiva publicada pela União Europeia em 2020, que estabelece que todas as imagens que eles disponibilizem na internet devem ter descrições textuais do conteúdo das imagens.

O trabalho foi publicado em agosto, e todo o material gerado está acessível publicamente.