Descobrindo novas galáxias com IA

Os telescópios são responsáveis por capturar milhões de imagens do universo, as quais depois servem para diversos propósitos científicos na área da astronomia. Um desses propósitos envolve o estudo de galáxias. Mas procurar galáxias nas imagens não é uma tarefa fácil. Apesar de elas terem formatos característicos, a imensidão das imagens produzidas pelos telescópios, e a grande quantidade de outros artefatos capturados nelas, fazem essa busca extremamente laboriosa.

Pesquisadores do Observatório Astronômico Nacional do Japão (NAOJ, National Astronomical Observatory of Japan) tiveram a ideia de usar inteligência artificial para identificar galáxias nesses dados. Já que o formato das galáxias é tão peculiar, eles pensaram que um algoritmo poderia ser treinado para realizar esta tarefa. E o resultado, apresentado em um artigo de julho, foi muito bom. O modelo desenvolvido por eles, na forma de uma rede neural convolucional, foi treinado com imagens de altíssima resolução coletadas pelo telescópio Subaru, instalado no Havaí. Apesar da resolução elevada aumentar a quantidade de dados a serem processados, ela também permite identificar subestruturas necessárias à correta classificação das galáxias. Ao todo, o algoritmo recebeu cerca de 54 mil imagens rotuladas por cientistas, contendo galáxias com espiral no formato S, no formato Z e sem espiral. O número de galáxias sem espiral era muito maior, então eles aplicaram a técnica de data augmentation para balancear as classes do dataset. No final do treinamento, o algoritmo alcançou 97,5% de precisão na identificação e classificação de um dataset de validação. Aplicando o modelo a imagens novas, foi possível identificar quase 80 mil novas galáxias espirais, sendo que mais da metade seria dificilmente identificada por outros métodos.

O sucesso da abordagem neste estudo piloto deixou os autores confiantes para aplicá-lo na classificação de galáxias de acordo com critérios mais detalhados. Já existe um projeto em andamento para a análise manual de fotografias de galáxias que estejam potencialmente em processo de colisão ou fusão. A intenção é usar este dataset para o treinamento de um algoritmo que possa no futuro realizar esta tarefa automaticamente. Dada a quantidade de dados a serem analisados e a raridade desses eventos no universo, o emprego de inteligência artificial na empreitada deve permitir descobertas que antes poderiam ser praticamente impossíveis.