Os telescópios são responsáveis por capturar milhões de imagens do universo, as quais depois servem para diversos propósitos científicos na área da astronomia. Um desses propósitos envolve o estudo de galáxias. Mas procurar galáxias nas imagens não é uma tarefa fácil. Apesar de elas terem formatos característicos, a imensidão das imagens produzidas pelos telescópios, e a grande quantidade de outros artefatos capturados nelas, fazem essa busca extremamente laboriosa.
Pesquisadores do Observatório Astronômico Nacional do Japão (NAOJ, National Astronomical Observatory of Japan) tiveram a ideia de usar inteligência artificial para identificar galáxias nesses dados. Já que o formato das galáxias é tão peculiar, eles pensaram que um algoritmo poderia ser treinado para realizar esta tarefa. E o resultado, apresentado em um artigo de julho, foi muito bom. O modelo desenvolvido por eles, na forma de uma rede neural convolucional, foi treinado com imagens de altíssima resolução coletadas pelo telescópio Subaru, instalado no Havaí. Apesar da resolução elevada aumentar a quantidade de dados a serem processados, ela também permite identificar subestruturas necessárias à correta classificação das galáxias. Ao todo, o algoritmo recebeu cerca de 54 mil imagens rotuladas por cientistas, contendo galáxias com espiral no formato S, no formato Z e sem espiral. O número de galáxias sem espiral era muito maior, então eles aplicaram a técnica de data augmentation para balancear as classes do dataset. No final do treinamento, o algoritmo alcançou 97,5% de precisão na identificação e classificação de um dataset de validação. Aplicando o modelo a imagens novas, foi possível identificar quase 80 mil novas galáxias espirais, sendo que mais da metade seria dificilmente identificada por outros métodos.
O sucesso da abordagem neste estudo piloto deixou os autores confiantes para aplicá-lo na classificação de galáxias de acordo com critérios mais detalhados. Já existe um projeto em andamento para a análise manual de fotografias de galáxias que estejam potencialmente em processo de colisão ou fusão. A intenção é usar este dataset para o treinamento de um algoritmo que possa no futuro realizar esta tarefa automaticamente. Dada a quantidade de dados a serem analisados e a raridade desses eventos no universo, o emprego de inteligência artificial na empreitada deve permitir descobertas que antes poderiam ser praticamente impossíveis.