IA visual reconhece objetos independentemente de seu domínio

Ainda que a visão computacional tenha alcançado um desempenho que justifica seu uso disseminado na análise de grandes coleções de imagens, ela ainda carece de uma capacidade de generalização maior. Por exemplo, imagens áreas são bastante restritas ao seu domínio espacial ou temporal. Uma telhado visto de dia é diferente daquele visto de noite, ou então aquele visto no centro de uma cidade contra um presente no meio de uma floresta. Isto torna a tarefa de discernir objetos limitada ao domínio especifico onde o sistema de inteligência artificial foi treinado.

Resolver este problema é a motivação por trás do trabalho realizado no Instituto Daegu Gyeongbuk de Ciência e Tecnologia, na Coreia do Sul. Eles treinaram uma rede convolucional para segmentação de objetos em imagens, em conjunto com uma rede generativa adversarial, que usa os exemplos de domínios específicos para gerar novas imagens e assim aumentar a capacidade de generalização do modelo.

O algoritmo foi testado na segmentação de construções em imagens aéreas de diferentes domínios. Ele foi capaz de detectar a localização, os contornos e o formato das construções presentes, independentemente do domínio em questão. A presença da rede generativa na arquitetura do modelo possibilita que ele seja facilmente ajustado para avaliar novos domínios, aumentando sua aplicabilidade.

A pesquisa é continuação de um trabalho anterior onde os cientistas conseguiram separar o conteúdo (por exemplo, a presença das construções) do estilo (o contexto onde eles estavam presentes) de imagens, assim permitindo a rede convolucional a focar nos aspectos relevantes para a realização das tarefas visuais requisitadas.

A nova iteração do sistema criado pela equipe foi apresentada na Conferência Internacional de Visão Computacional deste ano.

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.