Deep learning é usado para rastrear movimentos migratórios de pássaros

Ornitologistas – os cientistas que estudam pássaros – já vêm usando há algumas décadas dados obtidos de radares para documentar movimentos migratórios das aves, especialmente aqueles que são difíceis de observar, como os que ocorrem em altas altitudes, à noite, ou sobre o mar. Os dados se tornaram ainda mais abundantes com o surgimento de amplas redes de radar para monitorar o tempo. Entretanto, essa fonte de informação traz junto o registro de outros fenômenos, como precipitações, que se confundem com o movimento de animais. Via de regra, o uso desses dados depende de um pré-processamento manual para separar fenômenos biológicos de meteorológicos. Recentemente, algumas redes de radares passaram a usar uma tecnologia chamada de polarização dual, que torna a tarefa de separar os fenômenos por sua natureza mais fácil e automatizável. Mas esse método é limitado, e isso não resolve o problema de estudar os padrões migratórios de aves em dados históricos.

Para permitir a pesquisa nesses dados já coletados, pesquisadores da Universidade de Massachusetts Amherst desenvolveram uma rede neural convolucional, que eles batizaram de MistNet, para classificar precipitação e movimentação de pássaros. Seu trabalho foi publicado no último dia 27. Eles tiveram essa ideia porque as imagens de radar contêm padrões visuais que permitem que essa discriminação seja facilmente feita por pessoas. A MistNet é baseada nos modelos de CNN aplicados para classificação de imagens, mas inclui algumas alterações especificamente desenvolvidas para dados oriundos de radar. Por exemplo, eles desenvolveram uma nova arquitetura adaptadora para processar o número muito maior de canais de entrada (em comparação aos três canais de cor das imagens RGB), assim como para permitir a predição em diferentes elevações. Para agilizar o treinamento, eles usaram a estrutura VGG-16 inicializada com pesos oriundos de um pré-treinamento no dataset ImageNet. A tarefa específica do estudo foi otimizada com o ajuste dos pesos em função dos dados de radar. Ao invés de usar dados rotulados por pessoas para o treinamento (o que exigiria muito tempo), eles fizeram uso dos rótulos provenientes de dados de polarização dual. Esses rótulos são mais ruidosos que aqueles gerados manualmente, mas se mostraram suficientes para a tarefa. A figura abaixo resume a natureza do problema e a solução desenvolvida pela equipe.

(a) Os dados coletados pelo radar são representados num mapa bidimensional. (b) Os sinais de 5 aberturas diferentes do radar (valores em graus) são decompostos em outros 3 sinais cada, resultando em 15 canais. A primeira parte da CNN é um adaptador que mapeia esses 15 canais para os 3 canais clássicos de uma CNN para processamento de imagens. A rede produz predições para cada abertura em que o radar opera: as precipitações são marcadas em vermelho, as movimentações de pássaros em laranja.
Fonte: adaptado do artigo original.

O desempenho da rede foi avaliado com base em dados rotulados por pessoas, tanto em um dataset contemporâneo quando em um histórico. No dataset contemporâneo, a rede MistNet alcançou precisão de 99,1% e recall de 96,7%, ultrapassando os demais métodos disponíveis. No dataset histórico, a precisão foi de 98,7% e o recall de 95,9%. A figura abaixo compara as anotações feitas pela MistNet com as manuais.

Os métodos atuais não são capazes de anotar dados históricos obtidos a mais de 37,5 km do radar.
Fonte: adaptado do artigo original.

A rede MistNet foi capaz de anotar nos datasets históricos 15% mais dados biológicos do que os demais métodos disponíveis. Isso permite novos insights em uma base de dados de mais de 25 anos, identificando fenômenos até então desconhecidos. O método se mostrou de alta resolução temporal e espacial, sendo eficiente para estudar fenômenos que ocorrem em uma única noite, até aqueles que compreendem várias décadas; aqueles em escala continental, ou em frações individuais do espaço aéreo.

Esse trabalho mostrou que as técnicas de deep learning são adequadas para classificar dados obtidos por radar, ampliando o tipo de informação que elas são capazes de processar. Mais do que isso, o uso de deep learning permitiu avaliações inéditas, como em diferentes alturas ao mesmo tempo, e em distâncias maiores do radar de captura. Esses resultados foram conseguidos mesmo adaptando as redes já disponíveis para classificação de imagens, o que sugere que desempenhos ainda mais altos seriam possíveis em arquiteturas desenvolvidas exclusivamente para esse tipo de sinal. A rede MistNet está disponível em formato open source dentro do pacote WSRLIB.