IA da NVIDIA produz informações médicas a partir de diálogo clínico

Durante a Conferência para Inteligência de Máquina em Imageamento Médico (Conference for Machine Intelligence in Medical Imaging) de 2020, que ocorreu nos dias 13 e 14, a NVIDIA, empresa de tecnologia mais conhecida pela produção de processadores gráficos, apresentou um sistema de inteligência artificial capaz de interpretar diálogos clínicos falados. O sistema identifica palavras de natureza clínica e as mapeia até uma base de dados de saúde padronizada, sendo capaz, por exemplo, de propor um diagnóstico tentativo em função de sintomas ou resultados de exames declarados.

A base do novo sistema, batizado de Bio-Megatron, é o BERT, modelo de processamento de linguagem natural desenvolvido pelo Google, que na época de sua publicação foi considerado revolucionário ao integrar a ideia de contexto linguístico aos algoritmos que processam texto. O Bio-Megatron foi pré-treinado usando textos extraídos do PubMed, um repositório de resumos de publicações científicas da área biológica. Neste processo de pré-treinamento, o modelo aprende as características da língua, ganhando a capacidade de “interpretar” o texto em todas as suas nuances. Numa segunda fase, ele foi ajustado no processo conhecido como fine-tuning, para ser capaz de relacionar o significado do texto com uma base de dados para processamento de linguagem natural clínica, sendo assim capaz de produzir conclusões médicas a partir do texto analisado. O modelo foi então incorporado a um componente para reconhecimento de fala que realiza a identificação de palavras e as traduz em conceitos presentes no Sistema de Linguagem Médica Unificado (UMLS, Unified Medical Languagem System), uma ontologia criada pela Biblioteca Nacional de Medicina dos Institutos Nacionais de Saúde (NIH, National Institutes of Health), a agência governamental de saúde americana. Os pesquisadores informaram na conferência que o sistema atingiu acurácia de 92%, dois pontos percentuais acima do modelo BERT base (que não recebeu treinamento específico na área médica), em apenas 1 milissegundo de tempo de processamento.

Segundo os desenvolvedores, a aplicação mais imediata do sistema deve ser em telemedicina, área que se expandiu consideravelmente durante a pandemia do novo coronavírus. Pacientes poderiam receber o primeiro atendimento de um agente virtual, por exemplo, que a partir da descrição do seu problema, poderia fornecer informações para seu atendimento subsequente adequado, ou direcioná-lo diretamente para o profissional mais habilitado. Este pré-atendimento teria potencial de aliviar a pressão sobre os profissionais de saúde nas situações onde eles se encontram sobrecarregados.