Sistema comercial de IA performa melhor que 101 radiologistas

Em um estudo publicado no dia 5 de março, pesquisadores compararam o desempenho de um consórcio de 101 radiologistas contra um sistema de IA na detecção de câncer de mama. O sistema comercial, Transpara 1.4.0, da empresa holandesa Screenpoint Medical BV, usa redes neuras convolucionais, classificadores de características e algoritmos de análise de imagem para detectar calcificações e lesões de tecido mole em mamogramas digitais. Para cada exame, ele gera uma pontuação contínua entre 1 e 10 para representar o nível de suspeição da presença de câncer.

No trabalho apresentado pelos pesquisadores, eles treinaram o sistema com mais de 9 000 mamogramas anômalos e 180 000 mamogramas normais. As imagens eram provenientes de diferentes populações e foram geradas por máquinas de quatro diferentes fabricantes, o que aumenta a capacidade de generalização do modelo treinado. O desempenho foi determinado com um dataset de 2652 casos contendo 28 296 interpretações independentes de 101 radiologistas.

O sistema de IA alcançou performance representada por uma AUC de 0.840, contra 0.814 dos radiologistas. AUC é uma métrica que mede o trade-off entre sensibilidade e especifidade, ou em outras palavras, entre a taxa de falsos e verdadeiros positivos: quanto mais próximo de 1, melhor. Comparando com radiologistas individuais, o sistema foi melhor que 61% deles. Ainda que ele não tenha performado como os melhores radiologistas, há de se considerar que esses tiveram acesso a mais informações, como mamografias anteriores e de outros cortes, que o sistema não teve.

Os pesquisadores esperam que novos trabalhos possam avaliar o desempenho do sistema de IA por tipo de lesão, característica do tumor ou localização da lesão, que eles não puderam realizar porque as informações não estavam disponíveis nos datasets utilizados. Isso permitiria uma eventual aplicação ainda mais ampla. A esperança é que no futuro um sistema de IA possa ser usado como suporte a radiologistas, fazendo um pré-screening para descartar imagens que não necessitam de interpretação mais precisa, ou até ser uma alternativa em regiões onde há falta de radiologistas especializados.