Usando machine learning para detectar leucemia sem a necessidade de especialista

A leucemia mieloide aguda (AML, acute myeloid leukemia) é uma forma de leucemia que, sem tratamento adequado, pode provocar a morte em poucas semanas. A gravidade de contrair a doença aumenta uma vez que, nos estágios iniciais, os sintomas são similares aos de uma gripe forte. Ela está associada à proliferação de células patológicas da medula óssea, as quais podem cair na corrente sanguínea e infectar o resto do corpo.

Em um estudo conceitual publicado em dezembro, pesquisadores do Centro Alemão para Doenças Degenerativas (DZNE) e da Universidade de Bonn, também na Alemanha, usaram machine learning para detectar a doença sem a necessidade de um especialista. Eles se basearam no chamado transcriptoma, que é um análogo do genoma, mas que representa apenas a parte do material genético que está em atividade dentro da célula. Ainda que todas as células do corpo tenham o mesmo genoma, o transcriptoma muda em decorrência, por exemplo, do tecido onde reside, da idade, ou da função que a célula executa, mas também entre células sadias e doentes, o que pode possibilitar sua diferenciação. Atualmente, perfis transcriptômicos são gerados rotineiramente por laboratórios de nível clínico. Dados de transcriptoma, que geralmente são bastante extensos pois representam milhares de genes ativos, são usados com frequência para o diagnóstico de doenças, mas exigem tratamento específico por pessoal especializado. Esta é a primeira vez que a inteligência artificial foi empregada, dispensando a expertise para gerar o diagnóstico. Muitos estudos já foram realizados pela comunidade científica sobre a atividade genética de células sanguíneas, e os dados estão disponíveis em grandes bases públicas. Os autores do trabalho coletaram praticamente toda a informação atualmente disponível, o que resultou em cerca de 12 mil amostras de sangue, originárias de 105 estudos, sendo o meta-estudo mais robusto sobre o assunto. Aproximadamente 4.100 amostras eram de indivíduos leucêmicos, enquanto que as demais eram de indivíduos saudáveis ou com outras doenças. Ao todo nove métodos de machine learning foram testados, entre eles SVM com diferentes kernels, LDA, KNN, lasso e random trees, e o melhor desempenho em questão de precisão foi superior a 99%.

Apesar de os resultados estarem limitados por enquanto ao ambiente de laboratório, os cientistas comentam que com o devido desenvolvimento o método pode servir de suporte aos diagnósticos convencionais, já que é altamente escalonável, além de reduzir os custos. Enquanto que os demais métodos custam na faixa das centenas de euros, seu método baseado em machine learning está estimado em 50 euros. Isso pode facilitar a geração de um diagnóstico rápido logo que o médico que faz o primeiro atendimento suspeite da condição, podendo então encaminhar o paciente a um especialista e aumentando consideravelmente suas chances de recuperação.