Modelo prevê falha cardíaca com 100% de precisão usando uma única batida cardíaca

A insuficiência cardíaca congestiva (ICC) é uma condição responsável pela falência do coração no bombeamento de sangue para o corpo, tendo várias causas possíveis. A taxa de mortalidade pode chegar a 40% nos casos mais severos. Ela é uma das principais causas de hospitalização entre a população idosa, tendo uma taxa de reincidência de 50%. Por isso existe a necessidade de métodos precisos para a predição de insuficiência cardíaca, de forma a permitir diagnósticos precoces e mais eficientes.

Dada a quantidade e complexidade dos dados envolvidos, os métodos de machine learning são óbvios candidatos para o desenvolvimento dessas ferramentas diagnósticas. Alguns trabalhos anteriores já alcançaram êxito parcial na predição da condição, usando dados de variabilidade de taxa cardíaca (HRV, sigla para heart rate variability), que é a variação entre batidas consecutivas do coração extraídas de sinais de eletrocardiograma (ECG). Entretanto, o desenvolvimento desses modelos demanda tempo e é passível de erros, já que o preprocessamento exige a seleção manual iterativa das características apropriadas para o treinamento. Além disso, os modelos de melhor desempenho exigem sinais cardíacos de longa duração, precisando de monitoramento por até 24 horas.

Um novo trabalho publicado no início do mês usou uma abordagem diferente. Primeiro, o modelo não é baseado em HRV, mas sim diretamente nos dados de ECG, sendo que cada batida cardíaca foi analisada individualmente. Segundo, ele tem a estrutura de uma rede neural convolucional unidimensional. As redes convolucionais são especializadas em encontrar padrões locais nos dados, que são então usados nas tarefas de classificação. Terceiro, pelo uso de um mapeamento de ativação de classe chamado Grad-CAM, foi possível identificar quais regiões dos dados de entrada são mais relevantes para a definição da classe-alvo (CHF ou indivíduo saudável), o que contribui para a transparência do funcionamento do algoritmo. A arquitetura completa é representada na figura abaixo.

Fonte: adaptado do artigo original.

Vale mencionar rapidamente como funciona o método Grad-CAM. O método implica no cálculo do gradiente do score de uma classe definida (CHF ou indivíduo saudável, no caso), em relação a uma mapa de características específico (aqui, os mapas da última camada de convolução); esses valores são então ponderados pelo cálculo de sua média global. Esses resultados representam a importância do mapa de características em questão para a classe-alvo definida. A soma de todos os mapas, ponderada pelos valores calculados anteriormente, resulta, após a passagem por uma ativação do tipo ReLU, no Grad-CAM, que pode ser projetado sobre os dados de input para identificar os features mais relevantes à classificação. A figura abaixo mostra simplificadamente as regiões dos dados de entrada com melhor poder discriminativo de acordo com o método Grad-CAM.

O atributo alt desta imagem está vazio. O nome do arquivo é image-8-1024x724.png
Fonte: adaptado do artigo original

O desempenho do modelo desenvolvido é impressionante. Usando um único batimento cardíaco, o modelo é capaz de prever se a pessoa é portadora da condição com predição de 98%; a taxa de falsos positivos foi de 1% e de falsos negativos foi de 3%. Se vários batimentos de um mesmo indivíduos forem analisados, a precisão é perfeita, de 100%.

O método se mostrou um importante avanço frente aos demais métodos disponíveis, tanto em questão de precisão quando no tipo de dados que devem ser alimentados. ECGs, que são gerados corriqueiramente em ambientes hospitalares, poderiam ser prontamente utilizados na tarefa de classificação, dispensando qualquer tipo de pré-processamento. Os resultados da predição, enquanto diagnósticos, podem direcionar intervenções imediatas nos pacientes onde a condição for identificada.