Rede neural usa eletrocardiogramas para fazer predições inéditas de problemas de saúde

Quando nós vamos a um consultório devido a algum problema de saúde, a primeira coisa que o médico costuma fazer é gerar um panorama do nosso estado geral de saúde, para investigar primeiro os problemas mais comuns e mais fáceis de resolver. Esse panorama é construído quando o médico nos pergunta sobre sintomas, histórico e estilo de vida, por exemplo. Ele também pode solicitar que sejam feitos alguns exames mais simples, como análise de sangue e pressão. Dependendo da situação, esse processo pode levar algum tempo, e mesmo ao final a avaliação pode ser deficitária, já que depende muito da nossa memória – e até sinceridade – ao relatar as informações que o médico solicita. Por isso, métodos mais rápidos e confiáveis de acessar o estado geral de saúde seriam bem-vindos, para que o melhor tratamento possa ser sugerido com a melhor eficiência possível.

Num trabalho publicado no último dia 27 na revista Circulation: Arrythmia and Electrophysiology , pesquisadores do Colégio de Medicina da Clínica Mayo, em Rochester, Minnesota (EUA) apresentaram uma tentativa pioneira de gerar um marcador de saúde com as características desejadas. Eles usaram dados obtidos de eletrocardiogramas (ECGs) de cerca de 500 mil pacientes para treinar uma rede neural convolucional (CNN) para predizer o sexo e a idade dos pacientes. A estrutura da CNN foi modificada para conter camadas de extração de características espaciais e temporais (ver figura abaixo), comuns na decomposição de sinais de frequência. ECGs são obtidos de forma corriqueira em centros médicos, em apenas alguns minutos com desconforto mínimo dos pacientes. Eles já são usados em tarefas como estratificação de risco, identificação de doenças e administração cardiovascular, mas alguns estudos recentes, como apontam os autores, mostram que os dados gerados pela técnica podem conter outras informações que não estejam diretamente relacionadas ao sistema cardíaco. Isso levou os pesquisadores a usar técnicas de machine learning para tentar desvendar outros padrões de dados presentes nos dados de ECG. O sexo foi incluído no estudo para verificar o poder de classificação da rede (afinal de contas, ele pode ser informado pelo paciente sem a necessidade de qualquer análise), mas a idade pode ser um importante marcador de saúde, já que diferenças entre a idade predita pela rede (chamada de idade fisiológica) e a idade real dos pacientes indicam eventuais problemas.

Figure 1.
Estrutura das CNNs desenvolvidas para o estudo. Fonte: artigo original.

Após o treinamento, a rede foi testada com dados de outros 275 mil pacientes. A precisão na determinação do sexo foi de 90,4%, com AUC de 0,97, próximo do limite ótimo de 1. O erro na predição da idade foi de 6,9±5,6 anos, com R² de 0,7, o que indica uma correlação boa entre os dados de ECG e a idade, e por consequência a adequação do uso de dados de ECG nessa tarefa de predição. Numa segunda fase do estudo, foram selecionados aleatoriamente 100 pacientes com múltiplos ECGs ao longo de pelo menos duas décadas, para verificar a precisão na estimativa de idade da CNN em um mesmo indivíduo. Os pacientes cuja diferença entre idade cronológica e idade predita era maior que 7 anos tinham um histórico de problemas cardíacos. Naqueles onde a correlação entre as duas idades era maior que 0,8, nenhum havia tido incidentes num período de acompanhamento de 20 a 40 anos.

Os autores discutem que o monitoramento permanente em tempo real de indicadores fisiológicos deve ser uma prática corriqueira com a ascensão de dispositivos vestíveis e da internet das coisas, onde todos os nossos equipamentos deverão estar conectados à rede. Seu trabalho demonstra o potencial dos ECGs como biomarcador para o estado de saúde. Os resultados apresentados nesse estudo apontam para valores estatísticos que podem ser usados para calibrar um aplicativo de prevenção, por exemplo, que possa avisar uma pessoa sobre uma eventual necessidade de consultar um médico. Ao mesmo tempo, ele pode disponibilizar aos profissionais de saúde informações relevantes antes mesmo que o paciente se apresente, acelerando a tratativa. Mas, antes de tudo isso, a pesquisa demonstra o poder dos algoritmos de machine learning em extrair ainda mais informações escondidas na imensidão de dados que nós já temos disponíveis.