Modelo KNN treinado com dados de simulador para classificar a experiência de neurocirurgiões

Cirurgias são geralmente a última opção para resolver problemas de saúde devido ao risco intrínseco que representam ao paciente, ainda mais se o órgão a ser operado tiver uma função vital. Via de regra, a seleção de um médico capacitado para o procedimento é implícita, baseada no seu tempo de experiência e seu histórico de sucesso. Entretanto, um novo trabalho publicado no último dia 2 por pesquisadores da Universidade McGill, em Montreal, propõe uma forma mais sensível de qualificação. Eles usaram um setup de realidade virtual e técnicas de machine learning para classificar cirurgiões quanto ao seu nível de aptidão para realizar operações cerebrais.

Para o estudo, 50 participantes foram recrutados, com quatro diferentes graus de experiência: expert, senior, júnior e estudantes de medicina. Cada um realizou 5 cirurgias para retirada de tumor cerebral em um ambiente de realidade virtual. O trabalho fez uso do NeuroVR, um simulador neurocirúrgico de alta fidelidade desenvolvido para recriar a experiência visual e de tato da resseção de um tumor de cérebro humano através de um microscópio. A técnica avaliada requeria habilidades psicomotoras de ambas as mãos para a manipulação de um forceps e um aspirador ultrassônico, onde a preservação das estruturas adjacentes é de extrema importância. Uma demonstração da cirurgia virtual pode ser visualizada aqui.

O simulador fornece vários dados que podem usados em análise posteriores. No caso, os pesquisadores coletaram, em intervalos de 20 milissegundos, a ativação, a força aplicada, a posição da ponta e o ângulo de cada instrumento, o volume removido de tumor e tecido saudável nas imediações, e se os instrumentos estavam em contato com o tumor, com um vaso sanguíneo ou com tecido saudável. Os dados foram tratados para gerar medidas que refletissem informações mais relevantes na avaliação da qualidade da operação, como a velocidade, aceleração e trepidações dos instrumentos, sua posição relativa um ao outro, momentos de divergência e convergência de suas pontas, e as taxas de remoção de tecido. As condições foram analisadas em três janelas da cirurgia: durante todo o cenário, durante a resseção do tumor e durante a sucção de sangue. Os valores de média, mediana e máximo de todas as métricas foram selecionados; nessa etapa, as 5 cirurgias de cada participante foram sumarizadas pelo cálculo da média. No total, 270 métricas foram geradas. Aquelas que não mostravam diferença significativa entre quaisquer duas classes de experiência foram removidas, permanecendo 122 métricas.

Os dados tratados foram usados em quatro algoritmos de classificação: K-nearest neighbor (KNN), naive Bayes, análise discriminante e support vector machine. As métricas a serem incluídas no modelo foram selecionadas pelo método forward, onde o modelo começa com uma métrica aleatória e outra é adicionada a cada etapa, e pelo método backward, onde o modelo começa com todas as métricas e uma é retirada aleatoriamente a cada etapa. A precisão do modelo na classificação da habilidade dos cirurgiões foi determinada por validação cruzada do tipo leave-one-out, onde todos os participantes menos um são usados para treinamento, e o participante que ficou de fora é usado para validação.

O algoritmo de melhor desempenho foi o KNN, que atingiu uma precisão de 90%, classificando corretamente 45 dos 50 cirurgiões, usando apenas 6 das métricas à disposição – o menor número entre os algoritmos avaliados. O método em questão revela que as medidas de aptidão manual capturadas pelo simulador podem ser usadas para separar cirurgiões em grupos, os quais acabam refletindo seu grau de experiência. A classificação foi bem-sucedida usando informações mínimas sobre as aptidões dos participantes.

Esse trabalho pode ter impacto significativo no processo de avaliação continuada de neurocirurgiões. Por um lado, simuladores já são usados em ambiente acadêmico, mas a avaliação tem geralmente dependido de feedback humano. Por outro, existe a necessidade de um teste objetivo, consistente e transparente para a avaliação do conhecimento, do julgamento e das habilidades específicas a especialidades médicas cirúrgicas, as quais são necessárias para a manutenção da certificação dos cirurgiões. A aliança entre simuladores e modelos de machine learning parece oferecer um caminho que merece consideração.