Deep learning para enxergar dentro de células vivas

Todo graduando fica um pouco decepcionado quando se aprofunda numa área do conhecimento e descobre que aquilo que lhe foi ensinado na escola era enormemente simplificado. Na área de biologia celular, por exemplo, os alunos percebem que aquela representação da célula que consta nos livros do colégio é bem díspar da realidade: as estruturas internas que formam as células não estão em escala, seu número e localização não são precisos e não somos apresentados a qualquer senso intuitivo sobre sua movimentação. Não é à toa que os complexos processos intracelulares chegam a parecer mágica; como pode uma estrutura tão simples fazer tanta coisa? A bem da verdade, não há nada de simples na estruturação de uma célula, e mesmo na faculdade encontramos dificuldade para conciliar a visão que temos dessa estrutura com os comportamentos celulares que passamos a estudar mais a fundo.

Visualizar as estruturas intracelulares é uma tarefa difícil porque, de um lado, elas são muito pequenas, e de outro, elas se localizam atrás de pelo menos uma membrana e no meio de várias outras estruturas, que se encontram todas geralmente em constante movimento. Os microscópicos óticos, aqueles que usam apenas lentes e luz, são bastante limitados para atravessar a membrana, identificar organelas e assim desvendar esse microuniverso. Os microscópicos eletrônicos, que trabalham com feixes de elétrons ao invés de luz, possuem uma resolução muito maior, e graças à marcação com moléculas fluorescentes permitem a localização de estruturas, mas só são usados com células fixadas, ou seja, permanentemente paralisadas pelo tratamento necessário para a visualização. Além disso, a inclusão de moléculas fluorescentes pode alterar o funcionamento das estruturas, e o processo de preparação para a microscopia eletrônica é caro e lento. Um dos maiores paradigmas da biologia celular é unir os benefícios da microscopia ótica e da microscopia eletrônica, de forma a permitir ver as estruturas intracelulares em funcionamento com a resolução necessária para permitir o teste de teorias científicas.

Pensando nisso, Greg Johnson, um pesquisador em visão computacional do Instituto Allen para a Ciência Celular, em Washington, desenvolveu um modelo baseado em deep learning capaz de identificar e rotular estruturas celulares usando imagens simples disponibilizadas por microscópicos óticos. Ele diz ter se inspirado nos trabalhos recentes mostrando a geração de rostos fotorrealistas usando redes generativas adversariais, que lhe levaram a pensar em usar machine learning para realizar o seu trabalho de modelar células. Seu modelo foi treinado usando imagens rotuladas pelos métodos mais avançados, mas uma vez que ele foi capaz de identificar os limites das estruturas com base em informações mais simples como contrastes e bordas (que é o que faz uma rede convolucional), ele se mostrou eficiente para rotular as imagens sem qualquer tratamento complicado. A melhor parte é que, aplicando o modelo a uma “coleção de imagens sequenciais” (ou seja, um vídeo), foi possível visualizar as estruturas celular em funcionamento, no seu estado natural. O vídeo abaixo mostra como o modelo converte as imagens em um modelo tridimensional da célula.

O modelo identifica, em diferentes cores, estruturas como DNA, nucléolos, envelopes nucleares, membranas celulares e mitocôndrias. No final, o modelo cria um modelo dinâmico tridimensional das células.

O resultado é impressionante para os pesquisadores da área. Com equipamentos simples disponíveis em qualquer laboratório básico, é possível gerar imagens de alto impacto para a pesquisa. Os dados podem ser usados para construir modelos biologicamente precisos de uma célula idealizada. Num senso mais amplo, a técnica é um primeiro passo na modelagem da própria biologia celular, já que conhecer a célula em funcionamento pode permitir a descrição de seus processos e sua inter-relação. Com isso, pesquisadores podem testar teorias num ambiente virtual antes de realizar experimentos, o que representa ainda mais economia de recursos financeiros e tempo. E mesmo quando esses experimentos resultarem negativos, os dados podem ser usados para melhorar o treinamento do algoritmo original, melhorando ainda mais sua eficiência.

A estratégia não deve ficar confinada às imagens. Em teoria, qualquer mensuração que possa ser realizada numa célula pode ser usada para treinar um algoritmo de machine learning. Assim, outras características das estruturas intracelulares podem ser modeladas e preditas, como sua origem ou sua idade. Dado que a cada poucos anos surgem novos métodos de mensuração, o alcance da abordagem parece ilimitado.

O trabalho do Instituto Allen demonstra o potencial da inteligência artificial para aumentar significativamente o alcance da ciência no tipo de questionamento que ela é capaz de responder, e reforça seu papel na exponenciação da velocidade com que a pesquisa pode avançar.