Novo chip estruturado como uma rede neural faz reconhecimento ultrarrápido de imagens

A área de visão computacional exige uma enorme capacidade computacional. Isso se deve principalmente à forma com que as imagens são captadas atualmente, com câmeras e sensores tradicionais. A maioria da informação captada é irrelevante à tarefa, mas mesmo assim precisa ser processada pelas redes neurais desenvolvidas para essa finalidade. Por isso, muitos pesquisadores têm trabalhado no desenvolvimento de sistemas que emulam arquiteturas neurobiológicas, já que elas desempenham essa função de forma eficiente através, por exemplo, do pré-processamento das imagens capturadas pelos olhos antes de passar as informações para que o cérebro possa interpretá-las.

Um estudo publicado semana passada, realizado por pesquisadores do Instituto de Fotônica em Viena, na Áustria, apresentou uma solução que integra hardware e software para realizar o reconhecimento de imagens em nanossegundos. Eles construíram um chip inteligente composto de uma camada ultrafina – com apenas poucos átomos de espessura – do material chamado de diselenida de tungstênio, que tem propriedades elétricas únicas. Essa estrutura foi integrada por diodos sensíveis à luz, arranjados para que eles próprios formassem os nós de uma rede neural. O resultado é que essa rede neural física pode ser treinada para reconhecer informação visual ajustando em tempo real a sensibilidade dos diodos, que agem como os pesos de uma rede neural artificial. Os chips desenvolvidos foram capazes de reconhecer versões estilizadas das letras n, v e z em nanossegundos, o que na prática representa uma latência irrelevante. A precisão chegou a 100%, mesmo com sinais contendo ruído. Além da tarefa de classificação, a rede também foi treinada como um autoencoder, se tornando capaz de “limpar” sinais com ruído, recuperando o sinal original. Isso poderia ser útil se o objetivo fosse usar o sinal captado pelo chip em outras tarefas que não dependessem dele.

Por enquanto, este trabalho representa uma prova de conceito, já que os chips possuem apenas 27 sensores que podem processar imagens de 3×3 pixels. Entretanto, escalonar a estrutura para aumentar sua aplicabilidade é uma questão de tempo. Avanços nesse sentido serão muito bem-vindos nas áreas que dependem do reconhecimento rápido e preciso de informações visuais, como carros autônomos e robôs que operam atividades de alto risco.