Nos últimos anos, surgiram no mercado os primeiros headsets de realidade virtual. Apesar de a promessa ser fascinante, os dispositivos ainda não caíram no gosto geral do público. Uma das razões é porque estes headsets não produzem imagens tridimensionais verdadeiras, mas sim criam a ilusão de três dimensões a partir da projeção de duas imagens bidimensionais ligeiramente defasadas. No final das contas, o usuário está o tempo todo focando a visão em uma tela numa distância fixa muito próxima de seus olhos. Em muitas pessoas, este esforço causa fadiga e náusea, limitando o tempo de uso dos dispositivos.
Uma alternativa para eliminar este efeito é o uso de hologramas, que são imagens que mudam de perspectiva dependendo da posição do observador, permitindo ao olho ajustar a profundidade focal em função do plano da imagem. Isto é possível porque, além de brilho, hologramas também emitem a fase de cada onda de luz. Hologramas são encontrados na forma dos adesivos presentes em cartões de créditos ou das tarjas nas notas de dinheiro, mas como estes exemplos realçam, estas são imagens estáticas. Além disso, a produção de hologramas não é um processo simples, exigindo a partição de um feixe de laser.
Cientistas procuraram modelar o processo de geração de hologramas em computadores a partir de equações dos fenômenos físicos, mas esta tarefa também se mostrou pouco prática. Como cada pixel da imagem tem uma profundidade diferente, a complexidade dos cálculos aumenta exponencialmente, de forma que só um supercomputador é capaz de realizar a tarefa. Ainda assim, o computador pode levar minutos para gerar uma única imagem.
Isto deve mudar com a publicação esta semana de um trabalho de pesquisadores do Instituto de Tecnologia de Massachusetts (MIT, Estados Unidos). Eles desenvolveram uma abordagem batizada de holografia por tensores, que gera hologramas tridimensionais, com qualidade fotográfica e em tempo real, utilizando inteligência artificial. O trabalho aplica o protocolo básico de qualquer projeto envolvendo machine learning: eles passaram ao modelo, no caso uma rede neural convolucional, pares contendo uma imagem bidimensional mais uma terceira dimensão com informações de profundidade, e sua versão holográfica, para que ele aprendesse a gerar os hologramas a partir das imagens simples. Primeiro foi preciso criar este dataset, e os pesquisadores usaram a oportunidade para incluir imagens de natureza complexa e diversa, de forma que o modelo tivesse à disposição para treinamento uma coleção ampla de situações que deveria atender no futuro. No final do processo, o modelo se mostrou capaz de gerar os hologramas em milissegundos, o que é ordens de magnitude mais rápido que o método que usa modelagem física, e com uma quantidade irrelevante de memória. A imagem abaixo mostra a representação de um holograma gerado pelo modelo, com o foco no brinquedo dentro da caixa amarela na figura da esquerda, e nas letras da roda dentro da caixa azul na figura da direita.
A tecnologia tem potencial para ser revolucionária, já que tanto as imagens quanto a informação de profundidade já podem ser obtidas facilmente usando câmeras de celular e os sensores com tecnologia LiDAR que estão se tornando comuns nestes aparelhos. O maior entrave à popularização desta nova forma de interagirmos com imagens são as telas atuais, que não são capazes de modular as fases das ondas de luz, mas se a ideia ganhar tração e o público mostrar interesse, a produção destes dispositivos deve aumentar, reduzindo os custos.