IA possibilita tarefas utilizando dois modais de informação
O novo modelo foi capaz de codificar conceitos relacionados em dois modais (dentre imagem, vídeo, texto e áudio) em uma mesma região de um espaço latente, assim conseguindo identificar os dados em dois modais que representam o mesmo evento.