Meta Apresenta o Futuro da Tradução sem Fronteiras

"Ilustração estilo cartoon mostrando um robô azul com antenas ao centro interagindo com oito pessoas diversas (diferentes gêneros e etnias) dispostas em uma fileira. Acima deles há balões de diálogo contendo textos em diferentes idiomas, sugerindo uma tradução ou comunicação multilíngue. O robô e as pessoas estão sorrindo e fazendo gestos de comunicação com as mãos. As cores predominantes são azul, rosa e amarelo, com um fundo claro."

Em um avanço inédito para a comunicação global, a Meta apresentou o SeamlessM4T, um modelo multimodal projetado para derrubar barreiras linguísticas através de tradução contínua de fala e texto. Este sistema representa um salto significativo em direção ao sonho da ficção científica de um tradutor universal, oferecendo traduções de alta qualidade em quase 100 idiomas, além de suportar múltiplas tarefas, incluindo fala para texto, fala para fala e tradução de texto para texto, tudo dentro de um único modelo unificado.

A arquitetura técnica por trás do SeamlessM4T é tanto elegante quanto sofisticada, construída sobre o kit de ferramentas de modelagem de sequência fairseq2 redesenhado da Meta. Em seu núcleo, o modelo emprega uma arquitetura UnitY multitarefa que processa tanto texto quanto fala através de codificadores especializados capazes de reconhecer entradas em numerosos idiomas. O sistema então utiliza um decodificador de texto para transferir significado entre idiomas, seguido por um modelo texto-para-unidade que converte a saída em unidades acústicas discretas para geração de fala em 36 idiomas.

O que diferencia o SeamlessM4T é sua escala sem precedentes de dados de treinamento e abordagem inovadora para coleta de dados. A equipe desenvolveu o SONAR, um poderoso espaço de incorporação de texto multilíngua multimodal cobrindo 200 idiomas, que supera significativamente as abordagens existentes na busca por similaridade multilíngua. Através deste sistema, eles criaram o SeamlessAlign, o maior conjunto de dados de tradução multimodal aberto até hoje, compreendendo 470.000 horas de fala e alinhamentos de texto minerados. Este extenso conjunto de dados tem sido instrumental para alcançar resultados estado-da-arte em várias tarefas de tradução, particularmente melhorando o desempenho para idiomas com poucos e médios recursos, enquanto mantém fortes capacidades em idiomas amplamente falados.

Em linha com a dedicação da Meta à ciência aberta, o SeamlessM4T foi lançado sob uma licença que permite que pesquisadores e desenvolvedores construam sobre este trabalho inovador. Este lançamento inclui não apenas o modelo em si, mas também os metadados do SeamlessAlign e ferramentas como SONAR e stopes para processamento de dados multimodais. O material pode ser acessado no GitHub do projeto.

Sobre o autor

1 comentário em “Meta Apresenta o Futuro da Tradução sem Fronteiras”

  1. Arlindo Gonçalves Vianna Junior

    LI o artigo achei muito promissor, pesquisei sobre o autor e percebi que um dos site a ultima atualização foi em 2019. Gostaria de acompanhar o desenvolvimento do trabalho dele. obrigado

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.