Moshi AI: assistente virtual de conversação é o primeiro open source com execução local

Uma mulher e um robô estão sentados em cadeiras, de frente um para o outro, como se estivessem conversando.

Até então relativamente desconhecida, a empresa francesa Kyutai surpreendeu a comunidade com o lançamento do Moshi, no início do mês. Moshi é um novo assistente de IA que pode ser usado para conversas naturais e expressivas, semelhante a outros modelos de IA de conversação oferecidos por grandes empresas, como o GPT-4o da concorrente OpenAI. No entanto, uma das principais características do Moshi é que ele pode ser executado localmente em uma variedade de dispositivos. Isso o torna especialmente útil para situações onde o acesso à internet é limitado.

De acordo com a empresa, o Moshi foi projetado para se comunicar via voz de maneira natural. Ele pode entender o tom de voz e interrupções, tornando as conversas mais fluidas e realistas. O modelo por trás do assistente foi batizado de Helium. Com 7 bilhões de parâmetros, ele foi treinado com dados de texto e áudio. Os desenvolvedores planejam compartilhar o código e os pesos do modelo, permitindo que outros o aprimorem. Essa abordagem colaborativa diferencia o Moshi de alguns outros modelos de IA de conversação, que são desenvolvidos e mantidos por empresas privadas.

Embora o Moshi ofereça várias vantagens, ele também tem limitações. Por ser executado localmente, a janela de contexto e a base de conhecimento do Moshi são menores do que as de alguns modelos de IA de conversação baseados em nuvem. Isso significa que o Moshi pode não ser capaz de acessar e processar informações tão rápida ou completamente quanto alguns de seus concorrentes. Entretanto, a empresa já planeja melhorias nesse sentido, com ajuda da comunidade. O vídeo abaixo apresenta uma demonstração do assistente interagindo com um usuário. A latência praticamente inexistente é o que mais impressiona.

Créditos: Kyutai

A Kyutai é um laboratório de pesquisa fundado em 2023, e conta com forte investimento de players importantes no mercado de IA. Surpreendentemente, o Moshi foi desenvolvido em apenas 6 meses com uma equipe de 8 desenvolvedores. A ferramenta pode ser testada online em https://moshi.chat/.

Sobre o autor

2 comentários em “Moshi AI: assistente virtual de conversação é o primeiro open source com execução local”

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.