Stable Audio Open: solução open-source para geração de trechos de áudio
O modelo, disponível em formato open-source, é ideal para gerar trechos curtos de áudio, como pequenos arranjos musicais ou som ambiente, a partir de prompts de texto.
O modelo, disponível em formato open-source, é ideal para gerar trechos curtos de áudio, como pequenos arranjos musicais ou som ambiente, a partir de prompts de texto.
O recurso fará parte das novas versões dos sistemas operacionais da empresa, aproximando seus usuários das capacidades avançadas dos modelos mais recentes de IA generativa.
Evento trouxe novidades no Copilot e a disponibilidade de novos modelos e hardware para inteligência artificial.
Empresa anuncia novidades em seus principais produtos disponibilizadas pela integração do Gemini em novas versões.
O modelo impressiona por sua fluência e coerência ao interagir com pessoas por voz em tempo real, além de suas capacidades multimodais.
O modelo, baseado em transformers, permite facilitar o processo de desenvolvimento de novos produtos químicos, reduzindo o tempo necessário, custos, e a necessidade de testes com animais.
Expandindo sobre seu predecessor, além de permitir gerar áudio com prompts de texto, a nova versão também permite usar prompts no formato de áudio, para maior controle do processo de geração.
O sistema pode gerar vídeos realistas de uma cabeça falante com apenas uma imagem, animando os lábios e a expressões faciais em sintonia com um clipe de áudio.
O modelo ultrapassa seus concorrentes open-source nas principais categorias de avaliação de desempenho de LLMs.
O modelo é composto por uma arquitetura do tipo mix-of-experts otimizada que lhe proporciona melhorias de qualidade e performance.