Stable Audio Open: solução open-source para geração de trechos de áudio
O modelo, disponível em formato open-source, é ideal para gerar trechos curtos de áudio, como pequenos arranjos musicais ou som ambiente, a partir de prompts de texto.
O modelo, disponível em formato open-source, é ideal para gerar trechos curtos de áudio, como pequenos arranjos musicais ou som ambiente, a partir de prompts de texto.
Expandindo sobre seu predecessor, além de permitir gerar áudio com prompts de texto, a nova versão também permite usar prompts no formato de áudio, para maior controle do processo de geração.
Utilizando apenas 15 segundos de áudio como referência, o modelo é capaz de replicar a voz do interlocutor, transferindo para outros textos e até outros idiomas.
O modelo tem como grande novidade produzir sons e vozes, contextualizadas em um ambiente por exemplo, através de prompts de texto.