| IA Expert Academy

21 de novembro de 2022 at 17:51 #38098

Moderator

Olá Ilton!

De acordo com a documentação do Vosk é sugerido algumas verificações:

o áudio deve estar em boa qualidade;
as condições de áudio, como sotaque, realmente não foram as usadas no treinamento do modelo;
problemas de áudio imprevisíveis, como queda de quadro ou bugs de codificação de quadro;
erros de software.

Dito isto, você também pode tentar implementar algumas das técnicas de pré-processamento de áudio demonstradas aqui no curso, principalmente nas técnicas utilizadas no exemplo de treinamento do modelo de reconhecimento de comandos básicos.