Responder a: Vosk – Como Melhorar Acurácia da Transcrição

Home Fóruns Fórum Classificação de Áudio com Python: O Guia Completo Vosk – Como Melhorar Acurácia da Transcrição Responder a: Vosk – Como Melhorar Acurácia da Transcrição

#38098
Dalton Vargas
Moderador

Olá Ilton!

De acordo com a documentação do Vosk é sugerido algumas verificações:

  • o áudio deve estar em boa qualidade;
  • as condições de áudio, como sotaque, realmente não foram as usadas no treinamento do modelo;
  • problemas de áudio imprevisíveis, como queda de quadro ou bugs de codificação de quadro;
  • erros de software.

Dito isto, você também pode tentar implementar algumas das técnicas de pré-processamento de áudio demonstradas aqui no curso, principalmente nas técnicas utilizadas no exemplo de treinamento do modelo de reconhecimento de comandos básicos.