Home › Fóruns › Fórum Classificação de Áudio com Python: O Guia Completo › Vosk – Como Melhorar Acurácia da Transcrição › Responder a: Vosk – Como Melhorar Acurácia da Transcrição
21 de novembro de 2022 às 17:51 #38098
Moderador
Olá Ilton!
De acordo com a documentação do Vosk é sugerido algumas verificações:
- o áudio deve estar em boa qualidade;
- as condições de áudio, como sotaque, realmente não foram as usadas no treinamento do modelo;
- problemas de áudio imprevisíveis, como queda de quadro ou bugs de codificação de quadro;
- erros de software.
Dito isto, você também pode tentar implementar algumas das técnicas de pré-processamento de áudio demonstradas aqui no curso, principalmente nas técnicas utilizadas no exemplo de treinamento do modelo de reconhecimento de comandos básicos.