Responder a: Vosk – Como Melhorar Acurácia da Transcrição

Home Fóruns Fórum Classificação de Áudio com Python: O Guia Completo Vosk – Como Melhorar Acurácia da Transcrição Responder a: Vosk – Como Melhorar Acurácia da Transcrição

#38098
Dalton Vargas
Moderador

    Olá Ilton!

    De acordo com a documentação do Vosk é sugerido algumas verificações:

    • o áudio deve estar em boa qualidade;
    • as condições de áudio, como sotaque, realmente não foram as usadas no treinamento do modelo;
    • problemas de áudio imprevisíveis, como queda de quadro ou bugs de codificação de quadro;
    • erros de software.

    Dito isto, você também pode tentar implementar algumas das técnicas de pré-processamento de áudio demonstradas aqui no curso, principalmente nas técnicas utilizadas no exemplo de treinamento do modelo de reconhecimento de comandos básicos.