TesseractError

Visualizando 5 posts - 1 até 5 (de 5 do total)
  • Autor
    Posts
  • #30767

    Olá, tudo bem?

    Gostaria de retirar uma dúvida sobre um problema que estou tendo.

    Estou fazendo o curso de “Reconhecimento de texto com OCR e Python”, pois bem, compilei o arquivo fonte do primeiro tópico, sem problemas, quando tentei os arquivos dos outros tópicos tive como retorno erro, tentei voltar então ao primeiro código que inicialmente funcionava, o mesmo também passou a apresentar erro, segue abaixo a mensagem para visualização:

    TesseractError: (1, ‘Error opening data file tessdata/por.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘por’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)

    Estou tentando realizar a etapa “Processamento do vídeo e exibição do resultado” do conteúdo OCR em vídeos.

    A execução dos códigos está sendo feita no Google Colab com a cópia do código fonte original.

    Gostaria de uma orientação em como devo proceder neste caso.

    Obrigado.

    Atenciosamente.

    Fernando Guizã

    #30768

    Este é o erro completo que está retornando:

    Print do TesseractError

    Não foram realizadas alterações do código original.

    Obrigado.

    Att.

    #30785
    Gabriel Alves
    Moderador

    Olá Fernando!

    Acredito que tenha ocorrido algum problema para baixar o arquivo de tradução (por.traineddata), provavelmente foi feito o download mas não do arquivo bruto (pode acontecer as vezes)
    veja quanto pesa o arquivo por.traineddata, ele tem que pesar aproximadamente 14mb

    Se ainda estiver com problemas para baixar então substitua em seu código (na linha do !wget) o link abaixo

    de:
    https://github.com/tesseract-ocr/tessdata/blob/master/por.traineddata?raw=true

    para:
    https://github.com/tesseract-ocr/tessdata/blob/main/por.traineddata?raw=true

     

    Ou seja, o comando ficará assim

    !wget -O ./tessdata/por.traineddata https://github.com/tesseract-ocr/tessdata/blob/main/por.traineddata?raw=true

     

    Após baixar esse arquivo e substituir o que baixou anteriormente faça os testes novamente.

    #30792

    Obrigado Gabriel,

    Fiz o ajuste conforme orientado e consegui prosseguir, entretanto algumas etapas após (“Processamento do vídeo e exibição do resultado”), ocorreu um erro, ele aparentemente processou as imagens e exportou o arquivo de vídeo, entretanto o arquivo ficou com apenas 2 segundos ao invés de 4 segundos que deveria possuir.

    Processamento do vídeo e exibição do resultado

    resultado_east_tesseract

    Rodei o tópico posterior (“OCR em vídeos com EasyOCR”) e ele não apresentou erros, retornando o vídeo com 4 segundos.

    Solicito novamente auxilio para a resolução do problema.

    Desde já agradeço a atenção.

    Obrigado.

    Atenciosamente.

    #30829
    Gabriel Alves
    Moderador

    Olá Fernando,

    Verifique se o vídeo foi baixado corretamente, pois esse erro pode ocorrer quando há algum problema para ler algum frame do vídeo. Verifique também se todas as células do Colab foram executadas. Caso esteja tudo ok, faça o seguinte: “Runtime > Factory reset runtime”  (se o seu estiver em português fica: “Ambiente de Execução > Redefinir o ambiente de execução para a configuração original”)

    E execute seu código novamente.

    Caso o erro permaneça, peço que compartilhe aqui seu Colab para poder auxiliar melhor.

    Mas de preferência compare antes o seu código com esse aqui: https://colab.research.google.com/drive/1a8iChq_1_vgbokpk5VXPWzjTe2lhdqJj?usp=sharing

Visualizando 5 posts - 1 até 5 (de 5 do total)
  • Você deve fazer login para responder a este tópico.