Responder a: Could not initialize tesseract.

Home Fóruns Fórum Reconhecimento de Textos com OCR e Python Could not initialize tesseract. Responder a: Could not initialize tesseract.

#30153
Gabriel Alves
Moderador

    Olá, esse “–tessdata-dir tessdata“ é para indicar ao Tesseract que queremos usar os pacotes de linguagem que estão localizados na pasta “tessdata”. Durante o curso usamos esse método pois achamos melhor gerenciar os arquivos através desse diretório, pois além de funcionar melhor oferece mais controle. Mas na verdade é opcional, se você já fez a instalação do Tesseract pelo método tradicional então não é necessário indicar esse parâmetro, ao invés disso você pode instalar os pacotes das linguagens para OCR usando o comando !apt-get install tesseract-ocr-[codigo da linguagem]

    no caso para instalar o pacote para português ficaria !apt-get install tesseract-ocr-por

    (e pode usar !tesseract –list-langs para listar todos os pacotes instalados)