Тессеракт на Linux
Как решить проблему, не устанавливая tesseract 3.03, когда я получаю предупреждение:
Предупреждение. Вы используете неподдерживаемую версию Tesseract. Ожидается версия 3.03, ваша версия: 3.02.02 Ошибка открытия файла данных /usr/local/share/tessdata/lus.traineddata Убедитесь, что для переменной среды TESSDATA_PREFIX задан родительский каталог вашего каталога "tessdata". Не удалось загрузить язык 'lus' Tesseract не может загрузить ни один язык! Ошибка сегментации (ядро сброшено)
2 ответа
Проверьте, установлен ли пакет
dpkg -l | grep tesseract
Установите teseract, используя пакеты
sudo apt install tesseract-ocr
Поиск / установка доступных связанных пакетов
apt search tesseract | grep -B1 language
Используйте действующий код языка ISO 639-2 (три буквы).
tesseract image.png -l spa myoutput
Будет генерировать myoutput.txt
связанные с
- Улучшение качества изображения перед распознаванием
- Добавить текст в PDF с
pdfsandwich -verbose -lang spa -layout single scanned.pdf
Вот решение:
Просто скопируйте файлы из: openalpr/runtime_data/ocr/tessdata в /usr/local/share/tessdata