В jTessBoxEditor for Tesseract, как объединить несколько файлов TIFF/boxfile в один файл с обученными данными
Я думаю, что это было бы возможно с командной строкой, но как это сделать с помощью jTessBoxEditor, поскольку это автоматизировало бы большую часть рабочего процесса.
Так как jTessBox поддерживает многостраничный TIFF, я думаю, что так может быть, но как мне организовать boxfiles в этом случае?
1 ответ
Вам нужно будет обновить номер страницы (6-й столбец) в каждом файле блока, а затем объединить файлы в один. Номер страницы начинается с нуля и должен соответствовать порядку отдельных страниц в многостраничном изображении TIFF. После этого вы можете проверить, открыв изображение в jTessBoxEditor, чтобы проверить, совпадают ли поля с изображением.