Описание тега ocr
Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которыми могут управлять текстовые процессоры и т. Д.
1
ответ
Я отсканировал кучу квитанций и хочу отсканировать / распознать их данные в файл Excel. Как бы я это сделал?
Все квитанции имеют одинаковый формат (т. Е. Их список заказов, даты транзакций). Мне было интересно, может ли моя OCR-программа (Omnipage 17) перейти к определенной координате и распознать данные, тогда каким образом можно создать CSV-файл или даже…
09 дек '10 в 04:45
1
ответ
Применение метаданных к файлам на основе распознавания их содержимого
По сути, я ищу инструмент (Windows/Mac), который позволит мне следующий рабочий процесс: Сканирование ВСЕХ моих документов в папку (200-300 отсканированных изображений) запустите инструмент, который просматривает все файлы и запускает на них OCR на …
17 апр '12 в 10:15
0
ответов
Как я могу получить изображение текста, где я могу указать шрифт (файл TFF)?
Есть ли какой-нибудь способ быстро переписать большой объем текста странным шрифтом (например, что-то вроде BulletMix: https://www.fontstock.net/4041/bulletmix.html)? У меня есть доступ к фотошопу, но онлайн-метод предпочтительнее. Я посмотрел в Инт…
05 июн '16 в 08:18
2
ответа
Как отформатировать OCR PDF с двумя столбцами в один столбец
У меня проблемы с чтением PDF на моем Kindle, потому что текст OCR отображается в двух столбцах на странице. (Т.е. книга была отсканирована по две страницы за раз, они были распознаны). Как я могу отформатировать это в один столбец (или любой другой…
12 май '12 в 03:43
2
ответа
OCR, который добавляет сгенерированный текст в исходные файлы PDF и DJVU?
Моя ОС - Ubuntu. Я обнаружил, что некоторые приложения могут распознать файл PDF или DJVU, создавая другой текстовый файл. Но мне было интересно, как добавить текст OCRed в исходные файлы pdf или djvu, чтобы сделать его текстовым для выбора в исходн…
07 май '11 в 19:59
0
ответов
UltraVNC не работает с OCR, RDC успешно
Я пытаюсь использовать OCR на удаленной машине, к которой можно подключиться через RDC или VNC. Там должен быть запущен один скрипт, использующий пакет OCR tesseract. По какой-то причине VNC-сервер и сценарий дают сбой, он не определяет буквы правил…
15 май '19 в 07:55
3
ответа
Какое программное обеспечение может преобразовать почерк в текст?
Я посмотрел на MyScript, но программа не принимает формат PDF. У меня есть несколько документов (PDF), которые представляют собой сканы рукописного текста. Мне нужна программа, которая может отсканировать PDF, использовать OCR и преобразовать его в …
21 июл '09 в 09:22
2
ответа
Как оставить изображение PDF без изменений при добавлении OCR в PDF с pdfsandwich?
Я пытаюсь добавить OCR в PDF-файлы и использую для этого pdfsandwich. Проблема в том, что pdfsandwich обрабатывает изображение при распознавании, которое меняет внешний вид документа. Есть ли способ гарантировать, что изображение PDF остается полнос…
25 апр '19 в 02:10
0
ответов
Разделение изображения текста на слова - возможно ли это?
Мне интересно, есть ли способ разбить отсканированную копию страницы (то есть изображение) на изображения составляющих его слов. Сканируемая книга написана на индийском языке, для которого OCR (оптическое распознавание символов) не будет работать. Ц…
22 авг '18 в 00:01
4
ответа
Автоматизируйте чтение номеров лото
Когда мы покупаем большое количество билетов в лото, есть ли способ прочитать все эти числа в электронную таблицу, чтобы их можно было сравнить с выигрышными числами через формулы / макросы? Я ищу приложение для распознавания текста, которое может п…
07 окт '09 в 20:25
2
ответа
OCR с неязыковым текстом
Мне интересно использовать OCR для распознавания текста из документа, который не содержит слов. Скорее, это документ с длинной строкой "случайных" печатных символов. Я пытался использовать tesseract для сканирования текста, но, похоже, он ищет слова…
28 авг '13 в 15:00
2
ответа
Онлайн веб-сайт OCR для обработки всего PDF-файла за один раз?
Я ищу веб-сайт OCR для одновременной обработки многостраничного файла PDF. Бесплатно желательно. Я знаю http://www.newocr.com/. Если я прав, он может распознавать только одну страницу за раз, вручную нажимая "Предварительный просмотр", а затем нажим…
06 июл '12 в 15:22
2
ответа
OCR в Word 2013
Word 2013 может наивно открывать и редактировать PDF документы (на мой взгляд, большой плюс). Есть ли способ заставить это сделать некоторое OCR также? В PDF-файле, в котором были в основном рисунки, даже части, представляющие собой чистый текст, бы…
16 июл '12 в 22:53
4
ответа
Как я могу искать несколько файлов PDF, которые имеют OCR?
У меня есть тысячи и тысячи PDF-файлов с OCR. Здорово, когда у вас есть один открытый, но я хочу иметь возможность находить PDF-файлы в папке, содержащей X. В Adobe, похоже, есть что-то встроенное, но это занимает довольно много времени для обработк…
18 июл '12 в 07:24
1
ответ
Как извлечь текст из PDF-файла на основе изображений с помощью Cuneiform в терминале
клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я исполь…
31 янв '17 в 09:27
1
ответ
OCR испортил Ghostscript
В прошлом году в Ghostscript была обнаружена ошибка. Это задокументировано здесь: http://bugs.ghostscript.com/show_bug.cgi?id=696116 Помечено Статус: РАЗРЕШЕНО WONTFIX В конце концов, правопреемник Кен Шарп пишет: "К сожалению, я не вижу никаких пер…
25 июл '16 в 12:30
1
ответ
В jTessBoxEditor for Tesseract, как объединить несколько файлов TIFF/boxfile в один файл с обученными данными
Я думаю, что это было бы возможно с командной строкой, но как это сделать с помощью jTessBoxEditor, поскольку это автоматизировало бы большую часть рабочего процесса. Так как jTessBox поддерживает многостраничный TIFF, я думаю, что так может быть, н…
25 ноя '15 в 08:03
0
ответов
Конвертируйте и сжимайте несколько файлов TIF (изображений) в один PDF с помощью OCR
Я нашел один старый проект, который делает именно то, что я хочу! Но это как-то сломано. Некоторые важные части, кажется, отсутствуют. Это кошмар для настройки. Вы можете посмотреть на это здесь: http://bookscanner.pbworks.com/w/page/40965440/FrontP…
21 дек '15 в 18:15
1
ответ
Как заставить OCR распознавать это изображение
Исходное изображение Я думаю, что распознать цифры из этого изображения было бы действительно легко, но это не может быть распознано тессерактом и большим количеством онлайн-распознавания текста. Затем я обрабатываю это так. изображение процесса К с…
06 янв '16 в 12:02
1
ответ
OCR инженерных чертежей?
Какое лучшее решение для анализа OCR рукописных текстовых строк, которые появляются на карте? Более подробное объяснение того, что я ищу: Я работаю над большой обработкой данных, включающей библиотеку технических чертежей. Они предназначены для комм…
12 авг '11 в 20:29