Описание тега ocr

Описание тега Вопросы с тегом

Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которыми могут управлять текстовые процессоры и т. Д.

1 ответ

Я отсканировал кучу квитанций и хочу отсканировать / распознать их данные в файл Excel. Как бы я это сделал?

Все квитанции имеют одинаковый формат (т. Е. Их список заказов, даты транзакций). Мне было интересно, может ли моя OCR-программа (Omnipage 17) перейти к определенной координате и распознать данные, тогда каким образом можно создать CSV-файл или даже…

microsoft-excel ocr

09 дек '10 в 04:45

1 ответ

Применение метаданных к файлам на основе распознавания их содержимого

По сути, я ищу инструмент (Windows/Mac), который позволит мне следующий рабочий процесс: Сканирование ВСЕХ моих документов в папку (200-300 отсканированных изображений) запустите инструмент, который просматривает все файлы и запускает на них OCR на …

windows macos metadata ocr scanning

17 апр '12 в 10:15

0 ответов

Как я могу получить изображение текста, где я могу указать шрифт (файл TFF)?

Есть ли какой-нибудь способ быстро переписать большой объем текста странным шрифтом (например, что-то вроде BulletMix: https://www.fontstock.net/4041/bulletmix.html)? У меня есть доступ к фотошопу, но онлайн-метод предпочтительнее. Я посмотрел в Инт…

fonts adobe-photoshop ocr transcription

05 июн '16 в 08:18

2 ответа

Как отформатировать OCR PDF с двумя столбцами в один столбец

У меня проблемы с чтением PDF на моем Kindle, потому что текст OCR отображается в двух столбцах на странице. (Т.е. книга была отсканирована по две страницы за раз, они были распознаны). Как я могу отформатировать это в один столбец (или любой другой…

pdf ocr kindle

12 май '12 в 03:43

2 ответа

OCR, который добавляет сгенерированный текст в исходные файлы PDF и DJVU?

Моя ОС - Ubuntu. Я обнаружил, что некоторые приложения могут распознать файл PDF или DJVU, создавая другой текстовый файл. Но мне было интересно, как добавить текст OCRed в исходные файлы pdf или djvu, чтобы сделать его текстовым для выбора в исходн…

ubuntu pdf ocr djvu

07 май '11 в 19:59

0 ответов

UltraVNC не работает с OCR, RDC успешно

Я пытаюсь использовать OCR на удаленной машине, к которой можно подключиться через RDC или VNC. Там должен быть запущен один скрипт, использующий пакет OCR tesseract. По какой-то причине VNC-сервер и сценарий дают сбой, он не определяет буквы правил…

remote-desktop vnc ocr

15 май '19 в 07:55

3 ответа

Какое программное обеспечение может преобразовать почерк в текст?

Я посмотрел на MyScript, но программа не принимает формат PDF. У меня есть несколько документов (PDF), которые представляют собой сканы рукописного текста. Мне нужна программа, которая может отсканировать PDF, использовать OCR и преобразовать его в …

windows pdf ocr

21 июл '09 в 09:22

2 ответа

Как оставить изображение PDF без изменений при добавлении OCR в PDF с pdfsandwich?

Я пытаюсь добавить OCR в PDF-файлы и использую для этого pdfsandwich. Проблема в том, что pdfsandwich обрабатывает изображение при распознавании, которое меняет внешний вид документа. Есть ли способ гарантировать, что изображение PDF остается полнос…

pdf ocr scanning tesseract-ocr

25 апр '19 в 02:10

0 ответов

Разделение изображения текста на слова - возможно ли это?

Мне интересно, есть ли способ разбить отсканированную копию страницы (то есть изображение) на изображения составляющих его слов. Сканируемая книга написана на индийском языке, для которого OCR (оптическое распознавание символов) не будет работать. Ц…

pdf image-editing ocr image-processing

22 авг '18 в 00:01

4 ответа

Автоматизируйте чтение номеров лото

Когда мы покупаем большое количество билетов в лото, есть ли способ прочитать все эти числа в электронную таблицу, чтобы их можно было сравнить с выигрышными числами через формулы / макросы? Я ищу приложение для распознавания текста, которое может п…

spreadsheet ocr

07 окт '09 в 20:25

2 ответа

OCR с неязыковым текстом

Мне интересно использовать OCR для распознавания текста из документа, который не содержит слов. Скорее, это документ с длинной строкой "случайных" печатных символов. Я пытался использовать tesseract для сканирования текста, но, похоже, он ищет слова…

ocr tesseract-ocr

28 авг '13 в 15:00

2 ответа

Онлайн веб-сайт OCR для обработки всего PDF-файла за один раз?

Я ищу веб-сайт OCR для одновременной обработки многостраничного файла PDF. Бесплатно желательно. Я знаю http://www.newocr.com/. Если я прав, он может распознавать только одну страницу за раз, вручную нажимая "Предварительный просмотр", а затем нажим…

ocr

06 июл '12 в 15:22

2 ответа

OCR в Word 2013

Word 2013 может наивно открывать и редактировать PDF документы (на мой взгляд, большой плюс). Есть ли способ заставить это сделать некоторое OCR также? В PDF-файле, в котором были в основном рисунки, даже части, представляющие собой чистый текст, бы…

ocr word-2013-preview

16 июл '12 в 22:53

4 ответа

Как я могу искать несколько файлов PDF, которые имеют OCR?

У меня есть тысячи и тысячи PDF-файлов с OCR. Здорово, когда у вас есть один открытый, но я хочу иметь возможность находить PDF-файлы в папке, содержащей X. В Adobe, похоже, есть что-то встроенное, но это занимает довольно много времени для обработк…

pdf search ocr

18 июл '12 в 07:24

1 ответ

Как извлечь текст из PDF-файла на основе изображений с помощью Cuneiform в терминале

клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я исполь…

linux pdf fedora ocr

31 янв '17 в 09:27

1 ответ

OCR испортил Ghostscript

В прошлом году в Ghostscript была обнаружена ошибка. Это задокументировано здесь: http://bugs.ghostscript.com/show_bug.cgi?id=696116 Помечено Статус: РАЗРЕШЕНО WONTFIX В конце концов, правопреемник Кен Шарп пишет: "К сожалению, я не вижу никаких пер…

pdf ocr ghostscript

25 июл '16 в 12:30

1 ответ

В jTessBoxEditor for Tesseract, как объединить несколько файлов TIFF/boxfile в один файл с обученными данными

Я думаю, что это было бы возможно с командной строкой, но как это сделать с помощью jTessBoxEditor, поскольку это автоматизировало бы большую часть рабочего процесса. Так как jTessBox поддерживает многостраничный TIFF, я думаю, что так может быть, н…

ocr tesseract-ocr

25 ноя '15 в 08:03

0 ответов

Конвертируйте и сжимайте несколько файлов TIF (изображений) в один PDF с помощью OCR

Я нашел один старый проект, который делает именно то, что я хочу! Но это как-то сломано. Некоторые важные части, кажется, отсутствуют. Это кошмар для настройки. Вы можете посмотреть на это здесь: http://bookscanner.pbworks.com/w/page/40965440/FrontP…

pdf images compression ocr tif

21 дек '15 в 18:15

1 ответ

Как заставить OCR распознавать это изображение

Исходное изображение Я думаю, что распознать цифры из этого изображения было бы действительно легко, но это не может быть распознано тессерактом и большим количеством онлайн-распознавания текста. Затем я обрабатываю это так. изображение процесса К с…

ocr tesseract-ocr

06 янв '16 в 12:02

1 ответ

OCR инженерных чертежей?

Какое лучшее решение для анализа OCR рукописных текстовых строк, которые появляются на карте? Более подробное объяснение того, что я ищу: Я работаю над большой обработкой данных, включающей библиотеку технических чертежей. Они предназначены для комм…

ocr drawing handwriting

12 авг '11 в 20:29