Какое программное обеспечение может преобразовать почерк в текст?
Я посмотрел на MyScript, но программа не принимает формат PDF.
У меня есть несколько документов (PDF), которые представляют собой сканы рукописного текста.
Мне нужна программа, которая может отсканировать PDF, использовать OCR и преобразовать его в текст.
Что-нибудь подобное существует?
3 ответа
На самом деле, нет. Распознавание рукописного ввода - сложная проблема, и неспособность взломать это была одна из ключевых причин провала Apple Newton. Palm должен был создать псевдоскрипт под названием "Граффити", чтобы распознать его, и это было сделано по одной букве за раз на специальной клавиатуре, а не написано в виде скрипта.
Вы можете попробовать программу OCR - она может работать, но в лучшем случае вам, вероятно, придется потратить немало времени на исправление ошибок, допущенных программой.
В качестве альтернативы можно попробовать что-то вроде http://www.rentacoder.com/ и посмотреть, сможете ли вы заплатить кому-нибудь за ввод текста вручную. В развивающихся странах довольно много людей, которые работают через это, поэтому, возможно, можно будет сделать это довольно дешево. В качестве альтернативы, может также быть кто-то, у кого есть приложение Mechanical Turk, которое делает это.
Если документы не очень длинные, лучше сделать это вручную. Программа распознавания текста хороша только для печатных слов, не говоря уже о рукописных словах.
Если вы еще не написали текст, вы можете использовать определенные программные решения на основе пера, такие как ritePen. Здесь дело не в этом.
Типовое программное обеспечение, которое вы ищете, называется ICR (Intellgent Character Recognition), а не OCR. Тем не менее, это действительно очень эффективно только для печатного текста и в основном для тех форм, где вы заполняете поля по одной букве в каждом блоке.
Как и все остальное, сценарий не так уж и актуален.