Как я могу преобразовать DJVU в PDF с сохранением слова для поиска?

Question

Как я могу преобразовать DJVU в PDF с сохранением слова для поиска?

У меня есть файл djvu, в котором я могу искать конкретные слова. Однако, если я преобразую его в pdf (я пробовал использовать cutePDF и онлайн - инструмент djvu-pdf), возможность поиска слов будет потеряна.

Как я могу преобразовать файл djvu в PDF, сохраняющий слово для поиска?

14

pdf search conversion print-to-pdf djvu

Источник

glS 06 янв '15 в 15:48

7 ответов

Другие вопросы по тегам pdf search conversion print-to-pdf djvu

vindvaki 29 авг '15 в 15:52 2015-08-29 15:52 · Answer 1 · 2015-08-29 15:52

Я написал сценарий, чтобы сделать это давным-давно. Это по сути склеенный код вокруг нескольких утилит, которые делают тяжелую работу. Разница между моим сценарием и другими инструментами того времени заключается в том, что мой единственный был единственным, который выполнял все следующие действия:

имеет степень сжатия, аналогичную исходному файлу DjVu (размер в 1,5-2 раза вместо размера в 10-20 раз)
сохраненные метаданные закладок / оглавления (для навигации в программе чтения PDF)
сохранил встроенный текстовый слой для поиска

При этом, это очень примитивно. Я просто убедился, что он хорошо работает для всех моих файлов и с тех пор не работал с ним.

login 03 сен '21 в 00:15 2021-09-03 00:15 · Answer 2 · 2021-09-03 00:15

Скрипты виндваки vindvaki упаковал в образ докера с необходимыми зависимостями. Вы можете попробовать это с:

        docker run --rm -u $(id -u):$(id -g) -v $(pwd):/opt/work ilyabystrov/djvu2pdf filename.djvu filename.pdf

Подробности смотрите в djvu2pdf-docker.

7

Источник

login 03 сен '21 в 00:15

Marc Aurel 11 авг '18 в 16:00 2018-08-11 16:00 · Answer 3 · 2018-08-11 16:00

Этот конвертер DjVu в PDF определенно сохраняет возможность поиска слов в случае, если исходный DjVu доступен для поиска. Это также производит меньшие выходные файлы, чем калибр.

4

Источник

Marc Aurel 11 авг '18 в 16:00

Marduk 17 авг '16 в 01:32 2016-08-17 01:32 · Answer 4 · 2016-08-17 01:32

Откройте PDF-файл в PDF-XChange Viewer и выполните распознавание текста (я думаю, что поддерживаются только четыре языка). Это требует времени, но это чертовски хорошо (даже в двухколоночных документах).

На Mac и Linux вам понадобится Wine.

2

Источник

Marduk 17 авг '16 в 01:32

beatcracker 19 фев '15 в 19:24 2015-02-19 19:24 · Answer 5 · 2015-02-19 19:24

Вы пробовали Калибр? Участник Caliber упоминает, что текст OCR в djvu поддерживается. Таким образом, он может быть преобразован в PDF с возможностью поиска текста.

1

Источник

beatcracker 19 фев '15 в 19:24

M2G 08 сен '22 в 21:03 2022-09-08 21:03 · Answer 6 · 2022-09-08 21:03

Все эти ответы предлагают просто снова выполнить OCR!?

Лучший инструмент для этой работы (ИМХО) — бесплатное приложение под названием Djvutoy form:https://www.mediafire.com/folder/oajr60vu7zcls/MJ_Stronghorse_Apps

1

Источник

M2G 08 сен '22 в 21:03

srghma 26 мар '22 в 17:41 2022-03-26 17:41 · Answer 7 · 2022-03-26 17:41

Лучший сайт-конвертер, который я нашел

https://www.pdf2go.com/ + опция распознавания текста

1

Источник

srghma 26 мар '22 в 17:41