Преобразование PDF без потерь в DJVU
Я ищу способ без потерь, надежного и сжатого преобразования PDF-файлов, которые содержат черно-белые текстовые сканы, в формат djvu. Инструмент должен быть программой командной строки, чтобы я мог разбить преобразование. я нашел это djvulibre
но я не смог заставить его работать с необходимыми драйверами на моем Linux Ubuntu (они кажутся отдельными из-за проблем с лицензией). pdf2djvu
имеет параметры для настройки уровня потерь при сжатии изображений, но я не уверен, что он всегда будет правильно определять разрешение исходных файлов, так что я боюсь, что это может привести к потерям из-за повторной выборки изображений. Любые намеки на другое программное обеспечение, разрешение проблем с драйвером djvulibre
или правильное использование pdf2djvu
очень приветствуются
1 ответ
Вы можете использовать xpdf для извлечения отсканированных изображений из ваших файлов PDF.
Затем используйте imagemagick для преобразования каждого изображения в формат pbm:
convert page-000.png page-000.pbm
Затем с помощью djvulibre преобразуйте изображения в формате pbm в страницы djvu.
cjb2 -clean page-000.pbm page-000.djvu
Наконец добавление вашей новой страницы в окончательный документ
djvm -i page.djvu page-000.djvu
Процесс частично объясняется здесь: Создание файла DjVu