Уменьшение размера файла PDF отсканированных изображений
Я скачал этот PDF-файл с веб-сайта размером 350 КБ с 20 страницами. Все страницы являются отсканированными изображениями. Я извлек изображения с помощью Adobe Acrobat Pro, размер которого составляет 1,32 МБ (просмотр> инструменты> обработка документов> экспорт всех изображений). Я преобразовал их в один файл PDF (1,28 МБ). Как я могу объединить эти изображения в PDF-файл небольшого размера?
Нужно ли уменьшать размер отсканированных изображений с помощью программного обеспечения? Итак, как я могу сделать это, чтобы получить качество этого PDF-файла размером 350 КБ?
Фактически, я регулярно сканирую некоторые из своих документов и конвертирую их в PDF, и я хочу, чтобы они были как можно меньше.
Что я пробовал:
- в Adobe Acrobat Pro: файл> сохранить как другой> PDF уменьшенного размера
- в Adobe Acrobat Pro: файл> печать> установлен флажок "печать в оттенках серого"
обновление: ссылки удалены из-за нарушения авторских прав!
1 ответ
То, что вы сделали, полезно в качестве упражнения. Иначе экспортировать изображения из такого PDF -файла и создавать из них новый PDF -файл не имеет смысла.
Исходное использование пространства документа:
Description Bytes Percentage
Images 351,829 97.60 %
Content Streams 2,742 0.76 %
Document Overhead 5,916 1.64 %
Total 360,478 100 %
Использование вашего документа:
Description Bytes Percentage
Images 1,329,944 98.87 %
Bookmarks 21 0.00 %
Content Streams 1,675 0.12 %
Structure info 60 0.00 %
Document Overhead 13,389 1.00 %
Total 1,345,089 100 %
Исходный документ создается не с помощью Acro, а с iText, который объясняет отсутствующую информацию о структуре.
В разделе "Обработка документов" у вас есть отдельный инструмент "Оптимизация отсканированного PDF". Я проследил за вашим рабочим процессом и запустил оптимизатор для моего недавно созданного PDF, а полученный размер файла составляет 328 КБ. Однако качество явно хуже исходного документа.
Этого и следовало ожидать, так как я сделал все с настройками по умолчанию. Это означает, что экспорт изображения уже был выполнен в формате jpg, который в любом случае больше, чем PDF. Я проверил это, просто извлекая каждую страницу в один PDF -файл - например, изображение jpg, экспортированное со страницы 1, имеет размер 22 КБ, а при экспорте в формате PDF - всего 9 КБ. Дальнейшая оптимизация изображений в новом документе ухудшает качество изображения еще больше. Это просто неизбежно при работе с растровыми изображениями, такими как jpg.
Использование размера выше показывает, что Acrobat четко экспортировал изображения с максимально возможным качеством. Это имеет смысл, поскольку, когда вы делаете это, вы хотите получить их с минимальной потерей данных изображения.
Одним из вариантов может быть распознавание файла, при котором изображения преобразуются в текст, а текстовые файлы намного легче, чем изображения, увеличивающиеся в размерах. Acro Pro содержит инструмент OCR, но я не могу проверить это, так как у меня нет арабского языка.
РЕДАКТИРОВАТЬ: расширенный языковой пакет применяется только к Adobe Reader. После некоторых исследований кажется, что Acrobat не поддерживает арабское распознавание текста. Смотрите это обсуждение на форуме Adobe.
Сканирование в PDF и последующая оптимизация - это всегда компромисс между размером и качеством. Вам просто нужно протестировать с различными настройками (как сканирование оригинала, так и оптимизация), чтобы найти удовлетворительный компромисс.
Инструкции по оптимизации PDF находятся в справке Acrobat. Справка доступна онлайн для Acrobat X и Acrobat XI