Как извлечь поворот изображения из PDF
Я извлекаю все изображения из отсканированных PDF-файлов, используя pdfimages
, чтобы обработать и упаковать их.
Проблема в том, что некоторые изображения поворачиваются на 90° (по часовой стрелке или против часовой стрелки), а другие нет. Исходный PDF повторно поворачивает их на странице, так что все страницы отображаются прямыми, но извлеченные изображения остаются повернутыми.
Я не мог найти вариант в pdfimages
выводить повороты, чтобы я мог использовать их в скрипте.
Есть ли способ извлечь эту информацию?
1 ответ
Я не уверен, что ваши PDF-файлы являются многостраничными, поэтому, если они затем используют pdfTK или pdfSAM, чтобы разбить их на одностраничные PDF-файлы, то используйте Gimp для поворота изображений вручную.
Другая вещь, которую вы могли бы использовать, это использовать инструмент, подобный ImageMagick, для автоматизации поворота, но вам, вероятно, придется разделить обычные изображения CW, CCW на разные папки.