Как извлечь элементы из файла контейнера (ODP, PDF и т. Д.)?

PDF и другие типы контейнерных файлов, такие как ODP, содержат несколько файлов, склеенных вместе в презентацию / документ. Есть ли способ отделить эти файлы после сборки контейнера? Как из почтового файла?

Мне просто интересно, потому что, так как вы можете редактировать эти файлы контейнера впоследствии, элементы должны храниться где-то отдельно.

4 ответа

Решение

Я точно знаю, что можно извлечь изображения и другой контент из документа MS Word (.docx), открыв его с помощью файлового менеджера архива, такого как 7zip и навигация по каталогам.

Я не уверен насчет файлов PDF и ODP, но попробуйте открыть такой файл с помощью 7zip и посмотреть, как это происходит.

На Mac разархивирование через Finder иногда не работает. Затем вы получите файл, который заканчивается .zip.cpgzпосле первого переименования .odp подать в .zip, Я закончил тем, что использовал терминальную команду unzip. Прежде чем сделать это, поместите файл в пустую папку, потому что все файлы и папки оказываются в папке.

mv filename.odp filename.zip
unzip filename.zip -d content

Для меня это сработало, когда я переименовал расширение файла из ".odp" в ".zip", а затем использовал экстрактор файлов, такой как 7zip.

Чтобы добавить к ответу @SPRBRN, в формате ODP вы можете извлечь его непосредственно из файла в каталог:

unzip filename.odp -d unpacked

Это не так просто с PDF, для которого есть инструмент pdfimages из пакета poppler.

Другие вопросы по тегам