Конвертируйте PDF со встроенными шрифтами в EMF для PowerPoint
Существует ли бесплатный (то есть бесплатный) способ преобразования файла PDF в Windows EMF (расширенный метафайл) таким образом, чтобы текст, использующий встроенные в PDF шрифты, отображался в MS Office PowerPoint таким же образом? Я думаю, что нужно было бы заменить текст заполненным путем, но это было бы хорошо, так как я только хочу показать результат, а не редактировать его.
Я попытался pstoedit, но встраивание шрифтов кажется хитрым. Глядя на руководство по обработке шрифтов, кажется, что -dt
следует превратить текст в заполненные пути, но в этом случае пути, по-видимому, на самом деле просто полигоны, соединяющие конечные точки сегмента, но не делающие никаких кривых Безье между ними. Таким образом, результат выглядит странно, например, с бриллиантами в качестве точек всех "я".
Я читал в нескольких местах (например, здесь), что Inkscape может быть использован для преобразования PDF в EMF. Но в Windows импорт PDF зависает, не показывая диалоговое окно. В Linux я получаю диалоговое окно импорта, но единственный вариант для обработки текста - оставить текст в виде текста; Я не могу преобразовать в пути, поэтому без встроенных шрифтов я вынужден вместо этого использовать системные шрифты.
Я также попробовал ImageMagick convert
, но это, кажется, растеризует изображение, поэтому результат выглядит размытым.
Для одного приложения, а именно для встраивания формул LaTeX в PowerPoint, этот пост предлагает альтернативы (по крайней мере, некоторые из которых работают через DVI вместо PDF и MHTML вместо EMF. Но есть еще много инструментов, которые могут создавать PDF, но не EMF, поэтому Общая проблема остается.
У меня есть доступ к Windows, Linux и OS X, поэтому предлагаемый ответ может использовать любую комбинацию ОС, если это поможет. Если у вас нет полного решения, то частичное решение все еще может помочь. Например, какой-нибудь PDF-to-PDF конвертер, который заменяет текст заполненными путями. Или какой-нибудь инструмент для извлечения шрифтов из PDF и сохранения их в отдельных файлах, где другие инструменты (такие как pstoedit или inkscape) могут их подбирать и использовать для визуализации текстов. Или что-то еще, что вы считаете значительным шагом к решению.
2 ответа
Я столкнулся с той же проблемой, что и вы: у меня было несколько .pdf
файлы (по две страницы), которые я хотел преобразовать во что-то, что я мог импортировать в файл Word; что-то случилось .emf
в конце (все другие форматы не были приняты).
Этот ответ предполагает, что вам удобно пользоваться консолью.
Инструмент выбора для преобразования векторного формата X в векторный формат Y, кажется, inkscape
, Однако при импорте .pdf
файл прямо в inkscape
- вы можете получить доступ только к первой странице консоли (насколько мне известно)
- даже если вы выберете опцию text-to-paths
-T
Текст не очень хорошо преобразован.
Поэтому я счел необходимым предварительно преобразовать .pdf
подать inkscape
умеет пользоваться. Я нашел этот ответ очень полезным, особенно упоминание о pdf2svg
, Моя последняя последовательность была следующей:
pdf2svg input_filename.pdf interim_filename_%d.svg all
inkscape -T interim_filename_1.svg --export-emf=interim_filename_1.emf
(repeat for all additional pages of the .pdf)
В меру того, что я вижу на экране, перенося эти .emf
файлы на компьютер с Windows и их открытие с помощью средства просмотра изображений Windows, результат идентичен вводу. Плюс, попробовав контрольный пример с заказным документом LaTeX, используя шрифт, которого нет на моем компьютере с Windows, я также нашел результат идентичным. Пропуск начального pdf2svg
шаг означал, что интервал был полностью испорчен после inkscape
Преобразование
В моем случае мне не нужно было удалять .pdf
границы страницы (я имел дело с полностраничными файлами). Вам может потребоваться такой промежуточный шаг, если вы заинтересованы только в небольшой части .pdf
стр. Вытащив из этого ответа, pdfcrop
кажется, в состоянии сделать это.
Несмотря на название, упоминающее EMF, похоже, что фактическая цель OP - включить файлы PDF в PowerPoint, сохранив при этом все в виде векторной графики, а EMF - только средство для этого, а не цель. IguanaTex теперь поддерживает импорт форматов векторной графики (PDF/PS/EPS/EMF) в PowerPoint.
Использование IguanaTex также избавляет пользователя от необходимости подготовки файла EMF для дальнейшего редактирования. Файлы EMF, обычно вставляемые в PowerPoint, отображаются в виде изображений. Их можно разгруппировать в объекты PowerPoint, но это создаст лишние фигуры, которые необходимо удалить. IguanaTex позаботится об этом.
Внутренне IguanaTex действительно преобразует PDF в EMF, чтобы затем включить его в PowerPoint. Это делается с помощью pdfiumdraw, который является частью TeX2img. Фактическая команда (см . Исходный код IguanaTex на Github:
pdfiumdraw.exe --extent=50 --emf --transparent --pages=1 input.pdf
Полное раскрытие: я разработчик IguanaTex.
Если вам нужно написать формуляры на PPT, вы можете использовать IguanaTex Add-In для PPT.
Это зависит от распределения латекса, и если вы хотите также генерировать графики Tikz, вам понадобится ImageMagick. Который используется для преобразования полученного PDF PDFLatex в PNG, который выглядит довольно хорошо в PPT.
Если вам нужны картинки более высокого качества, вы можете использовать автономный класс и конвертировать (также требуется ImageMagick). Здесь вы можете генерировать PNG или JPG с заданным DPI. Или PDF как векторный формат.
Или вы можете использовать Standalone и вызвать pstoedit для генерации файлов WMF.
\documentclass[
convert={command=\unexpanded{
pstoedit\space-v \space -f\space emf \space convert.pdf \space convert.emf
}}]{standalone}
Кажется, вам нужно отредактировать вывод и ввести имя файла от руки.