Конвертируйте PDF со встроенными шрифтами в EMF для PowerPoint

Существует ли бесплатный (то есть бесплатный) способ преобразования файла PDF в Windows EMF (расширенный метафайл) таким образом, чтобы текст, использующий встроенные в PDF шрифты, отображался в MS Office PowerPoint таким же образом? Я думаю, что нужно было бы заменить текст заполненным путем, но это было бы хорошо, так как я только хочу показать результат, а не редактировать его.

Я попытался pstoedit, но встраивание шрифтов кажется хитрым. Глядя на руководство по обработке шрифтов, кажется, что -dt следует превратить текст в заполненные пути, но в этом случае пути, по-видимому, на самом деле просто полигоны, соединяющие конечные точки сегмента, но не делающие никаких кривых Безье между ними. Таким образом, результат выглядит странно, например, с бриллиантами в качестве точек всех "я".

Я читал в нескольких местах (например, здесь), что Inkscape может быть использован для преобразования PDF в EMF. Но в Windows импорт PDF зависает, не показывая диалоговое окно. В Linux я получаю диалоговое окно импорта, но единственный вариант для обработки текста - оставить текст в виде текста; Я не могу преобразовать в пути, поэтому без встроенных шрифтов я вынужден вместо этого использовать системные шрифты.

Я также попробовал ImageMagick convert, но это, кажется, растеризует изображение, поэтому результат выглядит размытым.

Для одного приложения, а именно для встраивания формул LaTeX в PowerPoint, этот пост предлагает альтернативы (по крайней мере, некоторые из которых работают через DVI вместо PDF и MHTML вместо EMF. Но есть еще много инструментов, которые могут создавать PDF, но не EMF, поэтому Общая проблема остается.

У меня есть доступ к Windows, Linux и OS X, поэтому предлагаемый ответ может использовать любую комбинацию ОС, если это поможет. Если у вас нет полного решения, то частичное решение все еще может помочь. Например, какой-нибудь PDF-to-PDF конвертер, который заменяет текст заполненными путями. Или какой-нибудь инструмент для извлечения шрифтов из PDF и сохранения их в отдельных файлах, где другие инструменты (такие как pstoedit или inkscape) могут их подбирать и использовать для визуализации текстов. Или что-то еще, что вы считаете значительным шагом к решению.

2 ответа

Решение

Я столкнулся с той же проблемой, что и вы: у меня было несколько .pdf файлы (по две страницы), которые я хотел преобразовать во что-то, что я мог импортировать в файл Word; что-то случилось .emf в конце (все другие форматы не были приняты).

Этот ответ предполагает, что вам удобно пользоваться консолью.

Инструмент выбора для преобразования векторного формата X в векторный формат Y, кажется, inkscape, Однако при импорте .pdf файл прямо в inkscape

  • вы можете получить доступ только к первой странице консоли (насколько мне известно)
  • даже если вы выберете опцию text-to-paths -T Текст не очень хорошо преобразован.

Поэтому я счел необходимым предварительно преобразовать .pdf подать inkscape умеет пользоваться. Я нашел этот ответ очень полезным, особенно упоминание о pdf2svg, Моя последняя последовательность была следующей:

pdf2svg input_filename.pdf interim_filename_%d.svg all
inkscape -T interim_filename_1.svg --export-emf=interim_filename_1.emf
(repeat for all additional pages of the .pdf)

В меру того, что я вижу на экране, перенося эти .emf файлы на компьютер с Windows и их открытие с помощью средства просмотра изображений Windows, результат идентичен вводу. Плюс, попробовав контрольный пример с заказным документом LaTeX, используя шрифт, которого нет на моем компьютере с Windows, я также нашел результат идентичным. Пропуск начального pdf2svg шаг означал, что интервал был полностью испорчен после inkscape Преобразование

В моем случае мне не нужно было удалять .pdf границы страницы (я имел дело с полностраничными файлами). Вам может потребоваться такой промежуточный шаг, если вы заинтересованы только в небольшой части .pdf стр. Вытащив из этого ответа, pdfcrop кажется, в состоянии сделать это.

Несмотря на название, упоминающее EMF, похоже, что фактическая цель OP - включить файлы PDF в PowerPoint, сохранив при этом все в виде векторной графики, а EMF - только средство для этого, а не цель. IguanaTex теперь поддерживает импорт форматов векторной графики (PDF/PS/EPS/EMF) в PowerPoint.

Использование IguanaTex также избавляет пользователя от необходимости подготовки файла EMF для дальнейшего редактирования. Файлы EMF, обычно вставляемые в PowerPoint, отображаются в виде изображений. Их можно разгруппировать в объекты PowerPoint, но это создаст лишние фигуры, которые необходимо удалить. IguanaTex позаботится об этом.

Внутренне IguanaTex действительно преобразует PDF в EMF, чтобы затем включить его в PowerPoint. Это делается с помощью pdfiumdraw, который является частью TeX2img. Фактическая команда (см . Исходный код IguanaTex на Github:

pdfiumdraw.exe --extent=50 --emf --transparent --pages=1 input.pdf

Полное раскрытие: я разработчик IguanaTex.

Если вам нужно написать формуляры на PPT, вы можете использовать IguanaTex Add-In для PPT.

Это зависит от распределения латекса, и если вы хотите также генерировать графики Tikz, вам понадобится ImageMagick. Который используется для преобразования полученного PDF PDFLatex в PNG, который выглядит довольно хорошо в PPT.

Если вам нужны картинки более высокого качества, вы можете использовать автономный класс и конвертировать (также требуется ImageMagick). Здесь вы можете генерировать PNG или JPG с заданным DPI. Или PDF как векторный формат.

Или вы можете использовать Standalone и вызвать pstoedit для генерации файлов WMF.

\documentclass[
   convert={command=\unexpanded{
     pstoedit\space-v \space -f\space emf \space convert.pdf \space convert.emf
   }}]{standalone}

Кажется, вам нужно отредактировать вывод и ввести имя файла от руки.

Другие вопросы по тегам