Преобразование сгенерированного LaTeX PDF в Word с использованием Acrobat XI
Я снова почувствовал, что мне нужно жить как в земле LaTeX, так и в Microsoft Word. У меня есть Acrobat XI, поэтому я решил использовать его в качестве посредника при переходе с LaTeX на Word. Кажется, у меня была эта работа в прошлом, но сейчас она просто производит много бессмысленного текста.
Текущий рабочий процесс:
- Напишите LaTeX в TeXworks (от MikTeX)
- Введите текст с помощью параметра "pdfLaTeX + MakeIndex + BibTex"
- Откройте выходной PDF в Acrobat Pro XI
- Перейти Файл-> Сохранить как Другое->Microsoft Word-> Документ Word
- В настройках снимите флажки "Включить комментарии" и "Запустить OCR при необходимости"
- Сохранить
Кажется, все идет хорошо, затем я открываю выходной документ Word, и весь текст - это просто случайные символы. Интересно, что форматирование выглядит абсолютно идеально - списки - это списки, ссылки по-прежнему работают, макет страницы выглядит хорошо - просто нечитаемый текст. Я проверил, и Acrobat умеет искать в PDF просто отлично, а обычное копирование текста в слово (через буфер обмена) прекрасно. Но если я выберу "Копировать с форматированием" и вставлю в слово, я вернусь к символам.
Я подозреваю, что это просто проблема со шрифтами. Я также предполагаю, что это довольно общая проблема, которая не обязательно является специфической для Acrobat. Я действительно надеюсь разобраться с этим - выходной документ Word не должен быть идеальным, он просто должен иметь тот же текст и примерно такое же форматирование. Любые мысли о возможных изменениях параметров в MikTeX, которые могут привести к появлению PDF Acrobat, будут легче?
Спасибо!
4 ответа
Я решил эту проблему, используя в латексном документе
\usepackage[T1]{fontenc}
\usepackage{lmodern}
Первое утверждение позволяет T1
кодирование шрифта, а второй позволяет использовать современные латексные шрифты.
Я даже использовал (только) первое утверждение все время (что само по себе не решило эту проблему), но добавление второго оператора все же исправило его, и документ Word, сохраненный из Acrobat Pro (в моем случае X), отображался правильно.
См. Ответы на этот https://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1 вопрос для получения дополнительной информации.
Используйте эти пакеты в файле LateX, который может помочь создать лучший текстовый файл PDF с возможностью копирования.
- \ Usepackage [T1] {fontenc}
- \ Usepackage{lmodern}
Создать PDF-файл
Откройте файл PDF с помощью Microsoft Word 2013 или более поздней версии.
Он преобразует все ваши тексты, рисунки, таблицы. Но у меня были некоторые проблемы с сноской, названием книги, разделами имени автора в верхней / нижней части страницы.
В настоящее время лучше использовать Mathpix для преобразования PDF-файла, созданного LaTeX, в Word с максимальной точностью. Если кто-то знает лучший вариант, я был бы рад его протестировать.
3 способа конвертировать PDF в word на Mac Шаг 1: Откройте PDF в Adobe Acrobat.
Шаг 2. Нажмите "Файл" на верхней панели навигации Adobe Acrobat.
Шаг 3: Нажмите "Сохранить как".
Шаг 4: выберите опцию "PDF to Word".
Шаг 5: Введите имя для документа. Выберите тип файла Word (.doc или.docx) и нажмите кнопку "Сохранить". Документ теперь сохраняется как документ Microsoft Word.