Как использовать Pandoc с двухбайтовыми символами?
Я пытаюсь преобразовать документ Markdown в PDF. Следующие работы с использованием pandoc test.md -o test.pdf
:
# Test
Testing
Но это
# Test
日本語
дает мне ошибку:
! Package inputenc Error: Unicode char 日 (U+65E5)
(inputenc) not set up for use with LaTeX.
See the inputenc package documentation for explanation.
Type H <return> for immediate help.
...
l.62 日
Try running pandoc with --latex-engine=xelatex.
pandoc: Error producing PDF
С помощью --latex-engine=xelatex
похоже не помогает. Я использую pandoc 1.19.2.1 на Mac OS X.
Использование пакета markdown-pdf ( https://atom.io/packages/markdown-pdf) в Atom также работает, но мне нужно использовать Pandoc по другим причинам.
1 ответ
Проблема не столько в двухбайтовых символах, сколько в том, что вам нужно сказать Pandoc, что он должен сказать LaTeX использовать шрифт CJK.
Для меня текущая версия Pandoc 2.5 на macOS работает:
- Вам нужно использовать
--pdf-engine=lualatex
или жеxelatex
сейчас (не более--latex-engine
). - Вам необходимо установить
'xecjk'
пакет в вашей установке LaTeX. - Вам нужно добавить
-V CJKmainfont=...
в вашей командной строке. - В вашей системе должен быть установлен соответствующий шрифт, например, "STSong".
Итак, здесь идет:
пандок \ --pdf-engine=lualatex \ -V CJKmainfont="STSong" \ -o out.pdf \ test.md