Как я могу конвертировать.odt в.html (или.md) из командной строки?
Я ищу бесплатное программное обеспечение, которое может конвертировать OpenDocument в HTML или уценку.
Pandoc может конвертировать HTML в OpenDocument, но не наоборот.
odt2html.py не удалось установить, используя оба pip
а также easy_install
,
Сообщается, что LibreOffice может выполнить преобразование; Тем не менее, я не мог заставить его работать со следующей командой:
soffice --convert-to --outdir . htm:HTML my.odt
2 ответа
Решение
Вы используете --convert-to
, но вы не указываете значение для него.
Правильный синтаксис:
soffice --headless --convert-to htm:HTML --outdir . my.odt
Или попробуйте использовать следующий скрипт:
#! /bin/bash
CONFIG=/path/to/tidy_options.conf
# rm -rv "$2"
mkdir -p "$2"
for F in `find $1 -type f -name "*.doc" -or -name "*.odt"`; do
BASE=`basename $F .doc` ; BASE=`basename $BASE .odt`
soffice --headless --convert-to htm:HTML --outdir $2 $F
tidy -q -config $CONFIG -f $2/$BASE.err -i $2/$BASE.htm | sed 's/ class="c[0-9]*"//g' > $2/$BASE.html
done
Использование:
$ convert_doc_to_html.sh SOURCE_DIR TARGET_DIR
Увидеть:
- Как конвертировать.doc и ODF файлы в чистый и чистый HTML на TechRepublic
Новые версии pandoc, универсального конвертера документов с открытым исходным кодом, теперь работают:
pandoc -t html -s input.odt -s -o output.html