Сходство и / или различие двух документов ODT (Linux)
У меня есть два документа ODT, они имеют очень близкое содержание, я хочу сравнить их, чтобы увидеть, насколько они похожи.
Лучше всего было бы иметь процент сходства, если не возможно, альтернативой было бы, по крайней мере, иметь какой-то тип diff.
Я использую Ubuntu Lucid.
Решение:
я использовал odt2txt
преобразовать файлы в текст, а затем использовать wdiff -i --statistics one.txt two.txt
иметь различие со статистикой, которая дала мне процент общих слов (сходство).
4 ответа
Я не пробовал их сам, но эта пара инструментов - odt2txt и oodiff - выглядит многообещающе.
Вы пробовали встроенную функцию сравнения? Редактировать / Сравнить документ...
Если вы просто хотите использовать текстовые различия, лучше всего конвертировать оба документа в обычный текст, а затем выполнять регулярные сравнения с ними. Вы должны будете выяснить, как нормализовать переносы строк, иначе разница будет не очень полезна.
Для этого я создаю файлы .pdf с помощью libreoffice, а затем использую diffpdf для сравнения двух файлов pdf. Это показывает различия, выделенные в параллельных окнах
Если вас не волнует форматирование текста, вы также можете скопировать содержимое в текстовые файлы и использовать старый добрый diff.
ps: вы учитель ищите возможных читеров?:п