Как сравнить содержимое двух файлов PDF?
Возможный дубликат:
Как сравнить различия между двумя файлами PDF?
В настоящее время я подытоживаю PDF курса, который мне нужно будет повторить в следующем году,
Возможно, что содержание PDF изменится, что приведет к ошибкам в моем резюме.
Есть ли способ просмотреть изменения между двумя версиями PDF-файла?
3 ответа
Я использовал pdftotext из набора инструментов xpdf прежде, чтобы экспортировать содержимое в виде простого текста и сравнить его с моим любимым инструментом сравнения. Прямо сейчас я нашел pdfdiff, скрипт на python, который делает именно то, что я делал раньше вручную. Быстрый тест показал, что он делает то, что должен.
Так что спасибо за ваш вопрос, который заставил меня искать новый, полезный инструмент.
Редактировать:
Я бы предложил использовать его вместе с meld, отличным инструментом сравнения, который поддерживается pdfdiff.
Мой первый ответ - проверить размер файла или, если вы хотите что-то более точное, просто выполнить проверку контрольной суммы MD5 (в Mac это командная строка /sbin/md5 vi). Например, если у вас есть файлы a.pdf и a.newer.pdf, вы можете сделать это:
md5 -q a.pdf && md5 -q a.newer.pdf
который должен вернуть что-то вроде
e097902c53d9066aaf679037b6432bdb
920621db3765f6d580a498035b587f67
Даже небольшое изменение вызовет огромную разницу в хэше.