Как удалить водяной знак из файла PDF?

Я думал, что это будет простая задача, но все оказалось наоборот.

Водяной знак - это одно и то же (накладывающееся, но прозрачное) изображение на каждой странице. Я сам создал файл PDF (поэтому здесь нет проблем с авторскими правами), используя PDFCreator 0.9.8.

Я уже пробовал Adobe Acrobat Pro моего друга, но он не работал. Он пытается удалить его, но не может. Я пытался удалить колонтитулы и т. Д., Но водяной знак просто не исчезнет.

Как я могу удалить водяной знак?

8 ответов

Решение

Для водяных знаков на основе изображений есть несколько инструментов, которые обещают их автоматическое удаление. Например:

Все это можно попробовать бесплатно, но для получения желаемого результата требуется лицензия.

Тем не менее, водяной знак этого конкретного файла PDF (который ОП прислал мне по электронной почте) - это не одно изображение, которое повторяется на всех страницах. Как оказалось, PDFCreator жестко закодировал его (почти пиксель за пикселем) в каждый из них. Это значительно затрудняет удаление водяного знака (и приводит к довольно раздутому файлу PDF).

Поскольку водяной знак на самом деле состоит из множества крошечных изображений, вы можете удалить их с помощью редактора PDF (например, Foxit Advanced PDF Editor), просто выбрав их и нажав " Удалить". К сожалению, вы должны повторить это для каждой страницы.

Менее трудоемким решением было бы удаление водяного знака программным способом. Нам нужно:

меры

  1. Загрузите Pdftk и извлеките pdftk.exe и libiconv2.dll в % windir% \ System32, каталог по пути или в любое другое место по вашему выбору.

  2. Скачайте и установите Notepad++.

  3. Потоки PDF обычно сжимаются с использованием алгоритма DEFLATE. Это экономит место, но делает источник PDF неразборчивым.

    Команда

    pdftk original.pdf output uncompressed.pdf uncompress
    

    распаковывает все потоки, поэтому они могут быть изменены текстовым редактором.

  4. Откройте uncompressed.pdf с помощью Notepad++, чтобы раскрыть структуру водяного знака.

    В этом конкретном случае каждая страница начинается с блока

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    и почти 4000 блоков, как этот. Этот конкретный блок устанавливает только один (/W 1 /H 1) пикселей водяного знака.

    Прокрутка вниз до изменения шаблона показывает, что поток водяного знака имеет длину 95 906 байт (считая новые строки). Точно такой же поток повторяется на каждой странице файла PDF.

  5. Нажмите Ctrl + H и установите следующее:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Регулярное выражение q 9 0 0 9 2997 4118\.67 cm.{95881} соответствует первой строке вышеуказанного блока (q 9 0 0 9 2997 4118.67 cm) и все последующие 95 881 символ, то есть поток водяного знака.

    Нажатие " Заменить все" удаляет его со всех страниц файла PDF.

  6. Водяной знак теперь удален, но в файле PDF есть ошибки (длина потоков неверна), и он не сжат.

    Команда

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    заботится о обоих.

  7. uncompressed.pdf больше не нужен. Вы можете удалить его.

В результате получается тот же PDF-файл без водяного знака (и примерно вдвое меньше).

Похоже, водяной знак на самом деле является частью изображений в.PDF, а не отдельным изображением, отображаемым поверх него тем, что вы используете для отображения.PDF. Возможно, вам не удастся удалить водяной знак без извлечения изображений из.PDF, запуска их через редактор изображений и последующей реконструкции.PDF вручную.

Для текстовых водяных знаков редактирование версии PostScript может быть намного проще: после

$ pdftops document.pdf

отредактируйте document.ps, затем преобразуйте обратно в PDF через

$ ps2pdf document.ps

Нашел другой способ сделать это:

  1. Используйте инструмент pdf2htmlEX (или любой другой конвертер PDF в HTML), чтобы конвертировать PDF в файл HTML.
  2. Отредактируйте HTML с помощью текстового редактора и удалите водяной знак. Сохрани это.
  3. Печать в HTML в новый документ PDF
  4. прибыль

Преобразовать документ в файл.rtf, используя zamzar. Водяной знак исчезает автоматически после преобразования. Обратите внимание:- Он отлично работает, если документ содержит текстовые материалы. Это всегда было очень полезно.. (пользователь Mac)

Артефакты штампа заключаются в том, что вы можете удалить его в Adobe Acrobat Pro, однако он восстанавливается при перемещении мыши, поскольку объект потока сохраняет его постоянным.

Если вы попытаетесь отредактировать исходный pdf-файл - это сложно, есть вероятность, что файл будет поврежден.

Если штамп является потоком, мы можем прервать его, отключив компьютер от сети, что я и сделал.

Затем, используя Adobe Acrobat Pro, я выбрал одну из своих аннотаций, щелкнул правой кнопкой мыши, чтобы открыть всплывающее окно, и выбрал "Показать список комментариев".

Выберите гнусный водяной знак / штамп из списка, щелкните правой кнопкой мыши, чтобы открыть всплывающее окно, и выберите "Удалить". Делайте это на каждой странице, где происходит прикрепление.

Сохраните файл под другим именем. Мое приложение зависло, но не перед сохранением файла!

Откройте новый и гораздо меньший файл; обратите внимание, что все водяные знаки / марки гонзо.

В моем случае размер файла моего 3-страничного документа сократился с 300 КБ до внушительных 60 КБ. Все исходные данные и аннотации остались без изменений - без водяных знаков.

~ Удачной охоты: о)

Это дополнение к ответу @Dennis от 18:06 30 июля 2012 года. Он, безусловно, решает более сложный вопрос.

В простейшем случае, когда водяной знак представляет собой простой, неукрашенный текст, например

Смедли для комиссара

несжатые водяные знаки PDF могут быть определены следующим образом:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

где 75.96 горизонтальное смещение и 625 вертикальное смещение для этого конкретного экземпляра водяного знака. (Да, можно увидеть как действительные числа, так и целые числа.)

Регулярное выражение, подобное следующему, будет работать для всех таких водяных знаков, игнорируя любые изменения в их размещении:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Имейте в виду, что различные модифицирующие операторы PDF могут вступать в игру с водяными знаками, которые имеют более сложное форматирование. Такая причудливость может превратить то, что читатель ожидает (надеется?), В непрерывную, легко ищемую строку в беспорядок супа из алфавита. Например,

E1 = mc² от Smedley™

Может быть продуктом этого:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

,,, или намного хуже, если ваш водяной знак улучшен по цвету!

Отметив все это, я также отмечу, что PDFtk имеет версию с графическим интерфейсом, предназначенную для обработки водяных знаков, с учетом лицензионного сбора в 4 доллара. Не дорогой вообще!

С другой стороны, я считаю, что его веб-сайт в настоящее время рекламирует полную поддержку O/S через Windows 8 а также OS X 10.8 Mountain Lion, Этот винтаж более 4 лет назад. Может ли PDFtk устареть? Я подозреваю, что нет, но я не знаю.

Вот бесплатные и платные способы сделать это, я предлагаю вам использовать Google Drive.

Google Drive имеет возможность открывать файлы и выполнять незначительные изменения. Кроме того, он может быть использован для удаления водяных знаков из PDF онлайн.

  1. Откройте учетную запись Google Диска, которая в основном совпадает с учетной записью Gmail.
  2. Нажмите "Создать"> "Загрузка файла", выберите документ PDF и затем загрузите его.
  3. После этого вы можете проверить загруженный файл на вашем диске, а затем щелкнуть правой кнопкой мыши, чтобы открыть его с помощью "Документов Google".
  4. После этого ваш водяной знак будет удален автоматически. Чтобы сохранить его, перейдите в "Файл" и нажмите "Скачать как", а затем выберите "PDF документ".
Другие вопросы по тегам