Сохранение элементов блога в формате PDF

Я знаю о FireShot, расширении Firefox, для сохранения целых страниц изображений. И я люблю это. Отличная идея и очень хорошая реализация.

Но, к сожалению, часто на таких сайтах у вас есть ссылки, которые теряются таким образом. Поэтому мне интересно, есть ли способ сохранить таким же образом целые посты в блоге, вики-посты, посты StackOverflow:), как PDF-файлы, чтобы ссылки также сохранялись?

14 ответов

Если цель состоит в том, чтобы сохранить весь контент и ссылки при минимальном влиянии на форматирование ... Я рекомендую Evernote .

Я знаю, что это не решение PDF ... но после 2 лет архивирования веб-страниц в PDF-файлах и изображениях и разочаровавшись в нем, я решил преобразовать свой личный инструмент для захвата веб-страниц в Evernote.

Дайте ему шанс, вам это может понравиться.

Существует расширение Firefox, называемое PDF Download, которое сохранит страницу в PDF (или отправит ее вам по почте).

  • Он сохранил ссылки на эту страницу, когда я попробовал.
  • Но вы должны помнить, что страница будет сохранена как общедоступная,
    Какой инструмент делает он-лайн (не так, как вы вошли в систему).
  • Есть платная версия инструмента PDF Nitro (там же)
    это спасет его прямо от вашего стола, и вы должны получить те недостающие части тоже.
    Не пробовал, хотя.
  • Еще один глюк,
    бесплатное дополнение Firefox (по крайней мере) не обрабатывает границы страниц PDF должным образом,
    Вы можете потерять строку текста там ...
  • У инструмента Nitro есть 14-дневная бесплатная пробная версия, если вы хотите попробовать это

HTML-to-PDF - это бесплатный инструмент Windows для пакетного преобразования веб-страниц в PDF-документ. Он поддерживает интерактивные ссылки, страницы, содержащие JavaScript, живые формы и встраивание шрифтов.

Смотрите: http://sourceforge.net/projects/html-to-pdf/

Я думал о печати PDF самостоятельно, но это не совсем работает, ссылки потеряны.

в этом случае я копирую / вставляю весь сайт в текстовый процессор и сохраняю документ, который хорошо работает для ссылок, но не для оригинального макета страницы.

Насколько мне известно, все основные браузеры позволят вам сохранить "завершенную" страницу, если вы используете встроенную команду сохранения. Это сохраняет файл HTML, а также одну папку, которая содержит все изображения и т. Д.

Очевидно, что это не решение PDF, но оно сохраняет как ссылки, так и макет.

Вы пробовали дополнение LOOP? Предполагается конвертировать URL (и документы) в PDF.

Я знаю, что вы, вероятно, ищете смарт-все в одном решении, и в этом случае кто-то другой может иметь лучший ответ.

Лично я считаю, что использование Bullzip PDF Printer работает очень хорошо. Он в основном обладает способностью выступать в качестве принтера, и все, что может пойти на бумагу, вместо этого.

Многие страницы имеют альтернативный CSS для печати и выглядят довольно неплохо. Для остальных я делаю скриншот, использую краску и печать (не элегантно, но работает!)

Ответить на ваш вопрос касательно. В то время как PDF может обрабатывать ссылки, сохранение страницы в формате HTML ближе к оригиналу и меньше деградации. В большинстве браузеров есть базовый тег, который удобен для цитирования источников (и обязательно, если они использовали неполные URL).

<base href="..." />

Поскольку я уже отклонился от PDF... Если вы используете браузер Opera, вы можете просмотреть исходный код, убрать префикс мусора и суффикс нужного контента. И применить изменения локально для предварительного просмотра перед сохранением. Без мусора я получаю меньше ложных срабатываний при поиске. (В Firefox должно быть что-то похожее.)

Они говорят, что то, что происходит в Интернете, существует всегда... Попробуйте посетить сайт десятилетия назад...

Возможно, вы захотите взглянуть на wkhtmltopdf. Это конвертер HTML в PDF, основанный на движке webkit HTML, который лежит в основе Safari и большинства других приложений OS X, отображающих HTML, а также браузер Google Chrome среди других приложений. Он построен для использования в командной строке и должен быть достаточно легким для настройки и перекомпиляции, учитывая возможность создания приложений на основе инфраструктуры Qt.

Я не помню, что именно он делает со ссылками на странице, но он неплохо справляется с преобразованием текста, включая форматирование CSS, в довольно красивый PDF.

И это бесплатно...

Изменить: Кроме того, полная копия Acrobat имеет эту способность, по крайней мере, с Acrobat 3 или 4 (т.е. долгое время). Тем не менее, вы должны купить полный Acrobat, потому что Reader не имеет этой функции. Поддерживаются два режима конвертации: автоматический и специальный. Автоматический режим просматривает предоставленный URL-адрес и извлекает из него все, что он может получить. Поскольку это может легко включать в себя поиск всей сети, он имеет контроль над количеством прыжков, которые можно удалить с исходной страницы. В режиме ad-hoc вы можете переходить от страницы к странице, и при нажатии на ссылку она получает страницу, добавляет ее в растущий документ PDF и перезаписывает ссылки, чтобы ссылаться на файл PDF, а не на Интернет.

Создание Acrobat в формате PDF, как правило, является лучшим показом, за исключением этого случая. Это действительно не обрабатывает достаточно спецификации CSS, чтобы заставить вещи работать правильно. Я часто добивался лучших результатов, устанавливая макет страницы в альбомной ориентации, но даже тогда он был неуклюжим.

Редактировать 2: я удалил Opera из списка пользователей webkit и добавил ссылку на страницу проекта webkit. Спасибо Дэну Уокеру за исправление.

Website2pdf выглядит так, как будто это делает это (по крайней мере, для меня), но не бесплатно, но тогда это не было указано в вопросе:)

Онлайн конвертер в PDF может сделать свое дело http://www.web2pdfconvert.com/

Если цель сохранения в формате PDF состоит в том, чтобы иметь автономный доступ и сохранить тот же формат, который вы видите в Интернете, то я предлагаю вам попробовать расширение Scrapbook Firefox. Он имеет следующие особенности:

  • Сохранить веб-страницу
  • Сохранить фрагмент веб-страницы
  • Сохранить веб-сайт (углубленный захват)
  • Организовать коллекцию так же, как закладки
  • Выделения, ластик и различные функции редактирования страниц
  • Полнотекстовый поиск и поиск с быстрой фильтрацией
  • Функция редактирования текста, напоминающая заметки Opera

Попробуйте. Это на много миль выше всего остального.

Попробуйте Green Print, у которого есть возможность удалять рекламу и делать печать PDF более четкой.

Посмотрите на зинепал. это больше подходит для подписок RSS, но может принимать любой контент из Интернета.

Другие вопросы по тегам