Шаблоны скребка экрана для различных сайтов

Я специально искал удобный способ локального архивирования сообщений с этого и других подобных сайтов. Я хотел бы отделить сам вопрос от ответов или, возможно, обрезать вопрос и сохранить его, сохранив заголовок страницы. Очевидно, мне не нужно хранить меню или другой интерфейс Chrome.

Лучший способ сделать это - связать шаблон XSLT с соответствием в URL-адресе и использовать этот шаблон для извлечения различной релевантной информации и ее форматирования.

Мой вопрос из двух частей:

  • Есть ли инструмент, специально созданный для этой задачи? IE что-то, что берет URL-адрес и проверяет его по сопоставлению выражений соответствия пути к шаблонам и выводит результат применения шаблона к этому ресурсу?

    Кажется, xmlto работает в большинстве случаев и может быть вызвано просто из скрипта, который выполняет сопоставление с шаблоном, но что-то уже интегрированное будет более удобным.

  • Является ли такая карта URL_pattern-to-XSLT_template общедоступной где-нибудь?

Вопрос 2.5: Законно ли это делать на сайтах, подобных этому, которые имеют публичные лицензии на свой контент?

1 ответ

Ответ на вопрос 2.5:

Это законно, если вы не распространяете и не публикуете его каким-либо образом. И если вы делаете, вы должны обратиться к исходной странице. Большинство сайтов поддерживают лицензию на основе пользовательских вкладов, лицензируемых в cc-wiki, с указанием авторства.

Другие вопросы по тегам