Шаблоны скребка экрана для различных сайтов
Я специально искал удобный способ локального архивирования сообщений с этого и других подобных сайтов. Я хотел бы отделить сам вопрос от ответов или, возможно, обрезать вопрос и сохранить его, сохранив заголовок страницы. Очевидно, мне не нужно хранить меню или другой интерфейс Chrome.
Лучший способ сделать это - связать шаблон XSLT с соответствием в URL-адресе и использовать этот шаблон для извлечения различной релевантной информации и ее форматирования.
Мой вопрос из двух частей:
Есть ли инструмент, специально созданный для этой задачи? IE что-то, что берет URL-адрес и проверяет его по сопоставлению выражений соответствия пути к шаблонам и выводит результат применения шаблона к этому ресурсу?
Кажется, xmlto работает в большинстве случаев и может быть вызвано просто из скрипта, который выполняет сопоставление с шаблоном, но что-то уже интегрированное будет более удобным.
Является ли такая карта URL_pattern-to-XSLT_template общедоступной где-нибудь?
Вопрос 2.5: Законно ли это делать на сайтах, подобных этому, которые имеют публичные лицензии на свой контент?
1 ответ
Ответ на вопрос 2.5:
Это законно, если вы не распространяете и не публикуете его каким-либо образом. И если вы делаете, вы должны обратиться к исходной странице. Большинство сайтов поддерживают лицензию на основе пользовательских вкладов, лицензируемых в cc-wiki, с указанием авторства.