Рекурсивное сохранение веб-страниц

Можно ли рекурсивно сохранить все страницы в Интернете, которые зависят от конкретной страницы? Или мне всегда нужно сохранять их по одному?

4 ответа

Решение

Когда мне это понадобилось, я обнаружил, что HTTrack является эффективным, простым в использовании и достаточно полным по опциям.

HTTrack является бесплатной (GPL, libre/free software) и простой в использовании автономной утилитой браузера.

Он позволяет вам загружать сайт World Wide Web из Интернета в локальный каталог, рекурсивно создавать все каталоги, получать HTML, изображения и другие файлы с сервера на ваш компьютер. HTTrack организует относительную структуру ссылок исходного сайта. Просто откройте страницу "зеркального" веб-сайта в своем браузере, и вы сможете просматривать сайт по ссылке, как если бы вы просматривали его в Интернете. HTTrack также может обновить существующий зеркальный сайт и возобновить прерванные загрузки. HTTrack полностью настраивается и имеет встроенную справочную систему.

WinHTTrack - это версия HTTrack для Windows 2000/XP/Vista/Seven, а для WebHTTrack - версия для Linux/Unix/BSD.

введите описание изображения здесь

wget -m http://www.example.com/

Больше информации можно найти с man wget:

-m --mirror Turn on options suitable for mirroring.
            This option turns on recursion and time-stamping,
            sets infinite recursion depth and keeps FTP directory listings.
            It is currently equivalent to -r -N -l inf --no-remove-listing. 

Это возможно с помощью программного обеспечения, которое может сканировать страницу. Мне нравится использовать HTML-паук Free Download Manager, который может загрузить страницу, и вы можете указать, сколько уровней глубины вы хотите, чтобы она прошла.

Да. Это возможно с помощью некоторых инструментов, предназначенных для этой цели, таких как Internet Download Manager(IDM) и Offline Explorer. с помощью этих инструментов вы можете даже загрузить весь веб-сайт для автономного изучения или просто загрузить одну страницу с зависимыми ссылками.

Другие вопросы по тегам