Как я могу скачать весь сайт?

Question

Как я могу скачать весь сайт?

Как я могу скачать все страницы с сайта?

Любая платформа в порядке.

454

download website web

Источник

joe 28 июл '09 в 13:32

24 ответа

Решение

Wget - классический инструмент командной строки для решения подобных задач. Он поставляется с большинством систем Unix/Linux, и вы можете получить его и для Windows. На Mac Homebrew - самый простой способ установить его (brew install wget).

Вы бы сделали что-то вроде:

wget -r --no-parent http://site.com/songs/

Для получения дополнительной информации см. Руководство по Wget и его примеры, например:

339

Источник

Jonik 28 июл '09 в 14:05

Используйте wget:

wget -m -p -E -k www.example.com

Варианты объяснены:

-m, --mirror            Turns on recursion and time-stamping, sets infinite 
                          recursion depth, and keeps FTP directory listings.
-p, --page-requisites   Get all images, etc. needed to display HTML page.
-E, --adjust-extension  Save HTML/CSS files with .html/.css extensions.
-k, --convert-links     Make links in downloaded HTML point to local files.

217

Источник

17 сен '09 в 01:17

http://www.internetdownloadmanager.com/ имеет утилиту Site Grabber с множеством опций, которая позволяет вам полностью загрузить любой веб-сайт, какой вы захотите, так, как вы этого хотите.

Вы можете установить ограничение на размер загружаемых страниц / файлов.
Вы можете установить количество посещаемых филиалов.
Вы можете изменить поведение скриптов / всплывающих окон / дубликатов
Вы можете указать домен, только под этим доменом будут загружены все страницы / файлы, соответствующие требуемым настройкам.
Ссылки могут быть преобразованы в автономные ссылки для просмотра
У вас есть шаблоны, которые позволяют вам выбрать вышеуказанные настройки для вас

введите описание здесь

Однако программное обеспечение не является бесплатным - посмотрите, подходит ли оно вам, используйте ознакомительную версию.

8

Источник

Lazer 16 сен '09 в 21:56

Вы должны взглянуть на ScrapBook , расширение Firefox. Имеет режим углубленного захвата .

введите описание здесь

8

Источник

webjunkie 16 сен '09 в 22:12

itucks - это название программы!

7

Источник

kmarsh 17 сен '09 в 11:42

Мне нравится Offline Explorer .
Это условно-бесплатная программа, но она очень хорошая и простая в использовании.

7

Источник

Eran 17 сен '09 в 02:08

Я расскажу об онлайн буферизации, которую используют браузеры...

Как правило, большинство браузеров используют кеш просмотра, чтобы некоторое время хранить файлы, которые вы загружаете с веб-сайта, чтобы вам не приходилось загружать статические изображения и контент снова и снова. Это может немного ускорить процесс при некоторых обстоятельствах. Вообще говоря, большинство кешей браузера ограничены фиксированным размером, и когда он достигает этого предела, он удаляет самые старые файлы в кеше.

Интернет-провайдеры, как правило, имеют кэширующие серверы, на которых хранятся копии часто используемых веб-сайтов, таких как ESPN и CNN. Это избавляет их от необходимости посещать эти сайты каждый раз, когда кто-то из их сети посещает их. Это может привести к значительной экономии в количестве дублированных запросов к внешним сайтам к провайдеру.

5

Источник

Axxmasterr 28 июл '09 в 14:03

Я не делал этого много лет, но есть еще несколько утилит там. Вы можете попробовать Web Snake. Я считаю, что использовал это много лет назад. Я сразу вспомнил имя, когда прочитал твой вопрос.

Я согласен со Стейси. Пожалуйста, не забивайте их сайт. Очень плохой.

4

Источник

Bobby Ortiz 28 июл '09 в 23:23

WebZip также является хорошим продуктом.

4

Источник

Herb Caudill 26 фев '10 в 01:26

Teleport Pro - это еще одно бесплатное решение, которое копирует все файлы из любой вашей целевой области (также есть платная версия, которая позволит вам перетягивать больше страниц контента).

4

Источник

Pretzel 21 мар '13 в 17:14

Попробуйте BackStreet Browser .

Это бесплатный, мощный автономный браузер. Высокоскоростная многопоточная программа для загрузки и просмотра веб-сайтов. Делая несколько одновременных запросов к серверу, BackStreet Browser может быстро загрузить весь веб-сайт или часть сайта, включая HTML, графику, Java-апплеты, звуковые и другие определяемые пользователем файлы, и сохраняет все файлы на жестком диске, в их исходном формате, или в виде сжатого ZIP-файла и просмотра в автономном режиме.

введите описание здесь

3

Источник

joe 14 окт '09 в 11:41

Для Linux и OS X: я написал grab-site для архивирования целых сайтов в файлы WARC. Эти файлы WARC могут быть просмотрены или извлечены. grab-site позволяет вам контролировать, какие URL-адреса пропустить, используя регулярные выражения, и их можно изменить, когда выполняется сканирование. Он также поставляется с широким набором настроек по умолчанию для игнорирования нежелательных URL.

Существует веб-панель мониторинга слежения, а также дополнительные опции для пропуска видеоконтента или ответов определенного размера.

3

Источник

Ivan Kozik 18 сен '15 в 01:41

DownThemAll - это надстройка Firefox, которая загружает весь контент (например, аудио- или видеофайлы) для определенной веб-страницы одним щелчком мыши. Это не загружает весь сайт, но это может быть то, что вопрос искал.

3

Источник

Will M 16 сен '09 в 22:17

Мощность wget

Хотя wget уже упоминался, этот ресурс и командная строка были настолько просты, что я подумал, что это стоит упомянуть:wget -P /path/to/destination/directory/ -mpck --user-agent="" -e robots=off --wait 1 -E https://www.example.com/

Смотрите этот код, объясненный на

3

Источник

Shwaydogg 03 ноя '17 в 18:13

Почтенный http://www.freedownloadmanager.org/ имеет эту функцию.

Free Download Manager имеет две формы в двух формах: Site Explorer и Site Spider:

Обозреватель сайта
Site Explorer позволяет просматривать структуру папок на веб-сайте и легко загружать необходимые файлы или папки.
HTML Spider
Вы можете загрузить целые веб-страницы или даже целые веб-сайты с помощью HTML Spider. Инструмент можно настроить для загрузки файлов только с указанными расширениями.

Я считаю, что Site Explorer полезен для просмотра папок, которые нужно включить / исключить, прежде чем пытаться загрузить весь сайт, особенно когда на сайте скрывается целый форум, который вы, например, не хотите загружать.

1

Источник

David d C e Freitas 27 сен '15 в 08:49

Как я могу загрузить весь сайт?

В моем случае я хотел скачать не весь сайт, а только поддомен, включая все его поддомены.

В качестве примера я попробовал:

      wget -E -k -m -np -p https://www.mikedane.com/web-development/html/

который работал нормально.¹

По моему опыту, это не всегда позволяет получить все поддомены или PDF-файлы, но я получил полнофункциональную копию, которая отлично работает в автономном режиме.

Вот значения флагов, которые я использовал, согласно :²

-E – приведет к добавлению суффикса .html к локальному имени файла.
-k – преобразует ссылки, чтобы сделать их пригодными для локального просмотра
-m – включает рекурсию и отметки времени, бесконечная глубина рекурсии – будут загружаться
только файлы ниже определенной иерархии
-p — скачать все файлы, необходимые для корректного отображения страниц

Ссылка

справочной странице Linuxwget(1) — справочная страница Linux

^{¹ Если вы попробуете, ожидайте, что загрузка составит около 793 КиБ.
В предыдущей версии у меня былоindex.htmlв конце URL-адреса. В этом нет необходимости. Это может даже привести к сбою загрузки.
² Что касается-npфлаг, исключением являются случаи, когда существуют зависимости вне иерархии.
Например, я сделал загрузку, для которой указанные CSS-файлы находятся в другом поддомене.
Тем не менее, поддомен, содержащий файлы CSS, также был загружен, чего мы, конечно же, и хотим.}

1

Источник

Henke 17 авг '22 в 15:02

Cyotek WebCopy также кажется хорошей альтернативой. В моей ситуации при попытке загрузить сайт DokuWiki в настоящее время на нем отсутствует поддержка CSRF/SecurityToken. Вот почему я выбрал Offline Explorer , как уже говорилось в ответе выше.

0

Источник

vchrizz 06 окт '20 в 01:29

Вы можете использовать ниже бесплатные онлайн-инструменты, которые сделают ZIP-файл со всем содержимым, включенным в этот URL

0

Источник

JerryGoyal 11 ноя '19 в 19:33

Сохранить страницу МЫ

Отличное расширение для Chrome и Firefox, которое загружает большую часть / весь контент веб-страницы и сохраняет его непосредственно в .html файл.

Расширение Google Chrome

Расширение Firefox

Я заметил, что на странице галереи изображений я его примерял, он сохранял эскизы, но не полные изображения. Или, может быть, просто не JavaScript, чтобы открыть полные картинки миниатюр.

Но он работал лучше, чем wget, PDF и т. Д. Отличное простое решение для нужд большинства людей.

0

Источник

Joshua Pinter 14 окт '19 в 17:14

Загрузка веб-сайта A1 для Windows и Mac — еще один вариант. Инструмент существует уже почти 15 лет и постоянно обновляется. Он имеет отдельные параметры фильтрации сканирования и загрузки, каждый из которых соответствует шаблону «ограничить» и «исключить».

0

Источник

Tom 25 ноя '20 в 08:59

Загрузите HTTracker, он загрузит веб-сайты очень простыми шагами.

ссылка для скачивания: http://www.httrack.com/page/2/

видео, которое может помочь вам: https://www.youtube.com/watch?v=7IHIGf6lcL4

-1

Источник

ALI SHEKH 21 сен '15 в 16:02

Firefox может делать это изначально (по крайней мере, FF 42). Просто используйте "Сохранить страницу"

-3

Источник

user1032531 02 дек '15 в 13:59

Я считаю, что Google Chrome может сделать это на настольных устройствах, просто зайдите в меню браузера и нажмите Сохранить веб-страницу.

Также обратите внимание, что такие сервисы, как pocket, на самом деле не могут спасти веб-сайт и поэтому подвержены гниению ссылок.

И наконец, обратите внимание, что копирование содержимого сайта может нарушать авторские права, если это применимо.

-3

Источник

jiggunjer 16 май '15 в 18:05

Другие вопросы по тегам download website web

Axxmasterr 28 июл '09 в 13:55 2009-07-28 13:55 · Accepted Answer · 2009-07-28 13:55

HTTRACK работает как чемпион по копированию содержимого всего сайта. Этот инструмент может даже захватить части, необходимые, чтобы веб-сайт с активным содержимым кода работал в автономном режиме. Я поражен тем, что он может воспроизводить в автономном режиме.

Эта программа сделает все, что от вас требуется.

Хорошей охоты!