Почему весь сайт не загружен?
Я пытался сделать копию сайта wiredhealthresources.net
используя команду:
wget -rpkl inf wiredhealthresources.net
Но команда загрузила только 54 файла! Большинство страниц отсутствуют, например /topics-cardiology.html
несмотря на связь с /index.html
Что я сделал не так? Почему wget
не скачиваете весь сайт?
2 ответа
Решение
Если вы посмотрите на страницу источника, вы не увидите никаких topics-cardiology.html
ссылка, потому что боковая панель генерируется JavaScript. Вам понадобится JavaScript-браузер без головы, такой как CasperJS, чтобы создать полное зеркало.
Я уверен, что вы не можете использовать inf
возможность изменить глубину, только для изменения попыток или запроса. Вы пытались использовать -m
вместо -r
а также -l
? Похоже, вы хотите отразить страницу, и вот что -m
используется для.