Почему весь сайт не загружен?

Я пытался сделать копию сайта wiredhealthresources.net используя команду:

wget -rpkl inf wiredhealthresources.net

Но команда загрузила только 54 файла! Большинство страниц отсутствуют, например /topics-cardiology.htmlнесмотря на связь с /index.html

Что я сделал не так? Почему wget не скачиваете весь сайт?

2 ответа

Решение

Если вы посмотрите на страницу источника, вы не увидите никаких topics-cardiology.html ссылка, потому что боковая панель генерируется JavaScript. Вам понадобится JavaScript-браузер без головы, такой как CasperJS, чтобы создать полное зеркало.

Я уверен, что вы не можете использовать inf возможность изменить глубину, только для изменения попыток или запроса. Вы пытались использовать -m вместо -r а также -l? Похоже, вы хотите отразить страницу, и вот что -m используется для.

Другие вопросы по тегам