Как сказать httrack не добавлять index.html в ссылки

При зеркалировании сайта со ссылкой типа www.example.com/some/where/ httracks меняет его на www.example.com/some/where/index.html в локальной копии.

Есть ли возможность избежать добавления index.html?

PS. Я полностью осознаю, что index.html необходим для локального просмотра сайта, но дело в том, что зеркало заменит сайт на сервере. Это сайт, управляемый базой данных, который будет заменен статической версией, поскольку он больше не будет обновляться. Но я хочу, чтобы он был идентичен снимку оригинального сайта.

Если это невозможно, мне нужно будет использовать sed для удаления частей index.html.

2 ответа

Решение

В итоге я использовал sed:

find . -name '*.html' -exec sed -i 's%index.html%%g' {} \;

Он находит все файлы, заканчивающиеся на.html в текущем подкаталоге, и запускает для них команду sed, которая заменяет все вхождения index.html ничем, т.е. удаляет это.

Просто добавьте опцию-Kи он пропустит эти index.html в URL-адресах. Тем не менее, вам необходимо убедиться, что ваш хост может разрешать URL-адреса без index.html.

Например:

      httrack https://example.com/ -K

https://www.httrack.com/html/fcguide.html

Другие вопросы по тегам