Как сказать httrack не добавлять index.html в ссылки
При зеркалировании сайта со ссылкой типа www.example.com/some/where/
httracks меняет его на www.example.com/some/where/index.html
в локальной копии.
Есть ли возможность избежать добавления index.html?
PS. Я полностью осознаю, что index.html необходим для локального просмотра сайта, но дело в том, что зеркало заменит сайт на сервере. Это сайт, управляемый базой данных, который будет заменен статической версией, поскольку он больше не будет обновляться. Но я хочу, чтобы он был идентичен снимку оригинального сайта.
Если это невозможно, мне нужно будет использовать sed для удаления частей index.html.
2 ответа
В итоге я использовал sed:
find . -name '*.html' -exec sed -i 's%index.html%%g' {} \;
Он находит все файлы, заканчивающиеся на.html в текущем подкаталоге, и запускает для них команду sed, которая заменяет все вхождения index.html ничем, т.е. удаляет это.
Просто добавьте опцию-K
и он пропустит эти index.html в URL-адресах. Тем не менее, вам необходимо убедиться, что ваш хост может разрешать URL-адреса без index.html.
Например:
httrack https://example.com/ -K