Как я могу определить, какая программа генерирует HTML-код веб-сайта?
Я провожу исследование, которое включает сравнение веб-сайтов. Некоторые проекты ужасны, и из болезненного любопытства я хочу выяснить, какая программа (Word, Dreamweaver и т. Д.) Их сгенерировала. Есть ли инструмент для обнаружения этого? Поиск в Google ничего не нашел.
Word HTML легко обнаружить, потому что его разметка очень плохая, но другие приложения сложнее обнаружить.
2 ответа
Несколько программ для создания веб-страниц вставляют <meta name="generator" content="...">
тег. Конечно, такой тег также может быть написан от руки, например, автором, и дискуссии об этом типе тега, похоже, вращаются вокруг вопроса о том, как предотвратить его испускание программой (часто с эффективными ответами).
Существуют различные способы эвристического определения того, какое программное обеспечение было использовано. Например, Word HTML можно очистить, используя "Фильтрованный вывод" в Word и постобработку, но обычно такие симптомы, как class=MsoNormal
остаются.
Подсказки могут также существовать в URL страницы. Например, расширения файлов.jsp .pl .asp .cfm обозначают Java Server Pages, Perl, .Net и ColdFusion, чтобы назвать несколько. Они также часто удаляются, чтобы упростить URL и скрыть технологию.