Как создать индекс Elasticsearch для файлов HTML?
Я пытаюсь использовать Elasticsearch (Elastic Stack) для хранения 3 миллионов HTML-файлов, извлеченных из Интернета. Большинство учебных пособий для Elasticsearch сосредоточены на документах JSON. Можно ли хранить HTML-файлы в индексе Elasticsearch? Если да, нужно ли указывать каждый важный тег?