Как создать индекс Elasticsearch для файлов HTML?

Я пытаюсь использовать Elasticsearch (Elastic Stack) для хранения 3 миллионов HTML-файлов, извлеченных из Интернета. Большинство учебных пособий для Elasticsearch сосредоточены на документах JSON. Можно ли хранить HTML-файлы в индексе Elasticsearch? Если да, нужно ли указывать каждый важный тег?

0 ответов

Другие вопросы по тегам