Я знаю, что lucene создает индекс и сохраняет все данные. Может ли кто-нибудь сказать мне, как данные хранятся в плоском файле? или какие алгоритмы они используют для хранения данных в бэкэнд, чтобы они могли быстро его получить?
Как данные хранятся в люцене
Ответ 1
Не знаю, это то, о чем вы просили. Но более общий ответ заключается в том, что они используют/реализуют Инвертированный указатель. Специфика того, как Lucene хранит его, вы можете найти в форматах файлов (как сказал милан).
Но общая идея заключается в том, что они хранят структуру данных Inverted Index и другие вспомогательные структуры данных, чтобы быстро отвечать на запросы. Например, он хранит вектор норм для каждого документа и каждый термин IDF (
Ответ 2
Вы можете прочитать эту книгу http://nlp.stanford.edu/IR-book/, чтобы узнать о структурах данных, алгоритмах и моделях, используемых в информационно-поисковых системах
Ответ 3
Вы можете найти все, что описано в разделе .