Мы используем Solr для поиска статей различной длины. Мы индексируем как описательные метаданные (название, автор, категория, ключевые слова и т.д.) И полный текст статьи. Мы не повышаем релевантность по времени индекса - все ускорения выполняются во время запроса (мы используем утилизацию в сочетании с различными повышениями qf, pf и bf).
В настоящее время в нашем поле fulltext используется стандартное значение omitNorms = false; и в результате все остальные равные, более короткие статьи (статьи с 2-3 колонками) будут часто иметь более высокую актуальность, чем более длинные статьи с длинными объектами (многостраничные).
В нашем случае длина статьи является значительным показателем релевантности, поэтому я рассматриваю возможность установки omitNorms = true в нашем поле полного текста.
Вопросы: 1. Почему поведение lucene/solr по умолчанию увеличивает короткие длины полей выше? Что такое рассуждения? 2. Почему я не хочу опускатьNorms? Мне не нужно увеличивать запросы в этом конкретном поле и не использовать какие-либо огранки в этом поле.