У меня есть четыре узла solrcloud setup версии 4.10, и моя коллекция имеет 4 осколка, 2 реплики. Мое приложение обеспечивает возможность поиска при проглатывании данных в реальном времени, параллельно выполняются процессы проглатывания и поиска данных.
Каждый день загрузка данных составляет около 2 ~ 3MM записей (операции ввода/обновления), а общее количество документов составляет 80MM +.
Проблема, с которой мы сталкиваемся, заключается в том, что solr возвращает очень несогласованные записи во время пикового времени приема данных.
Пример запроса:
for i in `seq 1 50`;
do
curl 'http://localhost:8888/solr/OPTUM/select?q=*:*&wt=json&indent=true'|grep numFound|rev|cut -d'{' -f1 |rev
done
В ответе numfound
отображается когда-то очень меньшее количество документов, которые фактически присутствуют в solr.
Пожалуйста, предложите, чтобы мне нужно было изменить конфигурацию, чтобы получить согласованное количество.