Подтвердить что ты не робот

Коллекция Solr против ядра

Я борюсь с пониманием разницы между коллекциями и ядрами. Если я правильно ее понимаю, ядра имеют несколько индексов. Коллекция состоит из ядер, поэтому по существу они разделяют одну и ту же логику в разделении, то есть отдельные ядра и коллекции имеют отдельные конечные точки.

У меня есть следующий сценарий. Я создаю бэкэнд для облачного сервиса для нескольких интернет-магазинов. В каждом магазине есть набор продуктов, к которым клиенты могут добавлять отзывы. Я хочу индексировать статические данные (информацию о продукте) отдельно от динамической информации (обзоров), чтобы я мог улучшить производительность.

Как лучше всего отделить в Solr???

4b9b3361

Ответ 1

Из Документация SolrCloud

Коллекция: один индекс поиска.

Осколок: логический раздел одной коллекции (также называемой Кусочек). Иногда люди говорят о "Шарде" в физическом смысле (проявление логического осколка)

Реплика: физическое проявление логического Осколка, реализованное как один индекс Люцен на SolrCore

Лидер: одна копия каждого Осколка будет обозначена как Лидер координатная индексация для этого Осколка

SolrCore: инкапсулирует один физический индекс. Один или несколько макияжа логические осколки (или срезы), которые составляют коллекцию.

Node: один экземпляр Solr. Один экземпляр Solr может иметь несколько SolrCores, которые могут быть частью любого количества коллекций.

Кластер: все узлы, которые вы используете для размещения SolrCores.

Таким образом, в основном коллекция (логическая группа) имеет несколько ядер (физические индексы).

Кроме того, проверьте обсуждение

Ответ 2

Core

В Solr a core состоит из набора файлов конфигурации, файлов индекса Lucene и Solrs журнал транзакций.

Ядро Solr является уникальный, управляемый и настроенный индекс, запущенный на сервере Solr; сервер Solr может содержать один или несколько ядер. Ядро обычно используется для разделения документов, которые различные схемы

коллекция

Solr также использует термин collection, который имеет смысл только в контексте кластера Solr, в котором один индекс распределяется между несколькими серверами.

SolrCloud вводит понятие a collection, которое расширяет понятие однозначно именованный, управляемый и настроенный индекс, который разделен на осколки и распределен на нескольких серверах.

Ответ 3

В соответствии с моим пониманием:

В распределенном поиске,

Коллекция - это логический индекс, разбросанный по нескольким серверам. Core - это часть сервера, на котором выполняется одна коллекция.

В нераспределенном поиске,

Один сервер, на котором запущен Solr, может иметь несколько коллекций, и каждая из этих коллекций также является ядром. Таким образом, коллекция и ядро ​​одинаковы, если поиск не распространяется.

Резюме

  • Коллекция на сервер называется ядром.
  • Коллекция аналогична индексу.
  • Один сервер Solr может иметь много ядер.
  • Коллекция является логическим индексом (пример использования для нескольких коллекций: скажем, две команды в одной группе недостаточно велики, чтобы оправдать полный собственный сервер Solr, но они также не хотят смешивать свои данные в одном индексе. Затем они могут создавать отдельные коллекции/индексы, которые будут хранить свои данные отдельно).
  • Лучше использовать отдельное Solr Cloud вместо создания коллекций, если данные для коллекции достаточно велики (не уверены, комментарии, пожалуйста?)

Ответ 4

От Solr Wiki:

Коллекции состоят из одного или нескольких осколков. Осколки имеют один или больше реплик. Каждая реплика - это ядро. Единая коллекция представляет один логический индекс.

Ответ 5

Отдельный экземпляр

В одном экземпляре Solr имеет нечто, называемое SolrCore, которое по сути является единственным индексом. Если вам нужно несколько индексов, вы создаете несколько SolrCores.

Solr Cloud

С помощью SolrCloud один индекс может охватывать несколько экземпляров Solr. Это означает, что один индекс может состоять из нескольких SolrCore на разных машинах. Мы называем все эти SolrCores, которые составляют один логический индекс в виде коллекции.

Коллекция представляет собой по существу единый индекс, который охватывает множество SolrCore, как для масштабирования индекса, так и для избыточности. Если вы хотите переместить 2 SolrCore Solr в SolrCloud, у вас будет 2 коллекции, каждая из которых состоит из нескольких отдельных SolrCores.

Ответ 6

Другие ответы определяют значение ядер и коллекций. Мой ответ объясняет использование ядер и коллекций.

Отдельный экземпляр

При работе с одним экземпляром solr вы запрашиваете cores.

Пользовательский интерфейс администратора одного экземпляра Solr не имеет селектора коллекции:

Single Solr Instance

Solr Cloud

При работе с Solr Cloud вы запрашиваете collections. Коллекции организованы в разных ядрах (реплики, осколки) в разных экземплярах solr.

Пользовательский интерфейс администратора экземпляра Solr Cloud имеет селектор коллекции и ядра. Но ядра являются технически экземплярами, здесь:

экземпляр Solr Cloud