Я работаю над проектом с требованием подойти к общей панели мониторинга, где пользователи могут выполнять различные типы группировки, фильтрации и разворота в разных полях. Для этого мы ищем хранилище поиска, которое позволяет делать фрагменты и кубики данных.
Было бы много источников данных и будет хранить их в Поисковом хранилище. Может потребоваться предварительное вычисление исходных данных, которое может быть выполнено промежуточными компонентами.
Я просмотрел несколько блогов, чтобы понять, можно ли надежно использовать ES в качестве основного хранилища данных. В основном это зависит от того, какой прецедент мы ищем. Некоторая информация о используемом случае:
- Около 300 миллионов записей каждый год с 1-2 КБ.
- Предполагая хранить данные за 1 год, сегодня мы имеем 300 ГБ, но прецедент может увеличиться до 400-500 ГБ при росте данных.
- На данный момент не уверен, как мы будем продвигать данные, но, грубо говоря, это может достигать 2-3 миллионов записей за 5 минут.
- Запрос поиска низкий, но требует сложных запросов, которые могут искать данные за последние 6 недель до 6 месяцев.
- документ будет проиндексирован почти во всех полях документа.
В некоторых блогах утверждается, что он достаточно надежен для использования в качестве первичного хранилища данных -
- http://chrisberkhout.com/blog/elasticsearch-as-a-primary-data-store/
- http://highscalability.com/blog/2014/1/6/how-hipchat-stores-and-indexes-billions-of-messages-using-el.html
- https://karussell.wordpress.com/2011/07/13/jetslide-uses-elasticsearch-as-database/
И некоторые блоги говорят, что у ES мало ограничений -
- https://www.found.no/foundation/elasticsearch-as-nosql/
- https://www.found.no/foundation/crash-elasticsearch/
- http://www.quora.com/Why-should-I-NOT-use-ElasticSearch-as-my-primary-datastore
Кто-нибудь использовал Elastic Search в качестве единственной истины данных без первичного хранилища, такого как PostgreSQL, DynamoDB или RDS? Я посмотрел, что у ES есть определенные проблемы, такие как раздвоенные мозги и коррупция индекса, где может быть проблема с потерей данных. Итак, я ищу, чтобы узнать, пользовался ли кто-то ES и какие проблемы с данными
Спасибо.