Я рассматриваю Доказательство концепции для обработки больших объемов данных, таких как > 10 G, которые требуют, по меньшей мере, 200+ записей в секунду и около 50 + чтение в секунду пространственных связанных данных. Это тоже растущая система. В настоящее время я рассматриваю возможность переноса этих данных большого объема в формат db для больших таблиц NoSql по соображениям производительности.
Я рассмотрел и поближе посмотрел на MongoDB и cassandra. Что касается моего чтения,
MongoDB: - похоже, проблема с блокировкой записи - один из сообщений в stackoverflow предложил этот db, если нет необходимости в нескольких серверах - индексы хранятся в памяти. Таким образом, чем больше рост индекса, тем выше производительность. - преимущество Mongodb имеет прямую поддержку пространственных данных и индексации наряду с такими функциями, как поиск близлежащих мест и т. - Я вижу этот пост Cassandra Or MongoDB для нашего приложения на основе местоположения, предлагая mongodb как лучший выбор
Cassandra:
- Кажется лучшим среди связанных dbs - Кажется, есть отличная запись, а также чтение производительности - Не поддерживает пространственное индексирование, но это может быть расширено с помощью geohash
Мое сердце на самом деле выходит на mongodb из-за его хорошей документации и прямой поддержки пространственных данных. Имеет ли какой-либо орган плохой опыт использования mongodb для таких больших систем? Я действительно вижу много сообщений о mongodb iostat для производительности.
Если mongodb не подходит, может кто-нибудь дать некоторые указатели на geohash используя cassandra? Я видел ссылку http://code.google.com/p/geospatialweb/ для создания хэшей. Но есть вопросы о том, как запрашивать и т.д.?