Подтвердить что ты не робот

Недостатки хранения двоичных данных в Riak?

Каковы проблемы, если таковые имеются, хранения двоичных данных в Riak?

Оказывает ли это эффект на работоспособность и производительность кластеризации?

Каковы были бы различия в производительности между использованием Riak для этой, а не распределенной файловой системы?

4b9b3361

Ответ 1

Добавляя к превосходному ответу на Оскар-Годсон, вы, вероятно, столкнетесь с проблемами со значениями, превышающими 50 МБ. Бит-бокс лучше всего подходит для значений, которые составляют до нескольких килобайт. Если вы храните большие значения, вы можете рассмотреть альтернативные серверы хранения, такие как innostore.

У меня нет опыта хранения двоичных значений, но у нас есть кластер среднего размера (5 узлов, порядка 100 М, 10 из ТБ), и мы видим частые ошибки, связанные с вставкой и извлекать значения, размер которых равен 100 КБ. Производительность в этом случае несовместима - несколько раз она срабатывает, другие - нет, поэтому, если вы собираетесь протестировать, проверьте масштаб.

Мы также видим проблемы с большими значениями при запуске запросов с уменьшением размера - они просто теряют время. Однако это может быть менее актуальным для двоичных значений... (как упоминал Мэтт-Ранни).

Также см. @Stephen-C answer здесь

Ответ 2

Единственная проблема, о которой я могу думать, - хранить двоичные данные размером более 50 МБ, которые они советуют. Весь смысл Riak таков:

Еще одна причина, по которой можно было бы забрать Riak для гибкости моделирования ваших данных. Riak будет хранить любые данные, которые вы им сообщаете в агностическом контексте - он делает не применять таблицы, столбцы или ссылочная целостность. Это значит, что ты может хранить двоичные файлы прямо рядом больше программно-прозрачных форматов как JSON или XML.

Источник: Схема схемы в Riak - Введение

Ответ 3

С Riak рекомендуемый максимум составляет 2 МБ на объект. Помимо этого, рекомендуется использовать либо Riak CS, который был протестирован с объектами до 5 ТБ (хранится в Riak как объекты 1 МБ), либо естественным образом разбивает ваш большой объект на 2 МБ фрагменты и связывает ключ и суффикс.

Ответ 4

Я лично не заметил никаких проблем с хранением данных, таких как изображения и документы (как DOC, так и PDF) в Riak. У меня нет номеров производительности, но я могу их запомнить.

Что-то примечание: с помощью Riak вы можете использовать Luwak, который предоставляет api для хранения больших файлов. Это было очень полезно.

Ответ 5

Одна из проблем может заключаться в том, что сложно, если не невозможно, использовать карту JavaScript/сокращение по вашим двоичным данным. Для этого вам, вероятно, понадобится Эрланг.