Я бы хотел использовать вашу мудрость, чтобы подобрать правильное решение для системы хранилища данных. Вот несколько деталей, чтобы лучше понять проблему:
Данные организованы в структуре звездной схемы с одним большим фактом и размером ~ 15.
20 байт строк в месяц
10 измерений со сто строк (несколько иерархии)
5 размеров с тысячами рядов
2 размера с ~ 200K строк
2 больших размера с рядами 50M-100M
Два типичных запроса работают против этой БД
Верхние члены в dimq:
select top X dimq, count(id)
from fact
where dim1 = x and dim2 = y and dim3 = z
group by dimq
order by count(id) desc
Меры против кортежа:
select count(distinct dis1), count (distinct dis2), count(dim1), count(dim2),...
from fact
where dim1 = x and dim2 = y and dim3 = z
Вопросы:
- Какая лучшая платформа для выполнения таких запросов
- Какое оборудование требуется
-
Где можно разместить (EC2?)
(пожалуйста, игнорируйте вопросы импорта и загрузки на данный момент)
Tnx,
Аггей.