Немного фона здесь:
Я знаю то, что хранилище данных, более или менее. Я прочитал несколько десятков руководств по хранилищу данных, я играл с SSAS, я знаю, что такое звездная схема, таблица измерений и таблица фактов, я знаю, что такое ETL и как это сделать. Это не вопрос "как" или запрос на учебники.
Моя проблема в том, что весь материал, который я прочитал на хранилище данных, кажется, замалчивает обоснование для создания хранилища данных. Все они фигурально, или в некоторых случаях буквально начинаются с фразы "так что вы решили построить хранилище данных..." Кроме того, я еще не принял это решение.
Итак, я надеюсь, что члены SO могут указать мне или помочь придумать какой-то полуобъективный тест. Что-то, что я могу приспособить к конкретной системе и в итоге "да, нам нужен хранилище данных" или "нет", сегодня выигрыш будет слишком мал ". Я думаю, что конкретные вопросы, на которые я должен ответить, следующие:
-
В какой момент строится хранилище данных, стоит рассмотреть вопрос? Другими словами, какие контрольные признаки, метрики или другие критерии следует искать, это может указывать на то, что стандартной транзакционной среды уже недостаточно?
-
Каковы альтернативы полнофункциональному хранилищу данных? Денормализацией в транзакционной базе данных и реплицируемым "сервером отчетов" является два, которые приходят на ум; есть ли какие-либо другие, которые я должен изучить, прежде чем совершать DW?
-
Почему хранилище данных лучше, чем упомянутые альтернативы? Если ответ "зависит от", то от чего он зависит?
-
Когда не должен, я пытаюсь создать хранилище данных? Я скептически отношусь к чему-либо, объявленному как "лучшая практика", независимо от контекста. Конечно, должны быть некоторые сценарии, где DW - неправильный выбор - каковы они?
-
Есть ли какие-либо практические примеры, которые я мог бы рассмотреть в отношении систем, которые были улучшены путем внедрения хранилища данных? Что-то, что объяснило бы мне, сквозные, какие решения или анализ им нужен был на складе, как они решили, что в него положить, и как склад оказался в более крупной среде? Я не хочу надуманного "позволить сделать куб из базы данных AdventureWorks" - реализация не имеет отношения ко мне, меня интересуют спецификации и конструкции и общий процесс мышления, которые были задействованы.
Обычно я стараюсь не спрашивать многочастников, но я думаю, что все они очень тесно связаны. Я готов принять любой ответ, который затрагивает, по крайней мере, первые 4 вопроса, хотя последнее действительно помогло бы кристаллизовать это в моем сознании. Ссылки хороши, если кто-то уже писал об этом, если они достаточно кратки и конкретны (ссылка на домашнюю страницу Ральфа Кимбалла = не полезно).
Надеюсь, что я поставил вопрос ясно - заблаговременно за ваши ответы!