Подтвердить что ты не робот

База данных - таблица фактов и таблица размеров

При чтении книги для бизнес-объектов я столкнулся с таблицей терминов и таблицей измерений. Является ли это стандартной вещью для всей базы данных, что все они имеют таблицу фактов и размерную таблицу или это просто для проектирования бизнес-объектов? Я ищу объяснение, которое различает два и то, как они связаны.

Отредактировано:

Почему запрос не может получить требуемые данные из таблицы фактов? Что произойдет, если вся информация хранится только в одной таблице фактов? Какие преимущества мы получаем, создавая отдельную таблицу фактов и измерений и присоединяясь к ней?

Извините за слишком много вопросов за раз, но я хотел бы узнать о взаимоотношениях и whys.

4b9b3361

Ответ 1

Dimension и Fact являются ключевыми терминов в OLAP.

  • Таблица фактов содержит данные, которые могут быть агрегированы.
  • Меры представляют собой агрегированные выражения данных (например, сумма затрат, количество вызовов,...)
  • Размер содержит данные, которые используются для создания групп и фильтров.
  • Таблица фактов без данных измерений бесполезна. Образец: "сумма заказов - 1M" - это не информация, а "сумма заказов с 2005 по 2009 год".

У них много инструментов BI, которые работают с этими понятиями (например, Microsft SSAS, Tableau Software) и языки (например MDX).

Несколько раз нелегко узнать, являются ли данные мерой или размером. Например, мы анализируем revenue, оба сценария возможны:

  • 3 меры: net profit, overheads, interest
  • 1 measure: profit и 1 размер: profit type (с 3 элементами: нетто, накладные расходы, проценты)

Аналитик BI определяет, что является лучшим дизайном для каждого решения.

EDITED из-за вопроса, который также редактируется:

Решение OLAP обычно имеет семантический уровень. Этот уровень предоставляет информацию инструмента OLAP о том, какие элементы являются данными фактов, элементами которых являются данные измерения и отношения таблицы. В отличие от OLTP-систем, не требуется нормальная нормализация базы данных OLAP. По этой причине вы можете принимать данные измерений из нескольких таблиц, включая таблицы фактов. Измерение, которое берет данные из таблицы фактов, называется "Размер факта" или "Вырожденный размер" .

Это много концепций, которые вы должны учитывать при разработке баз данных OLAP: "STAR Schema", "SNOWFLAKE Schema", "Surrogate keys", "parent-child hierarchies",...

Ответ 2

Это стандарт в хранилище данных, чтобы иметь таблицы фактов и таблицы размеров. Таблица фактов содержит данные, которые вы измеряете, например, что вы суммируете. Таблица измерений - это таблица, содержащая данные, которые вы не хотите постоянно повторять в таблице фактов, например, данные продукта, статусы, клиенты и т.д. Они связаны ключами: в схеме звездочек каждая строка в таблице фактов содержит ключ строки в таблице измерений.