Подтвердить что ты не робот

Datamart против отчетности Cube, каковы различия?

Термины используются повсеместно, и я не знаю четких определений. Я почти уверен, что знаю, что такое "файл данных". И я создал кубы сообщений с такими инструментами, как Business Objects и Cognos.

У меня также есть люди, которые говорят мне, что датамарт - это больше, чем просто коллекция кубов.

У меня также есть люди, которые говорят мне, что датамарт - это куб отчетности, не более того.

Каковы различия, которые вы понимаете?

4b9b3361

Ответ 1

Cube может (и, возможно, должен) означать что-то совершенно конкретное - артефакты OLAP, представленные через OLAP-сервер, например MS Analysis Services или Oracle (nee Hyperion) Essbase. Однако он также используется гораздо более свободно. Кубы OLAP такого типа используют инструменты запросов, поддерживающие куб, которые используют другой API для стандартной реляционной базы данных. Обычно OLAP-серверы поддерживают собственные оптимизированные структуры данных (известные как MOLAP), хотя они могут быть реализованы как интерфейсные реляционные данные источник (известный как ROLAP) или в различных гибридных режимах (известный как HOLAP)

Я стараюсь быть конкретным и использовать "куб" специально для обозначения кубов на серверах OLAP, таких как SSAS.

Бизнес-объекты работает путем запроса данных через один или несколько источников (которые могут быть реляционными базами данных, кубами OLAP или плоскими файлами) и создания в-памяти, называемой MicroCube, которую она использует для поддержки интерактивных операций с фрагментами и кубиками. Analysis Services и MSQuery могут сделать файл cube (.cub), который может быть открыт клиентским программным обеспечением AS или Excel и нарезанным и нарезанным аналогичным образом. IIRC. Новые версии Business Objects также могут открывать файлы .cub.

Чтобы быть педантичным, я думаю, что Business Objects находится в пространстве полуструктурированных отчетов где-то между реальной системой OLAP, такой как ProClarity и специальным инструментом отчетности, например Построитель отчетов, Oracle Discoverer или Brio. Круглые поездки к панели запросов делают ее несколько неуклюжей, как чистый инструмент OLAP с плавным мышлением, но он предлагает уровень интерактивности, которого нет в традиционных отчетах. Я вижу сладость Business Objects как сидеть в двух местах: специальная отчетность сотрудников, не обязательно знакомая с SQL, и предоставление запланированного отчета, поставляемого в интерактивном формате, который позволяет немного развернуть данные.

'Data Mart' также является довольно свободно используемым термином и может означать любой пользовательский интерфейс доступа к данным для системы хранилища данных. Определение может включать или не включать в себя инструменты отчетности и уровни метаданных, таблицы отчетов или другие элементы, такие как кубы или другие аналитические системы.

Я склонен думать о пакете данных как базе данных, из которой выполняется отчетность, особенно если это легко определяемая подсистема общей архитектуры хранилища данных. Однако вполне разумно подумать об этом, поскольку пользователь сталкивается с уровнем отчетности, особенно если есть специальные инструменты отчетности, такие как Business Objects или OLAP-системы, которые позволяют конечным пользователям напрямую получать данные.

Ответ 2

Термин "файл данных" стал несколько неоднозначным, но традиционно он связан с предметно-ориентированным подмножеством информационных систем организации. В карточке данных явно не подразумевается наличие многомерной технологии, такой как OLAP и data mart, явно не подразумевает наличие суммированных числовых данных.

С другой стороны, куб имеет тенденцию подразумевать, что данные представлены с использованием многомерной номенклатуры (как правило, технологии OLAP) и что данные обычно суммируются как пересечения нескольких иерархий. (т.е. чистая стоимость вашей семьи по сравнению с вашей личной чистой стоимостью и все, что между ними). ​​Как правило, "куб" подразумевает нечто очень специфическое, тогда как "data mart" имеет тенденцию быть немного более общим.

Я полагаю, что в ООП говорят, что вы можете точно сказать, что в "карте данных" есть "куб", "есть" реляционная база данных, "есть" отличный интерфейс отчетности и т.д.... но было бы неправильно говорить что любой из этих отдельных "is-a" файлов данных. Термин "файл данных" более инклюзивный.

Ответ 3

Как следует из названия, куб представляет собой структурированный многомерный набор данных (обычно три измерения, каждый из которых представляет три стороны куба). Массив данных - это просто контейнер, а не сама по себе структура, хотя он содержит наборы данных, упорядоченные (как таблицы) в размерах и фактах.

Структура куба позволяет легко визуализировать или концептуализировать данные по различным размерам куба. Таким образом, большинство бизнес-аналитиков или разработчиков легко находят запрос и взаимодействуют с кубом.

Так как массив данных - это просто контейнер с кучей таблиц; перед тем, как запросить и проанализировать данные, пользователям необходимо сначала концептуализировать и понять структуры размеров.

Ответ 4

Пакет данных традиционно имел в виду статические данные, обычно ориентированные на дату/время, используемые аналитиками для статистики, бюджетирования, отчетов о производительности и продажах и другие мероприятия по планированию.

Cube - это OLAP-база данных, которая довольно полно преобразует OLTP-данные в статическую, ориентированную на дату/время схему, которая использует язык запросов, который не является SQL, но создан специально для ответа на вопросы типа пакета данных. Он использует термины, такие как измерения, размеры, звездообразную схему и т.д., А не таблицы, столбцы и строки. Лучшая знакомая аналогия может быть сводной таблицей в электронной таблице.

Ответ 5

Пакет данных - это совокупность данных конкретного бизнес-процесса. Не важно, как хранятся данные. Куб хранит данные особым образом, многомерным, в отличие от таблицы с строкой и столбцом. Куб в базе данных olap похож на таблицу в традиционную базу данных. В хранилище данных могут быть таблицы или кубы. Кубы делают анализ быстрее, потому что он заранее вычисляет скопления раньше времени.

Ответ 6

Помните:

Складирование данных - это процесс сбора данных из систем устаревших и транзакционных баз данных и преобразования его в организованную информацию в удобном для пользователя формате для поощрения анализа данных и поддержки принятия бизнес-решений на основе фактов.

A Хранилище данных - это система, которая извлекает, очищает, согласовывает и доставляет исходные данные в хранилище объемных данных, а затем поддерживает и реализует запросов и анализа для принятия решений.

KIMBALL, например. последовательно определил пакет данных как ориентированное на процесс подмножество данных общих организаций на основе основы атомных данных, и это зависит только от физики событий измерения данных, а не от ожидаемых вопросов пользователей.

  • Витрины данных основаны на источнике данных, а не на просмотре данных в подразделениях.
  • Чертежи данных содержат все детали атома, необходимые для поддержки сверления до самого низкого уровня.
  • Сердечники данных могут централизованно контролироваться или децентрализоваться.

ПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ

  • Процесс основан
  • Atomic Data Foundation
  • Измерение данных

НЕИСПРАВНОСТЬ ОПРЕДЕЛЕНИЕ

  • Департамент на основе
  • Только агрегированные данные
  • Пользовательский вопрос

Ответ 7

Для меня дататарт - это просто место, где данные сбрасываются в относительно плоский, непригодный для использования формат.

Куб берет эти данные и заставляет танцевать.

Ответ 8

Я согласен с Мэтью. Мы используем термин "Data Mart" для любого источника данных, который хранит общие данные и сопоставления, используемые в различных приложениях в предприятии. Мы не храним измеримые данные в массиве данных, поэтому я рассматриваю карту данных как один из нескольких источников данных для куба. Это, однако, так, как мы это делаем. Я уверен, что нет ничего, что помешало бы вам хранить измеримые данные в массиве данных.