Подтвердить что ты не робот

Что такое хранилище данных?

Я спросил у клиента, что на самом деле означает термин "хранилище данных".

Я думал о ETL, подробности модели данных, о различиях с NoSQL, облаками, "нормальными" СУБД, MDM (Master Data Management) и т.д., но не мог описать этот термин в нескольких словах для него. (На самом деле я немного поговорил и оставил его неосвещенным.)

Как "хранилище данных" описано в предложениях 1-3 (или чуть больше)?

4b9b3361

Ответ 1

Для нетехнических парней лучше всего описать это как "Огромный объем данных, хранящихся в специализированной компьютерной системе. Данные обычно связаны с определенным доменом, и вся система разработана для быстрой и оптимизированной для некоторых специальных задач. хранящиеся в хранилищах данных, в основном используются для анализа или принятия решений".

Не уверен, что этого достаточно:) В Интернете есть много ссылок на эту тему, но если кто-то спросил меня о быстром определении, я бы использовал нечто похожее на то, что я написал выше.

Ответ 2

От wiki:

Хранилище данных - это хранилище организация с электронным хранением данных, предназначенных для облегчения отчетности и анализ 1.

Это определение хранилища данных основное внимание уделяется хранению данных. Однако средства для извлечения и анализа данных, извлекать, преобразовывать и загружать данные и для управления словарем данных также считаются существенными компонентами системы хранения данных. Многие ссылки на использование хранилищ данных этот более широкий контекст. Таким образом, расширенное определение данных складирование включает в себя бизнес инструменты разведки, инструменты для извлечения, преобразовывать и загружать данные в репозитория и инструменты для управления и получить метаданные.

Ответ 3

По крайней мере, теоретически идея хранилища данных заключается в предоставлении консолидированного представления данных из множества существующих систем, которые обычно считаются нецелесообразными для перезаписи для непосредственного объединения данных. Поэтому хранилище данных собирает данные из существующих систем и обеспечивает (по крайней мере иллюзию) все данные, находящиеся в одном месте, поэтому его можно запросить одним способом.

Основной целью является (обычно), чтобы обеспечить корреляцию между данными из существующих систем. Например, вы можете сравнить, сколько времени ваш продавец проведет с клиентом X (который хранится в одной системе), насколько покупатель X купил (хранится во второй системе) и насколько счастлив клиент X с тем, что они получают (хранятся, конечно, в третьей системе).

С практической точки зрения, это часто означает, что идеи клиентов находятся где-то между плохо определенным и совершенно безумным. Стоимость и график почти невозможны даже для того, чтобы догадаться, и надежная оценка явно невозможна. Поставить то, что он действительно хочет, почти наверняка невозможно, и выяснение чего-то, что будет полезно, будет занимать достаточно времени и работы, что ваш первый шаг - сделать то, что вы делаете, достаточно техничным, чтобы у него не было сердца когда он получает представление о стоимости и/или расписании.

Ответ 4

Хранилище данных представляет собой попытку сделать разрозненные системы однородными, независимо от технологии или механизма хранения.

Вы можете понять, почему "хранилище данных", но это другой вопрос.

Ответ 5

Хранилище данных - это база данных, система загрузки данных и отчетности, предназначенная для агрегирования данных из нескольких источников и представления ее таким образом, который легко извлекать и сообщать. С практической точки зрения, преимущества успешного проекта хранилища данных:

  • Статистическая и финансовая отчетность - хранилища данных упрощают работу с данными в совокупности и получают полезный анализ от него, особенно если у вас есть 65537 или более строк данных.

  • Безопасность данных - данные хорошо себя ведут и не имеют ловушек для молодых игроков. Внеочередные системы отчетности могут использоваться неопытными пользователями с низким риском получения неверных результатов в отчетах, не заметив.

  • Прозрачность - бизнес может видеть и идентифицировать проблемы с данными в базовых системах. Хранилище данных может быть хорошим инструментом для управления качеством данных.

  • Расширение возможностей - средства отчетности для конечных пользователей должны поддерживать большинство требований к информации управления только с минимальным набором требований, требующим составления индивидуального отчета специалистом.

Ответ 6

ПОЦЕЛУЙ...

Хранилище данных - это хранилище данных, относящихся к данной организации и ее деятельности. Эти данные позволят анализировать и сообщать о результатах деятельности организации по различным аспектам, таким как время, структура, потоки деятельности. Эти измерения можно объединить и объединить в соответствующие иерархии.

Ответ 7

Ничего себе, я занимался некоторыми исследованиями. Это действительно хороший ответ, с которым я столкнулся:

Хранилище данных... представляет собой воспроизводимую версию транзакций данных, которые особенно структурированы и построены для запроса, анализа и отчетности. В очень простом определении термин "хранилище данных" относится к процессу систематического сбора данных, которые хранятся организованно, чтобы их можно было получить и получить для будущей отчетности и анализа документов.

Это из Хранилище данных 100 секретов успеха" Ричардом Мартином

Ответ 8

С практической точки зрения: изменения в компаниях, изменение условий, вчерашний важный вопрос, возможно, не сегодня, и, скорее всего, завтра не будет. Это особенно актуально при решении вопросов на уровне генерального директора.

Если вы не можете предвидеть, какие будут вопросы, ваш единственный вариант - предоставить средства для быстрого ответа на любой вопрос. То, что делают хранилища данных или намерены делать. Откуда берутся данные, и от того, сколько разрозненных систем несущественно.

Многие хранилища данных терпят неудачу в "быстро ответе на любой вопрос", потому что их технология требует, чтобы вы превратили доступные сырые данные "наизнанку" (делая кубики), чтобы обеспечить "быстрое". И определение этих кубов ограничивает множество вопросов, на которые можно ответить.

Ответ 9

Из того, что я знаю, хранилище данных - это не что иное, как реляционная база данных, предназначенная для запроса и анализа. Он обычно содержит данные истории, полученные из данных транзакции.

В соответствии с William Inmon определение хранилища данных:

Data Warehouse - это предметно-ориентированный, интегрированный, энергонезависимый и временный сбор данных в поддержку управленческих решений.

И вышеприведенное определение логично и идеально, если мы мыслим рационально и можем быть поняты из здесь

Ответ 10

Хранилище данных - это реляционная база данных, предназначенная для анализа запросов и бизнеса, а не для обработки транзакций. Она содержит исторические данные, полученные из данных транзакций. Эти исторические данные используются бизнес-аналитиками для подробного понимания бизнеса.

Хранилище данных должно иметь следующие характеристики:

  • Тематическая ориентация:

Хранилище данных помогает в анализе данных. Например, чтобы узнать о продажах компании, хранилище данных должно основываться на данных о продажах. Используя этот склад данных, мы можем найти продажи в прошлом году. Эта способность определять хранилище данных по предмету (продажам) делает его ориентированным на объект.

  1. Интегрировано:

Приведение данных из разных источников и их включение в согласованный формат. Это включает в себя решение единиц мер, конфликтов имен и т.д.

  1. Нестабильность:

После ввода данных в хранилище данных данные не должны обновляться.

  1. Вариант времени:

Для анализа бизнеса аналитикам нужны большие объемы данных. Таким образом, хранилище данных должно содержать исторические данные.

Ответ 11

Простыми словами...

Хранилище данных - это способ управления элементами на реальном складе, который содержит местоположение, запас, перемещение, отчетность, аудит, что-либо о "реальных предметах" на "реальном складе".

Надеюсь, это будет проще.