Подтвердить что ты не робот

Какова фактическая разница между хранилищем данных и большими данными?

Я знаю, что такое Data Warehouse и что такое Big Data. Но я путаюсь с Data Warehouse Vs Big Data. Оба они одинаковы с разными именами или оба являются разными (концептуально и физически).

Спасибо заранее.

4b9b3361

Ответ 1

Я знаю, что это более старая тема, но в прошлом году произошли некоторые изменения. Сравнение хранилища данных с Hadoop похоже на сравнение яблок с апельсинами. Хранилище данных представляет собой концепцию: чистые, интегрированные данные высокого качества. Я не думаю, что потребность в хранилище данных исчезнет в ближайшее время. С другой стороны, Hadoop - это технология. Это распределенная вычислительная среда для обработки больших объемов данных. В прошлом хранилища данных обычно строились на реляционных базах данных и устройствах хранилища данных. Тем не менее, за последние пару лет возникли различные ограничения СУБД (разрастание лицензионных затрат перед растущими объемами данных, плохо подходит для целей запросов к графикам и иерархиям и проглатывания неструктурированных типов данных и т.д.). В то же время появились механизмы запросов MPP SQL на Hadoop, такие как Apache Drill, которые теперь позволяют запрашивать данные, которые находятся на Hadoop.

Я написал целую серию сообщений по этому вопросу, если вас интересуют все детали. Хранилище данных в возрасте больших данных. Конец эры?

Ответ 2

Я думаю, вы найдете следующую статью очень полезной для своих мыслей.

It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the "traditional" single database implementation of a data warehouse.  
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses.
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments. 

С: http://gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx

Ответ 4

Я нашел этот http://www.b-eye-network.com/view/17017, который описывает разницу больших данных и хранилища данных

когда мы сравниваем большое решение данных с хранилищем данных, что мы делаем найти? Мы находим, что большое решение данных - это технология и данные складирование - это архитектура. Это две разные вещи. технология - это просто средство хранения и управления большими объемами данные. Хранилище данных - это способ организации данных, чтобы корпоративной достоверности и целостности. Когда кто-то берет данные из хранилище данных, этот человек знает, что другие люди используют один и тот же данные для других целей. Существует основа для согласования данных когда есть хранилище данных.