Подтвердить что ты не робот

В кластере hadoop, должен ли улей быть установлен на всех узлах?

Я новичок в Hadoop/Hive, и я только начал читать документы. Существует множество блогов по установке Hadoop в режиме кластера. Кроме того, я знаю, что Hive работает на вершине Hadoop. Мой вопрос: Hadoop установлен на всех узлах кластера. Должен ли я также устанавливать Hive на все узлы кластера или только на master node?

4b9b3361

Ответ 1

Нет, это не то, что вы устанавливаете на рабочих узлах. Улей - клиент Hadoop. Просто запустите Hive в соответствии с инструкциями, которые вы видите на веб-сайте Hive.

Ответ 2

Из Руководства по установке Cloudera Hive:

Установите Hive на своем клиентском компьютере (ах), с которого вы отправляете задания; вам не нужно устанавливать его на узлы в вашем кластере Hadoop.

Ответ 3

Hive в основном используется для обработки структурированных и полуструктурированных данных в Hadoop. Мы также можем выполнить анализ больших наборов данных, которые присутствуют в HDFS, а также в файловой системе Amazon S3 с использованием Hive. Для запроса данных hive также предоставляет язык запросов, известный как HiveQL, который похож на SQL. Используя Hive, вы можете легко запускать Ad-hoc-запросы для анализа данных. Используя Hive, нам не нужно писать сложные задания Map-Reduce, нам просто нужно отправить SQL-запросы. Hive преобразует эти SQL-запросы в задания MapReduce.

Наконец, Hive SQL преобразуется в задания MapReduce, и нам не нужно отправлять задание MapReduce из всех node в кластере Hadoop, так же, как нам не нужно, чтобы Hive был установлен во всех node кластера Hadoop