Пряжа отличается от своего уровня инфраструктуры от исходной карты, уменьшая архитектуру следующим образом:
В YARN трекер заданий разбивается на два разных демона, называемых Resource Manager
и Node Manager
(node specific). Менеджер ресурсов управляет распределением ресурсов только для разных заданий, помимо планировщика, который просто выполняет задания по планированию, не беспокоясь о каких-либо проверках или обновлениях состояния. Различные ресурсы, такие как память, время процессора, пропускная способность сети и т.д., Помещаются в один блок под названием Resource Container
. Существуют разные AppMasters
, запущенные на разных узлах, которые общаются с несколькими этими контейнерами ресурсов и соответственно обновляют Node Manager с данными мониторинга/состояния.
Я хочу знать, как с помощью такого подхода увеличить производительность с точки зрения сокращения карты? Кроме того, если есть какой-либо окончательный контент о мотивации за пряжу и ее преимуществах по сравнению с существующей реализацией Map-reduce, укажите, пожалуйста, то же самое.