Я прохожу через исчерпывающий справочник хауопа, где он четко объясняет входные расщепления. Это похоже на
Входные разделители не содержат фактических данных, скорее у них есть хранилище местоположения для данных HDFS
и
Обычно размер разделения ввода такой же, как размер блока
1) позволяет сказать, что блок размером 64 МБ включен в node A и реплицирован из 2 других узлов (B, C), а размер разделенного входа для программы уменьшения карты - 64 МБ, будет этот раскол просто имеет место для node A? Или он будет иметь места для всех трех узлов A, b, C?
2). Поскольку данные локальны для всех трех узлов, как среда решает (выбирает) maptask для выполнения на определенном node?
3) Как это обрабатывается, если размер Разделение ввода больше или меньше размера блока?