Я хотел бы знать, почему группирующий компаратор используется во вторичном виде mapreduce.
В соответствии с окончательным примером руководства вторичной сортировки
Мы хотим, чтобы порядок сортировки для ключей был по годам (по возрастанию), а затем по температура (по убыванию):
1900 35°C
1900 34°C
1900 34°C
...
1901 36°C
1901 35°C
Установив разделитель для разбиения на часть года на год, мы можем гарантировать, что записи за тот же год идут на один и тот же редуктор. Этого еще недостаточно для достижения нашей цель, однако. Разделитель обеспечивает только то, что один редуктор получает все записи для год; он не меняет того факта, что редукторы группируются по ключевым разделам.
Поскольку мы уже писали бы наш собственный разделитель, который позаботился бы о том, чтобы ключи выхода на карту переходили к конкретному редуктору, так почему мы должны группировать его.
Заранее спасибо