Подтвердить что ты не робот

Как написать 'map only' hasoop jobs?

Я новичок в hadoop, я знаком с стилем программирования с уменьшением карты, но теперь у меня возникла проблема: иногда мне нужна только карта для задания, и мне нужен результат непосредственно в качестве вывода, что означает, что здесь не нужна фаза уменьшения, как я могу достичь этого?

4b9b3361

Ответ 3

Может быть очень полезно, когда вам нужно запускать работу с карточками только с терминала. Вы можете отключить редукторы, указав 0 редукторов в команде хаоса jar неявно:

-D mapred.reduce.tasks=0 

Итак, команда result будет следующей:

hadoop jar myJob.jar -D mapred.reduce.tasks=0 -input myInputDirs -output myOutputDir

Чтобы быть обратно совместимым, Hadoop также поддерживает параметр "-reduce NONE", который эквивалентен "-D mapred.reduce.tasks = 0".