В новом API (apache.hadoop.mapreduce.KeyValueTextInputFormat), как указать разделитель (разделитель), отличный от табуляции (по умолчанию) для разделения ключа и значения.
Пример ввода:
one,first line
two,second line
Обязательный параметр:
Key : one
Value : first line
Key : two
Value : second line
Я указываю KeyValueTextInputFormat как:
Job job = new Job(conf, "Sample");
job.setInputFormatClass(KeyValueTextInputFormat.class);
KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
Это отлично работает для вкладок в качестве разделителя.