У меня есть два файла в следующих форматах:
field1, field2, field3
field4, field1, field5
Другой номер поля указывает другое значение.
Я хочу присоединиться к двум файлам, используя Hadoop Streaming на основе взаимного поля (field1
в приведенном выше примере), поэтому вывод будет field1, field2, field3, field4, field5
(другие упорядочения в порядке, так же как и все поля).