Я использую следующую команду, чтобы заполнить RDD множеством массивов, содержащих 2 строки [ "filename", "content" ].
Теперь я хочу перебирать все эти вхождения, чтобы что-то делать с каждым именем и содержимым.
val someRDD = sc.wholeTextFiles("hdfs://localhost:8020/user/cloudera/*")
Кажется, я не могу найти документацию о том, как это сделать.
Итак, я хочу:
foreach occurrence-in-the-rdd{
//do stuff with the array found on loccation n of the RDD
}