Я ищу способ разделить RDD на два или более RDD. Самое близкое, что я видел, это Scala Искра: Разделить коллекцию на несколько RDD?, которая по-прежнему является единственным RDD.
Если вы знакомы с SAS, что-то вроде этого:
data work.split1, work.split2;
set work.preSplit;
if (condition1)
output work.split1
else if (condition2)
output work.split2
run;
что привело к двум различным наборам данных. Он должен быть немедленно сохранен, чтобы получить результаты, которые я намерен...