В Spark функция groupByKey преобразует пару RDD (K,V)
в пару RDD (K,Iterable<V>)
.
Тем не менее, эта функция стабильна? т.е. порядок в итерабельности сохраняется в исходном порядке?
Например, если я изначально прочитал файл формы:
K1;V11
K2;V21
K1;V12
Может ли моя итерабельность для K1
выглядеть как (V12, V11)
(таким образом не сохраняя исходный порядок) или может быть только (V11, V12)
(таким образом сохранение оригинала порядок)?