Подтвердить что ты не робот

Преобразование простой строки строки в RDD в Spark

У меня есть простая строка:

line = "Hello, world"

Я хотел бы преобразовать его в RDD только с одним элементом. Я пробовал

sc.parallelize(line)

Но он получает:

sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']

Любые идеи?

попробуйте использовать параметр List as:

sc.parallelize(List(line)).collect()

он возвращает

res1: Array[String] = Array(hello,world)

Нижеприведенный код отлично работает на Python

sc.parallelize([строка]). собирать()

['Привет, мир']

Здесь мы передаем параметр "строка" в виде списка.