Пожалуйста, предложите альтернативу pyspark dataframe для Pandas df['col'].unique()
Unique df['col'].unique()
.
Я хочу перечислить все уникальные значения в столбце pyspark dataframe.
Не тип SQL (зарегистрируйте шаблон, а затем запрос SQL для различных значений).
Также мне не нужно groupby->countDistinct
, вместо этого я хочу проверить различные значения в этом столбце.