Я анализирую некоторые данные с фреймами данных pyspark, предположим, что у меня есть dataframe df
, который я агрегирую:
df.groupBy("group")\
.agg({"money":"sum"})\
.show(100)
Это даст мне:
group SUM(money#2L)
A 137461285853
B 172185566943
C 271179590646
Агрегирование работает отлично, но мне не нравится новое имя столбца "СУММ (деньги # 2L)". Есть ли простой способ переименовать этот столбец в нечто, читаемое человеком из метода .agg
? Возможно, что-то более похожее на то, что можно было бы сделать в dplyr
:
df %>% group_by(group) %>% summarise(sum_money = sum(money))