В искрах SQL (возможно, только HiveQL) можно сделать:
select sex, avg(age) as avg_age
from humans
group by sex
что приведет к DataFrame
с столбцами с именем "sex"
и "avg_age"
.
Как avg(age)
можно сгладить до "avg_age"
без использования текстового SQL?
Edit: После ответа zero323 мне нужно добавить ограничение, которое:
Имя, подлежащее переименованию, может быть неизвестно/гарантировано или даже адресовано. В текстовом SQL, используя "select EXPR as NAME", удаляется требование иметь промежуточное имя для EXPR. Это также имеет место в приведенном выше примере, где "avg (age)" может получить множество автогенерированных имен (которые также различаются между искровыми релизами и базами sql-context).