pyspark.sql.functions.grouping

pyspark.sql.functions。 分組 ( 上校:ColumnOrName )→pyspark.sql.column.Column

聚合函數:表示一組的列表中指定的列是否聚合,返回1聚合或0不聚合的結果集。

例子

> > >df多維數據集(“名稱”)gg(分組(“名稱”),總和(“年齡”))orderBy(“名稱”)顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| |分組名稱(名稱)(年齡)| |數目+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |愛麗絲| | 0 | 2 |鮑勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +