目录
前言1. 创建DataFrame对象2. 单列聚合3. 多列聚合4. 多种聚合运算5. 多种聚合运算并更改列名6. 不同的列运用不同的聚合函数7. 使用自定义的聚合函数8. 方便的descibe
前言
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()
很方便进行聚合操作。
1. 创建DataFrame对象
import pandas as pd df1 = pd.DataFrame({\'sex\':list(\'FFMFMMF\'),\'smoker\':list(\'YNYYNYY\'),\'age\':[21,30,17,37,40,18,26],\'weight\':[120,100,132,140,94,89,123]})
grouped = df1.groupby([\'sex\',\'smoker\']) # sex有 F M 二值,smoker有 Y N 二值,故分成四组。
2. 单列聚合
grouped[\'age\'].agg(\'mean\')
sex smoker F N 30.0 Y 28.0 M N 40.0 Y 17.5 Name: age, dtype: float64
3. 多列聚合
grouped.agg(\'mean\')
4. 多种聚合运算
grouped[\'age\'].agg([\'min\',\'max\'])
5. 多种聚合运算并更改列名
grouped[\'age\'].agg([(\'A\',\'mean\'),(\'B\',\'max\')])
6. 不同的列运用不同的聚合函数
grouped.agg({\'age\':[\'sum\',\'mean\'], \'weight\':[\'min\',\'max\']})
7. 使用自定义的聚合函数
def Max_cut_Min(group): return group.max()-group.min() grouped.agg(Max_cut_Min)
8. 方便的descibe
grouped.describe()
参考博客:link
© 版权声明
THE END
暂无评论内容