Python数据分析处理(三)--运动员信息的分组与聚合
2022-11-15 canyinms.com 【 字体:大 中 小 】
代码:
import pandas as pd f = open('运动员信息表.csv') data=pd.read_csv(f,skiprows=0,header=0) print(data)
运行结果:
首先使用pd.read_csv(f,skiprows=0,header=0)进行数据的读取,并且将数据转换成为dataframe的格式给对象,做初始化,方便后面进行数据的分析。
2、统计男篮、女篮运动员的平均年龄、身高、体重代码:
sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"]) print(sex.mean())
运行结果:
首先我们先把数据提取出来做个分组,先把"年龄(岁)",“身高(cm)”,"体重(kg)"这三行数据提取出来再根据性别进行分组。
sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])
然后再调用mean()求平均值,求出男篮、女篮运动员的平均年龄、身高、体重。
3、统计男篮运动员年龄、身高、体重的极差值代码:
sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"]) basketball_male=dict([x for x in sex])['男'] basketball_male #求极差 def range_data_group(arr): return arr.max()-arr.min() #进行每列不同的聚合 basketball_male.agg({ "年龄(岁)":range_data_group,"身高(cm)":range_data_group,"体重(kg)":range_data_group })
运行结果:
首先提取数据:
单行循环提取数据,dict([x for x in sex])在循环体内的语句只有一行的情况的下,可以简化for循环的书写。定义一个函数def range_data_group(arr):求极差;
极差的求法:使用最大值减去最小值。就得到极差。
agg()函数:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*
func : 函数,函数名称,函数列表,字典{‘行名/列名’,‘函数名’}
使用指定轴上的一个或多个操作进行聚合。
需要注意聚合函数操作始终是在轴(默认是列轴,也可设置行轴)上执行,不同于 numpy聚合函数
最后我们可以得到三列数据:分别对应"年龄(岁)",“身高(cm)”,“体重(kg)”。
4 、统计男篮运动员的体质指数4.1添加体重指数代码:
data["体质指数"]=0 data
运行结果:
添加一行体重指数:data[“体质指数”]=0
4.2计算bmi值并添加数据代码:
# 计算bmi数值 def outer(num): def bminum(sumbim): weight=data["身高(cm)"] height=data["体重(kg)"] sumbim=weight/(height/100)**2 return num+sumbim return bminum
将该行数据添加上去:
代码:
# 调用函数 bimdata=data["体质指数"] data["体质指数"]=data[["体质指数"]].apply(outer(bimdata)) data
运行结果:
编写函数计算bmi数值 outer(num);然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。
data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))97622)]
编写函数计算bmi数值 outer(num) ;然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。
data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))
到此这篇关于Python数据分析处理,运动员信息的分组与聚合的文章就介绍到这了。更多相关Python数据分析处理内容请搜索好二三四,希望大家以后多多支持好二三四!
猜你喜欢
2023年高考需注意这些事项 注意事项有哪些?
2023年高考时间是几月几日 全国高考什么时候?
高考倒计时1天 几号开始高考?
晋江8个考点实行交通管制 此举有何意义?
高考生哪六样东西千万别发朋友圈?
黑龙江高考2023时间安排表 黑龙江高考是全国几卷?
《教育资源免费送!开学季大放送》
小学教育,如何激发孩子学习兴趣?
了解最新职业培训趋势,掌握未来就业机会!
教如何填报高考志愿
橘子洲旅游攻略 长沙橘子洲怎么玩
西安周边旅游攻略 西安周边最值得去的地方
毛坦厂中学万人雨中送考 毛坦厂送考头车车牌91666祝福考生
珠峰被救女子不愿支付全部救援费用 珠峰攀登者为救遇险女子放弃登顶
登珠峰获救女子只愿承担4成救援费是怎么回事 登珠峰获救女子只愿承担4成救援费具体情况
国内出现偏肺病毒感染 尚无治疗药物
男子连吃100天麦当劳减重53斤是真的吗 男子连吃100天麦当劳为什么能减重53斤
本周狗屎运最旺的星座 本周狗屎运最旺的四大星座
印度耗资百亿卢比的大桥又塌了是什么情况 印度耗资百亿卢比的大桥又塌了是为什么
一个村考出300多大学生6个北大 湖南一小村考上一本奖4000二本3000