游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

手把手教你用pandas分析可视化东京奥运会数据

  来源:早起Python
  作者:刘早起
  本文将基于东京奥运会奖牌榜数据,使用pandas进行数据分析可视化实战(文末可以下载数据与源码)数据读取
  首先是奥运会奖牌数据的获取,虽然有很多接口提供数据,但是通过奥运会官网拿到的数据自然是最可靠的
  通过对东京奥运会官网奖牌榜的页面分析,发现其表格在前端是通过嵌入的,所以可以使用pandas。readhtml()轻松读取df1pd。readhtml(https:olympics。comtokyo2020olympicgameszhresultsallsportsmedalstandings。htm)〔0〕
  之后再读取本地分日奖牌数据并将国家ID进行匹配df2pd。readcsv(东京奥运会奖牌分日数据。csv)
  修改列名
  注意到上面的df1列名并没有完整,所以可以使用rename函数修改指定列的名称df1。rename(columns{Unnamed:2:金牌数,Unnamed:3:银牌数,Unnamed:4:铜牌数},inplaceTrue)数据类型查看与修改
  既然df2有时间列,为了方便后面分析,自然要检查一下其类型df2。info()
  可以看到,获奖时间列虽然没有缺失值但其并不是pandas支持的时间类型。
  好在修改列属性并不是什么困难的事情,一行代码轻松搞定(712)df2〔获奖时间〕pd。todatetime(df2〔获奖时间〕)数据合并
  通过观察可以发现,df2并没有国家名称列,但是其与df1有一个共同列国家id
  为了给df2新增一列国家名称列,一个自然的想法就是通过国家id列将两个数据框进行合并,在pandas中实现,也不是什么困难的事情temppd。merge(df1,df2,on国家id)先合并temp〔获奖时间〕pd。todatetime(temp〔获奖时间〕)修改类型temptemp。sortvalues(by〔获奖时间,奖牌类型〕,ascendingTrue,ignoreindexTrue)排序,和df2一样df2〔国家〕temp〔国家奥委会〕赋值
  现在df2就调整的差不多了(由于源数据问题,部分获奖时间与真实时间有一定误差),下面开始进行分析数据分组
  下面对df2进行一些统计分析,计算每个国家的奖牌总数(也就是出现次数),并查看奖牌数前5名,结果可以用df1进行验证
  数据统计
  看完国家奖牌排行,接下来计算获得奖牌最多的运动员(注意:仅统计单人项目)
  这里无需使用分组功能,只需要按照运动员姓名列进行频率统计即可。数据筛选
  下面筛选出全部乒乓球的获奖信息,这里的筛选有多种写法,你能写出几种?
  数据透视
  现在查看各国在各项目上的奖牌详情,下面是通过透视得到的答案,但你会使用使用数据分组功能吗?pd。pivottable(df2,values〔奖牌类型〕,index〔国家,运动类别〕,aggfunccount)
  数据查询
  在上一题的基础上,查询中国队的获奖牌详情,注意是查询而不是筛选,所以使用上上一题的方法将会报错result。query(国家〔中国〕)个性化查看
  如何将上一题的结果进一步突出展示,可以使用pandas中的style(result。query(国家〔中国〕)。style。bar(subset〔奖牌类型〕,colorskyblue))
  数据格式化
  上面说到,df2的获奖时间部分并不准确(主要体现在小时上),所以我们干脆将时间精确到天,这里可以使用map对一整列进行操作deftimeformat(x):returnx。strftime(m月d日)df2〔获奖时间〕df2〔获奖时间〕。map(timeformat)分组统计
  接下来,让我们统计每天产生的奖牌总数df2。groupby(获奖时间)〔国家〕。count()。sortvalues()
  可以看到,最后一天产生的奖牌数量最多数据透视
  再来查看不同项目在不同国家的分布情况,同样也可以使用分组功能实现pd。pivottable(df2,values〔奖牌类型〕,index〔运动类别,国家〕,aggfunccount)
  数据计算
  接下来让我们计算中国每日总奖牌数量,你能想到该如何实现吗?pd。pivottable(df2,values〔奖牌类型〕,index〔获奖时间,国家〕,aggfunccount)。query(国家〔中国〕)。cumsum()
  数据计算
  最后,计算前十名各国每日奖牌数量统计,注意:对于第一天没有数据的国家用0填充,其余时间的缺失值用上一日数据填充。
  这看似简单的问题,涉及的pandas操作还真不少!datapd。pivottable(df2,values〔奖牌类型〕,index〔获奖时间,国家〕,aggfunccount)。query(国家〔美国,中国,日本,英国,ROC,澳大利亚,荷兰,法国,德国,意大利〕)datadata。unstack()data。columnsdata。columns。getlevelvalues(1)data。columns。nameNonedatadata。cumsum()datadata。fillna(axis0,methodffill)。fillna(0)data条形图
  首先制作奖牌排行榜
  上图使用matplotlib制作,看起来不错,但代码量也确实不少
  堆叠图
  接下来使用pyecharts绘制上一题奖牌榜各奖牌的细分
  使用pyecharts的好处就是使用封装好的方法,代码量相对较少
  环形图
  现在进一步绘制中国队的奖牌分布
  同样使用pyecharts,实际行代码搞定
  地图
  现在绘制奖牌分布的热力地图
  使用pyecharts绘制,绘图代码不多,但是调整国家中英文映射字典是一件痛苦的事情
  动态图
  最后绘制每日奖牌榜前十奖牌数量的动态图,使用matplotlib或pyecharts均得不到较好的效果,所以这里使用另一个第三方库barchartrace进行绘制
  以上就是基于2020年东京奥运会数据进行的一系列数据分析可视化流程,基本涉及到利用Pandas进行数据分析的主要操作,是一份不可多得的简单易懂、利于探索的数据集。

三星的手机处理器为什么除了之前魅族用过其它厂家不用?魅族之前一直是三星的国内合作伙伴,而且合作的深度不浅。况且三星也需要一个国内的厂商为自己的产品做代言,这样两家就一拍即合了。可惜三星的CPU一直都不给力发热量严重,而且性能随着……西电10篇论文入选2021年陕西省优秀博士学位论文近日,陕西省教育厅、陕西省学位委员会公布了2021年陕西省优秀博士学位论文评选结果,西电10篇博士学位论文入选,入选数位居全省第三,成绩喜人,再次彰显了学校研究生培养的硬核实力……第七届中法投资论坛聚焦新能源产业合作来源:人民网人民日报本报北京11月23日电(记者于超凡)智荟中欧2021第七届中法投资论坛23日在线上举行,中法产学界代表围绕新能源产业合作等议题进行了探讨。法国前……竞争宏光MINIEV?朋克多多实车曝光,不太香新能源车近几年真是强势崛起,尤其在今年车市上,各种新能源车像雨后春笋般遍地开花,多到让人应接不暇,消费者纷纷患上了选择困难症。自从去年五菱宏光MINIEV作为一匹黑马得到出头的……你用过最好的浏览器插件是什么?每天,我们都会用浏览器访问无数网页,从信息流中汲取各方面知识储备,却很少归纳整理。于是,当某一天你突然回想起曾经看到过什么内容时,用尽一切办法,也很难翻到当初的那个页面了。……更清晰更精确更详细!中国构建全球最大卫星图像数据集香港《南华早报》网站报道称,中国构建全球规模最大的卫星图像数据集,以加强训练人工智能。中国科学院近日表示,中国发布了包含100多万个目标详细信息的卫星图像数据集,用以帮助……电商直播带货四大天王转型记过去几年,人们看到了直播带货的成交神话,也惊叹于带货主播的魔力。在直播电商狂奔突进的当下,各大互联网平台争相入局,各路明星也纷纷涌进直播间,一时间主播成了很多年轻人的理想……恒大汽车海量专利发布5月12日,恒大汽车发布公告,首次对外公布专利信息,在中国及国外总共申请专利3012件,其中已获得授权专利1355件,这些专利涵盖纯电动底盘架构、悬架系统、转向控制、制动控制、……档次太低,无法上沪牌,五菱宏光MINIEV会退出上海吗?近期有传言指出,上汽通用五菱宏光MINIEV在上海地区暂时无法申请新能源汽车专用牌照,最近也有很多车主无法申领上海市免费发放的新能源汽车专用牌照,主要原因是因为上海在相关政策发……滴滴回应网约车抽成质疑虚心接受批评,持续推进公开透明!网友打5月8日,滴滴回应网约车抽成质疑登上微博热搜。日前,滴滴在其官微发布声明,回应近期公众对于其抽成过高、抽成规则不透明等问题的质疑。滴滴表示,虚心接受公众批评,将持续推进公……FILSCCHIA,三个关于存储的区块链项目,有何异同呢?fil,sc分布氏存储方向,chia绿色比特币方向,所以看好chiaSC算老牌了,不过都是山寨币。fil受到了资金盘青睐,最后基本都是一地鸡毛,庄家控盘想咋玩咋玩,玩币的……浮力产生的原因分析大家好,我们都知道,物体放到液体中会受到液体给物体竖直向上的浮力。那么为什么会产生这个浮力呢?今天张老师就带大家具体分析一下浮力产生的原因。我们都知道,物体放到液体中会受到液体……
今天超过80的仓库没有任何自动化世界已经开始进入了数字化和自动化的时代,自动化技术在社会、生活、经济、文化、医疗和媒体等领域的应用不断地扩大且成效显著。而作为制造业大军中数量和经济总量都庞大的中小型企业,数字……汽车人工智能与七个月的孩子谁更聪明?文丨来咖智库7个月大以后,多数孩子都已经学会了移出视线的物体仍然存在。把玩具放在毯子下面,孩子会知道玩具还在那里,并且可以伸手把它从毯子下面取回来。这种对于物体永久性的理……数字货币高富帅惨遭抛弃,价格几乎腰斩,发生了什么除了买彩票外,有没有可能一夜暴富,答案当然是有的;2009年数字货币比特币刚诞生时,价格还不足1美分,你花10元钱就可以买差不多近500个比特币,如果放到今年的4月份,那么你已……高通已抢占无人机制高点下一个科技制高点是什么?有人说是5G通讯。但我今天要说的是,5G通讯是一个宽泛化的概念,真正的下一个科技制高点是由5G通讯引发出来的科技实体行业。在这样的科技……红灯收音机和瓷介微调网上搜来的图片。94年上技校了,我仍有不起这类六管收音机。有个同学拿了图中这款收音机到学校听,我半开玩笑地说8元卖给我了,他还不肯,后来坏了,拿给他修家电的同学修去了,结果当然……抢购茅台,京东和天猫现状欢迎戳蓝字白酒圈儿关注。抢购的平台综合起来就那么多。可以点击这篇文章左下角的原文阅读,头部的文章,所有的平台都在里面,平台不会有什么太大的改变和增减,无非就是平台规……iOS15Beta5发布,HomePod无损音质也来了今日凌晨,苹果为开发者预览版用户推送了iOS15Beta5的更新。已经安装了iOS15测试版描述文件的用户可直接打开设置通用软件更新,直接在设备上OTA升级至最新的iOS15B……华为Mate50X大曝光,2K屏高刷新率后置四摄等,满满的诚无人不晓,华为手机是知名的手机厂商,以至于华为手机的一举一动都吸引着大家的目光。同时大家都知道华为是一个极致注重创新以及科技研发的手机厂商,因此华为手机为智能手机行业的发展做出……蔚来车主内讧超7800人反对被代表新京智库8月12日,蔚来车主林文钦驾驶蔚来ES8汽车在沈海高速涵江段发生交通事故不幸逝世。此次事件引发业内对自动驾驶技术安全性的讨论。蔚来车主林文钦车祸事件官方调查结果尚未公布,……为什么操作系统不能屏蔽底层的架构(arm,x86,mips)嗯,想了想,也就web浏览器有点接近这个意思了,不过运行权限就太低了你所说的屏蔽,就是上层做封装,但是封装以后带来的就是性能问题,比如安卓,如果你的代码全部用java写,……Redmi10海外正式发布,5000mAh电池康宁大猩猩玻璃近年来红米的市场表现不用多说,销量和口碑都很不错。小米能在短时间内取得全球销量第二,荣登欧洲市场销量第一的宝座,有一半都是子品牌红米的功劳。红米凭借着自身超高的性价比赢得了不少……科大讯飞消费者业务品牌全新升级AI助你超越所能8月24日,科大讯飞消费者业务发布全新品牌主张,发布全新业务宣言AI助你超越所能。基于展示科大讯飞围绕办公、学习、生活等场景,为大众用户提供易用、高效的AI产品和服务的宣传片《……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网