CDA数据分析师出品 【导语】:今天我们教你用Python画出当下最火的疫情直观图,Python技术部分可以直接看第四部分。 近日,新冠肺炎防控成果的好消息不断。 Showmedata,用数据说话 今天我们聊聊惊艳的疫情直观图 点击下方视频,先睹为快: 据国家卫健委数据统计,截止至3月10日24时,31省区市累计治愈出院病历超6万,达到61475例。 3月10日,随着江夏方舱医院和武昌方舱医院“休舱大吉”,武汉14家方舱医院全部休舱。 截止到3月12日24时,全国13地连续16天及以上无新增新冠肺炎确诊病例。 看来春天真的是来了,疫情好转的势头已经愈发明显。想必许多小伙伴也一样,越来越期待摘下口罩的那天,出门玩耍,出游踏青,吃起火锅唱起歌。 不过C君在这里也要提醒大家,多地病历0新增不代表零风险,一定要绷住,不要过早的松懈!继续戴好口罩,做好个人防护,避免人群聚集,相信摘下口罩的那天也就不远啦! 01: 这道彩虹真赞! 疫情直观图火了 与此同时,最近刷遍微博的这个疫情直观图火了!来自央视新闻官微的这个图一经发出就令人惊艳,彩虹的配色,直观的展现出目前全国多地病例0新增的数据。 一时间这道彩虹真赞的话题在微博上阅读达到2。6亿,讨论3。4万。大家在欣喜疫情好转的同时,都在问这个图叫什么呀?真太惊艳了。 微博上也出现了各种解答,有的说是饼图,扇形图,甚至还有的说是蜗牛图,漩涡图的其实准确的来说,这个图叫做南丁格尔玫瑰图。 02: 享誉全球的白衣天使 佛罗伦斯南丁格尔 南丁格尔玫瑰图(Nightingalerosediagram)又名鸡冠花图、极坐标区域图。统计学家和医学改革家佛罗伦斯南丁格尔(FlorenceNightingale)曾在克里米亚战争期间使用这种图表传达士兵身亡情况,故得名。 说起南丁格尔玫瑰图,就不得不聊一聊它的发明者,世界上第一个真正的女护士弗罗伦斯南丁格尔。 弗罗伦斯南丁格尔是著名的英国护士和统计学家,于1820年5月12日出生于意大利一个来自英国上流社会的家庭。南丁格尔在德国学习护理后,曾往伦敦的医院工作。于1853年成为伦敦慈善医院的护士长。 19世纪50年代,英国、法国、土耳其和俄国进行了克里米亚战争,当时英国战士的死亡率高达42。南丁格尔主动申请,她和38名女性志愿者护士的工作人员,前往战地医院服务。 到达战地医院后,南丁格尔克服种种困难,改善医院后勤服务和环境卫生,建立医院管理制度,提高护理质量,使伤病员死亡率从42,急剧下降到2。同时南丁格尔不仅表现出非凡的组织才能,而且对伤病员的关怀爱护感人至深。因此她也被称为被称为“克里米亚的天使”;南丁格尔经常在黑夜中提灯巡视病房,又被誉为“提灯女士”(TheLadywiththeLamp)。 由于南丁格尔的贡献,让昔日地位低微的护士,社会地位与形象都大为提高,成为崇高的象征。“南丁格尔”也成为护士精神的代名词。 03: 数据可视化先驱 南丁格尔玫瑰图 除了出色的医护才能,南丁格尔也有很强的数学天分,这也让她在之后成为视觉表现和统计图形的先驱。 在克里米亚的战地医院工作时,她分析过堆积如山的军事档案,发现在克里米亚战役中,英军死亡的原因是在战场外感染疾病,及在战场上受伤后缺乏适当护理而伤重致死,真正死在战场上的人反而不多。 由于当时资料统计的结果往往不受人重视,她发展出一种色彩缤纷的图表形式南丁格尔玫瑰图,让数据能够更加让人印象深刻。她用这个图标来表达军医院季节性的死亡率,向不会阅读统计报告的国会议员,报告克里米亚战争的医疗条件。 左下说明简译 各色块圆饼区均由圆心往外的面积来表现数字 蓝色区域:死于原本可避免的感染的士兵数 红色区域:因受伤过重而死亡的士兵数 黑色区域:死于其它原因的士兵数 1854年10月、1855年4月的红黑区域恰好相等 1856年1月与2月的蓝、黑区域恰好相等 1854年11月红色区域中的黑线指出该月的黑色区域大小 正是这种清晰易懂的数据展现形式,改变了当时包括维多利亚女王在内的高层人士的认知,导致他们做出医事改革的决策。 普通柱形图的坐标系是直角坐标系,而南丁格尔玫瑰图的坐标系是极坐标系,使用圆弧的半径长短表示数据的大小。比起一般的柱状图,它要更有冲击性,是非常一目了然的统计图。 用例 那南丁格尔玫瑰图都有哪些用例呢? 除了对比不同分类的大小,如各国制造指数的对比: 图源:https:antv2018。alipay。comzhcnvischartrose。html Facebook和Twitter的用户对比: 图源:http:thenextweb。comsocialmedia20101220facebookvstwitterbythenumbersinfographic 还可以用于表示披头士歌曲的音调。 图源:http:ritholtz。com201202thebeatlessongkeys 还有最近火了的全国各地0新增彩虹图。 04: 教你用Python画出 南丁格尔玫瑰图 那么你想知道,怎么才能做出如此惊艳的南丁格尔玫瑰图吗? 常见的方法有用Excel,然而做起来过程繁琐还还原度低。 要知道,万物皆可Python。 除了用Excel,今天C君就来教教你,怎么用Python做南丁格尔玫瑰图,保证高还原度: 左图是原图,右图是用pyechart做的。 具体步骤如下: 我们使用pyecharts包进行南丁格尔玫瑰图的绘制,如果你没有安装pyecharts,可以使用以下代码进行pip安装。 pipinstallpyecharts 南丁格尔玫瑰图和饼图类似,算是饼图的一种变形,用法也一样,主要用在需要查看占比的场景中。 首先需要导入我们需要使用的包,其中pandas用于数据整理,pyecharts用于绘图。 pd pyecharts。Pie opts 然后准备需要的数据,所用信息来自于国家卫健委官方网站,整理之后的数据使用列表的形式进行存储,其中provinces存储省份名称,num存储确诊病例连续多日零新增的数字,colorseries列表存储颜色用于后续的绘图使用。 〔北京,上海,黑龙江,吉林,辽宁,内蒙古,新疆,西藏,青海,四川,云南,陕西,重庆, 贵州,广西,海南,澳门,湖南,江西,福建,安徽,浙江,江苏,宁夏,山西,河北,天津〕 〔1,1,1,17,9,22,23,42,35,7,20,21,16,24,16,21,37,12,13,14,13,7,22,8,16,13,13〕 〔FAE927,E9E416,C9DA36,9ECB3C,6DBC49, 37B44E,3DBA78,14ADCF,209AC9,1E91CA, 2C6BA0,2B55A1,2D3D8E,44388E,6A368B 7D3990,A63F98,C31C88,D52178,D5225B, D02C2A,D44C2D,F57A34,FA8F2F,D99D21, CF7B25,CF7B25,CF7B25〕 接下来使用pandas对数据进行降序排列以方便后续的绘图,并提取数据。 创建数据框 pd。DataFrame({:provinces,:num}) 降序排序 df。sortvalues(,ascendingFalse,inplaceTrue) 提取数据 df〔〕。values。tolist() df〔〕。values。tolist() 最后使用Pyecharts库中的Pie类进行图形的绘制,代码说明如下,其中的配置项可以在pyecharts官网https:pyecharts。org 进行查看。图形生成在本地的html网页中。 实例化Pie类 pie1Pie(initoptsopts。InitOpts(1350,750)) 设置颜色 pie1。setcolors(colorseries) 添加数据,设置饼图的半径,是否展示成南丁格尔图 pie1。add(,〔list(z)zip(v,d)〕, radius〔30,135〕, center〔50,65〕, ) 设置全局配置项 pie1。setglobalopts(titleoptsopts。TitleOpts(玫瑰图示例), legendoptsopts。LegendOpts(isshowFalse), toolboxoptsopts。ToolboxOpts()) 设置系列配置项 pie1。setseriesopts(labeloptsopts。LabelOpts(isshowTrue,,fontsize12, {b}:{c}天,, ,MYaH ), ) 生成html文档 pie1。render(南丁格尔玫瑰图。) 生成的图如下: 最后,再自己加一下中间的字就大功告成,对比一下原图,是不是还原度很高呢? 结语: 怎么样,用Python作玫瑰图你学会了吗? 最后C君还是要提醒大家一下,虽然目前疫情转好,但大家一定不能掉以轻心!坚持做好防护哦,奥利给! 参考资料: 弗洛伦斯南丁格尔维基百科介绍 https:zh。wikipedia。orgwikiE5BC97E7BE85E580ABE696AFC2B7E58D97E4B881E6A0BCE788BE 南丁格尔玫瑰图为敬畏生命而生 https:mp。weixin。qq。comsUJhgZ0YXyrcvw9m0nyrVGQ 非常惊艳的南丁格尔玫瑰图 https:mp。weixin。qq。comsAswdxDN6mk0NYzsvqAPRw https:understandinguncertainty。orgcoxcombs 作者:Mika