游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

Python数据分析,办公自动化,数据表如何做拼接与连接?

  日常数据分析中,需要将多个表进行合并,包括表的纵向拼接以及表的横向连接,将多个小表组合成为一张大表,使用的方法有Excel中的Vlookup函数法,SQL中UNION和JOIN的方法,以及Pandas模块中的函数。
  使用VLOOKUP函数,指定条件在指定区域直方向查找数据。
  VLOOKUP函数的公式如下:VLOOKUP(lookupvalue,tablearray,colindexnum,rangelookup)
  匹配张三的语文、数学、英语成绩使用VLOOKUP函数演示。
  VLOOKUP函数动态演示
  在SQL中,对于多张表的纵向拼接,使用UNION或UNIONALL关键词,对于多张表横向连接,使用INNERJOIN或者LEFTJOIN即可。
  在Python,Pandas模块中append函数和concat函数可以对表格做纵向合并,merge函数可以对表格横向连接。其中,append函数只能在行方向进行拼接,concat函数可以在行方向或列方向进行内联或外联拼接操作,默认行拼接,取并集,merge函数可以在行方向或列方向进行拼接,默认列拼接,取交集。
  本文详细介绍Pandas模块中append函数、concat函数和merge函数,使用案例数据进行代码演示,下面一起来学习。
  本文来源于公众号:大话数据分析。一、表格纵向拼接
  1、append函数
  append函数的语法如下:df。append(other,ignoreindexFalse,verifyintegrityFalse,sortNone)
  函数的参数说明如下:other:DataFrame、series、dict、list等数据结构;ignoreindex:默认值为False,若为True则不使用index标签;verifyintegrity:默认值为False,若为True,当创建相同的index时会抛出ValueError的异常;sort:默认None,若为True时,进行排序。
  append函数的使用方法如下:
  构建一个DataFrame数据集,表示为df1和df2。df1pd。DataFrame(〔〔11,12〕,〔13,14〕〕,columns〔二班,一班〕,index〔优,良〕)df1
  df2pd。DataFrame(〔〔15,16〕〕,columns〔二班,三班〕,index〔差〕)df2
  使用append函数拼接,不排序。df1。append(df2,sortFalse)
  sortTrue,进行排序。df1。append(df2,sortTrue)
  ignoreindexTrue去除索引。df1。append(df1,ignoreindexTrue)去除索引
  2、concat函数
  concat函数的语法如下:pd。concat(objs,axis0,joinouter,jokinaxesNone,ignoreindexFalse,keysNone)
  函数的参数说明如下:objs:指定需要合并的对象;axis:拼接轴方向,默认为0,沿行拼接;若为1,沿列拼接;join:默认外联,拼接另一轴所有的label,缺失值用NaN填充;joinaxes:指定需要拼接轴的labels,可在join既不内联又不外联的时候使用;ignoreindex:对index进行重新排序,默认为False,若为True,则表示忽略原索引并生成新索引;keys:多重索引,便于区分来源表;sort:按值排序。
  concat函数的使用方法如下:importpandasaspdimportdatetime
  构建一个DataFrame数据集,表示为df1和df2。构造数据集df1df1pd。DataFrame({用户ID:〔1001,1002,1003,1004,1005,1006〕,日期:pd。daterange(datetime。datetime(2021,3,26),periods6),城市:〔北京,上海,广州,上海,杭州,北京〕,年龄:〔23,44,54,32,34,32〕,性别:〔F,M,M,F,F,F〕,成交量:〔3200,1356,2133,6733,2980,3452〕},columns〔用户ID,日期,城市,年龄,性别,成交量〕)df1
  构造数据集df2df2pd。DataFrame({用户ID:〔1007,1008,1009〕,日期:pd。daterange(datetime。datetime(2021,3,1),periods3),城市:〔北京,上海,广州〕,年龄:〔33,34,34,〕,成交量:〔4200,3356,2633〕},columns〔用户ID,日期,城市,年龄,成交量〕)df2
  使用concat函数拼接,keys为合并后的数据添加新索引,用于区分各个数据部分sort按照列名排序。数据集的纵向合并dfpd。concat(〔df1,df2〕,指定需要合并的对象keys〔df1,df2〕,为合并后的数据添加新索引,用于区分各个数据部分sortTrue按照列名排序)df
  level0将第一列的索引列转换为变量。将第一列的索引列转换为变量df3df。resetindex(level0,inplaceFalse)df3
  rename将第一列的索引列转换为变量后然后重命名。变量重命名df3。rename(columns{level0:数据集},inplaceTrue)df3
  拼接成新的数据集后,发现行索引还是原来的,不直观,这是使用两种方法进行修改,一种是使用index的方法。重新调整行索引df3。indexrange(df3。shape〔0〕)df3
  另一种当ignoreindexTrue,对index进行重新排序。重新调整行索引dfpd。concat(〔df1,df2〕,sortTrue,ignoreindexTrue)df
  二、横向连接
  1、merge函数
  merge函数的语法如下:pd。merge(left,right,howinner,onNone,leftonNone,rightonNone,leftindexFalse,rightindexFalse,sortFalse,suffixes(x,y),copyTrue,indicatorFalse,validateNone)
  函数的参数说明如下:leftdata、rightdata:需要合并的两部分数据;on:连接键,当两个表的连接键名一样,可以直接用on,而不用lefton和righton,可以是单键或多键;lefton、righton:如果两个表键名不一样,则分别指出,可以是单键或多键;suffixes:如果两边键名相同,要做区分,可以使用此参数指定区分格式,如suffixes(leftx,righty);how:指定连接方式,分为inner、left、right、outer;
  merge函数的使用方法如下:importpandasaspdimportdatetime
  构建一个DataFrame数据集,表示为df1和df2。构造数据集dfdf1pd。DataFrame({用户ID:〔1001,1002,1003,1004,1005,1006〕,日期:pd。daterange(datetime。datetime(2021,3,26),periods6),城市:〔北京,上海,广州,上海,杭州,北京〕,年龄:〔23,44,54,32,34,32〕,性别:〔F,M,M,F,F,F〕,成交量:〔3200,1356,2133,6733,2980,3452〕},columns〔用户ID,日期,城市,年龄,性别,成交量〕)df1
  构造构造列名不同的df2df2pd。DataFrame({id:〔1001,1002,1003,1004,1005,1006,1007,1008,1009,1010〕,平台:〔京东,淘宝,京东,天猫,唯品会,苏宁,天猫,淘宝,美团,拼多多〕,收入额:〔100000,320000,240000,445000,340000,640000,300000,460000,540000,230000〕},columns〔id,平台,收入额〕)df2
  首先构建了两个连接键列名不同的数据集,需要分别指定lefton和righton进行连接,此处howleft是左连接。将df1和df2连接起来merge1pd。merge(leftdf1,rightdf2,howleft,lefton用户ID,rightonid)merge1
  构造列名相同的df2,都有一个用户ID的列名。构造列名相同的df2df2pd。DataFrame({用户ID:〔1001,1002,1003,1004,1005,1006,1007,1008,1009,1010〕,平台:〔京东,淘宝,京东,天猫,唯品会,苏宁,天猫,淘宝,美团,拼多多〕,收入额:〔100000,320000,240000,445000,340000,640000,300000,460000,540000,230000〕,日期:pd。daterange(datetime。datetime(2021,3,1),periods10)},columns〔用户ID,平台,收入额,日期〕)df2
  因为都有一个用户ID的列名,所以此处左连接时,不用分别指定左右键名,只需要用on指定就好。指定用户ID连接merge2pd。merge(leftdf1,rightdf2,howleft,on用户ID)merge2
  suffixes对于重复的列名修改,作区分。重复列名处理merge2pd。merge(leftdf1,rightdf2,howleft,on用户ID,suffixes〔,1〕)merge2
  通常表格拼接完成后,数据预处理后就可以对数据做分析了,对于数据分析所需要的的字段分析。dfmerge2〔〔用户ID,日期,城市,成交量,收入额〕〕df
  查看字段的属性。df。info()
  做收入额的条形图。df〔收入额〕。plot(kindbar)

王萌黎三千鸦杀今日开播公主玄珠绝美登场今日,由回宇导演执导,郑业成、赵露思、王萌黎、刘怡潼、蒋依依等主演的古装剧《三千鸦杀》火热献播,该剧根据十四郎同名畅销小说改编,讲述了燕国的热血公主覃川为复国,改名字、练仙法,……王萌黎三千鸦杀饰演玄珠与赵露思刘怡潼剧组搞怪合影星关系3月13日讯由芒果TV与新力量影视文化有限公司出品,金牌制片陆国强担任总制片人,回宇导演执导的古装剧集《三千鸦杀》已于象山开机。该剧由郑业成、赵露思、刘怡潼、王萌黎等主演……很适合年轻人的3款SUV,颜值高动力强,都是国产尖货文车魔王原创随着越来越多年轻人购买力的提升,整个汽车市场的消费年轻化趋势已经不可逆转。而摆在众车企面前的,如何尽快迎合这部分年轻消费者的购车需求自然是重中之重。当然,我们……大江大河2叙写时代变迁和光同尘精神再奏鸣理想照耀中国国家广电总局庆祝中国共产党成立100周年电视剧展播剧目,由上海广播电视台、正午阳光、SMG尚世影业出品,改编自作家阿耐的小说《大江东去》,唐尧任编剧,马骋怡任联合编……我在他乡挺好的,你呢?我有时候觉得,生活好像在故意为难我。上周北京大雨,公司让在家办公,但是偏巧小区旁边的酒店在装修,工人师傅叮叮哐哐的声音吵得我一个字也写不出来。更令人生气的是,平时好……大江大河2搏浪青年挺过难关能人时代降临振奋事业理想理想照耀中国国家广电总局庆祝中国共产党成立100周年电视剧展播剧目,由上海广播电视台、正午阳光、SMG尚世影业出品,改编自作家阿耐的小说《大江东去》,唐尧任编剧,马骋怡任联合编……在嵌入式linux系统下修改uboot环境变量工具fwpri作为用户来说,不可能每次启动都先在uboot命令行下通过setenv、saveenv来修改传入kernel的环境变量,因此uboot提供了fwprintenv工具来让用户在文件……董子健大江大河29。3分居2020年国产剧第一杨巡今晚上线智由李雪、黄伟执导,孔笙任艺术总监,侯鸿亮担任制片人,王凯、杨烁、董子健、杨采钰领衔主演的《大江大河2》正在东方卫视、浙江卫视黄金档热播中。该剧自12月20日开播以来连续双台收视……电视剧闪光少女官宣原班幕后全新人主演惹期待!星关系10月19日讯电影《闪光少女》上映后口碑不俗,堪称青春片典范。近日,由爱奇艺出品,留白影业、壹线影业联合出品,鲍鲸鲸编剧、王冉执导的爱奇艺自制剧《闪光少女》正式官宣。主演……别克英朗用车体验10万拥有20万的越级品质,的确香一碗正宗羊肉汤,想了不知有多久。趁着这回国庆长假,刚好遇上英朗试驾体验的机会,于是决定开着英朗带家人自驾回老家,深度体验英朗的同时,顺便探望在老家的父母亲友,也安慰一下想念家乡……创造营2021周震南说何圳煜是一张有质量的白纸在3月3日《创造营2021》节目中,舞台第一次公演全面展开,除了选手们开着大招享受着舞台的每分每秒之外,几位评委也抓住时机挑选心仪的队伍。在赞多带领的《yummy》组成员里,何……赖雨濛雷霆战将开播铿锵玫瑰热血开战炽燃青春,热血之战。由金沙执导,张云龙、高伟光、赖雨濛等领衔主演的抗日战争剧《雷霆战将》已于近日举办了发布会,于不久在湖南卫视正式开播,芒果TV、爱奇艺、腾讯视频同步播出。该剧……
适合JAVA初学者看的书籍21天学通JavaPDF拿走不谢内容提要本书是初学者学习Java编程语言的畅销经典教程,循序渐进地介绍了Java编程语言知识,并提供了丰富的实例和练习;同时全面涵盖了Java8这一新标准以及与Andro……一分钟看天下潮商2021。08。11腾讯实习生要求总裁杜绝陪酒文化,刘炽平:我们和阿里不一样,对性骚扰持零容忍态度8月11日消息阿里巴巴女员工被侵犯事件在近期引发了全网讨论,进而推动目前其他的几个头部互联网……他其实没有那么爱你全阵容首亮相为爱而来寻我良人星关系10月10日讯近日,由北京爱奇艺科技有限公司,新丽电视文化投资有限公司联合出品的都市情感大剧《他其实没有那么爱你》发布了十二位主演剧照,首次曝光阵容。该剧由李莅樱担任总制……一本好书第二季首播重读红岩不仅是丰碑更是一面镜子星关系10月9日讯周一晚八点,《一本好书》第二季携文学经典《红岩》如约归来。节目通过电影级的呈现见证了英雄的初心,网友大呼看了第一期,被那些英雄人物的热血无畏感动到了。这……号手就位首发角色海报陈星旭凛凛军装眼神坚毅星关系10月9日讯近日,我国首部火箭军题材电视剧《号手就位》发布首批角色海报,因《东宫》被观众所熟知的青年演员陈星旭参与主演该剧,在剧中饰演火箭军士兵欧阳俊。海报中,陈星旭全副……程枫不负时光发型受瞩目温润贵公子秒变钢丝球星关系10月9日讯由安悦溪、邢昭林、朱颜曼滋、程枫领衔主演的2019青春奋斗梦想进阶必修手册《不负时光》正在爱奇艺、腾讯视频热播中。剧中,程枫饰演的吴彧与李校(安悦溪)、周子墨……徐梦洁极限17扣杀暖心收官元气彩虹演技获赞狂圈粉星关系10月9日讯由张荣吉指导,朱致灵、徐梦洁、邱虹凯共同主演的青春运动励志剧《极限17扣杀》现已收官。该剧自开播以来,凭借细腻刻画的人物形象和热血拼搏的真实青春吸引大批观众。……美院士一语中的,雷军官宣正式开始对标苹果在华为遭遇到断芯之前,在国内高端手机市场上,华为已经成功压制住了苹果,并且全球手机出货量紧随三星之后,已经成为全球数一数二的手机品牌。然而短短一年多的时间,华为的市场份额就已经……看熙游记Vlog汪小敏88层高空自拍姿势你get了吗?一天24小时,能做什么?早晨或许可以在游园射箭,飒爽英姿展露无遗;饭后或许可以在小屋和闺蜜起舞,热热闹闹温馨无比;午后或许可以接受一次战战兢兢的高空挑战,突破自己,遇见不一样的……魏健隆悍城反派角色获认可辛夷撕暖怂女友控标签星关系10月22日讯备受期待的动作悬疑网剧《悍城》,以于上周强势上线。这部剧是一部涉及跨国缉毒的原创悬疑、动作、警匪剧,演员演技在线,剧情悬念丛生,播出一周后收获了一众的网友好……佩戴助听器后,能听清电视和电话的声音吗?你好!首先是否佩戴助听器后能否听清电视和电话的声音、要看听患者的听觉功能的辨别能力,听患者的时间比较长且听力比较严重的、想要听清楚电视和电话的声音就会有一定的难度、可以结合字幕……邹敦明善始善终圆满收官警服加身正义凌然星关系9月19日讯昨晚,由宋凯导演执导,何东、张帆编剧,秦俊杰、孙铱、邹敦明等实力演员领衔主演的2019年缉毒案件刑侦大剧《善始善终》在爱奇艺平台迎来会员收官。该剧讲述了警察方……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网