游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

从零开始学R数据分析,数据筛选与提取

  通常从系统中导出的数据字段有很多,并不是所有的字段都能用于数据分析中,这时候为了提高运算的速度,以及节省运算内存,需要筛选一些我们数据分析实际使用到的数据字段,通常筛选出数据字段后还需要做聚合运算,例如EXCEL中countif,sumif的用法,那么这些方法如何在R中使用呢?下面一起来学习。示例工具:Rx643。5。3、RStudio
  本文讲解内容:数据筛选与提取
  适用范围:数据筛选、多条件计数、多条件求和
  本次内容的学习需要先创建一组数据集,数据内容包含ID、NAME等五个字段,数据结果如下。手动创建数据表datadatadata。frame(IDc(c001,c002,c003,c004,c005,c006,c007,c008,c009,c010),NAMEc(Rmesh,Khilan,Kaushik,Chaitali,Hardik,Komal,Tom,Muffy,Susan,Kevin),AGEc(23,20,23,25,27,24,26,31,26,30),ADDRESSc(Ahmed,Delhi,Kota,Mumbai,Bhopal,MPA,MPB,Indore,JPNo。1,JPNo。2),SALc(2000,1500,2000,5000,8500,6500,5500,9500,7000,9000))
  1数据筛选
  在R中数据筛选使用subset函数进行筛选,在subset函数的参数中添加逻辑运算和筛选条件,例如筛选条件等于、不等于、大于、小于,逻辑运算与、或、非的条件,这里用双等于号表示等于,如筛选名字中为Kevin的行,筛选结果如下所示:数据筛选subset(data,dataNAMEKevin)
  筛选名字中不包含Kevin的行,不等于号用!表示,筛选结果如下所示:按非条件进行筛选subset(data,dataNAME!Kevin)
  subset函数可以添加多个条件,使用与的条件时用符号连接起来,这里筛选年龄大于25且收入大于8000的行记录,结果如下:按与的条件筛选subset(data,dataAGE25dataSAL8000)
  如果是或的条件,用符号表示,筛选年龄大于25岁或者收入大于8000的行记录,筛选结果如下所示:按或的条件筛选subset(data,dataAGE25dataSAL8000)
  2数据提取
  数据提取一般有三种方法进行提取,即按位置提取、按索引提取和按条件提取,在pandas中类似于loc和iloc的用法,可以按照位置、按照列索引以及添加筛选条件进行数据提取。
  按位置提取数据使用中括号〔〕,在中括号中逗号前提取的是行,逗号后提取的是列,要提取第一行数据结果如下:提取数据表第一行data〔1,〕
  要提取第一行到第五行的数据,在中括号中提取行1:5,逗号后面提取列可以不写,默认即可。提取数据表第一行至第五行data〔1:5,〕
  提取数据表中第五列数据,省略逗号前行提取,直接写逗号后的列值即可。提取数据表第五列data〔5〕
  提取第三列到第五列,逗号前的行提取默认不写,在逗号后的列提取第三列到第五列即可,提取结果如下:提取数据表第三列至第五列data〔,3:5〕
  如果同时提取行和列,比如提取第三行第五列的数据,可以在逗号的前面和后面分别写上行数和列数。提取数据表第三行第五列data〔3,5〕
  提取特定的数据区域,可以使用:冒号来提取,行和列的位置不变,只需要改变数据区域的大小即可。提取数据表特定区域数据data〔1:3,1:3〕
  按索引提取数据,这里分为按照行索引提取和列索引提取,需要提取的行索引和列索引用引号括起来,如下提取第三行的数据。按索引提取行数据data〔3,〕
  如果按照索引提取多行,需要用括号括起来,在中括号中逗号前的位置用于提取行,逗号后的位置用于提取列,与按位置提取数据方法一致。按索引提取多行数据data〔c(3,5),〕
  按照列名提取数据,需要将列名用括号括起来即可。按列名称提取data〔NAME〕
  需要提取特定行和特定列的数据,中括号中写上行索引和列索引即可。按索引提取行与列数据data〔4,NAME〕
  提取多个行与多个列数据,需要用括号将行索引和列索引括起来。按索引提取多个行与列数据data〔c(2,4),c(NAME,SAL)〕
  除了按位置和按索引提取数据,还有一种方法是按条件提取数据,使用which函数,后面加特定的聚合条件,比如这里提取薪水最高的行记录。查找薪水最高的所在行data〔which。max(dataSAL),〕
  同理,提取薪水最低的行记录。查看年龄最小的所在行data〔which。min(dataAGE),〕
  3聚合运算
  筛选数据以及提取特定数据区域后,可以对这部分数据做聚合运算,与Excel中的筛选功能和countif和sumif功能相似,而countifs和sumifs是多条件计数和多条件求和。
  对年龄大于25岁以及收入大于8000的薪水多条件求和,使用subset函数数据筛选后,借助sum函数实现多条件求和的功能。Excel中的sumifs()函数求和sum(subset(data,dataAGE25dataSAL8000)SAL)
  多条件计数使用length函数计数。Excel中的countifs()函数计数length(subset(data,dataAGE25dataSAL8000)ID)
  多条件求平均这里使用mean函数,求年龄大于25岁或者收入大于8000的平均薪水,数据结果如下所示。Excel中的averageifs()函数计数mean(subset(data,dataAGE25dataSAL8000)SAL)

为什么越来越多的年轻人使用投影仪而不是电视机?为什么年轻人喜欢用投影仪?除了时代洪流下的个人因素,更是随着科学技术发展与人类需求产生的必然结果。进入后声像媒介时代,家用投影仪必然会取代电视机。这个现象不仅受技术迭代影响,还……IQOO是真的狠!关于骁龙888芯片!一番宣传把友商全得罪了进入到8月之后,各大手机厂商们在旗舰手机中的竞争又进入到了一个白热化阶段。就比如说近期就即将有不少品牌要发布新的旗舰手机。如荣耀的Magic3系列、IQOO8系列等等机型。……紧跟热点!小米宣布向印度奥运获奖运动员赠送小米11Ultra小米向所有印度奥运获奖运动员赠送一台小米11Ultra在本届奥运会快结束的时候,印度运动员NeerajChopra于8月7日为印度赢得了第一枚奥运金牌。至此本届奥运会印度……iPhone手机电池降到80一定要换吗?苹果换电池必须知道的用苹果手机的小伙伴最大的困扰是什么?手机无信号、耗电快续航短,这是毋庸置疑的,今天我们就来谈谈iPhone手机电池的相关内容!iPhone手机电池寿命低于80显示维修状态……华为HarmonyOS2升级用户现破7000万华为HarmonyOS2升级用户现已突破7000万,据介绍,华为HarmonyOS2支持上百款机型的升级,在不久的将来,华为Mate9、P10等机型也将陆续开放升级。8月……刷屏骑手被取消订单后怒砸外卖,你能接受吗今天在热搜上,有个新闻挂了一天。详情说的是,重庆耿先生定了一份外卖,预计1点40分送到。结果到1点46分,骑手打电话来说,商家的蒸笼坏了。到2点10分左右,耿先生没……OPPO子品牌爆发,跑分72万12256GB仅2299元,米一般买小米手机的米粉们,都是喜欢高性价比手机,以往在网上吐槽OPPO和VIVO高价低配的用户,大部分也是来自米粉们,当时OV的手机,在处理器上和小米形成了鲜明的对比,比如在三千……1亿像素主摄手机推荐,最低仅1399元,选这三款准没错今年越来越多的手机开始使用1亿像素主摄,所以不少网友调侃,高像素的方向终于对了。小米被吐槽了2年之后,终于被市场认可了这个方向。1亿像素的优势在于可以拍出更多的细节,即便是被放……更智能更快捷通用将为2024年车型配5G网络《车市零距离》是车市物语旗下自媒体,每天提供最新鲜的汽车零部件和智能网联相关资讯。日前我们获悉,日前我们获悉,通用与美国电话电报公司(AmericanTelephonea……用自己的手机号码拨打自己的手机号码竟然会通,这是怎么回事?一般是忙音,正在通话中。如果你能打通有两个可能:一是号码错误,二是你手机设置了呼叫转移功能中的占线转移。如果自己的手机号码被打通用自己的手机是别人监控你了打自己号码……为什么手机屏幕越做越大?感谢您的阅读!为什么现在手机屏幕越做越大?我觉得主要是有以下几个原因。第1个原因是因为消费者对于大屏幕手机的需求度在不断增加大屏幕能够带来更多的实际体验,不仅……华为官网上架二手机,搭载鸿蒙os,P30售价2799元大家有没有坚果官方商城上架二手手机的,这可以说是闻所未闻的消息,但最近相关消息显示,近日华为商城上架了一批官方认证的二手机产品,主要包括2019年发布的P30系列以及Mate3……
禹童夜天子放大招女诸葛田妙雯和徐海乔擦出火花星关系9月13日讯近日,由徐海乔、禹童主演的《夜天子》正在腾讯视频热播。禹童饰演的田妙雯可谓是文武双全,自出场以来颇受网友关注。而本周让人期待已久的集美貌与霸气于一身的田家大小……橙红年代陈伟霆马思纯吹响正能量号角9月17日两台三网盛大开播星关系9月13日讯由华策克顿旗下宽厚文化出品,公安部金盾影视文化中心联合出品,刘新执导,陈伟霆、马思纯、刘奕君、陈瑶、叶祖新、何明翰领衔主演的热血都市英雄传奇电视剧《橙红年代》……如懿传林澄强势护主好评不断获封金牌辅助称号星关系9月13日讯由周迅、霍建华、张钧甯、董洁、辛芷蕾、林澄等主演的《如懿传》正在热播中,随着剧情的逐步推进,众妃嫔之间的宫斗愈加精彩,饰演嘉妃心腹的林澄也开启了她的最强辅助功……李沁斗破苍穹小医仙上线用心诠释角色力求差异化星关系9月12日讯奇幻励志青春成长剧《斗破苍穹》第一季正式播出后,收视率与播放量节节攀高,相关话题引起热议不断。紧张跌宕的酷燃剧情、暗藏玄机的人物关系以及斗气少年们的热血成长都……景甜火王今晚上线三世虐恋引期待星关系11月26日讯由景甜、陈柏霖主演的电视剧《火王》将于今晚燃情开播。该剧分为古装版《火王之破晓之战》和现代版《火王之千里同风》两部分,讲述了男女主角为守护家园横亘千年,三生……许诗茵登上梦想的声音担音乐体验官为梦想助力星关系11月26日讯浙江卫视励志音乐竞技真人秀《梦想的声音》播出第五期,SING女团成员许诗茵在节目上担任音乐体验官,成为评委席上筑梦团的一员,为参赛选手们的梦想助力。倾……始于颜值忠于品质!全新宝马7系渲染图曝光,有望2022年亮相近日,我们从相关渠道获悉了一组全新宝马7系(参数询价)的渲染图,说起宝马这个品牌,相信很多消费者都是很有共同话题的,毕竟颜值实力都在那摆着,感兴趣的小伙伴一起来了解下吧。……孙红雷暌违三年重返小荧幕再当爹带着爸爸去留学曝概念海报宣布杀星关系11月26日讯近日,由姚晓峰执导,孙红雷、辛芷蕾、曾舜晞、蒋依依领衔主演,刘敏涛、涂松岩、杨玏特别出演,檀健次联合主演的电视剧《带着爸爸去留学》在海外杀青,片方发布首款概……风味人间挑战综艺黄金档浙江卫视今晚播出江湖夜雨星关系11月26日讯从《风味人间》看浙江卫视的纪录片情结,美食探索纪录片《风味人间》自开播以来口碑稳健,豆瓣评分稳定在9。3,其播出平台浙江卫视更是在每周日21:07成为观众与……马伯骞实名表白小S花式被虐承包全场笑点星关系11月23日讯日前,《Beauty小姐》第五期迎来了短发女神小S。在上期节目中马伯骞透露过自己的理想型并实名表白小S。这次终于与女神同台,难以掩饰的激动和害羞。本以为马伯……白百何何她说感性聊遗憾节目外享受生活晒美食星关系11月23日讯白百何《何她说》上线以来,因为探讨不同的社会生活话题引起网友共鸣,而她和工作室的小伙伴也因为因为生活而没有生活这期节目设立的周二生活日,切实践行着用心工作好……我们的四十年记录改革开放讲述历史洪流中的荣耀与决心星关系11月23日讯由王锦担任制片人,王梓执导,庸人编剧,金世佳、柴碧云、李茂、徐小飒、谢芳、钱波、刘亚津、苏国涛、柴鸥、王伟华、馨子、梁佳伟、卢佳、徐薏雯等主演的青春记忆暖情……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网