纠纷奇闻作文社交美文家庭
聚热点
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

在R中用箱形图做组间比较

1月1日 圆通道投稿
  来源:丁点帮你
  作者:丁点helper
  之前的文章讲了如何用R绘制箱形图,以此来帮助我们了解数据的整体分布情况、是否存在异常值。除此之外,箱形图还可以进行数据的组间比较。分组变量的数据清理
  多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。
  本次我们用到的是学生的课堂调查数据,包括了性别、年级、专业、身高、最喜欢的动物(讲数据清理时用的是这个变量,还记得吗)等变量。数据名:survey。csv,数据链接:
  首先导入数据,存入survey这个数据集中:surveyread。csv(UsersDesktopsurvey。csv,headerTRUE)获取数据中包含的变量名names(survey)〔1〕ClassProbStatusYearDivisionGenderHtCmHandHaircutExercise〔10〕CourseworkWebTVSocialEconAnimalFriendsPulse
  接下来我们以Gender作为分组依据,先来看看这个变量的情况。table(surveyGender)ChoosenottoanswerFemaleGendernonconformingMale111171118
  我们发现,除了female和male,有的同学回答了Choosenottoanswer,Gendernonconforming,还有同学什么都没填,空缺。
  今天我们暂时将这三种特殊情况从数据中删去。查看针对Gender这个变量,同学们有几类回答levels(surveyGender)〔1〕ChoosenottoanswerFemaleGendernonconformingMale
  在这五类回答中,我们想保留的是第3、第5类。也就是说,仅保留Gender为Female或Male的记录。把更新后的数据存储在survey2这个对象中survey2survey〔surveyGenderinlevels(surveyGender)〔c(3,5)〕,〕
  这里,ainb的作用是,用a中的元素去匹配b中的任意元素,如果匹配成功,则返回结果为TRUE,反之,则结果为FALSE。
  此时,上面的语句就简化为如下所示,c()里面是TRUE和FALSE的集合,是a中每个元素与b匹配的结果。survey2survey〔c(),〕这是为了便于理解写的简化语句,不能够运行的
  survey2中仅保留了匹配结果为TRUE的记录:table(survey2Gender)ChoosenottoanswerFemaleGendernonconformingMale001170118
  哎?虽然记录被删了,但Gender中之前包含的五个类都还在,用下面的droplevels()这个函数删掉那些没有记录的类。survey2Genderdroplevels(survey2Gender)table(survey2Gender)FemaleMale117118绘制整体和各组数据的箱形图
  多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。
  数据清理好之后,我们以身高HtCm这个变量为例,先用之前讲过的方法绘制箱形图,了解改变量的整体分布,然后对比性别之间的身高差异。boxplot(survey2HtCm,mainBoxplotofHtincm,colorange,lwd2)
  一目了然,我们调查的是大学学生,却出现了身高小于100厘米的情况,不符合常理。现在去检查一下原始数据。sort(survey2HtCm)将身高从小到大排序
  部分结果截图
  实际操作中,大家要尽量核实那些极端身高数据的真实情况,修正数据。这里我们为便于教学,直接把那些小于100厘米的身高值记录为缺失。
  然后利用整理后的身高数据绘制箱形图。survey2HtCm〔survey2HtCm100〕NAboxplot(survey2HtCm,mainBoxplotofHtincm,colorange,lwd2)
  最后绘制不同性别学生的身高箱形图。boxplot(survey2HtCmsurvey2Gender,mainBoxplotofHtincm,colc(2,3),lwd2)
  由图可知,男生的身高基本都高于女生。将两个箱形图放在一起,可以清晰地看到两组变量的大致情况,便于给两组做粗略的比较。
  但是这男女生身高到底有没有统计学上的差异,肉眼是很难得出结论的,统计学上怎么做呢?
投诉 评论 转载

腾讯阿里融冰,互联网迎来新时代?外链取消这一事件上,市场对腾讯、阿里、头条等巨头的关注颇高,伴随着外链破冰,中国互联网行业或将迎来新时代。文丨BT财经Han反垄断大潮滚滚向前,巨头们昔日筑起互相屏……人生感悟论文2600字每个人的人生都有不同的路要走,至于怎样走?并且走好它?那就是每个人需要斟酌的,因为你就是导演未来怎么演,未来怎么变,都要看你自己的。下面是一篇人生感悟的论文,供大家参考。……为什么现在5G网络感觉跟以前4G差别不大?5G网络发布时各路专家吹的是天花乱坠,说什么速度是4G的100倍,低延迟,延迟为1ms左右,还有万物互联等等,结果现在是一地鸡毛,感受起来和以前4G网络差别不大,而且更贵了。……腾讯年薪75万的程序员竟比不上深圳普通中学老师的工资?近日,有网友在网络上晒出了一张深圳普通中学老师的工资单,秒杀大多数互联网的程序员们,引起大家的讨论。这个帖子一出,尤其是一想到对方还有寒暑假,让不少程序员羡慕不已:虽然比……雷军十个艰难抉择究竟是啥?十年米粉一锤定音,都有这些小米创始人、小米集团集团董事长兼CEO雷军预报将于8月10日公布小米MIX4、小米平板5等旗舰级新产品。与此同时,这一场新品发布会也是一次演讲会,雷军将要举办自己本年度演讲会。……磷酸铁锂安全性高,为何新能源车企更喜欢用三元锂?电动车永远离不开的三大话题:续航、充电和电池。随着时间的迁移,大多数主流电动车更新迭代,其续航能力和充电速度都有一定的提升,唯独是电池安全问题一直是电动车的痛点。近……腾讯的星辰大海腾讯几乎涉及互联网任何一个领域,它在将来会不会真的干掉百度和阿里巴巴很长的时间里,我们谈论各个互联网巨头们,提到搜索时是百度,电商是阿里,短视频是抖音等等,这是很长的时间……对马云应该学习还是否定?中国移动互联网有五条金花,华为,阿里,大疆,抖音,支付宝,代表着中国移动互联网的最高水平,马云就创建了两个。华为的5G标准,代表了中国的最高标准,也代表了世界最高的标准,……在R中用箱形图做组间比较来源:丁点帮你作者:丁点helper之前的文章讲了如何用R绘制箱形图,以此来帮助我们了解数据的整体分布情况、是否存在异常值。除此之外,箱形图还可以进行数据的组间比较……助听器戴上后觉得头晕是怎么回事?如果头晕严重,建议先不要戴了,建议去购机的验配中心进行调试。患者戴助听器后出现头痛、头晕主要是助听器输出的声音超过了患者的不适阈。我们正常人的不适阈是120140dBSP……追赶中韩厂商推进海外找矿日本拟扩大车载蓄电池产能据共同社网站报道,日本政府已开始讨论设定2030年前后日企生产蓄电池的目标。报道表示,蓄电池对于普及纯电动汽车不可或缺。近年来中韩厂商发展迅猛,日企已逐渐失去以往的优势。……小米要做世界第一,荣耀想做中国第一,谁的目标更容易实现?小米与荣耀,狭路再次相逢。随着小米MIX4与荣耀Magic3系列接连发布,两者在高端市场的竞争更激烈了。值得一提的是,如今荣耀与小米,争抢的几乎都是华为空出来的市场空间。虽然华……
九龙戏珠188万中国四大名石之浙江青田石图看精品青田石雕短板不只是芯片,工业软件被外资垄断,1974亿中国市场拱手于2020年国产手机厂商集体冲击高端,都高在哪?15万级别买新能源汽车,你可以看看零跑C11蔚来一月销量同比劲增352。1交付7225辆创历史新高科学算命中的大数据应用被誉为世界第八大奇迹的人工天河红旗渠背后有什么的故事?浅析大学生创业教育论文AI生成的代码可信吗?编写的代码有Bug吗?也该抽空看看电视节目放轻松,当贝盒子H1评测全系插混?宝马XM动力参数曝光最高750马力自动驾驶终极挑战,AutoX发布全球首个城中村晚高峰完全无人
体验洗碗饭后吃水果加重身体负担吃水果有讲究别犯这些错误延长侦查羁押期限文书怎么写?必须夯实公民社会的基础【歌词】(川普搞笑)17岁之骗子校歌手:搞笑翻唱四热传聚热点 感恩有你们卡萨帝厨电引领3。0智慧厨房时代五年级工作计划泰星平彩娜能源企业竞相布局氢能产业我国已累计建成加氢站超过250座我学会了煮茶叶蛋防儿童噎到这些食物别给孩子吃

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形