游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

机器学习在房屋价格预测上的应用

  前言
  Python在机器学习方面有天然的优势,那么我们今天也来涉足一下机器学习方面的技术,以下是在学习过程中的一些笔记,里面有大量的注释说明,用于理解为什么这样操作。
  代码实现如下:NumpyPandasMatplotlibIpythonNumPy(NumericalPython)是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。importnumpyasnpPandas可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征importpandasaspdMatplotlib是Python的绘图库。它可与NumPy一起使用,提供了一种有效的MatLab开源替代方案importmatplotlib。pyplotaspltIpython。display的库是用来展示图片的fromIPython。displayimportImagefromsklearn。modelselectionimporttraintestsplitimportwarningswarnings。filterwarnings(ignore)datapd。readcsv(train。csv)print(type(data))print(data。info())print(data。shape)print(data。head())print(data〔〔MSSubClass,LotArea〕〕)数据集合缺失值选择数据集合中的几个重要特征dataselectdata〔〔BedroomAbvGr,LotArea,Neighborhood,SalePrice〕〕对数据集中的字段进行重命名dataselectdataselect。rename(columns{BedroomAbvGr:room,LotArea:area})print(dataselect)print(dataselect。shape)print(100)判断缺失值一般采用isnull(),然而生成的却是所有数据的truefalse矩阵print(dataselect。isnull())df。isnull()。any()则会判断哪些列存在缺失值print(dataselect。isnull()。any())只显示存在缺失值的行列,清楚的确定缺失值的位置print(dataselect。isnull()。valuesTrue)对缺失的数据进行过滤dataselectdataselect。dropna(axis0)print(dataselect。shape)print(dataselect。head())print(np。take(dataselect。columns,〔0,1,3〕))print(type(np。take(dataselect。columns,〔0,1,3〕)))归一化处理数太大,归一化,让数据的分布处于同一区间,咱们选择一种最简单的数据调整方法,每一个数除以其最大值forcolinnp。take(dataselect。columns,〔0,1,1〕):print(col)print(dataselect〔col〕)dataselect〔col〕dataselect〔col〕。max()print(dataselect。head())分配测试数据和训练数据train,testtraintestsplit(dataselect。copy(),testsize0。9)print(train。shape)print(test。shape)print(test。describe())numpy里面axis0andaxis1的使用示例说明:print(50)datanp。array(〔〔1,2,3,4〕,〔5,6,7,8〕,〔9,10,11,12〕〕)print(data)print(data。shape)shape〔3,4〕即为3行4列print(np。sum(data))在numpy中若没有指定axis,默认对所有的数据相加print(np。sum(data,axis0))若指定了axis0,则沿着第一个维度的方向进行计算,即为3按列中的3个数据进行计算,得到4组列数据计算结果print(np。sum(data,axis1))若指定了axis1,则沿着第二个维度的方向进行计算,即为4按行中的4个数据进行计算,得到3组行数据计算结果print(50)pandas里面axis0andaxis1的使用示例说明:如果我们调用df。mean(axis1),我们将得到按行计算的均值dfpd。DataFrame(np。arange(12)。reshape(3,4))print(df)print(df。mean())在pandas中,如果没有指定axis,则默认按axis0来计算print(df。mean(axis0))若指定了axis0,则按照第一个维度的变化方向来计算,即为3按列中的3个数据进行计算,得到4组列数据计算结果print(df。mean(axis1))若指定了axis1,则按照第二个维度的变化方向来计算,即为4按行中的4个数据进行计算,得到3组行数据计算结果线性回归模型线性回归模型,假设h(x)wxb是线性的。deflinear(features,pars):print(theparsis:,pars)print(pars〔:1〕)pricenp。sum(featurespars〔:1〕,axis1)pars〔1〕returnpriceprint(100)train〔predict〕linear(train〔〔room,area〕〕。values,np。array(〔0。1,0。1,0。0〕))能够看到,在该参数下,模型的预测价格和真实价格有较大的差距。那么寻找合适的参数值是咱们须要作的事情print(train。head())预测函数为h(x)wxb偏差的平方和函数:defmeansquarederror(predy,realy):returnsum(np。array(predyrealy)2)损失函数:deflostfunction(df,features,pars):df〔predict〕linear(df〔features〕。values,pars)costmeansquarederror(df。predict,df。SalePrice)len(df)returncostcostlostfunction(train,〔room,area〕,np。array(〔0。1,0。1,0。1〕))print(cost)linspace函数原型:linspace(start,stop,num50,endpointTrue,retstepFalse,dtypeNone)作用为:在指定的大间隔内,返回固定间隔的数据。他将返回num个等间距的样本,在区间〔start,stop〕中。其中,区间的结束端点可以被排除在外,默认是包含的。num100Xsnp。linspace(0,1,num)Ysnp。linspace(0,1,num)print(Xs)如果num5〔0。0。250。50。751。〕print(Ys)如果num5〔0。0。250。50。751。〕zeros函数原型:zeros(shape,dtypefloat,orderC)作用:通常是把数组转换成想要的矩阵;示例:np。zeros((2,3),dtypenp。int)Zsnp。zeros(〔num,num〕)100100的矩阵,值全为0。print(Zs)meshgrid从坐标向量中返回坐标矩阵Xs,Ysnp。meshgrid(Xs,Ys)print(Xs。shape,Ys。shape)print(Xs)如果num5则处理后的矩阵为:〔〔0。0。250。50。751。〕〔0。0。250。50。751。〕〔0。0。250。50。751。〕〔0。0。250。50。751。〕〔0。0。250。50。751。〕〕print(Ys)如果num5则处理后的矩阵为:〔〔0。0。0。0。0。〕〔0。250。250。250。250。25〕〔0。50。50。50。50。5〕〔0。750。750。750。750。75〕〔1。1。1。1。1。〕〕W1〔〕W2〔〕Costs〔〕foriinrange(100):forjinrange(100):W1。append(0。01i)W2。append(0。01j)Costs。append(lostfunction(train,〔room,area〕,np。array(〔0。01i,0。01j,0。〕)))numpy。argmin(a,axisNone,outNone)a:一个矩阵axis:整数,可选(没选择的话就是整个数组的展开)(0:行,1列)返回小值的下标indexnp。array(lostfunction)。argmin()print(W1〔index〕,W2〔index〕,Costs〔index〕)frommpltoolkits。mplot3dimportAxes3Dfigplt。figure()axfig。addsubplot(111,projection3d)ax。viewinit(5,15)ax。scatter(W1,W2,Costs,s10)ax。scatter(0。58,0。28,zslostfunction(train,〔room,area〕,np。array(〔0。58,0。28,0。0〕)),s100,colorred)plt。xlabel(rooms)plt。ylabel(llotArea)plt。show()

分享一些雷柏X1800PRO无线光学键鼠套装的独白风格,不是追逐潮流,千人一面而是,保留自己独有的一面眼缘,很难说明原因看上了,就是它就像雷柏X1800PRO无线光学键鼠套装掠过白衣飘飘将青……极速黑卡V3版全新上线!带你体验新旅程去陪你成长路上,我总是会听到一些人的声音。。。。。。。我不在乎,一直发愤图强,期待别人看到我的强大慢慢的,他们在认可我,你瞧他们一直在……21岁嫁朱老总,23岁为掩护主席老总牺牲,伍若兰功绩不朽1929年2月,赣州。城墙上悬挂着反动派们的镇压成果,革命者的头颅。来来往往的百姓或害怕,或悲伤,或惊叹,或胆怯。到底是什么力量,使一个娇小的女娃娃,冲破封建和礼教的枷锁……锐龙版MagicBook来了!是不是真的YES!先看开箱体验很欣喜的拿到了锐龙版的magicbook152020,一直以来除了我在90年代配置的第一台个人PC用的是AMD的U,后续就压根没有使用过,印象中那时候的AMD的U叫做K6235……6月iOS设备好评榜iPhoneSE再进一名2021年上半年已经正式过去,在今天我们也迎来了上半年iOS设备好评榜的最后一期榜单,不过虽然时间点上比较有意义,但榜单内的产品还是那几款,并没有什么新品出现,相信经常看我们榜……G胖将对EPIC采取行动立即调查未经用户许可收集Steam信此前报道的用户发现该Epic商店枚举电脑运行进程并试图在不通知用户的情况下访问Steam的本地数据并上传至服务器的新闻有了进一步的发展,V社对EPIC直接访问Steam数据文件……什么样的企业和员工能安全度过经济危机?纵观历史经济震荡的周期大概是十年。2018年不少企业深陷谷底,甚至一些知名企业也相继曝露出裁员的消息,其中国内不少的互联网巨头也未能幸免,刹那间,倒闭、裁员、股价大跌、员工讨薪……手动挡真的要被淘汰了吗?你可以说目前国内手动挡不是主流,毕竟大部分人买车都喜欢买自动挡,而且很多车型都取消了手动挡,只有自动挡。但是这并不代表手动挡就到了穷途末路。首先来说一大批经济型车是手动变……杰美特手机壳第一股开启智造新跨越深圳市杰美特股份有限公司(下称杰美特)数字化工厂位于深圳龙华。在这里,模具制造实现了从来料、生产、搬运、存储到送货的全流程自动化。车间里基本不见工人身影,取而代之的是挥舞的机械……实拍长安UNIT,未来感强烈,推荐12。59万中配车型{新车实拍}长安的UNIT是一台紧凑型SUV。其外观设计是车型的亮点之一,它更像是一台量产的概念车。整个车身充满了夸张、饱满的线条设计,特别是前脸的中网和大灯,浓厚的未来感。高……华为高工资是第一推动力华为为什么那么高的工资呢?在任正非的眼中,华为是个三高企业:高效率、高压力、高工资。他相信,高工资是第一推动力,重赏之下必有勇夫,华为给员工的不仅仅有高工资,还有股票和其……西湖大学的突破与未来近日,教育部批准了西湖大学的设立,其前身是施一公院士于2016年12月创立的浙江西湖高等研究院。西湖大学作为新生事物在办学性质和管理方式上都取得了巨大突破,但是其仍然会面临诸多……
十四运会,来咧它来了!它来了!它带着智慧全运走来了!9月15日,十三朝古都西安正式步入十四运时间。中国电信作为十四运会官方合作伙伴,带你抢先体验智慧全运。……新机荣耀X20Max终于来了曝7。2英寸大屏6000mAh大在8月份荣耀Magic3系列发布会的最后,荣耀预热了荣耀X20Max的存在,但并未公布具体的发布时间,现在这款大屏新机终于要来了。据工信部显示,荣耀型号为KKGAN70的……二季度通信服务大比拼中国移动真实力每月以及每个季度、每年这些间隔时间,通信运营商主管部门都会公布普通用户对基础电信企业的投诉统计情况。这一数据,也就成为衡量各家运营商在网络质量以及业务收费方面的市场口碑评价标准……知识爆发的时代,IP就是为你引路的老师今天是教师节,自古以来,老师作为传道受业,将知识传递出去的角色一直是受人尊敬的,每个人的知识,对世界的认知,对道理的领悟都少不了老师。可以说,每一个人的成长路上,老师是不可或缺……40。88万起!智己L7正式预售,车长5098mm,前排全是根据排放政策越来越严格,有很多车企都逐渐转型,开始在新能源领域进行研发,所以就目前情况来看,能够代替传统燃油车的方案就是新能源汽车。在燃油汽车领域中自主品牌发展得比较晚,没有优……大疆创新无人机老大,从零说起谈起无人机,我想大家第一个想起的词,那一定就是大疆创新了,那么今天就和大家聊聊坐落在深圳的大疆创新吧!黎明前的黑暗2006年,大疆在深圳莲花村的一间民房内办公。当时大疆根……懒人最爱,随身小空调,几素无叶挂脖风扇新体验虽说已经入秋了,但很明显广东并没有受传统节气的影响,依然保持35左右的热浪,作为一个土生土长的广东人来说,早已放弃抵抗了,每逢长到无边的夏日能待空调房就待空调房,不能待也要创造……Web3。0这个时代的机遇,年轻人的机遇连续熬了几个夜,在aWSB听了Gary(星瀚资本found)郭宇(Byte28岁退休天才少年)等分享,结合自己的理解整理一下:引子:不懂Web3。0的不仅仅是你绝大多数人……数字经济面临的挑战及未来发展指向作者:张为付(南京财经大学教授、江苏现代服务业智库首席专家)2022年1月12日,国务院印发《十四五数字经济发展规划》(以下简称《规划》),对我国十四五时期数字经济发展作……新50万以上豪华电动车第一?高合的答卷真涨士气随着6座版浅色内饰和4座版的交付,下个月高合成为50万以上豪华新能源细分市场的第一应无悬念。在成都车展上,高合汽车创始人丁磊发出了这样的感慨。这两款首次登台亮相的高合新车到底有……美的低调造车背后一级市场投资版图浮现芯片锂电池新材料均有布局《科创板日报》(记者陈美)讯,上周末,美的集团投资成立汽车部件公司,标志其在该领域再进一步。相比格力与小米,美的造车显得极为低调,公司甚至仅对外宣称:只做汽车部件。1月1……多国航司宣布停飞美国!美国新5G信号或影响飞行安全,恐酿成灾据美国有线电视新闻网1月18日报道,多家国际航空公司称,由于不确定美国新的5G手机服务与重要的飞机技术之间是否存在干扰,它们将从周三开始取消飞往美国的航班。报道称,阿联酋……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网