原文链接:http:tecdat。cn?p9564 目录 如何做多元回归 逐步回归选择模型 逐步程序 定义最终模型 方差分析 预测值图 检查模型的假设 模型拟合标准 将模型与似然比检验进行比较 我从马里兰州生物流调查中提取了一些数据,以进行多元回归分析。数据因变量是每75米长的水流中长鼻鱼(Rhinichthyscataractae)的数量。自变量是河流流失的面积(英亩);氧(毫克升);水流段的最大深度(以厘米为单位);硝酸盐浓度(毫克升);硫酸盐浓度(毫克升);以及采样日期的水温(以摄氏度为单位)。 如何做多元回归 多重相关 数据集包含多个数字变量时,最好查看这些变量之间的相关性。原因之一是,可以轻松查看哪些自变量与该因变量相关。第二个原因是,如果要构建多元回归模型,则添加高度相关的自变量不太可能对模型有很大的改进。 最后,值得看一下数字变量的分布。如果分布差异很大,则使用Kendall或Spearman相关性可能更合适。同样,如果自变量与因变量的分布不同,则可能需要对自变量进行转换。 Dataread。table(textConnection(Input),headerTRUE) library(dplyr) Data。numselect(Data,Longnose,Acerage,DO2,Maxdepth,NO3,SO4,Temp) library(FSA) headtail(Data。num) LongnoseAcerageDO2MaxdepthNO3SO4Temp 11325289。6802。2816。7515。3 21233338。5835。347。7419。4 354196118。3960。9910。9219。5 6620410610。0962。625。4515。4 6738102749。3905。4524。7615。0 68195106。7825。2514。1926。5 library(psych) corr。test(Data。num,,,,Csee?p。adjustforoptionsalpha。05) Correlationmatrix LongnoseAcerageDO2MaxdepthNO3SO4Temp Longnose1。000。350。140。300。310。020。14 Acerage0。351。000。020。260。100。050。00 DO20。140。021。000。060。270。070。32 Maxdepth0。300。260。061。000。040。050。00 NO30。310。100。270。041。000。090。00 SO40。020。050。070。050。091。000。08 Temp0。140。000。320。000。000。081。00 SampleSize Probabilityvalues(Entriesabovethediagonalareadjustedformultipletests。) LongnoseAcerageDO2MaxdepthNO3SO4Temp Longnose0。000。000。270。010。010。890。26 Acerage0。000。000。860。030。420。690。98 DO20。270。860。000。640。020。560。01 Maxdepth0。010。030。640。000。770。690。97 NO30。010。420。020。770。000。480。99 SO40。890。690。560。690。480。000。52 Temp0。260。980。010。970。990。520。00 逐步回归选择模型 使用AIC(赤池信息标准)作为选择标准。可以使用选项klog(n)代替BIC。 逐步程序 Longnose1 DfSumofSqRSSAIC Acerage117989。6131841518。75 NO3114327。5135503520。61 Maxdepth113936。1135894520。81 149831525。45 Temp12931。0146899526。10 DO212777。7147053526。17 SO4145。3149785527。43 。 。 snip。。。 。 。 LongnoseAcerageNO3Maxdepth DfSumofSqRSSAIC 107904509。13 Temp12948。0104956509。24 DO21669。6107234510。70 Maxdepth16058。4113962510。84 SO415。9107898511。12 Acerage114652。0122556515。78 NO3116489。3124393516。80 Call: lm(formulaLongnoseAcerageNO3Maxdepth,dataData) Coefficients: (Intercept)AcerageNO3Maxdepth 23。8290670。0019888。6730440。336605 定义最终模型 summary(model。final)Showcoefficients,Rsquared,andoverallpvalue EstimateStd。ErrortvaluePr(t) (Intercept)2。383e011。527e011。5600。12367 Acerage1。988e036。742e042。9480。00446 Maxdepth3。366e011。776e011。8960。06253。 NO38。673e002。773e003。1270。00265 MultipleRsquared:0。2798,AdjustedRsquared:0。2461 Fstatistic:8。289on3and64DF,pvalue:9。717e05 方差分析 AnovaTable(TypeIItests) Response:Longnose SumSqDfFvaluePr(F) Acerage1465218。69040。004461 Maxdepth605813。59330。062529。 NO31648919。78020。002654 Residuals10790464 预测值图 检查模型的假设 线性模型中残差的直方图。这些残差的分布应近似正态。 残差与预测值的关系图。残差应无偏且均等。 模型拟合标准 模型拟合标准可用于确定最合适的模型。使用AIC或可选的BIC。AICc是对AIC的一种调整,它更适合于观测值相对较少的数据集。AIC,AICc和BIC越小越好。 在下面的例子中,我们只讨论了显著相关的种植面积,MAXDEPTH和NO3。 Models Formula 1LongnoseA 2LongnoseM 3LongnoseNO3 4LongnoseAcerageM 5LongnoseAcerageNO3 6LongnoseMaxdepthNO3 7LongnoseAcerageMaxdepthNO3 8LongnoseAcerageMaxdepthNO3DO2 9LongnoseAcerageMaxdepthNO3SO4 10LongnoseAcerageMaxdepthNO3T Fit。criteria RankDf。resAICAICcBICR。squaredAdj。R。sqp。valueShapiro。WShapiro。p 1266713。7714。1720。40。120100。106703。796e030。72786。460e10 2266715。8716。2722。40。093010。079271。144e020。79232。115e08 3266715。6716。0722。20。095620。081921。029e020。73619。803e10 4365711。8712。4720。60。169800。144202。365e030。79342。250e08 5365705。8706。5714。70。239400。216001。373e040。75052。055e09 6365710。8711。4719。60。182000。156901。458e030。81498。405e08 7464704。1705。1715。20。279800。246109。717e050。81086。511e08 8563705。7707。1719。00。284300。238902。643e040。80414。283e08 9563706。1707。5719。40。279900。234103。166e040。81046。345e08 10563704。2705。6717。50。299500。255001。409e040。82251。371e07 几个模型的AICc(修改后的Akaike信息标准)图。模型7最小化了AICc,因此被选为该模型中的最佳模型。 将模型与似然比检验进行比较 将模型与平方和检验或似然比检验进行比较,以查看是否有其他项显着减少平方误差和。 AnalysisofVarianceTable Model1:LongnoseAcerageMaxdepthNO3 Model2:LongnoseAcerageMaxdepth Res。DfRSSDfSumofSqFPr(F) 164107904 2651243931164899。78020。002654 Likelihoodratiotest Model1:LongnoseAcerageMaxdepthNO3 Model2:LongnoseAcerageMaxdepth DfLogLikDfChisqPr(Chisq) 15347。05 24351。8919。67010。001873 Model1:LongnoseAcerageMaxdepthNO3DO2 Model2:LongnoseAcerageMaxdepthNO3SO4 Model3:LongnoseAcerageMaxdepthNO3Temp ModelA:LongnoseAcerageMaxdepthNO3 DfORSSODfARSSADfSSFPr(F) 1vA63107234。3864107903。971669。590。39340。5328 2vA63107898。0664107903。9715。910。00350。9533 3vA63104955。9764107903。9712948。001。76950。1882 Model1:LongnoseAcerageMaxdepthNO3DO2 Model2:LongnoseAcerageMaxdepthNO3SO4 Model3:LongnoseAcerageMaxdepthNO3Temp ModelA:LongnoseAcerageMaxdepthNO3 DfOlogLikODfAlogLikADflogLikChisqPr(Chisq) 1vA63346。8388164347。0504510。211640。42330。5153 2vA63347。0485964347。0504510。001860。00370。9513 3vA63346。1086364347。0504510。941821。88360。1699