1

回归分析知识点讲解:

回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

回归分析的基本思想:

确定变量

明确预测的具体目标,也就确定了因变量。

建立预测模型

依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。

进行相关分析

回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。

计算预测误差

回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。

确定预测值

利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
2

回归分析练习题:

1、两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是(  )
A、模型1的相关指数R2为0.25
B、模型2的相关指数R2为0.50
C、模型3的相关指数R2为0.80
D、模型4的相关指数R2为0.98
题型:选择题 难度:0.80 来源:2016春•登封市期中 看答案
2、在线性回归模型中,分别选择了4个不同的模型,它们的相关指数R2依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数R2为(  )
A、0.95
B、0.81
C、0.74
D、0.36
题型:选择题 难度:0.80 来源:2016春•和平区期中 看答案
3、2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP(最有价值球员),下表是易建联在这9场比赛中投篮的统计数据.
比分易建联技术统计
投篮命中罚球命中全场得分真实得分率
中国91-42新加坡3/76/71259.52%
中国76-73韩国7/136/82060.53%
中国84-67约旦12/202/52658.56%
中国75-62哈萨克期坦5/75/51581.52%
中国90-72黎巴嫩7/115/51971.97%
中国85-69卡塔尔4/104/41355.27%
中国104-58印度8/125/52173.94%
中国70-57伊朗5/102/41355.27%
中国78-67菲律宾4/143/61133.05%
注:(1)表中a/b表示出手b次命中a次;
(2)TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:
TS%=
全场得分
2×(投篮出手次数+0.44×罚球出手次数)

(Ⅰ)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;
(Ⅱ)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;
(Ⅲ)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.
题型:计算题 难度:0.62 来源:2015秋•云南校级月考 看答案
4、某次测量发现一组数据(xi,yi)具有较强的相关性,并计算得
y
=x+1,其中数据(1,y0)因书写不清,只记得y0是[0,3]任意一个值,则该数据对应的残差的绝对值不大于1的概率为    .(残差=真实值-预测值)
题型:计算题 难度:0.70 来源:2015•腾冲县一模 看答案
5、关于x与y有如下数据:
x24568
y3040605070
有如下的两个模型:①
y
=0.65x+17.5
y
=7x+17
,通过残差分析发现第①个线性模型比第②个拟合效果好,则R12       R22,Q1       Q2.(用大于,小于号填空,R,Q分别是相关指数和残差平方和)(  )
A、<,>
B、>,<
C、<,<
D、>,>
题型:选择题 难度:0.73 来源:2014春•桃城区校级期末 看答案
6、有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法正确的是(  )
A、残差平方和变小
B、相关系数r变小
C、相关指数R2变小
D、解释变量x与预报变量y的相关性变弱
题型:选择题 难度:0.46 来源:2014春•东莞期末 看答案
7、以下有关线性回归分析的说法不正确的是(  )
A、在回归线方程
y
=0.4x+12中,当自变量x每增加一个单位时,变量
y
平均增加约为0.4个单位
B、用最二乘法求回归直线方程,是寻求使
x
n+1
(y1-bx-a)2最小的a,b的值
C、相关系数为r,若r2越接近1,则表明回归线的效果越好
D、相关系数r越小,表明两个变量相关性越弱
题型:选择题 难度:0.71 来源:2014秋•新余期末 看答案
8、某产品的广告费用x万元与销售额y万元的统计数据如下表:
广告费用x(万元)4235
销售额y(万元)492639m
根据上表可得回归方程
y
=9x+10.5,则m为(  )
A、54
B、53
C、52
D、51
题型:选择题 难度:0.53 来源:2014秋•安徽月考 看答案
9、两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最差的模型是(  )
A、模型1的相关指数R2为0.98
B、模型2的相关指数R2为0.86
C、模型3的相关指数R2为0.56
D、模型4的相关指数R2为0.35
题型:选择题 难度:0.73 来源:2012春•集美区校级期末 看答案
10、若有一组数据的总偏差平方和为120,相关指数为0.6,则回归平方和为(  )
A、60
B、72
C、48
D、120
题型:选择题 难度:0.82 来源:2010秋•天心区校级期末 看答案