高级统计师考试《高级统计实务与案例分析》备考:应用直线相关与回归
【资料图】
数据汇总整理与统计分析模块(五)数据汇总整理与统计分析
第六章 相关与回归分析
6.5 应用直线相关与回归时应注意的问题在定性分析的基础上进行定量分析,是保证正确运用回归分析必要条件。回归分析是一种定量分析的方法。所谓定性分析是对所研究的客观现象的性质和变量之间内在联系的分析。建立回归模型,首先要熟悉研究理解本身的科学理论知识或有关专业方面的知识。在此基础上才能正确选择哪些变量作自变量,什么变量作因变量。1、作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律;如对儿童身高与小树的生长数据进行回归分析既无道理也无用途。另外,即使两个变量间存在回归关系时,也不一定是因果关系,必须结合专业知识作出合理解释和结论。2、直线回归分析的资料,一般要求应变量Y是来自正态总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严密控制的值。若稍偏离要求时,一般对回归方程中参数的估计影响不大,但可能影响到标准差的估计,也会影响假设检验时P值的真实性。3、进行回归分析时,应先绘制散点图。若提示有直线趋势存在时,可作直线回归分析;若提示无明显线性趋势,则应根据散点分布类型,选择合适的曲线模型),经数据变换后,化为线性回归来解决。一般说,不满足线性条件的情形下去计算回归方程会毫无意义,最好采用非线性回归方程的方法进行分析。4、绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查,对由于测定、记录或计算机录入的错误数据,应予以修正和剔除。否则,异常点的存在会对回归方程中的系数a、b的估计产生较大影响。5、回归直线不要外延。直线回归的适用范围一般以自变量取值范围为限,在此范围内求出的估计值称为内插(interpolation);超过自变量取值范围所计算的称为外延(extrapolation)。若无充足理由证明,超出自变量取值范围后直线回归关系仍成立时,应该避免随意外延。
真题解析:【例题】(2006年)在一项关于某种谷物产量的研究中,从10个试验田得到的数据如下表:
产量Y | 50 | 52 | 56 | 59 | 62 | 64 | 68 | 69 | 70 | 71 |
所施肥料X1 | 38 | 39 | 39 | 41 | 44 | 42 | 43 | 46 | 48 | 47 |
土质指数X2 | 50 | 50 | 54 | 56 | 56 | 60 | 64 | 63 | 62 | 60 |
对表中的数据进行多元线性回归分析,模型结果为:
要求回答:1. 模型参数的经济意义是什么?
【分析与提示】1. 模型参数的经济意义是y代表谷物产量,x1代表所施肥料,x2代表土质指数。2. F说明回归方程的显著性检验F检验的统计量,R2 是判定系数,t说明回归参数的显著性检验t检验的统计量。
[考试报名]全国高级统计师考试时间|报名时间|报名入口[成绩查询]全国高级统计师考试成绩查询时间|查询入口[真题答案]全国高级统计师考试历年真题及答案解析[考试政策]高级统计师报考条件|免考条件|考试科目[培训课程]最新高级统计师资格考试高清视频辅导课程试听标签: