首页 范文大全 古典文学 职场知识 中国文学 公文书信 外国名著 寓言童话 百家讲坛 散文/诗歌 美文欣赏 礼仪知识 民俗风情
  • 工作总结
  • 工作计划
  • 心得体会
  • 竞聘演讲
  • 会议发言
  • 爱国演讲
  • 就职演说
  • 开业开幕
  • 思想学习
  • 征文演讲
  • 经验材料
  • 述职报告
  • 调研报告
  • 工作汇报
  • 年终总结
  • 申报材料
  • 学习体会
  • 企划方案
  • 活动方案
  • 技巧经验
  • 模板范例
  • 思想宣传
  • 经济工作
  • 工作报告
  • 组织人事
  • 反腐倡廉
  • 慰问贺电
  • 先进事迹
  • 思想汇报
  • 入党申请书
  • 党会发言
  • 先进性教育
  • 入团申请书
  • 个人简历
  • 演讲稿
  • 调查报告
  • 实习报告
  • 和谐社会
  • 观后感
  • 读后感
  • 作文范文
  • 自我鉴定
  • 讲话稿
  • 自查报告
  • SPSS对主成分回归实验报告

    时间:2020-07-04 11:47:54 来源:蒲公英阅读网 本文已影响 蒲公英阅读网手机站

    相关热词搜索:成分 回归 实验

     《 多元统计分析分析 》实验报告

     2012 年

      月

      日 学院 经贸学院 姓名

     学号

     实验 名称

      实验成绩

     一、实验目的 (一)利用 SPSS 对主成分回归进行计算机实现. (二)要求熟练软件操作步骤,重点 掌握对软件处理结果的解释. 二、 实验内容

     以教材例题 7.2 为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用 三、实验步骤(以文字列出软件操作过程并附上操作截图)

     1、数据文件的输入或建立:( 文件名以学号或姓名命名)

     将表 7.2 数据输入 spss:点击“文件”下“新建”——“数据”见图 1:

     图 1

     点击左下角“变量视图”首先定义变量名称及类型:见图 2:

     图 2:

     然后点击“数据视图”进行数据输入(图 3):

     图 3

      完成数据输入 2、具体操作分析过程 :

     (1)首先做因变量 Y 与自变量 X1-X3 的普通线性回归:

     在变量视图下点击“分析”菜单,选择“回归”-“线性”(图 4):

     图 4

     将因变量 Y 调入“因变量”栏,将 x1-x3 调入“自变量”栏(图 5):

     然后选择相关要输出的结果:①点击右上角“统计量(s)”:“回归系数”下选择“估计”;“残差”下选择“D.W”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。选完后点击“继续”(见图 6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图 7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图 8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图 9)

     其他选项按软件默认。最后点击“确定”,运行线性回归,输出相关结果(见表 1-3)

     图 5 图 图 6 6 图 7

     图 8 图 9 回归分析输出结果:

     表1 模型汇总b b

     模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .996a

     .992 .988 .48887 2.740 a. 预测变量: (常量), x3, x2, x1。

     b. 因变量: y

     表2 Anovab b

     模型 平方和 df 均方 F Sig. 1 回归 204.776 3 68.259 285.610 .000a

     残差 1.673 7 .239

      总计 206.449 10

     a. 预测变量: (常量), x3, x2, x1。

     b. 因变量: y

     表3 系数a a

     模型 非标准化系数 标准系数 t Sig. 相关性 共线性统计量 B 标准 误差 试用版 零阶 偏 部分 容差 VIF 1 (常量) -10.128 1.212

     -8.355 .000

     x1 -.051 .070 -.339 -.731 .488 .965 -.266 -.025 .005 185.997 x2 .587 .095 .213 6.203 .000 .251 .920 .211 .981 1.019 x3 .287 .102 1.303 2.807 .026 .972 .728 .095 .005 186.110 a. 因变量: y 由表可知,回归模型拟合优度达到99.2%,方差分析也显示线性回归方程整体显著(F=285.61,Sig.=0.000)但是回归系数估计结果中,x1的系数为-0.051与一般经济理论矛盾且不显著(t检验值-0.731,检验的p值0.488),经多重共线性诊断(x1与x3的VIF值高达180以上)表明自变量存在共线性。运用主成分分析做多重共线性处理:

     (2)自变量x1-x3的主成分分析:

     由于spss没有独立的主成分分析模块,需要在因子分析里完成,因此需要特别注意:

     在数据窗口下选择“分析”—“降维”—“因子分析”(见图10); 在弹出的窗口中将x1-x3调入“变量”(见图11); 然后①点击“描述”,选择要输出的统计量(见图12):选中“统计量”下的两个项目(输出变量描述统计和初始分析结果);在“相关矩阵”一般要选择输出“系数”、“显著性水平”、“KMO”(做主成分分析和因子分析的适用性检验,也就是检验变量之间的相关系数是否足够大可以做因子分析)选完后点击“继续”进行下一步;②点击“抽取”(见图13):在“方法”下默认“主成分”;“分析”下,默认“相关性矩阵”(含义是要对变量做标准化处理,然后基于标准化后的协差阵也就是相关阵进行分解做因子分析或主成分分析),如果不需要对变量做标准化处理就选“协方差矩阵”;“输出”中的两项都选,要求输出没有旋转的因子解(主成分分析必选项)和碎石图(用图形决定提取的主成分或因子的个数);“抽取“下,默认的是基于特征值(大于

     1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。选完后点击 “继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)

     最后点击“确定”,运行因子分析。

     图10 图11

     图 12 图 图 13

     图 图 14

     图 图 15

     由运行结果计算主成分:

      表4 4 、 描述统计量

     均值 标准差 分析 N x1 194.5909 29.99952 11 x2 3.3000 1.64924 11 x3 139.7364 20.63440 11

     表5 5 、 相关矩阵

     x1 x2 x3 相关 x1 1.000 .026 .997 x2 .026 1.000 .036 x3 .997 .036 1.000 Sig.(单侧)

     x1

     .470 .000 x2 .470

     .459 x3 .000 .459

      表6 6 、 KMO 和

     Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。

     .492 Bartlett 的球形度检验 近似卡方 42.687 df 3 Sig. .000

     表7 7 、 解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 1.999 66.638 66.638 1.999 66.638 66.638 2 .998 33.272 99.910 .998 33.272 99.910 3 .003 .090 100.000 .003 .090 100.000 提取方法:主成份分析。

     表8 8 、 成份矩阵a a

      成份 1 2 3 x1 .999 -.036 .037 x2 .062 .998 .000 x3 .999 -.026 -.037 提取方法 :主成份。

     a. 已提取了 3 个成份。

     由表5、6可知适合做主成分或因子分析(KMO检验通过),表7知前两个主成分(初始因子)贡献率已达99.91%,提取前两个主成分用于分析。由表8(初始因子载荷阵)和表7可计算前两个特征向量,用表8前两列分别除以前两个特征值的平方根得前两个主成分表达式:

     F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)

     F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)

     其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。

     由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。主成分的计算:依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:点击“转换”—“计算变量”(图16):在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。

     (3)主成分回归过程:

     要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。

     点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9

     图16

     图17

     图18 图 图 19

     图 图 20

     图 图 21

     主成分回归结果:

      表9 9 、 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .994a

     .988 .985 .12104901 a. 预测变量: (常量), F1, F2。

     表 10 、 Anovab b

     模型 平方和 df 均方 F Sig. 1 回归 9.883 2 4.941 337.230 .000a

     残差 .117 8 .015

      总计 10.000 10

     a. 预测变量: (常量), F1, F2。

     b. 因变量: Zscore(y)

     表 11 、 系数a a

     模型 非标准化系数 标准系数 t Sig. 共线性统计量 B 标准 误差 试用版 容差 VIF 1 (常量) -3.043E-16 .036

     .000 1.000

      F2 .191 .038 .191 4.993 .001 1.000 1.000 F1 .690 .027 .976 25.486 .000 1.000 1.000 a. 因变量: Zscore(y)

     由表9-11可知,标准化Y对两个主成分的线性回归通过显著性检验,也没有多重共线性,回归系数合理,即Y*=0.690F1+0.191F2,将前面F1、F2的表达式(式1和二)带入可得标准化Y关于标准化自变量的回归方程:

     Y*=0.4806X1*+0.2211X2*+0.4826X3*,还原为原始变量:

     1 2 33 3 1 1 2 20.4806* 0.2211* 0.4826*y X X XX X X X X X y yS S S S     

     整理得最终回归结果:

     Y=-9.13+0.072X1+0.60X2+0.1062X3

    • 范文大全
    • 职场知识
    • 精美散文
    • 名著
    • 讲坛
    • 诗歌
    • 礼仪知识