196用96一升食用油等于多少斤3在用10+3=13这叫什么方法

> 问题详情
用适当的方法解下列方程组.(1)3x-y=102x-3y=9(2)2p-3q=13-p+5=3q(3)3m-2n=54m+2n=9(4)3x+5y=254x+3y=15(5)3
悬赏:0&答案豆
提问人:匿名网友
发布时间:
用适当的方法解下列方程组.(1)3x-y=102x-3y=9(2)2p-3q=13-p+5=3q(3)3m-2n=54m+2n=9(4)3x+5y=254x+3y=15(5)3x-5y=74x+2y=5(6)x2-y+13=13x+2y=4(7)m2+n3=13m3-n4=3(8)15x+13y=250.5x-0.3y=0.2(9)2x-15+3y-24=23x+15-3y+24=0(10)y+14=x+232x-3y=1.
我有更好的答案
<a href="http://www.shangxueba.com/ask/9420225.html" target="_blank" title="?已知a1,a2,…,an是n个整数,且1=a1 <a2 < … ?已知a1,a2,…,an是n个整数,且1=a1 <a2 < … <an=2016,若a1,a2,…,an中任意n-1个数的平均数仍是整数,求n的最大值.
请先输入下方的验证码查看最佳答案
图形验证:
验证码提交中……
每天只需0.4元
选择支付方式
支付宝付款
郑重提醒:支付后,系统自动为您完成注册
请使用微信扫码支付(元)
支付后,系统自动为您完成注册
遇到问题请联系在线客服QQ:
恭喜你被选中为
扫一扫-免费查看答案!
请您不要关闭此页面,支付完成后点击支付完成按钮
遇到问题请联系在线客服QQ:
恭喜您!升级VIP会员成功
提示:请截图保存您的账号信息,以方便日后登录使用。
常用邮箱:
用于找回密码
确认密码:3,7,10,13,16 这组数字有什么规律,求大神解答!!!!!!!!!!!!_百度知道
3,7,10,13,16 这组数字有什么规律,求大神解答!!!!!!!!!!!!
我有更好的答案
baidu://c,确实如楼上的几位所说,如果要加第一个数字的话,我用excel给你做出来了,函数关系式。如图所示.jpg" target="_blank" title="点击查看大图" class="ikqb_img_alink"><img class="ikqb_img" src="http://c.hiphotos.hiphotos.baidu.com/zhidao/pic/item/d439bab062f58c75cc.com/zhidao/wh%3D600%2C800/sign=1e362eda5fdf8db1bc7bc/d439bab062f58c75cc.jpg" esrc="http://c.hiphotos.baidu你好,从后面的数字来看
采纳率:71%
每一项都等于第一项加上其前一项。例如第四项13=第一项3+第四项前一项10
3+7=103+10=133+13=16所以接下去应该是3+16=19 也就是说从第三项开始An=A1+An-1
第一个表示后面的数字中,每两个相邻数字的差值.第二个数字开始,就是这些以第一个数字为差值的数组.
有没有发现3
之后 都是前面的数加上第一个数3得来的
比如10=7+3
那么后面的数必然是?=16+3
所以后面的为19
3+7=103+10=133+13=16
其他4条回答
为您推荐:
其他类似问题
您可能关注的内容
&#xe675;换一换
回答问题,赢新手礼包&#xe6b9;
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。赞助商链接
当前位置: >>
常用统计分析方法sPSS应用
常用统计分析方法 ――SPSS 应用General Method of Statistical Analysis ???? SPSS Application杜志渊编著 前言《统计学》是一门计算科学,是自然科学在社会经济各领域中的应用学科,是许 多学科的高校在校本科生的必修课程。 在统计学原理的学习和统计方法的实际应用中, 经常需要进行大量的计算。 因此, 统计分析软件问世使强大的计算机功能得到充分发挥,不仅能够减轻计算工作量,计 算结果非常准确,而且还节省了统计分析时间。因此,应用统计分析软件进行数据处 理已经成为社会学家和科学工作者必不可少的工作内容。 为了使高校的学生能够更好 的适应社会的发展和需求,学习和使用统计软件已经成为当前管理学、社会学、自然 科学、生物医学、工程学、农业科学、运筹学等学科的本科生或研究生所面临的普遍 问题。 为了使大学生和专业人员在掌握统计学原理的基础上能够正确地运用计算机做 各种统计分析,掌握统计分析软件的操作是非常有必要的。现将常用的 SPSS 统计分 析软件处理数据和分析数据的基本方法编辑成册, 供高校学生及对统计分析软件有兴 趣的人员学习和参考,希望能够对学习者有所帮助。 本书以统计学原理为理论基础, 以高等学校本科生学习的常用的统计方法为主要 内容,重点介绍这些统计分析方法的 SPSS 软件的应用。为了便于理解,每一种方法 结合一个例题解释 SPSS 软件的操作步骤和方法,并且对统计分析的输出结果进行相 应的解释和分析。同时也结合工业、农业、商业、医疗卫生、文化教育等实际问题, 力求使学生对统计分析方法的应用有更深刻的认识和理解, 以提高学生学习的兴趣和 主动性。 另外, 为了方便学习者的查询, 将常用统计量的数学表达式作为附录 1, SPSS 中所用的主要函数释义作为附录 2,希望对学习者能够的所帮助。编者1 目录第一章 数据文件的建立及基本统计描述 ................................................................................................... 1§1.1 SPSS 的启动及数据库的建立 ....................................................................................................................... 1 §1.1.2 SPSS 简介 ........................................................................................................................................... 1 §1.1.2 启动 SPSS 软件包 .............................................................................................................................. 2 §1.1.3 数据文件的建立 ................................................................................................................................ 3 §1.2 数据的编辑与整理 ........................................................................................................................................ 5 §1.2.1 数据窗口菜单栏功能操作 ................................................................................................................ 5 §1.2.2 Date 数据功能 ................................................................................................................................... 6 §1.2.3 Transform 变换及转换功能 ............................................................................................................ 7 §1.2.4 数据的编辑 ........................................................................................................................................ 8 §1.2.5 SPSS 对变量的编辑 ......................................................................................................................... 14 §1.3 基本统计描述 .............................................................................................................................................. 17 §1.3.1 描述统计分析过程 .......................................................................................................................... 17 §1.3.2 频数分析 .......................................................................................................................................... 19 §1.4 交叉列联表分析 .......................................................................................................................................... 30 §1.4.1 交叉列联表的形成 .......................................................................................................................... 31 §1.4.2 两变量关联性检验(Chi-square Test 卡方检验)......................................................................... 32第二章均值比较检验与方差分析 ............................................................................................................. 38§2.1 单个总体的 t 检验(One-Sample T Test)分析................................................................................... 38 §2.2 两个总体的 t 检验 .................................................................................................................................... 40 §2.2.1 两个独立样本的 t 检验(Independent-sample T Test) ......................................................... 40 §2.2.2 两个有联系总体间的均值比较(Paired-Sample T Test) ....................................................... 42 §2.3 单因素方差分析 .......................................................................................................................................... 44 §2.4 双因素方差(Univariate)分析过程 ...................................................................................................... 48第三章 相关分析与回归模型的建立与分析 ............................................................................................... 56§3.1 相关分析 ...................................................................................................................................................... 56 §3.1.1 简单相关分析 .................................................................................................................................. 56§3.1.1.1 散点图 ........................................................................................................... 56 §3.1.1.2 简单相关分析操作 ....................................................................................... 58§3.1.2 偏相关分析 ...................................................................................................................................... 59 §3.2 线性回归分析 .............................................................................................................................................. 62 §3.3 曲线估计 ...................................................................................................................................................... 70第四章时间序列分析 ................................................................................................................................. 77§4.1 实验准备工作 .............................................................................................................................................. 77 §4.1.1 根据时间数据定义时间序列 .......................................................................................................... 77 §4.1.2 绘制时间序列线图和自相关图 ...................................................................................................... 77 §4.2 季节变动分析 .............................................................................................................................................. 81 §4.2.1 季节分析方法 .................................................................................................................................. 82 1 §4.2.2 进行季节调整 .................................................................................................................................. 83第五章非参数检验 ..................................................................................................................................... 86§5.1 Chi-Square Test 卡方检验 ...................................................................................................................... 87 §5.2 一个样本的 K-S 检验 .................................................................................................................................. 89 §5.3 两个独立样本的检验(Test for Two Independent Sample) ............................................................. 92 §5.4 两个有联系样本检验(Test for Two related samples) ................................................................... 95 §5.6 多个样本的非参数检验(K Samples Test) .......................................................................................... 97 §5.6 游程检验(Runs Test) .......................................................................................................................... 101附录 1部分常用统计量公式 .................................................................................................................... 105§6.1 数据的基本统计特征描述 ........................................................................................................................ 105 §6.2 总体均值检验统计量 ................................................................................................................................ 106 §6.3 方差分析中的统计量 ................................................................................................................................ 108 §6.4 回归分析模型 .............................................................................................................................................110 §6.5 非参数检验 .................................................................................................................................................116附录 2SPSS 函数 ................................................................................................................................... 1212 第一章数据文件的建立及基本统计描述在社会各项经济活动和科学研究过程中,经常获得许多数据,而这些数据中包含 着大量有用的信息。 若要准确地、 科学地提取这些信息, 就要应用各种统计分析方法, 其中最基本的方法是数据的基本统计描述。通过数据的基本统计描述,可以得到数据 的分布状况,数据的主要特征值,时间序列的趋势性,是否存在异常值以及数据的大 致图形等。当然,要实现对数据的统计分析和描述,首先要从建立数据文件开始。这 一章主要介绍数据文件的建立和数据的基本统计描述方法。§1.1 SPSS 的启动及数据库的建立§1.1.2 SPSS 简介SPSS(Statistics Package for Social Science )for Windows 是一种运行 在 Windows 系统下的社会科学统计软件软件包。SPSS 软件包集数据整理、分析过程、 结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用 方便, 输出数据表格图文并貌, 并且随着它的功能不断完善, 统计分析方法不断充实, 大大提高了统计分析工作的效率。从 1968 年由美国斯坦福大学开发使用至今,已经 拥有全球数以万计的用户,分布在通信、医疗、银行、证券、保险、制造、商业、市 场研究、科学教育等众多的行业领域,成为世界上应用最广泛的专业统计软件之一。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容 包括描述统计、列联分析,总体的均值比较、相关分析、回归模型分析、聚类分析、 主成份分析、时间序列分析、非参数检验等多个大类,每个类中还有多个专项统计方 法。SPSS 设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形, 能够满足用户的不同需求。 一. SPSS 的运行方式 SPSS 提供了 3 种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行 方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自己的 SPSS 命令程序,通过语句直接运行。这里只介绍完全窗口菜单管理方式,这种操作 方式简单明了,除数据输入工作需要键盘外,大部分的操作命令、统计分析方法的实 现是通过菜单、图标按钮、对话框来完成的,非常适用于一般的统计分析人员和一般 统计方法的应用者。 SPSS 中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗口 操作与 Windows 应用软件操作风格一致。另一类是统计分析对话框,统计分析对话框 可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类变量及统计方法 是对话框的主要任务。有关对话框的详细操作将在后面的统计方法的实验中解释。 二. SPSS 的实验环境要求 1、系统运行环境 SPSS10.0 以上版本软件包可以工作在两种模式下,单机模式和作为网络系统的 用户界面模式。 SPSS for Windows 软件包可以运行在微软公司的 Windows98、Windows NT 4.0、 Windows ME、Windows2000 和 Windows XP 操作系统之下。由于统计分析软件的数据1 量比较大,所以系统运行需要大于 16M 以上空间。 2、辅助软件环境 SPSS 可以直接将 SPSS 数据文件保存为 Excel 工作表,也可以直接打开一个 Excel 工作表,因此,为了方便数据录入(许多人对 Excel 工作表编辑比较熟习) , 应在操作系统下安装一个 Excel 软件。另外,许多数据在处理之前可能保存在某个数 据库中,例如 FoxBase、Sybase、SQL_Server、Oracle 等等,如有需要从数据库中获 取数据的分析,应在操作系统下安装相应的数据库管理系统。 三. SPSS 的主要界面 SPSS 的主要界面有数据编辑窗口和结果输出窗口。 数据编辑窗口与微软的 Exdel 类似,但 SPSS 的统计功能更多。SPSS 的结果输出窗口是显示统计分析的结果,此窗 口的内容可以以结果文件.spo 的形式保存。数据编辑窗口和结果输出窗口的详细描 述将在有关 SPSS 的数据文件建立的内容中查到。 四. SPSS 的帮助系统 SPSS 对一些基本模块中的统计提供了帮助,可以通过单击 Help 菜单中的 Statistics Coach 命令,选择所需要的统计指导。§1.1.2 启动 SPSS 软件包当用户在操作系统下运行 SPSS 软件后, 计算机屏幕上出现一个对话框, 如图 1.1 所示:2 图 1.1 SPSS 启动后操作对话框对话框包括一个六选一单选对话框和一个复选对话框,其内容为: ? ? ? ? ? ? ? Run the tutorial 运行操作指南; Type in data 输入数据选项,建立新的数据集时可选择此项; Run an existing query 运行一个已经存在的数据文件选项; Create new query using Database Wizard 用数据库处理工具建立新文件; Open an existing date source 打开一个已经存在的数据文件; Open another type of file 打开其他类型的文件。 Don’t show this dialog in the future 是一复选对话框,选中该复选项 后,下次启动 SPSS 时将不会显示对话框,直接显示数据编辑窗口。§1.1.3 数据文件的建立当对话框选择 Type in data 后,点击 OK,系统将显示出 SPSS 软件包数据编辑 主窗口,数据文件的建立就是在数据编辑窗口中完成的。数据编辑窗口可以显示两张 表,分别是 Data View(见图 1.2)和 Variable View(见图 1.3) ,通过点击下端的 2 个同名窗口标签按钮实现相互切换。标尺栏 当前数据栏 标题栏 菜单栏 工具栏 数据输入区 数据编辑区窗口标签状态栏显示区滚动条图 1.2SPSS for Windows 主窗口示意图 3 数据编辑区是 SPSS 的主要操作窗口,是一个二维平面表格,用于对数据进行各 种编辑;标尺栏由纵向标尺栏和横向标尺栏,横向标尺栏显示数据变量,纵向标尺栏 显示数据顺序(如时间顺序) 。 Data View 表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个 体的序号,最上端行边框显示变量名。 Variable View 表用来定义和修改变量的名称、类型及其他属性,如图 1.3 所示。图 1.3 Variable View 表在 Variable View 表中,每一行描述一个变量,依次是: Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过 8 个字符,共 容纳 4 个汉字或 8 个英文字母,英文字母不区别大小写,最后一个字符不能是句号。 Type:变量类型。变量类型有 8 种,最常用的是 Numeric 数值型变量。其它常 用的类型有:String 字符型,Date 日期型,Comma 逗号型(隔 3 位数加一个逗号)等。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在 Date View 中所显示的列宽(默认列宽为 8) 。 Align:数据对齐格式(默认为右对齐) 。 Measure: 数据的测度方式。 系统给出名义尺度、 定序尺度和等间距尺度三种 (默 认为等间距尺度) 。 如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接 输入数据,系统将默认变量 Var00001,Var00002 等。 定义了变量的各种属性后,回到 Data View 表中,就可以直接在表中录入数据。4 输入数据后可以点击 Save 或 Save as 作为数据文件保存。另外对于统计分析的结果 也可以作为文件保存起来。 为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS 软件编辑窗口 除可以使用*.sav 扩展名数据文件,还可以直接打开和保存下述类型的文件。 SPSS DOS 版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS 统计软件产生的数据文件。§1.2 数据的编辑与整理当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都 是在数据窗口完成的。下面将介绍 SPSS 统计分析软件在数据窗口的主要操作方式和 菜单相应的功能。§1.2.1 数据窗口菜单栏功能操作数据编辑窗口的主菜单如图 1.4 所示,主菜单中的具体功能包括:图 1.4SPSS 主菜单1.File:文件操作。 2.Edit:文件编辑。 3.View:视图编辑。 4.Data:数据操作。 5.Transform:数据转换。 6.Analyze:统计分析方法。 7.Graphs: 图形编辑。 8.Utilities:实用程序。 9.Windows:窗口控制。 10.Help:帮助。 在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计 图形的建立与编辑等操作。5 §1.2.2 Date 数据功能数据编辑窗口的 Data 菜单为用户创建和定义数据提供了方便的功能,如图 1.5 所示。这个菜单是 SPSS 统计软件数据整理的特有功能菜单。它的功能包括:对变量、 观测量的编辑处理;对变量数据的变换;对观察量数据整理。 这些功能为各种统计分析要求提供极其灵活了数据整理功能, 用户可以根据不同 统计分析对数据的要求对数据进行整理。定义变量属性 拷贝数据属性 定义日期变量 插入一个变量 插入观测量 定位观测量 观测量排序 数据文件转置 重构数据结构 合并数据文件 正交设计 拆分数据文件 选择观测量 观测量加权 分类或不分类汇总 标识重复观测量图 1.5 Data 菜单项示意图一、定义和编辑变量、观测量的命令 Define Variable Properties Copy Data Properties Define Dates Insert Variable Insert Case Goto Case Sort Cases Transpose Restructure Merge File Aggregate 用于定义变量属性; 由外部文件和工作文件拷贝数据变量和属性;定义或编辑日期变量格式; 在数据编辑窗口插入一个变量; 在数据编辑窗口插入一个观测量; 光标跳转到某一指定观测量。 对观测量进行排序; 对观测量进行转置; 对现有的观测量进行重新构造,形成新格式的数据文件; 把外部文件数据合并到工作文件中; 对数据进行分类或不分类汇总,产生新文件或代替工作文件。 标识重复观测量;6二、变量数据变换的命令Identify Duplicate Cases Orthogonal Design 三、观察量数据整理的命令 Split File Select Cases Weight Cases进行正交设计。拆分数据文件的观测量,观测量进行条件分组; 选择观测量; 对观测量进行加权处理。通过选择上述命令,可以实现对数据的整理编辑。§1.2.3 Transform 变换及转换功能数据编辑窗口的 Transform 菜单为用户创建和定义复杂的数据提供了方便的功 能,如图 2.3 所示。它与 Data 菜单共同使用,可对基本的数据进行重新编辑,形成 新的变量和观测量。这个菜单主要对变量进行操作,分为三部分的功能。这些功能也 为各种统计分析要求提供极其灵活了数据处理功能。计算产生新变量 创建计数变量 变量值重新编码 产生新的分组变量 观测量排秩 变量值自动编码 创建时间序列变量 创建代替缺失值变量 运行其它转换程序 设定随机数种子图 1.6 Transform 菜单项示意图一. 通过基本变量创建各种新变量; Compute 计算产生新变量,SPSS 提供了 10 类 100 多个函数,通过该菜单可 以用表达式产生一个新变量; Random Number Seed Create Times Series 二. 创建各种参数变量; Count Recode Rank Cases 创建一个计数变量,用于统计计数; 对变量值重新编码; 为观测量排秩,求得的秩在数据窗口作为一个新变量保存; 建立新的分组变量,使数据分成若干个组; 对变量值自动编码,产生一个连续的变量值编码; 创建替代缺失值变量;7创建随机数种子; 创建时间序列变量;Categorize Variables Automatic Recode Replace Missing Values 三.运行其它自定义的转输程序。 Run Pending Transform 运行其它转换程序。 在一般的情况下,通过 Date 菜单和 Transform 菜单的操作就可以实现对原始数 据的整理和变换。§1.2.4 数据的编辑在 Data View 中,用鼠标左键单击数据表左边框的观测个体序号,这一行值就会 被选中,用鼠标左键单击上边框的变量名,这个列就被选中,和其它 Windows 中的操 作类似,也可以用鼠标对选中一部分单元格,选中的行、列、单元格后,单击鼠标右 键,可以对它们进行复制、删除、剪切等操作。 如果需要对已经输入的数据进行修改,就要对已经存在的数据进行编辑,SPSS 有许多数据编辑功能。下面介绍几种常用的数据编辑功能。 一、插入一个新观测量(Case) 插入一个新观测量(数据)的命令是 Insert Cases。 在数据窗口主菜单上单击 Date?Insert Cases 命令,可以在光标所在位置的前 上一行插入一行新的观测个体,可以输入新的观测数据。 二、查找指定的观测量(数据) 查找指定的观测数据的命令是 Go to Case。 在数据窗口单击 Date?Go to Case,弹出一个对话框,如图 1.7 所示:输入要 找的观测量的序号后,点 OK 按钮,数据表中光标就会指到选定的观测量个体。图 1.7Go To Case 对话框三、 观测数据排序 给观测量数据排序的命令是 Sort Cases。 在数据窗口单击 Date?Sort Cases,打开 Sort Cases 对话框(见图 1.8 ) 。8 图 1.8Sort Case 对话框从对话框左侧的变量列表中选择排序变量,点击右箭头按钮加入 Sort by 框中, 然后在 Sort Order 栏中选择排序顺序: Ascending 观测个体按照选定的排序变量值由小到大的升序排列; Descending 观测个体按照选定的排序变量值降序排列。 注意:观测个体.排序变量可以是一个或多个,当选择多个排序变量时,首先按 第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排 序,依次类推。 注意在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那 一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信 息,最好自己定义一个变量来记录观测个体的序号。 四、在数据中选取子集 如果需要从数据文件中选取一部分数据,可以在数据编辑窗口单击 Data → Select Case,打开 Select Case 对话框,如图 1.9 所示:图 1.9Select Case 对话框在该对话框的 Select 栏中选择挑选数据子集的方式(单选) : ? ? All case:选择所有数据; If condition is satisfied: 按指定条件选择数据。单击 If 按纽,打开 Select Case:If 对话框,如图 1.10 所示,先选择变量,然 后定义条件。9 ?Random Sample of cases:对观察值进行随机抽样。单击 Sample 按纽,打 开 Select Case:Random sample 对话框。如图 1.11 所示。图 1.10Select Case:If 对话框在 Sample Size 栏中有两种选择方式,一种是大概抽样(Approximately), 即键入抽样比例后由系统随机抽样;另一种是精确抽样((Exactly),要求输入 从第几个观察值起抽取多少数据。图 1.11 Select Case:Random Sample 对话框?Based on time or case range:顺序抽样。单击 Range 按纽,打开 Select Case: Range 对话框,用户自行定义从第几个观察值开始抽到第几个观察值 结束。 Use filter variable:用指定变量作过滤。先选择一个变量,系统自动在 数据管理器中将该变量值为 0 的观测单位标上删除记号, 系统对标有删除记 号的观测单位不作分析。?选择了挑选数据子集的方式后, 单击 OK, 在数据窗口可看到新的变量 filter_s。 如在数据文件 SY-1 中,选择年龄大于 48 岁的人作为选择子集。则满足条件的年龄大 于 48 岁的相应的新变量数据为 1,否则为 0。 五、数据分类汇总(数据分组汇总) 用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以数据库 SY-2 两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇 总命令实现。具体操作如下。10 1.指定分类变量和汇总变量。 打开数据库 SY-2, 在数据窗口单击 Date?Aggregate 命令, 打开 Aggregate Date 对话框。如图 1.12 所示:图 1.12 Aggregate Date 对话框2. 在变量名列表框中选择分类变量”性别”进入 Break Variable(s)。 3. 在变量名列表框中选择汇总变量”Math”进入 Aggregate Variable(s)。 4. 单击 Function 按纽,打开 Aggregate Date:Function 对话框,如图 1.13 所示。在此对话框中可以选择平均值、数据和、标准差的形式,特别值形式,百分数 形式、频数形式等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回 Aggregate Date 对话框中。11 图 1.13 Aggregate Date:Aggregate Function 对话框5. 在 Aggregate Date 对话框中指定汇总文件的保存路径。有两种选择:一种是 选中创建新数据文件,通过 File 按纽,重新指定结果文件名。一种是替代原来数据 文件,用分类汇总结果覆盖当前编辑窗口的数据。 6. 单击 Name&Label 按纽,可以重新指定结果文件中的变量名并加入变量标签。 SPSS 默认的结果文件中的变量名为原变量名最后加上_1. 7. 如果希望在结果文件中保存各分类组的数据个数,可以选择 Save number of case in break group as variable 项。最后单击 OK,可得相应的数据文件。 六、缺失值的替代方式 如果用户希望对缺失值进行定义,可以采用以下的操作: 在数据窗口点击 Transform?Replace Missing Values,打开 Replace Missing Values,对话框,如图.1.14.所示:12 图 1.14 Replace Missing Values 对话框在变量中选择具有缺失值的变量进入 New Variable 框内,系统可以自动产生替 代缺失值的新变量,也可处定义新变量。然后在 Method 的下拉菜单中选择缺失值的 替代方式。五种方式依次是: Series mean 用该变量所有非缺失值的平均值替代缺失值; 用缺失值相邻点的的非缺失值的中位数替代缺失值; 用缺失值相邻点的的非缺失值的中点值替代缺失值; 用线性拟合方式替代缺失值。 Mean of nearly point 用缺失值相邻点的的非缺失值的平均数据替代缺失值; Median of nearly point Linear interpolation Linear trend at point 七、数据秩(序)的确定 如果用户需要对已有的数据变量排秩(序) ,如对数据 SY-1 中两个班的数学成绩 分别排出名次,可以在数据窗口采用以下操作。 1. 单击 Transform?Rand Cases,打开 Rand Cases 对话框,如图 1.15 所示:13 图 1.15 Rand Cases 对话框2. 从左 边变量 名列 表框中 选择变 量 ”数 学” ( 也可选 择多个 变量) 进入 Variable(s)框中,选择变量”班级”进入 By 框中,则系统排序时将按照进入 By 的 变量值“班级”进行分别排序。 3. 单击 Ties 按纽,选择 Ties(Ties 是指两个或两个以上的数据相等的情况) 的处理方式。由于秩与数据个数是一一对应的,当数据有相同的时,确定它们相应的 秩有三种处理方式:对应秩的 Mean 平均值、Low 最小值和 high 最大值。如本例选择 最大值。选择后返回在主对话框。点击 OK,就可以在数据窗口看到排序结果。 Rank Types 按纽提供排秩方式。单击 Rank Types 按纽,打开 types 对话框,从 中选择排秩类型,排秩类型从左到右依次是:Rank 普通排序(系统默认),新变量的 值就是秩;Fractional rank as% 累计百分数排序;Savage score 以指数分布为基 础的原始分排序; of Case weights 以分组例数之和的权重排序; Sum Fractional rank 以秩变量除以分组例数之和排序;Ntile 先给定一个大于 1 的整数,系统按照此数的 范围确定秩。§1.2.5 SPSS 对变量的编辑一、插入一个新变量 插入一个新变量的命令是 Insert Variable。 在数据窗口单击 Data→Insert Variable,会在光标所在位置的前一列插入一个 新的变量,变量名字和属性可以在 Variable View 窗口中定义。 二、已存在的变量生成新变量 对于已存在的数据变量,根据需要进行计算生成新变量的命令是 Compute。 在数据窗口单击 Transform? Compute,打开 Compute Variable 对话框,如图 1.16 所示。 在对话框左上方 Target Variable 栏中,键入即将生成的新变量的名称,并单击 Type & Lable 按纽确定变量标签及数据类型。对话框的左下栏中给出了数据文件中 所有可用的变量列表,我们可以用右箭头按钮从中选取所需的变量进入右上方的 Numeric Expression 栏中,该栏存放运算表达式,运算表达式中所需要的常用函数 可以从下的 Functions 列表中直接选取。这些常用函数(见附录 2)和其它语言中的 函数名称类似,在框中按字母顺序排列,用鼠标选中某个函数,用 Functions 右面的 上箭头按钮加入数值表达式中,对话框中间是一个小键盘,可以用来输入数字、运算 符号等。Compute Variable 对话框的下面还有一个 if 按钮,可以选一部分满足某种 条件的观测个体来做运算,不满足条件观测,其新变量值缺失。14 图 1.16 Compute Variable 对话框如图 1.16 表示的是数据 SY-2 中每个学生的数学和物理总成绩。在 Compute Variable 对话框中填好新变量名称和运算表达式后,点击 OK 按钮,就可以在数据文 件中看到,已经生成了一个新变量 Total。 三、产生计数变量 如果用户需要对满足某项条件的数据进行计数,可以使用 Count 命令。以学生成 绩数据 SY-1 为例,说明具体操作步骤: 在数据窗口单击 Transform?Count,打开 Count Occurrence of Value within Cases 对话框,如图 1.17 所示:图 1.17Count Occurrence of Value within Cases 对话框先在 Target Variable 中指定一个变量(可以是已经存在的变量或新变量) ,并 定义变量标签,然后指定要统计的变量加到 Numeric Variables 框中,再单击 Define Values 按纽,打开 Value to Count 对话框。如图 1.18 所示:15 图 1.18 Count Values within Cases:Value to Count 对话框在上面的对话框中,确定需要计数的数值,其 Value 值的设置项依次是: Value:输入某个值为清点对象; System-missing:以系统的缺失值为清点对象; System-or user missing:以系统或用户指定的缺失值为清点对象; Range:指定数值的计数区域:其中包括: ( ( )through( )在框内指定下限和上限 ): 在框内只指定上限; lowest through()highest through: 在框内只指定下限。图中给出的是计算达到优良标准,即学生达到 80 分以上课程数。确定了计数数 值后,单击 Add,使选择结果进入 Values to count 框内。单击 Continue 按纽,返 回主对话框中。如果需要,可以单击 If 按纽确定计数条件。最后点 OK 可在数据窗口 得到计数变量。 四、变量分组(编码)与自动分组(编码) Transform 菜单下还有以上两条分组(编码)命令。对变量数据的重新分组(编 码) ,是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一 组。比如,可以对年龄重新分组,19 岁及以下年龄赋予一个编码 1,20-29 岁的年龄 码赋予 2,30-39 岁年龄码赋予 3,依此类推,这些码只能取正整数值。从某种程度 上来讲,编码也可以看做分组:一个组对应一个组号,这样就把这些人按年龄分为几 个组,一目了然。 变量重新编码命令为 Recode, 自动重新编码命令为 Automatic Recode。 Automatic 两者的区别是:Automatic Recode 命令是 SPSS 系统自动设定码为正整数,而 Recode 可以根据用户的需要指定特别的码值。自动编码的具体操作为: 在数据窗口单击 Transform? Automatic Recode 打开 Automatic Recode。对话 框,从左侧的变量列表中选出被将重新编码的原变量,在 New Name 按钮右边空白栏 中输入新的码值的变量名,点 New Name 按钮放到上面的栏中。对话框底下有两个选 项,以确定编码是从最小的开始,还是从最大的开始,点 OK 执行这条命令。需要注 意的是,码与秩是不同的,请读者在学习时注意它们的区别。16 如果用户需要自定义分组的条件, 可选择 Recode 命令。 Recode 命令有两个选项, 分别是: Into Same Variables:数据编码后新的码值直接放到原来的变量中; Into Different Variables:数据编码后新的码值存到一个新变量中。 为了避免数据丢失,尽量不要轻易选择前者。 选择后者的 Recode 命令对话框如 图 1.19 所示,图 1.19Recode Into Different Variables 对话框选择需要重新分组(编码)的变量进入 Numeric Variable?Output 框中,并在 右边的 Output Variable 框中定义新的变量名及变量标签,单击 Old and New Values 按纽,打开对话框,Old and New Values 对话框最左侧有六个选项,用来确定原变 量的取值区间(或单个变量值) ,它们将被赋予一个相同的新码值,新的码值在右上 方的 New Value 栏中填入。填好后 Add 按钮就被激活了,单击此按钮,就把这个旧的 变量区间(值)以及新的码值到 Old-&News 栏中。重复以上步骤,把所有的区间一个 一个都输入后,点 Continue 按钮回到 Recode Into Different Variables 菜单,点 OK 按钮执行命令,即在数据窗口可得到需要的分组赋值变量。§1.3 基本统计描述在建立了数据文件之后,需要对数据作进一步的考察,如了解数据的基本特征, 如数据的均值、标准差、四分位点,数据的分布形态等,这个过程称为对数据进行基 本统计描述。所以说,数据的基本统计描述的目的是:了解数据的基本特征和基本分 布形状,为进一步分析做好充分准备。 ? 本节主要内容:数据的基本统计描述方法:频数分析、探索分析及交叉列联 表分析等。§1.3.1 描述统计分析过程描述统计分析是对数据进行基础性描述。可以得出数据的平均值(Mean)、和 (sum)、标准差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、极 差(range)、 平均值标准误(S.E.Mean),峰度(Kurtosis)、 偏度 (Skewness) 等统计量。 以 2002 年全国职工平均工资表为例(数据库 SY-2) ,介绍描述统计分析的具体17 操作步骤如下: 1 、 首 先 打 开 数 据 表 SY-2 , 按 照 Analyze?Descriptives Descriptives 打开 Descriptives 对话框,如图 1.20 所示 Statistics?图 1.20Descriptives 主对话框2、从左边源变量中选择一个或者几个变量进入右框中,单击 Options 按钮,打 开 Options 对话框,如图 1.21 所示:图 1.21 Descriptives Options 对话框在对话框中最上面一行是 Mean:均值,sum:算术和 ? Dispersion 离差栏 Std.Deviation 标准差 Variance Range ? 方差 极差 Minimum 最小值 Maximum 最大值 S.E.mean 均值的标准误 Kurtosis 峰度18Distribution 分布状态栏 Skewness 偏度 ?Display Order 栏,选择输出方式:Variable List 按变量表次序; Alphabetic 按字母顺序; Ascending Meas 按平均值升序; Descending Means 按平均值降序。 如在此例中选择按平均值升序项,返回主对话框,单击 OK,在输出窗口得描述 统计分析输出表。表1.1 Descriptive Statistics基本描述统计表Descriptive Statistics N 城镇集体 股份合作 有限责任 股份有限 国有单位 外商投资 Valid N (listwise) 31 31 31 31 31 29 29 Minimum 55 65 Maximum
Mean 0.87 10.06 95.07 Std. Deviation 7.924 1.683 6.869§1.3.2 频数分析对于一组数据,考察不同的数据出现的频数,或者是数据所落入指定的区域内的 频数,可以了解数据的分布状况。数据文件 SY-3 是一个公司职员表,其中有性别、 年龄,受教育年限等五个变量,具体操作如下: 1 、 打 开 数 据 文 件 SY-3 后 , 单 击 Analyze?Descriptive Statistics? Frequencies 打开频数分析对话框如图 1.22 所示。图 1.22频数分布主对话框2、在左边的变量框中选中一个或多个变量送入 Variable(s)。19 3、选中 Display frequency tables 要求输出分布表。 4、单击 Statistics 按钮,得到对话框图 1.23。 在 Frequencies: Statistics 对话框中选择要求输出的统计量。图 1.23Frequencies: Statistics 对话框?Percentile Values 百分数选择项栏(复选项) Quartile 四分位数, Cut points equal groups 等分位点百分位数(取值范围在 2?100 之间) 。 Percentile(s)自定义百分数。? ? ?Dispersion 离差栏(见§1.3.1 基本统计描述过程) Central Tendency 中心趋势栏 Sum 算术和. Distribution 分布状态栏Mean 算术平均值(均值), Median 中位数, Mode 众数,在本例中选择四分位点、10 等分的百分位点;标准差、方差、最大、最小值; 全距、均值、均值的标准误,中位数、偏度、峰度等复选项。 5、单击 Chart 按钮,得到 Frequencies: Chart 对话框图 1.24. 在对话框中有 ? Chart Type 图形栏(单选) ,选择输出的图形类型。 None 不输出图形(系统默许) Pie charts 饼图 ? Bar charts 条形图 Histograms 直方图With normal curve 直方图中显示正态曲线(只有选择直方图时才能选择) 。 Chart Values 栏,选择图形中分类值的表现形式。 Frequencies 直方图纵轴为频数,饼图中每块表示属于该组观测值频数; Percentage 直方图纵轴为百分比,饼图中每块表示该组的观测量数占总数的百 分比。20 图 1.24 Frequencies: Chart 对话框6、单击 Format 按钮,得到对话框图 1.25。图 1.25 Frequencies: Format 对话框在 Frequencies: Format 对话框中: ? Order by 排序栏,表示频数分布表的排列顺序。(单选) Ascending values 按变量值升序排列(系统默许) 。 Descending values 按变量值降序排列。 Ascending counts 按变量各种取值发生的频数升序排列。 Descending counts 按变量各种取值发生的频数降序排列。 如果设置了直方图,频数表将按照变量值顺序排列。 ? Multiple Variables 多变量输出表格设置(单选)。 Compare variables 将所有变量的结果输出在一个表中。 Organize output by variables 为每一个变量输出一个表。 ? Suppress tables with more than _ categories 控制频数表输出的分类数 复选项。Maximum number of categories 分类数最大参数值,默许值是 10. 本例中均选择系统默认项。点击 OK,得到输出表 1.2.21 表 1-2(a)年龄 NStatistics统计分析表Valid Missing 70 0 42.66 1.223 10.232 .775 .287 -.010 .566 24 70 10 20 25 30 40 50 60 70 75 80 90 33.00 35.00 36.00 36.00 38.00 39.00 42.60 46.70 50.00 52.00 59.00Mean 均值 Std. Error of Mean 均值的标准误 Std. Deviation 标准差 Skewness 偏度Std. Error of Skewness 偏度的标准误 Kurtosis 峰度 Std. Error of Kurtosis 峰度的标准误 Minimum 最小值 Maximum 最大值 Percentiles百分数表1-2(b)年龄 Frequency 频数 Valid 24 30 32 33 34 35 36 37 38 39 41 42 2 2 2 4 2 4 7 4 6 5 3 1频数表Percent % 2.9 2.9 2.9 5.7 2.9 5.7 10.0 5.7 8.6 7.1 4.3 1.4 22 Valid Percent 2.9 2.9 2.9 5.7 2.9 5.7 10.0 5.7 8.6 7.1 4.3 1.4 Cumulative Percent 2.9 5.7 8.6 14.3 17.1 22.9 32.9 38.6 47.1 54.3 58.6 60.0 43 44 45 46 47 49 50 51 52 53 55 57 58 59 61 66 70 Total2 1 3 1 2 1 2 1 2 2 1 1 1 3 2 2 1 702.9 1.4 4.3 1.4 2.9 1.4 2.9 1.4 2.9 2.9 1.4 1.4 1.4 4.3 2.9 2.9 1.4 100.02.9 1.4 4.3 1.4 2.9 1.4 2.9 1.4 2.9 2.9 1.4 1.4 1.4 4.3 2.9 2.9 1.4 100.062.9 64.3 68.6 70.0 72.9 74.3 77.1 78.6 81.4 84.3 85.7 87.1 88.6 92.9 95.7 98.6 100.0表 1.2(c)直方图年龄302010FrequencyStd. Dev = 10.23 Mean = 42.7 0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 N = 70.00年龄从上面的表和直方图中可以观察到该公司 32 岁至 47 岁之间的人数最多, 占到总 人数的 60%以上。23 §1.3.3 探索分析过程探索分析是对数据进行初步的观察分析,主要的分析项目有: ? 观察数据的分布特征:可通过绘制箱图和茎叶图等图形直观地反映数据的 分布形式和数据的一些规律性,包括考察数据中是否存在异常值等。 ? 正态分布检验:检验数据是否服从正态分布。 ? 方差齐性的检验:用 Levene 检验比较各组的方差是否相等。 以数据库 SY-1 提供的两个班的学习成绩数据为例,对两个班的数学成绩按照性 别进行数据的分布、按照性别检验其数学成绩的方差是否相等。打开数据库 SY-1, 具体操作步骤: 1、单击 Analyze-&Descriptive statistics-&Explore,打开 Explore 主对话框: 如图 1.26 所示:图 1.26探索分析主对话框(1) 从左侧的变量列表中选出变量”数学”,送入 Dependent List 栏; (2) 选择”性别”作为因子变量,送入 Factor List 栏。有了因子变量,SPSS 会把所有的观测个体按照因子变量的取值分成若干各组,再分组考察 Dependent List 中的各个变量,如果不选择因子变量,SPSS 会对全部观 测来做探索分析。 (3) 选择”班级”标识变量送入 Label Case 栏,当输出涉及到观测量时,使 用该变量值标识各观测量。 (4) 在 Display 栏中选择输出项,依次是 Both 选择项,输出图形与描述统计 量(系统默认) ,只输出描述统计量和只输出图形。本例中选择默认项。 2、单击 Statistics 统计量按钮,打开 Statistics 对话框,选择统计输出量。有 四个选择项,分别是: Descriptives 基本统计描述。同时指定均值的置信区间的置信度,系统默认为 95%。24 M-估计(M 估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而 变化) ; Outliers 输出分析数据中五个最大值和五个最小值; Percentiles 输出百分数。 本例中选择 Descriptives 和 Outliers 后,返回主对话框。如图 1.27 所示。图 1.27探索分析 Statistics 对话框3、单击Plots 图形按钮,打开Plots对话框,如图1.28所示。图 1.28探索分析 Plots 对话框对话框中有四个选择栏: ? Boxplot 箱图选择栏。 Factor levels together 因变量按因素水平分组(系统默认) ; Dependents together 所有因变量生成一个并列箱图(本例中选择项) ; None 不显示箱图。 箱图中,最底部的水平线段是数据的最小值(奇异点除外) ,顶部的水平线段是 数据的最大值(奇异点除外) ,中间矩形箱子的底所在位置是数据的第一个四分位数 (即 25%分位数) ,箱子顶部所在位置是数据的第三个四分位数据(即 75%分位数) 。 箱子中间的水平线段刻画的是数据的中位数(即 50%分位数) 。25 ?Descriptive 描述图形栏(复选项) 。 Stem-and-leaf 茎叶图(系统默认) Histogram 直方图?Normality plots with test(复选项),正态分布检验并输出 Q-Q 图。? Spread vs level with Levene Test 栏,对所有的散布―层次图,同时输出 回归直线的斜率以及方差齐性的 Levene?s 检验,但如果没有指定分组变量, 此选择项无效。四个单选项依次为: None:不产生回归直线的斜率和方差齐性检验(系统默认) ; Power Estimation 转换幂值估计(对每组数据产生一个中位数自然对数及四个 分位数的自然对数的散点图)选项; Transformed 变换原始数据选择项(可在参数框中选择数据变换类型) ; Untransformed 不变换变换原始数据选择项。 本例中选择茎叶图,正态分布检验,方差齐性检验等。 4、单击 Option 按纽,打开 Option 对话框如图 1.29 所示。可选择缺失值的处理 方式,SPSS 提供三种处理方式:图 1.29 探索分析 Option对话框Exclude cases listwies 剔除带缺失值的观测量(系统默认) 。本例选择此项。 Exclude cases pairwise 剔除带缺失值的观测量时还一并剔除与缺失值有成 对关系的观测量。 Report values 输出频数表时同时输出缺失值。 5、单击 OK,得到相应的输出结果如表 1.3 所示。 表1.3 Explore 探索分析表1.3(a)Case Processing Summary 数据概述性别 Valid有效值 N个数 数学 女 男 33 47 Percent百分比 100.0% 100.0% N 0 0 Cases数据 Missing缺失值 Percent .0% .0% N 33 47 Total总数 Percent 100.0% 100.0%26 表1-3(b) 性别 数学 女Descriptives基本统计描述表Statistic Mean均值 95% Confidence Interval for Mean置信区间 Lower Bound置信下限 Upper Bound置信上限 78.82 74.88 82.76 79.35 79.00 123.403 11.109 46 99 53 12.50 -.771 1.320 78.64 Lower Bound置信下限 Upper Bound置信上限 75.59 81.69 78.78 81.00 107.714 10.379 53 98 45 16.00 -.367 -.533 .347 .681 .409 .798 1.514 Std. Error 1.9345% Trimmed Mean修正均值 Median 中位数 Variance 方差 Std. Deviation 标准差 Minimum 最小值 Maximum 最大值 Range 极差 Interquartile Range四分位间距 Skewness 偏度 Kurtosis 峰度 男 Mean均值 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis表1.3(c)Extreme Values极端值 (按照性别输出数学成绩的五个最大值及五个最小值)性别 数学 女 Highest 1 2 3 4 5 Lowest 1 2 3 4 Case Number 80 78 75 74 70 1 3 8 12 班级 1 2 1 1 1 1 1 1 2 Value 99 96 94 92 89 46 57 64 6627 5 男 Highest 1 2 3 4 5 Lowest 1 2 3 4 514 79 77 76 73 71 2 5 4 7 62 2 1 2 2 1 2 2 1 2 167 98 96 94 91 90(a) 53 62 62 63 63a Only a partial list of cases with the value 90 are shown in the table of upper extremes.表1.3(d) Tests of Normality正态分布检验表Kolmogorov-Smirnov(a) 性别 数学 女 男 Statistic .097 .110 df 33 47 Sig. .200(*) .200(*) Statistic .963 .971 Shapiro-Wilk df 33 47 Sig. .324 .291* This is a lower bound of the true significance. a Lilliefors Significance Correction从表1.3(d)的检验结果可以看出,由于假设检验的P值均大于0.05,故可以认 为男女生的数学成绩分布都近似地服从正态分布。表1.3 (e)Test of Homogeneity of Variance 方差齐性检验Levene Statistic df1 1 1 1 1 df2 78 78 76.348 78 Sig. .833 .880 .880 .856数学Based on Mean基于均值 Based on Median基于中位数 Based on Median and with adjusted df基于中位数及修正的自由度 Based on trimmed mean 基于修正的均值.045 .023 .023 .033由表1.3(e)得出方差齐性检验的P值为0.8以上,故认为男女生数学成绩的方差 是相等的。 表 1.3(f)Frequency 1.00 1.00 3.00Stem-and-Leaf Plots 茎叶图SEX= 女 Stem & 5 . 6 . 6 . 7 4 678 Leaf (=&46)一个极端值数学 Stem-and-Leaf Plot for 1.00 Extremes28 3.00 9.00 4.00 7.00 2.00 2.00 Stem width: Each leaf:7 . 7 . 8 . 8 . 9 . 9 .234 34
69 101 case(s)表1.3(g)Normal Q-Q Plots 正态分布Q-Q图Normal Q-Q Plot of 数学For SEX= 女210Expected Normal-1-2 40 50 60 70 80 90 100 110Observed Value上图中间的斜线是服从正态分布的标准线。从上面的分布图中看出,除个别极端 点外,数据点都在斜线周围波动,故可以认为女生的数学成绩近似服从正态分布。 表1.3(h)Detrended Normal Q-Q Plots离散正态分布图29 Detrended Normal Q-Q Plot of 数学For SEX= 女.4 .2 0.0 -.2 -.4Dev from Normal-.6 -.8 -1.0 -1.2 40 50 60 70 80 90 100Observed Value从上面的离散正态分布图中看出,除个别极端点外,离散点都在±2的周围波动, 故可以认为女生的数学成绩近似服从正态分布。 表1.3(i) 按照性别绘制的数学成绩的箱图1101009080706050140N= 33 47女男性别从上面的箱图中可以得出结论: 女生的数学成绩的平均水平比男生低且分散程度 小,但有一个极端值。§1.4 交叉列联表分析30 当观察的现象与两个因素有关时,如某种服装的销量受价格和居民收入影响;某 种产品的生产成本受原材料价格和产量的影响等等, 交叉列联表分析可以比较好的反 映出两个因素之间有无关联性,两因素与现象之间的相关关系。因此,数据交叉列联 表分析主要包括两个基本任务: ? 根据收集的样本数据,产生二维或多维交叉列联表; ? 在交叉列联表的基础上,对两两变量间是否存在关联性进行检验。 下面仍然以数据SY-1学生成绩为例,将学生成绩按照五级制分等级后,按照班级 形成数学等级和物理等级交叉分析表,并考察学生的物理和数学成绩间有无关联性。§1.4.1 交叉列联表的形成制作交叉列联表的具体操作步骤. 1、打开数据 SY-1,单击 Analyze?Descriptive Statistics? Crosstabs 对话 框如图 1.30 所示。 2、如果是二维列联表分析,可以将行变量选择进入 Row(s)中,将列变量选择进 入 Column(s)框中。如进行三维以上的列联表,可以将其它变量作为控制变量选到 Layer 框中。多控制变量可以是同层次的也可以是逐层叠加的。此例中选择数学等级 为行变量,物理等级为列变量,班级作为控制变量。 3、Display clustered bar chart 选择项,可以指定绘制各变量交叉频数分布 柱形图。Suppress table 表示不输出列联表,只有在分析行列变量间关系时选择此 项。此例中不选择这一项。图 1.30交叉列联表对话框4、单击 Cell 按纽,打开 Crosstabs:Cell Display 对话框,如图 1.31 所示。31 从对话框中指定列联表单元格中的输出内容。在 Counts 框中选择 Observed 观察值 (系统默认)或 Expected 期望频数; 。在 Percentages 框内选择 Row 行百分比、Column 列百分比及 Total 总百分比。在 Residuals 框中选择输出残差。其中 Standardize 为标准化残差。 Adj. standardize 为修正的标准化残差。 本列中选择默认项观察值。图 1.31 Crosstabs:Cell Display 对话框5、单击 Format 按纽,指定列联表的输出排列顺序,一般选择系统默认的升序。 然后点击 OK,就可得到交叉列联表如表 1.4 所示。表 1.4Count 班级 优 1 数学等级 优 良 中 及 不及格 Total 2 数学等级 优 良 中 及 不及格 Total 4 3 0 0 0 7 4 1 0 0 0 5 良 1 10 5 0 0 16 1 12 5 0 0 18 物理等级 中 0 2 5 2 0 9 0 1 6 3 0 10 及 0 0 1 3 2 6 0 0 2 3 0 5 不及格 0 0 0 1 0 1 0 0 0 2 1 3 5 15 11 6 2 39 5 14 13 8 1 41 Total数学等级 * 物理等级 * 班级 Crosstabulation 交叉列联表从上表中可以看出,一班中数学和物理成绩均为优秀者有四人,数学不及格的两 人的物理成绩都是及格。§1.4.2 两变量关联性检验(Chi-square Test 卡方检验)32 卡方检验是一种非参数检验方法。 可以用来检验两个变量因素之间是否有关联关 系。如果要考察学生的数学成绩和物理成绩之间是否有关联,相当于检验假设: H0:数学成绩和物理成绩之间是相互独立的(无关联关系) ; H1:数学成绩和物理成绩之间的关联关系显著。 由于列联分析表 1.4 中出现数据中小于 5 的值太多,故将数学等级合并,优良 等级合成一组,中、及和不及等级合成一组,同样可得物理分组,通过 Transform 菜单中 Recode 命令实现。实现新的分组后,可以实施卡方检验的具体操作步骤: 1、打开数据 SY-1,打开数据文件后按照 Analyze?Descriptive Statistics? Crosstabs 对话框如图 1.30 所示. 2、选择数学分组为行变量,物理分组为列变量,班级作为控制变量。 3、单击 Cell 按纽,打开 Cell Display 对话框,选择观察值为输出内容。 4、单击 Exact 按纽,打开 Exact Test 对话框如图 1.32,此对话框提供检验方 式。三个单选项分别是: (1) Asymptotic only 选择项,适用于具有渐近分布的大样本数据(默认项) ; (2) Monte Carlo 选择项,此项为精确显著水平值的无偏估计,无需数据具 有渐近分布的假设,是一种非常有效的计算确切显著性水平的方法。在 Confidence 参数框 k 中输入数据, 确定置信区间的大小, 一般为 90, 99。 Mumber of sample 95, 在 样本框中输入样本量数据。 (3) Exact 选择项,观察结果概率,同时在下面的 Time limit per test 框内, 选择进行精确检验的最大时限。 本例中不作选择。图 1.32 Exact Test 对话框5、单击 Format 按纽,从中选择排列顺序。一般取默认项,即升序排列。 6、单击 Statistics 按纽,打开 Crosstabs:Statistics 对话框如图 1.33 所示。 从中选择检验统计量:33 图 1.33Crosstabs:Statistics 对话框? Chi-square 卡方检验复选项,主要检验是行与列变量的独立性检验,也可称 作 Pearson chi-square 检验。本例中只选择此项。 ? ? Correlations 复选项,要求输出 Pearson 和 Spearman 相关系数。 Nominal 栏,适用于名义变量统计量。(1) Contingency coefficient 列联系数; (2) Phi and Cramer?s V ?系数和 Cramer 系数; (3) Lambda 系数 (4) Uncertainty coefficient 系数 ? Ordinal 栏,适用于有序变量的统计量。 (1) Gamma 选择项,两有序变量之间的关联性的对称检验; (2) Somer?s 两有序变量之间的关联性的检验; (3) Kendall?s tan-b 复选项,考虑有结的秩或等级变量关联性的非参数检验。 (4) Kendall?s tan-c 复选项,忽略有结的秩或等级变量关联性的非参数检验。 ? Nominal by interval 栏,适用于一个名义变量与一个等间隔变量的检验。 ? Cochran?s and Mantel Haenszel statistics 适用于一个二值因素变量和一 个二值响应变量的独立性检验。 有关检验统计量的详细内容请参阅附录 1。 选择完成后,单击 OK,就可得到相应的检验结果如表 1.4 所示。表1.4 Chi-Square Tests 卡方检验表Asymp. Sig. 班级 1 检验统计量 Pearson Chi-Square皮尔逊卡 Value 16.333(b) df 1 (2-sided) .000 Exact Sig. (2-sided) Exact Sig. (1-sided)34 方检验 Continuity Correction(a)连续 修正统计量 Likelihood Ratio极大似然比卡 方 Fisher&#39;s Exact Test费舍尔精 确检验 Linear-by-Linear Association 线性相关卡方 N of Valid Cases 2 Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher&#39;s Exact Test Linear-by-Linear Association N of Valid Cases a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.79. c 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.34. 20.942 41 1 .000 15.914 39 21.465(c) 18.641 24.809 1 1 1 .000 .000 .000 .000 .000 1 .000 13.807 17.898 1 1 .000 .000 .000 .000从表1.4中, 检验统计量有五种, Pearson Chi-Square 皮尔逊卡方检验; Continuity Correction连续性修正统计量;Likelihood Ratio极大似然比卡方检验;Fisher&#39;s Exact Test费舍尔精确检验和Linear-by-Linear Association线性相关性检验。连续性修正统 计量是根据卡方分布是连续型随机变量,而列联表中分类数据是不连续分布,所以由 SPSS自动对列联表进行连续性校正得到的连续修正统计量。在小样本的情况下,主 要参考Correction连续性修正和Fisher&#39;s Exact Test费舍尔精确检验的结果。本例中几 种检验的P值均小于0.05,所以认为数学成绩与物理成绩之间关联性是比较显著的。 这个结论与实际情况是相符的。练 习 一1、根据下面表中提供的 2002 年全国 31 个省、市、自治区的 GDP 数据,求出 GDP 的 平均值、人均 GDP 的平均值、中位数、标准差、峰度、偏度、前五位及后五位的省份, 并作出茎叶图、检验人均 GDP 的 95%的置信区间,35 省份 上海 北京 天津 浙江 江苏 广东 福建 山东 辽宁 新疆 湖北 河北 吉林 海南 湖南 河南GDP 值(亿) 00
00 0 6000人口(万) 01 42 38 44 0 9256省份 山西 黑龙江 宁夏 安徽 重庆 青海 四川 西藏 陕西 云南 江西 广西 甘肃 内蒙古 贵州GDP 值(亿) 0 0 0 00 0人口(万) 2 8 5 89 252、下面表中给出的是一组周岁儿童的身高,性别数据,1 代表男,0 代表女。试根 据表中的数据建立数据文件, 对数据进行基本统计描述, 给出身高的平均值、 标准差、 四分位点、频数分布直方图、箱图,并检验这组数据是否服从正态分布。 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 身高 64 66 67 68 68 69 70 70 71 72 72 73 73 73 73 性别0 1 1 0 0 1 1 1 0 1 0 0 0 1 1周岁儿童的身高表(厘米) 序号 身高 性别 序号 身高16 17 18 19 20 21 22 23 24 25 26 27 28 29 30性别0 0 0 0 1 1 0 0 1 0 0 1 1 0 1序号 46 47 48 49 50 51 52 53 54 55 5657 58 59 60身高 78 78 78 78 78 78 79 79 79 79 80 80 80 81 82性别174 74 74 74 74 74 75 75 75 75 75 75 75 75 761 0 0 1 0 1 1 1 0 0 1 0 0 1 131 32 33 34 35 36 37 38 39 40 41 42 43 44 4576 76 76 76 76 76 76 76 77 77 77 77 77 77 771 0 0 0 1 1 00 1 1 1 0113、调查 339 名 50 岁吸烟习惯与慢性支气管炎病的关系,得下表。试问吸烟者与不吸36 烟者的慢性气管炎患病率是否有所不同?(α =0.05)是否 是否 吸烟患病 kh 2 患慢性气炎吸烟 43 162 205 21不吸烟 13 121 134 9.5∑ 56 283 339 16.5未患慢性气炎 ∑ 患病率%4、为了调查男性、女性购车者的观点,调查了一百名购车人,检验性别对安全性能 的偏好之间有无联系。不同性别的汽车购买者认为最重要的安全措施(参考文献[13]) 调查者 男 女 合计 ABS 刹车 15 5 20 改良悬架 5 5 10 气袋 20 10 30 自动门锁 5 20 25 电路控制 5 10 15 合计 50 50 10037 第二章均值比较检验与方差分析在经济社会问题的研究过程中, 常常需要比较现象之间的某些指标有无显著 差异,特别当考察的样本容量 n 比较大时,由随机变量的中心极限定理知,样本均值 近似地服从正态分布。所以,均值的比较检验主要研究关于正态总体的均值有关的假 设是否成立的问题。 ? 本章主要内容: 1、单个总体均值的 t 检验(One-Sample T Test) ; 2、两个独立总体样本均值的 t 检验(Independent-Sample T Test) ; 3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test) ; 4、单因素方差分析(One-Way ANOVA) ; 5、双因素方差分析(General Linear Model?Univariate) 。 ? 假设条件:研究的数据服从正态分布或近似地服从正态分布。 在 Analyze 菜单中, 均值比较检验可以从菜单 Compare Means, General Linear 和 Model 得出。如图 2.1 所示。图 2.1 均值的比较菜单选择项§2.1 单个总体的 t 检验(One-Sample T Test)分析单个总体的 t 检验分析也称为单一样本的 t 检验分析, 也就是检验单个变量的 均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比 较,通过检验得出预先的假设是否正确的结论。38 例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职 工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。 首先建立假设:H0:国有企业工资为10000元; H1:国有企业职工工资不等于10000元 打开数据库SY-2,检验过程的操作按照下列步骤: 1、 单击 Analyze ?Compare Means ?One-Sample T Test, 打开 One-Sample T Test 主对话框,如图 2.2 所示。图 2.2一个样本的 t 检验的主对话框2、从左边框中选中需要检验的变量(国有单位)进入检验框中。 3、在 Test Value 框中键入原假设的均值数 10000。 4、 单击 Options 按钮, 得到 Options 对话框 (如图 2.3) 选项分别是置信度 , (默 认项是 95%)和缺失值的处理方式。选择后默认值后返回主对话框。图 2.3 一个样本 t 检验的 Options 对话框5、单击 OK,得输出结果。如表 2.1 所示。表 2.1(a).数据的基本统计描述One-Sample Statistics 39 N 样本容量 国有单位 31Mean 均值 Std. Deviation 标准差 Std. Error Mean 标准误 863.89629表 2.1 (b).一个样本均值 t 检验的检验结果One-Sample TestTest Value = 10000 95% Confidence Interval of the Difference置信区间 Lower Uppert 值 国有单位 4.121df 自由度 30Sig. (2-tailed) P值Mean Difference 均值差.000
24.2148从上面检验结果表 2.1(a)可以得出国有单位职工工资的平均值、标准差和均 值的标准误等反映数据特征的数据。从表 2.1(b)中可知检验的结果。即相应的检 验统计量 t 值为 4.229,自由度为 30,假设检验的 P 值(sig)小于 0.05,故原假设 不成立,检验结论是拒绝原假设 H0,接受假设 H1。即认为国有企业职工的平均工资与 10000 元的假设差异显著。§2.2 两个总体的 t 检验§2.2.1 两个独立样本的t检验(Independent-samples T Test)Independent-sample T Test是检验两个没有联系的总体样本均值间是否存在显 著的差异,两个没有联系的总体样本也称独立样本。如两个无联系的企业生产的同样 产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通 过抽取样本检验两个总体的均值是否存在显著的差异。 例2.某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调 查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服 用的效果越好,分值就越高,每人所得的总分见表2.2,试根据表中的数据检验这种 药品对男性和女性的治疗效果是否存在显著差异。 解:由于药品对男性或女性的影响是无联系的,因此这两个样本是相互独立的。 可以应用两独立样本的假设检验。 首先,建立假设H0:该药品对男性和女性的治疗效果没有显著差异; H1:该药品对男性和女性的治疗效果有显著差异。40 表2.2分 序 性 别 数 号男,女治疗效果的综合得分表男 150 160 67 80 110 80 132 115 60 100女 140 120 78 135 89 100 1051 2 3 4 5 6 7 8 9 10然后,根据表1的数据建立数据文件SY-4,并使用SPSS进行假设检验,具体操作 步骤: 1、单击Analyze ?Compare Means ?Independent-sample T Test,打开 Independent-sample T Test 主对话框如图2.4。图2.4 两个独立样本t检验的主对话框2、选择要检验的变量“综合得分”进入检验框中。 3、选择分组变量“性别”进入分组框中,然后单击Define Group按纽,打开分 组对话框如2.5图所示,确定分组值后返回主对话框,如果没有分组,可以选择Cut point单选项,并在激活的框内输入一个值作为分组界限值。 4、由Option选择按纽确定置信度值和缺失值的处理方式。 5、点击OK可得输出结果,见表2.3统计分析检验结果。41 图2.5 独立样本t检验Define Groups 对话框6、分析输出结果并对结果作出分析见表2.3。表2.3(a)Group Statistics分组统计描述表性别 综合得分 男 女 N 10 7 Mean 105.40 109.57 Std. Deviation 34.394 23.143 Std. Error Mean 10.876 8.747表2.3(b)独立样本的均值比较检验表方差齐性检验 Levene&#39;s Test for Equality of Variances 均值相等的t检验 t-test for Equality of Means 均值差 P值 P值 F值 Sig. 统计量 t 自由度 df Sig. (2-tailed) Mean Differe nce 标准差 Std. Error Difference 95%的置信区间 95% Confidence of the Interval Difference Lower 综合 得分 Equal variances assumed Equal variances not assumed -.299 14.997 .769 -4.17 13.957 -33.922 25.579 1.445 .248 -.278 15 .784 -4.17 14.980 -36.101 27.758 Upper检验表2.3(a) 基本统计表,检验表2.3(b)第三列和第四列是检验两样本数据的 方差是否相等,从检验结果得知两样本的方差没有显著差异。从第五列开始是对两个 样本的均值的是否相等进行检验。从假设检验的P值看出,它大于显著性水平0.05, 所以说男女之间的机械能力之间并无显著差异, 因此接受原假设H0。 而第八列之后分 别是均值差、均值差标准误、均值差的置信区间。§2.2.2 两个有联系总体间的均值比较(Paired-Sample T Test)Paired-Sample T Test是检验两个有联系正态总体的均值是否存在显著的差异。42 又称配对样本的 t 检验。经常用于生物、医药、农业、工业等多个行业。如检验某 种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某种粮食进行 品种改良,也需要比较改良前后粮食产量有无显著差异等。 例3:某企业对生产线上的工人进行某种专业技术培训,要对培训效果进行检验, 从参加培训的工人中抽取30人,将他们培训前后的数据每加工500个零件的不合格品 数进行对比,得到数据表见表2.4。试根据表中数据检验培训前后工人的平均操作技 术水平是否有显著提高,也就是检验培训效果是否显著。表 2.4序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 培训前 2 3 3 4 4 4工人培训前后不合格品数据表培训后 0 1 2 1 1 2 序号 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 培训前 6 6 6 6 6 6 6 6 6 6 7 7 7 7 8 培训后 4 2 2 2 4 3 3 3 3 3 3 3 4 4 344 5 5 5 5 5 5 523 2 2 3 3 2 3 3解:这显然是配对样本均值的假设检验的问题。所以要建立假设: H0:培训前后工人的技术水平没有显著差异; H1:培训前后工人的技术水平有显著差异; 根据表2.3建立数据文件SY-5,根据中心极限定理,在大样本的情况下,样本均 值近似地服从正态分布。所以可以利用正态参数的检验方法进行均值的检验。其检验 过程的具体操作步骤为: 1、单击Analyze ?Compare Means ? Paired-Sample T Test,打开Paired-Sample T Test主对话框如图2.6。 2、选择要检验的两变量进入检验框中,注意,一定要选择两个变量进入检验框 内,否则将无法得到检验结果。 3、由Option选择按纽确定置信度值95%和缺失值的处理方式。 4、点击OK得输出结果。 5、根据输出结果作出结论如表2.5所示。43 图2.6配对样本的t检验主对话框表2.5(a) Paired Samples Statistics 样本统计量分析样本容量 Mean Pair 1 培训前 培训后 5.30 2.53 N 30 30 标准差 Std. Deviation 1.368 .973 均值标准误 Std. Error Mean .250 .178表 2.5(b)Paired Samples Test 配对样本均值差检验表检验统 Paired Differences 95% Confidence Std. Std. Error Mean Interval of the Difference Lower Upper 3.12 16.203 29 .000 计量t 自由度 P值 (双尾) Sig. df (2-tailed)MeanDeviationPair 1培训前 培训后2.77.935.1712.42由上表2.5(b)中的检验结果知,假设检验的P值小于0.05,因此可以得出培训 前后的差异是显著的,故拒绝假设H0,接受假设H1,认为培训的效果是显著的。§2.3 单因素方差分析单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问 题。是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。其目 的也是对不同的总体的数据的均值之间的差异是否显著进行检验。 单因素方差分析的 应用范围很广,涉及到工业、农业、商业、医学、社会学等多个方面。 ? 单因素方差分析的应用条件:在不同的水平(因素变量取不同值)下,各总 体应当服从方差相等的正态分布。44 例 4,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选 择,为了比较这三个零件的强度是否相同,每个地区的企业抽出 6 件产品进行强度测 试,其值如表 2.6 所示。假设每个企业零件的强度值服从正态分布,试检验这三个地 区企业的零件强度是否存在显著差异。 解:首先建立假设 H0:三个地区的零件强度无显著差异; H1:三个地区的零件强度有显著差异。 然后根据表 2.6 中数据, 建立数据文件 SY-6 并进行单因素方差 (One-Way ANOVA) 分析。具体操作过程如下:表 2.6强 样 度 本 1 2 3 4 5 6 116 98 100 115 83 105 110 103 118 106 107 116 89 85 99 73 97 102 地 区样本零件强度值单位:百公斤1231、单击Analyze ? Compare Means ? One-Way ANOVA,打开 One-Way ANOVA 对话框。图 2.7单因素方差主对话框2、 从左框中选择因变量”零件强度”进入Dependent list框内, 选择因素变量” 地区”进入Factor框内。点击OK就可以得到方差分析表2.7。45 表2.7 ANOVA 方差分析表平方和 方差来源 Between Groups 组间 Within Groups Total 总和 组内 Sum of Squares 9.667
自由度 Df 2 15 17 均方 Mean Square 562.722 100.644 F值 5.591百公斤 P值 Sig. .015表2.7是方差分析表,由于F统计量值的P值明显小于显著性水平0.05,故拒绝假 设H0,认为这三个地区的零件强度有显著差异。 如果需要对各地区间的零件强度进行进一步的比较和分析, 可以通过按纽Option 选项,contrast对照比较,Post Hoc多重比较去实现。 3、单击Option按纽,打开Option对话框如图2.8所示:在Option选项中选择输出 项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。图2.8 单因素方差分析 Options 对话框本例中选择Homogeneity of variance test 进行不同水平间方差齐性的检验以 及Descriptive 基本统计描述。在Missing Value栏中选择系统默认项。 完成所有选择后返回主对话框,然后单击OK,就可以得到三个地区零件强度分 析表2.8。表2.8(a) Descriptives基本统计描述Std. N Mean Std. Deviation Error 95% Confidence Interval for Mean Lower Bound A1 A2 A3 Total 6 6 6 18 102.83 110.00 90.83 101.22 12.254 5.899 10.815 12.450 5.003 2.408 4.415 2.935 89.97 103.81 79.48 95.03 Upper Bound 115.69 116.19 102.18 107.41 83 103 73 73 116 118 102 118 Minimum Maximum46 表2.8(b)Test of Homogeneity of Variances方差齐性检验百公斤 Levene Statistic 1.203 df1 2 df2 15 Sig. .328从基本统计分析表2.8(a)可以得到均值、标准差等数据相应的统计特征值。 从表2.8 (b) 中的统计检验可以得出, 因素变量的各水平间的方差是没有显著差异的。 4、Contrasts按纽可以用来进一步分析随着控制变量水平的变化,观测值变化的 总体趋势以及进一步比较任意指定水平间的均值差异是否显著。 单击Contrasts按纽,打开One-Way ANOVA:Contrasts对话框.见图2.9.图2.9 单因素方差分析 Contrasts对话框如果要对组间平方和进行趋势成分检验,选中Polynomial多项式复选项,选中后 激活Degree参数框, 在Degree框中选择趋势检验多项式的阶数, 有最高次数可达5 次。 系统将给出指定阶数和低于指定阶次各阶次的自由度、F值和F检验的概率值。 在Contrast栏,指定需要对照比较两个水平的均值。 在Coefficients 框中输入一个系数,单击Add按纽,系数就进入到Coefficients 框中。重复上述,依次输入各组均值的系数。注意系数的和应当等于0。如;图2.9 中就是指第一个水平与第三个水平的均值差比较。 5、 如果需要将水平间两两比较, 可以单击Post Hoc 按纽, 打开多重比较对话框。 如图2.10 所示: 在该对话框中列出了二十种多重比较检验,涉及到许多的数理统计方法,在实际 中只选用其中常用的方法即可。 对话框下部的Significance level表示显著性水平,默认值是0.05,也可以根据 需要重新输入其它值。 ? ? 如果满足在水平间方差相等的条件,常用LSD(least-significant difference 最小显著性差异法),表示用 t 检验完成各组均值间的配对比较。 当方差不等的情况下,可以选择Tamhane?s T2, 用t检验进行各组均值间的47 配对比较。图2.10 单因素方差分析 PHC 对话框选择多重比较方式后,点击OK,得到输出结果表2.9。表2.9Dependent Variable: 百公斤 LSD Mean (I) 地区 A1 (J) 地区 A2 A3 A2 A1 A3 A3 A1 A2 Difference (I-J) -7.17 12.00 7.17 19.17(*) -12.00 -19.17(*) Std. Error 5.792 5.792 5.792 5.792 5.792 5.792 Sig. .235 .056 .235 .005 .056 .005 95% Confidence Interval Lower Bound -19.51 -.35 -5.18 6.82 -24.35 -31.51 Upper Bound 5.18 24.35 19.51 31.51 .35 -6.82Multiple Comparisons多重比较* The mean difference is significant at the .05 level.从表 2.8 中可以看出,地区 2 与地区 3 之间的差异是非常显著的,它们均值差的 检验的尾概率为 0.005,明显小于显著性水平 0.05。§2.4 双因素方差(Univariate)分析过程单因变量的双因素方差分析是对观察的现象(因变量)受两个因素或变量的影响 进行分析,检验不同水平组合之间对因变量的影响是否显著。双因素方差分析的应用 范围很广,如粮食产量受到气候、温度因素的影响;某生物产品的生产过程不仅受催 化剂多少的影响、还受温度高低的影响等,甚至两因素变量之间的交互作用对因变量48 也有一定的影响。要分清楚哪个因素的影响作用比较大,就可以应用双因素方差分析 的方法来解决。 ? 双因素方差分析应用条件:因变量和协变量必须是数值型变量,且因变量来 自或近似来自正态总体。因素变量是分类变量,变量可以是数值型或字符型 的。 各水平下的总体假设服从正态分布, 而且假设各水平下的方差是相等的。 双因素方差分析过程可以分析出每一个因素的作用;各因素之间的交互作用;检 验各总体间方差是否相等;还能够对因素的各水平间均值差异进行比较等。 例 5:表 2.10 是某商品 S 在不同地区和不同时期的销售量表。已知数据服从正 态分布,则要检验地区因素及时间因素对销售量的影响是否显著。表 2.10地 时 期 区某商品 S 销售量表 2 14.2 7.1 10.8 8.9 12.6 3 13.4 9.4 7.2 8.6 7.5 4 2.4 1.5 1.7 2.3 2.8单位:千件1 6.5 1.8 3.6 3.7 7.65 6.2 4.8 4.9 4.6 5.21 2 3 4 5由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题,根 据上表建立数据文件 SY-7,具体分析的步骤如下: 1、单击 Analyze ?General linear Model ?Univariate,打开 Univariate 主 对话框。如图 2.11 所示:图 2.11 双因素方差分析对话框49 2、选择要分析的变量”销售量”进入 Dependent Variable 框中,选择因素变 量”地区”和”时期”进入 Fixed Factor 框中。 3、 单击 Model 按纽选择分析模型, 得到 Model 对话框。 如图 2.12 所示: Specify 在 框中,指定模型类型。 Full Factorial 选项为系统默认项,建立全模型,全模型中包括因素之间的交 互作用。如果选择分析两个因素的交互作用,则必须在每种水平组合下,取得两个以 上的实验数据,才能实现两个因素的交互作用的分析结果。如果不考虑因素间的交互 作用时,应当选择自定义模型。图 2.12 Univariate:Model 对话框Custom 选项为自定义模型,本例选择此项并激活下面的各项操作。 先从左边框中选择因素变量进入 Model 框中,然后选择效应类型。一般不考虑交 互作用时,选择主效应 Main,考虑交互作用时,选择交互作用 Interaction。可以通 过单击 Build Term 下面的小菜单完成,本例中选择主效应。最后在 Sum of Square 中 选择分解平方和的方法后返回在主对话框。一般选取默认项 TypeⅢ。单击 OK 就可以 得到相应的双因素方差分析表 2.11.表 2.11 销售量的双因素方差分析检验表Tests of Between-Subjects Effects Dependent Variable: 商品S(千件) Type III Sum of Source Corrected Model Intercept 地区 时期 Error Total Corrected Total Squares 289.717(a) .218 42.498 39.474 .190 df 8 1 4 4 16 25 24 Mean Square 36.215 .805 10.625 2.467 F 14.679 411.438 25.052 4.307 Sig. .000 .000 .000 .015a R Squared = .880 (Adjusted R Squared = .820) 50 表中用黑体字部分是一般统计学原理书中给出的双因素方差分析表。 从表中数据 可以看出,F值对应概率P值都小于显著性水平0.05,这说明地区和时期对销售量的影 响都是显著的。 4、如果需要进行特定的两水平间的均值比较,可单击 Contrast 比较按纽,打 开 Contrast 对话框如图 2.13。在 Factor 框中显示所有在主对话框中选择的因素变 量, 括号中显示的是当前的比较方法, 点击选中因素变量, 可以改变均值的比较方法。图 2.13 Univariate:Contrasts 对话框?Change Contrast 栏中列出对比方法。在小菜单中供选择的方法依次是: None 不进行均数比较; Deviation 以观测量均值为标准进行比较; Simple 以第一个或最后一个水平的观察值均值为标准; Difference 各水平上观察值均值与前一个水平的均值进行比较; Hermert 各水平上观察值与最后一个水平的均值比较。选择了比较方法后,再点击 Change 按纽确定,将选中的比较方法显示在选中的 因素变量后的括号内。然后返回主对话框。图 2.14 Univariate :Profile Plots 对话框51 5、如果需要进行图形展示,可单击 Plots 按纽,打开图形对话框如图 2.14 所 示。选择作均值轮廓图(Profile)的参数。 (1)在 Factor 框中选择因素变量进入横坐标 Horizontal Axis 框内,然后单 击 add 按纽,可以得到该因素不同水平的因变量均值的分布。 (2)如果要了解两个因素变量的交互作用,将一个因素变量送入横坐标后,将 另一个因素变量送入 Separate Lines 分线框中,然后单击 add 按纽。就可以输 出反映两个因素变量的交互图。本例中选择因素 A 为横坐标。 6、如需要将因素 A 各水平间均值进行两两比较,单击 Post Hoc 按纽,打开 Post Hoc Multiple 多重比较对话框如图 2.15 所示。 Factor 框中选择因素变量进入 Post 从 Hoc Test for 框中,然后选择多重比较方法。本例中各组方差相等,选择 LSD 方法。图 2.15 Univariate:Post Hoc 多重比较对话框7、单击 Save 按纽,打开保存对话框,如图 2.16 所示。选择需要保存的变量。图 2.16Univari

我要回帖

更多关于 196cc等于多少千瓦 的文章

 

随机推荐