在SAS软件中,分析二因素试验,可重复双因素方差分析1次,如何编码

社会化媒体
了解更多>>
桂ICP备 号
阅读下一篇
自媒体运营攻略
行业经验交流
Hi,在你登录以后,就可以永久免费的收藏任何您感兴趣的内容,关注感兴趣的作者!
手机注册或邮箱注册
点击按钮进行验证
请输入正确的邮箱
已有帐号请点击
帐号创建成功!
我们刚刚给你发送了一封验证邮件
请在48小时内查收邮件,并按照提示验证邮箱
感谢你对微口网的信任与支持
你输入的邮箱还未注册
还没有帐号请点击
点击按钮进行验证
你输入的邮箱还未注册
又想起来了?
你已成功重置密码,请妥善保管,以后使用新密码登录
邮件发送成功!
我们刚刚给你发送了一封邮件
请在5分钟内查收邮件,并按照提示重置密码
感谢你对微口网的信任与支持
对不起,你的帐号尚未验证
如果你没有收到邮件,请留意垃圾箱 或
意见与建议
请留下您的联系方式
* 留下您正确的联系方式,以便工作人员尽快与你取得联系
转藏至我的藏点当前位置: >>
SAS方差分析
第二十五课 方差分析当影响观察结果的影响因素(原因变量或分组变量)的水平数大于 2 或原因变量的个数 大于 1 个,一元时常用 F 检验(也称一元方差分析),多元时用多元方差分析(最常用 Wilks’ ∧检验)。一、 方差分析概述方差分析(analysis of variance)又称变异数分析,可简记为 ANOVA,主要用于检验计量 资料中的两个或两个以上均值间差别显著性的方法。当欲比较几组均值时,理论上抽得的几 个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一 个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定 的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简 称为均方 MS(mean square) 。 方差分析的基本思想 根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相 对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出 各部分的均方,然后列出方差分析表算出 F 值,作出统计推断。 方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各 种效应的作用就越了解,统计推断就越准确。方差分析表的一般形式见表 25.1 所示: 表 25.1 方差分析表形式变异来源source 效应 S1 效应 S2 …… 效应 Sm 误差 Se 总变异 ST1.离差平方和SS SS1 SS2 …… SSm SSe自由度df df1 df2 …… dfm dfe均方MS MS1= SS1/df1 MS2= SS2/df2 …… MSm= SSm/dfm MSe= SSe/dfe MST= SST/dfTF 统计量 F F1(df1, dfe)= MS1/ MSe F2(df2, dfe)= MS2/ MSe …… Fm(dfm, dfe)= MSm/ MSeP 概率值 P P1 P2 PmSST= SS1+ SS2+… dfT=df1+ df2+… + SSm+ SSe + dfm + dfeFT(dfT, dfe)= MST/ MSePT表中变异来源一栏,可分为总变异(total) ,误差(residual),各个效应(effect)相对应 的项。效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素) ,交互影 响项(因素间的多级交互影响) ,协变量(来自回归的变异项) ,等等。 当分析和确定了各个效应项 S 后,根据原始观察资料可计算出各个离均差平方和 SS,再 根据相应的自由度 df,由公式 MS=SS/df,求出均方 MS,最后由相应的均方,求出各个变异 项的 F 值,F 值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。根据 F 值的分子、分母均方的自由度 f1 和 f2,在确定显著性水平为 α 情况下,由 F ( f 1 , f 2 ) 临界值 表查得单侧 Fα 界限值。当 F & Fα 时,则 P & α ,不拒绝原假设 H 0 ,说明不拒绝这个效应 项的效应为 0 的原假设,也即这个效应项是可能对总变异没有实质影响的;如果 F ≥ Fα ,则上海财经大学经济信息管理系IS/SHUFE Page 1 of 30 P ≤ α ,拒绝原假设 H 0 ,说明拒绝这个效应项的效应为 0 的原假设,也即这个效应项是很可能对总变异有实质影响的。 方差分析的试验设计 为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计 要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。在试验设计阶 段常需要作主要四个方面的考虑: 1) 研究的主要变量 方差分析的主要变量,也称响应变量或因变量(dependent variable) ,它是我们试验所要 观察的主要指标。一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进 行分析。 2) 因素和水平 试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水 平(level) 。在每一个因素下面可以分成若干水平。例如,某工厂的原料来自四个不同地区, 那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,四个地区便 是地区这一因素的四个水平。当某个主要因素的各个水平间的主要因变量的均值呈现统计显 著性时,必要时可作两两水平间的比较,称为均值间的两两比较。 3) 因素间的交互影响 多因素的试验设计,有时需要分析因素间的交互影响(interaction) 个因素间的交互影 ,2 响称为一级交互影响,例如因素 A 与因素 B 的一级交互影响可记为 A×B,3 个因素间的交互 影响称为二级交互影响,例如因素 A 与因素 B 与因素 C 的二级交互影响可记为 A×B×C。当 交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交 互影响项的效应,以助于作出正确的统计推断。 2.二、 单因素方差分析单因素方差分析(one factor ANOVA 或 one-way ANOVA)或称为完全随机设计的方差分 析(completely random design ANOVA) 。试验设计时按受试对象的抽取或分组的随机程度不 同可细分为以下两类: 完全随机设计――从符合条件的总体中完全随机地抽取所需数目的受试对象,再 将全部受试对象完全随机地分配到 k 组中去。 此时, 受试对象与试验因素间无直接 联系。 组内完全随机设计――按试验因素的 k 个水平将全部受试对象划分成 k 个子总体, 再分别从 k 个子总体中完全随机地抽取所需数目的受试对象。此时, 试验因素的各 水平决定了受试对象各自应该归属的组别。 设因素 A 有 k 个水平 A1 , A2 , L , Ak ,在每一个水平下考察的指标可以看成一个总体,现 有 k 个水平,故有 k 个总体,并假定: ① 每一总体均服从正态分布; ② 每一总体的方差相同; ③ 从每一总体中抽取的样本相互独立。 我们要比较各个总体的均值是否一致,就是要检验各总体的均值是否相同,设第 i 个总 体的均值为 ? i ,那么就是要检验如下原假设:上海财经大学经济信息管理系IS/SHUFE Page 2 of 30 H 0 : ?1 = ? 2 = L = ? k其备选假设为:H 1 : ?1 , ? 2 , L , ? k 不全相同。设从第 i 个总体获得容量为 ni 的样本观察值为 y i1 , y i 2 , L , y ini , i = 1,2, L , k ,各样本间 还是相互独立的。样本观察值 y ij 可看成是来自均值为 ? i 的总体,这样 y ij 就是其均值 ? i 与随 机误差 ε ij 迭加而产生的。上面我们已经假定在 Ai 水平下的 y ij 服从 N ( ? i , σ ) 分布,则有2ε ij ~ N (0, σ 2 ) 。因此,我们有单因素方差分析的统计模型:j = 1,2, L , ni ? yij = ? i + ε ij , i = 1,2, L , k , ? ? 2 ?各ε ij 相互独立, 且都服从N (0, σ ) ?(25.1)为了能更仔细地描述数据,常在方差分析模型中引人一般平均与效应的概念。称各个 ? i 的加权平均?=为总平均,其中 n =1 k ∑ ni ? i n i =1(25.2)∑ni =1ki。称ai = ? i ? ? ,i = 1,2, L , k(25.3)为因素 A 在第 i 水平的主效应,也简称为 Ai 的效应,同时也表明第 i 个总体的均值是一般平 均与其效应的迭加。容易看出效应间有如下关系式:∑n ai =1 iki=0(25.4)此时,单因素方差分析的统计模型可改写成包含效应的形式:? yij = ? + ai + ε ij , i = 1,2,L, k , ?k ? ?∑ ni ai = 0 ? i =1 ?各ε 相互独立, 且都服从N (0,σ 2 ) ? ij所要检验的原假设也可改写成:j = 1,2,L, ni(25.5)H 0 : a1 = a 2 = L = a k = 0现在,我们知道造成各 y ij 间差异的原因可能有两个:一个可能是假设 H 0 不真,即各水上海财经大学经济信息管理系IS/SHUFE Page 3 of 30 平下总体均值 ? i (或水平效应 a i )不同,因此从各总体中获得的样本观察值也就有差异了; 另一可能是 H 0 为真,差异是由于随机误差引起的。为了进一步定量分析这些差异,我们需 要把这些差异表达出来。由(25.1)可推导出:yi? = ? i + ε i?其中 y i ? =ni ni(25.6)∑ yij / ni , ε i? = ∑ ε ij / ni 。即组内样本观察值的平均值等于组内总体均值加上j =1 j =1组内随机误差的平均值。还可由(25.5)推导出:y = ? +ε其中 y =k ni k ni(25.7)∑∑ yij / n ,ε = ∑∑ ε ij 。即所有样本观察值的平均值等于总平均(各组均值的i =1 j =1 i =1 j =1加权平均)加上所有随机误差的平均值。这样,每一个观察值 y ij 与总平均 y 的偏差可以分解 成两部分:yij ? y = ( y ij ? y i? ) + ( y i? ? y )其中 y ij ? y i ? 称为组内偏差,由(25.1)和(25.6)代入得到:(25.8)yij ? yi? = ( ? i + ε ij ) ? ( ? i + ε i? ) = ε ij ? ε i?(3.2.9)说明组内偏差仅仅反映了随机误差。而 y i ? ? y 称为组间偏差,由(25.6)(25.7)和(25.3) 、 代入得到:yi ? ? y = ( ? i + ε i ? ) ? ( ? + ε ) = ai + ε i ? ? ε说明第 i 组间偏差除了反映随机误差外还反映了第 i 个水平的效应 a i 。 各 y ij 间总的差异大小可用总偏差平方和 S T 表示:(25.9)S T = ∑∑ ( y ij ? y ) 2i =1 j =1kni(25.10)由(25.9)随机误差引起的数据间的差异可以用组内偏差平方和表示,也称误差偏差平 方和 S e :S e = ∑∑ ( y ij ? y i? ) 2i =1 j =1kni(25.11)由于组间偏差除了随机误差外,还反映了效应的差异,故由于效应不同引起的数据差异 可以用组间偏差平方和表示,也称因素 A 的偏差平方和 S A :上海财经大学经济信息管理系IS/SHUFE Page 4 of 30 S A = ∑ ni ( y i ? ? y ) 2i =1k(25.12)将表示总差异的平方和进行分解:S T = ∑∑ ( y ij ? y ) = ∑∑ ( y ij ? y i? + y i? ? y ) 22 i =1 j =1 k ni i =1 j =1 kknikni= ∑∑ ( y ij ? y i? ) 2 + ∑∑ ( y i? ? y ) 2 + 2∑∑ ( y ij ? y i? )( y i? ? y )i =1 j =1 k ni i =1 j =1 k i =1 j =1nikni(25.13)= ∑∑ ( y ij ? y i? ) 2 + ∑ ni ( y i? ? y ) 2i =1 j =1 i =1= Se + S A其中∑(yj =1niij? y i? ) = 0 。证明了:总的差异=组内差异+组间差异。由于ni1σ2∑(yj =1ij? yi? ) =21σ2∑ (εj =1niij? ε i? ) 2 ~ χ 2 (ni ? 1)(25.14)又由 χ 2 分布的可加性可知k ? 1 = ∑? 2 2 σ i =1 ? σSek ? ( y ij ? y i? ) 2 ? = ~ χ 2 (∑ (ni ? 1)) = χ 2 (n ? k ) ∑ j =1 i =1 ? ni(25.15)还可证明,在 H 0 为真时,即各组效应 a i 都为 0SAσ因此可采用统计量2~ χ 2 (k ? 1)(25.16)F=来假设检验。S A /(k ? 1) ~ F (k ? 1, n ? k ) S e /(n ? k )(25.17)三、 多重比较当 k 组均值比较,如果经过 F 检验拒绝原假设,表明因素 A 是显著的,即 k 个水平对应 的指标均值不全相等,但不一定两两之间都有差异。在一些实际问题中,当方差分析的结论 是因素 A 显著时,还需要我们进一步去确认哪些水平间是确有差异的,哪些水平间无显著差 异。同时比较任意两个水平均值间有无显著性差异的问题称为多重比较,即要以显著性水平α ,同时检验以下 C k2 个假设:上海财经大学经济信息管理系IS/SHUFE Page 5 of 30 ij H 0 : ?i = ? ji & j,i, j = 1,2,L , k(25.18)均值间的多重比较的方法从形式上可分为几类:临界值相对固定的两两比较、临界值不 固定的多级检验、全部处理组均值与一个对照组均值比较。每一种类型中,根据所控制误差 的类型和大小不同,又有许多不同的具体方法。如 T(成组比较 t 检验法) 、Bon(Bonforroni t 检验法) Dunnett 与对照组均数比较) SNK 、 ( 、 (Student-Newman-Keuls 或称 q 检验法) Tukey 、 (学生化极差 HSD 或称最大显著差) Duncan 、 (新多极差检验法) LSD 、 (最小显著差) SIDAK 、 (Sidak 不等式进行校正 t 检验法) 、SCHEFFE(Scheffe 的多重对比检验) 、Waller-Duncan(k 比率 t 检验) 、GT2 或 SMM(学生化最大模数和 Sidak 不等式进行校正 t 检验法) 、REGWF (多重 F 检验) 、REGWQ(多重极差检验) 。 在多重比较时,选用什么样的检验方法,首先要注意每种方法适用的试验设计条件,其 次要关心所要控制的误差类型和大小。例如,某因素有 10 个水平,若采用通常的 t 检验进行 多重比较,共需要比较的次数为 C10 = 45 次,即使每次比较时都把第一类错误 α 控制在 0.052水平上,但经过 45 次多重比较后,犯第一类错误的概率上升到:1 ? (1 ? 0.05) 45 = 0.90 。从 中我们可以看到选用 t 检验法进行多重比较,仅仅控制了每次比较的显著水平,但却大大增 加了整体的显著水平。 下面是所要控制的几种误差类型和选用的检验方法: 第一类误差率――即犯第一类错误的概率 α 。 比较误差率――即每一次单独比较时, 所犯第一类错误的概率。 可使用 T 法、 LSD 法、DUNCAN 法。 试验误差率――即完成全部比较后,整体所犯第一类错误的概率。 可使用 完全无效假设下的试验误差率――即在 H 0 假设完全无效下的试验误差率。 SNK 法。 部分无效假设下的试验误差率――即在 H 0 假设部分无效下的试验误差率。 最大试验误差率――即在在 H 0 假设完全或部分无效下, 完成全部比较后所犯第一 类错误的最大概率。 可使用 BON 法、 SIDAK 法、 SCHEFFE 法、 TUKEY 法、 GT2/SMM 法、GABRIEL 法、REGWQ 法、REGWF 法、DUNNETT 法。 T 检验和 Bonforroni 检验 当因素有 k 个水平时,对任意两个水平均值间的差异的显著性检验,可用 t 统计量1)t ij =yi? ? y j ? ? Se ? 1 ? + 1 ? n ? k ? ni n j ? ? ?2~ t (n ? k )(25.19)两两比较的次数共有 m = C k = k ( k ? 1) / 2 , 因此, 共有 m 个置信水平, 每次比较的显著水平: T 检验的方法取 α 。完成所有比较后的整体显著水平等于1 ? (1 ? α ) m(25.21)当比较次数 m 越大,试验误差就越大。而 Bonforroni 检验的方法取 α / m 。完成所有比较后上海财经大学经济信息管理系IS/SHUFE Page 6 of 30 的整体显著水平等于1 ? (1 ? α / m) m & α(25.22)即最大试验误差率小于 α 。 2) LSD 检验 既可以通过两两比较的显著水平的特定限制来控制最终的试验误差率,也可以通过两两 比较的绝对差异界限来判别显著性。最容易想到的这个界限就是在两两比较中采用的 t 检验 法而得到 Fisher 最小显著差(LSD)为LSDij = t α (n ? k )2? Se ? 1 ? + 1 ? n ? k ? ni n j ? ? ?(25.23)当 y i ? ? y j ? ≥ LSDij 时,则 P ≤ α 。 SNK 检验和 Duncan 检验(应用最多) SNK 法和 Duncan 法都属于多级检验法中的一种,使用多级检验可以获得同时检验的更 高效率。多级检验分为步长增加法和步长减少法,SAS 系统采用步长减少法。当因素有 k 个 水平时,即有 k 个均值需要比较,检验步骤为: ① 将均值由大到小排队,即 y1? ≥ y 2? ≥, L , ≥ y k ? 。 比较 y1? 与 y k ? 是否有显著差异。此时跨度 a = k 。若两者之间无显著差异,说明 其他均值之差比它小的任何两个水平均值之间的差别也无显著性,所以停止一切 比较;反之,则继续进行下一步。 ③ 比较 y1? 与 y k ?1? ,比较 y 2? 与 y k ? 是否有显著差异。此时这 2 个比较的跨度 3)②a = k ? 1 。若两者之间的比较无显著差异,则停止一切比较。如果每一步都有不满足停止比较的对比组存在,最后应到达跨度为 2 的所有需要比较的相邻两水平 均值间都作完比较时为止。 多级检验在作每一级比较时,通过控制比较误差率 γ a 的显著水平来实现其最终要控制的 试验误差率。要注意的是 γ a 在每一级比较时可能是不同的,它是跨度 a 和整体试验误差率 α 的函数,即 γ a = f ( a, α ) 。另外,要注意的是 γ a 其实就是每一级比较时特定统计量分布的显 著水平。常用的两种方法是 SNK 检验和 Duncan 检验。它们的检验统计量为 q(也称学生化 极差统计量) ,如下qij =yi? ? y j ? ? Se ? 1 ? + 1 ? 2(n ? k ) ? ni n j ? ? ?~ q ( a, n ? k )(25.24)其中 a 是 y i ? 和 y j ? 之间的跨度值,q 分布的自由度是 a 和 n ? k ,显著水平为 γ a 。SNK 检验 和 Duncan 检验的区别主要在于 γ a 取值上海财经大学经济信息管理系IS/SHUFE Page 7 of 30 SNK 检验: γ a = α 。注意,当比较次数很大时,最大试验误差率将趋向于 1。 Duncan 检验: γ a = 1 ? (1 ? α )a ?1。四、 随机单位组设计的方差分析随机单位组设计(randomized block design)又称随机区组设计或随机配伍组设计,它是 两样本配对试验的扩大。欲比较因素 A 中的 k 个水平的各个均值,试验设计时,先将受试对 象按性质相同或相近者组成单位组,每个单位组有 k 个受试对象,分别随机分配到因素 A 的 k 个水平上。这时每个水平的受试对象,不仅数量相同,而且性质也相同或相近,就能缩小误 差,提高试验效率。这样的设计可将单位组看作一个因素,就成为两个因素的设计(因素与 单位组) ,由于两个因素的各水平仅仅交叉 1 次,所以重复数为 1,在这样的意义下,随机单 位组设计可看作为两因素重复数为 1 的设计,一般这种设计不考虑交互影响。 设有因素 A 具有 k 个水平,受试对象按性质相同或相近者分成 b 个单位组,每个单位组 有 k 个受试对象,分别随机分配到因素 A 的 k 个水平上。那么,随机单位组设计的方差分析 表见表 25.2 所示: 表 25.2 方差分析表形式变异来源source 因素 A 单位组 误差 Se 总变异 ST离差平方和SS SSA SS 单 SSe自由度df均方MS MSA= SSA/( k-1) MS 单= SS 单/( b-1) MSe= SSe/( bk-k-b+1) MST= SST/( bk-1)F 统计量 F FA= MSA/ MSe F 单= MS 单/ MSeP 概率值 P PA P单k-1 b-1bk-k-b+1SST= SSA+ SS 单+SSe bk-1FT= MST/ MSePTSS 计算公式为:yij = y + α i + β i + ε ij2 SS A = b∑ ( Ai ? y ) 2i =1 k2 SS单位组 = k ∑ ( B j ? y ) 2j =1 k bbSSe2 = ∑∑ ( yij ? Ai ? B j + y ) 2i =1 j =1五、 析因设计的方差分析析因设计(factorial design)是一种多因的设计。各因素在试验中所处的地位基本平等, 而且因素之间存在一级 (即 2 个因素之间) 二级 、 (即 3 个因素之间) 乃至更复杂的交互作用。 例如,两个因素时,第 1 个因素有 3 个水平,第 2 个因素有 2 个水平,全部水平组合共有 3 ×2=6 种组合,每种组合都作试验时就是析因试验设计,也可称为 3×2 析因试验设计。同样 3×4×2 析因试验设计,则代表 3 个因素,分别有 3,4,2 个水平,全部试验后的水平组合 为 3×4×2=24 种。在每一种组合下,适当重复几次,称为重复数。重复数可以不相等,一般上海财经大学经济信息管理系IS/SHUFE Page 8 of 30 地说,重复数相等时,效率最高。 析因设计能够检验每个因素的各水平间主要变量的平均值的统计差异,也能检验因素间 的交互影响。当存在交互影响时,表示一个因素各水平间的差异会随着另一个因素的水平改 变而不同;当不存在交互影响时,则各个因素独立,即一个因素的水平改变时不影响另一个 因素的各个水平之效应。析因设计的方差分析因为能研究交互影响,所以能提供较多信息。 但是,当有较高级(二级以上)的交互影响时,由于涉及多个因素,各有多个水平,情况将 错综复杂,可能会引起解释上的困难。 析因设计的方差分析同样是从数据差异的总平方和开始分解。例如,对于 A×B 双因素方 差分析,这个总差异能分解成:A 因素的各个水平之间的差异,B 因素的各个水平之间的差 异,A 与 B 的各种不同组合之间的差异,以及观察数据必然会产生的随机误差这四部分。方 差分析的主要目的就是要将这四部分从总平方和中分离出来,再以各个平方和与误差平方和 作比较。假设 A 因素有 r 个水平,B 因素有 c 个水平,每一种水平下的重复数为 m,那么总 的观察数据有 n=r×c×m 个,方差分析表见表 25.3 所示: 双因素( 表 25.3 双因素(r×c)重复数 m 的方差分析表形式变异来源source 因素 A 因素 B A×B 误差 Se 总变异 ST离差平方和SS SSA SSB SSAB SSe SST= SSA+ SSB+ SSAB自由度df均方MS MSA= SSA/( r-1) MSB= SSB/( c-1) MSAB= SSAB/(( r-1)( c-1)) MSe= SSe/( rc(m-1)) MST= SST/( rcm-1)F 统计量 F FA= MSA/ MSe FB= MSB/ MSe FAB= MSAB/ MSeP 概率值 P PA PB PABr-1 c-1(r-1)(c-1)r×c×(m-1)r×c×m-1+SSeFT= MST/ MSePTSS 计算公式为:2 SST = ∑∑∑ ( yijk ? y ) 2 i =1 j =1 k =1 r c m= ∑∑∑ ( yijk ? yij ) + ( yij ? Ai ? B j + y ) + ( Ai ? y ) + ( B j ? y )[]2六、 拉丁方设计的方差分析若试验中涉及到 3 个因素,当它们之间不存在交互作用或交互作用可以忽略不计,且各 因素均取相同水平时,适合于选择拉丁方设计。用 K 个拉丁字母排成 K 行 K 列的方阵,使每 行每列中每个字母仅出现 1 次,这样的方阵称为拉丁方(latin square) 。然后将 3 个因素分别 放置到拉丁方的行、列及字母上面。例如,三个 4×4 的拉丁方为: A B C D A B C D A B C D B A D C B A D C D C B A D C B A C D A B B A D C C D A B D C B A C D A B 四个 5×5 的拉丁方为: A B C D E A B C D E A B C D E A B C D E B C D E A C D E A B D E A B C E A B C D C D E A B E A B C D E A B C D D E A B C D E A B C B C D E A B C D E A C D E A B上海财经大学经济信息管理系IS/SHUFE Page 9 of 30 A B C D D E A B C C D E A B B C D E A 使用时可选择其中一个。拉丁方试验设计的关键是这 3 个因素之间不存在交互作用或者 交互作用可以忽略不计,一般情况是仅涉及到 1 个试验因素,因此就不存在交互作用。试验 因素有 K 个水平(如 A、B、C、D、E) ,还有 2 个是非处理因素,或者说是 2 个区组因素, 让这 2 个区组因素也正好取 K 个水平,同时把这 2 个区组因素放在 K×K 拉丁方阵的横向和 纵向上,构成了 K×K 个区组水平组合,每种组合下伴有试验因素 K 个水平中的 1 个水平。E七、 proc anova 和 proc glm 过程SAS 系统的 STAT 软件提供了 anova 过程和 glm 过程等几个过程进行方差分析。anova 过程主要处理均衡数据,所谓均衡数据是指自变量(或称分类变量)的每种组合中的观察数 是相等的,如果不相等则称为非均衡数据。。虽然 glm 过程能够处理均衡和不均衡的两种数 据,但是 anova 过程考虑到均衡设计的特殊构造,对于均衡数据使用 anova 比使用 glm 计算 快且占用存储少,还可以处理拉丁方设计、若干不完全的均衡区组设计等等。因此,无论何 时作方差分析,一旦可能都应该用 anova 过程来完成。如果试验设计不均衡,也不是上述的 几种特殊情况之一,那么应该使用 glm 过程。 1. anova 过程的语句格式 anova 过程的主要控制语句如下:proc anova 输入数据集名 &选项列表& ; class m 变量列表 ; 因变量列表=自变量列表 &/选项列表&; 效应列表 &/选项列表& ; &H=效应列表& E=效应列表;其中 class 语句、model 语句是必需的,而且 class 语句必须出现 model 语句之前。test 语 句必须放在 model 语句之后。 1) proc means 语句中的&选项列表&。 manova――按多元方式删除那些含有丢失值的观察, 按多元方式删除那些含有丢失值的观察 也即在因变量中有丢失值就从 按多元方式删除那些含有丢失值的观察, 这次分析中删除这个观察。 这次分析中删除这个观察。 outstat=输出数据集名 输出数据集名――生成一个输出数据集,它包含模型中每个效应的平方和、 生成一个输出数据集, 输出数据集名 生成一个输出数据集 它包含模型中每个效应的平方和、 F 统计量和概率水平。 统计量和概率水平。 2) class 语句。 在 anova 过程中要使用的分类变量、区组变量必须首先在 class 语句的变量列表中说明。 Class 语句是必需的,且必须放在 model 语句前面。Class 变量可以是数值型,也可以是字符 型。 3) model 语句。 该语句用来规定因变量和自变量效应。如果没有规定自变量的效应,则只拟合截距,假 设检验为因变量的均值是否为 0。Model 语句的主要形式有四种: ① 主效应模型 Model y= ② 含有交叉因素的模型 Model y=a b c a*b a*c b*c a*b*c;上海财经大学经济信息管理系IS/SHUFE Page 10 of 30 ③ 嵌套模型 Model y=a b c(a b); ④ 包含嵌套、交叉和主效应的模型 Model y=a b(a) c(a) b*c(a); Model 语句的选项列表有: int――打印与截距有关的假设检验结果。 anova 过程总是把截距作为模型的一个效应进行 处理,缺省时,不打印结果。 nouni――不打印单变量分析结果。 不打印单变量分析结果 不打印单变量分析结果。 4) means 语句。 该语句是用来计算在 means 语句后列出的每个效应所对应的因变量均值。Anova 过程可 以对出现在 model 语句等号右边的任一效应计算因变量的均值。不过这些均值没有针对模型 中的效应进行修正。如果需要修正的均值,应该调用 glm 过程,使用其中的 lsmenas 语句。 在 anova 过程里可以使用任意多个 means 语句,它们放在 model 语句后面。 Means 语句的选项列表主要有两个内容,一是选择多重比较的检验方法,二是规定这些 检验的细节,注意这些细节选项只能用于主效应。 ① 多重比较的检验方法 bon――对所有主效应均值之差进行 Bonferroni 的 t 检验。 检验。 对所有主效应均值之差进行 duncan――对所有主效应均值进行 Duncan 的多重极差检验。 的多重极差检验。 对所有主效应均值进行 dunnett&(‘格式化对照值 格式化对照值’)&――进行 Dunnett 的双尾 t 检验。用以检验对所有主效 检验。 格式化对照值 进行 应均值的某个水平作为对照,处理有无显著差异。为了规定这个对照效应的水平, 应均值的某个水平作为对照,处理有无显著差异。为了规定这个对照效应的水平,在括号 内用单引号把这个水平的格式化值括起来。缺省时,效应的第一个水平作为对照。 内用单引号把这个水平的格式化值括起来。缺省时,效应的第一个水平作为对照。 dunnettl&(‘格式化对照值 格式化对照值’)&――进行 Dunnett 的单尾 t 检验。它检验是否任一个处 检验。 格式化对照值 进行 理显著地小于这个对照。 理显著地小于这个对照。 dunnettu&(‘格式化对照值 格式化对照值’)&――进行 Dunnett 的单尾 t 检验。它检验是否任一个处 检验。 格式化对照值 进行 理显著地大于这个对照。 理显著地大于这个对照。 gabriel――对所有主效应均值进行 Gabriel 的多重对比检验。 的多重对比检验。 对所有主效应均值进行 regwf――对所有主效应均值进行 Ryan-Einot-Gabriel-Welsch 的多重 F 检验。 检验。 对所有主效应均值进行 regwq――对所有主效应均值进行 Ryan-Einot-Gabriel-Welsch 的多重极差检验。 的多重极差检验。 对所有主效应均值进行 scheffe――对所有主效应均值进行 Scheffe 的多重对比检验。 的多重对比检验。 对所有主效应均值进行 sidak――对所有主效应均值水平依据 Sidak 不等式进行调整后, 不等式进行调整后, 对所有主效应均值水平依据 对其均值之差两两 检验。 进行 t 检验。 Smm|gt2――当样本量不等时,基于学生化最大模和 Sidak 不相关 t 不等式,等到 当样本量不等时, 不等式, 当样本量不等时 Hochberg 的 GT2 方法,对主效应均值进行两两对比检验。 方法,对主效应均值进行两两对比检验。 snk――对所有主效应均值进行 Student-Newman-Keuls 的多重极差检验。 的多重极差检验。 对所有主效应均值进行 t|lsd――对所有主效应均值进行两两 t 检验,它相当于在单元观察数相等时 Fisher 对所有主效应均值进行两两 检验, 的最小显著差( 的最小显著差(Fisher’s least-significant-difference)检验。 )检验。 tukey――对所有主效应均值进行 Tukey 的学生化极差检验。 的学生化极差检验。 对所有主效应均值进行 waller――对所有主效应均值进行 Waller-Duncan 的 k 比率(k-ratio)检验。 比率( 对所有主效应均值进行 )检验。 ② 多重比较的检验细节 alpha=p――给出均值间对比检验的显著性水平。缺省值是 0.05。 给出均值间对比检验的显著性水平。 0.05。 给出均值间对比检验的显著性水平 cldiff――要求把两两均值之差的结果用置信区间的形式输出。 要求把两两均值之差的结果用置信区间的形式输出。 要求把两两均值之差的结果用置信区间的形式输出 clm――对变量的每个水平的均值按置信区间形式输出。 对变量的每个水平的均值按置信区间形式输出。 对变量的每个水平的均值按置信区间形式输出 e=效应 效应――指定在多重对比检验中所使用的误差均方。如果缺省,使用残差均方 指定在多重对比检验中所使用的误差均方。 效应 指定在多重对比检验中所使用的误差均方 如果缺省, 。指定的效应必须是在 语句中出现过的效应。 (MS) 指定的效应必须是在 model 语句中出现过的效应。 ) 。上海财经大学经济信息管理系IS/SHUFE Page 11 of 30 kratio=值――给出 Waller-Duncan 检验的类型 1/类型 2 的误差限制比例。Kratio 的 值 限制比例。 给出 类型 的误差限制比例 合理值为 50、100、500,大约相当于两水平时 alpha 值为 0.1、0.05、0.01。缺省值为 100。 、 、 , 、 、 。 。 lines――按下降次序列出所有检验方法产生的均值,并用一条线段在均值旁指出非 按下降次序列出所有检验方法产生的均值, 按下降次序列出所有检验方法产生的均值 显著的子集。 显著的子集。 hovtest――要求输出组间方差齐性的 Levene 检验。 检验。 要求输出组间方差齐性的 5) test 语句 在分析中,如果这个语句缺省,仍然使用残差均方( ) 在分析中,如果这个语句缺省,仍然使用残差均方(MS)作为误差项对所有平方 但用户可以使用本语句要求使用其他效应作为误差项, 和(SS)计算 F 值。但用户可以使用本语句要求使用其他效应作为误差项,得到另外的 F ) 检验。 语句, 语句后面。 语句的选项为: 检验。可以使用多个 test 语句,把它们放在 model 语句后面。Test 语句的选项为: h=效应 效应――规定模型里哪些效应用来作为假设的效应。 规定模型里哪些效应用来作为假设的效应。 效应 规定模型里哪些效应用来作为假设的效应 e=效应 效应――规定一个而且只能是一个效应用来作为误差项,这个说明项是必须的。 规定一个而且只能是一个效应用来作为误差项, 效应 规定一个而且只能是一个效应用来作为误差项 这个说明项是必须的。 2. glm 过程的语句格式 proc glm 是分析符合一般线性模型(General Linear Models)的数据,因此取名 GLM。它 能被用在许多不同的分析中,如简单回归、多元回归、方差分析、协方差分析、加权回归、 多项式回归、偏相关分析、多元方差分析等。 在 glm 过程中的大多数方差分析的语句和选项与 anova 过程中基本相同。用 anova 过程 编写的程序几乎不用修改就可在 glm 过程中运行。glm 过程仅仅是附加了三条语句:contrast、 estimate 和 lsmeans。contrast 和 estimate 语句允许你测试和估计均值的某种功能。lsmeans 语 句允许你计算调整后的均值。 glm 过程的主要控制语句如下:proc glm 输入数据集名 &选项列表& ; class model 变量列表 ; 因变量列表=自变量列表 &/选项列表&;contrast ‘标签’ 效应 值表 &/选项列表&; estimate ‘标签’ 效应 值表 &/选项列表&; lsmeans me 效应列表 &/选项列表& ; 效应列表 &/选项列表& ; &out=输出数据集名& &统计量关键字=变量名列表&; &H=效应列表& E=效应列表;其中 class 语句、model 语句是必需的,而且 class 语句必须出现 model 语句之前。其他语 句必须放在 model 语句之后。下面主要介绍与 anova 过程相比不同的语句和新增加的语句。 1) model 语句。 在 glm 过程的 model 语句中可以使用几种不同效应, 下面是使用这些效应的几个例子, a、 b 和 c 代表分类变量;y1、y2、x1 和 x2 代表连续变量。 Model y=x1; (简单回归) Model y=x1 x2; (多重回归) Model y=x1 x1*x1; (多项式回归) Model y1 y2=x1 x2; (多元回归) Model y=a; (单因素方差分析) Model y= (主效应模型) Model y=a b a*b; (因素模型) Model y=a b(a) c(b a); (嵌套模型)上海财经大学经济信息管理系IS/SHUFE Page 12 of 30 Model y1 y2= (多元方差分析模型) Model y=a x1 (协方差分析模型) Model 语句的主要选项有(与 anova 过程中的 model 语句选项相同不再列出) : solution――打印正规方程的解,即参数估计值。 打印正规方程的解, 打印正规方程的解 即参数估计值。 e1/e2/e3/e4――打印模型中每一效应的类型 1/类型 2/类型 3/类型 4 的可估函数, 并计算相 应的平方和。 ss1/ss2/ss3/ss4――对每个效应,打印与类型 1/类型 2/类型 3/类型 4 的可估函数相关的平 方和。 alpha=0.01/0.05/0.1――指定置信区间的 α 水平。缺省值为 0.05。 cli/clm――打印每一观察的预测值/预测均值的置信限,两者不能同时使用。 p――打印自变量没有缺失值的每一观察值、 预测值和残差值。 同时还打印 Durbin-Waston 统计量。 xpx――打印叉积矩阵 X ′ 。 X i――打印矩阵 X ′ 的逆矩阵或广义逆矩阵。 X 2) contrast 语句。 提供一种获得一般假设检验的技巧。其中,效应可以是截距,用字符 intercept 表示。通 过规定 L 向量或 M 矩阵来构造一元假设检验 Lβ = 0 或多元假设检验 LβM = 0 。例如,当 发现某两个因素的交互作用项有显著性时,我们可用本语句来实现一个因素被控制在某水平 上,对另一个因素的各水平间进行两两比较的目的。 设 M 因素有三个水平 a、b、c,V 因素有两个水平 1、2,且 M × V 有显著性。如果我们 要比较? a ? (?b + ? c )的差异,那么有几种不同的比较方法: ① 在因素 V 的每一个水平上,分别比较因素 M 的三个水平 a、b、c 均值的之间的线 性关系假设是否显著。也即1 2H 0 : ? a1 ? 0.5? b1 ? 0.5? c1 = 0 和 H 0 : ? a 2 ? 0.5? b 2 ? 0.5? c 2 = 0 。② 在因素 V 平均的所有水平上,比较因素 M 的三个水平 a、b、c 均值的之间的线性 关系假设是否显著。也即H 0 : 0.5( ? a1 ? 0.5? b1 ? 0.5? c1 ) + 0.5( ? a 2 ? 0.5? b 2 ? 0.5? c 2 ) = 0 。③ 在因素 V 平均的子集上,比较因素 M 的三个水平 a、b、c 均值的之间的线性关系 假设是否显著。也即H 0 : ( ? a1 ? 0.5? b1 ? 0.5? c1 ) ? ( ? a 2 ? 0.5? b 2 ? 0.5? c 2 ) = 0glm 模型为双因素试验设计的方差分析指定了下面的效应公式? ij = ? + α i + β j + (αβ ) ij(25.25)其中 ? ij 是因素 M i 水平与因素 V j 水平在 ij 单元上所有观察值的平均。 ? 为总平均。 α i 是β ( 因素 M 在 i 水平上的主效应, j 是因素 V 在 j 水平上的主效应, αβ ) ij 为因素 M 和因素 V上海财经大学经济信息管理系IS/SHUFE Page 13 of 30 在 ij 水平上的交互效应。因此,对任一观察值有y ijk = ? ij + ε ijk = ? + α i + β i + (αβ ) ij + ε ijk(25.26)因此,根据单元均值给出的线性组合可以转换成效应模型的合并参数形式,即 Lβ = 0 , 如? a1 ? 0.5? b1 ? 0.5? c1 = ? + α a + β1 + (αβ ) a1 ? 0.5? ? 0.5α b ? 0.5β1 ? 0.5(αβ ) b1 ? 0.5? ? 0.5α c ? 0.5β 1 ? 0.5(αβ ) c1 = α a ? 0.5α b ? 0.5α c + (αβ ) a1 ? 0.5(αβ ) b1 ? 0.5(αβ ) c1同理? a 2 ? 0.5? b 2 ? 0.5? c 2 = α a ? 0.5α b ? 0.5α c + (αβ ) a 2 ? 0.5(αβ ) b 2 ? 0.5(αβ ) c 2相应的 glm 过程的语句为 class model M V ;Y=M V M*V;contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 1 0 -0.5 0 -0.5 0; contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 0 1 0 -0.5 0 -0.5;Contrast 语句中的可选项: e――打印整个 L 向量。 e=效应――规定模型中的某个效应作为误差项。过程将把这一效应作为单变量 F 检验的 分母。如果缺省,过程把均方误差(MSE)作为误差项。 etype=n――指明 e=效应的类型(1、2、3、4) 。如果指明 e=而没有指明 etype=,则使用 最高类型。 3) Estimate 语句 可 用 来 估 计 参 数 的 线 性 函 数 , 通 过 用 参 数 的 估 计 b 乘 以 向 量 L 来 得 到 Lb 。 其 中b = ( X ′X ) ? X ′Y 。Estimate 语句的使用格式同 contrast 语句。estimate 语句中的可选项: e――打印整个 L 向量。 divisor=数字――为简便地输入效应的系数而规定的一个值, 用该值除以所有系数使得分 数系数可以作为整数输入。例如 estimate ‘1/3(a+b)-2/3c’ M 1 1 -2 /divisor=3; 可替代 estimate ‘1/3(a+b)-2/3c’ M 0.33 -0.66667; 4) Lsmeans 语句 计算列在语句中的每一效应的最小二乘均值(LSM) 。最小二乘均值估计是针对非均衡数 据设计的,而类和子类的算术平均值是针对均衡数据设计的。 lsmeans 语句中的可选项: cov――在选项 out=指明的输出数据集中输出协方差。 e――打印用以计算最小二乘均值的可估函数。上海财经大学经济信息管理系IS/SHUFE Page 14 of 30 e=效应――规定模型中的某个效应作为误差项。 etype=n――指明 e=效应的类型(1、2、3、4) 。 out=输出数据集名――产生一个包含 LSM 值、标准差及协方差的输出数据集。 pdiff――打印假设检验 H 0 : LSM (i ) = LSM ( j ) 的所有可能的概率值。 stderr――打印 LSM 的标准差和 H 0 : LSM = 0 的概率值。 tdiff――打印假设检验 H 0 : LSM (i ) = LSM ( j ) 的 t 值和相应的概率值。 pdiff=all/control/conroll/controlu――打印最小二乘均值之差的概率值。 adjust=bon/dunnett/scheffe/sidak/smm/gt2/tukey/t――要求多重比较对最小二乘均值之差的 概率值和置信限进行调整。缺省值为 t。 slice=效应――通过规定的这个效应来分开交叉的 LSM 效应。例如,假定交叉项 A*B 是 显著的,如果想对 B 的每个效应检验 A 的效应,使用下面语句: lsmeans A*B /slice=B;八、 实例分析1. 单因素试验设计的均值比较 例 25.1 考虑在 5 种不同品牌的人工合成胶合板材料上进行磨损时间测试,每种品牌的 材料做四次试验,且都是采用的同一种磨损措施,所有的试验都是在完全随机的顺序下在相 同的机器上完成的。 程序如下:data study. input brand $ wear @@; ACME 2.3 ACME 2.1 ACME 2.4 ACME 2.5CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6 AJAX 2.2 AJAX 2.0 AJAX 1.9 AJAX 2.1TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7 XTRA ; proc anova data=study. model wear= means brand / //方差齐性检验 2.3 XTRA 2.5 XTRA 2.3 XTRA 2.4程序说明: 因为数据仅仅是按照 brand 值分类, 所以在 class 语句中这是仅有的一个变量。 变量 wear 是被分析的因变量,故 wear 出现在 model 语句等号的左边。在方差分析表中,除 了总方差和误差外,方差的来源仅仅是由于各种不同 brand 值的变异造成的,因此 brand 出现 在 model 语句等号的右边。 Means 语句计算主效应 brand 不同水平所对应的因变量均值, 选项 hovtest 计算不同品牌组方差齐性的假设检验。上海财经大学经济信息管理系IS/SHUFE Page 15 of 30 输出的结果见表 25.4 所示:The SAS System Analysis of Variance Procedure Class Level Information Class BRAND Levels 5 Values ACME AJAX CHAMP TUFFY XTRANumber of observations in data set = 20//20个记录,自由度19Analysis of Variance Procedure Dependent Variable: WEAR Source Model Error DF 4 15 Sum of Squares//tss 0.//组间误差 0.//组内误差 0. Mean Square 0.. F Value 7.40 Pr & F 0.0017Corrected Total 19R-Square 0.663798C.V. 6.155120Root MSE 0.WEAR Mean 2.Source BRANDDF 4Anova SS 0.Mean Square 0.F Value 7.40Pr & F 0.0017Levene's Test for Equality of WEAR Variance ANOVA of Squared Deviations from Group Means//齐性检验 Sum of Source BRAND Error DF 4 15 Squares 0..00466 Mean Square 0..00031 F Value 0.5310 Pr & F 0.7149Analysis of Variance Procedure表 25.4 单因素设计的方差分析结果结果分析:anova 过程总是输出两个基本的方差分析表。一个是总体模型的方差分析表, 一个是包含模型中各个变量的方差分析。首先输出 class 语句中规定的每个变量(brand) 、分 类变量的取值数(5) 、具体取值(ACME AJAX CHAMP TUFFY XTRA)以及数据集中的观 察个数(20) 。 接着 anova 过程对 model 语句中每个因变量输出方差分析表。包括:因变量的总平方和 (0.9295) 、属于模型部分的平方和(0.6170) 、属于误差部分的平方和(0.3125) 、自由度 DF (4、5、19) 、模型的均方 MS(0./4) 、误差的均方 MSE(0..3125/15) 、2 模 型 的 F 值 ( 7.40=0.. ) 分 布 大 于 7.40 的 概 率 ( 0.0017 ) R 、 、(0..617/0.9295) 、变异系数 CV(6.× 0.0208333 / 2.345 ) 、因变量的上海财经大学经济信息管理系IS/SHUFE Page 16 of 30 标准差(0..0208333 ) 、因变量均值(2.345) 。 对模型中的每个效应, anova 过程还输出方差分析表。 brand 自由度 DF 4)平方和 ( 、 (0.617) 、 均方 MS(0./4) 、F 值(7.40=0..) 、分布大于 7.40 的概率 (0.0017) 。 总体 F 检验是显著的(0.) ,表明模型是有意义的。品牌 brand 的 F 检验也是显 著的(0.) ,表明不同品牌的均值不全相等。这里两个 F 检验是完全相同的,这仅仅 是因为在模型中只有一项 brand。注意,我们可以用 glm 过程替代这个 anova 过程,能得到相 同的方差分析结果。 最大区别是 glm 过程将计算每个效应的类型 1 和类型 3 平方和, anova 而 只计算类型 1 的平方和。对于单因素和多因素平衡数据来说,anova 过程的 SS1、glm 过程的 SS1 和 SS3 都相同。 Levene 的 方差齐性检验结果表明:不能拒绝(0.)不同品牌组里观察值的方 差是相等的原假设。 最后输出的是每种品牌的观察数、均值和标准差。例如,ACME 品牌的观察数为 4,均 值为 2.,标准差为 0.。 2. 均值的多重比较和置信区间 例 25.2 继续上例的分析。由于品牌 brand 的 F 检验是显著的(0.),表明 5 种不同品牌的均值不全相等,但可能存在某 2 个或某 3 个或某 4 个品牌的均值相同。因此, 常需要进一步的均值多重比较和置信区间分析。 程序如下:proc anova data=study. model wear= means brand / means brand /程序说明:第一个 means 语句选用了 ducan 选项,要求计算输出组间均值比较的新多重 极差检验,结果见表 25.5(a) 。第二个 means 语句选用了 lsd clm 选项,对所有组均值进行两 两 t 检验, 输出各组均值的置信区间, 结果见表 25.5 (b) 第二个 means 语句还选用了 lsd cldiff 。 选项,将对各组间均值之差采用最小显著差检验,输出各组间均值之差的置信区间,结果见 表 25.5(c) 。 表 25.5(a) Duncan 的新多重极差检验上海财经大学经济信息管理系IS/SHUFE Page 17 of 30 The SAS System Analysis of Variance Procedure Duncan's Multiple Range Test for variable: WEAR NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 15 MSE= 0.020833 Number of Means 2 3 4 5Critical Range . .Means with the same letter are not significantly different. Duncan Grouping A A B B A A 2.3750 4 XTRA Mean 2.6000 N 4 BRAND TUFFY表 25.5(a)中结果分析:注意到各组均值按大到小排列(2.60,2.375,2.375,2.3250, 2.0500) ,在标题“Duncan Grouping”下是一系列字母 A、B、C,如果均值间差异不显著标 上相同的字母, 否则标上不同的字母。 对于 Duncan 多重极差检验来说, 个均值之间的比较, 5 只要看最大的均值与最小的均值之差的是否大于临界值 0.239, 因为 2.600-2.050=0.55&0.239, 则为显著,所以品牌 TUFFY 的均值不同与 AJAX,应该标识不同的字母。因为存在 5 个均值 之间最大差的显著性,接下来就需要比较 4 个均值之间差的显著性,临界值为 0. -2.325=0.275&0.2346,显著,2.375-2.050=0.325&0.2346,显著,只要存在一个显著性,就 需要继续比较 3 个均值之间差的显著性。 虽然, 均值 2.600、 2.375 和 2.375 之间的差小于 0.2280, 均值 2.375、2.375 和 2.325 之间的差也小于 0.2280,但由于存在 2.375-2.050=0.325&0.2280, 显著,继续比较 2 个均值之间差的显著性。2.600-2.375=0.225&0.2175,显著,2.325- 2.050=0.275&0.2175,显著,其他相邻两均值比较不显著。 表 25.5(b) 各组均值的 t 检验置信区间T Confidence Intervals for variable: WEAR Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833Critical Value of T= 2.13 Half Width of Confidence Interval= 0.153824 Lower BRAND N Confidence Limit TUFFY XTRA 4 4 2.18 2.00 Mean Upper Confidence Limit 2.82表 25.5 b) ( 中结果分析: 均值 t 分布的 95%置信区间的一半宽度为 0.153824, 因此 TUFFY 品牌均值置信区间的下限为 2.600-0..44618,上限为 2.600+0..75382。其 他品牌均值的置信区间计算,同样是均值加减 0.153824 而得到的。 表 25.5(c) lsd 最小显著差检验上海财经大学经济信息管理系IS/SHUFE Page 18 of 30 The SAS System T tests (LSD) for variable: WEAR NOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate. Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833Critical Value of T= 2.13145 Least Significant Difference= 0.2175Comparisons significant at the 0.05 level are indicated by '***'. Lower BRAND Comparison Confidence Limit Difference Between Means Upper Confidence LimitTUFFY - XTRA TUFFY - CHAMP TUFFY - ACME TUFFY - AJAX0.5 0.50.0 0.00.5 0.5*** *** *** ***XTRA XTRA XTRA XTRA- TUFFY - CHAMP - ACME - AJAX-0.5 -0.5-0.0 0.0-0.5 0.5******CHAMP - TUFFY CHAMP - XTRA CHAMP - ACME CHAMP - AJAX-0.5 -0.5-0.0 0.0-0.5 0.5******ACME- TUFFY-0.4925-0.2750-0.0575***表 25.5(c)中结果分析:注意在显著水平为 0.05 上,两两比较的最小显著差为 0.2175, 如果显著则被标上“***” 。例如,TUFFY 均值减 XTRA 均值=2.600-2.375=0.225&0.2175, 显著。综合分析的结果表明,AJAX 品牌均值显著与其他品牌均值不同,且为最小的均值; TUFFY 品牌均值也显著与其他品牌均值不同,且为最大的均值;XTRA、CHAMP、ACME 三个品牌均值之间无显著差异。 3. 有计划的均值比较和参数估计 例 25.3 继续上例的分析。有时在实际情况中,多重比较要按某种分类标准来进行,例 如,假设我们知道 5 种品牌的制造商情况,品牌 ACMX、AXAX 和 CHAMP 来自美国 U.S. 制造商,而品牌 TUFFY 和 XTRA 来自非美国 non-U.S.制造商。如果我们有兴趣比较美国品 牌的均值与非美国品牌的均值是否有差异。 程序如下:proc glm data=study. model wear= contrast 'US vs NON-U.S.' brand 2 2 2 -3 -3; 上海财经大学经济信息管理系IS/SHUFE Page 19 of 30 estimate 'US vs NON-U.S.' brand 2 2 2 -3 -3;程序说明: 使用 contrast 语句来产生有计划的均值比较分析和使用 estimate 语句进行参数 估计。注意在 anova 过程中没有这两条语句,必须使用 glm 过程。使用 contrast 语句前,应该 首先表达出所关心的均值线性组合的原假设,如H 0 : 1 / 3( ? ACME + ? AJAX + ? CHAMP ) = 1 / 2( ? TUFFY + ? XTRA ) 等价于 H 0 : 2( ? ACME + ? AJAX + ? CHAMP ) ? 3( ? TUFFY + ? XTRA ) = 0contrast 语句的三个基本参数,一是标签('US vs NON-U.S.'),二是效应名(brand) ,三是效 应的数字系数表(2 2 2 -3 -3) 。应特别注意的是,数字系数的次序是匹配分类变量按字母数字 次序的水平值。事实上,均值线性组合的系数同样是 model 语句中效应参数组合的系数,这 是因为, ? i =? + α i ,将它们分别代入均值线性组合后,可得到2( ? ACME + ? AJAX + ? CHAMP ) ? 3( ? TUFFY + ? XTRA ) = 2( ? + α ACME + ? + α AJAX + ? CHAMP + α XTRA ) ? 3( ? + α TUFFY + ? + α XTRA ) = 2(α ACME + α AJAX + α XTRA ) ? 3(α TUFFY + α XTRA )所以,estimate 语句的使用格式与 contrast 语句非常类同。 输出的主要结果见表 25.6 所示: 表 25.6 有计划的均值比较和参数估计The SAS System Contrast US vs NON-U.S. DF 1 Contrast SS 0. Mean Square 0. F Value 13.00 Pr & F 0.0026T for H0: Parameter Estimate Parameter=0Pr & |T|Std Error of Estimate表 3.16 中结果分析:显示了美国品牌均值与非美国品牌均值比较的平方和为 0.27075,F 值为 13=0.833,这个 F(1,15)分布 F 值大于 13 的概率为 0.0026 小于 0.05,因 此原假设是显著的,拒绝接受,即美国品牌均值与非美国品牌均值是不同的。效应组合的参 数估计为-1.425=3×(2.325+2.050+2.375)-2×(2.600+2.375) ,对于原假设参数是否为 0 的 t 检验, 统计量为-3.60, t 概率为 0.0026 小于 0.05, 拒绝接受。 注意到 t 检验的 p 值为 0.0026, 与对比分析的 F 检验的 p 值相同,这是因为两种检验是相同的,F 值等于 t 的平方。 4. 随机单位组试验设计的方差分析 例 25.4 某食品公司对一种食品设计了四种包装。为了考察哪种包装最受欢迎,选了十个 有近似相同销售量的商店作试验,其中两种包装各指定两个商店,另两种包装各指定三个商 店销售。在试验期中各商店的货架排放位置、空间都尽量一致,营业员的促销方法也基本相 同。观察在一定时期的销售量,数据见表 25.7 所示。试比较四种包装的销售量是否一致。 表 25.7 四种包装在 10 个商店中的销售量 包装类型 (treat) A1 A2 商店(block) 1 12 14 2 18 12 13 3 商店数 n 2 3Page 20 of 30上海财经大学经济信息管理系IS/SHUFE A3 A419 2417 30213 2程序如下: input treat $ do block=1 input y @@; A1 2 12 18 A2 3 14 12 13 A3 3 19 17 21 A4 2 24 30 ; proc glm data= model y= means block treat/ means block treat/dunnett('1');程序说明:由于包装类型 A1 和 A4 在商店 3 里没有进行试验,所以产生的是一种不平衡 的试验数据,请注意随机单位区组中有不平衡数据集时,程序应该如何设计。本例有两个分 组变量,一是处理组 treat,包含四个水平 A1、A2、A3、A4,二是单位组 block,包含三个水 平 1、2、3,所以在 class 语句及 model 语句中都要写上这两个变量名。Means 语句中的分组 变量名可以是两个,也可以是一个。如果对单位组间的两两比较或各组均值不感兴趣,可去 掉 block,只用 treat。 第一条 means 语句的 snk 选项,要求对均值的多级比较采用多极差检验法,也称 Student-Newman-Keuls 法或 q 法。第二条 means 语句的 dunnett(‘1’)选项,要求所有分组均值 分别与对照组均值进行比较,采用 dunnett 的双尾 t 检验,这个 t 检验是一种多对一 t 检验, 也可用 dunnetl(单尾 t 检验,分组的均值是否显著地小于这个对照组的均值)或 dunnetu(单 尾 t 检验,分组的均值是否显著地大于这个对照组的均值)。对照组在括号内规定为’1’,即 分组变量的第一个水平分组,第 1 家商店和 A1 包装。第三个 means 语句,仅仅要求输出各 个分组的均值和标准差。输出的主要结果见表 25.8(a)和(b)所示。表 25.8(a) 随机单位区组试验设计的 snk 检验 ( )上海财经大学经济信息管理系IS/SHUFE Page 21 of 30 The SAS System General Linear Models Procedure Class Level Information Class BLOCK TREAT Levels 3 4 Values 1 2 3 A1 A2 A3 A4Number of observations in data set = 10 Dependent Variable: Y Source Model Error Corrected Total DF 5 4 9 Sum of Squares 269... C.V. 16.43355 Root MSE 2. Y Mean 18. Mean Square 53.. F Value 6.15 Pr & F 0.0515R-Square 0.884868Source BLOCK TREAT Source BLOCK TREATDF 2 3 DF 2 3Type I SS 10.. Type III SS 11..Mean Square 5.. Mean Square 5..F Value 0.60 9.85 F Value 0.63 9.85Pr & F 0.6 Pr & F 0.6Student-Newman-Keuls test for variable: Y NOTE: This test controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 4 MSE= 8.75WARNING: Cell sizes are not equal. Harmonic Mean of cell sizes= 3 Number of Means 2 3Critical Range 6..6078784 Means with the same letter are not significantly different. SNK Grouping A A A A A 17.000 2 3 17.250 4 1 Mean 19.250 N BLOCK 4 2Student-Newman-Keuls test for variable: Y NOTE: This test controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses.表 25.8(a)中结果分析:总的模型的方差分析结果 p=0.0515,基本上是有显著意义的。 模型中的变异(269)基本上反映了总的变异(304) ,判定系数 R =0./304。对于2上海财经大学经济信息管理系IS/SHUFE Page 22 of 30 单因素不平衡数据的方差分析,类型 1 和类型 3 的平方和就不相同了,分组变量的变异计算 应该采用类型 3 的平方和。分组变量 block 的方差分析结果 p=0.5789,不具有显著意义,说 明食品在 3 家不同商店进行销售时,销售量的均值没有显著差异。分组变量 treat 的方差分析 结果 p=0.0256,具有显著意义,说明 4 种不同包装食品的销售量的均值具有显著差异,但没 有指出具体哪几种包装之间有显著差异。 对 block 组进行 snk 多极差检验,3 个组比较时,大均值与小均值之差的临界值为 8.6078784,而 2 个组比较时,临界值为 6.7057809,结果显示在“SNK Grouping”标题下,3 个商店标有相同的字母“A”,说明了 3 个商店的销售量均值没有显著差异。对 treat 组进行 snk 多极差检验,在“SNK Grouping”标题下,出现了标有不相同的字母“A”和“B”,snk 的检验方法简单地说,将不同包装类型的食品销售量均值从大排到小,然后从两个最大的跨 度组开始比较,例如 A4 比较 A2 为 27-13=14&10.99260,有显著意义。Snk 的检验方法最后 给出 4 种不同包装食品的销售量的均值有显著差异,并指出了 A4 包装的销售量均值最高, 其他三种包装具有相同的效果。单元观察数的调和均数 2.4=4/(1/2+1/3+1/3+1/2)。 表 25.8(b) 随机单位区组试验设计的 dunnett 检验 ( )上海财经大学经济信息管理系IS/SHUFE Page 23 of 30 The SAS System General Linear Models Procedure Dunnett's T tests for variable: Y NOTE: This tests controls the type I experimentwise error for comparisons of all treatments against a control. Alpha= 0.05 Confidence= 0.95 df= 4 MSE= 8.75Critical Value of Dunnett's T= 3.336 Comparisons significant at the 0.05 level are indicated by '***'. Simultaneous Lower BLOCK Comparison 2 3 - 1 - 1 Confidence Limit -4.977 -8.795 Difference Between Means 2.000 -0.250 Simultaneous Upper Confidence Limit 8.977 8.295Dunnett's T tests for variable: Y NOTE: This tests controls the type I experimentwise error for comparisons of all treatments against a control. Alpha= 0.05 Confidence= 0.95 df= 4 MSE= 8.75Critical Value of Dunnett's T= 3.579 Comparisons significant at the 0.05 level are indicated by '***'. Simultaneous Lower TREAT Comparison A4 A3 A2 - A1 - A1 - A1 Confidence Limit 1.413 -5.665 -11.665 Difference Between Means 12.000 4.000 -2.000 Simultaneous Upper Confidence Limit 22.587 13.665 7.665 ***General Linear Models Procedure Level of BLOCK N --------------Y-------------Mean SD表 25.8(b)中结果分析:用 Dunnett 双侧检验求得的临界 t 统计量为 3.579,A4 组与 A1 组均值之差为 27-15=12&2×3.579,有显著意义,在旁边标上“***” ,置信区间的下限计算 上限计算为 12+3.579× 8.75(1 / 2 + 1 / 2) =22.587。 为 12-3.579× 8.75(1 / 2 + 1 / 2) =1.413, 而 A3 组与 A1 组之差为 19-15=4&2×3.579,无显著意义,置信区间的下限计算为 4-3.579 × 8.75(1 / 3 + 1 / 2) =-5.665,上限计算为 4+3.579× 8.75(1 / 3 + 1 / 2) =13.665。最后给出每 个分组的均值与标准差,其中 A4 包装的均值为 27.0000000,标准差为 4.。 5. 双因素实验设计的方差分析 例 25.5 研究饮食和健美操对减肥的作用。我们认为饮食对减肥肯定有一定作用,适当的 健美操对减肥也有效果。如果饮食加上健美操作为减肥的手段,就存在哪一种饮食配上哪一 样健美操最为有效的问题,因为饮食与饮食这两种减肥手段之间存在着交互作为,会强化减 肥的作用。现有三套饮食方案称为 a、b、c,五种不同的健美操标记为 1、2、3、4、5。构成 成了 3×5=15 种水平组合,选择了情况基本相同的 90 个肥胖人进行试验,将他们随机地指派上海财经大学经济信息管理系IS/SHUFE Page 24 of 30 到这 15 个组中且每组 6 人。经过一段时间后,体重的下降结果见表 25.9 所示。哪一套方案 效果最好表 25.9 3×5 双因素设计的试验结果饮食方案 food健美操 train 1 22.1 24.1 19.1 22.1 25.1 18.1 13.5 14.5 11.5 6.0 27.0 18.0 19.0 22.0 20.0 14.5 19.0 16.0 2 27.1 15.1 20.6 28.6 15.1 24.6 16.9 17.4 10.4 19.4 11.9 15.4 20.0 22.0 25.5 16.5 18.0 17.5 3 22.3 25.8 22.8 28.3 21.3 18.3 15.7 10.2 16.7 19.7 18.2 12.2 16.4 14.4 21.4 19.9 10.4 21.4 4 19.8 28.3 26.8 27.3 26.8 26.8 15.1 6.5 17.1 7.6 13.6 21.1 24.5 16.0 11.0 7.5 14.5 15.5 5 20.0 17.0 24.0 22.5 28.0 22.5 21.8 22.8 18.8 21.3 16.3 14.3 11.8 14.3 21.3 6.3 7.8 13.8abc程序如下: do i=1 to 3; Input food $ ; do train=1 to 5; do j=1 to 6; input y @@; a 22.1 24.1 19.1 22.1 25.1 18.1 27.1 15.1 20.6 28.6 15.1 24.6 22.3 25.8 22.8 28.3 21.3 18.3 19.8 28.3 26.8 27.3 26.8 26.8 20.0 17.0 24.0 22.5 28.0 22.5 b 13.5 14.5 11.5 上海财经大学经济信息管理系IS/SHUFE Page 25 of 30 6.0 27.0 18.0 16.9 17.4 10.4 19.4 11.9 15.4 15.7 10.2 16.7 19.7 18.2 12.2 15.1 6.5 17.1 7.6 13.6 21.121.8 22.8 18.8 21.3 16.3 14.3 c 19.0 22.0 20.0 14.5 19.0 16.0 20.0 22.0 25.5 16.5 18.0 17.5 16.4 14.4 21.4 19.9 10.4 21.4 24.5 16.0 11.0 11.8 14.3 21.3 ; proc glm data= model y=food train food* lsmeans food train food* lsmeans food*train/slice=food slice= Contrast ‘t1 vs t4 in f1’train 1 0 0 -1 0 food*train 1 0 0 -1 0 ; Contrast ‘t2 vs t4 in f1’train 0 1 0 -1 0 food*train 0 1 0 -1 0 ; Contrast ‘t3 vs t4 in f1’train 0 0 1 -1 0 food*train 0 0 1 -1 0 ; Contrast ‘t4 vs t5 in f1’train 0 0 0 1 -1 food*train 0 0 0 1 -1 ; Contrast ‘t2 vs t5 in f3’train 0 1 0 0 -1 food*train 0 0 0 0 0 0 0 0 0 0 0 1 0 0 -1 ; 7.5 14.5 15.5 6.3 7.8 13.8程序说明:本例中有两个因素 food 和 train,因此在 class 语句中要有这两个分组变量名。 由于除了要考察这两个因素的主效应外, 还要考察这两个因素的交互效应, 表示为 food*train, 所以需要在 model 语句的后面加上这个交互效应。用 lsmeans 语句替代 means 语句的主要原 因是, 对于非均衡的试验数据需要计算最小二乘均值, 它是一种调整后的均值。 第二条 lsmeans 语句的作用, 考虑到交叉项 food*train 是显著情况时, 通过 Slice 选项规定的 food 效应和 train 效应来分开交叉的 food*train 效应。Contrast 语句是作更进一步的对比,前四条 Contrast 语句 是把因素 food 固定在第一个水平 a 上,然后对 food 因素有显著交互作用的 train 因素的某两 个水平之间进行比较,最后一条 contrast 语句是把因素 food 固定在第三个水平 c 上,对 train 因素的第二个水平均值和第五个水平均值进行比较。要注意 food*train 交叉效应的参数化形 式的规则为, 交叉组合下标里最右边的变量水平比最左边的变量水平变化快, f1*t1、 即 f1*t2、 f1*t3、f1*t4、 f1*t5、f2*t1、f2*t2、f2*t3、f2*t4、 f2*t5、f3*t1、f3*t2、f3*t3、f3*t4、 f3*t5。 程序输出的主要结果见表 25.10(a)和(b)所示。表 25.10(a) 双因素试验设计的方差分析表 ( )上海财经大学经济信息管理系IS/SHUFE Page 26 of 30 The SAS System General Linear Models Procedure Class Level Information Class FOOD TRAIN Levels 3 5 Values a b c 1 2 3 4 5Number of observations in data set = 90 Dependent Variable: Y Source Model Error DF 14 75 Sum of Squares 9 7 6 C.V. 24.04225 DF Type I SS Root MSE 4. Y Mean 18. Mean Square F Value Mean Square 95.. F Value 4.87 Pr & F 0.0001Corrected Total 89 R-Square 0.476048 Source Pr & F FOOD TRAIN 2 4953..476..24.25 0.140.8表 25.10(a)中结果分析:总的模型方差分析结果表明,F=4.87,p=0.0001,模型效应是 显著的。模型中有三个效应:两个主效应 food 和 train 及一个交互效应 food*train,其中主效 应 food 和交互效应 food*train 是显著的,而主效应 train,F=0.14,p=0.9648,是不显著的。 所以我们可以得出的基本结论为:饮食控制和健美操对减肥是有作用的,3 种不同的饮食控 制方案对减肥效果是有区别的,而 5 种不同的健美操对减肥效果是没有区别的,同时饮食方 案和健美操的不同组合对减肥效果也是有区别的。表 25.10(b) 最小二乘均值和对比分析 ( )上海财经大学经济信息管理系IS/SHUFE Page 27 of 30 Least Squares Means FOOD Y LSMEAN a b c TRAIN 23...6066667 Y LSMEAN 1 2 3 4 5 FOOD TRAIN 18.....0333333 Y LSMEAN a a a a a b b b b b c c c c c 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 21...............5500000FOOD*TRAIN Effect Sliced by FOOD for Y Sum of FOOD a b c DF 4 4 4 Squares 72...025333 Mean Square 18...506333 F Value 0.9 2.6212 Pr & F 0.6 0.0414FOOD*TRAIN Effect Sliced by TRAIN for Y Sum of TRAIN DF Squares Mean Square F Value Pr & F表 25.10(b)中结果分析:由于主效应 food 是显著的,说明三种饮食方案对减肥的效果 是不同的,再通过查看三种饮食方案减肥体重的最小二乘均值均值,可以得出 a 方案最好,c 方案最差,且 a 方案和 c 方案的差异应该是显著的,至于 a 与 b 的比较及 b 与 c 比较,可以上海财经大学经济信息管理系IS/SHUFE Page 28 of 30 采用多重比较的方法进一步分析。为了知道交互效应 food*train 显著的具体原因,我们需要 比较两因素在各种组合时的均值差异,以便寻找最好的组合方案。先作切片(slice)分析, 分别固定 food 因素在三个水平 a、b、c 上,再对交互效应 food*train 的五种不同组合均值进 行分析,其中在切片 a 、b 上无显著性(0.,0.) ,而在 c 上有显著性 (0.) ,即只有当选择 c 饮食方案时,选择不同的健美操才会存在减肥效果区别。对 train 的五种水平作切片分析,结果都是显著的(0.1、0.1、0.0010) , 说明无论采用哪种健美操,选择不同的饮食方案对减肥效果都存在区别。进一步的分析,我 们把因素 food 固定在减肥效果最好的第一个水平 a 上,然后把 train 因素的每个水平与第四 个水平进行比较,结果显示都是无显著性(0.9、0.9),与前面的切 片分析是一致的。 最后把因素 food 固定在第三个水平 c 上, train 因素的最大水平均值和最 对 小水平均值进行比较,结果显示是显著的,同样证实了前面的切片分析。综上所述,最佳效 果的减肥措施是选择 a 饮食方案搭配 5 种健美操中的任何一种都可以。 6. 拉丁方试验设计的方差分析 例 25.6 研究 5 种不同的防护服(A、B、C、D、E)对脉搏数的影响。采用 5×5 拉丁方 试验设计,选用 5 个受试者,在 5 个不同日期进行试验,在行、列与字母上分别安排 3 个因 素(日期、受试者、防护服) ,得到试验结果数据见表 25.11 所示。拉丁方试验设计的数据 表 25.11 5×5 拉丁方试验设计的数据日期 date 1 2 3 4 5 程序如下: A B C D E受试者 person 1 129.8 144.4 143.0 133.4 142.8 B C D E A 2 116.2 119.2 118.0 110.8 110.6 C D E A B 3 114.8 113.2 115.8 114.0 105.8 D E A B C 4 104.0 132.8 123.0 98.0 120.0 E A B C D 5 100.6 115.2 103.8 110.6 109.8 do date=1 to 5; do person=1 to 5; input cloth $ y @@; A 129.8 B 116.2 B 144.4 C 119.2 C 143.0 D 118.0 D 133.4 E 110.8 E 142.8 A 110.6 ; proc anova data= cla model y= C 114.8 D 104.0 E 100.6 D 113.2 E 132.8 A 115.2 E 115.8 A 123.0 B 103.8 A 114.0 B 98.0 C 110.6B 105.8 C 120.0 D 109.8程序说明:对于拉丁方试验设计应该要用 anova 过程。实际上拉丁方试验设计是一种特上海财经大学经济信息管理系IS/SHUFE Page 29 of 30 殊类型的 3 个因素试验设计, 其水平数必须相同, 因此在 class 语句中有 3 个分类变量名 (date、 person、cloth)。在 3 个水平交叉的单元上只有一次试验,且不存在 3 个分类变量的交互效 应,所以在 model 语句等号的右边也只有这 3 个分类变量名。所作的三个原假设为:①各种 防护服的平均脉搏数相同;②各个受试者的平均脉搏数相同;③不同日期的平均脉搏数相同。 如果欲进一步比较某个因素的任两个水平的平均脉数是否相同,可增加 means 或 contrast 语 句。程序输出的主要结果见表 25.12 所示。拉丁方试验设计的方差分析 表 25.12 5×5 拉丁方试验设计的方差分析 The SAS System Analysis of Variance Procedure Class Level Information Class DATE PERSON CLOTH Levels 5 5 5 Values 1 2 3 4 5 1 2 3 4 5 A B C D ENumber of observations in data set = 25 Dependent Variable: Y Source Model Error DF 12 12 Sum of Squares 0 526.5. C.V. Root MSE Y Mean Mean Square 298.. F Value 6.80 Pr & F 0.0011Corrected Total 24 R-Square表 25.12 中结果分析:5 种防护服对脉搏数作用的差异,统计上显示无显著意义 (0.) 。而受试者之间的差异是有统计意义的(0.),说明试验的差异主要 来自受试者个体的情况,如身体状况、心理状况等,而与 5 种不同的防护服无关,基本上也 与试验在哪一天发生无关。上海财经大学经济信息管理系IS/SHUFE Page 30 of 30
实验报告五-SAS方差分析 - 实验报告 实验项目名称 所属课程名称 实验类型实验日期 方差分析 统计分析及 SAS 实现 验证性实验
班学姓...SAS-方差分析_生物学_自然科学_专业资料。南京农业大学SAS实验指导-统计推断Ⅱ(方差分析――多个平均数的比较)四、统计推断Ⅱ(方差分析――多个平均数的比较)(1...SAS笔记第五章,方差分析_数学_自然科学_专业资料。 多因素方差分析之区组设计方差分析 促销方式(method) () 分组情况 A (6.8 折加送礼物) B(5.8...(3)拉丁方设计资料的方差分析(三因素方差分析) (4)R*C 析因设计资料的方差分析(有交互因素的方差分析) SAS 系统中,ANOVA 过程可以处理以上情形的方差分析,但...实验报告6――SAS方差分析_农学_高等教育_教育专区。SAS方差分析 练习题解答实验报告 实验项目名称 所属课程名称 实验类型实验日期 方差分析 现代统计软件 验证性实验...SAS整理下之方差分析 - 第四届经济与管理学院团支书联席会期末复习宝典 六、方差分析 1.单因素方差分析 用 INSIGHT 进行分析 1)整理所给数据,创立数据集。 (在...sas的glm和anova基础_数学_自然科学_专业资料。多组资料均数比较我们一般采用方差分析的方法, SAS 中方差分析的功能非常全面, 能实现方差分析功能的过程有 anova ...SAS 方差分析 作业5_数学_自然科学_专业资料。SAS 方差分析实验七 方差分析一、 作业题目: 用二氧化硅(SiO2,原著中译为二氧化矽)50mg 对大鼠染尘后,不同时期全...完全随机设计资料的方差分析及两两比较的SAS程序 - 完全随机设计资料的方差分析及两两比较的 SAS 程序 01 data d07-01; 02 input x grp@@; 03...SAS学习系列29. 方差分析Ⅱ―ANOVA,GLM过程步_计算机软件及应用_IT/计算机_专业资料。SAS学习系列,方差分析,ANOVA,GLM 28. 方差分析Ⅱ―ANOVA,GLM 过程步 SAS ...
All rights reserved Powered by
www.tceic.com
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 可重复双因素方差分析 的文章

 

随机推荐