手机热点分享怎么弄用过不能用家里无线网怎么弄

分段指数模型的拟合及SAS实现-1
实现,给出了最小二乘法在多元正交基函数拟合中的计算机实现方法,以常见的二次...模型易用MATLAB编程求解; 文献[5]研究的是基于最小二乘法的分段三次曲线拟合...
模型去分段拟合该时间序列,例 如采用门限回归模型。...? 负指数衰减――随着时间的推移,自相关函数 ? (...介绍 ARIMA 模型的建模过程及 SAS 实现(见 GDP ...
第五章 SAS 作业学号: 姓名: 何斌 年级专业: 10 级统计 1 班 指导老师:肖莉 问题 1:试选择恰当模型拟合某种股票的价格数据,数据如下: 10.5 10....
插值与拟合模型_自然科学_专业资料。插值与拟合 §1 多项式插值问题 互异结点处...缺省时:分段线性插值。 三次样条插值; 立方插值。缺省时:分段线性插值。 注意...
绘图Ⅲ―散点图,时间序列图,拟合曲线图_计算机软件及应用_IT/计算机_专业资料。SAS学习系列,绘图,散点图,时间序列图,拟合曲线17. 绘图Ⅲ―散点图,时间序列图,...
而且实现简单,便于物理分析和研究,故成为最常用的...下面以分段线性拟合与分段三次曲线拟合为例讨论分段...a0 , a1 , a2 的值,从而确定出式 通过模型 ?ai...
服从正态分布外,还可以检验对数正态、指数和韦布尔...检验、符号秩检验,在SAS中可用univariate过 程实现。...中由模型能解释的部分占到 77.29%, 模型拟合效果...
最优arma模型及autoreg模型拟合预测_教育学/心理学_...该市房地产价格走势拟合及预测图 1.6 SAS 程序: ...
相关与回归模型 SAS 程序主要内容 1、散点图 2、相关分析 3、一元回归模型建立及检验 4、一元回归模型的拟合图与残差图 5、多元回归模型与数据标准化系数 6、...
用SAS 的 mixed 过程拟合林分的线性差分生长模型 【摘要】 本研究的目的在于...分段指数模型的拟合及SA... 827人阅读 3页 3下载券 SAS系统中线性回归模型的...扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
正态分布检验 sas有一组数据来自同一个样本,217份,检验是否符合正态分布,SAS的程序怎么写呢~
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
PROC UNIVARIATE DATA=数据集名 NORMAL PLOT ; VAR 变量;RUN;
为您推荐:
其他类似问题
PROC UNIVARIATE NORMAL PLOT DATA= VARyou need to change "temp" and "age"
扫描下载二维码  【摘 要】本研究的目的在于研究如何用SAS的proc mixed过程拟合线性代数差分模型。所用数据来源于148个集约经" />
免费阅读期刊
论文发表、论文指导
周一至周五
9:00&22:00
用SAS的mixed过程拟合林分的线性差分生长模型
  【摘 要】本研究的目的在于研究如何用SAS的proc mixed过程拟合线性代数差分模型。所用数据来源于148个集约经营火炬松人工林。直接拟合了一个胸高断面积的收获模型,而非代数差分生长模型。模型拟合过程如下:i).同时确定随林分变化的参数和最优拟合的方差结构模型;ii).依据AIC、BIC和极大似然比检验化简期望模型;iii).用代数差分法将拟合的收获模型转化为代数差分生长模型。 中国论文网 /8/view-4825651.htm  【关键词】线性代数差分模型;mixed过程;模型筛选;林分生长与收获预估   0.前言   在林分生长与收获预估的模型中,差分生长模型得到了广泛的应用。线性差分模型基本上为Schumacher模型的变型,广泛应用于林分蓄积、胸高断面积的建模,以及单位面积株数和优势木树高生长模型。   差分生长模型拟合方法有“直接最小二乘估计法”和“分类变量回归法”[1]。一般认为后者可以获得近似无偏的估计,而前者则导致检验统计量如RMSE的失真[2]。传统上差分生长模型的拟合主要是直接拟合差分生长模型,然后根据拟合统计量如RMSE、R2等确定最优拟合模型。与传统方法不同,本文直接拟合生长模型,在获得参数估计值后,再用代数差分法导出相应的代数差分生长模型。这样做的优越之处在于非常便于对期望模型和方差结构模型进行筛选。更为重要的是,可以通过模型拟合识别最适合的随林分变化参数。   本文详细讨论了如何用“分类变量回归法”和SAS的mixed过程拟合代数差分生长模型,可简述如下:i).直接以生长收获模型为对象,同时确定一个随林分变化的参数和最优拟合方差结构模型;ii). 保持方差结构模型不变,根据拟合统计量逐步化简期望模型;iii).在确定最优拟合的期望模型后,运用代数差分法导出相对应的代数差分生长模型。所有拟合与筛选均用SAS的mixed过程完成,并给出了详细的SAS代码和代码解释。   1.方法与材料   1.1数据   数据来源于148个集约经营的火炬松实验人工林逐年观测的固定样地数据(样地约0.152公顷)。SAS的数据集basal的内容如表(1)。   表1 模型拟合的基本数据结构   Table 1 data structure for mode fitting   age=林分年龄;fert=经营措施,分别取值为H=施加除草剂以控制竞争植物、F=施肥以增加土壤肥力、HF=除草剂和施肥并用、C=对照;code=样地代码,每个样地有一个唯一代码;logba=样地胸高断面积的自然对数值;logdh=样地优势木树高的自然对数值;iage=林分年龄的倒数;logtpa=样地株数的自然对数值。共有148个样地数据,1491个记录。   1.2数学模型   所考虑的胸高断面积收获的数学模型为   E(lny)=α+αlnN+αlnH+α+α (1)   这里lny、lnH和lnN分别对应logba、logdh和logtpa;1/t对应iage,其余为模型参数。通过不同假设,以上模型可以导出很多广泛应用的差分生长模型。例如假设α0为随林分变化的参数,运用代数差分法可以导出Pienaar和Shiver (1986)的胸高断面积模型[3];假设α4=0且α0为随林分变化的参数则可导出Forss等人(1996)提出的差分生长模型[4];假设α4=0和α2=0且α3为随林分变化的参数,则可以导出Souter (1986)的模型[5]。   1.3参数估计方法   从以上代数差分法的讨论中,总是假设模型(1)中有一个参数随林分变化而变化,因而使用“分类变量回归法”以便考虑这一特点。如果用SAS的reg过程,必须构造特殊的数据结构。用SAS的reg过程拟合线性差分生长模型有两点不足之处:1).需要构造复杂的数据文件。以本研究的为例,数据文件中需要增加额外的148个变量;2).reg过程无法考虑重复观测数据的自相关性和异质方差结构。由于所考虑的胸高断面积模型均为线性模型,而且数据为典型的重复观测数据,因而模型的拟合与筛选均用SAS的proc mixed过程。   1.4模型筛选和筛选指标选用   模型筛选包括期望模型和最优拟合的自相关与异质方差结构模型的筛选。Ngo和Brand(1997)推荐了两种模型选择方法[6]。一种方法就是首先列出所有可用的数学期望模型和所有可能的方差结构模型,拟合二者间的所有组合,然后根据模型拟合指标选择最优拟合模型。另一种方法为Wolfinger和Diggle提出的方法,即首先考虑最复杂的期望模型,并保持期望模型不变,然后选择最优拟合的方差结构模型。一旦选出最优拟合的方差模型,保持方差模型不变,再逐步简化期望模型。模型筛选指标较多,但常用的指标为极大似然比检验(LRT)、AIC、BIC(或称为SBC)。LRT用于嵌套的模型,而AIC和BIC用于非嵌套模型。   2.结果与分析   2.1残差的方差结构模型   为考虑经营措施对胸高断面积生长过程的影响,将模型(1)改写如下:(2)   这里参数?为不同经营措施对截距和各项回归系数的影响,下标k分别取值为C、F、H和HF,对应四种经营措施;由于差分生长模型需要确定一个随林分变化而变化的参数,因而模型拟合的首要任务就是识别该参数。假设“1/t”的回归系数随林分变化而变化,那么模型(2)则可以表示如下:      这里βi为随林分变化的参数。   根据以往的研究,所考虑的方差模型为:CS模型(同一林分不同年龄的观测值方差相同,而且相关系数为常数)、AR(1)模型(不同年龄观测值的方差相同,但相关系数为一阶自相关模型)、ARH(1)模型(相关系数为一阶自相关模型, 但不同年龄观测值的方差相异)和ARMA(1,1) 模型(不同年龄观测值的方差相同,但相关系数为一阶自相关移动平均模型)。
  由于模型(2)中共有5个参数可以考虑为随林分而变化的参数(b0~b4),因而相对应地共有5个期望模型,加上所考虑的4个方差结构模型,所有组合共计为20个模型。首先拟合这20个模型,根据拟合统计量AIC、BIC确定随林分变化的参数及最优拟合的方差结构模型,这部分与Ngo和Brand的方法一致;然后保持方差结构模型不变,根据LRT、AIC、BIC剔除回归效果不显著的因子,包括经营措施效果等,即化简期望模型。而这一部分则与Wolfinger和Diggle的方法一致。方差结构筛选的基本SAS代码如下:   以上代码及以后代码中的粗体字为SAS系统关键词。class语句声明了3个分类变量,分别为fert、code及age。model语句中既包含离散型的分类变量,又包含连续型变量(如logba、logtp等,即未在class语句中声明的变量)。以上代码的model语句意义如下:   i).代码中model语句中的分类变量表示该变量对回归模型截距的影响。例如model语句中fert表示不同经营措施下的logba的回归模型的截距不同,随fert变量的取值变化而变化。   ii).如果一个连续型变量与一个分类变量的乘积出现model语句中,且仅以该形式出现,如code*iage,则表示该连续型变量的回归系数随分类变量的取值变化而变化。code是一个分类变量,每个取值对应一个样地,而iage为一个连续型变量,那么code*iage则表示每个样地的iage项的回归系数均不相同,各有其取值。   iii).如果一个连续型变量与一个分类变量的乘积出现,而且该连续型变量同时独立出现在模型中,同样表示该连续型变量的回归系数随分类变量的取值变化而变化,但与ii)的意义有所不同。例如logdh和fert*logdh同时出现在model语句中,表示logdh的回归系数随fert取值的变化而变化,而且每个fert取值的回归系数均表示为两个分量之和。一个分量为参照回归系数,另一个分量为与参照回归系数相比的增量(可负可正)。mixed过程按照英文字母的排列顺序,以fert的最后一个取值(即HF)为参照,其回归系数即为参照回归系数。而fert其它取值的回归系数则表示为参照回归系数(即HF)和与之相比增量之和。   以上model语句的对应的数学模型如下:   以上四个模型分别对应经营措施C、F、H和HF的回归模型。参数α0、α1、α2、α4为在HF经营措施下,林分胸高断面积的回归系数(参照回归系数);参数φi,k为k经营措施的第i个回归系数与HF相对应的回归系数相比之增量(k取值为C、H和F)。以对照C的lnH的系数为例,其回归系数为α2+φ2,C。这里φ2,C就是C的lnH的回归系数与HF的lnH的回归系数相比的增量。以上代码中,fert*logtpa、fert*logdh及fert*logdh*iage分别对应各项回归系数与HF的回归系数相比的增量,即φ;logtpa、logdh及logdh*iage则对应参照回归系数,即HF的回归系数α0、α1、α2和α4等。   依据模型拟合统计量AIC和BIC值(其值越小,拟合效果越好)选择模型,指定1/t的回归系数为随林分变化的参数和arh(1)为方差结构模型时,AIC和BIC均取得了最小值,分别为-3629.9和-3585.0。因而arh(1)为最优拟合的方差结构模型,并且可以确认1/t的回归系数为随林分变化的参数。   2.2最优拟合的期望模型   保持arh(1)结构不变,根据AIC、BIC及极大似然比检验的p值进行期望模型的筛选。模型(3)的拟合结果表明,经营措施H和HF各个参数差异并不显著,φ0,H、φ1,H、φ2,H 和φ4,H是否为0的t检验p值均大于0.05,说明经营措施H的各项回归系数与HF并无显著差别。将二者的回归系数合并为一,仅保留截距不同,可拟合如下模型:    (4)   这里bi,k=αi,k+φi,k(i=0,1,2,4;k=C,F,H和HF);b1,p、b2,p、b4,p为经营措施H和HF的回归系数,b0,H和b0,HF则分别为二者的截距。模型(3)便于比较不同经营措施的效果异同,而模型(4)则便于化简期望模型,即判断一个回归因子对胸高断面积的影响是否显著。注意模型(3)和(4)的唯一区别仅在于将模型(3)中第3个和第4个模型合并为一个而已(仅截距不同)。为拟合以上模型,新引进了一个分类变量“f”,其取值分别为C、F和H,其中经营措施H和HF的样地“f”变量值均为H。拟合模型(4)的SAS代码如下:   模型(4)的AIC、BIC的值均小于模型(3)的AIC和BIC值,LRT检验p值为0.1573,表明模型(4)与模型(3)拟合效果基本相当,但模型(4)更为简洁。由于参数的t检验结果表明仅对照C的lnH/t参数与0相比差异显著,因而剔除F、H和HF的lnH/t项(相应的模型称为模型5)。相对应地,在SAS的数据文件中引入了一个新变量“check”,当且仅当林分的经营措施为C取值为1,其它情形均取值为0。对应的SAS代码如下:   与模型(4)的SAS代码相比,仅用check*logdh*iage 取代了f*logdh*iage。模型(5)的参数t检验结果表明H和HF的回归模型中lnH的回归系数b2,p与0比较差异不显著(p值为0.1181),但剔除该项后的模型拟合的LRT检验平值、AIC、AICC、BIC表现出一种相互矛盾的结果。AIC和AICC表明两个模型拟合效果基本一致,而BIC和LRT检验结果则倾向于选择化简后的模型。本研究最终以模型(5)为最优拟合模型,部分SAS输出的参数估计值见表(2)。   表2 模型(5)的参数估计值   Table 2 parameters estimates for model (5)(下转第164页)
  (上接第109页)*仅列出参数估计值部分,与code值相对应148参数估计值未列于此表。   2.3代数差分生长模型的导出   根据表(2)的模型结构,HF对应的回归模型为:   ln=+lnN+lnH+β (6)   假设t=t1时ln1已知,求解关于βi的表达式可有βi=t1(ln--lnN-lnH);代入模型(6)中可得当t=t2时的lny2的估计式,即:   ln=lny+++   其中ln1用lny1代替。其它经营措施的代数差分模型的导出基本相似,在此略过。   3.讨论与结论   本研究的模型筛选方法与以往研究不同。以往对差分生长模型筛选方法为:拟合选取的差分生长模型,让后根据拟合统计量如RMSE、R2选择最优拟合模型。本文从生长收获模型入手,而不是从差分生长模型入手。首先确定最优拟合的方差结构模型,同时确定最适合作为随林分变化的参数。然后保持方差结构模型不变的前提下,通过AIC、BIC及极大似然比检验的p值逐步化简期望模型。所有模型拟合和筛选均用SAS的proc mixed过程。该过程不仅非常便于拟合有分类变量的回归模型(例如经营措施),而且可以非常方便地拟合方差结构模型。本文所讨论的差分生长模型的拟合方法、筛选方法和拟合过程,均可以应用于其它林分因子如蓄积、优势木树高的线性差分生长模型。对于非线性模型,除了需要构造特殊的数据文件外,其它内容也基本相同。 [科]   【参考文献】   [1]倪成才,刘春梅,丁俊峰,潘晓茹.差分生长模型预测误差的分析[J].北京林业大学学报,):1-6.   [2]NI C,ZHANG L.An Analysis and comparison of estimation methods for self-referencing equations[J].Canadian Journal of Forest Research,72-1484.   [3]PIENAAR L V, SHIVER B D.Basal area prediction and projection equations for pine plantations[J].Forest Science,):626-633.   [4]FORSS,E.,GADOW,K.V.and Saborowski,J.1996.Growth models for unthinned Acacia mangium plantations in South Kalimantan,Indonesia[J]. Journal of Tropical Forest Science,8(4):449-462.   [5]SOUTER,R.A.1986.Dynamic stand structure in thinned stands of naturally regenerated loblolly pine in the Georgia Piedmont.Ph.D.Thesis,University of Georgia,Athens,GA.   [6]Ngo L.,Brand R.,1997.Model Selection in Linear Mixed Effects Models Using SAS PROC MIXED.SAS Conference Proceedings:SAS Users Group International 22,March16-19,1997,San Diego,California.
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。7064人阅读
概率论、数理统计、SAS(21)
from:.cn/s/blog_5fab.html
FROM :/qiaozhanwen@126/blog/static//
-proc univariate统计量:----------------------------------------------------------------------------------------------------------------------------------
1.观测值(未缺失的)
6.峭度系数
7.未校正和校正后的平方和
8.差异系数(相对标准差)
9.平均数的标准误
10.比较变量值是否等于0 的t检验
13.全距范围
14.中数,第3和第2四分位数
15.四分位差
17.第1、2、10、90、95和99的百分位数
18.5个最大值和5个最小值
需指定的(加上选项normal和plot):
19.W或D统计量,检验数据是否正太分布
22.正太概率图,将累加频数分布和理想正太分布相比较
-proc univariate统计结果的一些说明:----------------------------------------------------------------------------------------------------------------------------------
1、极值观测:
极端观测列出了数据中最大和最小的5个值,每个极端数据旁边还有数据的编号。
如果proc univarite中使用了ID语句,则极端数据旁显示的是ID变量。本例中我们可以将subject作为ID,可以用如下语句:
proc univariate data=
title &more descriptive statistics&;
在极端值这一部分,还有个常用的选项:nextobs=n,用于指定呈现几个最大值最小值。例如要呈现10个,则写成:proc univariate data=htwt &nextobs=10;
当加了ID语句和nextobs选项后(值:大小;subject:指定的ID;观测:数据所处的位置):
2、正态概率图:
它是将真实的数据与理想的正太分布数据比较。Y轴呈现数据值,X轴与反向标准正太函数有关。
*表示真实数据,+表示由样本均值和标准差得到的基线。如果样本分布越偏离正太,则*越偏离+。
-----------------------------------------------------------------------------------------------------------------------------------
在proc univariate语句下加入histgram语句,可以生成直方图,加上normal选项可以在直方图上进一步生成一条正态曲线,以便将自己的数据分布与标准正态分布相比较。并嵌入标示:5.2格式的均值,6.3格式的标准差,字体为Arial,高度为3放于西北角。
histogram height/midpoints=60 to 75 by 5
在proc univariate语句下加入qqplot语句,可以生成QQ图(分位数图),如果变量为正态分布,则QQ图就是一条直线。另外也可生成其他分布,例如对数正态分布(lognormal选项),beta分布(beta选项),Weibull分布(weibull选项)等。
在proc univariate语句下加入probplot语句,可以生成概率图,横轴表示真实数据,纵轴表示标准正态分布中期望的百分比,如果呈一直线,则可以认为数据来自正态分布。
PROC UNIVARIATE 含七道指令它们的格式如下(每道指令结束后才用逗号分开):
PROC UNIVARIATE 选项串;VAR 变量名称串;BY 变量名称串;FREQ 变量名称;WEIGHT 变量名称;ID 变量名称串;OUTPUT OUT=统计值输出文件名称 & &统计值关键字符串=统计值变量;
备注:在一个 UNIVARIATE 程序中,可以多次使用 OUTPUT 指令但其他六道指令只能出现一次,此外PROC UNIVARIATE 指令后的六道指令可以按任何顺序出现。
指令 #1:&PROC UNIVARIATE 语句的选项串有下列七个选项可供选择:
常用选项:
(1) DATA=输入资料文件名称
& & & &指明到底对那一个资料文件进行分析,若省略此选项则 SAS 会自动找出在本程序之前最后形成的资料文件并对它进行分析。
(2) NOPRINT
& & & &使用此选项分析结果将不在result里输出。
& & & &使用此选项UNIVARIATE 过程将产生三种图形:茎叶图 (Stem-And-Leaf Plot) 、平行条状图 (Horizontal Bar Chart)、盒状图 & & & & &(Box Plot)、正态分布拟合图 (Normal Probability Plot)(参阅 Tukey 1977)。
& & & &使用此选项 UNIVARIATE 过程将对变量各个取值的频数及百分比进行分析
(5) NORMAL
& & & 此选项可用来要求 UNIVARIATE 过程检定分析的变量是否呈现正态分布并且输出其检验结果。
不常用选项:
(6) PCDLDEF={1/2/3/4/5}此选项是用来决定计算百分位数 (Percentiles)的方法
PCDLDEF=1 表示用第一种计算方法以此类推 ,若省略此选项则UNIVARIATE程序会自动采用用第四种计算方法。
(7) VARDEF={N/DF/WEIGHT (或 WGT) /&WDF}&此选项决定计算变异数所用的分母
N 观察体总数
& & & & DF 观察体总数减去 1 这是本选项的内设值
& & & & WEIGHT (或 WGT) 加权后的观察体总数
& & & & WDF 上述 WEIGHT 值减去 1
指令 #2&VAR 变量名称串
&此指令列举需要进行描述性统计分析的数值变量名称,若省略将对输入资料文件中所有数值变量进行分析,若选用 OUTPUT 指令
&则不可省略 VAR 指令
指令 #3&BY 变量名称串
程序依据此指令所列举的变量将观测进行分组,然后对每组观测分别执行分析,选用此指令时资料文件内的数据必须先按照 BY & & & & & 变量的值做由小到大的重新排列,这个步骤可由 PROC SORT 过程完成。
指令 #4&FREQ 变量名称
这个变量必须是一个数值变量,其值代表观察测重复出现的次数,若此变量的值含小数则取其整数部分若其值小于 1 则此观测将 & & & &被剔除在计算过程之外。
指令 #5&WEIGHT 变量名称
这个变量称为加权变量,用以说明所要分析的变量的权重是多大,其主要功用在于计算加权平均数、加权标准差、及加权变异 & & & & & &数。
注意:若选用了 WEIGHT 指令则 UNIVARIATE 程序将不计算偏度与峰度这两个统计值,这两个统计值将以缺失(.)表示,此外WEIGHT 指令对四分位数极端分数及观察体总数的计算并不发生任何作用(freq选项会对其有影响)。
指令 #6&ID 变量名称串
用来标示输出的变量。
指令 #7&OUTPUT OUT=统计值输出文件名称 & & &统计值关键字符串=关键值变量
保存计算的N mean std等关键统计量
(1) OUT=统计值输出文件名称
存储要输出的关键统计的表名,省略此选项则 SAS 将以内设的命名方式自动给予 DATAn 的文件名 (如 DATA1 DATA2...) n 按输出文件产生的先后顺序由 1 逐次累加而成
(2) 统计值关键字符串
这些关键字代表要输出的统计值,首先说明要保存哪些统计值,然后对要存储的统计值给予变量名。
UNIVARIATE 程序内有二十六个统计值:
统计值及对应含义
N 非缺失值个数
NMISS 缺失值个数
NOBS 观察体总数
MEAN 平均数
SUM 变量值的总和
STD 标准差
VAR 变异系数(标准误)
SKEWNESS 偏度
KURTOSIS 峰度
SUMWT 所有观察体在 WEIGHT 变量上的总和
MAX 变量的最大值
MIN 变量的最小值
RANGE 最大值减去最小值所得的差
Q3 第三个四分位数
MEDIAN 中位数 (第 50 的百分位数)
Q1 第一个四分位数
QRANGE Q3 减去 Q1 之差
P1 第 1 的百分位数
P5 第 5 的百分位数
P10 第 10 的百分位数
P90 第 90 的百分位数
P95 第 95 的百分位数
P99 第 99 的百分位数
MODE 众数如果有不只一个众数取最小值的那一个
SIGNRANK 等级符号检定法 (The Signed Rank Statistic Lehmann 1975)
NORMAL 常态分配的检定 (Test Statistic for Normality)若观察体个数少于 51 则采用Shapiro-Wilk 的 W Statistic 的方法检定否则采用用 Kolomogorov
备注:这些关键字的表达方式是统计值关键字 = 变量名
些代表统计值的变量名称必须根据 VAR 指令内所列举的变量顺序对应地一&一列举未列举者不予输出请看下面这个例子
PROC UNIVARIATE;VAR X Y;BY SEX;OUTPUT OUT=MSD MEAN=MX MY STD=SDX;
假如分组变量 SEX 的值是 1 或 2 则 UNIVARIATE 程序所产生的报表输出文件将是两个 SEX 组在变量 X 与 Y 上的描述性统计值,OUTPUT 指令的界定这个输出数据集WORK.MSD (暂时的文件), MSD数据集包括四个变量即SEXMX MY 及 SDX, 其中 SEX 是分组变量、MX 与 MY 分别是变量 X 与 Y 的平均数、DX 是变量 X 的标准差,由于关键字 STD 后只界定一个变量名称
(SDX) 故此变
量自动指 VAR 指令内所列举的第一个变量,变量 Y 的标准差因未界定其相对应的变量名称因此不输出。
注 意 事 项:
1.缺失数据的处理,处理的方法依遗漏数据的性质而异
(1) VAR 指令中的变量
若观察体在 VAR 指令之某个变量上含遗漏数据则该观察体将被排除在这个变量的计算过程之外,然而若在其他变量上无遗漏数据仍会被纳入其他 VAR 变量的计算过程内,这些含遗漏数据的观察体个数及它们占总观察体数的百分比将被纳入报表输出文件
(2) WEIGHT 指令中的变量
若在 WEIGHT 的加权变量上含遗漏数据则观察体的加权变量值就是 0 这些观察体仍然而会被纳入百分位数的计算以及极端分数的挑选
(3) FREQ 指令中的变量
若在 FREQ 指令的次数变量上含遗漏数据则观察体将被剔除在所有计算过程之外
(4) BY 指令中的变量
若在BY 的分组变量上含遗漏数据则这些观察体在分析的过程中自成一个分组
(5) ID 指令中的变量
若在 ID 的识别变量上有遗漏数据则在需要识别观察体的地方仍以遗漏值 (.)呈现
&&相关文章推荐
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:130683次
积分:2396
积分:2396
排名:第15146名
原创:94篇
转载:58篇
(2)(1)(3)(5)(6)(24)(1)(6)(5)(34)(9)(18)(2)(7)(8)(9)(12)(1)

我要回帖

更多关于 无线网热点软件 的文章

 

随机推荐