用spss对数线性模型如何对人口模型进行logist

今天,我们推送一篇更为详细的二分类Logistic回归教程,本次的研究目的和上面那篇有所不同,有何不同呢,我们详细来看。
一、问题与数据
部分数据如下图,变量caseno为每个研究对象的唯一编码。
二、对问题的分析
使用Logistic模型前,研究者需判断是否满足以下七个研究假设:
假设1:因变量即结局是二分类变量。
假设2:有至少1个自变量,自变量可以是连续变量,也可以是分类变量。
假设3:每条观测间相互独立。分类变量(包括因变量和自变量)的分类必须全面且每一个分类间互斥。
假设4:最小样本量要求为自变量数目的15倍,也有一些研究者认为样本量应达到自变量数目的50倍
假设5:连续的自变量与因变量的logit转换值之间存在线性关系。
假设6:自变量间不存在共线性。
假设7:没有明显的离群点、杠杆点和强影响点。
三、对假设的判断
假设1-4:取决于研究设计和数据类型,如果不满足则需要更换统计方法。
后3个假设则依赖于二分类Logistic回归是否适用于数据。
假设5: 连续的自变量与因变量的对数间存在线性关系。
如果一个及以上连续自变量与因变量的logit转换值间不存在线性关系,可以对其进行数据转换以满足线性假设,需注意以下几点:
1) 数据转换针对原始的连续自变量,如年龄(age)。
2) 只需转换不满足线性假设的连续自变量,不需要转换满足假设的连续变量和不需要线性假设的分类自变量。
3) 如果可以进行数据转换,需要重新检验是否存在线性关系。
如果采用以上方法仍不满足线性假设,则需要将该变量转换为有序分类变量。
假设6:自变量间不存在共线性。
假设7:没有明显的离群点、杠杆点和强影响点。
1.该假设的SPSS操作可见后面第四大部分的操作,此处仅展示如何解读结果。结果中Casewise List表格显示学生化残差大于±2倍标准差的观测。学生化残差大于2.5倍标准差的观测,需要研究者进一步观察决定这些观测是否是离群点,如有必要甚至可以从分析中剔除这些观测。Casewise Diagnostics表格中展示这些信息,如下图:
注意1:如果所有观测的学生化残差小于±2倍标准差,SPSS不会输出上表。如果已经剔除离群点,则第一次分析得到的Casewise Diagnostics表格不会再显示。
注意2:可以通过各种残差如标准化残差、学生化残差或者学生化删除残差来检查离群点。在SPSS操作中勾选Casewise diagnostics选项时,SPSS默认使用学生化残差。
本例中,第70个观测(Case Number)的学生化残差为3.349,符合上述判断离群点的标准,如下图中红框显示:
注意:观测数(Case Number)指SPSS系统内自动编码(Data View窗口中最左侧蓝色一列中的编码),而非研究者赋值的编码。
研究者需要查看该观测为离群点的原因,决定是否删除该观测并报告。本例中则报告“纳入分析的观测中有一项观测学生化残差为3.349”。
根据SPSS分析结果,有两种情况:如果没有离群点,则直接进入第五部分结果解读;如果有离群点,研究者决定是否剔除这些观测或者对数据进行转换。如果剔除离群点,则需要对剔除后的数据重新进行回归分析。如果进行数据转换,则需要从线性假设重新开始分析。
四、SPSS操作
1.在主菜单中点击Analyze & Regression & Binary Logistic…,如下图:
点击后出现Logistic Regression对话框,如下图:
注意:标准的Logistic回归过程中,应忽略Previous和Next键(用于有序Logistic回归)。Methods选项选择默认值,即“Enter”。如果目前未选择“Enter”,应修改为“Enter”。
3.点击Categorical键,可显示Logistic Regression:Define Categorical Variables对话框,如下图:
注意:SPSS要求定义所有分类自变量。
4.将Covariates分类自变量性别(gender)选入Categorical Covariates框中,如下图:
5.在–Change Contrast–区域,将Reference Category从Last改为First,点击Change键,如下图:
注意:选择Last或First取决于数据。本例中以女性为对照组(赋值为0)将男性与女性对比,故选择First。
6.点击Continue键,回到Logistic Regression对话框,可见分类自变量性别(gender)显示为“gender(Cat)”,如下图:
注意:分类自变量后显示“(Cat)”说明已正确定义分类变量。本例中性别(gender)显示“gender(Cat)”,说明已被定义为分类变量。
7.点击Options键,显示出Logistic Regression:Options对话框,如下图:
8.在-Statistics and Plots-区域,选中Classification plots,Hosmer-Lemeshow goodness-of-fit,Casewise listing of residuals和CI for exp(B)这4个选项。在-Display-区域,选中At last step选项,如下图:
9.点击Continue键,即可返回Logistic Regression对话框。
10.点击OK键,即可分析生成结果。
五、结果解释
二分类Logistic回归分析的结果有两个目的:观察自变量对因变量的影响是否有统计学意义;观察二分类Logistic回归模型预测因变量的效果。这两个目的可以通过下面的各部分结果反映。
1. Data coding(数据编码):检查变量和数据,包括以下3步。
(1)检查是否存在缺失观测,纳入分析的观测数是否符合数据库中观测数一致。Case Processing Summary表格如下图:
(2)确认因变量的编码是否正确。Dependent Variable Encoding表格如下图:
(3)观察各个分类自变量是否存在某一类观测数过少的情况,此时不利于二分类Logistic回归分析。Categorical Variables Codings表格如下图:
2. Baseline analysis(基本分析):此部分结果的标题为“Block 0:Beginning Block”,为所有自变量不纳入模型、只包括常数项时的结果,可以与纳入所有自变量的模型的结果相比。
(1) Classification Table表格展示,没有任何自变量危险因素时,最好的情况是所有研究对象没有心脏病。如果做这个假设,只能将65%的研究对象正确分至没有心脏病一类(Overall Percentage一行)。
(2) Variables in the Equation表格展示只有常数项纳入模型的结果。
(3) Variables not in the Equation表格展示没纳入模型的自变量。
3. Binomial logistic regression results(二分类Logistic回归结果)
(1)模型拟合:Omnibus Tests of Model Coefficients展示该模型的统计学意义(与不纳入任何自变量的模型相比),如下图:
二分类Logistic回归中需观察Model一行。从上表中可观察到模型有统计学意义(P
另一种方法是Hosmer and Lemeshow goodness of fit test检验评价模型预测因变量的能力,如下图:
如果该模型检验结果有统计学意义则提示模型拟合较差。本例中Hosmer and Lemeshow goodness of fit test检验没有统计学意义(P=0.871),提示模型拟合良好。
(2)方差解释:为了解因变量的变异能够被拟合的模型解释的比例,可以查看Model Summary表格。
该表格包含Cox & Snell R Square和Nagelkerke R Square,这两种方法都可以解释因变量的变异(与多元回归分析计算方法略有不同)。这两种R2有时被称为伪R2,在多元回归分析中伪R2小于R2。这些伪R2与R2解释的方法相同,但需要更谨慎。
因此,本研究中因变量可被解释的变异比例在24.0-33.0%间,具体数值取决于Cox & Snell R2和Nagelkerke R2。Nagelkerke R2在Cox & Snell R2基础上改进,但Cox & Snell R2不能达到1(其中Cox&snell R2计算公式:R2C&S= 1 – (L/ LM)2/n,L是没有自变量时的似然函数值,LM是有自变量时的似然函数值,n是样本量)。因此,最好报告Nagelkerke R2。
4. Category prediction(模型预测)
二分类Logistic回归估计事件(本例中为患心脏病)发生的可能性。如果事件发生的可能性大于或等于0.5,SPSS判断为事件发生(本例中为患心脏病);如果可能性小于0.5,则判断为事件未发生(本例中为未患心脏病)。
研究者常对自变量使用Logistic回归来分类或预测观测的结局。因此,与真实情况相比,预测效果的有效性有必要评价。根据研究不同类型有很多方法评价这种有效性,这些方法都围绕观测和预测的分类,结果在Classification Table可见,如下图:
首先,需注意该表下方的说明“界值为0.5”,表明如果观测被分类至“是”这一类的概率大于0.5,则该观测会被分类至“是”这一类,否则被分类至“否”这一类。
SPSS结果中第一个Classification Table显示,不考虑自变量、假设所有观测“没有”心脏病时,模型能够将65.0%的观测能够正确分类。当纳入自变量时,模型能够将71.0%的观测正确分类(查看Overall Percentage一行),即纳入这些自变量能够能够提高预测能力。该指标常被称作percentage accuracy in classification(正确分类百分比)。
第二个指标是敏感度,因变量分类(或预测)为“是”的观测数占实际为“是”的观测数的比例。本例中,45.7%患有心脏病的研究对象被模型预测患有心脏病(请查看“Percentage Correct”列中实际观测的“Yes”一行)。
特异度是指因变量分类(或预测)为“否”的观测数占实际为“否”的观测数的比例。本例中,84.6%未患心脏病的研究对象被模型预测未患心脏病(请查看“Percentage Correct”列中实际观测的“No”一行)。
阳性预测值是指预测与实际均为“是”的观测数占所有预测为“是”的观测数的比例。本例中,该值为100*(16÷(10+16))=61.5%,即预测患有心脏病的观测中有61.5%预测正确。
阴性预测值是指预测与实际均为“否”的观测数占所有预测为“否”的观测数的比例。本例中,该值为100*(55÷(55+19))=74.3%,即预测未患心脏病的观测中有74.3%预测正确。
5. Variables in the equation(方程中的自变量)
Variables in the equation表格中展示了每个自变量的贡献及其统计学意义,如下图:
系数B(“B”一列)用于预测事件(因变量)发生的概率,代表在其他自变量为常数时自变量每变化一个单位,比值比(事件发生概率与不发生概率的比值)的log值的变化。
例如,本例中与女性(赋值为0)相比男性(赋值为1)患心脏病比值的log值变化为1.950。但用系数B解释结果的不够直观,SPSS结果在“Exp(B)”一列中提供每个自变量的比值比,后面两列是置信区间(95%C.I. for EXP(B))。
“Exp(B)”大于1代表自变量每增加一个单位发生结局的风险是不增加时的倍数。本例中,男性患心脏病的风险是女性的7.03倍。Exp(B)小于1.0则提示自变量每增加一个单位发生结局的风险是不增加时的倍数。
六、撰写结论
1. 简要汇报
本研究采用二分类Logistic回归评估年龄、体重、性别和最大摄氧量对研究对象患心脏病的影响。最终,得到的Logistic模型具有统计学意义,χ2(4)=27.402,P
模型纳入的五个自变量(或预测因素)中年龄、性别和最大摄氧量这三个变量有统计学意义(见表1)。男性患心脏病的风险是女性的7.03倍。年龄每增加一岁,患心脏病的风险增加9%;最大摄氧量每增加一个单位,患心脏病的风险降低9%。
2. 详细汇报
本研究采用二分类Logistic回归评估年龄、体重、性别和最大摄氧量对研究对象患心脏病的影响。
使用Box-Tidwell方法检验连续自变量与因变量logit转换值间是否为线性,线性检验结果得到所有连续自变量与因变量logit转换值间存在线性关系。一个观测的学生化残差为标准差的3.349倍,但保留在分析中。
最终,得到的Logistic模型具有统计学意义,χ2(4)=27.402,P
模型纳入的五个自变量(或预测因素)中年龄、性别和最大摄氧量这三个变量有统计学意义(见表1)。男性患心脏病的风险是女性的7.02倍。年龄每增加一个岁,患心脏病的风险增加9%;最大摄氧量每增加一个单位,患心脏病的风险降低9%。
1.【合集】23种统计方法的SPSS详细操作
2.那么多变量,我该选择哪些进入多因素分析呢?
3.举几个例子,看看多因素分析中可能犯的错
医咖会微信:medieco-ykh
赶快关注医咖会吧!
有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),加入医咖会统计讨论群,和小伙伴们一起交流学习吧。
文章转载自网络,作者观点不代表本网站立场,如需处理请联系客服
医咖会其它文章
上一节医咖会Stata视频教程,我们强调了可重复性的重要性,提到Log File和Do File。Log File,可将所有显示在Stata结果窗口的内容保存在一个文件中,从而让你可以回顾每一步结果,让分析更加透明。那么在Stata中如何利用好Log File呢,快点击下方视频学习吧!手机播放视
很多人在生活中都有饮酒的习惯,人们常说要适量饮酒,不要贪杯,但现实往往是不醉不归。《美国居民膳食指南》中建议,男性每周饮用酒精量不超过196g,女性每周不超过98g。《英国国居民膳食指南2016》中建议,不管是男性还是女性,每周饮用酒精量均不超过112g。
上一节医咖会Stata视频教程,我们学习了如何计算置信区间和查看变量的相关性。本期Stata小课堂,我们主要来学习:为什么要强调分析的可重复性,以及用Stata如何保证分析的可重复性,这就引入我们后面要重点介绍的Log File和Do File了。有了Log File和Do File,再也不用每
上一节医咖会Stata视频教程,我们学习了如何在Stata中绘制常见的双变量图像(折线图、垂直线图等)。本期Stata小课堂,我们主要来学习:计算置信区间,查看变量的相关性,以及绘制相关性矩阵。要学习的Commands有:ci mean;proportion;pwcorr;graph matrix手机播放视
上一节医咖会Stata视频教程,我们一起学习了散点图(Scatter plots)的绘制。今天,我们进一步来介绍在Stata中还可以绘制哪些常见的双变量图像,例如,折线图、垂直线图、脉冲图、面积图等。手机播放视频,可能有些地方看不太清楚,可使用电脑打开本文,或直接复制下方链
上一节医咖会Stata视频教程,我们一起学习了几个常见的统计图——直方图、箱形图、小提琴图。今天,我们继续来学习如何绘制散点图(Scatter plots)。要学习的Commands为:twoway scatter。手机播放视频,可能有些地方看不太清楚,可使用电脑打开本文,或直接复制下方链
会议预告糖尿病已经成为21世纪危害人类健康的重大疾病之一,目前我国糖尿病患病人数多、基层诊疗水平亟待提高、糖尿病防治形式严峻。由中华医学会糖尿病学分会制定的中国2型糖尿病防治指南是指导我国糖尿病临床诊疗实践的行动纲领和行为准则,2017年指南再次更新,纳入了
我们常常把随机分组挂在嘴边,好像只要一提到随机化,整个研究就能提升一个level。但是在实际的研究过程中,很多研究者并不知道怎么才能正确的实现随机分组。所以,小咖决定手把手来教大家如何通过SPSS,轻松实现随机分组。随机分组随机分组,就是将参加研究的受试对象,
上一节医咖会Stata视频教程,我们一起学习了“统计描述指标(均数、标准差)”。除了这些指标,我们还可以通过图形来简洁、直观地对数据进行统计描述。今天我们就来学习几个常见的统计图:直方图、箱形图、小提琴图,对应要学习的Commands分别为:histogram,graph box,
在上一期的文章中,我们向大家介绍了随机抽样的相关内容,它主要用在流行病学调查选择研究对象的过程中,目的是为了使所有的研究对象都有相同的机会被抽取。(点击查看:手把手教你SPSS实现随机抽样的两种方法)。当然,对于抽样结构比较复杂的情况时,我们需要综合多种
日-6日,中国研究型医院学会糖尿病学专业委会第二期青年专家临床研究方法培训班在武警总医院学术报告厅隆重召开。中国研究型医院学会糖尿病学专业委员会主任委员肖新华教授、青年委员会主任委员于淼教授在大会致辞中强调了临床研究的重要性,希望培训班能够帮
我们在进行科学研究时,常常会强调一个非常重要的概念——“随机化”。随机化的过程主要分为两大类:随机抽样和随机分组,它们在样本选取和分组方案中占有至关重要的地位。随机化按照数学概率的原理,使研究对象有同等的机会被抽中或被分配到某一处理组,结果不受人为因
上一节医咖会Stata视频教程,我们一起学习了如何进行数据观测,相信聪明的你,都已经完全掌握了吧。提到统计描述,你是不是马上就想到了均数、标准差?那赶快来看看如何在Stata里快速得到一组数据的均数、标准差、百分位数等指标吧。本期一起学习的Commands:codebook和
中国研究型医院学会糖尿病学专业委员会联合医咖会推出:研医论道。针对糖尿病领域的指南、最新文献、会议资讯,学会专家深度解读,全方位剖析领域热点!第19期由天津医科大学总医院的黄雨蒙,舒画和刘铭教授带来『单基因糖尿病研究进展』的精彩综述。本栏目将持续更新,
上一节医咖会Stata视频教程带大家了解了Stata界面的各个模块,相信你对Stata软件有更深的认识了吧。假设,你现在拿到了一个数据集,第一步会做什么呢?这就涉及到我们今天的讲题:初步数据观测。通过这节课,我们可以先从整体上了解要分析的数据。手机播放视频,可能有些
-5日,2018中国医师协会循证医学专业年会暨复旦循证医学论坛将在上海召开!本届学术年会聚焦临床研究和循证临床实践,邀请国内外著名循证医学专家进行主题报告。本次盛会由中国医师协会、中国医师协会循证医学专业委员会主办,复旦大学循证医学中心承办,国家
3个多月前,医咖会发过有序Logistic回归的详细版SPSS教程;前几天,一位大咖用户『fangjinming1983』在医咖会官网(http://www.mediecogroup.com/)上对文章内容提出了疑问,我们查阅了多篇文献,发现以前有些理解不是很到位,所以决定再更新一下这个教程。更新的内容主
各位伙伴:最近一段时间,深深感受到了大家对R教程的渴望,正好医咖会团队中也有熟知R的大咖,我们讨论了一下,决定尽快推出R教程,全力满足大家学习和工作的需求。目前课程正处在规划阶段,我们初步拟定了医咖会R课程的内容大纲,展现形式暂定为视频。一、基础入门二、
上周五,医咖会推送了Stata视频教程开课的通知,相信大家已经大致了解了我们的课程规划。本期内容我们就带大家一起先来认识Stata界面,看看每一个版块都有哪些功能。对Stata软件有了完整的了解,将会极大提高我们统计分析的效率,所以加入我们,一起来打好基础吧手机播放
在上一期的内容中,我们介绍了如果想要比较两个疾病模型的预测能力,除了可以绘制两个模型的ROC曲线并计算曲线下面积(AUC)外,还可以用定量的指标来比较新、旧模型预测准确率的改善程度,即净重新分类改善指数NRI。(详细内容可查看:比较两个疾病模型的预测能力,AUC和如何用 spss17.0 进行二元和多元 logistic 回归分析 一、二元 logistic 回归分析 二元 logistic 回归分析的前提为因变量是可以转化为 0、1 的二分变 量,如:...
SPSS-配对条件 Logistic 回归分析_IT/计算机_专业资料。SPSS 配对调查资料的条件 Logistic 回归分析(1:1 或 1:n) 1. 1:1 病例对照研究的基本概念 在管理工作...
回归分析简要步骤 利用 SPSS 进行 Logistic 回归分析简要步骤现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用 0 和 1 表示。如果我们采用...
在菜单栏依次选择分析(analyze)D回归(regression)D...(二)曲线估计法 采用 spss 的曲线估计进行模型拟合...文档贡献者 比例尺文学家 贡献于 ...
利用SPSS 进行Logistic 回归分析_经济学_高等教育_教育专区。SPSS Logistic 回归分析 (word版) 第8 章 利用 SPSS 进行Logistic 回归分析 现实中的很多现象可以划分...
SPSS logistic回归分析_计算机软件及应用_IT/计算机_...筛选条件,只有满足该条件的记录才会被纳入分析,单击...下 面我将演示它是如何做的,毕竟不是每个例子都...
如何用 spss17.0 进行二元和多元 logistic 回归分析一、二元 logistic 回归分析二元 logistic 回归分析的前提为因变量是可以转化为 0、 的二分变量, 1 如: 死亡...
分类资料的Logistic回归分析SPSS_计算机软件及应用_IT/计算机_专业资料。SPSS 10....回归方程的应变量取值可是在实数集中,直接做会出现 0~1 范围之外的不可能结果...
SPSS实验8-二项Logistic回归分析_计算机软件及应用_IT/计算机_专业资料。关于SPAA实验操作方法 SPSS 作业 8:二项 Logistic 回归分析为研究和预测某商品消费特点和...
Logistic 回归 Logistic 回归是多元回归分析的拓展,其...1 年以内为 0) ,进行非条件的 logistic 回归建模...如何用SPSS做logistic回... 13页 1下载券 利用SPSS...豆丁微信公众号
君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
Logistic人口预测模型的SPSS拟合方法分析
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口spss软件中logistic回归模型结果如何分析,求详细_百度知道
spss软件中logistic回归模型结果如何分析,求详细
使用spss软件对随机变量x1-x8做logistic回归分析,得出了如下图的结果,求问如何对图中信息做分析和提炼?各个值表示的什么意思,如何理解?
我有更好的答案
这个不需要什么提炼,你能看懂就可以了
请问能说下怎么对这个数据进行阐述么
为您推荐:
其他类似问题
logistic回归的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。豆丁微信公众号
君,已阅读到文档的结尾了呢~~
归回分析中的类别变量处理
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
如何使用SPSS对Logistic回归中分类变量进行处理
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 双重差分模型 spss 的文章

 

随机推荐