心电奥迪a4l胎压监测设置z、w、l区别是什么

当前位置: >>
心电图形状分析的统计方法
华东师范大学 硕士学位论文 心电图形状分析的统计方法 姓名:李树良 申请学位级别:硕士 专业:概率论与数理统计 指导教师:周迎春 201105 中文摘要摘要在现代医学中,已经有很多种方法应用到了心电图的研究领域,他们大部分都是 提取一个人一段时间(如15秒钟)的心跳情况进行分析,这其实是一个抽样过程:从 总体中抽出部分样本,但是,到目前为止,还很少有人从统计学的角度、用统计分析 方法对心电图的形状和特性进行研究。 我们先采用传统的主成分分析方法对心电图进行分析,探索心电图的共性随时间 的变化特征,发现不同时间段内该病人的主要特征有共性,也有差异或者说变化;然 后介绍引起学术界越来越重视的函数型数据,介绍函数型主成分分析,对多元主成分 进行扩展,结合其在其它领域的良好效果,首次将其应用到心电图上,我们发现三个 波的变化特征极为相似,都体现为垂直方向上的移动、水平方向上的平移和斜率的变 化,各个波的主要变化形式也有量的差异;最后我们对已有函数型数据的非线性模型 进行细微的改动,把其应用从T波推广到整个心跳的P波、QRS复波和T波三个波段, 将其形状变化特征通过非线性模型分解为几个方向的变化,利用函数型数据能够抓住 数据的整体特征,进行降维,函数型数据良好的解释性,能够对心电图本身所隐含的 生理学信息进行解释,有助于解决QT的方法操作不方便、敏感性太强等局限性。关键词:心电图,主成分分析,函数型数据,函数型数据分析 英文摘要AbstractManymethods have been used in the field ofaelectrocardiogram(ECG)inmethodsmodernSOmedicine,In fact,this is far,few people have First,wesampling procedure,ie,takessamples from population.Butanalysis,andstudied the shapeproperties llsing statisticalsophisticatedly. found commonanalyzedthe ECG usmg principal componentfeatures of thevariations ofthe ECGs.Wefound that there are similarityand characters.princioThen we introduced the functional principal component pal component analysis,which and we used it wavesare onanalysis and extended theattentionreceivedmoreand morefrom many researchers, oftheECG for the firsttime.Wefound that the variationd证erentsimilar,ie,vertical and horizon shifts.anFinally,we modifiedexistingnonlinear model of functional data whichhave beenusedonTwave,and extendedmuch which greatlyit to P waveand QaScomplex wave tocharacterizetheshapeof ECGs.It iseasier toreduce the dimension ofthe data llsing functionalanalyticalimprove the currently using ofQT method.Key Words:ECG,Principal component analysis,Functional data,Nonlinear model-X- 李树良硕士学位论文答辩委员会成员名单姓名 张日权 汤银才 吴贤毅职称 教授 教授 教授单位 华东师范大学 华东师范大学 华东师范大学备注 主席 插图目录插图目录1.1一个正常的心跳……………………………………………………………. 1.2一个病人10秒钟的心电图………………………………………………….. 1.3编号为selll6的病人的样本矩阵的三维图………………………………….. 2―1三段样本各自的前三个主成分…………………………………………….. 孓1从多元主成分到函数型主成分……………………………………………..3-2155912 16 16 17P波、QRs复波和T波各自的第一个主成分……………………………….. P波、QRS复波和T波各自的第二个主成分……………………………….. P波、QRS复波和T波各自的第三个主成分………………………………..Pi!芰………………………………………………………………………….3-3 3-44―122 22 22 22 23 23 23垂2 垂3 4-4 4-5 垂6 4-7 垂8 4-9 4-104-11QRS波……………………………………………………………………… T波…………………………………………………………………………P波参数散点图(凡^=0.8771,阳=一0.9322,P<0.01)……………….. QRs波参数散点图(氏^=0.6793,触=一0.9826,P<0.01)…………….. T波参数散点图(p曲=0.5718,阳=一0.8017,P<0.01)………………..P波和QRS复波参数h散点图………………………………………………. P波和T波参数h散点图…………………………………………………….. QRS复波和T波参数h散点图………………………………………………. P波参数U和h的功率谱密度……………………………………………….. P波参数d和m的功率谱密度……………………………………………….232 3 2 4烈5 表格目录表格目录2-1贡献率I……………………………………………………………………..93-1贡献率II…………………………………………………………………….17 4-l图垂1,垂2,垂3对应P波、QRS复波和T波让、d、m和h参数值……………224-2P波、QRS波和T波参数九的相关矩阵(p<0.01)…………………………24 P波、QRS波和T波参数U的相关矩阵(p<0.05)…………………………244-3 第一章引言弟一早j I苗 第一章引言§111问题背景随着社会的进步和经济的发展,人们对自身的健康日益关注。’’健康是无价的”的 观念已经逐渐深入人心。据统计,在我国,由心血管疾病引起的死亡占到了总死亡构 成比的40%左右,对人们的健康造成了极大的威胁。心血管疾病包括心律失常、心室 心房肥大、心肌梗死、心律失常、心肌缺血等病症。目前,临床上主要通过ECG来 对心血管疾病进行诊断,以此作为治疗的依据,结合医生临床经验对病人进行治 疗。ECG是指使用心电采集仪器(如心电监护仪)记录人体心脏电位变化、并据此应 用于临床心脏疾病监护/诊断的可见图形记录,心电图一般划分为P、Q、R、S和T五 个波段(图1.1)。图1-1一个正常的心跳临床上把各个波的振幅、长度、形态和变化方向等因素作为指标对病人进行诊 断。例如,临床上规定,如果P波的振幅增高,而P波时限正常或无明显延长时,就 意味着有可能是右心房肥大;又如,在某些导联,T波的振幅不应低于同导联R波 的1/10。但是,由于各个波的形状受呼吸、身体的移动以及病变等因素的影响,其形 状也会出现变异,而这些变异可能是肉眼不能识别的,增加了对各个波段进行测量和 识别以及诊断疾病的难度。 因此,有效识别各个波的振幅、形态和变化方向对医生进行诊断起着关键的作 用,本文将从这些方面对其进行研究。§1.2研究现状目前,国内外大量学者和专家对心电图的识别和分类做出了极大的努力和贡献,?1- §1.2研究现状 其研究主要是利用滤波域值法、句法学法(Syntactic Method)、小波分析、人工智 能法、主成分分析法以及支持向量机(SvM)等,这些方法基本都是用斜率、振幅或 者QT、RR的长度等直观参数对心电图进行描述,以此达到对心电图进行识别、分类的 目的;或者是利用主成分分析的方法,提取心电图的主要特征和隐含的信息,达到降 维、压缩数据等目的。§1.2.1滤波域值法Pan J币DWompkinsWJ[26]先对心电图进行带通滤波降低干扰;然后通过对波形进行差分得到斜率的信息,再通过平方放大,最后移动窗口积分得到包含斜率和宽度的 信息,根据斜率、振幅和宽度,再加上决定规则,利用振幅限制逐步放宽的双阀值技术对QRS主波的位置进行检测,并反复测试MIT/BIH心电数据库优化振幅阀值公式和其他参数,利用跳过一定长度的不应期和斜率判断的方法降低了把T波误检为QRS主波 的概率,同时阈值随着检测到的信号实时地自适应变化着。 该方法允许更小的窗宽,增加了检测的灵敏度,并且该算法窗宽和参数的自适应变化能够适应QRS复波形态和心跳速率等相关的ECG变化。在24小时的MIT/BIH心律不齐心电数据库中,该算法的正确检测率达至1J99.3%。§1.2.2句法学法句法学法提出了一套ECG模式文法来描述ECG。Trahanias P.和Skordalakis E.f271首先对ECG进行基元模式提取,接着将ECG波形转化成字符串,然后根据ECG 模式文法和QRS复波的能量阈值和角度阈值来识别出QRS复波。该算法不仅能识 别QRS复波,也能识别P波、T波,甚至能区分心拍的正常异常,识别效果不错。缺点 是运算量很大,算法比较复杂。 事实上,这里的能量实际上是和振幅相关的,而角度实际上是和斜率相关的。§1.2.3小波分析法小波变换是一种时域和频域相结合的分析方法,将信号在时间和频率上以不同分 解率分解,使局部信号特征明显。多分辨率等良好的性质使它成为研究心电信号的有 力工具,并取得了丰硕的成果。 小波变换在心电信号的波形识别和检测领域的主要研究有如下:主要是利用二进样条小波对信号进行变换,从二进小波变换等效滤波器角度[10】,分析了信号奇异点(R峰点)与小波变换模极大值对零交叉点的关系,在检测中运用了一系列策略以增 强算法的抗干扰能力,提高QHs波检测正确率;Dinh HAN[11]对各种不同性质的小波 函数进行试验,检验它们的正交性和时频集中性对准确检测QRS波群能力的影响,得?2? 第一章引言 出对称紧支撑的小波检测效果较好。另外利用构造新的小波方法:如余辉、张凯等 人【31]利用一次微分小波和二次微分小波构造出两个具体的算法,提高了QRS波的检出 率;基于双正交样条小波的提升格式,降低了运算复杂度,提高了运算速度;或者采 用适合强干扰区的高精度小波一最小二乘小波,用较少的运算量取得了较高的精确性。 张杨等人【32]将心电信号进行多尺度分解,把不同频带的信号显现在小波分解的各个尺 度上。特征尺度上准确定位QRS波和T波的起始点,从而获得人体心电信号中的QT间 值,为临床诊断提供更加准确的依据。§1.2.4隐马尔可夫模型法隐马尔可夫模型实际上是一种非确定性随机有限状态自动机,其状态变换不是 用转化方程来描述而是用转化可能性大小来描述,而且可以递归地构造。隐马尔可 夫模型可以对ECG进行精准的建模,接着进行句法分析,从而识别ECG的各种子模 式:P波、QRS复波、T波。t;用隐马尔可夫模型建模并识9}I]ECG法无需先验知识就可以递归地构造f3】,可以直 接把心电信号转化成初始符号串,对难以识别的子模式进行模糊判定。缺点是建模训 练过程是隐藏的,无法得知模型训练数据的学习程度。部分实验的结果是,该方法能 正确检测99.9%的QRS复波。§1.2.5人工智能法人工神经网络可用来学习模式和经验,然后进行识别。结合主成分分析、小波分析、李亚谱诺夫指数、卡尔曼滤波的基于神经网络的方法【24]【8]【25】,以及二级神经网络可用来获得更好的效果。 实际上,ECG识别都是基于知识的过程。基于知识库的ECG模式识别就是对这个 过程进行归类、表达、存储、搜索、比较,进而进行诊断。ECG知识库的所有知识是 许多ECG专家的智慧结晶。ECG知识封装在知识库里。基于知识库的ECG识别方法按 照对心电知识的描述方法不同分为AND/OR图表达,一阶谓词逻辑,模糊逻辑,过 程语义网等技术。前三者利用形态方面的领域知识,后者还用到心电传导系统。模糊 方法能处理更细微的变化,而不需要增加规则。例如,ECG先被抽取为具有时间戳的 序列,用神经网络从ECG抽取有用的特征,再用识别器的时间推理机对其进行处理, 以自动发现和获取与心律有关时间模式。并使用归纳逻辑程序设计实现一阶关系学习。-3- §1.3数据介绍§1.2.6多元主成分法事实上,每个人的每个心跳之间有很多共性,其中包含了很多统计特 性。Francisco castens等人f13】首先介绍了主成分分析在心电图信号领域的当前状 况,然后利用主成分分析对心电图进行分析,对心电图的数据压缩、ST―T段的检测对 某些疾病的识别等进行了研究,展示了主成分分析在ECG信号处理的重要作用和广阔 应用空间。 通过对这些研究的简单比较,我们发现他们很少利用心电图的统计特性,我们将 利用统计方法对其进行探索和研究。我们选取的数据本身包含了很多统计信息和性 质,心电图之间有很多共同类似的信息,而其维度也特别高,怎么能够更为简洁对其 包含的信息进行解释和处理是我们关心的问题;另外,心电图信号本身就是关于时间t 的连续函数,怎么利用这一函数对心电图的一些性质进行研究是我们关心的另一问 题。我们注意到很多学者在研究过程中把斜率、振幅和宽度作为关注指标,这与临床 上的诊断指标相一致,现在我们将从函数的角度出发,对这些参数进行研究。函数型主成分分析在很多领域得到了很好的应用[6】[14】【16】【21】[22】,也得到很大的发展。它把统计分析方法和时间序列信号结合起来,能够凸显研究对象的统计特性和 其他特性。但是我们发现还没有人把该方法应用到心电图的波形研究上来,这是值得 研究的,我们将利用该方法对心电图进行分析。 另外,函数型数据的非线性模型的发展也引起了学术界越来越多的重视和关注【9]【15]【181,心电图本身是一个连续型的信号,代表了一个连续的函数,YingchunZhou和Se出a珊k『28]把函数型数据分析方法引进心电图的研究,我们将在第四章对其进 行具体的描述,他们把该方法应用到心电图的T波上,并得到了良好的结果,能够对心 电图的形状变化做出有效、直观的解释,我们将进一步对其进行扩展,把这一方法应 用到整个心跳的各个波段上。§1.3数据介绍本文所用数据来自:http:/脚.physionet.org/,该网站可以免费登录,提供大量关于生理学信号数据,以及相关的开源软件。为了下文引用和分析的方便,我们对所 引用的数据进行简单介绍和预处理。 由于心跳具有一定的周期性,根据临床上的经验,~个完整的心跳一般是以R峰为 基点,向左一直到P波的起点,右边以T波的终点为止。经过比较试验发现,P波和T波 的位置的选取对结果的影响不大,结合其他关于该波段位置的选取的方法,我们以R峰 为基准点对每个心跳进行大致的选取,基本包含P、QRS和T波。.4. 第一章引言例如,图1―2是一个病人10秒钟左右的心电图(横坐标代表取样次数,下文相 同),为了更好的分析心电图的形状随时间的变化特征,以及不同心跳之间的变化 特征,我们选取R峰为基准点,令所有的心电图的R峰(即图中最高的峰)重叠在一 起,截取包含P、Q、R、S、T波的长度。假如每条心跳的测量次数为仉次(每秒测量250次),令他相等,这样得到包含p个心跳的样本矩阵为‰×p=(X1,x2,…,%)其中,每个心跳为蜀=(Xll,:r12,…,zzn)’,(z=1,2,…,P)图1-2一个病人10秒钟的心电图1∞图1.3编号为selll6的病人的样本矩阵的三维图这样对数据进行预处理有两个好处(图1―3),一个是从立体图能够直观地看出形 状随时间的变化情况,二是便于用统计的方法描述不同心跳之间形状的差异。-5一 §1.4本文创新点和框架§1.4本文创新点和框架§1.4.1本文创新点本文的创新之处在于: (1)采用分段分析的方式,利用主成分分析的方法挖掘每 (2)首次将函数型主成分分析应用到心电图 (3)把应用到T波的非线性模型扩展到整个段的共性,以及这些共性之间的差异: 上,并结合生理学背景对结果进行解释; 心电图的P波、QRS波和T波。§1.4.2本文框架第二章先介绍主成分分析的基本原理和方法,接着对一个人数分钟的心跳做主成 分分析,从图形形状和主成份贡献率两个角度,采用分段研究的方式分析心电图的共 性以及这些共性随时间的变化而产生的变化。 第三章先介绍函数型数据的一些基本概念、发展情况和研究成果。接着通过比较 与多元主成分分析的异同,引进函数型主成分分析的基本理论、具体的计算方法和呈 现结果的形式,然后以心电图为自变量进行函数型主成分分析,并对分析的结果进行 解释。 第四章先介绍函数型数据非线性模型的基本概念和相关研究成果,介绍对T波进行 的函数型数据分析的模型和算法,指出一些可以提高的地方。接着在原有模型基础上 做出改进,把该方法应用到整个心电图的P波、QRS波和T波,对得到的参数从各个波 内部和之间的相关性以及频谱图等方面进行分析并作出解释。 第五章通过从不同角度的对比,分析总结前面所用方法的特色和局限性,并对该 领域将来进一步的研究进行展望。-6- 第二章主成分分析第二章一-+-成分分析 溅万万优 弟一早在实际问题中,我们会经常遇到多个指标的问题,由于变量个数太多,并且彼此 之间存在一定的相关性,因而观测到的数据所反映的信息有所重叠。在变量很多的时 候,势必会增加分析问题的复杂性。我们自然希望用较少的变量来代替原来的变量, 并希望这些变量能够尽可能的反映原来的信息,利用这种降维的思想,产生了主成分分析等统计方法。主成分分析【29]就是为了达到这样的目的将多指标化为少数几个综合指标的一种统计分析方法。§2.1理论基础§2.1.1总体主成分定义2.1设X=(%,x2,…,墨)’为p维随机向量,称Zl=≤x为x的第i主成-分G=1,2,…,p),如果:(1)《&=1(i=1,2,…,p); (2)当i>1时,g∑6=o(j=1,2,…,i一1);(3)Var(Z,)=,,里a,xy口r(善’x).磊6=l,‘∑白U=1,…乒一1)假设:p维随机向量x的均值E(X)=0,协方差阵D(X)=∑,∑>0,则有如下定理及相关性质。 定理2.1设X=(X1,x2,…,饰)’为p维随机向量,且D(x)=∑,E的特征值为A1≥A2≥…≥~2 0,6,已,…,岛为相应的单位正交特征向量,则x的第i个主成分为:磊=《x0=1,2,…,P)性质2.1D(Z)=人,即p个主成分的方差为:Var(Z,)=九0=1,2,…,p),且口 p 口它们是互不相关的。 性质2.2∑以t=∑丸,通常称∑%为原总体x的总方差。i=l /=1 i=1该性质说明总体X的方差和与主成分的方差和相同,故存在m(m<p),使得E%≈∑九,即只需用前m个主成分就可以提供总体的绝大部分信息。为了选取frt的方便,我们引进累计贡献率的概念,以此作为确定仇的一个统计指标。 定义2.2我们称鲰=入∥量沁为主成分磊的贡献率;又称Gm=丕^衫墨k为主成分历,历,…,磊(TYt<P)的累计贡献率。-7- §2.2主成分分析在心电图的应用§2.1.2样本主成分在实际问题中,一般协方差阵∑是未知的,需要通过样本来估计,针对我们研究的问题,设xt=‰l,觑2,…,%)’@=1,2,…,扎)为来自总体xtfl样本,X=(x1,为,…,%)7为样本数据阵。样本协方差阵S和样本相关阵R分别为:s=高∑∞一贾)㈣一贾)’丝(s巧)脚R=(%)p×p,其中%=而aq方差阵就是样本相关阵R,且~t’,歹=1,2,…,p)假设每个变量的观测值都己经标准化(标准化之后的数据阵仍为%×p),这时协R=击Fx仡一上按照前面的记号,样本主成分和总体主成分有同样的性质。§2.2主成分分析在心电图的应用在第一章我们提到已经有人用主成分方法对心电图进行分析,但是,我们发现他 们只是把其中的共性挖掘了出来,而没有研究这些共性随着时间的变化情况,以及这 些共性是否存在一些变化?这里将进一步研究心电图不同时间段的共性随时间的变化 情况。从http://www.physionet.org/的QT数据库中随机的选取数据,选择编号为sel301的病人15分钟的数据作为样本进行分析,为了提取出不同时间段内的心跳特征及充 分利用其统计特性,我们把这15分钟分为三段,每段截取2分钟分别进行主成分分 析,分别记为第一样本、第二样本和第三样本,将其主成分进行对比。根据第一章介绍的方法,我们从每段选取p条心跳,每条心跳记为xI‘=(3:11,:r12,…,zzn)’,0= 1,2,3;Z=1,2,…,p),佗为每条心跳的测量次数,以每条心跳为变量,得到的样本矩阵为砖×p=(矗,驾,…,群),对此进行主成分分析。从表2.1可以看出三段样本的前三个主成分的累计贡献率都达至1198%以上,可见每 组心电图内都有非常大的相关性,也即共性。因为大量的临床检查需要用到心电图, 在这些过程中产生的大量数据带来了很多数据存储和传输工作,利用心电图的相关性 很大的特征,可以对数据进行压缩,将会大大降低存储空间和成本。-8? 第二章主成分分析图二1三段样本各自的前三个主成分主成分弟一秤本 96.64% 2.65% 0.14%第一主成分第二主成分 弟二王成分弟二样本 94.67% 2.36% 1.64%弟二样本 97.23% 2.02% 0.32%对这三段的主成分进行对比发现,图形之间存在一些差异,也即个性,但是,仅 仅通过主成分分析并不能对心电图的具体变化进行有效的解释,只能作为探索性的分 析。虽然如此,这些发现还是有意义的。这些水平、垂直、斜率方向的变化特征正是 我们更是临床医生所感兴趣的,对我们进行下面的分析有极大的启发和重要作用。§2.3本章小结本章利用主成分分析,考虑到心电图随时间变化带来的差异,我们采用分段分析 的方法,采用等距抽样的方法对三段样本进行分析,这样不仅能够提取出心电图的主 要信息,而且通过将每段的主成分进行对比的方法可以抓住这些主成分随时间的变化 情况。 通过分析我们发现心电图之间主要是共性,但是这三段样本的主成分也存在一些 差异,大概为水平方向的平移、垂直方向上的移动和斜率的变化,这种效果是单独对 整个样本进行主成分分析所不能达到的,而且这种思想也是我们进一步研究的基础。一9一 第三章函数型主成分分析在第二章我们用多元主成分方法分析了不同时间段的主成分的共性和差异,我们 发现心电图的取样频率特别高,几乎是连续的,是否可以把该近乎连续的曲线用一个 连续函数表示,并对这一连续函数进行分析?函数型主成分已经应用到了很多领域, 但是到目前为止还没有学者用函数型主成分分析心电图的形状特征,本章我们的主要 工作就是利用函数型主成分研究心电图的形状变化特征,结合生理学背景对得到的结 果进行解释。§311函数型数据的定义通常情况下,我们得到的数据都是离散的,但是随着数据收集方法的提高和发 展,我们收集到的数据的采样频率可能非常高,而且时间间隔也不一定相同,此时需 要分析的维度就非常高。遇到这种问题,如果我们仍然采用传统PCA方法来处理数据就会出现一些问题[4】,得不到估计的结果。这时我们可以考虑换一种思维方法,就是将高采样频率数据看作函数的形式,再对这些函数型数据进行相关的分析处理。 函数型数据分析【20]正是针对这些实践中不断遇到的函数型数据发展起来的一系列新的研究方法。函数型数据(Functional Data)是指在某个连续集上进行的一组测量。连续集通常指时间,可以是空间、心理物理空间等,可以是一维的,也可以是多维的[231。由函数型数据组成的集合并不是单个的离散观测值,而是看作一个整体,一条曲线或者一个影像。虽然函数型数据在形式上多种多样,但就其本质来讲都是由函数 构成的。函数型主成分分析正是众多函数数据分析方法中十分重要的一种。 函数型数据分析方法基本出发点是假定在观测数据背后存在着相应的连续函数,因此理论上可以估计任意时点t上的函数值z(t)A其各阶导数值扩z(t),从而描述某一现象的发展状况及其速率。在实际问题中,我们观测得到的只是一系列离散的数据值。令{s1,82,…,sn>为含有n个样品的样本集,五=(Xll,勋2I.一,%)’为第2个样I:口11:I在P个时间点t1,t2,…,£p∈T=【a,6】上的样本观测值。把x视为一个整体而非单个观测 值序列,称X为原始函数数据。假设z(z)为产生原始函数数据x的对应函数,即有如下模型:X=2(孟)+e(3-1)其中e代表原始函数数据中的扰动因素、噪音或误差。其中z(£)为拟合的函数曲线。用K个基函数(Basis Function);妒1,也,…讥的线性组合来表示函数z(亡),Hpz,(t)=一10― 第三章函数型主成分分析∑Q七讥(亡)。其中,讯表示基函数Ck(t)所占的权重,下标k表示基函数以及它的权重的顺序。常用的基函数为Fourier、Spline和Gaussian等,一般情况下当数据有一定的 周期性则用Fourier作为基函数,若没有明显的特征则用其它的函数作为基函数。 在Ramsay和Silverman编著的《函数型数据分析》(FunctionalDataAnalysis)f201中介绍了很多应用函数型主成分分析的例子,如由于年、月、日的温度具有明显的周 期性,所以他们采用Fourier函数作为基函数,利用函数型主成分方法分析了加拿大 的35个站点12个月的温度的变化特征。我们发现心电图的各个波和温度有类似的形状 特征,都是中间高,两端低,并有一定的对称性,所以我们这里用Fourier作为基函数 对原始数据进行拟合。 我们采用如下方式来衡量拟合的程度,以此来选择最合适的基函数:,_'SSe=Ⅳ∑僦Z一 ^甄其中llx,一龟112=f(z(s)一^(s))2ds,窑(s)为z(s)的拟合值,我们通过使,sse达到最小来选择合适的基函数忍(z)=∑CikCk(t)k=l ::§3.2函数型主成分的发展随着对函数型数据研究的不断深入,理论的不断完善,应用范围的不断扩 大,以及应用效果的不断提高,近几年该方法引起了更加广泛的关注,很多学者,比如B玎1瑚back和融ce[5】证明了混合效应模型与粗糙惩罚回归(Penalized sion)的BLUP(Be斌LinearUnbiasedRegres-Predictor)是一致的,其解就是三次样条函数,从光滑样条角度改进了函数型数据分析的理论和计算方法;Cardot[7]给出了均值和协方差特征值的近似收敛速度,并说明光滑参数的选取对估计结果有一定的影响,从而对函数型主成分进行了论证和应用;James[19]等人对稀疏函数数据的函数型主成分方法 进行了提高,改进了函数型主成分的计算方法。在实际应用方面,Aguilera[1][2]拓展了多变量主成分回归方法,应用函数型主成分方法对不均匀分布的连续时间序列进行 预测并得到了较好结果;Fang Yao和Jane-ling Wang[12]等人提出了一种非参数方法对不规则分布的稀疏重复数据进行主成分分析:Salvatore[17]把函数型主成分方法应用于金融时间序列的分析中。李淳芄等人【33]利用函数数据对人体运动进行合成,通过对一 组样本运动进行函数主成分分析,构建出一个由特征运动构成的低维函数子空间。该 低维子空间不仅能够有效地刻画样本序列内在的变化规律,而且也为有目的的运动合 成提供了方法。并通过控制各特征运动的系数即可合成出逼真、平滑的运动序列。并 且该合成过程没有耗时的计算,因此能够满足各种实时应用的需求,他们的相关的实-11- §3.3多元主成分和函数型主成分的异同 验结果证明了该算法的有效性。 但是我们发现还没有学者把该方法应用到心电图领域,我们将在这些应用研究的 基础上研究其在心电图形状的效果。§3.3多元主成分和函数型主成分的异同对于观测数据相对于样本个数来说相当大的情况,普通的PCA一般有两种方法。一种方法是缩小观测时间的区域。第二种方法是偏最小二乘(PartialLeastSquares,PLS)。当变量之间存在多重共线性时,采用主成分分析提取的主成分,虽然能较好地概括变量中包含的信息,却带来了许多无用的噪声,从而对因变量缺乏 解释能力。但是偏最小二乘方法一般用于建立预测回归方程,对于未知参数分布特性 的确定无能为力,它所给出自变量和因变量之间的结构关系也过于抽象。函数型数据 主成分分析是将变量看作函数的形式,其样本的协方差矩阵也变为函数的形式,因此 可以避免出现高维的协方差矩阵。 在向量空间中,我们用卢’z来表示向量x在权重向量卢下的值,当卢和x为关于8的函 数时,关于j的求和变成关于s的积分:有求和变为做内积;同样在计算主成分得分时也有多元分析中的A=∑岛1%=旨甄变为五1=Jr6(s)毛(s)如。具体过程和异同如图3-1: 多元主成分在 在函数型主成分口。】i t一1 厶钮一_钮I一‘J?j窖∽凼=l矗12=1的约柬条件下.计算满足一的约束条件下.计算满足…一'_.,2 “。厶川llm技y五3●的恢重向■矗=皤l,…,知)‘?苴由,一:甲声一。.:,t. 然后在蚓叹重函数磊国?毒中五一,主(5)瓦(5№然后在∑箭=br=1,∑知缸=矗矗=Q,的约柬条件下m丝CEZ,)得到I一I己lf=1.f磊∞卣∞出=o的约柬条件下m戡C£Z,)得到l己=(厶.…,己,)‘ 依此就能得到所有的主成分.岛∞依此就售皂得到所有的主成分。图3-1从多元主成分到函数型主成分-12? 第三章函数型主成分分析在多元主成分分析中,主成分分析的目标是通过计算特征值和特征向量作为分析的指标。在函数型主成分中,主成分分析的目标是寻找相互正交的单位权重函数知,并以此作为分析指标。 定义协方差函数为:y(s,t)=佗。1∑毛(s)翰(t)i=l其中z(s)为按照第一节定义的函数型数据。 则现在的函数型特征方程为:/怖∽鲍)如=必(s)其中p仍然是特征值,但是∈(s)变为协方差函数的特征函数。若记(3-2)瞻=/脚㈡@)砒则 y∈=必 由此可见,通过选择合适的记号,函数型主成分和主成分分析的形式是一致的。 但是两者的特征值和特征函数最大对数却不相同。在多元主成分分析中,变量的个 数k决定了其协方差阵的特征值及其对应的特征向量的最大对数为k,因而满足约束条件的主成分的最大个数为七:函数主成分分析中数据z(t)是一个函数,样本的个数Ⅳ决定了其协方差算子的秩为Ⅳ一1。因此其非零特征值的最大个数为Ⅳ一1,进而满足约 束条件的主成分的最大个数为Ⅳ一1。§3.4函数型主成分通过上一节多元主成分和函数型主成分的思想和计算方法的对比,我们发现它们 的思想基本上是一致的,通过合适的记号,它们的记法也是相似的,但是在计算方法 上可能有些差异,原来离散的数据矩阵变为函数阵,这一节我们将具体介绍函数型主 成分的计算方法以及如何将得到的结果直观的展示。§3.4.1计算方法假设有仃条已经中心化的曲线魏,为了计算方便,我们通过把如表示为一组己知基函数讥的线性组合把3.2式化简为矩阵或者单个的形式,K的选取取决于原始数据个-13― §3.4函数型主成分 数、平滑水平、拟合效果等因素。现在假设每个函数有如下形式:筑(亡)=∑铡∞)若记向量值函数z=(z1,z2,…zⅣ),向量值基函数妒=(妒1,也,…Ck),那么就可以把n条曲线表示为:z=C砂其中C为礼×K阶矩阵,对应的协方差函数的矩阵形式为:V(s,t)=n一1砂(s)’∥C妒(亡)假设3-2式对应的特征函数如下:㈤=∑k如(s)=妒(s)’b,(6=(bl,…,k)令w=/彬则3-2式为:/忡∽鲍)出=/n-1帅)’∥刚帅∽,6出=帅)'n-IC'C肌因此3-2式可以表示为:妒(s)’n一1c'cwb=彬(s)’b由于等式对任意的S成立,所以有:n-aC'CWb=pb(3-3)由幢(s)II=1可以得到6,Ⅳ6=1,类似的,当且仅当砖w62=o时,∈l和已正交,定义乱=wl/2b。孓3式两边同时乘以Ⅳ1/2得 W1/2∥CWl/2缸=pu..14..n-1 第三章函数型主成分分析 有此可得系数向量:b=W―I/2u至此,我们已经可以计算函数型主成分了,下面我们介绍如何将得到的结果更加 直观的展示出来。§3.4.2结果显示方法在函数型主成分中一般通过如下三种方式对结果进行展示:第一种是通过均值函 数加上或者减去主成分函数的合适倍数77的形式;第二种是主成分得分做图;第三种是 旋转PCA。这里我们具体介绍一下第一和第三种方法。 (1)均值函数加上或者减去主成分函数的合适倍数。定义卵为均值函数与的均方 根,矿=N‘1II芦(t)一-l|2其中声(£)为均值函数,豇=N_1 f"fiCt)dt‘ 一般选择常数o.2以得到具有可解释性的结果,对声(t)和芦(亡)4-o.2叼硫(泵为第i个主成分函数)进行比较做图,描述原始数据的主要变化特征(方式和程度)。 (2)旋转PCA。事实上,没有函数能够比上面得到的正交函数更好的拟合数据,但是并不是说没有正交函数集能够达到同样的效果。如果令f=(∈z,已,…6)’,T满足,T=I,那么就有这样的正交集:(=联现在我们并不能保证砂l能够解释最大变化,但是K个正交函数在近似原始数据的时 候和旋转前有同样的效果。并且旋转后的函数可能更加容易的解释数据的一些性质。令B为K×佗阶矩阵,代表前K个主成分函数6,已,…&,假如B的第m行来自等间隔的 时间点t1,1}2,…t竹。旋转后的基函数对应的值为A=TB我们通过令Q乞最大化来计算T,把%单独拿出来作为一个向量,由于T是旋转阵,所以有:∑∑n乞=traceA’A=打aceB’,TB=traceB’Bm J-15- §3.5函数型主成分在心电图的应用因此只有当这些值要么很大,要么几乎为零时才能使。乞达到最大,而同时%解释。在网站http:/胁.functionaldata.org@有关于T的快速、稳定的计算方法和程序,我们在这里不再叙述。的值则趋向于或者绝对值很大,或者几乎为零。这些信息可能让主成分的变化易于我们通过平滑数据和平滑主成分两种方式[20】,使得到的主成分更加光滑。§3.5函数型主成分在心电图的应用在第一章我们介绍了一些生理学背景知识,了解到临床上把各个波的振幅、长 度、形态和变化方向等因素作为指标对病人进行诊断,另外,我们发现直接对整个心 跳拟合的效果不是很好,所以我们根据心电图的形状特征把其分为三段(P波、QRs复 波和T波)进行分析。这样不仅能够提高数据的拟合效果,减小误差,还能够得到每个 波形状的变化特征。 下面我们按照上一节的理论基础和计算方法,把第二章所采用的数据根据生理学 特征分为三段(P波、QRS复波和T波)进行函数型主成分分析,我们选择前面所说 的第一种方法把结果展示出来,即均值函数加上或者减去主成分函数的合适倍数的方 式,选择前三个主成分。■“■_H∞'P―_?■■-■■●_蜘0Pc^■_,h1―-―婶■_■■叶●O图3-2P波、QRS复波和T波各自的第一个主成分P‘^■-日h2―――_■―_,青_aL-咖:p州_t?■-―●-_目3日,’曩-―_:P-―忡-_袖-■明图3.3P波、QRS复波和T波各自的第二个主成分.16. 第三章函数型主成分分析Pc^■_“_3垆___‘p一-州_”,,。c^■_-3炉■曲岬■_●●■r田Pc^■_-l,俨■-忡■-―■■,4图3_4P波、QRS复波和T波各自的第三个主成分主成分 第一主成分 第二主成分 弟二王成分P波 95% 1%Qas复波49% 8%T波 81% 14% 2%2%34%从P波、QRS波和T波的前三个主成分可以看出,各个波的变化形式基本一致,前 三个主成分的累计贡献率都达到了91%以上(表3.1),与多元主成分分析的结果基本 一致,并且其具有更加具体和详细的可解释性,可以形象而又清晰的把各个波的变化方式展现出来,从图3-2至图“可以看出这些变化主要反映为三个方向的变化:垂直、水平和斜率。 一、垂直方向上的移动。三个波段第一个主成分主要说明大部分波的变化方式是 在主曲线的基础上垂直方向上的波动,分别占了大约95%、49%和81%之高(图3-2)。 在临床上反映为波形振幅的变化,也即这些心电图的主要变化方式为振幅的变化。 二、水平方向上的平移。可以明显的看出三个波段的第二个主成分主要解释的是 水平方向上的平移,分别占了大约2%、34%和14%(图孓3)。在临床上反映为变化方 向,这说明波的变化方向也是心电图的一种主要变化方式。 三、斜率的变化。斜率在临床上反映为心电图形态的变化,三个波段的第三个主 成分主要解释的是斜率方向上的变化,可以看出在波峰处有明显的斜率上的变化,在 波的尾巴处有翘起或者跌下的趋势,充分的把波的这种变化特征显示出来。分别占了大约1%、8%和2%(图“)。三个波的变化形式具有非偶然的一致性,但是我们注意到这些一致性并非绝对的 一致,也存在着一些差异,从各个主成分所占的比例可以看出,各个波的比例是不一 样的,这也说明各个波的主要变化形式也有量的差异,比如P波主要是垂直方向上的变 化,占了95%的信息量。?】7- §3.6本章小结§3.6本章小结本章利用函数型主成分分析,结合临床上的研究指标,我们根据心电图的形状特 征把其分为三段(P波、QRS复波和T波)进行分析。这样不仅提高了数据的拟合效 果,减小误差,而且得到了每个波形状的变化特征。通过对比我们发现一些重要的特征:(1)这些波的变化主要反映为三个方向的变化:垂直方向、水平方向和斜率,并 且三段波的变化形式具有一致性。这三种变化方式与临床上所关注的振幅、长度以及 形状变化方向相对应,说明我们利用函数型主成分分析能够得到临床上所关注的心电 图的主要变化特征。 (2)但是每个波的各个主成分所占的比例并不一样,说明各个波的主要变化形式 也存在量的差异。这可能与各个波的临床意义以及诱因有关,这需要我们结合生理学 知识进一步的研究,但是由于专业知识不足及时间问题,我们暂时不再深入讨论。?18- 第四章函数型数据的非线性模型第四章函数型数据的非线性模型在第二章和第三章我们已经了解到,这些数据基本相似,只是在水平、垂直和斜 率方向有些变化而己。在引言中我们已经提到,临床上把各个波的时间长短、振幅、 形态和方向等因素作为指标对病人进行诊断。例如,如果P波的振幅增高,而P波时限 正常或无明显延长时,就意味着有可能是右心房肥大;又如,在某些导联,T波的振幅不应低于同导联R波的1/10,意味着不同波段之间也是有联系的。说明第二章和第三章所得到的结果是非常重要的,使我们大概了解了心电图的一些变化特征,而这些特 征正是临床上所关注的指标,但是通过主成分分析很难对这些特征进行具体的定量描 述,这正是本章我们所要作的事情,我们将把这些有意义的变化具体的描述出来,并 找到各种变化形式之间和各个波之间的联系。 本章的主要内容是介绍函数型数据非线性模型的发展及其在心电图T波的应用,然 后从新的角度建立模型对心电图进行分析,通过对模型中的参数的关系分析探索其所 隐含的生理学信息。§4.1函数型数据的非线性模型的发展我们先定义一个新的概念…一参考曲线,参考曲线是为研究数据的变化,是一条代表该样本数据主要信息的曲线。分析函数型数据的其中一种方法是把参考曲线 的变化按照非线性的方向进行分解,这种曲线的非线性分解在过去的20年里受到很大的关注,Hastie和Stuztzle[15]把线性主成分分解推广到非线性分解,并完成了主曲线的 定义和计算的前期工作;ChalmondTFflGirard[9]等人对以主曲线为基础进行了方法和应用方面的研究。和线性主成分分析一样,尽管非线性主曲线可以解释数据的大部分变 化,但是其缺乏可解释性。在此之前,Izem R.和Kingsolver J.G.【181建立了一个三参数 模型,该模型把数据中的变化分解为一些预先确定的、解释性比较好的方向。该模型 把毛虫生长速度描述为关于温度的函数:五(巧)=毗z(毗(如一佻))+勉+%(4-1)其中磊(易)是第i族毛虫在温度tj时的生长速度,z是参考曲线,伽,m,^分别为斜率、水平和垂直方向上的变化,该模型的一般形式如下:z,(tj)=K(吼,岛)+%-19一(4-2) §4.1函数型数据的非线性模型的发展 其中良是参数向量。该模型在处理毛虫生长速度问题时得到了良好的结果,能够对 该生长速度关于温度的变化做出很好的有意义的解释。 随后Yingchun Zhou和NellSedra璐k【28]对上述模型(垂1)进行了改进,并应用到心电 图的T波上。两位学者对模型中的参数做了更为详细的改进,增加了一个参数,由原来 的单一的斜率变化为描述两面的斜率。现在关于数据阵X的模型为:矾,={怒浆黜乏:尝:升斜率、下降斜率、水平、垂直方向,e―N(0,铲)。此时c蜘其中i=1,2,…,I,j『=1,2,…,‘,,X是参考曲线,四个参数u,d,m,hi+别代表上眦,={嚣浆黜臻:估计口,即tc删其中Oi=(%,d‘,讹,‰),他们用非线性最优化来估计该模型(乒3),以得到参数Oi的拿=arg母∑(五(岛)一K(巩,坩。1J他们利用该模型(垂3),把每条T波看作关于参考曲线的变换,得到每条T波的参数吼(i=1,2,…,,),说明四个参数可以很好的近似这一变化,并从生理学的实际背景对四个参数进行解释,达到了降维并且具有医学意义上的可解释性的目的。 该模型(4.3)有两个创新之处,第一,参考曲线的明确性,参考曲线显示了所有曲 线的一般形状,其它曲线是由其变换得到的,我们可以对参数进行分析和估计,参考 曲线不同于主曲线,为了衡量样本之间的变化,首先想到的是Fr百chetmean,由于T波 在形状和位置上变化不大,用样条插值来得到参考曲线更为有效,计算量也大大降 低;第二,因为T波的上升和下降曲线需要分别考虑,该模型采用分段函数的形式。-20- 第四章函数型数据的非线性模型§4.2函数型数据非线性模型在心电图中的应用受前面研究的启发,考虑到关于时间t的尺度变换并不一定和整个函数的伸缩变换相一致,所以我们用参数u和d来代替上面模型中的参数、/才,修正之后的模型为: z,(tj)=地z(画(巧一砜))+%+% (4-5)其中i=1,2,…,n,J=1,2,…,P,u代表函数整体的尺度变化,d代表关于时间t的尺度变化,m和h分别代表水平和垂直方向上的位移。现在K(8i,tj)=‰X(d‘(亡j一佻))+‰其中仇=(讹,哦,佻,鬼)在第三章我们对函数型数据做了简单的介绍,现在我们按照前述方法对编号 为selll6的病人的ECG进行预处理,然后再对此进行分析,假设处理后的ECG数据阵 为X,虽然X的每列都是离散的数据,但是其中隐含着一个连续函数,这样X就可以看 作关于时间t的函数族,现在的目的就是如何更加详细的刻画该函数族的变化特征。 首先我们把该方法应用到整个ECG上面,得到残差平方和SSE高达1148,可能是 由于维度太高,拟合的效果并不好,由此产生的偏差将对我们进行下一步分析的结果 的准确性产生很大影响。注意到P波、QRS复波和T波的形状相似,结合第三章得到 的比较好的结果,我们考虑用同样的方法对三段波分别进行处理。把该方法分别应用 到P波、QRS复波和T波上,SSE分别为:1.7,15.25,3.04;相对于整个ECG做分析, 分段处理拟合的效果更好,这样有助于减小下面分析的误差。§4.2.1四个参数的意义从图形(图缸1,垂2,4-3)直观来看,拟合值和真实值相当吻合,这也与SSE#614,相一致。P波、QRS复波和T波三个波的变化方向和幅度具有一定的一致性。T波的变 化特征和四个参数的意义和数值大小相一致垂1,就拿T波来说,a图相对参考曲线向 下移动(九=-0.24),b图在向上移动的同时,又有水平方向的移动(^=0.25,m= 112.72),斜率也有所变化(牡和d一个大一个小),c图的两端没什么变化,但是波峰 有所上移,斜率变大,d图恰恰与C图相反,而是两端的斜率变小,变得平缓了。 注:图垂1,缸2,垂3为原始数据、拟合数据和参考曲线对比图,其中点线为原始数 据,虚线为拟合数据,实线为参考曲线。-21? §4.2函数型数据非线性模型在心电图中的应用P波IDa UQRS复波m h一.28 0.13Ur波h 一.45Ud1.04 0.97 O.91 1.08d0.99 0.95 0.95 1.11m80.63d1.01m 108.78112.72 110.67 111.42h一.240.891.08 1.19 1.0182.85 84.9788.14 82.790.791.04 1.09 1.030.88 1.17 1.19 1.15bC82.7382.55 75.720.090.13 一.120.991.01 0.960.250.24 一.010.22一.08d图垂1P波图冬2QRs波图垂3T波§4.2.2各个波内部的参数关系首先,我们对得到的参数进行分析,挖掘各个波内部四个参数所隐含的信息。我 们感兴趣的是这四个参数之间是否有某种联系,比如相关性等。为此我们对各个波的 四个参数做相关性分析,结果发现三个波都具有一个重要特征,即在0.01的置信水平下,(1)每个波本身的m和d都显著负相关,(2)u和h都显著正相关(图4-4)。图4-4P波参数散点图(pI‘^=0.8771,阳=一0.9322,P<0.01)m和d都显著负相关说明当水平方向产生位移与关于时间t的尺度变化是相反方向 的,可能是因为水平位移是由于关于时间的尺度变化所导致,或者是因为水平位移导 致尺度的变化。u和h都显著正相关说明垂直方向上的变化与整个波的尺度变化是一致 的。但是其他各系数之间并没有明显的相关性。 在图垂4至图缸6中,用’P心’代表P波的参数也,依此类推,’Ru7代表QRS复波的参 数u等。一22― 第四章函数型数据的非线性模型图禾5QRS波参数散点图(p曲=0.6793,舢=一0.9826,p<0.01)图垂6T波参数散点图(胁=0.5718,腑=一0.8017,p<0.01)§4.2.3各个波之间的参数关系',第三章中我们了解到三个波段的变化特征具有非偶然的一致性,但是没有给出具 体的在某个方向上量的一致性,在这里进一步对其分析。通过图形的直观展示可以看 出h与图形的形状变化非常一致,能够充分说明原始数据关于参考曲线的变化方向,第 一条和第四条曲线的htJ,于零,意味着参考曲线向下移动,而第二条和第三条则相反, 三段的h之间有很大的相关性,这说明一个人的心电图各个波的垂直位置是相互关联 的,我们进行相关性分析的结果证实了这一点,并且相关性非常大。 对三段的h值做相关性分析结果如(表4-2),在0.01的显著性水平下,p值都小 于0.01,说明三段波的h值是显著相关。图 垂7 P波和QfLs复波参图垂8 数h散点图 图P波和T波参数h散点图 垂9 qP,s复波和T波参 数h散点图-23- §4.2函数型数据非线性模型在心电图中的应用相关系数P波1QRS复波0.7141T波0.655 0.7481P波 QRS复波 T波0.714 0.6550.748相关系数 P波P波1 0.230QRS复波0.2301T波0.3890.443 1QRS复波 T波0.3890.443说明这些P波、QRs复波和T波至少在一个心跳周期内可以说是同步的。这就意味 着一旦一个人的心跳有问题,偏离正常位置太高或者太低,各个波段都会将这种现象 表现出来。而参数h可以反映出来各个波的振幅大小,振幅是临床上医生进行诊断的重 要指标,从中可以反映出很多心血管疾病的特征,各个波的h参数所反映出来的一致性 将对医生进行诊断大有帮助,他们可以只用针对其中一个比较明显的波进行检查,而 不用对所有的波进行检查。 参数乱也有类似性质<豸t4-3),但是相关性没有参数h明显,在0.05的水平下是显著相关的,也能够说明上面类似的问题。但是参数瘌仇没有如此一致的性质。§4.2.4频谱分析另外,我们可以把得到的参数值看作时间序列并获得关于心电图各个波的一些信 息。通过功率谱密度来研究这些时间序列的频率,进行频谱分析。图垂10P波参数u和h的功率谱密度频谱分析是将信号源发出的信号强度按频率顺序展开,使其成为频率的函数,并 考察变化规律。功率谱密度谱是一种概率统计方法,是对随机变量均方值的量度。功 率谱密度是结构在随机动态载荷激励下响应的统计结果,是一条功率谱密度值与频率.24. 第四章函数型数据的非线性模型图4-11P波参数d和m的功率谱密度值的关系曲线。 从图4-10和图4-11中可以看出,P波的参数U和h都在0.08Hz附近有一个极大点,对 应的周期为12.5秒,而参数m和d在0.29Hz附近有一个极大点,对应的周期为3.5秒。这 正是ECG图中可以大概观测到的异常心跳的频率。§4.3本章小结发现这四个参数之间有一定的联系,并且各个波之间也有一定的关系:雳本章利用函数型数据的非线性模型把心电图的形状变化用四个参数来描述,我们”(1)四个参数的数学意义能够很好的对图形的变化进行解释,牡代表函数整体的 尺度变化,d代表关于时间t的尺度变化,m和h分别代表水平和垂直方向上的位移,在 临床上可以通过这几个参数对心电图的变化方式进行描述,这几个参数的意义和临床 上关注的指标相一致,可以作进一步研究。 (2)每个波的参数U和h都显著正相关,而参数m和d都显著负相关。这说明心电图 水平方向的变化与关于时间t的尺度变化是相反方向的,在临床上可能反映为某些病症 的关联性。札和h都显著正相关说明垂直方向上的变化与整个波的尺度变化是一致的。 但是其他各系数之间并没有明显的相关性。 (3)三个波的参数h都显著相关,参数仳也有一定的相关性。参数h反映了各个波 的振幅大小,振幅是临床上进行诊断的重要指标,从中可以反映出很多心血管疾病的 特征,各个波的参数h所反映出来的一致性将对医生进行诊断大有帮助。-25? 第五章结论本文充分利用心电信号的统计特征,用统计方法对心电信号的形状特征进行分 析。介绍比较新的函数型数据的相关概念和理论,并把该方法应用到心电图上,并得 到了一定的有意义的结果。 首先利用离散的多元主成分对一个病人的15分钟的心电图分段做分析,这样提取 出不同时间段的主要特征,并将这些主要特征(主成分)进行对比,发现不同时间段 内该病人的主要特征有共性(形状基本相似),也有差异或者说变化(水平、垂直和 斜率的变化),但是其可解释性不足,这也是多元主成分美中不足的地方。 结合现代对函数数据的关注以及函数型主成分的良好效果,我们利用函数型主 成分进行分析,考虑到心电图的临床意义及各个波的形状有相似的地方,我们采 用Fourier作为基函数对数据进行拟合,然后利用函数型主成分分别对三段波进行分 析,拟合效果比较好,前三个主成分的累计贡献率都达N95%以上,并且可解释性更 强,可以形象而又清晰的把波的变化方式展现出来。通过三个波的主成分的横向对 比,我们发现三个波的变化特征极为相似,都体现为垂直方向上的移动、水平方向上 的平移和斜率的变化,另外是无规律的变化。但是我们注意到这些一致性并非绝对的 一致,也存在着一些差异,从各个主成分所占的比例可以看出,各个波的比例是不一 样的,这也说明各个波的主要变化形式也有量的差异。 第四章我们对已有函数型数据的非线性模型进行细微的改动,把其应用从T波推 广到三个波段,以验证其普遍适用性。我们发现结果与主成分得到的直观的结果相一 致,而且得到的四个参数的意义更加有说服力。通过比较各个波内的参数,我们发现 在0.01的置信水平下,每个波各自的m和d都显著负相关,说明水平方向产生位移与关 于时间t的尺度变化是相反方向的,而u和h都显著正相关,说明垂直方向上的变化与整 个波的尺度变化是同方向的。但是其他各系数之间并没有明显的相关性。通过比较各 个波之间的参数,我们发现参数h与图形的形状变化非常一致,充分说明原始数据关 于参考曲线的变化方向,并且p值都小于0.01,说明三段波的h值是显著相关。说明这 些P波、QRS复波和T波至少在一个心跳周期内是同步的。参数h可以反映出来各个波 的振幅大小,从中反映出相关的心血管疾病的特征。 由于心电图本身的复杂性,在波段的选取时我们并没有利用临床上的方法自动选 择波段的起始和结尾,而是采用通过比较粗糙的方法,这样可能导致我们得到的结果 有一定的偏差,这是值得改进的。注意到参数之间的相关性,可以通过回归分析减少 对模型中的参数,但是由于时间关系,我们在这里并没有作出进一步的研究,这也是 今后我们需要进一步研究的。-26- 参考穸献参考文献【1】Aguilera A M,Ocana F A,Valderrama M J,Forecasting time series by functionalPCA-discussion of several weighted Approaches,Computational Statistics,1999, 14,443_467.【2】2Aguilera A M,Ocana F A,Valderrama M J, data byaForecasting with unequally spacedfunctional principal component Approach,Test,1999,8,233-253. ECG signal analysis through hidden markov【3】Andreao,RV.,Dorizzi,B.,Boudy,J.,models,IEEE TransactionsonBiomedicalEngineering,2006,53(s),1541.using functional principal components,【4】Barra,V.,Analysis of gene expression dataComputer Methods and Programs biomedicine,2004,75,1-9.【5】Bmmback,BA.,Rice,J.A., andcrossed samples of curves,Smoothing spline models forthean出siJsof nestedJournal of The American Statistical Association,1998,93,961―976.【6】Boente,G.,Fraiman,R.,Kernel-based§ProbabilityLetters,2000,48,335―345.functional principal components,Statistics【7】CabotofH.,Nonparametrie estimationYbksel,of smoothed principal componentsanalysissampled noisy functions,Journal of Nonparameter Statistics,2000,12,503-538.Comparison of FCM.PCA【8]Ceylan l:{2Jlime,Ozbay丽thand、W techniquesfor classification ECG arrhythmias using artificial neural network,Expert Systems Applications,2007,33,286. Girard,S, Nonlinear modeling of【9】Chalmond,B.andInaEhinescatteredonmultivariate dataand its application to shapechange,IEEETransactionspatternanalysis andintelligence,1999,21(5),422―432. Zheng,and ChangfengIEEE Tai,Detection of ECG characteristicon【10]CuiweipointsLi,Chongxunusmgwavelet transforms,TransactionBiomedical Engineering,1995,42(1),21. 【1 1】Dinh,HAN.,Kumar,D.K.,PallProceedings-23rd Annual N.D.,Burton,P.,WaveletsforQRSDetection,Conference,IEEE/EMBS,2001Oct.25-28.【12]Fang Yao,Hans-Georg M/211er and Jane-Ling WangSparse Longitudinal Data2004.Functional Data Analysis for一27? 参考文献【13]FranciscoCastells,Pablo Laguna,Leif Sornmo,Andreas Bollmann and Jose Millet JournalonRoig,Principal Component Analysis in ECG Signal Processing, Advances in Signal Processing,2006.【14】GirardS.,A nonlinear PCA basedonmanifold approximation,ComputationalStatistics,2000,15,145―167.【15]Hastie,T.and Stuetzle,W.,PrincipalAssociation,1989,84,502―5 16.curves,Journal of theAmerican Statistical【16】He,G.Z.,MNler,H.G.,Wang,J.L.,dinal data,Journal of theFunctional dataanalysisfor sparse longitu-American Statistical Assodation,2005,100,577-590.In studies in classification,data analysis,and【17]IngrassiaS.,Costanzo G.D.,knowledge organization,Studies in Classification,Data Analysm,and KnowledgeOrganization Ed,Eds,Berlin,Springer Berlin Heidelberg,2005,351―358.【18]Izem,R.andKingsolver,J,Variation in continuous reactionnorms,quantifyingdirections of biological interest,TheAmerican Naturalist,2005,166(2),277-289.【19]James G.M.,Hastie T叫JSugar C.A.,Principal component modek for sparsefunctional data,Biometrika,2000,87,587-602.【20】J.O.Ramsay B.W.Silverman,科学出版社,2006.Functional DataAnalysis(Second Edition),北京,【21]Laukaitis,A.,Rar妇uskas,A,【22】Leng,X.,Muller,H.G.,Functional data analysis for clients segmentationtasks,European Journal of Operational ClassificationResearch,2005,163(1),210-216.using functional data analysis for temporalgene expression data,Bioinformatics,2006,22,no.1,68-76.[23】Levitin,D.J.,Nuzzo,R.L.,Vines,B.W.,Ramsay,J.0.,Introduction to functionaldataanalysis,Canadian Psychological Association,2007,46(3),135-155.transformations and neural networks,a【24]Maglaveras,N.,Stamkopoulos,T.,Diamantaras,K.,et al,ECG pattern recognitionandclassification using Non-linearreview,International Journal of Medical Informatics,1998,52,191.【25]Mahantapas,K.,Mita,N.,Dipak,K.B.,Knowledge-basedECG interpretation-acritical review,Pattern Recognition,2000,33,351.【26]Pan,J.,Tompkins,WJ.,A real-time QRSondetection algorithm,IEEE TransactionBiomedical Engineering,1985,32,230. Syntactic pattern recognition of the ECG,IEEE【27]Trahanias,P.,Skordalakis,E.,TransactiononPattern Analysisand Machine Intelligence,1990,12(7),648.-28- 参考文献【28]YingchunZhou,Nell Sedransk,Functional Data Analytic Approach Of ModelingECG T-wave shape to measure cardiovascular behavior,Annals of Applied Statis. tics,2009,Volume 3,Number 4,1382―1402.【29】高惠璇,应用多元分析,北京,北京大学出版社,2005. 人体运动的函数数据分析与合成,Journalof Software,【30】李淳艽,王兆其,夏时洪,2009,V01.20,No.6,16641672.【31】余辉,张凯,吕扬生,黄玉玺, 【32】张杨,蔡建立,223-225.二次微分小波在心电图QRS波检测中的应用,中国科学院上海冶金研究所,材料物理与化学(专业)博士论文2000. 小波分析和EcG信号的检测,南京理工大学学报,2005,29(10),七33]http:||悄.physionet.org/ 【34】http://硼.functionaldata.org?29― 附录A 3.4节函数型主成分分析程序clearaddpath(’D:\论文\fdaM’) addpath(’D:\论文\fdaM\fpca’) qt-load(’D:\论文\fda\selll6.txt’);[time,sample,ch,x,Y,z】=textread(’D:\论文\fda\selll6atr.txt’,…’Xs 7.u fini=[55j:8组龃¨d’,-Z);5515-20];20fl=[B5-1585];qt_m12=qt(:,2); inc=floor(1ength(sample));startidx-i;%+inc*inputvalue;endidx=startidx+inc一1;q鼻一atr=sample(startidx:endidx); n=length(qt―atr)一1;jc qt_m12=qt_m12’;for i=1:11,nintervals,n beatsint―im【(i,:)=[q与一art(i)qt―atr(i+1)];end for k=l:4;ini=fini(k); l=fl(k):ll=ini+l;n=length(qt―atr)一1;jc q鼻一atrl=qt―air(2:n+1); qt_nLl2=qt―m12’;nintervals,n beatsqt_m12一intO=zeros(1l,n一3);for i=1:n-3qt―m12一intO(:,i)=qt_m12(int―idx(i,2)一ini:int―idx(i,2)+1―1);endrng=[0,ii]; knots=[1:ii]’;?30_ 附录A 3.4节函数型主成分分析程序nbasis=50;hgtbasis-create―fourier―basis(rng,nbasis); ecgfd=data2fd(q七一m12一intO,knots,hgtbasis);Zconvert LbasisobjLcoef wfd wfdcell the data to functional dat-create―constant―basis(rng); -[0,(2*pilll)‘2,0]; -fd(Lcoef,Lbasisobj); -fd2cell(Vfd); jcconvert the FDobj ecttoacellobj ectharmaccelLfd=Lfd(3,wfdcell);jclambda =le一9:define the operatorobjectfdParobj=fdPar(hgecbasis,harmaccelLfd,lambda); ecgfd=smooth―fd(ecgfd,fdParobj);7.smoothing-harmthefunctionaldata=4:ecgfdPar=fdPar(ecgfd,harmaccelLfd,lambda); ecgpcastr=pca―fd(ecgrfd,nharm,ecgfdPar);:c plot―pca(ecgpcastr)jcplot the fpca’8 results do fpca-31- 附录B 4.2节非线性模型程序clearjc~…8e11 16…一一:cfini=[s55515-20];20士1t[8s-15dd=5;8s]:qtl-load(’D:\论文\fda\selll6.txt'):CtJJne,sample,ch,x,y,z]一textread(’D:\论文\fda\selll6atr.txt’,…’jc8)Iu j:8 j:d j:d j:d’,一1);):sample qt_m12=qtl(:,2);isacolumn vectorinc=floor(1ength(sample));startidx=l; endidx=startidx+inc一1:qt―air=sample(startidx:endidx);;cn=length(q鼻一atr)一1; qt.m12zqt―m12’;for i=1:n,startinE from 10 minute subtractjcnintervals,n beatsint―ictx(i,:)t[qt―air(i)qt―atr(i+1)];endj:j:j:j::cj:):)::c循环开始:cj:j:):):):j:j:j::cj:j:)::cforj=z:4ini=fini(j); 1=f1(j);ll=ini+l:n=length(qt―atr)一1; qt-m12=qt―m12’;:cnintervals,n beatsqt_m12一intO=zeros(11,n一1);q鼻皿2一intl=zeros(11,n―1);for i=1:n-1qt―m12一intO(:,i)=qt―m12(int―idx(i,2)-ini:int―idx(i,2)+i-1);qt_m12一intl(:,i)--medfiltl(qt―m12一intO(:,i),3);end?32- 附录B 4.2节非线性模型程序zO---mean(qt―m12一intl,2);X(II+30)宰1 zl=mean(qz―m12一intl,2);ZII*Ivshift=0;jc min(z1):zO=zO―vshift;z=spline([1:length(z0)],zo);dataffiqt..m12..intO;¨plotthe stackX-[1:ii]’*ones(1,size(data,2));Xll*n Y:ones(ii,1)木[1:size(data,2)】;jc figure;surf(X,Y,data);j:plot xlabel(’time’) ylabel(’beat’) pcurve=ppval(z,【1:11]);:cif obtain principalcurve evenspacing the datathe surface ofj―lpcurve l=pcurve; datal=data;else ifj一2pcurve2=pcurve; data2ffidata;else ifj----3pcurveS=pcurve;data3=data; elsepcurve4=pcurve;data4=data; end end endenv=[1:ii]’; [yinit,minit,hinit,familyindex]=initialdatar(data,vshift,z);FamilyIndex=familyindex; iterate=500;眦?TSS2,SSE,see]=fitpolywmhr(data,env,z,yinit,iterate,familyindex):-33― Xfitting mindata―rain(rain(data)):maxdata-皿ax(m懿(data));n=size(data,2); d=size(data,1);wuval-鼬(:,1);wdval=W吐(:,2); reval=W血(:,3);d1(j)=d;hval=岫(:,4);aveidx=[30/2+1:d+30/2];7.1*d [maxz maxzloc]=max(ppval(z,[1:d+30])); wstar--wuval;:cfor i=1:n, n*l;t=aveidx-mval(i); znewidx--wstar(i)*[ppval(z,wdval(i)*t+maxzloc)];ifj=t datafitl(:,i)=zneuidx’+hval(i)*ones(d,1);if elseelsej----2if else enddatafit2(:,i)=znewidx’+hval(i)*ones(d,1):j--3 datafits(:,i)=znewidx’+hval(i)*ones(d,1);datafit4(:,i)=znewidx’+hval(i)*ones(d,1);end end clear t tl end t2;wⅧhz(:,1+(j―1)木4:j木4)=啪h:TSSZ(j)=TSS2; SSEZ(j)=SSE;end7.XT.7.j循环结束X%讹)::c):j:plots=2; data and datafittt=t’a’:’b’;’c’;’d’);forj=t:4ifj―1.34. 附录B 4.2节非线性模型程序figure; for i=1:s宰8subplot(8,S,i) plot(1:d1(j),pcurvel,’g一’,1:d1(j),datal(:,i),’r:I,l:d1(j),datafitl(:,i),’b一一,)end end ifj=2figure; for i=1:8木8subplot(8,8,i) plot(I:dl(j),pcurve2,’g一’,1:d1(j),data2(:,i),’r:,,1:d1(j),datafit2(:,i),’b一一 title(it(i)); axis([O,size(data2,1),-1.5,0]):end end ifj一3figure; for i=1:esssubplot(8,8,i) plot(1:dl(j),pcurve3,’g-’,1:d1(j)。data3(:,i),’r:,,1:d1(j),datafit3(:。i),’b一一 title(tt(i)); axis([O。size(data3,1),-2,3]);end end ifj------4figure; for i=1:SSSsubplot(8,8,i) plot(I:dl(j),pcurve4,’g。’,1:d1(j),data4(:,i),’r:,,1:d1(j),datafit4(:,i),’b一一 axis([0。size(data4,1),-I.5,0】); title(it(i)):end end-35? 致谢致谢时间如白驹过隙,我的研究生生涯马上就要结束了,在这里我获取了知识,也得 到了快乐,更积累了有用的人生道理。 在这即将离开我生活三年的美丽校园之时,我要向我的导师周迎春副教授表达最 真挚的谢意!真心感谢她对我们的关心和照顾。周老师认真指导我们的论文,不厌其 烦,其严谨的治学风格,独到而广博的眼光令我们敬佩,值得我们学习,让我们受益 终生。再次真心的说声:谢谢您! 同时,我还要感谢学院的各位教师,是他们给予我们知识和做人的道理。 感谢各位同学,感谢室友对我的帮助,和你们一起度过了美好的三年时光。从你 们身上学到了很多,谢谢你们! 我还要感谢我的父母和姐姐,是你们的极力支持和鼓励让我更加顺利的完成了学 业。 未来的路还很长,让我们迈出这一步,一起努力走向更远的未来吧!-36- 心电图形状分析的统计方法作者: 学位授予单位: 李树良 华东师范大学本文链接:.cn/Thesis_Y1903333.aspx
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 铁将军胎压监测960w 的文章

 

随机推荐