刚买的金士顿骇客神条8g真假1600 8g为什么装电脑上开不了机子了,原来的内存条是三星的1600

您的位置: &
基于K均值动态聚类分析的地球物理测井岩性分类方法
优质期刊推荐工具类服务
编辑部专用服务
作者专用服务
层次聚类算法的改进
聚类分析作为数据挖掘领域的一个重要技术,被广泛的应用于医疗诊断、图像处理、信息检索、数据压缩和机器视觉等多个领域,其发展前景越来越受人们的关注。近年来随着信息化时代的到来,人们所接触到收集到的数据量越来越大,信息中所隐藏的信息也越来越复杂,人们迫切希望找到一种简单高效的聚类算法来对数据进行提取分析,因此对于聚类分析算法的研究具有重要的实际意义。  在目前的各类聚类算法中,层次聚类以其简单的逻辑原理以及准确的聚类结果,得到了人们的广泛应用。但是该算法对数据中的孤立点较为敏感,不能很好的处理含有孤立点的数据集,此外该算法由于需要重复的进行相似度计算,从而导致了较高的时间复杂度和空间复杂度,使其不适用于大规模数据处理。本文主要针对层次聚类算法的以上不足,进行了如下两个方面的研究:  (1)针对层次聚类算法对孤立点敏感的不足,提出一种基于能量场的改进算法EFHC(Energy Field Hierarchical Clustering),该算法将引力场的概念引入到孤立点的检测中,将数据中的每个点看成引力场中具有一定能量值的能量点,根据数据点与孤立点场能的不同,识别出场能较低的孤立点,并将其去除,该算法可以有效的去除数据集中的孤立点,提高聚类的精确性。  (2)针对层次聚类算法计算复杂度过高的不足,提出一种新的基于数据切分的改进算法DHC(Divide Hierarchical Clustering),将大规模数据分块切分为小规模数据,然后对小数据块逐一进行聚类处理,得到每块数据中的代表信息,并在之后对其进行整合处理,进而将原有大数据进行聚类,通过在UCI数据集和机器合成数据集上的实验验证,该算法与原有算法相比大大的降低了时间复杂度,并且使聚类质量也得到了相应的提高。
学科专业:
授予学位:
学位授予单位:
导师姓名:
学位年度:
在线出版日期:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社欢迎光临知识文库,如需获取更多资料请使用搜索功能。
基于KD_树和K_means动态聚类方法研究
第12期万means动态聚类方法研究静,等:基于KD-树和K-·3591·
数据无时无刻不在发生变化,如何解决变化数据的聚类问题是人们面临的难题。由于增量聚类方法可以解决数据的变于是增量聚类的研究具有较大化和大量存储空间需求的问题,
9,10]的现实意义。文献[从不同角度分析了增量聚类存在的问题以及增量聚类的发展趋势,并同时给出现在比较实用的增11]提出了量聚类算法及其算法解决的一些相关问题。文献[
一种针对XML结构的算法COXClustering,利用静态聚类提取子树作为特征,利用动态聚类动态调整簇核心,提高了聚类的12]效率与质量。文献[提出了一种基于层次距离的增量聚类利用概念层次树来解决数据间的相似度问题,然而其中算法,
13]基涉及到权重的选择问题在实际操作中很难保证。文献[于BIRCH聚类提出新的聚类技术选出代表点,使之构建成最Tree,小聚类树CF-进行多分辨率的层次聚类,在时间和精度方面有了很大的提高。
means聚类算法作为一种简单方便同时又应然而,传统K-却存在着不能高效地处理动态聚类的问用最广泛的聚类算法,
means方法存在的问题,14]题。对于传统K-文献[提出了一种means方法,专门处理动态聚类的动态K-可以有效检测发生概念漂移问题,但是效率较低,不能在线处理动态聚类问题。文献[15]means与遗传算法相结合的增量针对大数据量提出粗糙K-聚类算法,不过该算法参数不易调节,并且内存消耗较大。为此,本文提出了基于KD-树优化初始聚类中心点选取的方法。
针对上述不足,本文提出了一种基于KD-树优化的K-means聚类算法,采用KD-树这种数据结构来存储所有的数据对象,并通过KD-树选取k个稳定的初始中心点,以及快速地减少空间近邻搜索的时间,并寻找到对给定对象的近邻对象,且能够有效处理增量数据聚类的问题。
2基于KD-树的初始中心点选取方法
means聚类方法,对于传统的K-随机选取的初始聚类中心
因而得到的聚类结果往往往不能较好地反映数据的分布情况,
往也不稳定。通常希望选取的初始聚类中心点较为分散,但在由于随机选取的原因,往往会一般的初始中心点选取过程中,
找到许多孤立点作为初始聚类中心,不利于数据进行聚类,影响聚类结果
。因此,在选择初始聚类中心时,如果利用有效
则能够有效地改善初始的数据存储结构对数据事先进行处理,
聚类中心点选取的问题。这里所提到的存储结构是指KD-树树空间划分思想可以有方向性地选取方数据结构。根据KD-对待聚类数据进行优先处理。因为KD-树划分的空间区域法,
在一定程度上可以反映数据集的分布,而与随机选取初始聚类中心点的方法相比,本文方法相对更有效。因此,本文提出了树优化的初始聚类中心点的选取方法。基于KD-2.1
由于本文研究的算法采用KD-树存储结构,为了便于理首先介绍KD-树的相关知识。解,
KD-dimensinaltree的缩写,树是k-是对数据点在k维空间中划分的一种数据结构。最早由Bentley用,如潘章明
1means聚类方法传统K-means聚类算法基本思想是:首先从n个数据样本传统K-
通过将二叉查找树
集中随机选取k个样本对象作为初始聚类中心,其中k为聚类个数,计算每个样本到初始聚类中心的欧氏距离,根据距离最小的原则,把样本点分配到距离最近的聚类簇中;完成数据划分后,计算每个聚类簇中各个数据对象的均值,从而得到新的聚类簇中心。不断重复以上步骤,直到聚类中心不再发生变化为止
扩展到高维空间提出的,后来许多学者对其进行了扩展与应
。KD-树本质上是一棵二叉树,多用于多维空
树就是一种空间划分树,把整个空间划分成间上的搜索。KD-几个特定的部分,然后在特定的部分内进行相关操作。
本文提出一种基于KD-树的初始聚类中心的选取方法。KD-树能把数据空间分割成一个一个的矩形区域,每个矩形区通过计算矩形单元中心来代表域中都包含相对应的数据对象,
此矩形单元内包含的数据对象,对原始数据集进行简化处理。然后,通过比较计算出来的矩形单元中心的大小,选取出前k个作为初始样本聚类中心。根据KD-树空间划分的思想,有方在一定程度上能够反映数据集的分向性地选取初始聚类中心,
布、聚类形状。同时,通过KD-树优化数据集选取出的初始聚means聚类算法随机选取更具有代表性,类中心比传统K-因此本文算法在初始聚类中心的选取上相对简单有效。
x2,…,xn}。为了研究基于KD-已知样本数据集X={x1,
树优化初始聚类中心点选取的算法,本文给出以下定义。
数据对象数目。每个矩形单元中的数据对象的
x2,…,xn},C={C1,C2,…,Ck}设样本数据集为X={x1,
c2,…,ck}规定为初始的表示初始聚类的k个类,其中c={c1,聚类中心,两个样本数据对象之间的欧氏距离表示为Dist(xi,xp)=‖xi-xp‖2,令聚类中心为ci=子集Ci中样本数据的个数。
K-means聚类的准则函数为E=∑∑‖xi-ci‖2,E表
∑x,其中ni表示聚类nix∈Ci
示样本数据集中所有样本数据对象的误差平方和。当聚类中E达到最优心不再发生变化时,
K-means聚类算法实现起来比较简单,并且具有较好的可means聚类算法尝试找出使误差平方准则函扩展性。由于K-所以当样本数据密集且类与类之间区数最优的k个聚类结果,
means聚分比较明显时,聚类效果显著。然而,由于传统的K-类方法的初始中心点是随机选取的k个数据对象,使得聚类结果易陷入局部最优;同时,中心点的随机选取策略易受噪声影响,从而影响聚类结果的有效性。
means算法针对增量数据存在两方面的缺此外,传统K-means聚类算法需要对整个陷:a)当增量数据到来时,传统K-数据集重新进行聚类,效率较低;b)在每次对整个数据集进行算法仍存在对中心点敏感的不足。聚类时,
数目定义如下:
其中:RecU表示通过KD-树切割形成的矩形单元;DataN表示数据样本数目;SF表示细分因子(反映对聚类的细分程度,即一个聚类被分割成SF个子块,可根据数据集的大小进行调如果数据集各聚类中的样本数差别不大,则一个聚类被分整,
割为10个子块(即SF=10),再进行取样,这样就已经非常精细了);k表示聚类数。通过NumRecU反映KD-树的深度和叶子节点的数目。
PPT制作技巧文档分类:
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,
下载前请先预览,预览内容跟原文是一样的,在线预览图片经过高度压缩,下载原文更清晰。
您的浏览器不支持进度条
下载文档到电脑,查找使用更方便
还剩?页未读,继续阅读
播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表层次聚类法及蚁群计算理论下的电力体系无功优化.doc
文档介绍:
层次聚类法及蚁群计算理论下的电力体系无功优化 1绪论 1.1 课题研究的背景及意义在输送电能的过程中,如何有效利用无功调节手段减少电力系统的电能损耗的相关研究受到广泛重视。电力系统的无功功率分布对系统运行的经济性和安全性有重要影响。为使系统中的无功功率分布合理,可以通过调节发电机机端电压、安装并联电容器和有载调压变压器 OLTC )进行电力系统的无功电压控制。在电力系统规划时,通过优化计算来有效地配置并联电容器的个数、位置及容量; 在电力系统运行时,根据全天负荷曲线的变动,合理调节发电机机端电压、投切电容器和调节有载调压变压器分接头。因此,加强无功功率控制,保证电压质量和降低系统损是电力系统需要解决的重要问题之一。电力系统无功优化问题是一个大规模非线性非连续控制变量的优化问题。通过优化计算能以较小的投资达到最佳的补偿效果,从而有效降低电中的能量损耗和改进电能质量。本文针对如何合理确定系统的无功电源的数量、位置和容量,调节控制设备全天动作的时段和次数的无功优化问题进行研究有着十分重要的理论意义和现实意义。 1.2 国内外无功优化研究现状由于无功优化问题研究的复杂性,长久以来,相关研究人员对其优化模型和算法进行了大量研究。本文仅从电力系统无功规划研究和电力系统动态无功优化研究两个方面阐述国内外无功优化方面的研究现状。 1.2.1 电力系统无功规划研究现状电力系统无功规划问题,主要针对在恒定负荷条件下,确定无功补偿设备的数量、位置和容量。对该问题的大量研究总体上可以归结为数学规划法、启发式方法和人工智能方法。①数学规划法研究人员采用数学规划法,将无功规划问题处理成有约束的极值问题用最优化方法迭代计算。该方法能够在模型中较为完善地考虑电压和电流等约束条件,并可以考虑补偿点位置的具体情况和电容器的型号。此类优化方法有线性规划法(Linear Programming , LP) 、非线性规划法(Non-Linear Programming , NLP) 和混合整数规划法等。 1 )线性规划法(LP) 线性规划法作为最优化技术中发展最成熟的方法,具有收敛性好、计算速度快等优点。文献[1] 将线性规划法引入到无功规划中, 控制电的无功功率及电压。文献[2] 采用模糊集理论对无功优化问题建模,将其转化为一个标准的 LP 问题。但电容器的容量和安装位置本身为非线性规划问题,用一个连续变量来替代离散变量,不能准确描述无功规划问题,使计算的误差较大。 2 )非线性规划法 NLP ) 非线性规划法能够直接处理非线性模型,更符合无功规划实际问题,计算精度高。文献[3] 用非线性规划法中的梯度法进行优化计算,采用运行与投资费用最小作为目标函数。将问题分解为最大负荷、一般负荷和最小负荷三个子模型,并在最大负荷条件下考虑投资费用,使优化方案更符合实际需求。可是现有算法存在计算量大、内存需求量大、收敛性差的缺点,对不等式处理存在一定的困难,限制了算法的应用。 2 聚类方法简介和蚁群算法的基本原理 2.1 引言聚类是一种重要的数据挖掘技术。它通过分析数据间的相互关系,利用一定规则将数据划分为性质相似的若干簇。聚类分析的结果揭示了数据间的内在关系,为进一步分析数据提供了重要的依据。除此以外,聚类分析也可以作为其它算法的预处理步骤,在聚类生成簇的基础上进行处理,这样可以大大提高算法的效率。聚类方法已经在电力系统研究领域得到了应用。蚁群优化算法(Ant Colony Optimization algorithm,ACO) 是模拟自然界中真实蚂蚁觅食行为而形成的一种新型模拟进化算法。它利用具有记忆功能的人工蚂蚁,通过蚂蚁个体间消息的交流与相互协作来找到从蚁穴到食物源的最短路径,其具有搜索速度快等优点。本章简要介绍聚类分析方法和蚁群算法的基本原理。 2.2 聚类方法简介聚类分析是数据挖掘中一个活跃的研究领域。它是将物理或抽象对象的集合组成的多个簇或类的过程,并满足相同簇内差异度最小,不同簇内差异度最大的原则。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,只需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象必需有类别标记。因为聚类是观察式学习,而不是示例式的学习,所以聚类更为复杂。下面结合文献[41 、 42] 对聚类方法的要求和种类进行简要介绍。 3 基于层次聚类法和蚁群算法.......................... 22-47 3.1 引言.......................... 22 3.2 配电无功规划的数学模型.......................... 22-23 3.3 基于层次聚类法确定无功待.......................... 23-26 3.3.1 层次聚类法的基本原理.......................... 23-24 3.3.2 聚类算法的基本描述..........................24-25 3.3.3 基于层次聚类法确定.......................... 25-26 3.4 配电无功规划蚁群算法..........................26-29 3.4.1 配电无功规划蚁群算.......................... 26-27 3.4.2 对蚁群算法搜索策略..........................27-28 3.4.3 计算流程.......................... 28-29 3.5 算例及分析.......................... 29-45 3.5.1 聚类结果分析.......................... 29-34 3.5.2 无功待补偿点的选择.......................... 34-35 3.5.3 三个 IEEE 配电系统优.......................... 35-44 3.5.4 实际算例..........................44-45 3.6 本章小结.......................... 45-47 4 基于聚类蚁群算法的动态.......................... 47-66 4.1 引言..........................47 4.2 动态无功优化的数学模型.......................... 47-48 4.3 OLTC 分接头.......................... 48-49 4.4 动态无功优化聚类蚁群算法.......................... 49-53 4.4.1 聚类蚁群方法..........................49-50 4.4.2 蚁群算法多样性.......................... 50-52 4.4.3 蚁群算法连续控制变量................1
内容来自淘豆网转载请标明出处.

我要回帖

更多关于 金士顿骇客神条8g真假 的文章

 

随机推荐