mac圣诞限定口红12支多少

 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
聚类算法及其有效性问题研究报告
下载积分:3000
内容提示:聚类算法及其有效性问题研究报告
文档格式:PDF|
浏览次数:1|
上传日期: 09:23:59|
文档星级:
全文阅读已结束,如果下载本文需要使用
 3000 积分
下载此文档
该用户还上传了这些文档
聚类算法及其有效性问题研究报告
官方公共微信(window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
&&|&&1次下载&&|&&总79页&&|
您的计算机尚未安装Flash,点击安装&
阅读已结束,如需下载到电脑,请使用积分()
下载:30积分
0人评价211页
0人评价180页
0人评价3页
0人评价211页
0人评价92页
所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
若此文档涉嫌侵害了您的权利,请参照说明。
我要评价:
下载:30积分您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
对聚类算法普遍存在问题解决办法.pdf 8页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:250 &&
你可能关注的文档:
··········
··········
--------------------------Page1------------------------------第9卷第3期电路与系统学报Vol.9No.32004年6月JOURNALOFCIRCUITSANDSYSTEMSJune,2004文章编号:04)03-0092-08对聚类算法普遍存在问题的解决办法*姜园,张朝阳,仇佩亮,戚玉鹏(浙江大学信息与通信工程研究所,浙江杭州310027)摘要:聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,总结并预测了未来聚类算法在这五个方面的研究方向。关键词:聚类;效果评估;类数目估计;预处理;相似性测量;抗干扰性能中图分类号:TP391文献标识码:A1引言聚类就是根据某种相似性准则将样本空间分成多个子空间,使每个子空间内部样本点尽可能相似,不同子空间内样本点之间差异尽可能大,其实质是寻找隐藏在数据中不同的数据模型,是一个无监督学习过程,能够实现样本空间的盲分类。聚类广泛应用于统计、机器学习、模式识别、数据分析等领域,并越来越受重视。目前已有应用于多个领域的聚类算法近百种,处理对象从一般数据库到超大规模数据库,从低维数据空间到高维数据空间,从数字属性数据到多种属性的数据。一般地,聚类算法可分为分层聚类和分割聚类两大类,但根据应用对象的不同和处理过程的差异,聚类算法还有如下几种分类:基于密度的聚类算法、基于栅格的聚类算法、字符属性联合处理算法、高维数据聚类算法等。这种分类并非完备正交的,相互之间有交叉,每种分类又包括多种算法,有的算法同时包含了多种类型算法的设计思想。本文提出了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能。这些问题反映了算法设计者对类的定义和要求,根据应用对象的不同,不同的算法对这几个方面各有其侧重点。本文分析了对这些问题的有代表性的解决方法,总结并预测了未来聚类算法在这五个方面的研究方向。2聚类效果评估在算法设计中要考虑是否任何类的形成趋势都能在算法中得到体现,相应地就要考虑选择哪些属性作为相似性测量对象并采用最能体现特征的数据结构。对聚类效果的评价通常有两种方式:专家评估、自动评估机制。专家评估要考虑两方面问题:聚类结果的可解释性、聚类结果的可视化。聚类结果的可解释性取[1]决于算法的类型,有些类型算法可解释性好,例如基于模型的似然率算法(如COBWEB算法)具[2][3][4]有很好的可解释性;K-Means算法和K-Medoid算法产生的类可视为在centroids点和medoids点周围按照密度分布形成的数据块,具有较好的可解释性。有些类型算法的可解释性则较差,WaveCluster[5][6]算法根据小波系数聚类,FC(FractalClustering)算法将HFD(Hausdorff分形维数)作为聚类目标函数,算法的可解释性都较差。高维聚类算法通常比低维聚类算法的可解释性差。一般地,低维数据聚类结果比高维数据聚类结果可视化程度高;数据属性越多,聚类结果可视化性能越差。对高维数据通常采用PCA(PrincipalComponentsAnalysis)和SVD(SingularValueDecomposition)技术降低维数,虽然其结果缺乏可解释性,但便于可视化。[7]提出了一种新的高维数据可视化聚类方法,构成可视平面的2个坐标轴不再是降低维数后的两个属性或属性组合,而是记录序列(一个记录即为高维属*收稿日期:修订日期:基金项目:国家自然科学基金资助项目()--------------------------Page2------------------------------第3期姜园等:对聚类算法普遍存在存在问题的解决办法93性空间中的一个点)。通过对记录属性按用户关心的程度进行排序,两个记录在高维空间中的相似关系(表示为距离)在由以记录为坐标轴构成的平面中仍有可能得到保持,如此较容易发现聚类和异常现象。[8]对聚类结果可视化进行了比较全面的研究和论述。研究聚类形成趋势是为了避免聚类算法对单一类模式集合的不适当应用,即检验集合X是否已经为单峰分布;而聚类有效性则对应于数据集的概率密度p(x)的峰值分解是否完全,即检验每类模式子集S(i1,2,,c)的密度函数是否都是单峰函数。i[9]因此,聚类形成趋势和聚类有效性两个问题归结为模式子集在特征空间的单峰检验问题。采用自动评估机制就必须对同一个数据库用同样的聚类算法进行两次聚类,对形成的聚类结果进行比较
正在加载中,请稍后...

我要回帖

更多关于 mac圣诞限定眼影 的文章

 

随机推荐