落泪的戏子手机到底有什么好

  摘 要: RFID采集的车辆信息可以识别营运车辆的运行规律,采用这种方法能找出运行规律类似营运车辆的私家车,并判定为疑" />
免费阅读期刊
论文发表、论文指导
周一至周五
9:00&22:00
一种自适应停止的SOM神经网络及其应用
2014年4期目录
&&&&&&本期共收录文章20篇
  摘 要: RFID采集的车辆信息可以识别营运车辆的运行规律,采用这种方法能找出运行规律类似营运车辆的私家车,并判定为疑似非法营运车辆。应用SOM神经网络聚类时,初始化网络需要设置各种参数。为此,提出一种自适应确定网络训练次数的方法,利用权值导数来判断是否停止训练。利用UCI数据集对传统的和改进后的网络进行测试并对比,发现改进后的网络优于传统网络。最后,将改进后的网络用在车辆运行规律识别中,得到预期的效果。 中国论文网 /8/view-5827367.htm  关键词: SOM神经网络; 网络训练; 自适应; 聚类   中图分类号:TP391.4 文献标志码:A 文章编号:(-03   Abstract: The vehicle information collected by RFID could identify laws of the commercial vehicles' operation. Using this approach can find out private cars which have similar operation laws, and judge them as suspected illegal vehicles. When using SOM neural network to cluster, various parameters need to be set when initializing the network. A self-adaptive method is introduced for determining the network training times, which uses weights derivative to determine whether to stop training. After the test and comparison of the traditional and the improved network by taking advantage of UCI datasets, it turns out that the improved network is better than the traditional network. Finally, when the improved network is used in identification of the vehicle, an expected recognition results can be reached.   Key words: SOM neural network; network training; a self-adaptive method; cluster   0 引言   RFID技术作为一种新兴的车辆监控技术,正在被广泛地应用于交通领域,重庆市目前正在建设全球最大规模的以UHF RFID技术为基础的车联网,已建设RFID数据采集点300余处,给利用RFID数据来进行非法营运车辆的识别提供了可能。项目前期已经得到了模拟城市某点的RFID对各种机动车辆仿真的数据,其中包括营运车辆和非营运车辆。营运车辆包括:公交车、长短途客运车辆和出租车;非营运车辆是私家车。识别的任务就是找到非法的营运车辆。在识别过程中采用了SOM神经网络对各种车辆进行聚类,从而识别运行规律与营运车辆类似的私家车,并将其标记为疑似非法营运车辆,提高交通行政执法人员的目的性和执法效率。   所谓自组织映射网络(SOM)是由芬兰学者Kohonen教授在1981年提出的,也称作Kohonen网络[1]。网络通过把复杂、多维的输入数据投射到一维或者二维的输出空间来进行对复杂数据的研究。SOM网络的应用和研究都非常广泛,例如利用模糊概率SOM神经网络来进行人脸识别[2],利用改进的自组织网络进行概率密度估计与分类[3],设计自生长的批处理SOM网络以及确定它的停止条件[4],这里的停止条件是指获胜者的近邻加权平均失真误差发生收敛时停止训练网络等。   项目前期得到RFID点采集到的信息包含:车辆车牌号、车辆经过时间和经过地点,再将数据导入SQL Sever数据库进行数据的预处理,处理后得到的数据包括:车辆车牌号,统计周期内的车辆平均通过时间、通过时间的方差、通过时间间隔、通过时间间隔的方差、通过频次、高峰通过占比等相关信息,而后经过PCA降维处理去掉不同维数据之间的相关性并剩下最终的六维数据,将这六维数据作为网络的输入数据。   使用MATLAB神经网络工具箱[5]对SOM网络进行聚类时发现,对SOM网络的初始参数的确定有很多局限性,这些初始参数包括:网络权值和阈值、训练次数、训练样本的顺序、学习率等[6-7],但目前暂时还没有找到一种有效的方法来解决这些初始参数的设定问题。本论文对网络的训练次数的设定方式进行一些改进。   1 论述   1.1 SOM网络的基本模型及原理   SOM网络由输入层和输出层构成,输入层是一维的神经元,神经元个数由输入向量的维数i确定,表示网络的输入信号;输出层也是竞争层,一般是一维或二维的神经元组成的网络,其中每个神经元表示不同的输出模式。其连接方式如图1所示。对于每一个输出神经元j,它和每一个输入神经元通过一个权值连接,这个权值组成的向量如式⑴:   其中i表示输入向量的维数,即输入层的神经元个数,j表示第j个输出神经元,输出层共包含M*N个输出神经元,如图1所示为4输入神经元,4*4输出神经元构成的SOM神经网络[5]。   SOM网络的运行分为训练和工作两个阶段[1]。训练阶段,对网络输入数据,输出层将有某个神经元产生最大的响应而获胜。获胜神经元周围的神经元也因此产生较大的响应,于是将获胜神经元及其领域(以某种方式定义的一个获胜神经元周围的区域)内的所有神经元以某种方式将其权值向量进行修改。网络通过自组织方式,用输入数据调整网络权值,最后使输出层各神经元的权值向量成为某类的聚类中心,确定好后训练结束。网络训练结束后,输出层各神经元与输入模式的特定关系就完全确定了,因此可以工作了,当输入一个模式时,网络输出层代表该模式的特定神经元会产生最大的响应,在所有神经元中竞争成功,从而自动将该输入归类。
  在训练阶段,训练次数需要根据经验并反复对比确定一个合理的值,但对于一个陌生的问题,并不能够在短时间内很好地确定训练次数的最佳值,若训练次数设定过小,可能造成训练不充分而使得到的结果正确率不高;若训练次数过多,又会造成训练过度而使结果不准确,且会浪费大量的时间。故训练次数确定过程很繁琐,不够简便,而且确定最佳训练次数时 花费的时间较多,针对这个问题本文提出了一种解决方法。   1.2 SOM神经网络的训练过程   传统SOM神经网络的训练过程主要包括以下几步骤[6]:   ⑴ 初始化网络:首先确定输出神经元的数目,二维的输出矩阵可以表示为M*N,往往要比预测的聚类数目多,初始化权值向量如式⑵:   ⑵ 确定获胜神经元:对于每一个训练样本x,使用最小欧式距离准则来寻找离样本向量最近的神经元c,作为获胜神经元,并把它添加到该获胜神经元的类型VC中。决策条件如式⑶:   ⑶ 更新权值:对优胜邻域内所有节点按照式⑷   来调整权值。其中学习率η(t,N)是训练时间t和邻域内第j个神经元与获胜神经元之间的拓扑距离N的函数,且η随着t和N的增加减小。   ⑷ 检查结束:SOM网络的训练是以学习率η(t)是否减小到0或某个特定的值,或者训练次数t是否达到某一设定的值为条件,满足这个条件就退出训练,否则继续对网络进行训练,返回步骤⑵。   1.3 SOM网络的改进   在SOM的训练过程中,权值一开始是一系列的随机的小数,随着训练过程的进行,权值不停地改变,更加靠近每一个输出神经元的聚类中心,直到达到一个设定的训练次数或学习率衰减到一定的值。但设定的训练次数往往需要多次实验才能确定;而学习率最后衰减的阈值需要靠经验来确定,如果设定为0,会使网络陷入亚稳定状态[1],设置合适的阈值需要适应不同的实际情况。故提出一种利用权值导数来判断何时该停止训练的方法。   每个神经元都代表一个聚类中心,而在传统的聚类过程中,类中心是随着聚类的过程不断地靠近每一类数据中心,而在SOM神经网络中,聚类中心的表征形式又是各个输出神经元的权值向量[Wj1,Wj2,…,Wji](j=1,2,…,M*N),所以定义每一次训练后权值的变化,如式⑸:   来表示类中心的变化情况。其中其中Wn表示当前训练后的权值,Wn-1表示前一次训练后的权值,ΔW是一个i*j维的向量。其中i是输入神经元的个数,j是输出神经元的个数M*N。   权值变化量ΔW的一范数如式⑹:   一范数即为列模,这里符合权值的定义,每一列代表一个聚类中心,ΔW的一范数就是变化最大的类中心的变化量。最终的目的即判断在训练次数为何值时权值W收敛。采用函数值的下降量充分小[8]为收敛准则,即最大的类中心变化值‖ΔW‖1小于某一给定值ε时,即:   来判断收敛。ε为事先给定的收敛条件。   在网络的训练过程中,学习率仍采用SOM网络经典的函数,即指数函数,这里所用的是:   2 实验   为了评估训练次数自适应的SOM改进算法对网络性能的影响[10],本文对改进算法与传统算法进行了对比分析。采用UCI数据集对数据进行测试,分别采用了八个数据集,包括Wine、Breast_Cancer、Iris、Zoo、Car_Evaluation、Abalone、bupa、segment数据集的基本信息和对应的输出网络模型设置见表1,并对照MATLAB中传统的SOM网络[5]进行仿真结果如表2所示,其中在MATLAB中默认的训练次数为200次。   经过测试可以看到,改进后的SOM网络能够比matlab中传统SOM网络(默认训练200次)识别的正确率高。   把改进后的SOM神经网络用在车辆类型识别中的效果如图2所示,其中绿色的为私家车数据,黑色为非法营运车辆数据,红色为公交车数据,蓝色为长途车数据。   该网络输出矩阵设置为7*7的矩阵,经过若干次自适应的迭代,得到的聚类结果如图3所示。   可以看到营运车辆被聚到一类,绿色的合法私家车均匀的散布在输出矩阵中,非法营运的私家车被聚到营运车一类。将这些疑似营运车辆的私家车提供给执法部门,能够给执法人员提供一些线索和依据。   3 结束语   本文提出了一种运用在SOM网络中利用导数判断收敛的算法,该算法能够自适应确定SOM网络无监督训练时的迭代次数,缩短确定训练次数所花费的时间,减小算法复杂度。经过实验验证,在不降低正确率的情况下通过该算法可以减少手动确定训练次数的过程;并与MATLAB中传统的SOM神经网络工具箱相对比,其中默认的训练次数是200次,从表2中可以看到改进后的网络比默认参数的神经网络识别正确率高。利用改进后的网络对经过特征数据提取之后的RFID数据进行聚类,能够达到预期结果。   参考文献:   [1] Samarasinghe.s. Neural Networks for Appeied Sciences and Engineering:From Fundamentals to Complex Pattern Recognition[M].Beijing:Mechanical industry press,2009.7.   [2] Laura Lanzarini, Franco Ronchetti, Cesar Estrebou, Luciana Lens Aurelio Fern' andez Bariviera,Face recognition based on fuzzy probabilistic SOM[J]. IFSA World Congress and NAFIPS Annual Meeting (IFSA/NAFIPS),2013.
  [3] Lin Chang, Yu Chong-xiu, Modified Self-Organizing Mixture Network for Probability Density Estimation and Classification[J].Neural Networks (IJCNN), The 2013 International Joint Conference on,2013.   [4] Se Won Kim, Tang Van To. A Self-Growing and Self-Organizing Batch Map with Automatic Stopping Condition[J].2013 5th International Conference on Knowledge and Smart Technology (KST),2013.   [5] 张德丰等.MATLAB神经网络应用设计[M].机械工业出版社,2011.   [6] 周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].清华大学出版社,2005.   [7] 任军号,吉沛琦,耿跃.SOM神经网络改进及在遥感图像分类中的应用[J].计算机应用研究,2011.3.   [8] 陈宝林.最优化理论与算法[M].清华大学出版社,2005.   [9] Apirak Jirayusakul. Improve the SOM Classifier with the Fuzzy Integral Technique[J].Ninth International Conference on ICT and Knowledge Engineering,2011.   [10] Juha Vesanto, Johan Himberg, Esa Alhoniemi and Juha Parhankangas, Self-organizing map in Matlab: the SOM Toolbox[J].Proceedings of the Matlab DSP Conference,1999.   [11] Chen Weijun,Li Xiao. An Improved Solution of SOM Network Anomaly Detection Based on T-Distribution[J].International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery,2011.
转载请注明来源。原文地址:
【xzbu】郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息,与本网站立场无关。xzbu不保证该信息(包括但不限于文字、数据及图表)准确性、真实性、完整性等。SOM学习笔记1 - 简书
SOM学习笔记1
SOM学习笔记小编打算写两篇,内容来自小编前阶段在工作要解决的预警产品质量在多个ATE上走低的问题。第一篇从理论的角度介绍SOM的网络模型、学习算法,第二篇从应用的角度以demo的形式展示实际的应用。
1.SOM是什么
SOM英文全拼是Self-Organizing Maps,中文一般译作自组织映射网络,它是神经网络的一种,由kohonen提出,属于非监督式学习,它模仿人脑神经元对信息的处理方式,通过自身训练,自动对输入的模式进行聚类。
2.SOM网络模型
SOM网络有两层,分别是InputLayer和OutputLayer。InputLayer与OutputLayer通过权值相连,InputLayer即输入层,其输入一般为高维度向量。OutputLayer的神经元一般放置在二维网格中,输出层近邻的神经元也通过权值连接
SOM网络模型
3.内星学习规则
SOM是基于内星学习规则而来的,有必要学习下该规则:
假设输入信息为n维向量,该向量与权值向量连接,输出到输出神经元Y中,Y采用硬限幅函数作为传递函数,限定输出为1和0
内星模型训练的目标使得神经元Y只对某些特定的输入向量产生兴奋,即在Y出的神经元输出为1
通过学习速率η对权值进行调整,当Y=1时,权值进行调整,当Y=0时,权值不做调整,最终得到的网络权值趋近于各输入向量的平均值
4.SOM学习算法
设定变量:X=[x1,x2,x3,…,xm]为输入样本,每个样本为m维向量。ωi(k)=[ωi1(k), ω i2(k),…,ωin(k)]为第i个输入节点与输出神经元之间的权值向量
初始化:权值使用较小的随机值进行初始化,并对输入向量和权值做归一化处理
X’ = x/||x||
ω’i(k)= ωi(k)/||ωi(k)||
||x||和||ωi(k)||分别为输入向量和权值向量的欧几里得范数
将样本输入网络:样本与权值向量做内积,内积值最大的输出神经元赢得竞争,记为获胜神经元
更新权值:对获胜的神经元拓扑邻域内的神经元采用内星规则进行更新
ω(k+1)= ω(k)+ η(x- ω(k))
更新学习速率η及拓扑邻域,并对学习后的权值重新归一化
判断是否收敛。如果中心改变很小或达到预设的迭代次数,结束算法
5.SOM的优缺点
表示的结果非常容易理解,这点将在第二篇demo中看到
实现起来比较简单
计算复杂度高,对相似性的度量非常敏感
不能应用存在缺失值的数据集基于SOM神经网络的风机故障诊断研究--《风机技术》2009年01期
基于SOM神经网络的风机故障诊断研究
【摘要】:应用自组织特征映射(SOM)神经网络实现风机的故障诊断。介绍了SOM网络的结构和学习算法;总结了风机的故障集、征兆集和故障特征数据。在MATLAB环境下给出了风机故障诊断的具体实例,表明该方法是一种可行有效的风机故障诊断方法。
【作者单位】:
【关键词】:
【分类号】:TP277【正文快照】:
1SOM神经网络结构和学习算法1.1SOM神经网络结构自组织特征映射网络(Self-organizingfeatureMap,SOM)由输入层和输出层组成。输入层是通过权向量,将外界信息汇集到输出层各神经元,该层的节点数与样本维数相同。输出层也是竞争层,该层神经元的排列有多种形式,分为一维线阵、二
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【引证文献】
中国期刊全文数据库
尤丽静;陈在平;;[J];天津理工大学学报;2010年01期
【参考文献】
中国期刊全文数据库
张松鹤,罗跃纲;[J];风机技术;2005年03期
【同被引文献】
中国期刊全文数据库
赵金鑫;许宝杰;吴国新;;[J];电子技术;2008年08期
舒服华;;[J];风机技术;2007年02期
李铁军;朱成实;叶龙;赵新君;王丹;王学平;;[J];风机技术;2007年05期
黄生琪,周菊华;[J];通风除尘;1996年01期
岳素青;;[J];太原师范学院学报(自然科学版);2008年04期
【二级参考文献】
中国期刊全文数据库
颜延虎,钟秉林,黄仁,万德均;[J];振动工程学报;1993年03期
【相似文献】
中国期刊全文数据库
王杰,闫东伟;[J];系统工程与电子技术;2004年12期
潘毅;[J];微电子学与计算机;1986年10期
王立权;赵树鹏;张立勋;苏炳卿;;[J];应用科技;1992年03期
于淑芳;[J];柳州职业技术学院学报;2005年01期
路志英,赵智超,郝为,林孔元,刘还珠;[J];计算机应用;2004年04期
王娜,梁禹;[J];仪器仪表学报;2005年S1期
邢秀琴;姚竹亭;;[J];机械管理开发;2006年02期
侯水英;;[J];中南大学学报(自然科学版);1992年03期
;[J];电子科技文摘;2001年12期
冯介一;;[J];电子测量技术;2002年02期
中国重要会议论文全文数据库
张晓阳;孙宇;张荣涛;郭兴华;;[A];江苏省机械工程学会第六次会员代表大会论文集[C];2002年
任生;胡明文;;[A];设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集[C];2005年
徐荣红;董新民;;[A];第二十届中国控制会议论文集(下)[C];2001年
刘京津;姜斌;;[A];2007中国控制与决策学术年会论文集[C];2007年
张柯;李文然;;[A];2007中国控制与决策学术年会论文集[C];2007年
成曙;石林锁;吴少军;;[A];1995中国控制与决策学术年会论文集[C];1995年
段志善;东亚斌;;[A];振动利用技术的若干研究与进展——第二届全国“振动利用工程”学术会议论文集[C];2003年
卢达川;;[A];第五届设备管理第八届设备润滑与液压学术会议论文集——《设备管理设备润滑与液压技术》[C];2004年
代克杰;张红梅;盛赛斌;;[A];2004中国控制与决策学术年会论文集[C];2004年
肖江;蒋爱平;;[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
中国重要报纸全文数据库
高庆华?记者
张云普;[N];中国石油报;2008年
张志春;[N];黑龙江日报;2010年
石新兵;[N];中国矿业报;2008年
;[N];沈阳日报;2010年
李东梅 连小芳;[N];宁夏日报;2007年
广西龙州县鸭水电厂
王昉;[N];中华合作时报;2004年
谢克俭;[N];福建科技报;2006年
谢克俭;[N];福建科技报;2006年
薛志成;[N];电子报;2003年
蒋金波;[N];市场报;2005年
中国博士学位论文全文数据库
杨旭华;[D];浙江大学;2004年
蒋丽英;[D];浙江大学;2005年
王承;[D];电子科技大学;2005年
谢宏;[D];湖南大学;2005年
陈晓娟;[D];吉林大学;2006年
李厦;[D];同济大学;2006年
王志鹏;[D];大连理工大学;2001年
肖迪;[D];南京航空航天大学;2005年
刘敏华;[D];清华大学;2005年
柳新民;[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库
付阶辉;[D];东南大学;2004年
郭丽;[D];吉林大学;2007年
叶芳;[D];重庆大学;2004年
崔飞;[D];吉林大学;2005年
王勇;[D];内蒙古工业大学;2006年
刘炳春;[D];河北工业大学;2005年
阎铁生;[D];西南交通大学;2005年
孙凤;[D];哈尔滨工程大学;2005年
闫传军;[D];中国海洋大学;2005年
王莉;[D];太原理工大学;2005年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号SOM神经网络_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
SOM神经网络
上传于|0|0|文档简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩8页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢基于RFM分析的银行信用卡客户的行为评分模型;――应用自组织映射神经网络SOM和Apfiod方;梁昌勇赵艳霞;合肥工业大学管理学院,合肥230009;摘要t本文应用数据挖掘工具分析银行的现有的信用卡;关键词:行为评分模型;客户细分:神经网络:关联规;TheBehavioralScoringMode;onCardCustomersinaBankBa;.…一th
基于RFM分析的银行信用卡客户的行为评分模型
――应用自组织映射神经网络SOM和Apfiod方法
梁昌勇赵艳霞
合肥工业大学管理学院,合肥230009
摘要t本文应用数据挖掘工具分析银行的现有的信用卡客户的行为特性和信用,探讨了信用卡客户的行为评分模型。应用自组织映射神经网络分析其还款行为和近度R、频度F、值度M的行为特性,应用这四个指标进行评分来识别不同的客户群。然后把银行客户分为三个主要的盈利客户群并识别出银行的重要客户群.应用Apriori关联规则描述不同的客户群的特征属性,形成客户轮廓。本文通过建立的客户行为评分模型有助于识别客户的特征,促进营销策略的实施.
关键词:行为评分模型;客户细分:神经网络:关联规则
TheBehavioralScoringModelofCredit
onCardCustomersinaBankBasedRFM
.…一theApplicationofSOMandApriori
ZhaoYanxiaLiangChangyong
SchoolofManagement,HefeiUniversityofTechnology,Hefei230009
Abstract:Thisstudyproposes
customersinaanintegrateddatamininganalysisthebehavioroftheexistingcreditcardtObankandpresentsabehavioralscoringmodel.Aself-organizingmapneuralnetworkisused
011identifygroupsofcustomersbasedrepaymentbehaviorandrecency,frequency,monetarybehavioral
scoringpredieators.Italsoclassifiedbankcustomersintothreemajorprofitablegroupsofcustomersand
作者简介:粱昌勇(1965一),男,安徽合肥人,合肥工业大学管理学院副院长,博士生导师,研究方向:信息管理、智能决策。赵艳霞(1978.),女,合肥工业大学硕士生,研究方向:信息资源管理、客户关系管理、数据挖掘,Emaihzhaoyanxia2001@yahoo.tom.∞347
identifiedthemostimportantcustomer.Theresultinggroupsofcustomerswerethenprofiledbycustomcr,sfeatureattributesdeterminedusinganAprioriassociationruleinducer.Thisstudydemonst他teSthatidentifyingcustomersbyabehavioralscoringmodelishelpfulcharacteristicsofcustomerandfacilitatcsmarketingstrategydevelopment.
Keywords:BehavioralScoringModel;CustomerSegmentation;NeuralNetwork;AssociationRule1研究背景
企业获取客户资源的重要策略是实施与市场相适应的营销策略。因此,对企业来说基本的是要成功地获取新的客户而且留住高价值客户。为了达到这一目标,许多企业已经建立了大型的数据库,基于这些数据资源的分析和应用有利于制定新的商业战略,把握商业机会。
信息技术的快速发展和企业信息化程度的日益提高,使企业收集、处理和运用客户数据的能力大大增强,这为进行客户行为的深人分析创造了良好的条件。目前我国的一些大中型银行已经建立了自己的大型数据库,基本完成了数据大集中,当务之急是分析银行数据库中的客户资料,挖掘其中的客户行为模式,找到其中的关联规则,针对目标客户群实施特定的、与之相适应的管理战略。
1970年问世的“行为评分”,被认为在现有消费贷款账户及客户管理上是非常具有参考价值的。行为评分是一种统计专门技术,它透过追踪账户如何被使用(像款项支付、消费、延迟付款等参数)的一些信息,对贷款拖欠的风险进行评估,更进一步还可以用来预测潜在的获利性。信用评分模型是用来决定是否给与新的贷款申请人贷款许可,区分好客户和坏客户;行为评分模型是对已有客户进行风险管理与控制的最好的方式,如何提高收益。信用和行为的评分模型是在金融和银行业中运用统计学和运筹学研究的最成功的一个模型,建立信用和行为评分模型的最主要目的是对客户进行分类。在银行数据库中分类方法应用于信用评分主要是根据申请者的特征如年龄、收入和婚姻等情况决定是接受其申请或者拒绝。另一方面,行为评分的分类分析通过对现有客户的行为评分变量来描述其特征以及对其未来的贷款消费行为和信用状况做出预测。
之前的大部分研究都是以建立准确的信用或行为的评分模型以及如何利用各种统计方法来提高分类模型的准确度为焦点。然而,因为银行数据库的多维性,它包含有大量的月账户记录和日交易记录,即使有了高准确度的评分模型,也会经常出现一些错误的分类模式。
本文引入了数据挖掘的方法,建立一个基于RFM分析的数据挖掘的行为评分模型来分析银行信用卡客户的行为,这一模型包括了对现实中的数据集进行数据处理和准备、进行评分和客户轮廓刻画,建立的这个标准模型具有很大的实用性。两阶段的行为评分模型的框架也是验证了实际申请中评分分析过程中数据挖掘的有效性。
2系统的行为评分模型和概念框架
本文建立了一个两个阶段的评分模型如图1所示,它的主要特征是应用数据挖掘的工具:自组织映射神经网络(SOM)和Apfiofi关联规则。应用自组织映射神经网络SOM把盈利客户群分类后,应用Apriofi方法刻画每个客户群属性特征,建立最具有盈利能力的客户数据库。然后对每个客户群给出了一个代表性的客户轮廓,为制定更好的银行营销战略做准备。
董;熟|潜蠢1.“委“霪l蠢}『j’城蔷1t_i
一一vr++一…一”tv鸯黄囱s秘了v*一“n…,一…一-,…
嚣’寿献褥l
图1两阶段的行为评分模型图2客户行为模型的概念框架
银行信用卡客户的数据主要分为两部分:账户数据信息和交易记录信息。账户数据信息描述了客户的个人信息如年龄、性别、收入等,交易记录信息包含了客户的行为信息如贷款的支付、消费金额等。然后把两部分数据集建立连接就形成了单一客户的行为数据集。
由于原始数据库存在如下问题:数据不完整,存在大量的空缺值;含噪声数据,存在大量冗余和噪声数据;数据不一致,原始数据取自各实际应用系统,而各应用系统的数据缺乏统一标准,数据结构也有较大差异;不同的数据挖掘算法对数据有相应的要求,因此在挖掘之前需要对原始数据进行大量的预处理工作,以减少挖掘过程中的故障,提高数据挖掘模式的质量,降低实际挖掘所需要的时间。
酋先进行数据集成,主要将多文件或多数据库运行环境中的异构数据进行合并处理,
解决语义的模糊性。该部分主要涉及数据的选择、数据的冲突问题,以及不一致数据的处理问题。在集成的过程中需考虑以下问题的一致性:字段数据格式、字段长度、字段名称等。然后进行数据清理。去除源数据集中的噪声数据和无关数据,处理遗漏数据和清洗脏数据,考虑时间顺序和数据变化等。主要包括噪声数据处理和缺值数据处理,并完成一些数据类型的转换。接下来进行数据变换,主要是找到数据的特征表示,用维变换或转换方法减少有效变量的数目或找到数据的不变式,将数据转换成适合于挖掘的形式。最后进行属性构造、数据归约和布尔转换。
3应用SOM的银行卡客户细分
3.1自组织映射神经网络(SOM)算法
自组织映射(SelfOrganizationMap,SOM)神经网络是较为广泛应用于聚类的神经网络,它是由Kohonen提出的一种无监督学习的神经元网络模型。主要功能是将输入的n维空间数据映射到一个较低的维度佣i常是一维或者二维)输出,同时保持数据原有的拓扑逻辑关系。与其他类型神经网络的区别在于:它不是以一个神经元或网络的状态矢量反映分类结果的,而是以若干神经元同时(并行)反映分类结果,这种特征映射神经网络通过对输入模式的反复学习。使连接权矢量的空间分布能反映输入模式的统计特性。
SOM网络可以采用各神经元(特征参数)之间的自动组织去寻找各类型问固有的、内在的特征,从而进行映射分布和类别划分。所以SOM神经网络对于解决各类别特征不明显、特征参数相互交错混杂的、非线性分布的类型识别问题是非常有效的。SOM神经网络的这种特性对于基于客户行为的客户细分和分类研究也是相当有效的,因为客户行为识别本身也是一种复杂多变的问题。SOM网络由输入层和输出层(Kohonen层)组成。输入层中的每一个神经元。通过权与输出层中的每一个神经元相联,如图3所示。
输入层的神经元以一维的形式排列,输入神经元的个数由输入矢量中的分量个数决定。输出层的神经元一般以一维或者二维的形式排列,计输入层的神经元数量为n,输出层神经元数量为m,输入的样本总数为s,第P个输入样本用矢量表示为:
Xp=(xpl,xp2,...,xpi,...,xpn)7每个输出神经元的输出值记为撕,j=1,2,...,m。与莉个输出神经元相联的权用矢量表示为:Wj=(wjl,wj2,...,wji,...,wjn)r
SOM聚类的方法是为每个输入神经元寻找对应的输出神经元,办法是通过寻找输入矢量和权矢量的最佳匹配来确定一个获胜神经元,这个获胜神经元与输入的样本具有最近的欧氏距离,即若c为第P个样本的获胜单元,则有:nXp-Wc¨<Ilxp.'wjlI,VjCm,j≠c
图3SOM网络结构图4还款行为的客户分布图
为了使接近获胜神经元的其他神经元的权值向获胜神经元靠近,而使远离获胜神经元的那些神经元的权值远离获胜神经元,从而在输出层能够将特征进行聚集,以便于在输出层的二维阵列中相互靠近的位置可以找到类似的特征,需要在输出层中引入侧反馈。侧反馈是在输出层建立的反馈连接,反馈的大小和类型(兴奋或抑制)用侧向权值表示,侧向权值是输出层阵列内神经元之间几何距离的一个函数,它决定了哪种侧向连接将产生预期的结果。
3.2基于SOM的客户l疆M分类模型
在本文中建立的行为评分模型是基于一个二维的SOM网络结构有4x4的矩阵的神经元组织。每个神经元通过在学习中不断调整的权值和输入向量相联系。SOM的第一个阶段是模糊估计阶段,抓取总体的数据模式。第二个阶段是调整过程,调整映射模型的数据特征。在学习的过程中,当一个模式作为输入到神经网络时,应用RA和对M作为输入变量计算模式和每个神经元之间的欧式距离。SOM的输入量,按一定标准进行量化,每个特征取值在0.1之间。一旦决定了最相似的神经元,该神经元的临近区域就可以被识别。一个神经元的临近区域是在与相匹配的神经元的在一定欧式距离内的所有神经元。所有临近区域内的神经元都具有和当前的特征值更相近,应用他们进一步进行调整。神经元的权值的调整速率由学习的速率来决定。
信用评分模型除了应用到客户价值,还需要行为评分模型中主要的评分信息、还款行为模式和客户的购买历史。行为评分模型为了抽取不同客户的行为模型试图建立评分的输入和输出分数间的关联。更准确地说,行为评分模型把具有相同行为模式的客户归为同一类。这需要对每个客户进行评分,通过SOM神经网络把客户进行分组,相同价值的客户为同一类。行为评分根据下列公式计算:行为评分=fSOM(predieatorl:
predicator2:….)
本文中,命名了四个评分预测器,应用还款行为和RFM价值把客户分为三种盈利客户群。客户的分数每年更新一次。这里采用C银行的信用卡资料,2003年6月以前的158,126名客户的信用卡帐户信息:另一部分数据集是从2000年1月到2003年6月的客户个人交易记录。
根据信用卡客户的历史的还款行为和砌珊评分模型来预测其中的盈利客户群。对每351
三亿文库包含各类专业文献、专业论文、幼儿教育、小学教育、生活休闲娱乐、文学作品欣赏、应用写作文书、50基于RFM分析的银行信用卡客户的行为评分模型应用自组织映射神经网络SOM和Apriori方法_图文等内容。 
 暂无评价|0人阅读|0次下载|举报文档SOM神经网络_计算机软件及应用_IT/计算机_专业资料。第4章 SOM 自组织特征映射神经网络 生物学研究表明,在人脑的感觉通道上,...  基于RFM分析的银行信用卡... 10页 2下载券 自组织...介绍基于自组织映射神经网络的运动目标行为分析,首先...其中运动目标的行为表示和行为模型酌建 立是行为监控...  基于自组织映射 SOM(Self-Organizing Feature Map)神经网络算法用于解决 多机器人系统任务分配问题,其侧重解决静态或动态环境下存在大量机器人和目 标的情况。由于算法...  基于SOM自组织神经网络在状态归类问题中的应用_信息与通信_工程科技_专业资料。基于...下图就是最普遍的自组织特征映射二维网格模型。 二维SOM网格模型 SOM网络的一个...  TSPsom() %TSP 问题,使用自组织特征映射神经网络 SOFM 解决 %把经纬度转换成了直角坐标后进行计算 city_name=str2mat('哈尔滨' ,'长春', '...

我要回帖

更多关于 哽咽落泪的演唱现场 的文章

 

随机推荐