基于深度学习的图像识别输入是什么格式

基于深度学习的图像识别.ppt
扫描二维码,下载文件到手机
当前文件信息
浏览:656次
保存:74次
下载:419次
您的VIP会员已过期,是否续费?
用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。举报邮箱:
京网文[0号 京ICP证100780号
《提醒》6月30日即将清空免费用户文件
尊敬的用户,很抱歉地通知您,微盘于6月30日停止向免费个人用户提供存储服务。()您的文件处于排队等待删除状态,无法进行操作,将于近期删除完毕。感谢您5年来对微盘的支持,此次调整给您带来的不便我们深表歉意。
补充说明:
1、新浪VIP邮箱用户、微博会员及在会员有效期内可继续使用存储服务,文件依然保留。
2、微盘近期将对不良信息进行集中清理,因此全面暂停分享及站内搜索服务至整改结束。
3、若您有疑问,可将问题及您的微博昵称私信至@微盘 ,或者发邮件至,我们将尽快为您处理。基于深度学习的图像识别进展:百度的若干实践_中华文本库
第1页/共9页
基于深度学习的图像识别进展:百度的若干实践
关键词:深度学习 图像分类 物体检测
都大龙 余轶南 罗 恒 等
2.深度学习不是一个黑箱
概述:深度学习和图像识别
近年来在人工智能领域最受关注的,非深度学习莫属。自2006年吉奥夫雷·辛顿(Geoffery Hinton)等在《科学》(Science)杂
语音搜索、图像识别等领域,涵盖几十项产品。今天,用户在百都被深度学习系统所处理。
人工智能的特征之一是学习的能力,即系统的性能是否会随
系统。它像概率模型一样,提供
模语言(建模框架)。利用这套语言系统,我们可以表达数据内在的丰富关系和结构,比如用卷用递归神经网络(Recurrent Neu-ral Network, RNN)处理自然语言等数据中的时序结构。
3.深度学习几乎是唯一的
度平台上的几乎每个服务请求,一套丰富的、基于联接主义的建
着经验数据的积累而不断提升。积处理图像中的二维空间结构,工智能的发展提供前所未有的机遇。在这个时代背景下,深度学习在包括图像识别等方面所取得的突破性进展并非偶然。
在百度的实践中,我们认识到深度学习主要在以下三个方面具有巨大优势:
1.从统计和计算的角度
志发表那篇著名的论文[1]开始,所以,大数据时代的到来给人深度学习的热潮从学术界席卷到了工业界。2012年6月,《纽约时报》披露“谷歌大脑(Google Brain)”项目,由著名的斯坦福大学机器学习教授吴恩达(Andrew Ng)和大规模计算机系统世界顶级专家杰夫·迪恩(Jeff Dean)共同主导,用1.6万个CPU核的并行计算平台训练深度神经网络(Deep Neural Networks, DNN)的机器学习模型,在语音和图像识别等领域获得巨大成功。
国内方面,2013年1月,百度成立深度学习研究院,公司CEO李彦宏担任院长。短短两年时间,深度学习技术被应用到百
端到端机器学习系统。它直接
作用于原始数据,自动逐层进行特征学习,整个过程直接优化某个目标函数。而传统机器学习往往被分解为几个不连贯的数据预处理步骤,比如人工抽取特征,这些步骤并非一致地优化某个整
让计算机识别和理解图像,是人工智能最重要的目标之一。尤其是在移动互联网时代,智能的世界捕捉下来,图像和视频数据暴增,造就了图像大数据时代。
看,深度学习特别适合处理大
数据。在很多问题上,深度学习
它集中体现了当前机器学习算法的三个大趋势:用较为复杂的模型降低模型偏差(model bias),用用可扩展(scalable)的梯度下降
是目前我们能找到的最好方法。体的目标函数。
大数据提升统计估计的准确度,手机上的摄像头将人们日常看到
度的凤巢广告系统、网页搜索、算法求解大规模优化问题。
第1页/共9页
寻找更多 ""基于深度学习的图像识别算法研究_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
基于深度学习的图像识别算法研究
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩70页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢深度学习在图像识别中的研究及应用--《武汉理工大学》2014年硕士论文
深度学习在图像识别中的研究及应用
【摘要】:对图像进行精确识别,具有非常重要的研究意义,图像识别技术在医药学、航天、军事、工农业等诸多方面发挥着重要的作用。当前图像识别方法大多采用人工提取特征,不仅费时费力,而且提取困难;而深度学习是一种非监督学习,学习过程中可以不知道样本的标签值,整个过程无需人工参与也能提取到好的特征。近年来,将深度学习用于图像识别成为了图像识别领域的研究热点,已取得了良好的效果,并且有广阔的研究空间。
本文基于深度学习在图像识别的相关理论,分析了深度学习的基本模型和方法,并在相关图像数据集上实验论证;另外鉴于深度学习多用于大样本集,本文基于小样本提出了一种改进算法,具体工作内容如下:
(1)分析深度学习中卷积神经网络(Convolutional Neural Networks,CNNs)的基本原理,研究其训练过程和模型结构。其中卷积层通过卷积运算,可以使原信号增强,并且降低噪声,提高信噪比;降采样对卷积层的图像进行子抽样,在保证了有用信息不降低的基础上,减少数据处理量。将其在MNIST手写字体数据集上进行实验,通过对比分析了该方法和其他经典算法在识别率和时间方面的优劣。
(2)针对于卷积神经网络训练时间过长这一缺陷,分析了深度学习中深度信念网络(Deep Belief Networks,DBNs)的基本原理、训练过程和模型结构。DBNs的分层训练机制大大减少了训练难度,减少了训练时间。引入Softmax作为模型的分类器,将其在MNIST手写字体数据集上进行实验,实验表明:深度信念网络在识别率上和卷积神经网络持平,但训练方法的改善使得消耗时间大大减少。此外,该方法在自然场景CIFAR-10库上也有较好的实验效果。
(3)鉴于深度学习多适用于较大的数据集,针对小样本提出了一种改进的深度信念网络结构:深度信念网络整个过程可以分为预训练和参数微调两个阶段,改进的算法在预训练阶段对样本进行降采样;在参数微调阶段引入随机隐退(Dropout),将隐含层的结点随机清零掉一部分,保持其权重不更新。将改进的模型在MNIST子集和ORL数据集上进行实验,实验表明:在小样本中,引入降采样和随机隐退后,深度信念网络在识别率和耗时方面都有不错的改善,过拟合现象得到有效缓解。
【关键词】:
【学位授予单位】:武汉理工大学【学位级别】:硕士【学位授予年份】:2014【分类号】:TP391.41【目录】:
摘要4-5Abstract5-9第1章 绪论9-15 1.1 课题来源9 1.2 课题研究背景及意义9-13 1.3 国内外研究现状13-14 1.4 论文主要内容和组织结构14-15第2章 基于卷积神经网络的图像识别15-30 2.1 传统人工神经网络结构15-17 2.2 卷积神经网络结构17-24
2.2.1 卷积神经网络结构18-19
2.2.2 卷积神经网络的参数减少和权值共享19-21
2.2.3 卷积神经网络的参数更新21-24 2.3 基于卷积神经网络的手写字体识别24-29
2.3.1 MNIST 数据库及手写字体识别一般方法24
2.3.2 基于卷积神经网络的手写字体识别24-26
2.3.3 实验结果和对比26-29 2.4 本章小结29-30第3章 基于深度信念网络的图像识别30-45 3.1 深度网络分层训练的思想30-33
3.1.1 浅层学习和深度学习30-32
3.1.2 深度网络的分层学习思想32-33 3.2 深度信念网络(DBNs)基本原理33-39
3.2.1 受限制玻尔兹曼机模型33-35
3.2.2 受限制玻尔兹曼机(RBM)学习方法35-37
3.2.3 深度信念网络(DBNs)的模型和方法37-39 3.3 基于深度信念网络的图像识别39-44
3.3.1 基于深度信念网络的手写字体识别39-43
3.3.2 基于深度信念网络的自然场景识别43-44 3.4 本章小结44-45第4章 基于小样本的深度信念网络的应用研究45-59 4.1 随机隐退思想及其应用45-50
4.1.1 随机隐退的思想45-47
4.1.2 随机隐退应用于神经网络47-50 4.2 随机隐退和深度学习算法的结合50-53 4.3 基于降采样和随机隐退的深度信念网络53-58
4.3.1 图像降采样54-55
4.3.2 降采样和随机隐退相结合应用于深度信念网络55-58 4.4 小结58-59第5章 总结与展望59-61 5.1 课题总结59-60 5.2 课题展望60-61致谢61-62参考文献62-64
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
许海峰;赵文庆;孙峥;陈更生;;[J];复旦学报(自然科学版);2010年06期
王珏,石纯一;[J];广西师范大学学报(自然科学版);2003年02期
;[J];电子技术与软件工程;2013年07期
翟俊海;赵文秀;王熙照;;[J];河北大学学报(自然科学版);2009年01期
张淑雅;赵一鸣;李均利;;[J];计算机工程与应用;2007年25期
孙权森,曾生根,王平安,夏德深;[J];计算机学报;2005年09期
王秀珍;;[J];内蒙古电大学刊;2008年08期
杨盛春;贾林祥;;[J];徐州建筑职业技术学院学报;2006年03期
王洪升,曾连荪,田蔚风;[J];自动化技术与应用;2004年06期
孔斌;[J];自然杂志;2002年01期
【共引文献】
中国期刊全文数据库
古帅;邱书波;;[J];中华纸业;2010年06期
刘永俊;赵根林;陈才扣;杨静宇;;[J];常熟理工学院学报;2007年10期
苏志勋;刘艳艳;刘秀平;;[J];大连理工大学学报;2009年01期
刘郁,陈耘志,张兵;[J];电脑知识与技术;2005年30期
曹建芳;王鸿斌;;[J];电子商务;2009年12期
张前园;赵文静;杨娜娟;;[J];电子科技;2010年05期
张洁玉;陈强;白小晶;孙权森;夏德深;;[J];电子与信息学报;2009年10期
金炜;俞建定;符冉迪;岑雄鹰;尹曹谦;;[J];光电子.激光;2010年07期
林小玲;;[J];硅谷;2009年08期
谢书娟;;[J];甘肃科技;2010年01期
中国重要会议论文全文数据库
陈恩伟;王勇;陆益民;刘正士;;[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
林正青;彭圆;王磊;牟林;张风珍;王重阳;;[A];中国造船工程学会电子技术学术委员会——2012年水下复杂战场环境目标识别与对抗及仿真技术学术交流论文集[C];2012年
刘超彪;宋鸿陟;司国东;傅熠;;[A];第八届和谐人机环境联合学术会议(HHME2012)论文集CHCI[C];2012年
纪元;桂预风;;[A];第25届全国灰色系统会议论文集[C];2014年
中国博士学位论文全文数据库
杨茂龙;[D];南京理工大学;2011年
李贵奇;[D];中南大学;2011年
董政;[D];电子科技大学;2011年
杨显飞;[D];哈尔滨工程大学;2011年
郭永洪;[D];中国农业大学;2004年
刘静波;[D];吉林大学;2004年
敖丽敏;[D];中国农业大学;2005年
胡良梅;[D];合肥工业大学;2006年
张新荣;[D];吉林大学;2006年
张义荣;[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库
于佳;[D];哈尔滨工程大学;2010年
梁怀志;[D];大连理工大学;2010年
李艳萍;[D];大连理工大学;2010年
李艳;[D];中国海洋大学;2010年
陈艳;[D];中国海洋大学;2010年
徐吟琼;[D];苏州大学;2010年
杨晶;[D];昆明理工大学;2010年
孙敏;[D];山东大学;2010年
杜亮;[D];西安电子科技大学;2009年
曹剑;[D];西安工业大学;2011年
【二级参考文献】
中国期刊全文数据库
刘传才,杨静宇,江志明,孙兴华;[J];机器人;1999年06期
胡钟山,娄震,杨静宇,刘克,孙靖夷;[J];计算机学报;1999年04期
贾林祥;[J];宁波大学学报(教育科学版);2002年06期
林粤彤,王飞跃,肖靖,王知学;[J];自动化学报;2001年04期
郭萌;王珏;;[J];模式识别与人工智能;1998年03期
赵凯;王珏;;[J];模式识别与人工智能;2000年04期
李弼程,郭志刚,文超;[J];模糊系统与数学;2000年04期
中国博士学位论文全文数据库
贾林祥;[D];南京师范大学;2002年
【相似文献】
中国期刊全文数据库
姚士强;[J];机床与液压;2001年06期
;[J];电子科技文摘;2002年05期
;[J];电子科技文摘;2003年12期
霍迎辉,王少卿;[J];计算机与现代化;2004年04期
王丹青;李志俊;;[J];武汉科技大学学报(自然科学版);2005年04期
黄瀚敏;黄席樾;;[J];计算机仿真;2006年06期
谢敬辉;王旦福;张浩;;[J];北京理工大学学报;2007年10期
王丰;;[J];科技信息(学术研究);2008年28期
杨茂龙;孙权森;夏德深;;[J];计算机工程与应用;2008年29期
鲁鹏;鲁秀青;;[J];中国科技信息;2009年15期
中国重要会议论文全文数据库
高晓丁;左贺;高鹏;;[A];佶龙杯第四届全国印花学术研讨会论文集[C];2009年
郭艳;王萍;朱国;;[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
姜洪臣;任晓磊;赵耀宏;徐波;;[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
姜洪臣;任晓磊;赵耀宏;徐波;;[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
刘翠响;孙以材;张艳;于明;;[A];第25届中国控制会议论文集(下册)[C];2006年
林达宜;邱利松;张莎;;[A];2012全国无线及移动通信学术大会论文集(上)[C];2012年
王利强;张红梅;;[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
俞建荣;卜凡亮;李文力;陆晓军;;[A];第三届全国信息获取与处理学术会议论文集[C];2005年
李灵;;[A];2013年江苏省计量测试学会学术会议论文集[C];2013年
于丽颖;;[A];第24届全国煤矿自动化与信息化学术会议暨第6届中国煤矿信息化与自动化高层论坛论文集[C];2014年
中国重要报纸全文数据库
郑晓春;[N];科技日报;2007年
沈晓光?编译;[N];中国电子报;2008年
李红;[N];科技日报;2000年
海言;[N];科技日报;2007年
田梦;[N];计算机世界;2007年
比尔·盖茨;[N];中国电子报;2008年
宋辉;[N];中国企业报;2004年
汤铭;[N];计算机世界;2013年
冯逊;[N];大众科技报;2010年
闫静;[N];经济日报;2014年
中国博士学位论文全文数据库
王宇新;[D];大连理工大学;2012年
陈健美;[D];江苏大学;2008年
冉瑞生;[D];电子科技大学;2006年
李雅梅;[D];重庆大学;2008年
侯书东;[D];南京理工大学;2012年
吴萌;[D];上海交通大学;2014年
谢铉洋;[D];中国科学技术大学;2006年
孙权森;[D];南京理工大学;2006年
翟俊海;[D];河北大学;2010年
胡新宇;[D];武汉理工大学;2011年
中国硕士学位论文全文数据库
于哲;[D];机械科学研究院;2005年
牛一帆;[D];西安理工大学;2007年
陈正军;[D];景德镇陶瓷学院;2007年
陈丹;[D];西南交通大学;2013年
时文;[D];武汉理工大学;2005年
于跃;[D];山东大学;2013年
余振庭;[D];浙江大学;2008年
杨耿;[D];江苏大学;2005年
孙晓霞;[D];哈尔滨工程大学;2006年
李迎斌;[D];东北师范大学;2008年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 大众知识服务
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号深度学习(1)
表情识别(1)
第一篇博客就不用Markdown(什么鬼)来写了。
今天主要是被老板一通说,然后说两月看10篇paper,算了,还是丫丫自己先多码码论文吧。再加之这几天有开博的想法,就索性一起开了,顺道总结下最近看的一篇中文的&
主要是找了 浙理工的施徐敢的毕设论文和他的一篇《融合深度信念网络和多层感知器的人脸表情识别》,再结合DL_toolbox里的DBN实例做个总结。再有其他什么想法再陆陆续续发哈。(轻喷。。。)
DBN(深度信念网络)的关键部分都是RBM(受限玻尔兹曼机)(Restricted Boltzmann Machines, RBM)的步骤,所以先放一张rbm的结构,帮助理解(网上找的图)。
V是可视层,h是隐藏层。b,c是相应的偏置单元(或者是b,a)。其对RBM的训练过程为如下:
其中某些公式的推导可参考
http://blog.csdn.net/hanzihan123/article/details/
伪代码如下
当RBM训练好后,对其叠加便构成DBN了。即DBN是一种深度学习结构,它是由多个受限玻尔兹曼机(RBM)叠加而成.
DBNs 的工作原理是:低层的输出作
为下一层的输入,下一层的输出再作为更高一层的输入,以此传递,通过微调参数和权重偏置来增强 DBNs 的抽取性能,结构如下图 所示
但DBN只能用来训练学习,是一种无监督学习模式,而无法单纯用来分类识别,故这里可结合多层感知器(MLP,Multilayer Perceptron)来进行识别。
MLP&&神经网络模型:
多层感知器是一种前馈人工神经网络模型,其把输入层的多个数据集映射到唯一的输
出层的数据集上。多层感知器的神经网络模型是由很多层神经元模型组成的,而每个节点都是一个独立的神经元模型。
深度信念网络与多层感知器的融合的方法包括DBN的学习,MLP 初始化和人脸表情识别。深度信念网络的特征学习,包括模型中的预训练和微调,对提取的原始人脸表情图像的初级特征(原始像素特征)
进行学习,得到更高层次的抽象特征。由于 DBNs 实际上是一种含有多层隐藏层的深度学
习神经网络,提取得到的更高层次的抽象特征可以用在每一个 DBNs 的隐藏层中。在这项
工作中,DBNs 的最高隐藏层学习得到的抽象特征用来初始化传统的多层感知器(MLP)
模型中的隐层网络权重值。被初始化的 MLP 模型具有和 DNBS 模型相同的参数,比如隐
藏层的数目,每个隐藏层上的节点数,以及每个隐藏层的权重。最后,我们使用初始化的
MLP 作为分类器来进行人脸表情识别。
这里主要是讲用于分类识别的MLP将用于学习的DBN结合一起,关键是将DBN得到的&参数应用于多层感知器的初始化,即指建立一个在隐层层数、 隐层节点数、 以及每一层隐层的网络权重值三个
方面上, 与训练好之后的深度信念网络完全一样的多层感知器模型. 这个就是其创新点所在。
& & & 所以,往后可以思考:
(1)是否可用CNN替换DBN
(2)是否可用其他分类法来于DL结合。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:292次
排名:千里之外

我要回帖

 

随机推荐