华为畅享6s为什么下架5s和6scpu哪个号

java识别验证码-用tess4j实现超简单调用tessreact-orc来破解验证码
java识别验证码-用tess4j实现超简单调用tessreact-orc来破解验证码
直接上操作,
因为tess4j依赖jna,而新版的tess4j和默认的com.sun.jna 3.0.6版本不兼容,它需要先加入这个jna的依赖:
&dependency&
&groupId&net.java.dev.jna&/groupId&
&artifactId&jna&/artifactId&
&version&4.2.1&/version&
&/dependency&
然后加入tess4j的依赖(exclude掉默认的jna):
&dependency&
&groupId&net.sourceforge.tess4j&/groupId&
&artifactId&tess4j&/artifactId&
&version&2.0.1&/version&
&exclusions&
&exclusion&
&groupId&com.sun.jna&/groupId&
&artifactId&jna&/artifactId&
&/exclusion&
&/exclusions&
&/dependency&
依赖库就只有这些,不需要加入tessreact-ocr,因为新版tess4j的jar包里面自带了(几十兆)
然后把tessreact项目里面的tessdata文件夹提取出来放在某个位置:/tesseract-ocr/tesseract
没完,还要加入验证码识别的相关语言包,姑且叫做训练文件,在这里下载:/tesseract-ocr/tessdata
假如你想识别一般的英文数字验证码,就下 eng.traineddata,然后放到tessdata文件夹下,比如:C:\tessdata
最后找一张图片验证码来测试,测试代码:
public void test() {
File imageFile = new File(&D:/validcode.jpg&);
Tesseract tessreact = new Tesseract();
tessreact.setDatapath(&C:/tessdata&);
String result = tessreact.doOCR(imageFile);
System.out.println(result);
} catch (TesseractException e) {
System.err.println(e.getMessage());
我的热门文章
即使是一小步也想与你分享java实现验证码类生成中文验证码
字体:[ ] 类型:转载 时间:
java实现的汉字输入验证码,主要包含两个类,一个是生成验证码,一个是判断验证码输入是否正确,实现原理非常简单,将汉字和干扰线生成图片并将汉字保存到session,前台获取每次生成验证码图片并用文本框值和session值比较,功能就怎么简单
代码如下:package xwcms.net.import java.awt.Cimport java.awt.Fimport java.awt.Gimport java.awt.Graphics2D;import java.awt.image.BufferedIimport java.io.IOEimport java.util.Rimport javax.imageio.ImageIO;import javax.servlet.ServletEimport javax.servlet.http.HttpSimport javax.servlet.http.HttpServletRimport javax.servlet.http.HttpServletR/**&* 生成随机汉字&* &* @author xw素材网提供&* &*/public class DrawImage extends HttpServlet {&&& public static final int WIDTH = 120;&&& public static final int HEIGHT = 30;&&& public void doGet(HttpServletRequest request, HttpServletResponse response)&&&&&&&&&&& throws ServletException, IOException {&&&&&&& this.doPost(request, response);&&& }&&& public void doPost(HttpServletRequest request, HttpServletResponse response)&&&&&&&&&&& throws ServletException, IOException {&&&&&&& request.setCharacterEncoding("utf-8");&&&&&&& response.setContentType("text/charset=utf-8");&&&&&&& // 创建缓存&&&&&&& BufferedImage bi = new BufferedImage(WIDTH, HEIGHT,&&&&&&&&&&&&&&& BufferedImage.TYPE_INT_RGB);&&&&&&& // 获得画布&&&&&&& Graphics g = bi.getGraphics();&&&&&&& // 设置背影色&&&&&&& setBackGround(g);&&&&&&& // 设置边框&&&&&&& setBorder(g);&&&&&&& // 画干扰线&&&&&&& drawRandomLine(g);&&&&&&& // 写随机数&&&&&&& String random = drawRandomNum((Graphics2D) g);&&&&&&& // 将随机汉字存在session中&&&&&&& request.getSession().setAttribute("checkcode", random);&&&&&&& // 将图形写给浏览器&&&&&&& response.setContentType("image/jpeg");&&&&&&& // 发头控制浏览器不要缓存&&&&&&& response.setDateHeader("expries", -1);&&&&&&& response.setHeader("Cache-Control", "no-cache");&&&&&&& response.setHeader("Pragma", "no-cache");&&&&&&& // 将图片写给浏览器&&&&&&& ImageIO.write(bi, "jpg", response.getOutputStream());&&& }&&& /**&&&& * 设置背景色&&&& * &&&& * @param g&&&& */&&& private void setBackGround(Graphics g) {&&&&&&& // 设置颜色&&&&&&& g.setColor(Color.WHITE);&&&&&&& // 填充区域&&&&&&& g.fillRect(0, 0, WIDTH, HEIGHT);&&& }&&& /**&&&& * 设置边框&&&& * &&&& * @param g&&&& */&&& private void setBorder(Graphics g) {&&&&&&& // 设置边框颜色&&&&&&& g.setColor(Color.BLUE);&&&&&&& // 边框区域&&&&&&& g.drawRect(1, 1, WIDTH - 2, HEIGHT - 2);&&& }&&& /**&&&& * 画随机线条&&&& * &&&& * @param g&&&& */&&& private void drawRandomLine(Graphics g) {&&&&&&& // 设置颜色&&&&&&& g.setColor(Color.GREEN);&&&&&&& // 设置线条个数并画线&&&&&&& for (int i = 0; i & 5; i++) {&&&&&&&&&&& int x1 = new Random().nextInt(WIDTH);&&&&&&&&&&& int y1 = new Random().nextInt(HEIGHT);&&&&&&&&&&& int x2 = new Random().nextInt(WIDTH);&&&&&&&&&&& int y2 = new Random().nextInt(HEIGHT);&&&&&&&&&&& g.drawLine(x1, y1, x2, y2);&&&&&&& }&&& }&&& /**&&&& * 画随机汉字&&&& * &&&& * @param g&&&& * @return&&&& */&&& private String drawRandomNum(Graphics2D g) {&&&&&&& StringBuffer sb = new StringBuffer();&&&&&&& // 设置颜色&&&&&&& g.setColor(Color.RED);&&&&&&& // 设置字体&&&&&&& g.setFont(new Font("宋体", Font.BOLD, 20));&&&&&&& // 准备常用汉字集&&&&&&& String base = "\u\u4e86\u662f\ud\u5728\u4eba\u4eec\u\u4ed6\u8fd9\u4e0a\ua\u\u5927\u91cc\u8bf4\u5c31\u53bb\u5b50\u5f97\u4e5f\u548c\u90a3\ub\u770b\u\u8fc7\u51fa\u5c0f\u4e48\u8d77\u4f60\u90fd\u628a\u597d\u8fd8\u591a\u6ca1\u4e3a\u53c8\u53ef\u5bb6\u5b66\u53ea\u4ee5\u4e3b\u4f1a\u\u60f3\u751f\u540c\ud\u5341\u4ece\u81ea\ud\u\u5b83\u540e\u\u5f88\u50cf\u89c1\u4e24\u\u56fd\u52a8\u8fdb\u6210\u56de\u4ec0\u8fb9\u4f5c\u5bf9\u5f00\u800c\u5df1\u4e9b\u73b0\u5c71\u6c11\u5019\u7ecf\u53d1\u5de5\ub\u547d\u7ed9\u957f\u6c34\u51e0\u4e49\u4e09\u58f0\u4e8e\u9ad8\u624b\u77e5\uc\u5fd7\u70b9\u5fc3\uc\u95ee\u4f46\u8eab\u65b9\u5b9e\ua\u53eb\u5f53\u4f4f\u542c\u\uf\ud\u56db\u5df2\uc\u4e4b\u\u4ea7\u60c5\u8def\ub\ud\u8bdd\u4e1c\u5e2d\u6b21\u4eb2\u5982\u88ab\u82b1\u53e3\u653e\u513f\u5e38\u6c14\u4e94\u7b2c\u4f7f\ub\u\u8fd0\u518d\u679c\u600e\u5b9a\u8bb8\u5feb\u660e\u884c\u56e0\u522b\u98de\u\ub\u90e8\u95e8\u65e0\u5f80\ub\u65b0\u5e26\u961f\ub\u5b8c\u\u4ee3\ua\u66f4\u4e5d\u60a8\u6bcf\u98ce\u7ea7\u8ddf\u7b11\u554a\u5b69\u4e07\u5c11\u76f4\u610f\u591c\u6bd4\u9636\u8fde\u8f66\u91cd\u4fbf\uc\u54ea\ua\u\u793e\u4f3c\u58eb\u\u77f3\u6ee1\u65e5\u51b3\u767e\u539f\u62ff\u7fa4\u7a76\ud\u672c\u601d\u89e3\u7acb\u6cb3\ub\u96be\u65e9\u8bba\u\u\u76f8\u7814\u4eca\u\u\u5e94\u\u89c9\u6b65\u53cd\u\u5c06\ue\u4e89\u\u5e08\u7ed3\u\u8c01\ua\u5b57\u52a0\u811a\u7d27\u\u4e60\u\u\u534a\u706b\u6cd5\u9898\u5efa\u8d76\u4f4d\u\u4e03\u5973\u4efb\u4ef6\u611f\u51c6\u5f20\u56e2\u5c4b\u79bb\u\u\ub\u\u521a\u4e14\u\uf\u5bfc\u665a\uf\u\u54cd\u96ea\u6d41\u672a\u573a\u8be5\u5e76\u5e95\u6df1\u523b\u5e73\u4f1f\u5fd9\u63d0\u786e\u8fd1\u4eae\u8f7b\u8bb2\u519c\u53e4\u9ed1\u544a\u754c\u62c9\u540d\uf\u6e05\u\u529e\u53f2\u\u8f6c\u753b\u\u6b64\u6cbb\u\u670d\u96e8\u7a7f\u\u9a8c\u4f20\u4e1a\u83dc\u722c\u\u5f62\u91cf\u54b1\u89c2\u82e6\u4f53\u4f17\u901a\u51b2\u\u53cb\u5ea6\u672f\u996d\u516c\u65c1\u623f\u\u67aa\u8bfb\u6c99\u5c81\u7ebf\u91ce\u575a\u7a7a\u\u81f3\u653f\u57ce\u52b3\u843d\u94b1\u\u5f1f\u80dc\u6559\u70ed\u5c55\uc\u7c7b\u6e10\u5f3a\u\u547c\u\u7b54\u54e5\u\u795e\u5ea7\u7ae0\u5e2e\u\u7cfb\u4ee4\u8df3\u975e\u4f55\u725b\u53d6\u\u\u5ffd\u79cd\u88c5\u\uc\u606f\u53e5\u533a\uc\u62a5\u53f6\u538b\u\u80cc\u7ec6";&&&&&&& int x = 5;&&&&&&& // 控制字数&&&&&&& for (int i = 0; i & 4; i++) {&&&&&&&&&&& // 设置字体旋转角度&&&&&&&&&&& int degree = new Random().nextInt() % 30;&&&&&&&&&&& // 截取汉字&&&&&&&&&&& String ch = base.charAt(new Random().nextInt(base.length())) + "";&&&&&&&&&&& sb.append(ch);&&&&&&&&&&& // 正向角度&&&&&&&&&&& g.rotate(degree * Math.PI / 180, x, 20);&&&&&&&&&&& g.drawString(ch, x, 20);&&&&&&&&&&& // 反向角度&&&&&&&&&&& g.rotate(-degree * Math.PI / 180, x, 20);&&&&&&&&&&& x += 30;&&&&&&& }&&&&&&& return sb.toString();&&& }}
您可能感兴趣的文章:
大家感兴趣的内容
12345678910
最近更新的内容
常用在线小工具常见验证码的弱点与验证码识别 | WooYun知识库
我的图书馆
常见验证码的弱点与验证码识别 | WooYun知识库
0x00 简介  验证码作为一种辅助安全手段在Web安全中有着特殊的地位,验证码安全和web应用中的众多漏洞相比似乎微不足道,但是千里之堤毁于蚁穴,有些时候如果能绕过验证码,则可以把手动变为自动,对于Web安全检测有很大的帮助。  全自动区分计算机和人类的图灵测试(英语:Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA),俗称验证码,是一种区分用户是计算机和人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。(from&wikipedia)  大部分验证码的设计者都不知道为什么要用到验证码,或者对于如何检验验证码的强度没有任何概念。大多数验证码在实现的时候只是把文字印到背景稍微复杂点的图片上就完事了,程序员没有从根本上了解验证码的设计理念。  验证码的形式多种多样,先介绍最简单的纯文本验证码。  纯文本验证码  纯文本,输出具有固定格式,数量有限,例如:  ·1 1=?·本论坛的域名是?·今天是星期几?·复杂点的数学运算  这种验证码并不符合验证码的定义,因为只有自动生成的问题才能用做验证码,这种文字验证码都是从题库里选择出来的,数量有限。破解方式也很简单,多刷新几次,建立题库和对应的答案,用正则从网页里抓取问题,寻找匹配的答案后破解。也有些用随机生成的数学公式,比如 随机数 [ -*/]随机运算符 随机数=?,小学生水平的程序员也可以搞定……  这种验证码也不是一无是处,对于很多见到表单就来一发的spam bot来说,实在没必要单独为了一个网站下那么大功夫。对于铁了心要在你的网站大量灌水的人,这种验证码和没有一样。  下面讲的是验证码中的重点,图形验证码。  图形验证码  先来说一下基础:  识别图形验证码可以说是计算机科学里的一项重要课题,涉及到计算机图形学,机器学习,机器视觉,人工智能等等高深领域……  简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。计算机涉及到的几何图形处理一般有 2维到n维图形处理,边界区分,面积计算,体积计算,扭曲变形校正。对于颜色则有色彩空间的计算与转换,图形上色,阴影,色差处理等等。  在破解验证码中需要用到的知识一般是 像素,线,面等基本2维图形元素的处理和色差分析。常见工具为:  ·支持向量机(SVM)·OpenCV·图像处理软件(Photoshop,Gimp…)·Python Image Library  支持向量机SVM是一个机器学习领域里常用到的分类器,可以对图形进行边界区分,不过需要的背景知识太高深。  OpenCV是一个很常用的计算机图像处理和机器视觉库,一般用于人脸识别,跟踪移动物体等等,对这方面有兴趣的可以研究一下  PS,GIMP就不说了,说多了都是泪啊……  Python Image Library是pyhon里面带的一个图形处理库,功能比较强大,是我们的首选。  SVM图像边界区分  SVM原理,把数据映射到高维空间,然后寻找能够分割的超平面  识别验证码需要充分利用图片中的信息,才能把验证码的文字和背景部分分离,一张典型的jpeg图片,每个像素都可以放在一个5维的空间里,这5个维度分别是,X,Y,R,G,B,也就是像素的坐标和颜色,在计算机图形学中,有很多种色彩空间,最常用的比如RGB,印刷用的CYMK,还有比较少见的HSL或者HSV,每种色彩空间的维度都不一样,但是可以通过公式互相转换。  RGB色彩空间构成的立方体,每个维度代表一种颜色  HSL(色相饱和度)色彩空间构成的锥体,可以参考:    了解到色彩空间的原理,就可以用在该空间适用的公式来进行像素的色差判断,比如RGB空间里判断两个点的色差可以用3维空间中两坐标求距离的公式:  distance=sqrt[(r1-r2)^2 (g1-g2)^2 (b1-b2)^2]  更加直观的图片,大家感受一下:  随便把一张图片的每个像素都映射到RGB色彩空间里就能获得一个这样的立方体。  通过对像素颜色进行统计和区分,可以获得图片的颜色分布,在验证码中,一般来说使用近似颜色最多的像素都是背景,最少的一般为干扰点,干扰线和需要识别文字本身。  对于在RGB空间中不好区分颜色,可以把色彩空间转换为HSV或HSL:  0x01 验证码识别的原理和过程  第一步:& & 二值化  所谓二值化就是把不需要的信息通通去除,比如背景,干扰线,干扰像素等等,只剩下需要识别的文字,让图片变成2进制点阵。  第二步: 文字分割  为了能识别出字符,需要对要识别的文字图图片进行分割,把每个字符作为单独的一个图片看待。  第三步:标准化  对于部分特殊的验证码,需要对分割后的图片进行标准化处理,也就是说尽量把每个相同的字符都变成一样的格式,减少随机的程度  最简单的比如旋转还原,复杂点的比如扭曲还原等等  第四步:识别  这一步可以用很多种方法,最简单的就是模板对比,对每个出现过的字符进行处理后把点阵变成字符串,标明是什么字符后,通过字符串对比来判断相似度。  在文章的后半部分会详细解释每步的各种算法  二值化算法  对于大部分彩色验证码,通过判断色差和像素分布都能准确的把文字和背景分离出来,通过PS等工具把图片打开,用RGB探针对文字和背景图的颜色分别测试,在测试多张图片后,很容易可以发现文字和背景图的RGB差距总是大于一个固定的阈值,即使每次图片的文字和背景颜色都会变化,比如:  新浪和discuz的验证码  通过对文字部分和干扰部分取样可以发现,文字部分的R、G值一般在100左右,B值接近255,但是背景干扰的R、G值则大大高于文字部分,接近200,比较接近文字轮廓部分的像素的RG值也在150以上。通过程序遍历一遍像素就可以完全去掉背景。  Discuz的验证码同理  对于一些和文字颜色相同但是较为分散和单一的干扰像素点,我们可以用判断相邻像素的方法,对于每个点判断该点和相邻8个点的色差,若色差大于某个值,则 1,如果周围有超过6个点的色差都比较大,说明这个点是噪点。对于图像边界的一圈像素,周围没有8个像素,则统统清除,反正文字都在图片的中间位置。  如下图:假如当前像素的坐标是x,y &图形坐标系的原点是图像的左上角  干扰线对于识别验证码增加了一些难度,不过干扰线只有很小的几率会以大角度曲线的方式出现,大部分时间还是小角度直线,去除算法可以参考  对于1个像素粗细的干扰线,在字符为2个像素以上的时候,可以用去噪点算法作为滤镜,多执行几次,就可以完美的把细干扰线去掉。  对于像素数比干扰点稍大的干扰色块,可以采用的算法有:  油漆桶算法(又叫种子填充算法,Floodfill)  种子填充算法可以方便的计算出任意色块的面积,对于没有粘连字符或者粘连但是字符每个颜色不一样的验证码来说,去除干扰色块的效果很好,你只需要大概计算一下最小的和最大的字符平均占多少像素,然后把这段区间之外像素数的色块排除掉即可。  上下左右4个方向填充还有8个方向填充的不同  判断颜色分布:  对于大多数彩色验证码来说,文字基本在图片中心的位置,每个字符本身的颜色是一样的,也就是说对于文字来说,同一种颜色基本都集中在一个固定的区域范围内,通过统计图片中的像素,按近似颜色分组,同时分析每个颜色组在图片中的分布范围,假如说有一种颜色大部分像素都在图片边缘,那么这个颜色肯定不属于要识别的字符,可以去掉。  对于干扰线,并没有一种十分有效的方式能完全去除并且不影响到文字,不过如果能够成功分割字符的话,少量干扰线对于识别率影响不大。  字符分割算法  破解验证码的重点和难点就在于能否成功分割字符,这一点也是机器视觉里的一道难题,对物件的识别能力。对于颜色相同又完全粘连的字符,比如google的验证码,目前是没法做到5%以上的识别率的。不过google的验证码基本上人类也只有30%的识别率  对于字符之间完全没有粘连的验证码,比如这个-&_-&  分割起来是非常的容易,用最基本的扫描线法就可以分割,比如从最左侧开始从上到下(y=0---|||||y=n)扫描,如果没有遇到任何文字的像素,就则往右一个像素然后再扫描,如果遇到有文字像素存在,就记录当前横坐标,继续向右扫,突然没有文字像素的时候,就说明到了两个字符直接的空白部分,重复这个步骤再横向扫描就能找到每个字符最边缘4个像素的位置,然后可以用PIL内建的crop功能把单独的字符抠出来。  对于有少许粘连但是只是在字符边角的地方重叠几个像素的验证码,可以用垂直像素直方图的统计方法分割。如下图:  图上半部分是垂直像素直方图的一种直观展示,假如图片宽度为100像素,则把图片切割为100个1像素的竖线,下面的红色部分为当前x坐标上所有黑色像素的总和。这么一来可以很容易的通过直方图的波峰波谷把4个字母分割开。图片的下半部分是扫描线分隔法,因为干扰线和字符旋转的存在,只有M和5直接才出现了连续的空白部分。  除了垂直像素直方图,还可以从不同的角度进行斜线方向的像素数投影,这种方式对于每次全体字符都随机向一个角度旋转的验证码效果很好。对于每次字符大小和数量都一样的验证码还可以用平均分割法,也就是直接先把中间的文字部分整体切出来,然后按宽度平均分成几份,这种方式对字符粘连比较多用其他方式不好分割的验证码很有用,之前的megaupload的3位字母验证码就是通过这种方式成功分割的。  另外对于彩色的验证码,还可以用颜色分割,比如12306的:  12306的验证码,每个字符颜色都不一样,真是省事啊。  作为验证码识别里的难点,分割字符还有很多种算法,包括笔画分析曲线角度分析等等,不过即便如此,对粘连的比较厉害的字符还是很难成功的。  标准化  标准化的意思是指对于同一个字符,尽可能让每次识别前的样本都一致,以提高识别率。而验证码设计者则会用随机旋转,随机扭曲还有随机字体大小的方式防止字符被简单方法识别。  还原随机旋转的字符一般采用的是旋转卡壳算法:  此算法非常简单,对一张图片左右各旋转30度的范围,每次1度,旋转后用扫描线法判断字符的宽度,对于标准的长方形字体,在完全垂直的时候肯定是宽度最窄的。嗯?纳尼?上面的图是中间的最窄?好像的确是这样,不过只要每次旋转后的结果都一样,对于识别率不会有影响。  扭曲还原的算法比较蛋疼,效果也不怎么样(其实我不会),不过如果识别算法好的话,对扭曲的字符只要人能认出来,识别率也可以达到接近人类的水准。  还有一些常用到的算法,对于提高识别率和减少样本数量有一定帮助:  骨架细化:腐蚀算法  腐蚀算法的原理有点像剥洋葱,从最外层沿着最外面的一层像素一圈一圈的去掉,直到里面只剩下一层像素为止。腐蚀算法里面需要用到另一个算法,叫做凸包算法,用来找一堆像素点里面最外围的一层。  最后就是把字符变成统一大小,一般而言是把全部字符都缩到和验证码里出现过的最小的字符一个大小。  详情请自行google……  分割算法差不多就到这里了,都是一些比较基础的内容。下面是最终的识别。  0x02 识别  其实到了这一步,单独的字符已经分离出来了,可以训练tesseract ocr来识别了,样本数量多的话,识别率也是很高的。不过在这里还是要讲一下,如何自己来实现识别过程。  第一步,样本现在应该已经是一个矩阵的形式了,有像素的地方是1,背景是0,先肉眼识别一下,然后把这个矩阵转换为字符串,建立一个键值对,标明这串字符串是什么字符。之后就只需要多搜集几个同样字符的不同字符串变形,这就是制作模板的过程,。  搜集了足够多的模板后,就可以开始识别了,最简单的方法:汉明距离,但是如果字符有少许扭曲的话,识别率会低的离谱。对比近似字符串用的最多一般是 编辑距离算法(Levenshtein Distance),具体请自己google。  两种算法的差别在于,对同样两个字符串对比101010,汉明距离是6,但是编辑距离是2。  最后一种最NB的识别算法,就是神经网络,神经网络是一种模拟动物神经元工作模式的算法,神经网络有多种不同的结构,但是基本架构分为输入层,隐含层和输出层,输入和输出均为二进制。  对于验证码识别来说,输入和输出节点不宜过多,因为多了很慢……所以如果样本矩阵为20x20 400个像素的话,需要对应的也要有400个输入节点,因此我们需要对整个矩阵提取特征值,比如先横向每两个数字XOR一下,然后再竖向每两个数字XOR。  Python有很多封装好的神经网络库,你所需要的只是把特征值输入神经网络,再告诉他你给他的是什么(字符),这样多喂几次之后,也就是训练的过程,随着训练的进行,神经网络的内部结构会改变,逐渐向正确的答案靠拢。神经网络的优势是,对于扭曲的字符识别成功率非常高。另外神经网络在信息安全中还可以起到很多其他作用,比如识别恶意代码等等。  动画验证码  有些不甘寂寞的程序员又玩出了些新花样,比如各种GIF甚至flv格式的动画验证码,下面我来分析一下腾讯安全中心的GIF验证码。  晃来晃去的看似很难,放慢100倍一帧一帧再看看?  基本上每帧都有一个字符和其他的分开,用最简单的扫描法就能分割出来。  剩下的就很轻松了,旋转还原之后,先填充内部空白,缩小细化之后做成模板对比,识别率怎么也得有90%了。  原本一张图就能搞定的事情,偏偏给了我们8张图,而且每张图还有一点区别,平白无故增大了很多信息量。  另外就是一些所谓的高用户体验的验证码,比如freebuf的:  拖动解锁按钮会触发执行一段js,生成一串随机字符串,ajax给后端程序判断。  破解方式就当留给大家的思考题了,假如我想刷评论的话,怎么办。  还有就是声音验证码的识别,现在很多验证码为了提高用户体验和照顾视觉障碍的用户,都有声音验证码,一般来说是机器生成一段读数字的语音。但是在这方面上很多程序员都偷懒了,预先找了10个数字的声音录音,然后生成的时候把他们随机拼到一起,结果就是这样:  前3秒为语音提示,后面的是数字,有没有发现什么?  声音也是可以做成模板的哦  最后就是应该怎么样去设计验证码  ·整体效果·字符数量一定范围内随机·字体大小一定范围内随机·波浪扭曲(角度方向一定范围内随机)·防识别·不要过度依赖防识别技术·不要使用过多字符集-用户体验差·防分割 ·重叠粘连比干扰线效果好·备用计划·同样强度完全不同的一套验证码附件添加一个破解验证码的实例包括程序大家自行研究吧:
TA的最新馆藏Java识别验证码
java验证码识别--1
java验证码识别--2
java验证码识别--3
java验证码识别--4
java验证码识别--5
验证码识别基本分四步,图片预处理,分割,训练,识别
1。图像的预处理
这种直接根据亮度设个阈值处理就可以了(如图中两种颜色,一种背景色,一种字体色,把区别色即阈值设为100)
这个验证码居然是固定位置的,分割相当简单,直接截取相应位置就可以了
直接拿几张图片,包含0-9,每个数字一个样本就可以了,将文件名对应相应的数字
因为是固定大小,固定位置,识别也很简单。
直接拿分割的图片跟这个十个图片一个像素一个像素的比,相同的点最多的就是结果。比如如果跟5.jpg最相似,那么识别的结果就是5。
下面是识别结果,很容易达到100%
完整代码:
import&java.awt.C&&
import&java.awt.image.BufferedI&&
import&java.io.F&&
import&java.io.FileOutputS&&
import&java.io.InputS&&
import&java.io.OutputS&&
import&java.util.ArrayL&&
import&java.util.HashM&&
import&java.util.L&&
import&java.util.M&&
import&javax.imageio.ImageIO;&&
import&mons.httpclient.HttpC&&
import&mons.httpclient.HttpS&&
import&mons.httpclient.methods.GetM&&
import&mons.io.IOU&&
public&class&ImagePreProcess&{&&
&&&&public&static&int&isWhite(int&colorInt)&{&&
//100为阈值,即背景色跟字体颜色的分隔值,
&&&&&&&&Color&color&=&new&Color(colorInt);&&
&&&&&&&&if&(color.getRed()&+&color.getGreen()&+&color.getBlue()&&&100)&{&&
&&&&&&&&&&&&return&1;&
//为背景颜色时返回1,非背景颜色时返回0
&&&&&&&&}&&
&&&&&&&&return&0;&&
&&&&public&static&int&isBlack(int&colorInt)&{&
&&&&&&&&Color&color&=&new&Color(colorInt);&&
&&&&&&&&if&(color.getRed()&+&color.getGreen()&+&color.getBlue()&&=&100)&{&&
&&&&&&&&&&&&return&1;&&
&&&&&&&&}&&
&&&&&&&&return&0;&&
&&&&public&static&BufferedImage&removeBackgroud(String&picFile)&&
&&&&&&&&&&&&throws&Exception&{&&
&&&&&&&&BufferedImage&img&=&ImageIO.read(new&File(picFile));&&
&&&&&&&&int&width&=&img.getWidth();&&
&&&&&&&&int&height&=&img.getHeight();&&
&&&&&&&&for&(int&x&=&0;&x&&&&++x)&{&&
&&&&&&&&&&&&for&(int&y&=&0;&y&&&&++y)&{&&
&&&&&&&&&&&&&&&&if&(isWhite(img.getRGB(x,&y))&==&1)&{&&
&&&&&&&&&&&&&&&&&&&&img.setRGB(x,&y,&Color.WHITE.getRGB());&&
&&&&&&&&&&&&&&&&}&else&{&&
&&&&&&&&&&&&&&&&&&&&img.setRGB(x,&y,&Color.BLACK.getRGB());&&
&&&&&&&&&&&&&&&&}&&
&&&&&&&&&&&&}&&
&&&&&&&&}&&
&&&&&&&&return&&&
&&&&public&static&List&splitImage(BufferedImage&img)&&
&&&&&&&&&&&&throws&Exception&{&
//分隔图片
&&&&&&&&List&subImgs&=&new&ArrayList();&&
&&&&&&&&subImgs.add(img.getSubimage(10,&6,&8,&10));&&
&&&&&&&&subImgs.add(img.getSubimage(19,&6,&8,&10));&&
&&&&&&&&subImgs.add(img.getSubimage(28,&6,&8,&10));&&
&&&&&&&&subImgs.add(img.getSubimage(37,&6,&8,&10));&&
&&&&&&&&return&subI&&
&&&&public&static&Map&loadTrainData()&throws&Exception&{&
//用来验证的图片存到Map中,供后面比对调用
&&&&&&&&Map&map&=&new&HashMap();&&
&&&&&&&&File&dir&=&new&File("train");&&
&&&&&&&&File[]&files&=&dir.listFiles();&&
&&&&&&&&for&(File&file&:&files)&{&&
&&&&&&&&&&&&map.put(ImageIO.read(file),&file.getName().charAt(0)&+&"");&&
&&&&&&&&}&&
&&&&&&&&return&&&
&&&&public&static&String&getSingleCharOcr(BufferedImage&img,&&
&&&&&&&&&&&&Map&map)&{&&
&&&&&&&&String&result&=&"";&&
&&&&&&&&int&width&=&img.getWidth();&&
&&&&&&&&int&height&=&img.getHeight();&&
&&&&&&&&int&min&=&width&*&&
//图片的面积
&&&&&&&&for&(BufferedImage&bi&:&map.keySet())&{&&
&&&&&&&&&&&&int&count&=&0;&&
&&&&&&&&&&&&Label1:&for&(int&x&=&0;&x&&&&++x)&{&&
&&&&&&&&&&&&&&&&for&(int&y&=&0;&y&&&&++y)&{&&
&&&&&&&&&&&&&&&&&&&&if&(isWhite(img.getRGB(x,&y))&!=&isWhite(bi.getRGB(x,&y)))&{&&
&&&&&&&&&&&&&&&&&&&&&&&&count++;&
//当不是背景色的时间count值加1
&&&&&&&&&&&&&&&&&&&&&&&&if&(count&&=&min)
//一般count不会大于图片的面积,特殊情况下就中断处理
&&&&&&&&&&&&&&&&&&&&&&&&&&&&break&Label1;&&
&&&&&&&&&&&&&&&&&&&&}&&
&&&&&&&&&&&&&&&&}&&
&&&&&&&&&&&&}&&
&&&&&&&&&&&&if&(count&&&min)&{&
//正常情况下,当得到的图片面积比图片面积小,或者比上一次得到的图片面积小时,用得到的面积替代图片的面积,这样当所有的用来验证的图片都遍历一遍后就能得到最接近现在图片的验证图片,
&&&&&&&&&&&&&&&&min&=&&&
&&&&&&&&&&&&&&&&result&=&map.get(bi);&
//得到最接近现在图片的验证图片的数字
&&&&&&&&&&&&}&&
&&&&&&&&}&&
&&&&&&&&return&&&
&&&&public&static&String&getAllOcr(String&file)&throws&Exception&{&&
&&&&&&&&BufferedImage&img&=&removeBackgroud(file);&
//去除验证码背景色
&&&&&&&&List&listImg&=&splitImage(img);&&
//验证码分隔,如四个数字分隔开
&&&&&&&&Map&map&=&loadTrainData();&
//用来匹配的所有数字图片
&&&&&&&&String&result&=&"";&&
&&&&&&&&for&(BufferedImage&bi&:&listImg)&{&&
&&&&&&&&&&&&result&+=&getSingleCharOcr(bi,&map);&
//得到匹配结果
&&&&&&&&}&&
&&&&&&&&ImageIO.write(img,&"JPG",&new&File("result//"+result+".jpg"));&
//输出匹配结果
&&&&&&&&return&&&
&&&&public&static&void&downloadImage()&{&
//下载验证码
&&&&&&&&HttpClient&httpClient&=&new&HttpClient();&&
&&&&&&&&GetMethod&getMethod&=&new&GetMethod(&&
&&&&&&&&&&&&&&&&"/authimg.php");&&
&&&&&&&&for&(int&i&=&0;&i&&&30;&i++)&{&&
&&&&&&&&&&&&try&{&&
&&&&&&&&&&&&&&&&//&执行getMethod&&
&&&&&&&&&&&&&&&&int&statusCode&=&httpClient.executeMethod(getMethod);&&
&&&&&&&&&&&&&&&&if&(statusCode&!=&HttpStatus.SC_OK)&{&&
&&&&&&&&&&&&&&&&&&&&System.err.println("Method&failed:&"&&
&&&&&&&&&&&&&&&&&&&&&&&&&&&&+&getMethod.getStatusLine());&&
&&&&&&&&&&&&&&&&}&&
&&&&&&&&&&&&&&&&//&读取内容&&
&&&&&&&&&&&&&&&&String&picName&=&"img//"&+&i&+&".jpg";&&
&&&&&&&&&&&&&&&&InputStream&inputStream&=&getMethod.getResponseBodyAsStream();&&
&&&&&&&&&&&&&&&&OutputStream&outStream&=&new&FileOutputStream(picName);&&
&&&&&&&&&&&&&&&&IOUtils.copy(inputStream,&outStream);&&
&&&&&&&&&&&&&&&&outStream.close();&&
&&&&&&&&&&&&&&&&System.out.println("OK!");&&
&&&&&&&&&&&&}&catch&(Exception&e)&{&&
&&&&&&&&&&&&&&&&e.printStackTrace();&&
&&&&&&&&&&&&}&finally&{&&
&&&&&&&&&&&&&&&&//&释放连接&&
&&&&&&&&&&&&&&&&getMethod.releaseConnection();&&
&&&&&&&&&&&&}&&
&&&&&&&&}&&
&&&&public&static&void&main(String[]&args)&throws&Exception&{&&
&&&&&&&&for&(int&i&=&0;&i&&&30;&++i)&{&
//验证给出的30个验证码一
&&&&&&&&&&&&String&text&=&getAllOcr("img//"&+&i&+&".jpg");&&
&&&&&&&&&&&&System.out.println(i&+&".jpg&=&"&+&text);&&
&&&&&&&&}&&
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 华为畅享6s有什么缺点 的文章

 

随机推荐