厦门图睿信息的超强ocr识别软件可以安装在手机上吗?

OCR识别的真面目
随便在百度百科或其他百科中很容易我们就可以找到关于OCR的定义了。所谓的OCR的是英文——Optical
Character Recognition的缩写,中文翻译是光学字符识别,行业内又称为OCR识别、字符识别。
作为一名非专业的OCR使用者,这样的解释似乎很难让人理解。让我们来一层层的揭开OCR的神秘面纱。
通俗说来,OCR就是把通过拍照或扫描的方式取得的图片上的文字,通过图像处理、图像分析和图像理解的方式,翻译成可编辑的文本文字。
这实际上是一个逆过程。
很多人都习惯于使用纸质的文本文档。所以,才会把文本通过打印机等外部设备将我们的合同、稿件、书本等转化成物质材料。随着企业ERP进程的推进以及人们对于电子阅读习惯的养成。纸质文本的电子归档变得尤为重要。这也是OCR在近几年得到不断发展的重要原因。
回过头来继续在技术层面上谈谈我们的OCR识别,它是怎么构造起来的呢?
简单的说,是软件。软件就应该有软件的样子,图睿OCR识别软件标准把整体分成五个层:数据传输层、图像处理层、版面解析层、OCR识别层、栏目后处理层(非必需)。具体的,数据传输层主要是对图像的输入方式进行定义,允许以图像流、图像路径等多种方式进行数据传输,同时还设计了数据加密接口,保证在数据传输过程中,数据不会被破译。图像处理层的工作在于,把解密数据通过传统的图像处理技术如去噪、二值化等,把图像优化成为可供OCR识别的图像形式。
版面解析层其实是OCR识别不可分割的一部分,工作中,需要扫描识别一份文件的时候,常常需要的不仅仅是图像上的文字得到识别,更多的还需要对字符的字号、版面位置等信息进行识别。而版面解析层正是完成这样的操作。OCR识别层就是完成将图像文字转化成文本文字的功能。
对于栏目后处理层,对于例如证件识别(身份证识别、驾驶证识别以及行驶证识别等)、名片识别,就需要把对应的栏目放到指定的位置。同时,证件、名片等具备一定的特殊性,比如地址栏目可以通过上下文的联系进行一些修订,我们把这一功能称之为后处理,后处理对于提高整体识别率具有不可估量的作用。
转载请标明出处:/,版权所有厦门市图睿信息科技有限公司
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 ocr在线识别 的文章

 

随机推荐