博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[转]众多OCR软件
阅读量:5262 次
发布时间:2019-06-14

本文共 3713 字,大约阅读时间需要 12 分钟。

转载地址:http://blog.sina.com.cn/s/blog_548c0f960102vt53.html

 
1、ABBYY FineReader 
简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多打印机、扫描仪都自带它为ocr软件。安装程序约300MB,选择词库安装后约500MB。 
评价:功能齐全,众多软件中应该是第一。 
缺点:占cpu/内存大。有时会识别出一些不存在的字(和正确的字很相像,但不存在。造字?) 
 
简介: 功能类似汉王屏幕摘抄、Mini Ocr是专门OCR识别屏幕截图用的。 
 
2、I.R.I.S. Readiris 

Readiris Corporate(光学识别软件) v15.1.0 中文免费版

简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多印机、扫描仪都自带它为ocr软件。安装程序约200MB,选择词库安装后约100MB。 
评价:功能可以,对表格的识别率ms比ABBYY FineReader高。没遇到FineReader的造字问题。 
缺点:没自带校对功能。 
友情提醒: 
一定用Asian版,没写Asian的不支持中文! 
导入图片时勾上“使用300dpi分辨率” 不然若图片不达标会弹出提示叫你从扫。 
 
3、Scansoft Nuance 
简介:国外4大OCR公司之一,自己号称全球都在用(估计没算中国),微软、清华还向他买技术 
*** OmniPage (最贵的,$499.99 ) 
*** PaperPort (才$79.99 ) 
*** TextBridge (才$79.99 ) 
友情提醒+评价缺点:吹的多nb。下一个MULTi LANGUAGE多语言版,500MB,吓一跳。打开后发现带2个软件OmniPage和PDFCreate5。我们当然装最贵的OmniPage咯,实际安装程序越越约300MB。选择安装后250MB,kao,中文词库只不过是做样子呢!难怪微软也同时向清华买OCR技术。 
 
 
 
 
4、清华文通TH-OCR 
简介:国产(清华+文通)+国外企业Scansoft Nuance,值得支持,与汉王不同的是清华国际知名度比较好。微软向他买技术,满多印机、扫描仪也带它为ocr软件。 
评价:功能还可以,(可以把汉王认为是国内的FineReader ,清华则是Readiris....或者反过来?) 嗯nb!还带语音效稿! 
缺点:不支持多页单TIF文档 
友情提醒:"清华紫光OCR"是旧版 
*** 文通慧视小灵鼠 
简介:简单的说就是增加了手写识别的增强版。 
*** CAJViewer 
简介:向清华买的识别程序。 
*** 《文档天地》综合管理与处理系统 
简介:向清华买的技术。 
*** netocr.net在线OCR 
简介:
应用了由清华大学电子系研制的国际领先的最新OCR识别技术,提供一天之内不超过99幅图像的免费的文字识别服务。 
还有后台人工校对识别。。。
由文通搞的,貌似搞不下去了。 
 
6、Microsoft微软 
简介:微软,nb公司啊!开玩笑,其实用清华(中文?)和Scansoft Nuance(英文?)的引擎。 
Office Document Imaging 
Office OneNote 
评价:用的像是清华早期的特征库。比较好笑的是,网上有人测试的比清华现在的词库识别好。 
缺点:懒着写 
友情提醒: 
默认装了跟Office的相同语言的特征库,其他语言特征库手动添加,若装office多语言版ms就免了. 
***老马的 UnicornViewer 、 Pdg2Pic 、 TextForever 
简介:套用微软yy过的OCR引擎和词库来实现批量OCR 
http://www.comicer.com/stronghorse/w...e/pdg2text.htm 
*** 创华OCR 
简介:套用微软yy过的OCR引擎和词库 
 
7、Adobe Acrobat Pro 
简介:Adobe,nb公司啊!开玩笑,其实是买IRIS Readiris的技术。 
评价: 
其实他的OCR技术也是给图片式PDF用的,识别后会在图片PDF的文字上附上识别文字,这样你可以拷贝pdf上的东西. 
(表达能力有限,类似onenote的使用方法) 
缺点:没自带校对功能。 
友情提醒:不是免费的Reader,是Acrobat Pro或Acrobat Pro Extended版 
 
8、Mini Ocr 
简介:作者马飞涛知道是谁不?是护花使者的作者。用他的话说:
我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能 
把文字识别出来,图像的含义就很容易让计算机理解了。
是的,专门设计给截图用的 
评价:看看过滤效果,就知道多利害了吧,而且是他自制的特征库. 
缺点:可惜无法手动选择识别区域 
友情提醒:有点类似汉王屏幕摘抄、汉王照片摘抄 
 
9、文粹OCR 
简介:国产企业,值得支持。识别率不比汉王差! 
缺点:功能不够强大、完善。 
友情提醒: 
去worldrobot.net/download.html 下最新2009版。华军,天空的都不是最新版。 
默认快捷方式“文粹OCR”是update.exe,为避免每次升级,把路径改成WencuiOcr.exe。 
*** 文粹在线OCR 
貌似搞不下去了。 
 
10、Newsoft 丹青文件辨识系统 MaxReader、Presto OCR 
简介:应该是tw的Newsoft公司和国外Presto合搞的(这不重要)。 
这Presto公司在9x年代买了ABBYY的识别引擎,然后丹青又买/合作/使用了Presto版的ABBYY识别引擎。(10年前旧版的ABBYY不支持中文,所以有的搞,不过现在。。。。) 
评价:看他网上上吹的多nb(10年前的技术也敢吹?!),但是识别繁体竖排或简体都不见得有多好。安装程序越越约300MB,安装后130MB。 
缺点:懒着写 
友情提醒:我情愿用汉王,这不过是个旧版的ABBYY 
 
11、汉王 
简介:国产企业,值得支持 
缺点:不支持多页单TIF文档 
*** 汉王文本王文豪7600 
评价:功能满全的,自带的几个小工具不错(汉王拼图精灵、汉王屏幕摘抄、汉王照片摘抄) 
友情提醒: 
1.貌似该公司目前开发重点是硬件,2007后出了文本王文豪7600就没更新了。 
2.网上一个366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 这两个文件夹,大家装hwdocsafe 文件夹里的。另166MB的是光光hwdocsafe 这个文件夹。 
3.设置里选“忽略段内回车换行”。 
4.汉王屏幕摘抄、汉王照片摘抄貌似是用特征库,效果跟Mini Ocr一样。所以识别结果跟文本王不一样。 
*** 汉王 PDF OCR 
简介: 停止开发文本王但是品牌名声和功能还是要维护的。这个免费使用的才40MB。 
评价: 什么PDF OCR啊?我的一个图像pdf就根本识别不了.... 
*** 汉王尚书七号 
简介:尚书OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约60MB. 
*** Founder 方正OCR 
简介:本来不想写这个的,方正OCR软件是方正公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约40MB. 
*** 汉王文友 
简介:旧版 
*** 超星阅览器 
简介:向汉王买的技术。 
*** RapidScan高速扫描影像优化OCR识别系统 
简介:向汉王买的技术。 
 
12、ExperVision TypeReader 
简介:新人可能不知道,但是n年前还是满有名的。 (才$395.00 )同时也曾是国外4大OCR公司之一。 
评价:ms2008年后就没更新,以前拿了n多奖,若oem盘有带,用来ocr英文还可以。 25MB。 
缺点:不支持中文算不? 
友情提醒:此东东不好下,没特别需要别下 
 
13、赛酷OCR 
简介:使用云系统来OCR,说土点就是叫你装一个客户端,把图片上传到服务器上,识别后再发回来。 
优点:机子配置不好的,用这东东占资源少。客户端安装文件也小。 
缺点: 
识别率不咋的,可能还没丹青好。除了简体,繁体竖排根本不行。 
机密文件你甲认为我会安心上传给你? 
万一断网,偶要OCR咋办? 
友情提醒:偶就纳闷,网上关于该软件的评价很高。(有人发帖问用啥OCR软件好,基本上就有人回“用赛酷”)就首次使用送10次识别,网上可能有那么多有钱的潜水支持者?可见肯定是1毛党! 
 
14、SimpleOCR 
简介:本来不想写这个的,但是这免费的东东名声蛮大的,我不说,人家可能会去下。 
缺点:不支持中文 
 
15、奥普ocr 
简介:停止开发的东东。 
 
 
注1:以上,就前9名OCR软件值得试! 
注2:在线网页OCR不实际 
注3:该软件的比较写于2010年,估计5年内有效 
注4:此贴由winny社长验证,内容非常包青天 
注5:软件按引擎Engine+词库分类

转载于:https://www.cnblogs.com/Crysaty/p/6080287.html

你可能感兴趣的文章
Jenkins+ProGet+Windows Batch搭建全自动的内部包(NuGet)打包和推送及管理平台
查看>>
php上传文件及头像预览
查看>>
大四java实习生的一些经历
查看>>
线程池的概念
查看>>
Oracle_Statspack性能诊断工具
查看>>
转获取sql维护的表关系
查看>>
Java 序列化
查看>>
Java 时间处理实例
查看>>
Java 多线程编程
查看>>
Java 数组实例
查看>>
mysql启动过程
查看>>
2017前端面试题总结
查看>>
Http GetPost网络请求
查看>>
SWIFT国际资金清算系统
查看>>
Sping注解:注解和含义
查看>>
站立会议第四天
查看>>
如何快速掌握一门技术
查看>>
利用AMPScript获取Uber用户数据的访问权限
查看>>
vagrant 同时设置多个同步目录
查看>>
python接口自动化28-requests-html爬虫框架
查看>>