aardio 官方社区

 找回密码
 注册会员

QQ登录

只需一步,快速开始

搜索
楼主: JacenHe

开源图文识别引擎 tesseract-ocr

  [复制链接]

8

主题

56

回帖

464

积分

二级会员

积分
464
发表于 2017-8-20 06:12:05 | 显示全部楼层
thXnder 发表于 2016-9-30 14:26
不知道为什么,有的语言包能正常使用,例如eng.traineddata、kor.traineddata、yid.traineddata等;但有的 ...

我也碰到了同样的问题,请问楼上的朋友,你解决了吗?能否告知解决办法???非常感谢~~~

12

主题

188

回帖

1249

积分

荣誉会员

积分
1249
QQ
发表于 2017-9-1 11:15:32 | 显示全部楼层
MMiao79 发表于 2017-8-20 06:12
我也碰到了同样的问题,请问楼上的朋友,你解决了吗?能否告知解决办法???非常感谢~~~

是不是因为版本的问题,网上查了一下说要tesseract3.0以上才支持中文识别。

8

主题

56

回帖

464

积分

二级会员

积分
464
发表于 2017-9-4 23:05:38 | 显示全部楼层
cjc0045 发表于 2017-9-1 11:15
是不是因为版本的问题,网上查了一下说要tesseract3.0以上才支持中文识别。


你说对了,跟版本有关系。

在看到你的回帖之前,经过验证,aardio里的DLL版本应该对应的是3.0.2,而之前我在tesseract-ocr官方下载的语言识别库版高于这个DLL,所以使用会报错。经过搜索找到对应的3.0.2语言库后,不再报错了,对于宋体、黑体等正常字体,识别度还是很高的,其他美术体就不好说了。

另外,识别之前的字符集设置,也是很有必要的,否则就算是有了相应的语言库,在不设置字符集的情况下,仍然不能做到很好的识别。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|未经许可严禁引用或转载本站文章|aardio.com|aardio 官方社区 ( 皖ICP备09012014号 )

GMT+8, 2025-1-18 19:42 , Processed in 0.068530 second(s), 21 queries .

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表