搜索
123
返回列表 发新帖
楼主: Jacen.He

[扩展库] 开源图文识别引擎 tesseract-ocr

    [复制链接]

8

主题

65

帖子

465

积分

二级会员

Rank: 3Rank: 3

积分
465
发表于 2017-8-20 06:12:05 | 显示全部楼层
thXnder 发表于 2016-9-30 14:26
不知道为什么,有的语言包能正常使用,例如eng.traineddata、kor.traineddata、yid.traineddata等;但有的 ...

我也碰到了同样的问题,请问楼上的朋友,你解决了吗?能否告知解决办法???非常感谢~~~
回复

使用道具 举报

12

主题

204

帖子

1260

积分

荣誉会员

Rank: 8Rank: 8

积分
1260
QQ
发表于 2017-9-1 11:15:32 | 显示全部楼层
MMiao79 发表于 2017-8-20 06:12
我也碰到了同样的问题,请问楼上的朋友,你解决了吗?能否告知解决办法???非常感谢~~~

是不是因为版本的问题,网上查了一下说要tesseract3.0以上才支持中文识别。
回复

使用道具 举报

8

主题

65

帖子

465

积分

二级会员

Rank: 3Rank: 3

积分
465
发表于 2017-9-4 23:05:38 | 显示全部楼层
cjc0045 发表于 2017-9-1 11:15
是不是因为版本的问题,网上查了一下说要tesseract3.0以上才支持中文识别。


你说对了,跟版本有关系。

在看到你的回帖之前,经过验证,aardio里的DLL版本应该对应的是3.0.2,而之前我在tesseract-ocr官方下载的语言识别库版高于这个DLL,所以使用会报错。经过搜索找到对应的3.0.2语言库后,不再报错了,对于宋体、黑体等正常字体,识别度还是很高的,其他美术体就不好说了。

另外,识别之前的字符集设置,也是很有必要的,否则就算是有了相应的语言库,在不设置字符集的情况下,仍然不能做到很好的识别。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|未经许可严禁引用或转载本站文章|站长邮箱|aardio.com|aardio官方社区 ( 皖ICP备09012014号 )

GMT+8, 2019-9-19 08:40 , Processed in 0.046875 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表