aardio官方社区

 找回密码
 注册会员

QQ登录

只需一步,快速开始

搜索
aardio官方社区 门户 查看主题

开源图文识别引擎 tesseract-ocr

发布者: Jacen.He | 发布时间: 2014-11-21 04:34| 查看数: 24089| 评论数: 37|帖子模式

[源码分享] 验证码识别 - 种子填充算法

演示程序下载(已包含训练语言包、测试图片,可直接测试识别效果)

关于 tesseract-ocr 研究的人比较多、网上的资料也比较多,请自行搜索了解。
Apache许可证可自由商用,aardio支持库1.5MB已包含所有组件, 用法也非常简单,下面是一个简单的例子:
  1. [lang=aardio,false]import console;
  2. import tesseract;

  3. var ocr = tesseract.ocr();
  4. if( 0 != ocr.init("eng","/") ){ //初始化样本语言包
  5.         error("没有找到样本 \tessdata\eng.traineddata");
  6. }

  7. //预设字符集可提升识别率,注意要一定在加载样本以后调用此函数
  8. ocr.setVariable("tessedit_char_whitelist","0123456789")

  9. //识别图像
  10. var text = ocr.processPages("\test.jpg" )   

  11. console.log(text)
  12. console.pause()
  13. [/lang]
复制代码


示例二:
  1. [lang=aardio,false]
  2. import console;
  3. import tesseract;
  4. import win;

  5. var ocr = tesseract.ocr();
  6. if( 0 != ocr.init("eng","/" ) ){ //初始化样本语言包
  7.         var prefix = win.getenv("TESSDATA_PREFIX");
  8.         if(!#prefix) prefix = "~\lib\tesseract\.res"
  9.         error("没有找到样本 " + prefix + "eng.traineddata",2)
  10.         
  11. }

  12. //预设字符集可提升识别率,注意要一定在加载样本以后调用此函数
  13. ocr.setVariable("tessedit_char_whitelist","0123456789")

  14. //获取图像像素数据
  15. var pix = liblept.pixRead( ..io.fullpath("\test.jpg") );
  16. ocr.setImage2( pix )

  17. //识别图像
  18. if( 0 != ocr.recognize() ){
  19.         console.pause(true,"识别图像出错");
  20.         return;
  21. }

  22. var text = ocr.getText()
  23. console.log("识别结果",text )

  24. liblept.pixDestroy({addr pix = pix})
  25. console.pause();

  26. [/lang]
复制代码

最新评论

常年最低调 发表于 2014-11-21 09:19:52

刚好要用到,谢谢

刚好要用到,谢谢
PowerfulTan 发表于 2014-11-21 09:22:17

老大,看到更新很兴奋啊,准备用java搞的,现在aau有了,那就不考虑java了,老大V5

老大,看到更新很兴奋啊,准备用java搞的,现在aau有了,那就不考虑java了,老大V5
csdn321 发表于 2014-11-21 10:02:35

老大又出精品了{:victory:}

老大又出精品了
winner 发表于 2014-11-21 23:16:05

真是极好的

真是极好的
liyoubin37 发表于 2014-11-22 20:57:18

这个非常好,必须支持一下,以前也有想过要搞,现在有现成的,收下了。

这个非常好,必须支持一下,以前也有想过要搞,现在有现成的,收下了。
laorenI 发表于 2014-11-23 07:46:02

学无止境,学习了 {:3_41:}

学无止境,学习了
满月星光 发表于 2014-11-23 08:17:02

太好了。看时间是凌晨4点更新??老大真强,不过身体要紧。

太好了。看时间是凌晨4点更新??老大真强,不过身体要紧。
nvt303 发表于 2014-11-23 08:56:16

赶紧下载学习!感谢分享!

赶紧下载学习!感谢分享!
air_fans 发表于 2014-11-24 09:58:58

这个很强大,可以自己制作训练包

这个很强大,可以自己制作训练包
laorenI 发表于 2014-11-24 14:39:44

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=68165&ptid=12601][c

air_fans 发表于 2014-11-24 09:58
这个很强大,可以自己制作训练包

最重要的就是语言库的训练,如果你有研究,发上来分享一下啊。
auaau 发表于 2014-11-24 15:53:42

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=68167&ptid=12601][c

laorenI 发表于 2014-11-24 14:39
最重要的就是语言库的训练,如果你有研究,发上来分享一下啊。

都这么有分享精神啊,要不你研究下发出来分享一下?!
laorenI 发表于 2014-11-24 16:03:13

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=68172&ptid=12601][c

auaau 发表于 2014-11-24 15:53
都这么有分享精神啊,要不你研究下发出来分享一下?!

正在研究还是不会训练。
diergod 发表于 2014-11-24 19:50:52

学习啦 {:3_48:}

学习啦
wjmcu 发表于 2014-11-25 07:32:24

谢谢老大 {:3_46:}{:3_46:}{:3_46:}

谢谢老大
donque2010 发表于 2014-11-26 23:27:46

感谢分享!

感谢分享!
yc51 发表于 2014-11-28 17:04:35

{:D}这个强大 可以识别汉字

这个强大 可以识别汉字
qdcycm 发表于 2014-11-29 20:49:53

谢谢楼主。

谢谢楼主。
chaosfract 发表于 2014-12-5 10:58:50

衷心感谢分享! 先把这个源码收藏下来,再慢慢研究消化.

衷心感谢分享!
先把这个源码收藏下来,再慢慢研究消化.
12下一页

手机版|未经许可严禁引用或转载本站文章|站长邮箱|aardio.com|aardio官方社区 ( 皖ICP备09012014号 )

GMT+8, 2017-2-28 07:03 , Processed in 0.078125 second(s), 24 queries , Wincache On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表