|
演示程序下载(已包含测试图片,可直接测试识别效果)
关于 tesseract-ocr 研究的人比较多、网上的资料也比较多,请自行搜索了解。
Apache许可证可自由商用,aardio支持库1.5MB已包含所有组件, 用法也非常简单,下面是一个简单的例子:
- import console;
- import tesseract;
- var ocr = tesseract.ocr();
- if( 0 != ocr.init("eng","/") ){ //初始化样本语言包
- error("没有找到样本 \tessdata\eng.traineddata");
- }
- //预设字符集可提升识别率,注意要一定在加载样本以后调用此函数
- ocr.setVariable("tessedit_char_whitelist","0123456789")
- //识别图像
- var text = ocr.processPages("\test.jpg" )
- console.log(text)
- console.pause()
复制代码
示例二:
- import console;
- import tesseract;
- import win;
- var ocr = tesseract.ocr();
- if( 0 != ocr.init("eng","/" ) ){ //初始化样本语言包
- error("没有找到样本 eng.traineddata",2)
-
- }
- //预设字符集可提升识别率,注意要一定在加载样本以后调用此函数
- ocr.setVariable("tessedit_char_whitelist","0123456789")
- //获取图像像素数据
- var pix = liblept.pixRead( ..io.fullpath("\test.jpg") );
- ocr.setImage2( pix )
- //识别图像
- if( 0 != ocr.recognize() ){
- console.pause(true,"识别图像出错");
- return;
- }
- var text = ocr.getText()
- console.log("识别结果",text )
- liblept.pixDestroy({addr pix = pix})
- console.pause();
复制代码
|
|