tesseract-ocr可以对图像文字进行识别,可以自己调试模型使图像文字进行程序的识别率更高,同时为图文转换的工作时省去了大量时间。
工具/原料
1
电脑一台
2
linux服务器一台
安装编译环境
1
gcc安装使用的内容是基础环境,虽然大部分机子上面都有,但也不排除没有的,所以还是安装一遍检查下。
2
使用图片中的命令,下载leptonica文件。 使用tar xvf 解压之前下载的文件,下载之后进入解压后的文件。./configure;make ; make install进行安装,安装的leptonic是tesseract-ocr的支持部件,使用tesseract,leptonic是必须安装的
4
同样使用tar xvf进行对下载文件的解压,之后进入解压后的文件使用./autogen.shmkdir m4;./configuremake;make install 进行对tesseract的安装
5
具体是世界使用,tesseract (图片名称) out(转换的文字),虽然使用的转换成功率不高,还是有错误的问题,用户可以自己建立相应的模型,这样会提高识别率。
注意事项
使用tesseract有需要时可以自己建立模型,提高识别率
上一篇:新车怎么查是否维修过
下一篇:【鉴别真假】买车防骗攻略