多语言展示
当前在线:1484今日阅读:26今日分享:39

图像识别tesseract-ocr

tesseract-ocr可以对图像文字进行识别,可以自己调试模型使图像文字进行程序的识别率更高,同时为图文转换的工作时省去了大量时间。
工具/原料
1

电脑一台

2

linux服务器一台

安装编译环境
1

gcc安装使用的内容是基础环境,虽然大部分机子上面都有,但也不排除没有的,所以还是安装一遍检查下。

2

使用图片中的命令,下载leptonica文件。  使用tar xvf 解压之前下载的文件,下载之后进入解压后的文件。./configure;make ; make install进行安装,安装的leptonic是tesseract-ocr的支持部件,使用tesseract,leptonic是必须安装的

4

同样使用tar xvf进行对下载文件的解压,之后进入解压后的文件使用./autogen.shmkdir m4;./configuremake;make install 进行对tesseract的安装

5

具体是世界使用,tesseract (图片名称) out(转换的文字),虽然使用的转换成功率不高,还是有错误的问题,用户可以自己建立相应的模型,这样会提高识别率。

注意事项

使用tesseract有需要时可以自己建立模型,提高识别率

推荐信息