多语言展示
当前在线:172今日阅读:23今日分享:25

将​图​片​中​的​文​字​提​取出来​

日常工作中,我们有时需要提取图片或扫描件中的文字,但长篇累牍地打印,实在太慢:1、图片后缀是tif,需要将图片或扫描件中的文字复制出来到word文档。2、图片后缀不是tif,如:jpg、jpeg、pdf、bmp等,要将图片或扫描件中的文字复制出来到word文档。方法:利用office或者扫描仪的一些软件,所带有的OCR文字识别功能,通过鼠标右键,或者打开后点击OCR转换按键,进行转换。利用office,步骤如下:如不是tif格式,则将图片直接另存tif格式,或者用画图程序打开,另存为tif格式。双击该tif文档,点击'将文本发送到word'即可。当图片清晰度不高,或含有手划线及图章等非文字图案时,转换后会出現乱码,但大部分文字已经出来,其余的工作就是修正和调整。可以设法提高图片质量,比如:用画图程序去掉图片中不需要转换的手划线、图章等等非文字图案,精简和优化后,可以提高文字识别率,高的可达90%以上或100%。注意:最好在安装OFFICE时,将所有功能安装到本地磁盘。如果OFFICE没有安装完全,可能因没有OCR识别模块,而转换不了。另一种方法是利用扫描仪驱动程序中的OCR识别软件,安装该软件后,可通过右键转换,步骤如下:右键点击jpg格式的图片,菜单出現OCR,可以“OCR成TXT文本,OCR成RTF格式的word文档,OCR成CSV格式的EXCEL文档”。对于扫描件,转换效率可能很高;对于非扫描件,可能无法转换,不能转换时,则可利用OFFICE转换。两种方法交替使用,应可以很大地提高工作效率。
推荐信息