昨天同事要我帮忙把图片上的文字生成文本,这可要用到识别软件。其实Office2003 工具中的Document Image就有OCR文字识别的功能。下面我们就来将图片上的文字识别成可编辑的文本。
工具/原料
1
Office2003
2
Office Document Imaging
方法/步骤
1
Office Document Imaging工具在Office中默认是没有安装的,大家可以通过更改Office安装添加此工具。
2
在开始菜单中的Office程序组中找到并运行Office Document Imageing工具。
3
Office Document Imaging可以识别的图片格式有两种:tif\tiff、mdi 。 因此,图片如果是JPG或其它格式,那就要先用其它软件转换,比如PHOTOSHOP。
4
打开tif格式的图像文件。
5
点击工具栏上的“使用OCR识别文本”按钮,会出现识别进度框,速度还是蛮快的。
6
识别完成后,再点击“将文本发送到Word”按钮。
7
在弹出的对话框中,点击确定。默认情况下是将已经识别的所有页面内容发送到Word。如果只想发送某一部分内容,应该先进行框选,再点发送按钮。
8
发送后,会自动将打开生成的Word文档,默认是htm格式。可以看到,整体识别效果很不错。
注意事项
图片的分辨率、颜色及文字后的背景都会影响识别效果,不可能十全十美。
上一篇:图片快速转换为文本文字
下一篇:将图片或网页上的文字转换成文本