多语言展示
当前在线:1693今日阅读:165今日分享:48

文字识别:如何复制提取pdf文件内容文字

现在看电子书的人越来越多了,很多时候我们都会因各种原因需要复制PDF文件里面的内容,而一般的阅读器都是不支持复制的。所以我们需要找到合适的工具和方法。下面分享一下本人总结的效果比较好的方法:
工具/原料
1

电脑

2

CAJViewer 软件

3

汉王HWPDFOCR80软件

方法/步骤
1

【方法一】:新建一个word文档,点击菜单的“文件”,“打开”,选择要处理的pdf文件,word将会自动把pdf文件转换成word文件,可以保存起来,可以对内容进行编辑。注意:不是所有的pdf文件都可以转换的;转换后的内容可能和原来的不太一致,毕竟把图片转换成文本,文字识别技术不是100%正确的,所以复制内容的时候,最好核对一下有没乱码之类的。

3

【方法三】:先将要复制的内容截图成一张图片,然后用汉王HWPDFOCR80软件打开,提取图片中的内容。部分准确率很高。这个效果很难说,有时高有时低。

4

大家根据自己的情况,选择适合自己的方法试试

推荐信息