多语言展示
当前在线:517今日阅读:26今日分享:39

OCR图像转换文字软件

ABBYY (泰比)是一个在文档转换、数据捕获和语言软件领域全球领先的供应商。 ABBYY的产品包括:FineReader and PDF Transformer – 文档转换;Recognition Server – OCR识别和PDF文档转换;FlexiCapture – 用于表格、半结构化和非结构化文档的数据捕获;FineReader Engine SDKs – 全方位识别技术; Lingvo – 词典软件。
工具/原料
1

1、ABBYY FineReader

2

2、ABBYY Recognition Server

3

3、ABBYY FlexiCapture

4

ABBYY FlexiCapture for Invoices

方法/步骤

ABBYY FineReader是一套OCR软件, 它能够把所有各种不同的文件例如PDF, scanner输入, 甚至相机拍下的照片, 轻松将里面的文字识别出来并转换成你想要的文件格式。1、 这套软件和其它一般OCR不同的地方, 是我们的认字能力比其它的高, 我们的ABBYY FineReader准确率达到99%;2、我们支持多达190种以上不同国家的文字;3、另外, 透过ADRT技术 (Adaptive Document Recognition Technology), 经过FineReader转换的文件, 它们的排版格式包括入面的图片、图表、字型及多页的格式等等也可以做到和原文档一样;4、FineReader支持多种不同的输出格式, 例如MS Word & Excel, TXT, Searchable PDF, RTF, 等等。

方法/步骤2

Recognition Server 只是一個Server版的OCR和PDF轉換方案, 並支持Indexing功能方便文件管理 。Recognition Server的5个简单步骤, 就能够完成文件转换:1、Import(输入) – 可以选择直接用scanner, 或者可选择由活页夹或email附件输入;2、Recognition(识别) Processing Station – 由于都是基于ABBYY的OCR技术, 所以识别的效能和之前介绍的FineReader一样;3、Verification Station – Admin可以指定某user手动检查和校对转换的结果;4、Indexing Station – 支持人手输入或直接在文件上点击输入Index, 甚至透过简单programming可达到自动文件分类和Index;5、Export – 同样可支持多种可修改的文件格式和Searchable PDF,另外可保存原档案的图片文件。

方法/步骤3

ABBYY FlexiCapture,Data Capture能帮忙的不只是capture文件中的文字, 而更能够把相对的Data定义抽取出系统或Database的应用。用一幅图更能清楚表达出ABBYY FlexiCapture的功能:1、在左边是一大迭各种各样不同类型的文件要处理的;2、把这大堆文件导入中间的FlexiCapture, 它主要提供两大类的功能, 就是(i)文件分类; 和(ii)数据抽取;3、经过FlexiCapture处理后, 每份文件的分类和文件里面所需要的一些data已经被抽的系统或database;这样, 以往烦复的data entry工作便可轻松地自动化进行操作。

方法/步骤4

ABBYY FlexiCapture for Invoices。Invoice Reader是基于FlexiCapture平台上的一个新功能, 令用家可以简单几个步骤就可轻松识别出不同Invoice的格式1、它可读取出所有Invoice相关的data field;2、支持所有的Invoice格式和语言; 3、和原来的FlexiCapture一样, 可以容许用户自己添加所需的field和规则;最后, 一边操作一边的在线培训可以不断提高抽取数据的准确质素, 相当于一个智能学习系统

推荐信息