ABBYY FineReader Engine

面向软件开发人员的功能全面的 OCR SDK

ABBYY FineReader Engine

AI 驱动的OCR软件开发工具包 ABBYY FineReader Engine 允许您将ABBYY的多语言文本识别、PDF转换、文档比对和文档分类技术集成到您的应用程序中。这样,您就可以快速创建高度准确的文本提取和文档转换解决方案——而且编程工作量很小。

将智能文档处理技术 集成到您的应用中

无论您是软件供应商、系统集成商,还是开发自己的IT系统的企业公司,ABBYY OCR SDK都能帮助您创建高精度的文本和数据处理应用程序。您可以为Windows、Linux或Mac创建桌面或服务器应用程序,并将其部署在本地、云端或虚拟机上。多样化的 OCR 功能可为许多领域的应用增添价值,如 DMS、ERP、RPA、保险、银行、医疗保健、法律和机器视觉。

全面的识别技术

在卷积神经网络、端到端识别和语言模型深度学习的帮助下,SDK 可对机器打印文本(OCR)和手写文本(ICR)进行高精度识别,并可进行整页或字段级识别。此外,它还能识别条形码(OBR)和校验码(OMR)。

强大的 PDF 处理工具

SDK 可将文档转换为可搜索的 PDF 和 PDF/A 格式。导入 PDF 文件时,可增加缺失的文本层,同时保留 PDF 属性。可从导入的 PDF/A 文件中提取 XML 数据,也可在保存为 PDF/A 格式时插入 XML 数据。

人工智能与机器学习

强大的人工智能和基于 ML 的技术与 ABBYY 的 ADRT 和其他技术相结合,可检测文档的逻辑结构并识别其格式元素,如目录、页眉、页脚、字体和字体样式,从而精确地重新创建原始文档。

高级图像预处理功能

即使是低质量的图像,经过纠偏、旋转、扭曲校正、文本线校直、页面分割、自适应二值化、ISO 降噪和其他图像校正步骤后,也能获得最佳的 OCR 识别效果。

快速实施的识别配置文件

在频繁识别任务中使用预定义处理配置文件,从而获得最佳 OCR 结果的预设参数。这可以用来代替手动微调识别系统,更快的集成SDK 。

多核心CPU并行处理

在转换许多页面(如书籍)时,开发人员可以利用 SDK 灵活、可扩展的架构。通过使用多核 CPU 和在多个线程上并行处理图像,OCR 步骤的执行速度可以显著提高。

使用机器学习技术的文档分类器

FineReader Engine中的高级分类算法利用机器学习和OCR技术,使应用程序能够自动将文档分为不同的类别。

与现有系统集成

除了公司内网部署外,软件开发人员还可以选择在虚拟环境中部署应用程序,或将其产品托管在阿里云、Microsoft Azure 或 Amazon Web Services 等云平台上。

可视化组件

开发人员可以使用 ABBYY 基于 ActiveX 的可视化组件,轻松地将用户界面集成到 ERP、ECM 或 DMS 系统等各种应用程序中,为用户提供验证文档、访问识别结果以及直接在应用程序中编辑文档的可能性。

代码示例

代码示例库提供了如何使用 OCR SDK 的说明,展示了不同的 FineReader Engine 技术,可用于开发项目。每个库部分都包含代码片段,并附有如何执行相关任务的系统说明。

详细的 SDK 文档和支持

详细的文档有助于简化集成。开发人员可通过 ABBYY 帮助文档中获取更多信息。除这些资源外,您还可在免费试用期间获得我们提供的技术支持。

文档比对

"比较文档 "允许您比较同一文档的两个版本,并检测其内容差异。文档可以是不同的格式,例如 Microsoft Word、PDF、TIF、JPEG 和任何其他支持的输入文档格式。

产品特性

 Windows Linux MAC
识别
BMP、DCX、GIF、JBIG2、JPEG、JPEG 2000、PCX、PDF 扫描 件、加密 PDF 电子文件、PDF/A、PNG、TIFF(仅适用于 Windows 版本:WIC 兼容、WDP、DjVu) + + +
文本文件(doc、docx、rtf、htm/html、txt、odt); 表格(xls、xlsx、csv、ods);演示文稿(ppt、pptx、odp ) 新增 新增
OCR——印刷体文本识别 支持 210 种语言 支持 210 种语言 支持 208 种语言
希伯来语、泰语、越南语 + + +
哥特体 OCR:拉脱维亚语,斯拉夫语,英语,法语,德语, 意大利语,西班牙语 + + +
缅甸语(技术预览)和波斯语 OCR 新增 新增 新增
格鲁吉亚语 OCR 新增 新增
简单数学公式 OCR 识别 新增 新增
阿拉伯语 OCR 基于 ML(机器学习)增强 + +
韩语 OCR 基于 ML(机器学习)增强 + +
日语 OCR 基于 ML(机器学习)增强 基于 ML(机器学习)增强 增强
中文 OCR 基于 ML(机器学习)增强 基于 ML(机器学习)增强 +
对日语及阿拉伯语日期、时间和地址的识别 增强 增强 增强
从身份证机读区提取数据 (MRZ) 新增 新增
从名片上提取数据 + + +
ICR——手写体文本识别 支持 126 种语言 新增:支持 126 种语言
OMR——复选标记识别 + 新增
OBR——条形码识别 + + +
文本差异检测
“比较文档”模块,用于比较两个文档版本 新增 +
图像预处理工具
自动剪裁和自动拆分双页 + + +
过滤彩色水印和标记,消除噪音,改善局部对比度 + + +
自适应二值化 + + +
摄像头 OCR + + +
布局重构
“比较文档”模块,用于比较两个文档版本 新增
自动剪裁和自动拆分双页 + + +
过滤彩色水印和标记,消除噪音,改善局部对比度 + + +
自适应二值化 + + +
摄像头 OCR + + +
文档布局重构,包括其内部结构和格式 + + +
检测并重建平衡的文本列 新增 新增 新增
表格检测和布局重构 增强 增强 增强
轻松开发
扫描实用程序 增强
支持原生 64 位 + + +
代码样本及预定义的配置文件处理 + + +
多核 CPU 嵌入式识别 + +
多线程性能 + +
并行处理多个单页文件 + +
并行处理多页文件 + + +
用于创建用户界面的即用型组件 +
导出设置
多种导出设置可选,如 RTF、DOCX、TXT、ODT、CSV、XLS(X)、 HTML、PDF、PDF/A、XML、PPTX、ALTO、EPUB、FB2、图像格式 + + +
导出到 vCard(用于名片数据) + + +
导出至 JSON(用于 MRZ 数据) 新增 新增
导出至 HTML5 新增 新增 新增
使用非偏斜校正更快导出至 XML 新增 新增 新增
将列表元素直接导出为 XML 新增 新增 新增
ALTO 3.1 导出格式 新增 新增 新增
直接导出至内存 + + +
导出至 XPS +
导出为 PDF 格式
导出为 PDF 2.0 和 PDF/UA 格式 新增 新增 新增
导出为 PDF/A-1a、PDF/A-1b 格式 + + +
导出为 PDF/A-2(a,b,u)、PDF/A-3(a,b,u)格式 新增:PDF/A-2b, PDF/A-3b 新增:PDF/A-2b, PDF/A-3b 新增:PDF/A-2b, PDF/A-3b
支持使用 Unicode 字符进行 PDF 加密 新增 新增 新增
导出为带标签 PDF 格式 增强 增强 +
在 PDF 中保留原始批注和书签 + +
可跳过 OCR,直接检测 PDF 文本层 + +
快速导出多页 PDF 文档 + + +
技术改进
基于 ML 和 NLP 的文档分类 增强 增强 增强
访问有关单个识别变体的信息 新增 新增 新增
使用人工智能和机器学习提升准确性,实现布局重构 新增 新增 新增
能够从内存中打开 PDF、DjVu、WIC 和 WDP 文件 + 仅限 PDF 格式
在打开 PDF 时能够指定光栅化分辨率 + +
全面支持 ZUGFeRD® 兼容 PDF(包括导入和导出) + + +
许可
支持云(Amazon® EC 和 MS Azure®)和虚拟环境 新增 新增
网络许可 + +
备份 Network License Manager,以提高容错性 + +

        + 已在版本12中提供
        - 功能当前不可用/计划中

ABBYY FineReader Engine 可视化组件演示

滚动至顶部