ABBYY FineReader Engine
ABBYY FineReader Engine
AI 驱动的OCR软件开发工具包 ABBYY FineReader Engine 允许您将ABBYY的多语言文本识别、PDF转换、文档比对和文档分类技术集成到您的应用程序中。这样,您就可以快速创建高度准确的文本提取和文档转换解决方案——而且编程工作量很小。
将智能文档处理技术 集成到您的应用中
无论您是软件供应商、系统集成商,还是开发自己的IT系统的企业公司,ABBYY OCR SDK都能帮助您创建高精度的文本和数据处理应用程序。您可以为Windows、Linux或Mac创建桌面或服务器应用程序,并将其部署在本地、云端或虚拟机上。多样化的 OCR 功能可为许多领域的应用增添价值,如 DMS、ERP、RPA、保险、银行、医疗保健、法律和机器视觉。
全面的识别技术
在卷积神经网络、端到端识别和语言模型深度学习的帮助下,SDK 可对机器打印文本(OCR)和手写文本(ICR)进行高精度识别,并可进行整页或字段级识别。此外,它还能识别条形码(OBR)和校验码(OMR)。
强大的 PDF 处理工具
SDK 可将文档转换为可搜索的 PDF 和 PDF/A 格式。导入 PDF 文件时,可增加缺失的文本层,同时保留 PDF 属性。可从导入的 PDF/A 文件中提取 XML 数据,也可在保存为 PDF/A 格式时插入 XML 数据。
人工智能与机器学习
强大的人工智能和基于 ML 的技术与 ABBYY 的 ADRT 和其他技术相结合,可检测文档的逻辑结构并识别其格式元素,如目录、页眉、页脚、字体和字体样式,从而精确地重新创建原始文档。
高级图像预处理功能
即使是低质量的图像,经过纠偏、旋转、扭曲校正、文本线校直、页面分割、自适应二值化、ISO 降噪和其他图像校正步骤后,也能获得最佳的 OCR 识别效果。
快速实施的识别配置文件
在频繁识别任务中使用预定义处理配置文件,从而获得最佳 OCR 结果的预设参数。这可以用来代替手动微调识别系统,更快的集成SDK 。
多核心CPU并行处理
在转换许多页面(如书籍)时,开发人员可以利用 SDK 灵活、可扩展的架构。通过使用多核 CPU 和在多个线程上并行处理图像,OCR 步骤的执行速度可以显著提高。
使用机器学习技术的文档分类器
FineReader Engine中的高级分类算法利用机器学习和OCR技术,使应用程序能够自动将文档分为不同的类别。
与现有系统集成
除了公司内网部署外,软件开发人员还可以选择在虚拟环境中部署应用程序,或将其产品托管在阿里云、Microsoft Azure 或 Amazon Web Services 等云平台上。
可视化组件
开发人员可以使用 ABBYY 基于 ActiveX 的可视化组件,轻松地将用户界面集成到 ERP、ECM 或 DMS 系统等各种应用程序中,为用户提供验证文档、访问识别结果以及直接在应用程序中编辑文档的可能性。
代码示例
代码示例库提供了如何使用 OCR SDK 的说明,展示了不同的 FineReader Engine 技术,可用于开发项目。每个库部分都包含代码片段,并附有如何执行相关任务的系统说明。
详细的 SDK 文档和支持
详细的文档有助于简化集成。开发人员可通过 ABBYY 帮助文档中获取更多信息。除这些资源外,您还可在免费试用期间获得我们提供的技术支持。
文档比对
"比较文档 "允许您比较同一文档的两个版本,并检测其内容差异。文档可以是不同的格式,例如 Microsoft Word、PDF、TIF、JPEG 和任何其他支持的输入文档格式。
产品特性
| Windows | Linux | MAC |
---|---|---|---|
识别 | |||
BMP、DCX、GIF、JBIG2、JPEG、JPEG 2000、PCX、PDF 扫描 件、加密 PDF 电子文件、PDF/A、PNG、TIFF(仅适用于 Windows 版本:WIC 兼容、WDP、DjVu) | + | + | + |
文本文件(doc、docx、rtf、htm/html、txt、odt); 表格(xls、xlsx、csv、ods);演示文稿(ppt、pptx、odp ) | 新增 | 新增 | – |
OCR——印刷体文本识别 | 支持 210 种语言 | 支持 210 种语言 | 支持 208 种语言 |
希伯来语、泰语、越南语 | + | + | + |
哥特体 OCR:拉脱维亚语,斯拉夫语,英语,法语,德语, 意大利语,西班牙语 | + | + | + |
缅甸语(技术预览)和波斯语 OCR | 新增 | 新增 | 新增 |
格鲁吉亚语 OCR | 新增 | 新增 | – |
简单数学公式 OCR 识别 | 新增 | 新增 | – |
阿拉伯语 OCR | 基于 ML(机器学习)增强 | + | + |
韩语 OCR | 基于 ML(机器学习)增强 | + | + |
日语 OCR | 基于 ML(机器学习)增强 | 基于 ML(机器学习)增强 | 增强 |
中文 OCR | 基于 ML(机器学习)增强 | 基于 ML(机器学习)增强 | + |
对日语及阿拉伯语日期、时间和地址的识别 | 增强 | 增强 | 增强 |
从身份证机读区提取数据 (MRZ) | 新增 | 新增 | – |
从名片上提取数据 | + | + | + |
ICR——手写体文本识别 | 支持 126 种语言 | 新增:支持 126 种语言 | – |
OMR——复选标记识别 | + | 新增 | – |
OBR——条形码识别 | + | + | + |
文本差异检测 | |||
“比较文档”模块,用于比较两个文档版本 | 新增 | + | – |
图像预处理工具 | |||
自动剪裁和自动拆分双页 | + | + | + |
过滤彩色水印和标记,消除噪音,改善局部对比度 | + | + | + |
自适应二值化 | + | + | + |
摄像头 OCR | + | + | + |
布局重构 | |||
“比较文档”模块,用于比较两个文档版本 | 新增 | – | – |
自动剪裁和自动拆分双页 | + | + | + |
过滤彩色水印和标记,消除噪音,改善局部对比度 | + | + | + |
自适应二值化 | + | + | + |
摄像头 OCR | + | + | + |
文档布局重构,包括其内部结构和格式 | + | + | + |
检测并重建平衡的文本列 | 新增 | 新增 | 新增 |
表格检测和布局重构 | 增强 | 增强 | 增强 |
轻松开发 | |||
扫描实用程序 | 增强 | – | – |
支持原生 64 位 | + | + | + |
代码样本及预定义的配置文件处理 | + | + | + |
多核 CPU 嵌入式识别 | + | + | – |
多线程性能 | + | + | – |
并行处理多个单页文件 | + | + | – |
并行处理多页文件 | + | + | + |
用于创建用户界面的即用型组件 | + | – | – |
导出设置 | |||
多种导出设置可选,如 RTF、DOCX、TXT、ODT、CSV、XLS(X)、 HTML、PDF、PDF/A、XML、PPTX、ALTO、EPUB、FB2、图像格式 | + | + | + |
导出到 vCard(用于名片数据) | + | + | + |
导出至 JSON(用于 MRZ 数据) | 新增 | 新增 | – |
导出至 HTML5 | 新增 | 新增 | 新增 |
使用非偏斜校正更快导出至 XML | 新增 | 新增 | 新增 |
将列表元素直接导出为 XML | 新增 | 新增 | 新增 |
ALTO 3.1 导出格式 | 新增 | 新增 | 新增 |
直接导出至内存 | + | + | + |
导出至 XPS | + | – | – |
导出为 PDF 格式 | |||
导出为 PDF 2.0 和 PDF/UA 格式 | 新增 | 新增 | 新增 |
导出为 PDF/A-1a、PDF/A-1b 格式 | + | + | + |
导出为 PDF/A-2(a,b,u)、PDF/A-3(a,b,u)格式 | 新增:PDF/A-2b, PDF/A-3b | 新增:PDF/A-2b, PDF/A-3b | 新增:PDF/A-2b, PDF/A-3b |
支持使用 Unicode 字符进行 PDF 加密 | 新增 | 新增 | 新增 |
导出为带标签 PDF 格式 | 增强 | 增强 | + |
在 PDF 中保留原始批注和书签 | + | + | – |
可跳过 OCR,直接检测 PDF 文本层 | + | + | – |
快速导出多页 PDF 文档 | + | + | + |
技术改进 | |||
基于 ML 和 NLP 的文档分类 | 增强 | 增强 | 增强 |
访问有关单个识别变体的信息 | 新增 | 新增 | 新增 |
使用人工智能和机器学习提升准确性,实现布局重构 | 新增 | 新增 | 新增 |
能够从内存中打开 PDF、DjVu、WIC 和 WDP 文件 | + | 仅限 PDF 格式 | – |
在打开 PDF 时能够指定光栅化分辨率 | + | + | – |
全面支持 ZUGFeRD® 兼容 PDF(包括导入和导出) | + | + | + |
许可 | |||
支持云(Amazon® EC 和 MS Azure®)和虚拟环境 | 新增 | 新增 | – |
网络许可 | + | + | – |
备份 Network License Manager,以提高容错性 | + | + | – |
+ 已在版本12中提供
- 功能当前不可用/计划中