跳转到主要内容
一些实用工具,可增强开发人员与 ABBYY FineReader Engine 交互以及在核心层面控制识别过程的能力:

使用配置文件

ABBYY FineReader Engine 12 提供了一组预定义配置文件,这些配置文件已针对基本使用场景进行了优化。这些配置文件中指定的设置可在相应场景下提供最佳结果。此外,大多数配置文件都提供两种形式:一种针对生成文档的最佳质量进行优化,另一种针对最高处理速度进行优化。以下是可用的预定义配置文件列表:

场景

配置文件名称

数据提取

  • DataExtraction

用于内容复用的文档转换

  • DocumentConversion_Accuracy
  • DocumentConversion_Normal

文档归档

  • DocumentArchiving_Accuracy
  • DocumentArchiving_Speed

用于字段检测和文档分类的文本提取

  • TextExtraction_Accuracy
  • TextExtraction_Speed

字段级识别

  • FieldLevelRecognition

条码识别

  • BarcodeRecognition_Accuracy
  • BarcodeRecognition_Speed

名片识别

  • BusinessCardsProcessing

从机读区采集数据

  • MachineReadableZone

高压缩 PDF 文档归档

  • HighCompressedImageOnlyPdf

工程图纸识别

  • EngineeringDrawingsProcessing
您可以在预定义配置文件规范中查看这些配置文件提供的设置列表。
这些配置文件中的设置可通过 Engine 对象的 LoadPredefinedProfile 方法加载。加载配置文件后,新创建的对象将采用该配置文件中指定的新默认值。

Voting API 支持

当 ABBYY FineReader Engine 被用作第三方应用程序中的参与识别引擎之一时,它会针对字符、词和字符间切分提供识别候选结果 (或假设) 及其相应的置信度。这些信息可帮助开发者为需要结合多种识别技术的应用程序设计高效且准确的投票算法。例如,在识别 “O” 时,ABBYY FineReader Engine 可能会返回 3 个假设:“0” (零) ,置信度为 60;大写字母 “O”,置信度为 80;以及大写字母 “C”,置信度为 10。对于字符间切分,情况可能是这样:对于 “m”,可能的假设包括 “m”、“rn” 和 “in”。更多信息,请参见 使用 Voting API

核心识别的“实时”调优

ABBYY FineReader 允许开发者在 OCR 过程中从核心层面访问并控制识别引擎。FineReader 识别引擎会生成假设 (或识别候选结果) ,并允许开发者使用自定义的特定排序标准,影响或微调针对每个假设进行置信度级别设置的过程 (或选择最佳假设) 。

常见转换任务的代码示例

SDK 随附了一组源代码示例,演示了如何在不同场景中使用引擎。Windows 代码示例提供了 Visual Basic .NET、纯 C++、支持 Native COM 的 C++、C#、Java 和脚本语言版本。

另请参阅

主要功能