- 对扫描图像或照片进行预处理
- 从 MRZ 中提取数据
- 导出到外部文件
场景实现
本主题提供的代码示例仅适用于 Windows。
步骤 1. 加载 ABBYY FineReader Engine
步骤 1. 加载 ABBYY FineReader Engine
要开始使用 ABBYY FineReader Engine,您需要创建 Engine 对象。Engine 对象是 ABBYY FineReader Engine 对象层次结构中的顶层对象,提供各种全局设置、一些处理方法,以及用于创建其他对象的方法。要创建 Engine 对象,可以使用 InitializeEngine 函数。另请参阅加载 Engine 对象的其他方法 (Win) 。
C#
步骤 2. 加载此场景的设置
步骤 2. 加载此场景的设置
您可以使用 Engine 对象的 LoadPredefinedProfile 方法,加载适用于此场景的处理设置。此方法使用设置配置文件的名称作为输入参数。更多信息,请参阅使用配置文件。此场景的设置可通过预定义配置文件 MachineReadableZone 获取:如果您想更改处理设置,请使用相应的参数对象。更多信息,请参阅下方的特定任务的附加优化。只有当您的 ABBYY FineReader Engine 许可证支持 MRZCapture 模块时,才能进行 MRZ 捕获。
- 启用对图像中所有文本的检测和提取 (不检测图片、矢量图形和表格) 。
- 自动执行分辨率和几何校正。
C#
步骤 3. 加载并预处理文档图像
步骤 3. 加载并预处理文档图像
要将图像加载到 FineReader Engine,您可以使用以下对象的方法:要将图像加载到 FRDocument 对象,请执行以下任一操作:
- FRDocument
- 适用于 Linux 和 Windows 的 BatchProcessor
Linux 和 Windows 用户可在使用 ABBYY FineReader Engine 进行并行处理中了解这两种方法各自的优缺点。当前主题重点介绍 FRDocument。
- 创建 FRDocument 对象时,使用 Engine 对象的 CreateFRDocumentFromImage 方法。
- 将文件中的图像添加到已创建的 FRDocument 对象中 (使用 AddImageFile、AddImageFileWithPassword 或 AddImageFileWithPasswordCallback 方法) 。
C#
步骤 4. 从 MRZ 提取数据
步骤 4. 从 MRZ 提取数据
要从 MRZ 提取数据:
- [可选] 使用 Engine 对象的 CreateMrzProcessingParams 方法创建 MrzProcessingParams 对象。将其属性设置为所需的值。
- 调用 FRPage 对象的 ExtractMrz 方法,并将上一步中配置好的 MrzProcessingParams 对象作为输入参数传入;如果使用默认的 MRZ 捕获设置,只需传递 NULL。您将收到一个 MrzData 对象,其中包含从捕获的 MRZ 中解析出的信息。
C#
步骤 5. 处理提取的数据
步骤 5. 处理提取的数据
MrzData 对象包含从 MRZ 中提取的所有数据。您可以使用 GetLine 方法访问机读文本行,并使用 GetField 和 GetFieldByType 方法遍历字段。可提取以下类型的字段:
- 文档类型
- 文档子类型
- 签发国家
- 姓氏
- 名
- 文档编号
- 国籍
- 出生日期
- 性别
- 到期日期
- 个人编号
- 可选数据第 1 行
- 可选数据第 2 行
C#
步骤 6. 导出提取的数据
步骤 6. 导出提取的数据
提取的数据可以保存为 XML 或 JSON 文件。要使用默认参数导出数据,请调用 MrzData 对象的 ExportToFile 方法,并将文件路径作为输入参数传入。要使用用户自定义参数导出数据,请调用 MrzData 对象的 ExportToFileEx 方法,并将指向 MrzJsonExportParams 对象或 MrzXmlExportParams 对象的指针作为输入参数传入。C#
步骤 7. 卸载 ABBYY FineReader Engine
步骤 7. 卸载 ABBYY FineReader Engine
所需资源
其他优化
- 加载 Engine
- 加载 Engine 对象的不同方式 (适用于 Windows)
详细介绍了加载 Engine 对象的各种方式。 - 在多线程服务器应用程序中使用 ABBYY FineReader Engine (适用于 Windows)
介绍了在服务器应用程序中使用 FineReader Engine 的具体注意事项。 - 使用配置文件
详细说明了预定义配置文件和用户配置文件。
- 加载 Engine 对象的不同方式 (适用于 Windows)
- 识别
- 调整预处理、分析、识别和合成的参数
介绍如何使用预处理、分析、识别和合成参数对象来自定义文档处理。
- 调整预处理、分析、识别和合成的参数
- 处理提取的数据
- 机器可读区字段
列出了可通过 ABBYY FineReader Engine 12 从机器可读区提取的字段及其简要说明。 - 处理文本
介绍如何处理识别后的文本、段落、单词和字符。 - 使用 Voting API
介绍如何处理单词和字符识别的备选结果。
- 机器可读区字段
