跳转到主要内容
本文适用于即将切换到 Vantage 的 FlexiCapture 用户。Vantage 允许复用 FlexiCapture 项目中的各种组件,包括 FlexiLayouts。它还使您能够利用全新的强大机器学习技术,并且可以轻松在现有的已标注文档上对其进行训练。 建议您先了解 Vantage 中提供的内置技能。在大多数情况下,它们的效果至少可与现有的 FlexiCapture 项目相当。Advanced Designer 和 Vantage 所提供的高效训练能力,也可能使您无需再复用在 FlexiLayout Studio 中创建的 FlexiLayouts。 技能目录中提供了 50 多个内置技能。此外,Vantage 提供用于处理发票、采购订单、收据和商业发票的技能,这些技能可以成功替代 ABBYY FlexiCapture for Invoices

关键概念

在 Vantage 中,文档是在事务中处理的。与批次不同,事务不被指定类型。事务的处理流程和 OCR 设置由处理该事务的技能定义。 通常,需要将 Document Definitions 替换为内置或手动配置的文档技能,创建一个流程技能,并配置其处理流程,将文档路由到相应的文档技能和其他处理阶段。

关键概念映射

FlexiCapture 中的概念在 Vantage 中的对应概念
FlexiCapture project引用在 Vantage 和 Advanced Designer 中开发的其他技能(OCR、Classification、Document、Document Splitter 技能)的流程技能
Batch事务(部分等价)
Batch type, project properties在流程技能中配置的文档处理工作流,以及技能设置和活动设置
Classification batches分类技能中的文档集
Training batches文档技能中的文档集(部分等价)
Test batchesAdvanced Designer 中文档技能里的测试文档集
Document Definition文档技能
Workflow流程技能中的文档处理工作流
Auto-learning for field extraction用于字段提取的文档技能在线学习
NLP modelsAdvanced Designer 中文档技能里用于非结构化文档的活动

文档导入

FlexiCapture 12 扫描工作站可以完全由 ABBYY Vantage 扫描工作站替代。 可以在流程技能的 Input 活动中配置从热文件夹(在 Vantage 中称为共享文件夹)或电子邮件导入文档。源类型、源文件名以及有关电子邮件的信息都会自动保存到注册参数中。 还可以通过 Vantage API 导入文档并设置自定义注册参数](/vantage/documentation/developer-guide/registration-parameters,或者使用连接器从各种第三方应用程序中导入文档。

工作流设置

要重新创建批处理工作流,请配置一个流程技能。在 Vantage 中,流程技能中的各个活动相当于处理阶段。文档集指的是一个事务中的一组文档。

工作流阶段映射

FlexiCapture 中的工作流阶段在 Vantage 中的对应项
ScanningABBYY Vantage Scanning Station(未集成到流程技能活动中)
Rescanning不支持
Recognition一个工作流,其中可以包含流程技能的 OCR、Classify、Extract 和 Assemble 活动。可以为每个 Classification 技能和文档技能分别配置 OCR 设置。流程技能中的 OCR 活动可用于为所有文档指定通用的预识别选项。Classify 活动可用于确定文档类型,并将文档路由到映射到 Extract 活动的相应文档技能,在其中提取数据。Assemble 活动可用于组装文档。
Document assembly check不支持验证文档集合的完整性。要组装文档,可以使用流程技能的 Assemble 活动。
Batch integrity check在文档发送到 Vantage 之前,Scanning Stations 会执行自动批次完整性检查。操作员也可以在 Scanning Station 上运行手动检查。
Data verification, verification, export confirmation流程技能的人工审核活动。
Export流程技能的 Output 活动或 Custom 活动。
Processed, Exceptions由 Vantage 自动分配的事务状态。您可以在技能监控的 Transactions 部分查看事务状态。
User type流程技能的 Condition 活动或 Custom 活动。
只有在工作流中包含人工审核活动时,Vantage 中的工作流才需要与人工操作员交互。

用户角色

Vantage 支持在一个流程技能中创建多个人工审核活动。人工审核操作员的访问权限可以被限制为仅访问特定的人工审核阶段。要创建用户并编辑其权限,请转到 Vantage 中的 Users 选项卡。

角色映射

FlexiCapture 中的角色Vantage 中的角色
Scanning OperatorSkill User
Data Verification OperatorManual Review Operator(可限制访问特定技能和人工审核阶段)
Verification OperatorManual Review Operator(可限制访问特定技能和人工审核阶段)
Senior Verification OperatorProcessing Supervisor
Project Settings EditorSkill Designer
Monitoring OperatorProcessing Supervisor(同时可访问人工审核)
AdministratorTenant Administrator
Web Capture OperatorSkill User + Manual Review Operator
Operators ManagerTenant Administrator(这是唯一允许管理用户权限的角色)

分类

分类模型不能直接在 Vantage 中复用。 若要识别不同类型的文档,请创建一个分类技能 (Classification skill)。在该技能中,您可以上传曾用于在 FlexiCapture 中训练分类模型的文档,创建相同的类别,并在 Vantage 中对该技能进行训练。之后,您可以在流程技能 (Process skill) 的 Classify 活动中使用此技能,并将这些类别映射到 Extract 活动。每个 Extract 活动将使用一个文档技能 (Document skill),可视为一个文档定义部分 (Document Definition section) 的等价物。 在 Vantage 中,聚类始终处于启用状态,因此可以自动识别同一类型文档的不同变体。但是,如果版式差异较大,请考虑在 Advanced Designer 中创建一个文档技能,在其工作流中添加一个 Classify 活动,并相应地对其进行训练。您可以设置一个 Extraction Rules 活动(与 FlexiLayout 大致等价),并在 Classify 活动之后放置一组 Extraction Rules 活动,使系统能够根据文档变体自动选择合适的 Extraction Rules 活动。 若要在输入页面流中分割文档,请在流程技能中添加一个 Assemble 活动。您可能还需要在 Advanced Designer 中创建并配置一个 Document Splitter 技能。

文档定义

通常,您需要将针对不同类型文档的文档定义替换为相应的文档技能。对于同一类型文档的不同变体,其文档定义必须在同一个文档技能中,通过单独的活动分别进行替换。如果某个文档定义包含多个部分,则每个部分都必须替换为相应的文档技能。 OCR 设置和手写识别是在文档技能范围内进行配置的。如果您使用流程技能将文档路由到不同的文档技能,还可以在 OCR 活动中配置通用的预识别设置(语言、手写识别和条形码)。请注意,手写识别在文档技能设置中默认启用,而在 OCR 活动中默认禁用。
提示: 与 FlexiCapture 相比,Vantage 中的数据提取技术已经进行了重大变更和改进。Vantage 中可用的提取规则和其他活动的工作方式与其在 FlexiCapture 中的对应功能不同,这意味着在某些情况下结果可能会有所差异。在将文档定义替换为文档技能之后,请务必确认提取结果符合您的预期。

固定文档定义

用于表单的文档定义无法在 Vantage 中直接复用。如果内置技能都不能满足您的需求,请从 FlexiCapture 导出相应的一批已标注文档,并将其导入在 Advanced Designer 中新建的文档技能中。之后您有两种选择:
  • 向该文档技能的处理流程中添加一个 Fast Learning 活动,并使用已上传的文档对其进行训练。此活动无需大量文档即可完成训练。要开始使用针对表单的技术来训练该活动,您只需要添加三份可被识别为同一表单实例的文档。
  • 向该文档技能的处理流程中添加一个 Forms 活动,并上传一张空白表单的图像。在空白表单上标注字段并训练该活动。然后在已上传的文档上测试结果。
如果您不需要将固定表单处理与其他任何活动组合使用,则可以直接在 Vantage 中为表单创建一个简单的文档技能,而无需使用 Advanced Designer。

基于 FlexiLayout 描述的文档定义

在很多情况下,您可以轻松将现有的文档定义替换为内置技能,或者使用已标注的文档在 Vantage 或 Advanced Designer 中训练新的技能。不过,也可以在 Advanced Designer 中快速创建一个与现有 FlexiLayout 等效的配置。 您可以在 Advanced Designer 中将 FlexiLayout 导入到文档技能中。可以基于 FlexiLayout 项目创建新的文档技能,或者将 FlexiLayout 导入到 Extraction Rules 活动中。OCR 语言设置会从 FlexiLayout 设置中继承,但建议在导入后检查该技能的 OCR 设置。训练结果无法迁移到 Advanced Designer,不过您可以从训练批次中导入已标注的文档,并使用它们在 Advanced Designer 中重新训练该活动。

使用 NLP 技术定义文档

已训练的模型无法导入到 Advanced Designer 中。不过,您可以在 Advanced Designer 中选择可用的 NLP 模型作为技能中的活动,上传示例文档并对该活动进行训练。若要训练您自己的 NLP 模型,请在 Advanced Designer 中的文档技能中使用 Segmentation 和/或 Deep Learning 活动。提取脚本无法在 Advanced Designer 或 Vantage 中复用。

规则验证

可以在 Vantage 或 Advanced Designer 中重新创建规则。必须重新编写脚本规则,以与 Vantage 的 JavaScript 解释器兼容。

文档组装

使用流程技能中的 Assemble 活动。要添加文档组装脚本,请在 Advanced Designer 中创建并配置一个 Document Splitter 技能。必须重写该脚本,以使其与 JavaScript 解释器兼容。

导出设置

您可以通过 Vantage API 导出处理结果,或者使用连接器将处理结果导出到各种第三方应用程序。在流程技能的 Output 活动中可以配置将结果导出到共享文件夹,并在同一活动中配置导出格式。 您可以在流程技能的 Output 活动或 Custom 活动中使用脚本配置导出。脚本需要重新编写,以便与 Vantage 的 JavaScript 解释器兼容。Vantage 支持将第三方服务的凭据存储在环境变量中,并可在这些脚本中访问这些变量。

数据表单

当您将已标注的文档或 FlexiLayout 导入 Advanced Designer 时,字段结构会自动重新创建。然后,您可以使用 Vantage 或 Advanced Designer 编辑数据表单布局。

ABBYY FlexiCapture for Invoices

Vantage 提供了大量内置技能,用于处理各种类型的文档,包括发票、收据、采购订单和商业发票。这些技能开箱即用,并且可以替代在 ABBYY FlexiCapture for Invoices 中创建的项目。
提示: 建议您先在自己的文档上测试内置技能。如果您对提取结果不满意,请继续阅读,了解如何创建或自定义技能的相关建议。
项目中使用的数据集可以以 CSV 格式上传到数据目录中。系统会自动为 Invoice、Commercial Invoice 和 Purchase Order 技能创建所需的数据目录,其列集合与数据集相同。 如果您之前使用的是在自己文档上训练的 FlexiCapture for Invoices 项目,但没有任何手动自定义设置或自定义字段,则无需在 Vantage 中配置其他设置。只需从所需的内置发票技能派生一个技能,导入带标注的文档,并在生成的文档集合上训练该派生技能即可。 如果您之前使用的是自定义 FlexiLayout,建议您从所需的内置发票技能派生一个技能,并通过导入自定义 FlexiLayout 创建一个 Extraction Rules 活动。将您创建的 Extraction Rules 活动添加在 Base: <Base Skill Name> 活动之后。此方法可用于例如提取额外的发票字段。
提示: 如果您有多个 FlexiLayout,可以添加多个 Extraction Rules 活动。例如,如果您为每个供应商准备了专用的 FlexiLayout,请将每个 FlexiLayout 作为一个独立的 Extraction Rules 活动导入,并将供应商 ID 值(由基础发票技能提取)映射到相应的活动。
您在 FlexiCapture 中使用的 FlexiLayout 可能包含许多附加设置,例如货币格式、区域设置或税率。在 Vantage 中通常不需要这些设置,因为其内置技能已经包含所有相关信息。

监控和报告

您可以在技能监控中查看和监控处理效率及处理数据。有关处理事件和错误的信息可在技能监控的 Transactions 和 Error Log 部分中查看。若要生成业务处理报告,您可以使用 Vantage 中包含的 Business Processing Reporting Warehouse。与业务事务处理无关的活动信息可在 Security Log 中查看。

Vantage 中不支持的功能列表

以下 FlexiCapture 功能在 Vantage 中不支持:
  • SLA 控制
  • 批次优先级
  • 重新扫描
  • 文档组装检查
  • 导入图像的用户附件
  • 来自热文件夹批次的说明文件
  • 二次验证
  • 分布式验证
  • 处理界面事件
  • 界面皮肤设置(仅当将人工审核客户端集成到您自己的系统时,才能移除 Vantage 徽标)
  • 自定义识别脚本
  • 服务字段
  • 指向现有字段的链接(可以通过脚本访问一个事务中所有文档的字段值)
  • OCR 语言词典
  • 规则链(只能使用 Advanced Script 规则进行设置)
  • 在导出文档时对敏感数据进行遮盖
  • 数据表单、规则名称和脚本消息的本地化