跳转到主要内容
本文面向准备迁移至 Vantage 的 FlexiCapture 用户。Vantage 允许你复用 FlexiCapture 项目中的多种组件,包括 FlexiLayout。它还让你受益于全新的强大机器学习技术,你可以轻松使用现有的已标注文档进行训练。 我们建议你先查看 Vantage 中的内置 Skill。在大多数情况下,它们的效果至少可与现有的 FlexiCapture 项目相当。Advanced Designer 与 Vantage 所提供的高效训练能力也可能使你无需复用在 FlexiLayout Studio 中创建的 FlexiLayout。 Skill Catalog 中提供了 50 多个内置 Skill。除其他之外,Vantage 还提供用于处理发票、采购订单、收据和商业发票的 Skill,能够成功替代 ABBYY FlexiCapture for Invoices

关键概念

在 Vantage 中,文档是在处理事务中进行处理的。与批次不同,处理事务不分配类型。处理某个处理事务的流程和 Optical Character Recognition (OCR)(OCR)设置由负责该处理事务的 Skill 定义。 通常,您需要将 Document Definitions 替换为内置或手动配置的 Document skill,创建一个 Process 技能,并配置其处理流程,将文档路由到相应的 Document skill 和其他处理阶段。

关键概念映射

FlexiCapture 中的概念在 Vantage 中的对应概念
FlexiCapture 项目在 Vantage 和 Advanced Designer 中开发的、引用其他 Skill(OCR、Classification、Document、Document Splitter)的 Process 技能
批次事务(Transaction)(部分对应)
批次类型、项目属性在 Process 技能中配置的文档处理工作流,以及 Skill 设置和 Activity 设置
分类批次分类 Skill 的文档集
训练批次Document skill 中的文档集(部分对应)
测试批次Advanced Designer 中某个 Document skill 的测试文档集
文档定义Document skill
工作流Process 技能中的文档处理工作流
字段提取的自动学习面向 Document skill 的在线学习
NLP 模型Advanced Designer 中 Document skill 用于非结构化文档的 Activities

导入文档

可以使用 ABBYY Vantage Scanning Stations 完全替代 FlexiCapture 12 Scanning Stations。 可以在 Process 技能的 Input 活动中配置从热文件夹(在 Vantage 中称为共享文件夹)或从电子邮件导入。源类型、源文件名以及有关电子邮件的信息都会自动保存到注册 Parameter 中。 您还可以通过 Vantage API 导入文档并设置自定义注册 Parameter](/zh/vantage/documentation/developer-guide/registration-parameters),或使用 connectors 从各种第三方应用程序导入文档。

工作流设置

要复现批处理工作流,请配置一个 Process 技能。在 Vantage 中,Process 技能中的活动对应各个处理阶段。文档集是指同一处理事务中的一组文档。

工作流阶段映射

FlexiCapture 中的工作流阶段在 Vantage 中的对应项
扫描ABBYY Vantage Scanning Station(未集成到 Process 技能的活动中)
重新扫描不支持
识别可能包含 Process 技能的 OCR、Classify、Extract 和 Assemble 活动的工作流。可为每个 Classification 和 Document skill 分别配置 OCR 设置。Process 技能中的 OCR 活动可用于为所有文档指定通用的预识别选项。Classify 活动可用于确定文档类型,并将文档路由至映射到 Extract 活动的相应 Document skill,在其中提取数据。Assemble 活动可用于组装文档。
文档组装检查不支持对文档集合的完整性进行验证。要组装文档,可以使用 Process 技能的 Assemble 活动。
批处理完整性检查Scanning Station 会在文档发送到 Vantage 之前自动执行批处理完整性检查。操作员也可以在 Scanning Station 上进行手动检查。
数据核验、核验、导出确认Process 技能的 Manual Review 活动。
导出Process 技能的 Output 活动或 Custom 活动。
Processed、Exceptions由 Vantage 自动分配的事务(Transaction)状态。您可以在 Skill Monitor 的 Transactions 部分查看事务状态。
用户类型Process 技能的 Condition 活动或 Custom 活动。
仅当工作流包含 Manual Review 活动时,Vantage 中的工作流才需要与人工操作员交互。

用户角色

Vantage 支持在一个 Process 技能中创建多个人工校验活动。Manual Review Operator 的访问权限可以限定为特定的人工校验阶段。要创建用户并编辑其权限,请在 Vantage 中进入 Users 选项卡。

角色映射

FlexiCapture 中的角色Vantage 中的角色
Scanning OperatorSkill 用户
Data Verification Operator人工校验操作员(可限制对特定 Skill 和人工校验阶段的访问权限)
Verification Operator人工校验操作员(可限制对特定 Skill 和人工校验阶段的访问权限)
Senior Verification Operator处理主管
Project Settings EditorSkill Designer
Monitoring Operator处理主管(同时可访问人工校验)
Administrator租户管理员
Web Capture OperatorSkill 用户 + 人工校验操作员
Operators Manager租户管理员(唯一可管理用户权限的角色)

分类

分类模型无法在 Vantage 中直接复用。 如需识别不同类型的文档,请创建一个 Classification skill。在该 Skill 中,您可以上传用于在 FlexiCapture 中训练分类模型的文档,创建相同的类别,并在 Vantage 中训练该 Skill。随后,您可以在 Process 技能的 Classify 活动中使用此 Skill,并将这些类别映射到 Extract 活动。每个 Extract 活动都会使用一个 Document skill,可将其视为 Document Definition 部分的对应项。 在 Vantage 中,聚类始终启用,因此同一类型文档的不同变体可能会被自动识别。但如果版式差异较大,请考虑在 Advanced Designer 中创建一个 Document skill,将 Classify 活动添加到其工作流中,并进行相应训练。您可以设置一个 Extraction Rules 活动(在某种程度上等同于 FlexiLayout),并在 Classify 活动之后放置一组 Extraction Rules 活动,使系统能够根据文档变体自动选择相应的规则。 对于在输入页流中分隔文档的场景,请在 Process 技能中添加一个 Assemble 活动。您也可能需要在 Advanced Designer 中创建并配置一个 Document Splitter skill。

Document 定义

通常,您需要将针对不同文档类型的 Document 定义替换为相应的 Document skill。对于同一类型文档的不同变体,其 Document 定义必须在单个 Document skill 中用单独的活动进行替换。如果一个 Document 定义包含多个部分,则每个部分都必须替换为相应的 Document skill。 OCR 设置和手写体识别在一个 Document skill 的范围内进行配置。如果您使用 Process 技能将文档路由到不同的 Document skill,还可以在 OCR 活动中配置通用的预识别设置(语言、手写体识别和条码)。请注意,手写体识别在 Document skill 设置中默认启用,而在 OCR 活动中默认禁用。
提示: 与 FlexiCapture 相比,Vantage 的数据提取技术已进行了重大变更与改进。Vantage 中可用的 Extraction Rules 和其他活动的工作方式与其在 FlexiCapture 中的对应项不同,这意味着在某些情况下结果可能有所差异。在将您的 Document 定义替换为 Document skill 之后,请务必确认提取结果满足需求。

固定文档定义

用于表单的 Document Definition 无法在 Vantage 中直接复用。若内置的 Skill 都不符合需求,请从 FlexiCapture 导出相应的一批已标注的文档,并将其导入在 Advanced Designer 中新建的 Document skill。然后你有两种选择:
  • 在该 Document skill 的处理流程中添加 Fast Learning 活动,并使用已上传的文档进行训练。此活动的训练不需要大量文档。要基于表单技术开始训练,只需添加三份可被识别为同一表单实例的文档。
  • 在该 Document skill 的处理流程中添加 Forms 活动,并上传一张空白表单的图像。为空白表单上的字段添加标签并训练该活动。使用已上传的文档测试结果。
如果你不需要将固定表单的处理与其他活动组合使用,可以直接在 Vantage 中创建一个用于表单的简易 Document skill,而无需使用 Advanced Designer。

基于灵活描述的 Document 定义

在许多情况下,你可以轻松地用内置的 Skill 替换现有的 Document 定义,或者在 Vantage 或 Advanced Designer 中使用已标注的文档训练新的 Skill。不过,也有一种快捷方式,可在 Advanced Designer 中创建与现有 FlexiLayout 等效的方案。 你可以在 Advanced Designer 中将 FlexiLayout 导入到 Document skill 中。可以基于该 FlexiLayout 项目创建新的 Document skill,或将 FlexiLayout 导入到 Extraction Rules 活动。OCR 语言设置会从 FlexiLayout 设置中继承,但我们建议在导入后检查该 Skill 的 OCR 设置。训练结果无法迁移到 Advanced Designer,不过你可以从训练批次中导入已标注的文档,并用它们在 Advanced Designer 中重新训练该活动。

使用 NLP 技术进行文档定义

已训练的模型无法导入到 Advanced Designer。不过,您可以在 Advanced Designer 中将可用的 NLP 模型作为 Skill 活动来使用,上传示例文档并训练该活动。若要训练您自己的 NLP 模型,请在 Advanced Designer 的 Document skill 中使用 Segmentation 和/或 Deep Learning 活动。提取脚本无法在 Advanced Designer 或 Vantage 中复用。

规则验证

可以在 Vantage 或 Advanced Designer 中重新创建规则。脚本规则必须重写,才能兼容 Vantage 的 JavaScript 解释器。

文档组装

使用 Process 技能中的 Assemble 活动。要添加文档组装脚本,请在 Advanced Designer 中创建并配置一个 Document Splitter 技能。需重写该脚本以确保与 JavaScript 解释器兼容。

导出设置

您可以通过 Vantage API 导出处理结果,或使用连接器将处理结果导出到各类第三方应用程序。可以在 Process 技能的 Output 活动中配置导出到共享文件夹。也可在同一活动中配置导出格式。 您可以在 Process 技能的 Output 活动或 Custom 活动中通过脚本配置导出。为与 Vantage 的 JavaScript 解释器兼容,必须对脚本进行重写。Vantage 支持将第三方服务的凭据存储在环境变量中,可在这些脚本中访问这些变量。

数据表单

当您将带标签的文档或 FlexiLayout 导入 Advanced Designer 时,字段结构会自动重新创建。随后,您可以使用 Vantage 或 Advanced Designer 来编辑数据表单的布局。

ABBYY FlexiCapture for Invoices

Vantage 提供了大量内置 Skill,可用于处理各类文档,包括发票、收据、采购订单和商业发票。这些 Skill 开箱即用,并且可以替代在 ABBYY FlexiCapture for Invoices 中创建的项目。
提示: 建议您先在自己的文档上测试内置 Skill。若对提取结果不满意,请继续阅读,了解如何创建或自定义 Skill 的建议。
项目所用的数据集可以以 CSV 格式上传到数据目录(data catalog)。系统会为 Invoice、Commercial Invoice 和 Purchase Order Skill 自动创建所需的数据目录,并配置与数据集对应的一组列。 如果您之前使用的是在您的文档上训练、但未进行手动自定义设置或自定义 field 的 FlexiCapture for Invoices 项目,则无需在 Vantage 中进行任何额外配置。只需从所需的内置发票 Skill 派生一个 Skill,导入已标注的文档,并在生成的文档集上训练该派生 Skill。 如果您之前使用了自定义 FlexiLayout,建议您从所需的内置发票 Skill 派生一个 Skill,并通过导入自定义 FlexiLayout 创建一个 Extraction Rules 活动。将创建的 Extraction Rules 活动添加在 Base: <Base Skill Name> 活动之后。该方法可用于例如提取附加的发票字段。
提示: 如果您有多个 FlexiLayout,可以添加多个 Extraction Rules 活动。例如,如果您为每个 Vendor 都配置了专用的 FlexiLayout,请将每个 FlexiLayout 作为一个 Extraction Rules 活动导入,并将 Vendor ID 值(由基础发票 Skill 提取)映射到相应的活动。
您在 FlexiCapture 中使用的 FlexiLayout 可能包含许多其他设置,例如币种格式、区域设置或税率。这些设置通常在 Vantage 中不再需要,因为其内置 Skill 已包含所有相关信息。

监控与报告

您可以在 Skill Monitor 中监控生产效率和处理数据。有关处理事件和错误的信息可在 Skill Monitor 的 Transactions 和 Error Log 部分查看。要生成业务处理报告,您可以使用 Vantage 随附的 Business Processing Reporting Warehouse。与业务处理事务无关的活动信息可在 Security Log 中查看。

Vantage 中不支持的功能列表

以下 FlexiCapture 功能在 Vantage 中不受支持:
  • SLA 控制
  • 批次优先级
  • 重新扫描
  • 文档组装检查
  • 为已导入图像添加用户附件
  • 来自热文件夹的批次描述文件
  • 双重校验
  • 分布式校验
  • 处理界面事件
  • 皮肤设置(仅当在您自己的系统中集成人工校验客户端时,才能移除 Vantage 标识)
  • 自定义识别脚本
  • 服务字段
  • 指向现有 field 的链接(可通过脚本访问某个处理事务中所有文档的 field 值)
  • Optical Character Recognition (OCR) 语言词典
  • 规则链(只能通过高级脚本规则进行设置)
  • 导出文档时对敏感数据进行遮盖
  • 数据表单、规则名称和脚本消息的本地化