关键概念
关键概念映射
| FlexiCapture 中的概念 | 在 Vantage 中的对应概念 |
|---|---|
| FlexiCapture 项目 | 在 Vantage 和 Advanced Designer 中开发的、引用其他 Skill(OCR、Classification、Document、Document Splitter)的 Process 技能 |
| 批次 | 事务(Transaction)(部分对应) |
| 批次类型、项目属性 | 在 Process 技能中配置的文档处理工作流,以及 Skill 设置和 Activity 设置 |
| 分类批次 | 分类 Skill 的文档集 |
| 训练批次 | Document skill 中的文档集(部分对应) |
| 测试批次 | Advanced Designer 中某个 Document skill 的测试文档集 |
| 文档定义 | Document skill |
| 工作流 | Process 技能中的文档处理工作流 |
| 字段提取的自动学习 | 面向 Document skill 的在线学习 |
| NLP 模型 | Advanced Designer 中 Document skill 用于非结构化文档的 Activities |
导入文档
工作流设置
工作流阶段映射
| FlexiCapture 中的工作流阶段 | 在 Vantage 中的对应项 |
|---|---|
| 扫描 | ABBYY Vantage Scanning Station(未集成到 Process 技能的活动中) |
| 重新扫描 | 不支持 |
| 识别 | 可能包含 Process 技能的 OCR、Classify、Extract 和 Assemble 活动的工作流。可为每个 Classification 和 Document skill 分别配置 OCR 设置。Process 技能中的 OCR 活动可用于为所有文档指定通用的预识别选项。Classify 活动可用于确定文档类型,并将文档路由至映射到 Extract 活动的相应 Document skill,在其中提取数据。Assemble 活动可用于组装文档。 |
| 文档组装检查 | 不支持对文档集合的完整性进行验证。要组装文档,可以使用 Process 技能的 Assemble 活动。 |
| 批处理完整性检查 | Scanning Station 会在文档发送到 Vantage 之前自动执行批处理完整性检查。操作员也可以在 Scanning Station 上进行手动检查。 |
| 数据核验、核验、导出确认 | Process 技能的 Manual Review 活动。 |
| 导出 | Process 技能的 Output 活动或 Custom 活动。 |
| Processed、Exceptions | 由 Vantage 自动分配的事务(Transaction)状态。您可以在 Skill Monitor 的 Transactions 部分查看事务状态。 |
| 用户类型 | Process 技能的 Condition 活动或 Custom 活动。 |
用户角色
角色映射
| FlexiCapture 中的角色 | Vantage 中的角色 |
|---|---|
| Scanning Operator | Skill 用户 |
| Data Verification Operator | 人工校验操作员(可限制对特定 Skill 和人工校验阶段的访问权限) |
| Verification Operator | 人工校验操作员(可限制对特定 Skill 和人工校验阶段的访问权限) |
| Senior Verification Operator | 处理主管 |
| Project Settings Editor | Skill Designer |
| Monitoring Operator | 处理主管(同时可访问人工校验) |
| Administrator | 租户管理员 |
| Web Capture Operator | Skill 用户 + 人工校验操作员 |
| Operators Manager | 租户管理员(唯一可管理用户权限的角色) |
分类
Document 定义
提示: 与 FlexiCapture 相比,Vantage 的数据提取技术已进行了重大变更与改进。Vantage 中可用的 Extraction Rules 和其他活动的工作方式与其在 FlexiCapture 中的对应项不同,这意味着在某些情况下结果可能有所差异。在将您的 Document 定义替换为 Document skill 之后,请务必确认提取结果满足需求。
固定文档定义
- 在该 Document skill 的处理流程中添加 Fast Learning 活动,并使用已上传的文档进行训练。此活动的训练不需要大量文档。要基于表单技术开始训练,只需添加三份可被识别为同一表单实例的文档。
- 在该 Document skill 的处理流程中添加 Forms 活动,并上传一张空白表单的图像。为空白表单上的字段添加标签并训练该活动。使用已上传的文档测试结果。
基于灵活描述的 Document 定义
使用 NLP 技术进行文档定义
规则验证
文档组装
导出设置
数据表单
ABBYY FlexiCapture for Invoices
提示: 建议您先在自己的文档上测试内置 Skill。若对提取结果不满意,请继续阅读,了解如何创建或自定义 Skill 的建议。项目所用的数据集可以以 CSV 格式上传到数据目录(data catalog)。系统会为 Invoice、Commercial Invoice 和 Purchase Order Skill 自动创建所需的数据目录,并配置与数据集对应的一组列。 如果您之前使用的是在您的文档上训练、但未进行手动自定义设置或自定义 field 的 FlexiCapture for Invoices 项目,则无需在 Vantage 中进行任何额外配置。只需从所需的内置发票 Skill 派生一个 Skill,导入已标注的文档,并在生成的文档集上训练该派生 Skill。 如果您之前使用了自定义 FlexiLayout,建议您从所需的内置发票 Skill 派生一个 Skill,并通过导入自定义 FlexiLayout 创建一个 Extraction Rules 活动。将创建的 Extraction Rules 活动添加在
Base: <Base Skill Name> 活动之后。该方法可用于例如提取附加的发票字段。
提示: 如果您有多个 FlexiLayout,可以添加多个 Extraction Rules 活动。例如,如果您为每个 Vendor 都配置了专用的 FlexiLayout,请将每个 FlexiLayout 作为一个 Extraction Rules 活动导入,并将 Vendor ID 值(由基础发票 Skill 提取)映射到相应的活动。您在 FlexiCapture 中使用的 FlexiLayout 可能包含许多其他设置,例如币种格式、区域设置或税率。这些设置通常在 Vantage 中不再需要,因为其内置 Skill 已包含所有相关信息。
监控与报告
Vantage 中不支持的功能列表
- SLA 控制
- 批次优先级
- 重新扫描
- 文档组装检查
- 为已导入图像添加用户附件
- 来自热文件夹的批次描述文件
- 双重校验
- 分布式校验
- 处理界面事件
- 皮肤设置(仅当在您自己的系统中集成人工校验客户端时,才能移除 Vantage 标识)
- 自定义识别脚本
- 服务字段
- 指向现有 field 的链接(可通过脚本访问某个处理事务中所有文档的 field 值)
- Optical Character Recognition (OCR) 语言词典
- 规则链(只能通过高级脚本规则进行设置)
- 导出文档时对敏感数据进行遮盖
- 数据表单、规则名称和脚本消息的本地化
