关键概念
关键概念映射
| FlexiCapture 中的概念 | 在 Vantage 中的对应概念 |
|---|---|
| FlexiCapture project | 引用在 Vantage 和 Advanced Designer 中开发的其他技能(OCR、Classification、Document、Document Splitter 技能)的流程技能 |
| Batch | 事务(部分等价) |
| Batch type, project properties | 在流程技能中配置的文档处理工作流,以及技能设置和活动设置 |
| Classification batches | 分类技能中的文档集 |
| Training batches | 文档技能中的文档集(部分等价) |
| Test batches | Advanced Designer 中文档技能里的测试文档集 |
| Document Definition | 文档技能 |
| Workflow | 流程技能中的文档处理工作流 |
| Auto-learning for field extraction | 用于字段提取的文档技能在线学习 |
| NLP models | Advanced Designer 中文档技能里用于非结构化文档的活动 |
文档导入
工作流设置
工作流阶段映射
| FlexiCapture 中的工作流阶段 | 在 Vantage 中的对应项 |
|---|---|
| Scanning | ABBYY Vantage Scanning Station(未集成到流程技能活动中) |
| Rescanning | 不支持 |
| Recognition | 一个工作流,其中可以包含流程技能的 OCR、Classify、Extract 和 Assemble 活动。可以为每个 Classification 技能和文档技能分别配置 OCR 设置。流程技能中的 OCR 活动可用于为所有文档指定通用的预识别选项。Classify 活动可用于确定文档类型,并将文档路由到映射到 Extract 活动的相应文档技能,在其中提取数据。Assemble 活动可用于组装文档。 |
| Document assembly check | 不支持验证文档集合的完整性。要组装文档,可以使用流程技能的 Assemble 活动。 |
| Batch integrity check | 在文档发送到 Vantage 之前,Scanning Stations 会执行自动批次完整性检查。操作员也可以在 Scanning Station 上运行手动检查。 |
| Data verification, verification, export confirmation | 流程技能的人工审核活动。 |
| Export | 流程技能的 Output 活动或 Custom 活动。 |
| Processed, Exceptions | 由 Vantage 自动分配的事务状态。您可以在技能监控的 Transactions 部分查看事务状态。 |
| User type | 流程技能的 Condition 活动或 Custom 活动。 |
用户角色
角色映射
| FlexiCapture 中的角色 | Vantage 中的角色 |
|---|---|
| Scanning Operator | Skill User |
| Data Verification Operator | Manual Review Operator(可限制访问特定技能和人工审核阶段) |
| Verification Operator | Manual Review Operator(可限制访问特定技能和人工审核阶段) |
| Senior Verification Operator | Processing Supervisor |
| Project Settings Editor | Skill Designer |
| Monitoring Operator | Processing Supervisor(同时可访问人工审核) |
| Administrator | Tenant Administrator |
| Web Capture Operator | Skill User + Manual Review Operator |
| Operators Manager | Tenant Administrator(这是唯一允许管理用户权限的角色) |
分类
文档定义
提示: 与 FlexiCapture 相比,Vantage 中的数据提取技术已经进行了重大变更和改进。Vantage 中可用的提取规则和其他活动的工作方式与其在 FlexiCapture 中的对应功能不同,这意味着在某些情况下结果可能会有所差异。在将文档定义替换为文档技能之后,请务必确认提取结果符合您的预期。
固定文档定义
- 向该文档技能的处理流程中添加一个 Fast Learning 活动,并使用已上传的文档对其进行训练。此活动无需大量文档即可完成训练。要开始使用针对表单的技术来训练该活动,您只需要添加三份可被识别为同一表单实例的文档。
- 向该文档技能的处理流程中添加一个 Forms 活动,并上传一张空白表单的图像。在空白表单上标注字段并训练该活动。然后在已上传的文档上测试结果。
基于 FlexiLayout 描述的文档定义
使用 NLP 技术定义文档
规则验证
文档组装
导出设置
数据表单
ABBYY FlexiCapture for Invoices
提示: 建议您先在自己的文档上测试内置技能。如果您对提取结果不满意,请继续阅读,了解如何创建或自定义技能的相关建议。项目中使用的数据集可以以 CSV 格式上传到数据目录中。系统会自动为 Invoice、Commercial Invoice 和 Purchase Order 技能创建所需的数据目录,其列集合与数据集相同。 如果您之前使用的是在自己文档上训练的 FlexiCapture for Invoices 项目,但没有任何手动自定义设置或自定义字段,则无需在 Vantage 中配置其他设置。只需从所需的内置发票技能派生一个技能,导入带标注的文档,并在生成的文档集合上训练该派生技能即可。 如果您之前使用的是自定义 FlexiLayout,建议您从所需的内置发票技能派生一个技能,并通过导入自定义 FlexiLayout 创建一个 Extraction Rules 活动。将您创建的 Extraction Rules 活动添加在
Base: <Base Skill Name> 活动之后。此方法可用于例如提取额外的发票字段。
提示: 如果您有多个 FlexiLayout,可以添加多个 Extraction Rules 活动。例如,如果您为每个供应商准备了专用的 FlexiLayout,请将每个 FlexiLayout 作为一个独立的 Extraction Rules 活动导入,并将供应商 ID 值(由基础发票技能提取)映射到相应的活动。您在 FlexiCapture 中使用的 FlexiLayout 可能包含许多附加设置,例如货币格式、区域设置或税率。在 Vantage 中通常不需要这些设置,因为其内置技能已经包含所有相关信息。
监控和报告
Vantage 中不支持的功能列表
- SLA 控制
- 批次优先级
- 重新扫描
- 文档组装检查
- 导入图像的用户附件
- 来自热文件夹批次的说明文件
- 二次验证
- 分布式验证
- 处理界面事件
- 界面皮肤设置(仅当将人工审核客户端集成到您自己的系统时,才能移除 Vantage 徽标)
- 自定义识别脚本
- 服务字段
- 指向现有字段的链接(可以通过脚本访问一个事务中所有文档的字段值)
- OCR 语言词典
- 规则链(只能使用 Advanced Script 规则进行设置)
- 在导出文档时对敏感数据进行遮盖
- 数据表单、规则名称和脚本消息的本地化
