跳转到主要内容
ABBYY Vantage 是一款智能文档处理(IDP)平台,使组织能够从各种类型的文档(结构化、半结构化和非结构化)中提取结构化数据。其核心组件之一是 Skill Designer,它使用户能够创建、训练和部署 ABBYY 所称的 技能(Skills)——用于文档分类、数据提取以及集成到业务/流程工作流中的模型和规则。 简而言之,Skill Designer 允许您构建“文档技能”(文档类型定义和提取规则)、“分类技能”(用于识别文档所属的类型)以及“流程技能”(用于将分类、文档技能和业务规则组合成多步骤逻辑流程)。

Skill Designer 中的技能类型

在 Skill Designer 中,您可以使用以下类型的技能:
  • 分类技能
  • 文档技能
  • OCR 技能
  • 流程技能

工作原理

以下是使用 Skill Designer 的整体流程:
  1. 定义/整理样本集。收集你要处理的各类示例文档(结构化、半结构化、非结构化)。
  2. 分类(如有需要)。如果存在多种文档类型,构建一个分类技能,以便自动将文档路由到正确的处理流程。
  3. 标注/标记字段。定义你希望提取的数据片段,包括在示例文档上标记字段。
  4. 训练文档技能。使用 ABBYY 的模型/训练流水线(根据复杂度选择快速学习或深度学习)来训练提取模型。
  5. 审核与验证。通过人工审核/验证发现误提取或置信度问题,并通过调整标注、业务规则等提升准确率。
  6. 发布/部署。在对性能满意后,发布该技能,以便在业务流程中使用。技能将在目录中可被发现,并可通过 API 调用。
  7. 监控与迭代。跟踪性能指标。随着时间推移,持续加入新样本以重新训练或调整该技能,从而处理更多文档的多样化情况。