跳转到主要内容
ABBYY Vantage 是一款智能文档处理(IDP)平台,可让组织从各种类型的文档(结构化、半结构化、非结构化)中提取结构化数据。其核心组件之一是 Skill Designer,它使用户能够创建、训练和部署 ABBYY 所称的 Skill —— 用于文档分类、数据提取以及集成到业务/流程工作流中的模型或规则。 简而言之,Skill Designer 允许您构建 “Document skill”(文档类型定义和提取规则)、“Classification skill”(用于检测文档所属类型)、以及 “Process 技能”(用于组合多步骤逻辑,将分类、Document skill 和业务规则串联在一起)。

在 Skill Designer 中的 Skill 类型

您可以在 Skill Designer 中使用以下 Skill:
  • 分类 Skill
  • Document skill
  • Optical Character Recognition (OCR) Skill
  • Process 技能

工作原理

以下是使用 Skill Designer 的高层流程:
  1. 定义/整理样本集。收集你要处理的文档类型的样本(结构化、半结构化、非结构化)。
  2. 分类(如需)。如果存在多种文档类型,构建一个 Classification skill,以便将 documents 自动路由到正确的处理流程。
  3. 标注字段。明确你希望提取的数据要素,并在样本文档上标记字段。
  4. 训练 Document skill。使用 ABBYY 的模型/训练管道(根据复杂度选择快速学习或深度学习)来训练提取模型。
  5. 审核与验证。通过人工审核/验证发现误提取或置信度问题。调整标注、业务规则等,以提升准确性。
  6. 发布/部署。当对性能满意后,发布该 Skill,使其可在业务工作流中使用。Skills 将可被发现,并可通过 API 调用。
  7. 监控与迭代。跟踪性能指标。随着时间推移,加入新的样本以重新训练或调整该 Skill,以处理更多文档变体。