跳转到主要内容

概述

在 ABBYY Vantage 中构建任何文档处理工作流之前,您需要先决定使用哪种技能。提前做出正确的选择可以节省大量时间,并避免返工。 您将了解:
  • 什么是基础技能、派生技能和新技能
  • 各种方法之间的关键区别
  • 如何基于基础技能创建派生技能
  • 如何从头开始创建新技能
  • 在您的情况下应选择哪种方法
阅读时间: ~5 分钟

了解三种技能类型

基础技能派生技能新技能
来源由 ABBYY 提供从基础技能复制而来从零开始构建
可编辑
预训练是 (继承)否——需要您自行训练
随 ABBYY 发布版本更新是 (自动)可选 (手动同步)
最适合直接使用或作为起点自定义现有技能完全自定义的文档类型

基础技能

什么是

基础技能是 ABBYY 提供的预训练只读技能。它们旨在开箱即用地处理常见文档类型——发票、采购订单、身份证件等。您不能直接编辑基础技能,但可以按原样使用它,或将其作为派生技能的起点。

在哪里可以找到它们

基础技能列在 技能目录 中。要打开该目录:
  1. 登录您的 ABBYY Vantage 租户。
  2. 在左侧边栏中,单击 技能目录
  3. 按文档类型浏览或搜索技能。
带有锁形图标或“只读”标签的技能就是基础技能。 显示内置基础技能的技能目录

使用基础技能可以执行的操作

  • 可直接用于流程技能工作流中——无需配置。
  • 如果您需要自定义字段、验证或识别设置,可以基于它创建派生技能
您不能重命名、重新训练或修改基础技能的内部配置。

派生技能

什么是派生技能

派生技能是基础技能的一个完整且可编辑的副本。创建派生技能时,你会继承其所有预训练的提取逻辑、字段定义和识别设置,然后可以对其中任意内容进行自定义。

何时使用派生技能

在以下情况下,请使用派生技能:
  • 已有适用于您的文档类型的基础技能,但它并不完全符合您的需求。
  • 您需要添加、删除或重命名字段。
  • 您希望调整验证规则或置信度阈值。
  • 您希望在 ABBYY 预训练的基础上,再结合您自己的配置。

如何创建派生技能

  1. 在左侧边栏中,单击 Skill Catalog
  2. 找到要派生的基础技能。
  3. 单击该技能,打开其详情页。
  4. 单击 Create and Edit Derived Skill Create and Edit Derived Skill button
  5. 单击 Create and Edit Derived Skill
Second Create and Edit Derived Skill button 该技能会在编辑器中打开。
  1. 上传文档,或通过拖放文档开始操作。
  2. 现在,您可以:
    • 添加或删除提取字段
    • 修改字段标签和验证规则
    • 调整识别设置
    • 根据需要上传更多训练文档
  3. 完成技能编辑后,单击 Train.
Skill Designer Train button
  1. 训练完成后,单击 Publish,使该技能可在 Process Skills 中使用。
Skill Designer Publish button

基础技能更新后如何更新派生技能

当 ABBYY 发布基础技能更新时,您的派生技能不会自动继承这些更改。要应用更新,请执行以下操作:
  1. 在 Skill Catalog 中,查找派生技能版本号旁边的更新图标
  2. 单击更新图标并选择 Update,或者打开派生技能,单击 settings 图标,选择基础技能的最新版本,然后单击 Save
  3. 派生技能会自动重新训练。测试该技能并根据需要进行调整。
  4. 单击 Publish,使更新后的版本可供使用。
如果您在更新后对提取结果不满意,请不要发布该技能。请改为在 Skill Catalog 中选择该技能并单击 Discard changes,以使用先前的版本。

新技能

什么是新技能

新技能完全通过 Skill Designer 从零构建。它没有预训练基础,您需要自行定义字段、上传训练文档、标注数据并训练模型。

何时使用新技能

在以下情况下使用新技能:
  • 没有适用于您的文档类型的基础技能。
  • 您的文档具有高度自定义或专有的布局。
  • 您需要完全掌控提取模型。

新技能类型

技能类型用途
文档技能从文档中提取结构化数据字段
分类技能按类型对文档进行分类
OCR 技能从文档图像中提取文本,并将结果导出为 PDF、DOCX 等格式;支持设置识别语言、手写识别、图像预处理和条码检测等选项
拆分技能将多文档文件中的页面流拆分为单独的文档,以便进一步处理
流程技能编排端到端的文档工作流,整合分类、提取、审阅和导出等活动

如何创建新的文档技能

  1. 技能目录 中,单击工具栏上的 Create 按钮。
  2. 从显示的菜单中选择 文档技能 显示技能类型选项的 Skill Designer“Create”对话框
  3. 输入技能名称,以及可选的描述。
  4. 单击 Create,打开 Skill Designer 编辑器。
  5. 文档 选项卡中,上传用于训练的示例文档。先在一个文档上标注字段;随着你添加更多不同类型的示例,准确率会提高。
  6. Editor 选项卡中,使用标注工具标记并标注要从每个文档中提取的字段。
  7. 操作窗格 中单击 Train,根据已标注的数据构建提取模型。
  8. 检查提取准确率,纠正错误,并重复步骤 5–7,直到结果令人满意。
  9. 当结果符合要求时,单击 Publish
你提供的训练文档越多,类型越丰富,提取模型的准确率就越高。

决策指南

使用本指南选择合适的方法:
  1. ABBYY 是否为您的文档类型提供了预构建的技能?
    • 查看技能目录。
    • 如果是 → 从 基础技能 开始。可直接在流程技能中使用它。
  2. 基础技能是否开箱即用,效果已足够好?
    • 如果是 → 直接使用 基础技能。无需自定义。
    • 如果否 (缺少字段、验证有误、布局不匹配) → 创建 派生技能
  3. 您的文档类型是否没有对应的基础技能?
    • 如果确实没有 → 在 Skill Designer 中创建一个 新技能
简而言之:
SituationRecommended Approach
ABBYY has a skill and it works基础技能
ABBYY has a skill, but it needs tweaks派生技能
No suitable Base Skill exists新技能

摘要

  • 基础技能为预训练技能,可直接使用,且无法编辑。
  • 派生技能是基础技能的可编辑副本,并继承其预训练逻辑。
  • 新技能从零开始构建,需要使用您自己的训练数据。
  • 如果可以,尽量从基础技能开始;只有在确有需要时,才派生或新建技能。

下一步