跳转到主要内容
本场景介绍如何持续开发由 Process 技能引用的 Classification 或 Document 技能。适用于以下情况:
  • 你希望汇集由人工校验(Manual Review)操作员处理的文档,并用这些文档来训练 Skill。由于 Vantage 允许累积由 Classification 或 Document 技能处理的文档,你可以在 Process 技能中调用该技能并添加Manual Review活动来启用此功能。由人工校验操作员处理的文档将被添加到相应 Classification 或 Document 技能的文档集。新文档既可用于自动训练 Skill,也可仅先收集,供 Skill Designer 进行人工审阅。更多信息,请参见在线学习
  • 你希望在不同的 Classification 和 Document 技能之间切换(而非在技能版本之间切换)。
本场景假定你已创建好一个希望为其收集文档的 Classification 或 Document 技能。

为 Online Learning 选择文档累积策略

根据您的目标和所处开发阶段,应选择合适的文档累积策略。您需要决定以下事项:
  • 在获取新文档时是否启用自动 Skill 训练(Online learning 模式)。
  • 收集所有文档,还是仅收集存在问题的文档,例如规则错误或不确定的 field(Review Documents 模式)。
开发阶段推荐策略Online learning 模式(Classification/Document skill 设置)Review Documents 模式(Process 技能的 Manual Review 活动设置)
早期 Skill 开发通过模拟文档处理,并收集由 Skill 处理的所有文档(而不仅是不确定 field 或存在规则错误的文档)来扩充文档集。多名用户可同时进行文档校验,从而向文档集中添加大量已标注的文档。完成收集后,可继续进行 Skill 开发。由于训练前可能需要先调整 Skill,因此应禁用自动训练。Collect onlyAll(默认值)
对表现正常的 Skill 进行自动微调收集在人工校验中发现问题并已修正的文档,并开启自动训练。新训练的模型会在替换旧模型前先行测试;若效果不如原模型则会被丢弃,这意味着自动训练不会降低该 Skill 的准确性。Collect and learn(默认值)With rule errors, with uncertain fields, or of unknown type
后期开发对于已调优且拥有大量文档集的 Skill,建议仅收集存在问题的文档。鉴于该 Skill 已运行良好,不建议自动重新训练。与其启用自动训练,不如不定期人工审阅所收集的文档。Collect onlyWith rule errors, with uncertain fields, or of unknown type

设置文档累积

要根据所选策略设置 Skill:
  1. 在 Vantage 中打开一个 Classification 或 Document skill。
  2. 打开 skill 设置;如果希望累积由该 Skill 处理的文档,请检查 Online learning 模式是否与所选策略一致。
    注意: 此属性仅在 Vantage 的 skill 设置中可用。
  3. 发布该 Skill,使更改对其他用户可用。
  4. 创建并设置一个 Process 技能。应包含以下内容:
    • 一个 ClassifyExtract 活动,用于引用你要训练的 Skill。如果希望累积由该 Skill 处理的文档,在将该 Skill 添加到活动时启用 Online learning
    • 一个 Manual Review 活动。如果希望累积由该 Skill 处理的文档,请确认 Review Documents 模式与所选策略一致。
    提示: 更多信息,请参见 设置 Process 技能
  5. 如有必要,为结果文件配置额外的输入源和/或额外的目标位置。更多信息,请参见 Input activityOutput activity
  6. 发布该 Process 技能。它将获得版本号,并可用于测试和生产。documents 将由 Process 技能所引用的 Classification 或 Document skill 进行处理,并将根据设置进行累积。用户可通过 API、连接器,或共享文件夹/电子邮件(如果在第 5 步中配置)访问该 Process 技能。

在已累积文档后编辑 Skill

要利用已收集的文档来优化 Skill,请按以下步骤操作:
  1. 打开你为其收集了文档的该 Skill。系统会创建此 Skill 的一个新草稿版本。由于 Process 技能仍引用已发布版本,编辑该 Skill 不会影响用户。
    注意: 从此刻起收集的所有文档只会添加到已发布版本的文档集,不会出现在你刚创建的草稿版本中。
  2. 审阅文档,进行必要的调整,并训练该 Skill。
  3. 发布该 Skill。这将创建一个版本号递增的新已发布版本。
    重要! Process 技能所引用的版本不会自动更新。因此,此时 Process 技能仍引用之前版本的 Classification/Document skill。
  4. 更新被 Process 技能引用的该 Skill 的版本:
    a. 在 Skill Catalog 中,点击 Process 技能版本号旁的上箭头。
    b. 在打开的对话框中,选择被引用 Skill 的最新版本。
    c. 点击 Save
    d. 发布 Process 技能。Process 技能的版本将被更新,使用该 Process 技能的用户将能够访问被引用 Skill 的新版本。

回滚到先前版本并测试不同策略

如果您对新版本的性能不满意,可以删除最新的 Process 技能版本。 要删除最新的 Process 技能版本,请按以下步骤操作:
  1. Skill Catalog 中,单击 Process 技能的版本号。
  2. 单击列表中最新版本旁的 Delete icon。最新版本将被永久删除。用户将切换到上一个 Process 技能版本,该版本引用您正在开发的 Classification/Document skill 的先前版本。
如果最新的 Process 技能版本包含您希望保留的更改,您可以创建一个新的 Process 技能版本,使其引用较早版本的 Classification/Document skill:
  1. 打开 Process 技能。
  2. 单击技能名称右侧的 Skill settings icon。
  3. 选择被引用技能的任意可用版本并单击 Save
  4. 发布该 Process 技能。用户将切换到新的 Process 技能版本,该版本引用所选的(不一定是倒数第二个)Classification/Document skill 版本。
随后,您可以删除 Classification/Document skill 的最新版本。如果在删除之前将此版本复制为一个新的技能,您可以将其作为独立技能继续开发。通过更改 Process 技能所引用的技能(参见上述过程的第 3 步),您可以将工作流从一个技能切换到另一个技能(例如用于比较它们的性能)。 更多信息,请参见 Skill versions
重要提示: 对技能所做的任何更改,只有在您发布该技能后,用户才能使用。