跳转到主要内容
本场景描述如何实现对由流程技能引用的分类或文档技能的持续开发。本场景适用于以下情况:
  • 如果您希望累积由人工审核操作员处理的文档,并使用这些文档来训练技能。由于 Vantage 允许累积由分类或文档技能处理的文档,您可以通过在流程技能中调用该技能并使用 人工审核 活动来利用此功能。由人工审核操作员处理的文档将被添加到相应分类或文档技能的文档集。新文档既可以用于自动技能训练,也可以仅被收集起来,供技能设计人员在 Skill Designer 中进行人工审核。有关更多信息,请参见 Online Learning
  • 如果您希望在不同的分类和文档技能之间切换(而不是在技能版本之间切换)。
本场景假定您已经创建了一个分类或文档技能,并希望为其收集文档。

为在线学习选择文档累积策略

根据您的目标和当前开发阶段,您需要选择合适的文档累积策略。您需要决定是否要:
  • 在获取新文档时启用或禁用自动技能训练(Online learning 模式)。
  • 收集所有文档,还是仅收集存在问题的文档,例如有规则错误或不确定的字段(Review Documents 模式)。
开发阶段推荐策略在线学习模式(Classification/文档技能设置)Review Documents 模式(流程技能的人工审核活动设置)
技能早期开发通过模拟文档处理并收集由该技能处理的所有文档(而不仅是仅包含不确定字段和规则错误的文档),来扩大文档集。多个用户可以协同工作,同时审核文档,从而向文档集中添加大量已标注的文档。完成文档收集后,您可以继续进行技能开发。在训练之前,可能需要对技能进行调整,因此应禁用自动训练。仅收集 (Collect only)全部 (All)(默认值)
性能正常的技能的自动微调收集在人工审核期间存在问题并已被更正的文档,并启用自动训练。新训练的模型在替换旧模型之前会先进行测试,如果其性能不如旧模型,则会被丢弃,这意味着自动训练不会降低技能的准确性。收集并学习 (Collect and learn)(默认值)具有规则错误、具有不确定字段或未知类型的文档
后期开发对于已调整良好且拥有大量文档集的技能,您可能只想收集存在问题的文档。由于该技能已经运行良好,不建议对其进行自动重新训练。此时不应启用自动技能训练,而是应不定期地手动审核所收集的文档。仅收集 (Collect only)具有规则错误、具有不确定字段或未知类型的文档

设置文档累积

要根据选定的策略配置技能:
  1. 在 Vantage 中打开一个 Classification 或 Document 技能。
  2. 打开技能设置,如果你希望累积由该技能处理的文档,请检查 Online learning 模式是否符合所选策略。
    **注意:**此属性仅可在 Vantage 的技能设置中配置。
  3. 发布该技能,使更改对其他用户生效。
  4. 创建并配置一个流程技能(Process skill)。它应包含以下内容:
    • 一个 ClassifyExtract 活动,用于引用你希望训练的技能。如果你希望累积由该技能处理的文档,请在将技能添加到该活动时启用 Online learning
    • 一个 Manual Review 活动。如果你希望累积由该技能处理的文档,请确认 Review Documents 模式符合所选策略。
    **提示:**有关更多信息,请参阅 设置流程技能
  5. 如有必要,为结果文件配置额外的输入源和/或额外的目标位置。有关更多信息,请参阅 Input activityOutput activity
  6. 发布流程技能(Process skill)。它将获得一个版本号,并可用于测试和生产。文档将由流程技能所引用的 Classification 或 Document 技能处理,并将根据设置进行累积。用户可以通过 API、连接器,或通过共享文件夹/电子邮件(如果在步骤 5 中已进行配置)访问该流程技能。

在已累积文档后编辑技能

要使用已收集的文档来调整技能,请按照以下步骤操作:
  1. 打开为其收集了文档的技能。系统会创建该技能的新草稿版本。由于流程技能仍然引用已发布版本,因此编辑该技能不会影响用户。
    注意: 从现在开始收集的所有文档只会添加到已发布版本的文档集中。它们不会出现在刚刚创建的草稿版本中。
  2. 查看文档,进行必要的调整,并训练该技能。
  3. 发布该技能。这将创建一个版本号递增的新发布版本。
    重要! 流程技能引用的版本不会自动更新。因此,此时流程技能仍然引用先前版本的分类/文档技能。
  4. 更新流程技能所引用的该技能版本:
    a. 在 技能目录 中,单击流程技能版本号旁边的向上箭头。
    b. 在打开的对话框中,选择所引用技能的最新版本。
    c. 单击 Save
    d. 发布流程技能。流程技能版本将被更新,使用该流程技能的用户将可以访问所引用技能的新版本。

回滚到先前版本并测试不同策略

如果您对新版本的性能不满意,可以删除最新的流程技能版本。 要删除最新的流程技能版本,请按以下步骤操作:
  1. 技能目录 中,单击该流程技能的版本号。
  2. 单击列表中最新版本旁边的 Delete 图标。最新版本将被永久删除。用户将会切换到上一版本的流程技能,该流程技能引用的是您正在开发的分类/文档技能的上一版本。
如果最新的流程技能版本包含您希望保留的更改,您可以创建一个新的流程技能版本,并让其引用较早版本的分类/文档技能:
  1. 打开该流程技能。
  2. 单击技能名称右侧的 Skill settings 图标。
  3. 选择任一可用的被引用技能版本并单击 Save
  4. 发布该流程技能。用户将会切换到新的流程技能版本,该版本引用的是您正在开发的分类/文档技能的所选版本(不一定是倒数第二个版本)。
然后,您可以删除分类/文档技能的最新版本。如果在删除之前将此版本复制为一个新的技能,您可以将其作为单独的技能继续开发。通过更改流程技能所引用的技能(参见以上步骤 3),您可以将工作流从一个技能切换到另一个技能(例如,用于比较它们的性能)。 欲了解更多信息,请参见 技能版本
重要! 对技能所做的任何更改,只有在您发布该技能之后,用户才能使用。