- 你希望汇集由人工校验(Manual Review)操作员处理的文档,并用这些文档来训练 Skill。由于 Vantage 允许累积由 Classification 或 Document 技能处理的文档,你可以在 Process 技能中调用该技能并添加Manual Review活动来启用此功能。由人工校验操作员处理的文档将被添加到相应 Classification 或 Document 技能的文档集。新文档既可用于自动训练 Skill,也可仅先收集,供 Skill Designer 进行人工审阅。更多信息,请参见在线学习。
- 你希望在不同的 Classification 和 Document 技能之间切换(而非在技能版本之间切换)。
为 Online Learning 选择文档累积策略
- 在获取新文档时是否启用自动 Skill 训练(Online learning 模式)。
- 收集所有文档,还是仅收集存在问题的文档,例如规则错误或不确定的 field(Review Documents 模式)。
| 开发阶段 | 推荐策略 | Online learning 模式(Classification/Document skill 设置) | Review Documents 模式(Process 技能的 Manual Review 活动设置) |
|---|---|---|---|
| 早期 Skill 开发 | 通过模拟文档处理,并收集由 Skill 处理的所有文档(而不仅是不确定 field 或存在规则错误的文档)来扩充文档集。多名用户可同时进行文档校验,从而向文档集中添加大量已标注的文档。完成收集后,可继续进行 Skill 开发。由于训练前可能需要先调整 Skill,因此应禁用自动训练。 | Collect only | All(默认值) |
| 对表现正常的 Skill 进行自动微调 | 收集在人工校验中发现问题并已修正的文档,并开启自动训练。新训练的模型会在替换旧模型前先行测试;若效果不如原模型则会被丢弃,这意味着自动训练不会降低该 Skill 的准确性。 | Collect and learn(默认值) | With rule errors, with uncertain fields, or of unknown type |
| 后期开发 | 对于已调优且拥有大量文档集的 Skill,建议仅收集存在问题的文档。鉴于该 Skill 已运行良好,不建议自动重新训练。与其启用自动训练,不如不定期人工审阅所收集的文档。 | Collect only | With rule errors, with uncertain fields, or of unknown type |
设置文档累积
- 在 Vantage 中打开一个 Classification 或 Document skill。
-
打开 skill 设置;如果希望累积由该 Skill 处理的文档,请检查 Online learning 模式是否与所选策略一致。
注意: 此属性仅在 Vantage 的 skill 设置中可用。 - 发布该 Skill,使更改对其他用户可用。
-
创建并设置一个 Process 技能。应包含以下内容:
- 一个 Classify 或 Extract 活动,用于引用你要训练的 Skill。如果希望累积由该 Skill 处理的文档,在将该 Skill 添加到活动时启用 Online learning。
- 一个 Manual Review 活动。如果希望累积由该 Skill 处理的文档,请确认 Review Documents 模式与所选策略一致。
- 如有必要,为结果文件配置额外的输入源和/或额外的目标位置。更多信息,请参见 Input activity 和 Output activity。
- 发布该 Process 技能。它将获得版本号,并可用于测试和生产。documents 将由 Process 技能所引用的 Classification 或 Document skill 进行处理,并将根据设置进行累积。用户可通过 API、连接器,或共享文件夹/电子邮件(如果在第 5 步中配置)访问该 Process 技能。
在已累积文档后编辑 Skill
- 打开你为其收集了文档的该 Skill。系统会创建此 Skill 的一个新草稿版本。由于 Process 技能仍引用已发布版本,编辑该 Skill 不会影响用户。
注意: 从此刻起收集的所有文档只会添加到已发布版本的文档集,不会出现在你刚创建的草稿版本中。 - 审阅文档,进行必要的调整,并训练该 Skill。
- 发布该 Skill。这将创建一个版本号递增的新已发布版本。
重要! Process 技能所引用的版本不会自动更新。因此,此时 Process 技能仍引用之前版本的 Classification/Document skill。 - 更新被 Process 技能引用的该 Skill 的版本:
a. 在 Skill Catalog 中,点击 Process 技能版本号旁的上箭头。
b. 在打开的对话框中,选择被引用 Skill 的最新版本。
c. 点击 Save。
d. 发布 Process 技能。Process 技能的版本将被更新,使用该 Process 技能的用户将能够访问被引用 Skill 的新版本。
回滚到先前版本并测试不同策略
- 在 Skill Catalog 中,单击 Process 技能的版本号。
- 单击列表中最新版本旁的 Delete icon。最新版本将被永久删除。用户将切换到上一个 Process 技能版本,该版本引用您正在开发的 Classification/Document skill 的先前版本。
- 打开 Process 技能。
- 单击技能名称右侧的 Skill settings icon。
- 选择被引用技能的任意可用版本并单击 Save。
- 发布该 Process 技能。用户将切换到新的 Process 技能版本,该版本引用所选的(不一定是倒数第二个)Classification/Document skill 版本。
重要提示: 对技能所做的任何更改,只有在您发布该技能后,用户才能使用。
