跳转到主要内容您可以使用单独的文档集来训练分段活动。为此,请在 Skill 名称旁的下拉列表中选择分段活动。然后,在上传按钮左侧的下拉列表中,选择所需的文档集,或单击**创建集合…**以新建文档集。您可以按照Documents部分所述,在此选项卡中上传、删除和旋转文档。
设置分段活动的步骤如下:
- 在活动选项卡中,将分段活动添加到文档处理流程中。请注意,分段活动应位于从文本片段中提取字段的活动之前。
- 在活动属性窗格中,选择与要提取的片段相对应的所有字段。
注意: 仅支持类型为 Text 且数据类型设置为 Text 的字段。
- 单击活动编辑器。如有需要,请在字段选项卡中进一步修改文档标注。
- 单击训练活动。训练可在快速或深入模式下进行。
- 默认选择快速模式。该模式即使在较小的文档集上也能工作,且训练速度较快。
- 如果对快速模式的结果不满意,可考虑切换到深入模式以训练深度学习模型。此模式需要更多训练文档且耗时更长,但可在更广泛的文档上取得更佳效果。文档集必须至少包含 50 份已标注文档,建议至少 150 份。要切换到深入模式,请使用训练活动按钮旁的下拉菜单。
- 您可以测试两种模式,并选择最适合您文档的模式。
注意: 深入模式仅适用于英文文档。
- 活动训练完成后将自动开始测试。测试完成后,转到结果选项卡,分析该活动的字段提取结果。结果选项卡中显示的统计数据与结果选项卡中该 Skill 的总体统计数据一致。如有需要,请调整标注并重新训练活动。
注意: 该活动只能使用已确认标注的文档进行训练和测试。若参考标注是基于预测标注自动生成的,除非您在文档上下文菜单中使用相应选项将预测标注复制到参考标注,否则该文档的标注为未确认。您可以在Documents选项卡查看每个文档的标注状态。要确认某个文档的标注,请在字段选项卡中进行审核。
支持语言:English、Russian、German、French、Spanish、Italian、Portuguese (Standard)、Japanese 和 Dutch。