跳转到主要内容
您可以使用单独的文档集来训练 Segmentation 活动。为此,在 Skill 名称旁的下拉列表中选择 Segmentation 活动。然后,在上传按钮左侧的下拉列表中选择所需的文档集,或单击**创建集合…**以创建新的文档集。您可以按照Documents部分中的说明在此选项卡上传、删除和旋转文档。 要设置 Segmentation 活动:
  1. 活动选项卡上,将 Segmentation 活动添加到文档处理流程中。请注意,Segmentation 活动应位于后续从文本片段中提取字段的活动之前。
  2. 活动属性窗格中,选择与要提取的片段相对应的所有字段。
注意: 仅支持类型为 Text 且数据类型设置为 Text 的字段。
  1. 单击活动编辑器。如有需要,可在字段选项卡中进一步修改文档标注。
  2. 单击训练活动。训练可在快速深度模式下进行。
    • 默认选择快速模式。该模式即使在较小的文档集上也能工作,且训练速度较快。
    • 如果对快速模式的结果不满意,可切换到训练深度学习模型的深度模式。此模式需要在训练集中包含更多文档,训练时间更长,但在更广泛的文档类型上表现更好。文档集必须至少包含 50 份已标注的文档,建议至少 150 份。要切换到深度模式,请使用训练活动按钮旁的下拉菜单。
    • 您可以测试两种模式,并选择对您的文档效果最佳的一种。
注意: 深度模式仅适用于英文文档。
  1. 活动训练完成后将自动开始测试。测试完成后,转到结果选项卡,分析该活动的字段提取结果。结果选项卡中显示的统计信息与结果选项卡中为该 Skill 显示的总体统计信息相同。如有需要,请对标注进行必要修改并再次训练该活动。
注意: 只能使用标注已确认的文档来训练和测试该活动。如果参考标注是基于预测标注自动生成的,则文档的标注为未确认状态,除非您在文档上下文菜单中使用相应选项将预测标注复制到参考标注。您可以在Documents选项卡查看每个文档的标注状态。要确认某个文档的标注,应在字段选项卡中对其进行审核。
支持语言:英语、俄语、德语、法语、西班牙语、意大利语、葡萄牙语(标准)、日语和荷兰语。