注意: 此活动仅支持类型为 Text 的字段。
训练要求
- 对于高差异度的文档,需要至少 150 份样本文档(每个变体 2–3 份样本文档)。
- 对于低差异度的文档,我们可以从 1 份样本文档开始训练,但每个变体至少需要 2–3 份样本文档。
使用单独的文档集
支持的语言
设置深度学习活动
- 在 Activities 选项卡上,将深度学习活动添加到文档处理流程中。请注意,该深度学习活动应放在提取其源字段的活动之后。
- 在 Activity Properties 面板中使用 Field 下拉列表,选择与要从中提取字段的非结构化文本片段相对应的源字段。
- 选择应从源字段中提取的字段。您可以选择与源字段处于同一嵌套级别或位于其下一层级的字段。
- 单击 Activity Editor,转到 Fields 选项卡,通过为应从源字段中提取的字段指定区域来对文档进行标注。Activity Editor 中的标注过程与常规文档标注过程完全相同,唯一的例外是:要由深度学习活动提取的字段必须位于源字段的区域之内。
- 用于 NLP 的深度学习活动可以从 1 个示例文档开始,但每个变体至少需要 2–3 个示例文档。
- 如果训练集包含 1 到 150 个文档,则可以开始训练活动,但 Advanced Designer 会显示一条警告,内容为“我们建议至少添加 150 个文档”。
- 如果训练集包含 150 到 10,000 个文档,则可以立即开始训练活动。这是训练集中推荐的文档数量范围。
- 如果训练集包含超过 10,000 个文档,Advanced Designer 会显示一条警告,提示该技能可能变得不稳定。
- 单击 Train Activity 以训练该活动。
- 活动训练完成后,将自动开始活动测试。测试完成后,导航到 Results 选项卡并分析该活动的字段提取结果。Results 选项卡中显示的统计信息与在 Results 选项卡上显示的技能通用统计信息相同。如有需要,请对标注进行必要的更改并重新训练该活动。
