注意: 您可以使用单独的文档集来训练您的深度学习活动。为此,请在技能名称旁边的下拉列表中选择深度学习活动。然后,在 Upload 按钮左侧的下拉列表中,选择所需的文档集,或单击 Create Set… 创建新的文档集。您可以在此选项卡中按照 Documents 部分中的说明上传、删除和旋转文档。
设置步骤
步骤 1。添加 Activity
步骤 2:选择字段
- 最多 50 个类型为 Text 的字段,不受其嵌套级别限制。
- 一个包含最多 32 列的表格。
注意: 以下字段无法被训练:
- 类型不是 Text 的字段
- 包含多个项目的组、表格,或嵌套在包含多个项目的组中的多项目文本字段
- 列数超过 32 列的表格
步骤 3:标注文档
- 如果训练集仅包含最低要求的 10 份文档,您可以开始深度学习训练,但建议上传更多文档以获得更高的准确率。
- 如果训练集仅包含 10 份文档,您仍然可以开始训练模型。但 Advanced Designer 会显示一条警告,建议您添加超过 500 份已标注文档以获得最佳训练效果。
- 如果训练集包含 500 到 10,000 份文档,您可以立即开始训练该 Activity。建议训练集中文档数量在此范围内。
- 如果训练集包含超过 10,000 份文档,Advanced Designer 会显示一条警告,提示该技能可能会变得不稳定。
步骤 4。训练 Activity
步骤 5. 监控训练进度
训练完成后的步骤
- 向训练集添加更多文档并继续训练过程。到目前为止获得的训练结果将被保留,神经网络会在此基础上使用更新后的文档集进行额外训练。
- 调整标注并重新开始训练。到目前为止获得的训练结果将被丢弃,神经网络将从头开始训练。
- 创建一个包含 Extraction Rules 活动的 Hypothesis Filtering 容器,以便为 Deep Learning 活动的输出设置条件。
注意: 从 Advanced Designer v. 2.3.1 开始,Deep Learning 活动的字段数量限制已发生变化。如果您的技能中使用的已训练 Deep Learning 活动提取的字段数超过 50,您仍然可以继续使用该技能处理文档。但是,当您打开此类技能进行编辑时,现有的 Deep Learning 活动将被拆分为多个 Deep Learning 活动,您可能需要重新训练它们。您还需要在文档处理工作流中重新配置这些活动的路由。
