训练进度图表

注意: 在训练过程中,会在由 20% 文档组成的验证集上进行测试。训练完成后,会在所有文档上进行测试。因此,结果可能会有所不同。文档总数越多,结果之间的差异通常就越小。
解读图表
- 如果准确率已经足够高且不再提升,则可以停止训练。
- 如果准确率尚不足够高但仍在提升,则应继续训练。
- 如果准确率尚不足够高且不再提升,则应分析各个字段的提取质量(文档中可能存在过于罕见的字段,或者字段被错误标注)。
注意: 训练不会影响识别质量,被错误检测的字段仍然可以用于训练。
如何决定何时停止训练您的活动
- 准确率已经足够高,并且连续多个 epoch 内准确率没有明显变化。
- 准确率较低,并且连续多个 epoch 内准确率没有明显变化(可考虑使用更大的文档集,或确保所有字段都有良好的代表性并被正确标注)。
- 您希望在所有文档上对该活动进行手动测试(如果对字段提取结果不满意,可以继续训练)。
如何调整训练时长
- 转到 Results 选项卡中的 Self-Assessment 部分。
- 单击图表上方周期数右侧的设置图标。
- 输入新的周期数和/或以“小时:分钟”格式表示的时间并单击 Apply。新的限制必须大于已历经的周期数。最大周期数为 20。训练将在达到任一限制后停止。
注意: 您可以随时单击 Stop Training 停止训练。任何未完成训练周期的结果都会被丢弃。
