跳转到主要内容在发布 Skill 之前,您需要检查字段提取质量,以确保已正确配置 Skill。要测试 Skill,请单击 Test Skill。测试 Skill 时,程序会将参考标注与提取结果进行比较。
在 Results 选项卡上,您可以查看某个 Skill 的文档提取结果统计信息。分析这些统计信息有助于了解如何改进提取数据的质量。
由 Skill 提取的所有字段都会显示在 Fields 列中。属于字段组的字段会收纳在以其字段组命名的可折叠下拉列表中。
可用的字段提取统计如下:
-
Accuracy 列显示提取值正确的 field 的百分比(ALL FIELDS 行),以及各个 field 的正确提取比例。
- 各个 field 的 Accuracy 值计算为
**Accuracy** = **Correct** / (**Correct** + **Recognition Issues** + **Located Incorrectly** + **Not Detected**)。
- ALL FIELDS 的 Accuracy 值使用相同公式计算,但分母中的数值为所有 field 的汇总。
-
Correct 列显示其提取值与参考值匹配的 field 实例数量。
-
Recognition Issues 列显示在文档中已检测到但未正确识别的 field 实例数量。
-
Located Incorrectly 列显示由于其区域位置与标注指定的位置不一致,导致其值与预测值不同的 field 实例数量。
-
Not Detected 列显示未检测到的 field 实例数量。
-
Frequency in Documents 列显示包含给定 field 的 documents 的百分比。
注意: 默认情况下,这些统计会针对所有 field 显示。您可以在列表中隐藏单个 field,仅查看所需 field 的统计信息。为此,请点击 Fields 列顶部的过滤器 icon,然后选择所需的 field。
通过单击第 2 至第 5 列中的值,您可以切换到参考与预测标注的比较模式。您可以使用比较模式在文档图像上分析参考与预测标注之间的差异。这有助于您识别参考标注中的任何错误,以及可能需要重新配置该活动的问题 field。
在 Activity Editor 的 Results 选项卡中也可以查看单个活动的字段提取统计信息。活动统计仅包含由相应活动提取的字段数据。分析活动特定统计有助于评估活动配置的正确性,从而提升该 Skill 的字段提取质量。
注意: 具有未确认标注的 Documents 不会包含在测试结果中。如果参考标注是基于预测标注自动生成的,则该 documents 被视为未确认标注,除非你在文档上下文菜单中使用相应选项将预测标注复制到参考标注。你可以在 Documents 选项卡查看每个文档的标注状态。要确认某个文档的标注,需要在 Fields 选项卡对其进行复核。