跳转到主要内容“Documents” 选项卡会显示用于配置、训练和测试某个 Skill 及其活动的所有文档。
文档按文档集进行组织。每个 Skill 都关联一个 All Documents 集合,默认创建并包含所有已上传的文档。你也可以创建自定义文档集,将其用于特定活动或用于测试某个 Skill。任何自定义集合都是 All Documents 集合的子集。单个文档可以同时属于多个自定义集合。
创建新活动时,默认使用 All Documents 集合。你可以为活动创建自定义文档集。为此,在 Documents 选项卡中,点击文档集列表中的添加按钮,为自定义集合命名并添加所需文档。新的文档集会显示在该 Skill 的 Documents 选项卡中,并可在此编辑。当为不同文档变体配置不同提取规则的 Skill 时,可能需要为某个活动创建自定义文档集。有关更多信息,请参阅 Classify By Text and Image activity。
注意: Documents 选项卡的名称会根据所使用的文档集而变化。若选择 All Documents 集合,选项卡名称显示为 All Documents;若选择自定义集合,选项卡名称将变为 Documents: <Set name>。
您也可以创建一个单独的文档集用于测试,而无需将其关联到任何活动。当您需要在某个特定客户的文档上测试某个 Skill,并使用单独平衡的文档集时,可能需要这样做。要创建测试集,请在文档集列表中点击添加按钮。如果您已上传需加入测试集的文档,可以先选择这些文档,然后在快捷菜单中点击 Create Set from Selection。要使用特定文档集测试某个 Skill,请在列表中选中该集合,然后在快捷菜单中选择 Test Skill Using This Set。在为 Skill 标注文档并查看测试结果时,您也可以选择新的测试集。或者,您也可以在文档的快捷菜单中点击 Test Skill,通过一个或多个选定的文档来测试 Skill。
在 Vantage 中编辑创建的 Skill 时,其文档集也会显示在 Documents 选项卡中。
可使用以下工具栏命令编辑文档集:
Upload(上传)。将文档上传到所选集合。每个上传的文档都会自动添加到 All Documents(所有文档) 集合。您也可以通过从文件资源管理器中拖放来上传文档。
Import Labeled Documents From Folder…(从文件夹导入已标注文档…)。将已标注文档上传到某个 Document skill 的 All Documents(所有文档) 集合。您可以在 Upload(上传) 按钮右侧的下拉列表中找到此工具栏命令。可通过从 Skill 训练集导出、从手动复核的处理结果导出,或从 ABBYY FlexiCapture 导出,来创建包含已标注文档的文件夹。有关重用已标注文档的更多信息,请参阅 从文件夹导入已标注文档。
Divide Set(拆分集合)。按一定比例将单个集合拆分为两个,为测试和训练创建不同的文档集。在每个 Activity 的编辑器中,您可以选择用于训练或测试的文档集。
注意: 含少于 10 个文档的集合无法拆分。
Add from Set(从集合添加)。将所选集合中尚未包含在当前集合中的所有文档添加到当前集合。
Add to Set(添加到集合)。将选定的文档添加到其他集合。如果该 Skill 只有一个集合,则不可用。
Delete(删除)。从集合中删除所选文档。您可以仅从当前选定的集合中删除,也可以从所有文档集合中删除。当位于 All Documents(所有文档) 集合时,只能从所有集合中删除文档。
Rotate(旋转)。更改所选页的方向。您可以从下拉列表中选择以下选项之一:Rotate All Pages Left(将所有页向左旋转)、Rotate All Pages Right(将所有页向右旋转) 或 Rotate All Pages 180º(将所有页旋转 180º)。
列表视图。以列表形式显示文档。此视图还会显示每个文档的上传日期、该文档所属的文档集,以及该文档是否已完成标注的信息(位于 Reference Fields 列)。有关文档标注的更多信息,请参见 Fields。
缩略图视图。以缩略图形式显示文档。
要查看缩略图视图中文档的完整图像,请使用预览按钮。必要时,您可以在文档预览窗口中点击“更多选项”按钮并选择相应的菜单项来旋转页。
您可以在设置 Skill 的任意阶段返回 Documents 选项卡上传文档。若已在「Activities」选项卡为该 Skill 配置了文档处理流程,则在上传新文档时,Skill 将自动开始处理。处理完成后,新文档的预测标注将显示在「Fields」选项卡上,并会基于预测标注生成参考标注。如果您在活动编辑器中上传文档,也会触发文档处理。
注意: 自动生成的参考标注在您通过文档快捷菜单中的相应选项将预测标注复制到参考之前,均处于未确认状态。标注未确认的文档无法用于训练,并会从测试结果中排除。要确认文档标注,请在 Fields 选项卡中进行审核。
我们不建议向单个 Skill 上传超过 10,000 个文档,否则该 Skill 可能会不稳定。