使用场景
- 仅处理发票:在此场景中,Invoice Document Splitter 技能会将包含多张发票的文件拆分为单独的文档。
- 同时处理发票和其他类型的文档:在此场景中,Invoice Document Splitter 技能会使用两个技能将发票与非发票文档分开——一个用于处理发票,另一个用于处理其他类型的文档。发票被归为 invoice 类,而所有其他类型的文档被归类为 non_invoice。
技能组件
- 一个 Classify 活动,其中包含两个类别:invoice 和 non_invoice(non_invoice 类别包括附件、电子邮件和传真抬头、装箱单、运单,以及同一文件中包含的其他类型文档)
- 一个 Extraction Rules 活动,用于提取发票号码,并根据第一页的可靠标记(例如 “Page 1 of 10”)拆分文档
文档拆分条件
- 识别出文档分类。
- 提取出可靠的第一页标记。
- 提取出新的发票号码。
设置说明
- 创建一个新的流程技能。
- 添加并设置一个 Input 活动。
- 添加一个 Assemble 活动。对于此活动,在 Actions 窗格中选择 By Document Splitter Skill 选项,然后在列表中选择 Invoice Document Splitter skill。
- 添加一个 Extract 活动。对于此活动: a. 在 Actions 窗格中,单击 Add Skill 按钮,并在列表中选择所需的文档技能。 b. 仍在 Actions 窗格中,单击此文档技能名称旁边的配置图标。在打开的对话框中,在 Class 字段中选择 invoice。 c. 如果您的文档包含附件,请再次单击 Add Skill 按钮,并为附件选择合适的文档技能。然后单击此文档技能名称旁边的配置图标,在 Class 字段中选择 non_invoice。 您也可以通过单击 Actions 窗格底部的 Edit Mapping 按钮,将 “invoice” 和 “non_invoice” 类与各自的技能进行关联。在打开的对话框中,为 “invoice” 类选择所需的发票技能。如果您预计文档还包含其他类型的页面,请同时为 “non_invoice” 类选择合适的技能。
- (可选) 添加并设置一个 Manual Review 活动,以验证提取的数据,并对组装后的文档进行必要的调整 (例如,您可以调整页面顺序) 。
- 添加并设置一个 Output 活动。
- 单击 Publish Skill 按钮。
