用例
- 仅处理发票:在该场景中,Invoice Document Splitter Skill 会将包含多张发票的文件拆分为独立的文档。
- 同时处理发票和其他类型文档:在该场景中,Invoice Document Splitter Skill 通过两个 Skill 将发票与非发票文档区分开来——一个用于处理发票,另一个用于处理其他类型的文档。发票被归类为 invoice 类,所有其他类型的文档被归类为 non_invoice。
Skill 组件
- 一个 Classify 活动,其中包含两个类别:invoice 和 non_invoice(non_invoice 类别涵盖附件、电子邮件和传真页眉、装箱单、运单,以及同一文件中包含的其他类型文档)
- 一个 Extraction Rules,用于提取发票号码,并根据首页的可靠标记拆分文档(例如,“Page 1 of 10”)
文档拆分标准
- 识别出文档类别。
- 提取到首页的可靠标识。
- 提取到新的发票号码。
设置说明
- 创建一个新的 Process 技能。
- 添加并设置一个 Input 活动。
- 添加一个 Assemble 活动。对于该活动,在 Actions 窗格中选择 By Document Splitter Skill 选项,然后从列表中选择 Invoice Document Splitter skill。
- 添加一个 Extract 活动。对于该活动: a. 在 Actions 窗格中,点击 Add Skill 按钮,并从列表中选择所需的 Document skill。 b. 仍在 Actions 窗格中,点击该 Document skill 名称旁的配置图标。在打开的对话框中,在 Class 字段选择 invoice。 c. 如果文档包含附件,重新点击 Add Skill 按钮,并为附件选择相应的 Document skill。然后点击该 Document skill 名称旁的配置图标,并在 Class 字段选择 non_invoice。 你也可以通过点击 Actions 窗格底部的 Edit Mapping 按钮,将“invoice”和“non_invoice”类与其对应的 Skill 关联。在打开的对话框中,为“invoice”类选择所需的发票 Skill。如果预计文档还包含其他类型的页,也请为“non_invoice”类选择合适的 Skill。
- 可选:添加并设置一个 Manual Review 活动,用于校验提取的数据,并对组装后的文档进行必要的调整(例如可以移动页)。
- 添加并设置一个 Output 活动。
- 点击 Publish Skill 按钮。
