跳转到主要内容在处理文档时,您可能需要将从文档中提取的数据与数据目录中的记录进行比对。此过程可通过数据目录查找规则自动化,用于:
- 将发票和订单与 Vendor 和收货人数据库进行比对,
- 使用数据目录中的相应记录填充缺失的文档字段值,例如:
- 订单编号和金额
- 公司详细信息
- 商品与服务的名称和描述
有关用于 Document skill 的数据目录的更多信息,请参阅使用数据目录。
要设置数据目录查找规则,请执行以下步骤:
-
在字段属性中单击新建规则。
-
在打开的对话框中,选择数据目录查找规则类型。
-
在用于查找的数据目录下拉列表中,选择用于比对文档字段值的数据目录。
**注意:**若要同时将文档字段值与多个数据目录中的记录进行比对,您需要为每个目录分别创建一条规则。
-
选择数据目录后,将显示如下表格:
目录列列包含所选数据目录的列名。
-
在Skill 字段列中,使用下拉列表指定与目录字段对应的已提取文档字段。如果不需要查找某个特定字段,或文档中不存在该字段,请将表格中的相应项留空。
**注意:**一条规则只能包含来自同一个可重复组的字段。如果需要从文档中的多个可重复组中查找值,请为每个组分别创建一条规则。
-
在操作列中,指定需要针对字段对执行的操作:
- 选择精确比对以匹配诸如纳税人识别号(TIN)和商品标识符等唯一值。
- 选择模糊比对以匹配可能存在细微差异的值,如街道名称和组织地址。
- 选择从数据目录获取值以将目录记录中的值复制到相应的文档字段。仅当在规则设置期间至少为一个字段对指定了精确比对或模糊比对时,才能执行此操作。
-
如有需要,使用规则名称文本字段编辑规则名称,然后单击保存。
创建规则后,指向该 Skill 的链接将出现在数据目录部分的目录列表中。
新建的规则将针对其设置期间指定的所有文档字段运行。现有的数据目录查找规则仅在字段提取期间执行。当文档字段值被手动编辑时,新的值不会触发自动目录查找。若要再次对字段运行数据目录查找规则,可以向 Skill 文档集上传新文件,或将文档发送至人工校验。
仅当精确比对和模糊比对均至多返回一个匹配的目录记录时,数据目录查找规则才能正常工作。否则,可能出现以下两种错误之一:
- 未找到记录表示所指定的比对类型在目录中未为该文档字段找到匹配项。
- 找到的记录过多表示所指定的比对类型在目录中为该文档字段找到了多个匹配项。
为避免这些错误,请在规则设置期间至少指定一个具有唯一值或不可能匹配到多个目录记录的字段。
手动在数据目录(data catalog)中查找field值
如有需要,您可以在数据目录中手动查找field值。为此,点击为其设置了规则的、包含该field值的输入框右侧的Search按钮,并在出现的文本栏中输入要查找的值(可以是完整或部分,但不少于3个字符)。搜索将遍历所有数据目录fields。通过左键单击从搜索结果列表中选择相应的值。这样会将此数据目录值复制到在规则设置期间与该数据目录列配对的所有文档field中。
注意: 使用目录中的记录填写文档值后,您将无法手动编辑它们。如果发生错误,您可以手动执行查找并选择相应的记录。Document field值将更改为目录中的所选值,并且该规则将再次执行。
如果在数据目录中找不到所需的值,请点击Clear Document Fields或按Ctrl+Del。这将使用文档中的值填充在规则设置期间指定的fields,而不使用相应数据目录记录中的值。