跳转到主要内容
数据表单显示包含已提取数据的字段。这些字段中可能存在需要在人工审核期间更正的错误。错误类型包括:
  • 格式错误。当识别到的数据与文档图像上的实际数据不一致时,会产生这类错误。格式错误会在数据表单中以红色高亮标记。某个字符的识别置信度会显示在该字符旁边(数字越小,程序对结果的置信度越低)。如果某个字段中没有任何字符是程序以完全置信度识别的,该字段会以感叹号标记。如果某个字段完全未被提取,则会显示为空。对于这类错误,需要通过手动输入所有值来进行更正。
  • 规则错误。当提取的值不满足为特定字段指定的规则时,会产生这类错误。规则错误同样会在数据表单中以红色高亮标记。
错误会按照它们在数据表单中出现的顺序显示和排序。在人工审核过程中,系统会按以下顺序提示用户在字段之间进行导航:
  1. 首先,用户会被定位到第一个存在格式错误的字段。
  2. 如果当前文档中不再有格式错误字段,用户会被定位到第一个存在规则错误的字段。
  3. 如果文档中的所有错误都已更正,用户会被定位到文档列表中的下一个文档。
注意: 您无法导航到当前事务中当前文档之外的字段。不支持在同一事务内的不同文档之间进行导航。
此外,可以使用以下快捷键在文档字段之间导航:
  • Tab。移动到数据表单中的下一个元素。
  • Shift+Tab。移动到数据表单中的上一个元素。
  • Space。当数据表单中表格或组的某个元素处于焦点时,折叠或展开表格或组。展开操作会将焦点保留在当前元素上。如果随后按下 Tab 键,焦点会移动到该表格或组的第一个元素。
  • 方向键。在单元格内以及单元格之间移动文本光标。即使到达列或行的开头或结尾,此操作也不会跳转到第一或最后一个单元格。

更正格式错误

要更正错误,请将字段中的数据与文档图像上的数据进行比较,然后更正字段中的字符,或调整文档图像中的区域。字段区域是在文档图像上用于提取数据的区域。选中数据表单中的某个字段后,其对应的区域会显示在文档图像上。字段区域在以下情况下可能需要调整:
  • 当所有数据无法完整包含在字段区域中时。
  • 当区域中错误地包含了多余数据时。
  • 当区域被错误地分配时。
有关如何选择字段区域的信息,请参见 Labeling guidelines。 区域被更正后,应用程序会从中“学习”,从而使后续识别更加精确。更多信息,请参见使用人工审核文档训练系统。在您编辑字段区域之后,其中包含的任何数据都会被提取到数据表单中的相应字段。 您还可以在数据表单中为现有字段添加新的字段区域,方法是在数据表单中选择相应字段,然后单击文档图像上的位置。如果字段应包含多个单词,请通过标记整个字段区域来选择多个单词。可以添加以下字段类型:
  • Text 字段
  • 条码
  • 复选标记
注意: 只能添加放置在有边界方形区域中的复选标记。
完成对字段的相应更改后,可通过按 Enter 键或跳转到下一个字段来确认更改。如果错误已被更正,该字段将不再以红色高亮显示。 要放大文档图像上的特定区域,请按住 Ctrl 键并单击相应区域。字段将以 200% 的缩放级别显示。您可以再次按住 Ctrl 键并单击该区域,恢复默认缩放级别。 如果数据表单中表格内的字段不包含低置信度字符且未涉及规则错误,则这些表格会折叠。您可以通过将其还原来查看这些表格。为此,请单击数据表单中的相应表格,或单击文档图像上的表格单元格区域。 如果数据表单中的字段与文档不匹配(例如,数据表单显示的字段并未出现在文档上),则很可能需要更改文档类型。有关执行此操作的更多信息,请参见更改文档类型

纠正规则错误

ABBYY Vantage 允许您使用规则自动检查文档。Rules(规则) 定义了某个特定字段的值需要满足的各种条件。您可以为不同的文档类型设置不同的规则。 在人工审核期间,数据表单的下方会显示规则错误列表。您可以使用该列表在所有包含错误的字段之间进行导航。 在 ABBYY Vantage 中有多种类型的规则:
  • Required field 是一种将特定字段设为必填的规则,这意味着此类字段不接受空值。如果必填字段未被自动提取,您需要手动输入其值,或者在文档图像上更正该字段区域,直到可以提取为止。必填字段在数据表单中用星号(*)标记。
  • Check Sum 是一种涉及多个字段值求和的规则。指定值的总和会与某个设定值或来自其他字段的值进行比较。
  • Check Product 是一种将某个字段值与其他字段值相乘,并将结果与另一数值进行比较的规则。
  • Compare 是一种比较多个字段值的规则。例如,一个文档中可能有多个字段要求其值必须相同。
  • Merge 是一种将多个字段合并为一个字段的规则。合并后的值可以使用句号、空格或其他分隔符进行分隔。
  • Data Catalog Lookup 是一种将文档字段的值与数据目录中相应记录进行校验的规则。有关更多信息,请参阅 Using data catalogs。
  • Advanced Script Rule 是一种使用 JavaScript 创建和使用自定义规则的规则。
如果某个规则未被满足(例如,必填字段未被提取),该字段会以红色高亮显示。如果该字段属于某个组,则该组的名称也会以红色高亮显示。同时,数据表单下方还会显示一条规则错误消息。 要纠正规则错误,需要更改相关字段的值,使其满足相应规则。例如,如果将一个 Total 字段指定为必填字段,请在文档图像上为该字段标出区域,必要时为其手动输入一个值。按下 Enter 键确认您输入的值。如果现在已满足规则条件,数据表单下方的规则错误消息将会消失。您可以使用规则错误列表在包含该类错误的各个字段之间进行导航。