跳转到主要内容
数据表单会显示包含提取数据的字段。这些字段可能存在需要在人工校验期间更正的错误。错误类型包括多种:
  • 格式错误。当识别的数据与文档图像上的实际数据不一致时,会发生此类错误。格式错误会在数据表单中以红色高亮标记。每个字符的识别置信度会显示在其旁边(数值越低,程序对结果的置信度越低)。如果某个字段中没有任何字符是程序能够完全确信识别的,该字段会以感叹号标记。如果某个字段完全未被提取,则显示为空白。此类错误需要通过手动输入所有值来更正。
  • 规则错误。当提取的值不满足为特定字段设置的规则时,会发生此类错误。规则错误也会在数据表单中以红色高亮标记。
错误会按照它们在数据表单中出现的顺序显示和排序。在人工校验期间,系统会提示用户按以下顺序在字段之间导航:
  1. 首先,将用户定位到第一个存在格式错误的字段。
  2. 如果当前文档中不再有格式错误字段,将用户定位到第一个存在规则错误的字段。
  3. 如果文档中的所有错误都已更正,将用户定位到 documents 列表中的下一个文档。
注意: 无法在处理事务中跳转到当前文档之外的字段。不支持在处理事务的不同文档之间进行导航。
此外,可以使用以下快捷键在文档字段之间导航:
  • Tab。移动到数据表单中的下一个元素。
  • Shift+Tab。移动到数据表单中的上一个元素。
  • Space。当数据表单中某个表或分组的元素获得焦点时,折叠或展开该表或分组。展开时会保持焦点在当前元素上。随后按下 Tab 键时,焦点将移动到该表或分组的第一个元素。
  • 方向键。在单元格内以及单元格之间移动光标与切换焦点。当到达列或行的起始或结束位置时,不会跳转到第一个或最后一个单元格。

更正格式错误

要更正错误,请将field中的数据与文档图像上的数据进行比较,然后更正field中的符号或调整文档图像中的区域。field 区域是从文档图像中提取数据的区域。当在数据表单中选择特定field时,该field的区域会显示在文档图像上。在以下情况下,可能需要调整field区域:
  • 当所有数据无法容纳在field区域内时。
  • 当区域中错误包含了多余数据时。
  • 当所有数据无法容纳在field区域内时。
有关如何选择field区域的信息,请参见 Labeling guidelines。 在纠正区域后,应用程序会从中“学习”,从而使后续识别更加精确。有关更多信息,请参见使用人工校验documents训练系统。编辑field区域后,其中包含的任何数据都会被提取到数据表单中的相应field。 您还可以通过在数据表单中选择相应的field,然后单击其在文档图像上的位置,向数据表单中的现有fields添加新的field区域。如果一个field应包含多个单词,请通过标记整个field区域来选择多个单词。可以添加以下field类型:
  • 文本fields
  • 条形码
  • 选框
注意: 只能添加放置在有边界正方形区域内的选框。
在对field进行适当更改后,可通过按 Enter 键或导航到下一个field来确认更改。如果错误已被更正,该field将不再以红色突出显示。 要放大文档图像上的特定区域,请按住 Ctrl 键并单击相应区域。此操作将以 200% 的缩放级别显示该field。再次按住 Ctrl 键并单击该区域即可返回默认缩放级别。 如果数据表单中的表格的fields不包含低置信度字符且不涉及规则错误,则这些表格会折叠。您可以通过还原来查看此类表格。为此,请单击数据表单中的相应表格,或单击文档图像上的表格单元格区域。 如果数据表单中的fields与文档不对应(例如数据表单显示的fields未出现在文档上),则可能需要更改文档类型。有关执行此操作的更多信息,请参见更改文档类型

更正规则错误

ABBYY Vantage 允许你使用规则自动检查文档。规则定义了某个字段的值需要满足的各种条件。你可以为不同的文档类型设置不同的规则。 在人工校验期间,数据表单的下部会显示规则错误列表。你可以使用此列表在包含错误的所有字段之间导航。 ABBYY Vantage 中使用了多种类型的规则:
  • 必填字段是一种将特定字段设为必填的规则,这意味着该字段不接受空值。如果必填字段未被自动提取,你需要手动为其输入值,或在文档图像上更正该字段区域,直至可以被提取。必填字段在数据表单上以星号(*)标记。
  • **校验和(Check Sum)**是一种涉及多个字段值求和的规则。指定值的总和将与设定值或来自其他字段的值进行比较。
  • **乘积校验(Check Product)**是一种将某个字段值与其他字段值相乘并将结果与另一值比较的规则。
  • **比较(Compare)**是一种比较多个字段值的规则。例如,一个文档可能包含多个需要具有相同值的字段。
  • **合并(Merge)**是一种将多个字段合并为一个的规则。合并后的值可以用句号、空格或其他分隔符进行分隔。
  • **数据目录查找(Data Catalog Lookup)**是一种将文档字段的值与数据目录中的相应记录进行校验的规则。更多信息请参见使用数据目录。
  • **高级脚本规则(Advanced Script Rule)**是一种用于通过 JavaScript 创建并使用自定义规则的规则。
如果未满足某条规则(例如未提取到必填字段),该字段会以红色高亮显示。如果该字段属于某个组,则该组的名称也会以红色高亮显示。数据表单下方还会显示一条规则错误消息。 要纠正规则错误,需要更改相关字段的值,使其满足相应的规则。例如,如果将“总计(Total)”字段指定为必填字段,请在文档图像上为该字段标出区域,并在必要时手动为其输入一个值。按下 Enter 键确认你输入的值。如果规则条件已满足,规则错误消息将从数据表单下方消失。你可以使用规则错误列表在包含该类型错误的各个字段之间导航。