跳转到主要内容
数据表单会显示包含已提取数据的字段。字段可能包含需要在人工校验期间纠正的错误。错误类型如下:
  • 格式错误。当识别的数据与文档图像上的实际数据不一致时,会出现这些错误。数据表单中以红色高亮标记格式错误。每个字符的识别置信度显示在其旁边(数字越低,程序对结果的置信度越低)。如果某个字段不包含任何程序能够完全有把握识别的字符,则该字段会以感叹号标记。如果某个字段完全未被提取,则显示为空。此类错误需要通过手动输入所有值来纠正。
  • 规则错误。当提取的值不满足为特定字段指定的规则时,会出现这些错误。规则错误也会在数据表单中以红色高亮标记。
错误会按照它们在数据表单中的出现顺序显示和排序。在人工校验期间,系统会提示用户按以下顺序在字段之间导航:
  1. 首先,引导用户前往第一个存在格式错误的字段。
  2. 如果当前文档中已没有格式错误的字段,则引导用户前往第一个存在规则错误的字段。
  3. 如果文档中的所有错误都已纠正,则引导用户前往 documents 列表中的下一个 document。
注意: 无法导航到处理事务中当前 document 之外的字段。不支持在处理事务的 documents 之间导航。
此外,可使用以下热键在文档的字段之间导航:
  • Tab:移动到数据表单中的下一个元素。
  • Shift+Tab:移动到数据表单中的上一个元素。
  • Space:当数据表单中表或组的某个元素处于焦点时,折叠或展开该表或组。展开时焦点保留在当前元素上。随后按下 Tab 键,焦点将移动到该表或组的第一个元素。
  • 方向键:在单元格内以及单元格之间移动。到达列或行的起始或结束位置时,不会跳转到第一个或最后一个单元格。

更正格式错误

要更正错误,请将field中的数据与文档图像上的数据进行比较,然后更正field中的字符或调整文档图像中的区域。field区域是从文档图像中提取数据的区域。当在数据表单中选择特定field时,文档图像上会显示该field的区域。在以下情况下,可能需要调整field区域:
  • 当所有数据无法容纳在field区域内时。
  • 当错误地将多余的数据包含到某个区域时。
  • 当所有数据无法容纳在field区域内时。
有关如何选择field区域的信息,请参见标注指南。 在更正某个区域后,应用程序会从中“学习”,从而使后续识别更加精确。更多信息,请参见使用人工校验documents训练系统。编辑field区域后,其中包含的任何数据都会被提取到数据表单中的相应field。 您还可以通过在数据表单中选择相应field,然后单击其在文档图像中的位置,将新的field区域添加到数据表单中的现有fields。如果某个field应包含多个单词,请通过标记整个field区域来选择多个单词。可以添加以下field类型:
  • 文本fields
  • 条码
  • 文本fields
注意: 只能添加放置在有边界的方形区域内的文本fields。
完成对field的相应更改后,请按 Enter 键或导航到下一个field以确认更改。如果错误已更正,该field将不再以红色突出显示。 要放大文档图像上的特定区域,请按住 Ctrl 键并单击相应区域。这将以 200% 的缩放级别显示该field。再次按住 Ctrl 键并单击该区域即可恢复到默认缩放级别。 如果数据表单中的表格的fields不包含低置信度字符且未涉及规则错误,则这些表格会被折叠。您可以通过还原来查看此类表格。为此,请单击数据表单中的相应表格,或单击文档图像上的表格单元格区域。 如果数据表单中的fields与文档不对应(例如,数据表单显示的fields未出现在文档上),则可能需要更改文档类型。有关执行此操作的更多信息,请参见更改文档类型

更正规则错误

ABBYY Vantage 允许你使用规则自动检查文档。规则定义了某个字段的值需要满足的各种条件。你可以为不同的文档类型设置不同的规则。 在人工校验期间,数据表单的下部会显示规则错误列表。你可以使用此列表在包含错误的所有字段之间导航。 ABBYY Vantage 中使用了多种类型的规则:
  • 必填字段是一种将特定字段设为必填的规则,这意味着该字段不接受空值。如果必填字段未被自动提取,你需要手动为其输入值,或在文档图像上更正该字段区域,直至可以被提取。必填字段在数据表单上以星号(*)标记。
  • **校验和(Check Sum)**是一种涉及多个字段值求和的规则。指定值的总和将与设定值或来自其他字段的值进行比较。
  • **乘积校验(Check Product)**是一种将某个字段值与其他字段值相乘并将结果与另一值比较的规则。
  • **比较(Compare)**是一种比较多个字段值的规则。例如,一个文档可能包含多个需要具有相同值的字段。
  • **合并(Merge)**是一种将多个字段合并为一个的规则。合并后的值可以用句号、空格或其他分隔符进行分隔。
  • **数据目录查找(Data Catalog Lookup)**是一种将文档字段的值与数据目录中的相应记录进行校验的规则。更多信息请参见使用数据目录。
  • **高级脚本规则(Advanced Script Rule)**是一种用于通过 JavaScript 创建并使用自定义规则的规则。
如果未满足某条规则(例如未提取到必填字段),该字段会以红色高亮显示。如果该字段属于某个组,则该组的名称也会以红色高亮显示。数据表单下方还会显示一条规则错误消息。 要纠正规则错误,需要更改相关字段的值,使其满足相应的规则。例如,如果将“总计(Total)”字段指定为必填字段,请在文档图像上为该字段标出区域,并在必要时手动为其输入一个值。按下 Enter 键确认你输入的值。如果规则条件已满足,规则错误消息将从数据表单下方消失。你可以使用规则错误列表在包含该类型错误的各个字段之间导航。