跳转到主要内容
以下限制与已知问题将于未来版本中处理:

常规

  • 可添加到处理事务中的文件数量上限为 1,000。
  • 如果通过 Public API 将多个文件上传到包含 Optical Character Recognition (OCR)、Document 或 Classification Skill 的处理事务中,这些文件将被合并并作为单个文档处理。
  • 每个导入的文件大小不得超过 2 GB。
  • 无人值守的文档处理仅在以下页数范围内经过测试:OCR Skill 最多 3,000 页;Document skill 最多 500 页;若处理流程包含人工校验阶段,Document 与 Classification Skill 的组合最多 100 页。页数更多的文档可能会在 Manual Review 客户端中影响处理效率。
  • 本次发布仅在 Google Chrome 和 Safari 上进行了测试。使用 Firefox、Opera 及其他浏览器时可能会遇到一些问题。这些浏览器将在后续版本中得到全面支持。
  • 目前,上传到 Documents 的文件的自动 Skill 选择仅适用于以下语言:English、French、German 和 Spanish。
  • 可在以下限制条件下导入 Excel 文件(*.xls*.xlsx):
    • 如果导入的文件包含带有文本的图表(例如标题),该文本将不会被提取。
    • Vantage 会从一组标准尺寸中自动选择页大小。如果导入的 Excel 文件内容不符合任何标准尺寸(例如宽度不匹配),可能会显示不正确。
    • 如果导入的文件包含带有可见区域之外数据的切片器(例如需要滚动查看的项目),这些数据不会显示。
    • Vantage 会忽略 Excel 的“Scale to Fit”选项(该选项会缩小工作表以更好地适配打印页)。如果导入的表格行数过多,将被拆分到多页。
    • Vantage 可能无法保留表格与表格外对象的相对位置。例如,表格中的文本相对于其上方的形状可能会向右偏移。

Process 技能

  • 如果一个 Process 技能包含多个 Classify/Extract 活动,在线机器学习将应用于最后一个活动。
  • Manual ReviewInput/OutputAssembleFor each document 活动不能嵌套在 For each document 活动中。对其中部分活动的 For each document 嵌套将于后续版本支持。
  • ABBYY Vantage 从共享文件夹导入的每个 ZIP 归档文件不得超过 1.5 GB。ZIP 归档内的每个文件不得超过 100 MB。ZIP 归档必须仅包含受支持格式的文件,否则将导入失败。
  • 自定义活动仅支持同步的 Vantage API 调用。同步调用意味着外部系统的处理仅需数秒,且处理结果会几乎即时在第三方系统的响应中返回。异步方法将于后续版本实现。
  • 单个 Extract 活动中,Process 技能最多支持 50 个 Document skill。
  • 从电子邮件导入时,仅处理第一层级的附件作为处理事务的文档。如有附加的电子邮件文件,其附件不会作为该处理事务的文件导入。
  • 从电子邮件导入时,将不会指定 “FilePath” 文档注册 Parameter,而会指定 “FileName” 文档注册 Parameter。
  • 图像 field 无法导出为 CSV。如果 Document skill 中存在图像 field,该 field 的值在导出结果中将始终为空。
  • 通过 API 指定 Skill 参数时,单个处理事务中最多可指定 10 组键值对,每个键最多 128 个字符,每个值最多 256 个字符。

OCR Skill 与 Process 技能中的 OCR Activity

  • 选择过多语言(超过 20 种)可能会降低性能并影响 OCR Skill 的效果。
  • 使用 OCR Skill 处理的单个文件,建议的最大页数为 3,000 页。
  • 在某些情况下,印章、贴纸等对象在导出的 PDF 中可能会出现倾斜。

Document 和 Classification Skill

  • ABBYY Vantage 可处理最多 10,000 份用于训练的文档。
  • 当将新文档添加到已训练的 Document 或 Classification Skill 中时,在对新文档完成标注并重新训练该 Skill 之前,Results 选项卡会显示过时的信息。
  • 在 Document Skill 中将训练结果与参考进行对比时,Difference 选项卡不会显示重复 field 的错误类型和参考值。
  • 单个 Skill 的 Parameter 不得超过 100 个。

Document Splitter Skill

  • Document Splitter Skill 目前不支持参考标注和统计。
  • 无法回退到较早的 Document Splitter Skill 版本。
  • 使用 Document Splitter Skill 处理的文档,其每个文档的页数不应超过 1000 页。

在线学习

  • 在线学习不支持以下类型的字段:
    • 图像字段
    • 包含图像字段、嵌套可重复组、可重复组中的组或表格的可重复组
  • 一般而言,针对复选标记字段的在线学习结果质量足够高。但有时由于复选标记字段的几何形状(如圆形或方形),或用户标注复选标记字段的方式(例如未在字段内打勾,而是画叉或加下划线),可能导致复选标记未被正确检测或训练。此类复选标记的检测与训练将在后续版本中改进。
  • 训练集的最大文档数为 10,000,测试集为 1,000。

Advanced Designer 中的 Fast Learning

  • 从 Skill 中删除 Fast Learning 活动时,相关的数据库查找规则也会被删除。

Advanced Designer 中的深度学习

  • 深度学习仅适用于文本字段。
  • 一个深度学习活动最多可训练 50 个字段(包括可重复组和字段),或一张最多包含 32 列的表。
  • 无法训练嵌套的可重复组,或可重复组中的组。

数据目录(Data Catalogs)

  • 如果某个数据目录在任何 Skill 中被使用(包括该 Skill 的任何版本),则无法删除或修改。要删除不再需要的数据目录,必须先在该 Skill 中停止使用它(即删除或修改相应规则),并删除对应 Skill 的所有先前版本。可以在 Skill 设置中删除 Skill 版本。如果不想删除旧的 Skill 版本但希望更改数据目录,请创建一个新的数据目录。
  • 当一个数据目录使用查找规则时,field 值不会自动填充。要填充该 field 值,需要手动单击与相应 field 关联的 Lookup icon,从查找结果中选择值,然后重新训练该 Skill。

Skill Monitor

  • 只能从 Error Log 将最新的 10,000 条错误导出为 CSV 文件。您可以在 Error Log 中使用筛选和搜索特定行,以减少需要导出的错误数量。
  • 如果某个 Skill 被删除后又以相同标识符重新导入,Skill Monitor 中将不会显示任何指标。

业务处理报表仓库与质量分析报表仓库

  • 部分 Process 技能的处理事务未出现在已完成的处理事务列表中。
  • 按特定日期范围请求处理事务时,可能会返回整个时段的处理事务。
  • 获取处理事务列表时,如果 offset 参数等于 totalitemcount 参数,该端点会失败。

Advanced Designer

  • 在 Manage Fields 对话框中,Number 和 Money 字段类型的 “The Number must be within interval” 属性已被禁用。您可以在 Fields 选项卡的 Reference 部分或在 Vantage 中设置此属性。
  • 在 Manage Fields 对话框中编辑并保存的字段设置不会与 Reference 标注部分同步。为解决此限制,请在 Vantage 中或在 Advanced Designer 的 Fields 选项卡下的 Reference 部分编辑字段设置。

内置 Skill

  • 无法在内置 Skill 的副本中启用其他语言。内置 Skill 旨在处理特定语言的文档。在内置 Skill 中启用其他语言也无法从该语言的文档中提取字段。你可以禁用任何受支持的语言,建议禁用不会在你的文档中使用的语言。
  • 对于 Identity Document skill,人工校验将不显示已提取字段的区域。

移动端输入

  • 目前护照采集尚未自动化。将文档在屏幕中居中后,用户需手动拍摄文档图像。

Scanning Station

  • 在未获得管理员权限的情况下安装 Scanning Station 时,即使在设置过程中选择了其他 UI 语言,仍会以英文界面安装。要规避此限制,请采用以下任一变通方法:(a) 在安装 Scanning Station 之前获取管理员权限;(b) 重新安装 Scanning Station;或 (c) 安装后修改以下注册表键值:
    [HKEY_CURRENT_USER\SOFTWARE\ABBYY\ScanStationVantage\5.0\Fine Objects]
    "InterfaceLanguage"="X"
    
    其中 X 为:
    • 64:中文(简体)
    • 3:法语
    • 2:德语
    • 6:意大利语
    • 26:日语
    • 63:韩语
    • 27:葡萄牙语(巴西)
    • 5:西班牙语