跳转到主要内容
以下限制和已知问题将在后续版本中解决:

常规

  • 单个事务中最多可添加 1,000 个文件。
  • 如果通过 Public API 将多个文件上传到包含 OCR、文档技能或分类技能的事务中,这些文件将被合并并作为单个文档进行处理。
  • 每个导入文件的大小不得超过 2 GB。
  • 无人值守文档处理仅在以下页数条件下进行了测试:对于 OCR 技能最多 3,000 页,对于文档技能最多 500 页,对于同时包含文档技能和分类技能且处理流程中包含人工审核阶段的情况最多 100 页。包含更多页数的文档可能会减慢您在 Manual Review 客户端中处理文档的速度。
  • 此版本仅在 Google Chrome 和 Safari 上进行了测试。在使用 Firefox、Opera 和其他浏览器时,可能会遇到一些问题。这些浏览器将在未来的版本中得到全面支持。
  • 当前,上传到 Documents 中的文件的自动技能选择仅支持以下语言:英语、法语、德语和西班牙语。
  • 可以在以下限制条件下导入 Excel 文件(*.xls*.xlsx):
    • 如果导入的文件包含带有文本的图表(例如标题),则无法提取此文本。
    • Vantage 会从一组标准尺寸中自动选择页面大小。如果导入的 Excel 文件内容不符合任何标准尺寸(例如在宽度方面不适配),则可能会显示不正常。
    • 如果导入的文件包含在可见区域之外具有数据的切片器(例如需要滚动才能查看的项目),则这些数据不会显示。
    • Vantage 会忽略 Excel 的“Scale to Fit”选项(将工作表缩小以更好地适应打印页面)。如果导入的表格行数过多,它将被拆分到多个页面。
    • Vantage 可能无法保留表格与表格外对象的相对位置。例如,表格中的文本相对于文本上方的形状可能会向右偏移。

流程技能

  • 如果一个流程技能包含多个 Classify/Extract 活动,在线机器学习将仅应用于最后一个活动。
  • Manual ReviewInput/OutputAssembleFor each document 活动不能被嵌套在 For each document 活动中。对其中部分活动进行 For each document 嵌套将在未来版本中得到支持。
  • 从共享文件夹由 ABBYY Vantage 导入的每个 ZIP 压缩包大小不得超过 1.5 GB。ZIP 压缩包中的每个文件大小不得超过 100 MB。ZIP 压缩包中必须仅包含受支持格式的文件,否则该 ZIP 压缩包的导入将失败。
  • 自定义活动仅支持同步 Vantage API 调用。同步调用意味着外部系统中的处理只需几秒钟,并且处理结果会几乎立即在第三方系统的响应中返回。异步调用方式将在未来版本中实现。
  • 流程技能在一个 Extract 活动中最多支持 50 个文档技能。
  • 从电子邮件导入时,只有第一层级的附件会作为事务中的文档进行处理。如果存在被附加的电子邮件文件,其中的附件将不会作为该事务的文件被导入。
  • 从电子邮件导入时,将不会指定 “FilePath” 文档注册 Parameter,而会指定 “FileName” 文档注册 Parameter。
  • 图像字段无法导出为 CSV。如果文档技能中存在图像字段,此类字段在导出结果中的值将始终为空。
  • 使用 API 指定技能参数时,在一个事务中最多可以指定 10 个键值对,每个键最多包含 128 个字符,每个值最多包含 256 个字符。

OCR 技能与流程技能中的 OCR 活动

  • 选择过多语言(超过 20 种)可能会降低性能并影响 OCR 技能的识别效果。
  • 使用 OCR 技能处理的每个文件,建议的最大页面数为 3,000 页。
  • 在某些情况下,印章和贴纸等对象在输出的 PDF 中可能会出现倾斜。

文档和分类技能

  • ABBYY Vantage 可以处理最多 10,000 份文档的训练集。
  • 当在已训练的文档技能或分类技能中添加新文档时,在新文档完成标注并对该技能重新训练之前,Results 选项卡会显示过时的信息。
  • 在文档技能中将训练结果与参考数据进行比较时,Difference 选项卡不会显示重复字段的错误类型和参考值。
  • 一个技能最多可以有 100 个 Parameter。

文档拆分技能

  • 文档拆分技能目前尚不支持参考标注和统计功能。
  • 无法回退到文档拆分技能的早期版本。
  • 使用文档拆分技能处理的文档,每个不应超过 1000 个页面。

在线学习

  • 在线学习不支持以下类型的字段:
    • 图像字段
    • 包含图像字段、嵌套重复组、重复组内的组或表格的重复组
  • 通常,针对复选标记字段的在线学习结果质量已经足够高。然而,有时由于复选标记字段的几何形状(例如圆形或方形),或由于用户勾选该字段的方式(例如用户在字段上画叉或划线,而不是在其中打勾),复选标记可能无法被正确检测或训练。这类复选标记的检测和训练将在未来版本中得到改进。
  • 训练集的最大文档数量为 10,000,测试集的最大文档数量为 1,000。

Advanced Designer 中的快速学习

  • 从技能中删除快速学习活动时,数据库查找规则也会一并删除。

Advanced Designer 中的深度学习

  • 深度学习仅适用于文本类型的字段。
  • 一个深度学习活动最多可训练 50 个字段,包括重复组和字段,或者一张最多包含 32 列的表格。
  • 无法训练嵌套的重复组以及位于重复组中的组。

数据目录

  • 如果某个数据目录被用于任何技能(包括该技能的任意版本),则无法删除或更改该数据目录。若要删除不再需要的数据目录,必须先在技能中停止使用它(即删除或修改相应规则),并删除对应技能之前的所有版本。技能版本可以在技能设置中删除。如果不想删除旧的技能版本但又想更改数据目录,只需创建一个新的数据目录。
  • 当针对某个数据目录使用查找规则时,字段值不会自动填充。要填充该字段值,需要手动点击与相应字段关联的 Lookup 图标,从查找结果中选择值,然后重新训练该技能。

技能监控

  • 只能从 Error Log 中将最近的 10,000 条错误导出到 CSV 文件。您可以在 Error Log 中使用筛选和搜索特定行来减少需要导出的错误数量。
  • 如果某个技能被删除后又使用相同标识符重新导入,则在技能监控中不会显示任何指标。

业务处理报表仓库和质量分析报表仓库

  • 部分流程技能事务在已完成事务列表中缺失。
  • 在请求特定日期范围内的事务时,可能会返回整个时间段内的所有事务。
  • 在获取事务列表时,如果 offset 参数等于 totalitemcount 参数,则该端点的请求会失败。

Advanced Designer

  • 在 Manage Fields 对话框中,对于 Number 和 Money 字段类型,Number must be within interval 属性处于禁用状态。你可以在 Advanced Designer 中 Fields 选项卡的 Reference 部分,或在 Vantage 中设置此属性。
  • 在 Manage Fields 对话框中编辑并保存的字段设置不会与 Reference 标注部分同步。为避免此限制,请在 Vantage 中或在 Advanced Designer 中 Fields 选项卡的 Reference 部分编辑字段设置。

内置技能

  • 无法在内置技能的副本中启用其他语言。内置技能旨在处理特定语言的文档。在内置技能中启用其他语言,并不能从这些语言的文档中提取字段。你可以禁用任何一种支持的语言,建议禁用在文档处理中不会用到的语言。
  • 对于 Identity 文档技能,人工审核中不会显示提取字段的区域。

移动端采集

  • 目前尚未实现护照的自动采集功能。用户应在护照在屏幕中居中对齐后,手动拍摄文档图像。

Scanning Station 扫描工作站

  • 在没有管理员权限的情况下安装 Scanning Station 时,即使在安装过程中选择了其他界面语言,仍会安装为英文界面。要解决这一限制,可以采用以下任一变通方案:(a)在安装 Scanning Station 之前先获取管理员权限;(b)重新安装 Scanning Station;或(c)在安装完成后修改以下注册表项:
    [HKEY_CURRENT_USER\SOFTWARE\ABBYY\ScanStationVantage\5.0\Fine Objects]
    "InterfaceLanguage"="X"
    
    其中 X 的取值为:
    • 64 表示简体中文
    • 3 表示法语
    • 2 表示德语
    • 6 表示意大利语
    • 26 表示日语
    • 63 表示韩语
    • 27 表示葡萄牙语(巴西)
    • 5 表示西班牙语