改进
Migrator
我们对 Vantage 3.0 Migrator 进行了系列增强,以提升可靠性和透明度,并改善客户从 Vantage 2.7.x 迁移到 3.0 时的整体迁移体验。这些更新基于实际迁移经验,旨在提高可预测性、减少人工干预,并加快价值实现速度。问题修复
✓ 在 Vantage 登录页面中,较长的租户名称会在租户选择窗口中被截断。现在,租户选择窗口更宽,可以显示完整的租户名称。(653576)✓ 无法为 Microsoft Power Automate 设置连接器。(656179)✓ 技能版本窗口中的链接会将用户引导到旧的文档 URL,而不是 docs.abbyy.com。✓ 在 Advanced Designer 中,将文档上传到 Invoice Splitter 技能后,字段不会加载。✓ 在 Advanced Designer 中,复制 Invoice Splitter 技能会导致403 错误。✓ 在技能目录中,对技能进行训练和发布后,将其升级到 Technology Core 版本 3.0 时会出现问题。✓ 对于 External Identitiy Providers,API 响应不包含 Client Secret。新功能
内置技能副本更新为派生技能
在较早版本的 Vantage 中,您可以创建内置技能的可编辑副本。在本版本中,您可以更新这些副本,这同时会更新 Technology Core,并将该副本转换为派生技能。将技能副本转换为派生技能,可以在基础技能将来发布新版本时实现方便且无缝的更新。一旦您将某个内置技能的副本转换为派生技能,系统会显示一份在转换过程中发生的更改列表。您对副本所做的部分更改将在转换后被重置,例如在派生技能中不允许更改的字段结构或字段属性等。更新完成后,请仔细检查新的技能,特别是所有已启用字段的标注。如果在检查并调整更新后的技能后,仍然无法获得期望的结果,您可以选择不发布该技能,并继续使用该副本,直到下一次 Technology Core 更新可用。完成 Technology Core 更新后,先前版本将不再受支持,您需要更新您的技能。新技能
现有内置技能的更新
- 发票:
- 已在所有 Invoice 技能中新增 Ship To 组,但 Invoice CN 技能除外。
- 采购订单:
- 现已支持处理来自意大利和荷兰的采购订单。
- 已修复法国采购订单的提取问题。
- 新增了一条规则:当 合计金额 与 净额 相同时,会将 合计金额 的值复制到 净额。
- Form 1040,美国个人所得税申报表:
- 2023 年度税务表单 现已支持。
- 个人收入报表:
- Employer’s Phone Number 字段已添加。
- 租赁协议:
- 通过在更多文档上进行训练,Lease Agreement 技能的质量得到了提升。
- Receipt CJK:
- 现已支持对日文收据进行手写识别。
Vantage 和 Advanced Designer 用户界面更新
Vantage 和 Advanced Designer 的用户界面已得到改进,使技能更新操作更加简便直观:- 每次更新后都会显示一份新的详细变更及所需操作概览,使更新过程更加清晰明了。
- 现在可以更改字段名称和类型。在更新技能副本和派生技能时,这些更改将被保留。
- 已新增“What’s New”字段,用于突出显示各技能版本的最新更新内容。
流程技能
- 在导出前遮盖字段 新增了一项功能,可在导出已处理图像之前对特定字段进行涂销处理,确保敏感和机密数据被永久移除。被涂销的字段在导出的图像上显示为黑色遮挡区域,在保护敏感信息的同时,仍然允许对图像进行存储或归档。被涂销的数据无法从 PDF 文件的文本层中恢复或复制。
- 配置自定义活动所需文件 以前,Custom activity 会创建包含所有提取数据的 JSON 文件,以及带有源图像的可搜索 PDF。现在,Custom activity 允许您选择要发送到外部系统的文档字段、文本和图像的格式。当在 Custom activity 中不需要 JSON 或 PDF 文件时,从而缩短了处理时间。您现在还可以在 Custom activity 中添加更多导出格式,而不仅限于 JSON 或 PDF。
移动端输入
- 指向 Vantage Mobile Input 的短链接 Vantage Mobile Input 现在支持短链接,使开发人员更容易将其集成到原生应用中。这也简化了用户访问 Vantage Mobile Input 微应用程序的方式。短链接可确保在移动设备上具有更好的兼容性,从而提升用户体验。
监控与报告
- Analytics 图形界面 新的 Analytics 服务会从 Analytics Reporting Warehouse 中检索所选流程技能的已处理事务详细信息,并将其显示在 Analytics 页面上。已处理事务的信息以摘要、图表和圆环图的形式呈现,并可在事务完成后的几分钟内获取。新的 Analytics 服务简化了数据处理并提升了文档处理效率。
业务流程报告
- 可指定时间段 在 Vantage API 中,从 Warehouse 中下载数据报告时,您现在可以指定一个时间范围,并且仅会下载在该时间范围内完成的事务事件。
- 文档和页面数量信息 Warehouse 的数据报表现在包含已完成事务中文档数量和页面数量的信息。
- 可下载大数据报告 Vantage API 现在支持以异步方式收集数据报表所需的数据。这意味着来自 Warehouse 的数据报表可以被拆分成多个文件。要获取所有文件,您需要针对每个文件分别发送请求。此更改旨在防止由于数据报表异常庞大而导致的故障。
重新启动失败事务的功能
该功能允许处理监督员重启失败的事务,这些事务可能由临时性问题引起,例如外部系统不可用或意外处理错误。重启后的事务将从头开始处理源文件,同时保留所有相关参数和文档。管理 Vantage
- 自定义令牌有效期 Vantage 租户管理员现在可以为其租户配置访问令牌和刷新令牌的有效期。
ABBYY Vantage Advanced Designer
技能现在可以使用 LLM
现已引入一项新的基于提示的活动,旨在在文档技能中使用外部大型语言模型 (LLM)。该活动允许您通过多种方式使用外部 LLM:- 您可以在针对 LLM 的提示中使用由其他活动提取的文档字段、文本和图像。例如,您可以上传一份财务报告,使用 Extraction Rules 活动提取特定的财务指标 (例如 EBITDA 或净利润) ,然后使用 LLM 将其与预测值进行比较。
- LLM 生成的输出可以通过 Vantage 活动进行进一步处理、验证或纠正。例如,您可以将提取的数据与数据目录进行比对验证,以帮助降低 LLM 潜在幻觉带来的影响。
现在可以使用较少数量的文档进行深度学习
现在,训练最少可使用 10 份文档进行;但对于文档数量低于 500 份的情况,系统仍会显示警告。可以使用预定义权重来帮助降低文档数量不足的影响;但若要通过深度学习达到足够的质量,训练时仍需要大量文档。Advanced Designer 中的高级准确率报告
以下高级统计信息现在可在技能测试后查看:- 技能在提取字段值方面的质量指标:Field Precision、Field Recall 和 Field F-measure。
- 技能在检测字段区域时的准确性:Region Precision、Region Recall 和 Region F-measure。
- 参考标注中字段实例的数量。
- 包含指定字段的文档占比。
NLP 提取规则:支持重复字段
从本版本开始,您可以在 NLP 提取规则中添加多个字段实例。所有提取的元素实例将显示在属性窗格的结果部分。新增 NLP 语言和地区
地址解析活动现在可以解析意大利地址。主要改进
OCR 技术改进
以下改进已应用于 OCR 技术- 由于在产品中集成了新的 e2e 模型,中文和泰文的光学字符识别 (OCR) 质量得到了提升。这将影响所有运行在 Technical Core 3.0 版本上的技能。
- 在协议、发票、财务文档以及包含数学公式的文档中,表格检测得到改进。
数据目录查找规则的改进
以下是对数据目录查找规则所做的改进:- 您现在可以根据字段值中任意词语的任意部分来搜索匹配的数据目录记录,而不仅仅是根据第一个词语进行匹配。
- 参与数据库查找的字段可以通过脚本、活动 (例如 Script 或 NLP 活动) 、规则以及手动方式进行填充。从此版本开始,如果在人工审核过程中更改了字段值,数据目录查找规则将会再次运行。如果找到对应记录,该字段将变为只读。
错误修复
在 Vantage Release 3.0 中,我们修复了以下问题:管理 Vantage
✓ 在为 Azure AD SAML 配置外部身份提供程序时,即使用户已通过外部身份提供程序完成系统认证,Vantage 仍会每次提示用户重新登录。(598355, 552880, 571969, 597296)✓ 当使用外部身份提供程序进行身份验证时,无法在 Advanced Designer 中切换租户。(599410)✓ 即使在租户中启用了 IP 限制,使用非白名单 IP 的用户仍然可以登录 Vantage。(604762)Advanced Designer
✓Internal Program Error: \\AwlVantageControls\\Src\\LayoutTabControl.cpp, 523 在 Advanced Designer 中对提取规则活动使用代码编辑器时出现此错误。(601875)✓ 从另一个技能导入标注时,明细项格式意外地从”table”更改为”重复组”。(588121)✓ Internal Program Error: ../DAForms/DAForms.HighLevel/Src/BlockResult.cpp, 203 在 Advanced Designer 中上传某些文档时出现此错误。(596699)✓ 如果向技能中添加了”提取规则”活动,则在打开活动编辑器时,已禁用的字段会变为启用状态。(600707)✓ 在 Advanced Designer 中上传的大型文档集导致性能下降或失败。(597783)✓ Advanced Designer 没有用于查看所有技能版本的滚动条。(595916)✓ 在提取规则活动中,图片无法被识别。(594091)✓ 在 Advanced Designer 中,重复组元素的排列顺序不正确。(582314)✓ 无法在 Advanced Designer 的”所有文档”窗格中选择多个文档进行删除。(582313)✓ 在 Advanced Designer 中上传文档时出现的问题 (581111)✓ 即使某个字段的输出复选框未勾选,FastML 仍会填充该字段的值。(576466)✓ 在 Advanced Designer 中,“重命名数据集”对话框曾因滚动条偏移而出现在数据集下方。现在,该对话框将显示在数据集名称所在的位置。(567358)✓ 在 Advanced Designer 中,Invoice US 技能 (Technology Core 2.4) 未能为供应商 ID 字段提取正确的值。(591210)航空货运单技能
✓ 使用 Air Waybill 技能时,部分文档中未能找到 Flight 和 Flight Date 字段。(577333)✓ 使用 Air Waybill 技能时,部分文档中的承运人国家字段提取不正确。(601791)内置技能,快速学习活动
✓ 如果将快速学习活动添加到内置技能并重新训练该技能,内置技能中字段的提取质量会下降。(598328)名片技能
✓ 在某些日语名片中,个人姓名被错误提取为组织名称。(564779)分类技能
✓ 部分已上传的文档从分类技能的文档集中消失。(581895)✓ 使用分类技能处理某些文档时,出现Max activation count for step exceeded 错误。(585456)✓ 默认分类技能在某些文档上无法正常工作。(581726)商业发票技能
✓ 管道符号和下划线未被提取。(549374)数据目录
✓ 使用”Document Issuer Company”类型的数据目录时,即使未识别到任何值,“Data Catalog Lookup”规则仍会获取值。(576583)✓ 通过 SFTP 上传数据目录 CSV 文件时,数据目录更新未按预期工作。(584710, 585050)✓ 使用有效文件更新数据目录时,出现Invalid data in CSV file 错误。(600635)✓ 修复了数据目录中存在重复记录时,导致无法找到任何记录且不显示任何错误消息的问题。(581746)✓ 即使技能中未使用数据目录,人工审核期间也会出现数据目录搜索弹出窗口。(583091)文档技能
✓ 某些技能在训练被取消后变得无响应。(597478, 598648, 599991)✓ 技能可能会对编辑过它们的用户锁定。(594866)✓ 文档技能在尝试打开、发布或导出时可能会无响应。(599067, 599582, 599892, 599991, 600169, 602816)✓ 更新大型技能时发生内存不足错误。(579890)✓ 在为固定表单文档设计的文档技能中标注表格时,表格单元格可能会消失。(582447)✓ 末尾带有负号的负数字段值被错误地识别为正数。(581898, 583978)✓ 新创建的文档技能在同时启用泰语和英语时无法识别符号。(603748)✓ 处理大型文档时,事务因错误而失败。(587435)✓ 文档技能的提取准确率较低。(577537)✓ 部分文本提取有误。(577166)✓ 修复了编辑文档技能时文档上传失败的问题。(582452)✓ 已禁用的字段被纳入计算准确率的结果概览中。(566879)✓ 文档技能无法识别和提取竖排文本的问题已修复。(501694)导出技能
✓ 如果未勾选”Export with embedded skills”选项,包含超过 100 个文档的流程技能将无法导出到本地计算机。(594063)✓ 导出文件中图像区域的矩形坐标超出了导出页面的宽度和高度。(571790)手写识别 OCR
✓ 手写识别 OCR 对某些文档无法正常工作的问题已修复。(593302)✓ 训练后的手写识别文本在提取时遗漏了第一个字符,导致结果不正确。(572998)✓ 来自表格不同行的手写识别文本被显示为单个单词,导致结果不正确。(572996)导入文档
✓ 导入某些 PNG 文件时出现Cannot open the image file. The file may be corrupted. 错误。(602971)✓ 将矢量 PDF 导入 Vantage 后,图像质量下降。(581372)导入技能
✓ 导入流程技能时,Vantage 现已允许用户选择如何处理嵌入的技能。(568806)Invoice 技能
✓ 某些贷记单文档未被识别为贷记单,尽管所需关键字已存在。(567399)✓ 使用 Invoice 技能时,部分原生数字 PDF 中的发票号码和发票日期字段未能被提取。(587417)✓ 使用 Invoice 技能时,部分文档未能提取 Bank Code 字段。(575741)✓ 修复了无法在发票技能的”可接受日期”字段中输入 0 的问题。输入 0 可确保不会处理任何未来日期的发票。(563263)Invoice CN 技能
✓ 中文数据提取质量问题。(493023)Invoice JP 技能
✓ 使用 Invoice JP 技能时,部分文档未能提取”合计金额”字段。(597732)Invoice UA 技能
✓ 使用 Invoice UA 技能时,部分文档中的 Quantity 和 Unit Price 字段未被提取。(586336)人工审核
✓ 在人工审核期间,将页面从一个文档移动到另一个文档时,偶发出现问题 (例如黑屏、图像无限加载等) 。(586235)✓ 如果某个流程技能包含多个人工审核阶段,当一个事务在第一个人工审核阶段处理完毕后被路由至第二个人工审核阶段时,将导致无法通过人工审核链接或技能监控在审核界面中打开该事务。(603366)✓ 人工审核期间,文档类型列表未按字母顺序排列。(588131)✓ 修复了即使在人工审核期间从数据目录中手动选择了记录,No records found 错误仍然持续出现的问题。(601613, 600781)✓ 在人工审核中,调整 Field 窗格大小较为困难。(590746)✓ 在人工审核中,当文档技能被策略删除时,事务会失败。(587960)✓ 当人工审核完成后,再次点击人工审核链接时,会出现一条通用错误消息。该错误消息已得到改进。(585573)✓ 在人工审核中手动绘制字段区域时,即使该区域未完全覆盖完整值,系统仍会提取完整值。(562061)✓ 在人工审核期间,字段值未根据文档中的字段区域自动填充。(561595)✓ 无法在人工审核中打开事务。(611592)采购订单技能
✓ 页面上的部分文本未被识别或识别有误。(566393)✓ 如果另一个合计字段包含相同的数字,小计/货物合计字段的值会不正确。(594464)✓ 使用采购订单技能时,部分数据无法从法语文档中提取。(576291)OCR
✓ 某些文档上的字段值提取不正确。(589314)✓ 从明细项中提取数据时,有时可能会引入幻影字符。(547197)✓ 图像上传方式可能会影响识别结果。(580169)✓ 处理某些文档时出现ProjectiveTransformationParams.cpp, 100 内部程序错误的问题已修复。(585333)✓ 对于某些 RTL 语言 (例如希伯来语和阿拉伯语) 的文档,单词顺序识别有误。(462151, 580752)✓ 处理某些文档时出现 Internal program error:../FineObjects/Inc/Object.h, 360. 错误。(598221)✓ 从某些阿拉伯语文档中提取明细项时,第一行出现倒置问题。(595150)✓ 某些文档上的部分数字未被识别或识别有误。(589175, 603681)✓ 处理某些文档时出现 Max activation count for step exceeded 错误。(602331)✓ 处理某些日语文档时,日期识别不正确的问题已修复。(584518)✓ 处理泰语文档时,逗号被识别为句点的问题已修复。(567178)✓ 在全文 OCR 过程中,低对比度文本未被识别或识别有误。(544424)✓ 表单上的标准复选标记未被检测到。(460241)✓ 手动绘制字段区域时,RTL 语言中的多词文本显示顺序不正确的问题已修复。(443616, 580184, 525296, 492170, 579355)✓ 如果某个字段在数字后面带有负号,该负号未被提取。(584492)✓ 如果在文档中未找到某个值,该字段将被填充数据,而非保持空白。(570252)✓ 即使手动绘制字段区域时值是正确的,系统仍将其识别为错误。(565943)✓ 提取过程中未能识别货币符号。(564681)✓ 使用”从数据目录获取值”选项时,未能从数据目录中提取记录。(564011)OCR 技能
✓ 当使用启用了”导出为 PDF”选项的 OCR 技能处理文档时,输出 PDF 中的条形码无法被条形码扫描仪识别。(564727)流程技能
✓ 如果在人工审核期间更改了文档类型,包含带有 Classify 活动的”For-each”块的流程技能在导出的 JSON 文件中会将”ResultClass”值设置为 null。(592498)✓ 在技能监控中禁用导入时,Import is disabled for this skill. 警告未出现在输入活动设置中。(597789)报告服务
✓ 报告服务针对基于 Technology Core 2.0 版本的技能,在NumberOfChangedFields 列中返回了错误的值。(597754)✓ 使用指定 startDate 和 endDate 值的 /transaction-steps 请求返回了超出指定范围的事务。(586394, 588878)✓ process-skills/fields 和 /process-skills/documents 请求失败,并出现 Tenant mapping not found for tenant. 错误。(605418)✓ 使用 API 提取包含过多记录的事务报告时,出现 504 Gateway Time-out 错误。(593394, 604392)海运单技能
✓ 随着更多样本被添加到 Sea Waybill 技能并对该技能进行重新训练,Containers 表格字段的准确率有所下降。(582982)✓ 默认 Sea Waybill 技能的提取质量过低。(581472)技能监控
✓ 当搜索结果超过单个页面所能显示的数量时,搜索功能无法正常工作。(592619)✓ 某些事务在被取消后,其阶段在技能监控中未发生变化。(570696)训练
✓ 文档技能的训练有时会失败,并显示Could not update report, because workflow failed 错误。(580332)✓ 如果某些字段被禁用,派生技能的训练将失败。(588035)✓ 训练某些技能时出现 Managed interop delegate failed in /DEV_ROOT/0/OcrtWorker/Native/Interop/Src /Exports/InteropStorageAccess.cpp:23 错误。(594034)✓ 已删除的技能可编辑版本中的文档,有时不会从该技能的下一个可编辑版本中删除。(596442)✓ 训练某些技能时出现 Max activation count for step exceeded 错误。(585137)✓ 向技能添加更多样本并重新训练后,某些字段的准确率有所下降。(569334, 601893)✓ 即使在对示例文档训练技能后,某些字段仍被错误提取。(597627)✓ 即使在对示例文档训练技能后,部分明细项仍未被提取。(603240, 583993)Technology Core
✓ 将某些派生技能升级到 Technology Core 2.4 版本会导致其准确性降低。 (579585)✓ 当派生技能更新至 Technology Core 2.4 版本时,在派生技能中更改的字段数据类型已恢复为基础技能的数据类型。(605495)✓ 在某些更新至 Technology Core 版本 2.4 的技能中,表格提取结果不正确。(580130)Vantage 文档
✓ 文档中的一些错误已修复。(593114, 590537, 561590, 600172)✓ 已在通过 Vantage API 创建租户中添加了 Model Parameter 的说明,并相应更新了示例请求。(584558, 594350)✓ 模糊搜索已在创建数据目录查找规则中进行了更详细的说明。(598897)已知问题
- Vantage 3.0 Arrival Notice 技能不再支持对法语和德语的语言识别。Arrival Notice 技能仅支持英语。
- 用户在从 Vantage 2 租户切换到 Vantage 3 租户后无法登录 Vantage 3。**解决方法:**若要同时使用 Vantage 2 和 Vantage 3,请在浏览器的隐身窗口中登录 Vantage 3。
