跳转到主要内容
快速学习活动用于从结构化和半结构化文档中提取字段。它还允许在文档于 Vantage 中处理的同时,对作为此活动输出字段的字段进行训练。有关更多信息,请参阅《Vantage Runtime Guide》中的 Online Learning。您可以在 Activity Properties 窗格中取消选中字段训练,以显式禁用该功能。如果您未将快速学习活动添加到文档处理流程中,则在创建并发布技能之后,将无法再对字段进行训练。 如果您正在编辑在 Vantage 中创建的技能,该技能可能包含一个预训练的快速学习活动。您可以添加其他活动,并将其与预训练活动组合使用。有关更多信息,请参阅编辑在 Vantage 中创建和训练的技能
**注意:**快速学习活动无法提取复杂结构(例如嵌套表格,即位于其他表格内部的重复结构)以及 Image 类型字段。要提取此类结构,请使用 Extraction Rules activity

用例

在以下情况下,将此活动添加到您的文档处理流程中:
  • 当文档集包含多种不同的文档版式变体,并且您能够在训练期间为每种变体提供样本时。例如,如果您希望训练从多家不同银行的银行对账单中提取数据,并且手头有每家银行的样本。
  • 当您计划处理您的技能尚未训练过的文档变体,并希望利用 Online Learning(在线学习)时。例如,在处理发票时,每个供应商通常都有自己独特的发票版式,而且每天可能都会有新的供应商出现。在这种情况下,您会使用其他活动从文档中提取数据,但也可以将 Fast Learning 活动添加到处理流程中,它会在运行时利用来自人工审核循环的在线学习反馈进行训练。
  • 当您希望在文档于 Vantage 中处理的同时对字段进行训练时。

工作原理

Fast Learning 基于聚类技术,将布局相似的文档归为一组,并在内部为每个聚类训练一个字段抽取模型。Fast Learning 活动可以学习成千上万种不同的文档变体。 与 Deep Learning 活动不同,Fast Learning 活动更倾向于记住它已经“见过”的内容,而不是学习图像模式。Fast Learning 无法对尚未遇到的新文档变体进行泛化。在运行时,当 Fast Learning 活动遇到一个新文档时,它会判定该文档最接近哪个聚类,然后应用对应的内部模型。 此活动不需要大型训练集——一个文档就足以开始训练。如果您有同一类型文档的多个变体(例如,本质相同但外观略有差异的文档),建议在训练集中包含能够代表每种不同变体的文档。 有关更多信息,请参阅设置 Fast Learning 活动