快速学习活动 - ABBYY Documentation

用例
工作原理

快速学习活动用于从结构化和半结构化文档中提取字段。它还允许在文档于 Vantage 中处理的同时，对作为此活动输出字段的字段进行训练。有关更多信息，请参阅《Vantage Runtime Guide》中的 Online Learning。您可以在 Activity Properties 窗格中取消选中字段训练，以显式禁用该功能。如果您未将快速学习活动添加到文档处理流程中，则在创建并发布技能之后，将无法再对字段进行训练。如果您正在编辑在 Vantage 中创建的技能，该技能可能包含一个预训练的快速学习活动。您可以添加其他活动，并将其与预训练活动组合使用。有关更多信息，请参阅编辑在 Vantage 中创建和训练的技能。

快速学习活动无法提取复杂结构 (例如嵌套表格，即位于其他表格内部的重复结构) 以及 Image 类型字段。要提取此类结构，请使用 Extraction Rules activity。

用例

在以下情况下，将此活动添加到您的文档处理流程中：

当文档集包含多种不同的文档版式变体，并且您能够在训练期间为每种变体提供样本时。例如，如果您希望训练从多家不同银行的银行对账单中提取数据，并且手头有每家银行的样本。
当您计划处理您的技能尚未训练过的文档变体，并希望利用 Online Learning (在线学习) 时。例如，在处理发票时，每个供应商通常都有自己独特的发票版式，而且每天可能都会有新的供应商出现。在这种情况下，您会使用其他活动从文档中提取数据，但也可以将 Fast Learning 活动添加到处理流程中，它会在运行时利用来自人工审核循环的在线学习反馈进行训练。
当您希望在文档于 Vantage 中处理的同时对字段进行训练时。

工作原理

Fast Learning 基于聚类技术，将布局相似的文档归为一组，并在内部为每个聚类训练一个字段抽取模型。Fast Learning 活动可以学习成千上万种不同的文档变体。与 Deep Learning 活动不同，Fast Learning 活动更倾向于记住它已经“见过”的内容，而不是学习图像模式。Fast Learning 无法对尚未遇到的新文档变体进行泛化。在运行时，当 Fast Learning 活动遇到一个新文档时，它会判定该文档最接近哪个聚类，然后应用对应的内部模型。此活动不需要大型训练集——一个文档就足以开始训练。如果您有同一类型文档的多个变体 (例如，本质相同但外观略有差异的文档) ，建议在训练集中包含能够代表每种不同变体的文档。有关更多信息，请参阅设置 Fast Learning 活动。

公司识别的工作原理

设置 Fast Learning 活动

Advanced Designer

​用例

​工作原理

用例

工作原理