メインコンテンツへスキップ
Fast Learning アクティビティは、構造化および半構造化ドキュメントから Field を抽出するために使用します。さらに、Vantage でドキュメントを処理している間、このアクティビティの出力 Field として選択された Field を学習させることもできます。詳細は「Vantage Runtime Guide, Online Learning」を参照してください。Field の学習は、Activity Properties ペインで選択を解除することで明示的に無効化できます。ドキュメント処理フローに Fast Learning アクティビティを追加しない場合は、Skill を作成して公開した後に Field を学習させることはできません。 Vantage で作成した Skill を編集している場合、Skill に事前学習済みの Fast Learning アクティビティが含まれていることがあります。他のアクティビティを追加し、それらを事前学習済みのものと組み合わせることができます。詳細は「Vantage で作成および学習した Skill の編集」を参照してください。
注意: Fast Learning アクティビティは、複雑な構造(例: ネストされたテーブル[他のテーブル内の繰り返し構造])や Image 型の Field を抽出できません。そのような構造を抽出するには、Extraction Rules アクティビティを使用してください。

ユースケース

次のような場合、このアクティビティをドキュメント処理フローに追加します。
  • ドキュメントセットに複数のレイアウトのバリエーションが含まれ、学習時に各バリエーションのサンプルを提供できる場合。例:複数の銀行の銀行取引明細からの抽出を学習したい場合で、各銀行のサンプルが手元にあるとき。
  • まだ Skill を学習していないドキュメントのバリエーションを処理する予定で、Online Learning を活用したい場合。例:請求書の処理では、サプライヤーごとに請求書レイアウトが異なり、新しいサプライヤーが日々追加される可能性があります。この場合、他のアクティビティでドキュメントからデータを抽出しつつ、処理フローに Fast Learning アクティビティを追加すれば、手動確認ループからの Online Learning フィードバックに基づき、実行時に学習されます。
  • Vantage でドキュメントを処理しながら Field を学習したい場合。

仕組み

Fast Learning は、見た目が類似するドキュメントのレイアウトをクラスタリングでグループ化し、各クラスターに対して内部で field 抽出モデルを学習する技術に基づいています。Fast Learning アクティビティは、数千に及ぶさまざまなドキュメントのバリアントを学習できます。 Deep Learning アクティビティとは対照的に、Fast Learning アクティビティは画像パターンを学習するというよりも、これまでに「見た」ものを記憶する傾向があります。Fast Learning は、これまでに遭遇していない新しいドキュメントのバリアントへ一般化することはできません。実行時に Fast Learning アクティビティが新しいドキュメントに直面した場合、そのドキュメントがどのクラスターに最も近いかを判定し、対応する内部モデルを適用します。 このアクティビティには大量の学習用データは不要で、1 つのドキュメントから学習を開始できます。同一のドキュメントに複数のバリアントがある場合(例えば、本質的には同一だが見た目がやや異なるドキュメントなど)、学習用データには各バリアントを代表するドキュメントを含めることを推奨します。 詳細については、Setting up a Fast Learning activity を参照してください。