メインコンテンツへスキップ
Fast Learning アクティビティは、構造化および半構造化のドキュメントから field を抽出するために使用します。さらに、Vantage でドキュメントを処理している間、このアクティビティの出力 field として選択した項目を学習させることができます。詳細は Vantage Runtime Guide の Online Learning を参照してください。field の学習は、Activity Properties ペインで選択を解除することで明示的に無効化できます。ドキュメント処理フローに Fast Learning アクティビティを追加しない場合、Skill を作成して公開した後に field を学習させることはできません。 Vantage で作成した Skill を編集中の場合、Skill に事前学習済みの Fast Learning アクティビティが含まれていることがあります。ほかのアクティビティを追加し、それらを事前学習済みのものと組み合わせることができます。詳細は、Vantage で作成および学習した Skill の編集を参照してください。
注記: Fast Learning アクティビティは、複雑な構造(例: 入れ子のテーブル。別のテーブル内に繰り返し構造があるもの)や Image 型の field を抽出できません。このような構造を抽出するには、Extraction Rules アクティビティを使用してください。

ユースケース

次のような場合、このアクティビティをドキュメント処理フローに追加します。
  • ドキュメントセットに複数のレイアウトのバリエーションが含まれ、学習時に各バリエーションのサンプルを提供できる場合。例:複数の銀行の銀行取引明細からの抽出を学習したい場合で、各銀行のサンプルが手元にあるとき。
  • まだ Skill を学習していないドキュメントのバリエーションを処理する予定で、Online Learning を活用したい場合。例:請求書の処理では、サプライヤーごとに請求書レイアウトが異なり、新しいサプライヤーが日々追加される可能性があります。この場合、他のアクティビティでドキュメントからデータを抽出しつつ、処理フローに Fast Learning アクティビティを追加すれば、手動確認ループからの Online Learning フィードバックに基づき、実行時に学習されます。
  • Vantage でドキュメントを処理しながら Field を学習したい場合。

仕組み

Fast Learning は、見た目が似たドキュメントのレイアウトをクラスタリングでグループ化し、各クラスターごとに内部的に field 抽出モデルを学習する技術に基づいています。Fast Learning アクティビティは、数千種類の異なるドキュメントのバリアントを学習できます。 Deep Learning アクティビティとは異なり、Fast Learning アクティビティは画像パターンを学習するというより、これまでに「見た」ものを記憶する傾向があります。Fast Learning は、まだ遭遇していない新しいドキュメントのバリアントに一般化することはできません。Fast Learning アクティビティが実行時に新しいドキュメントに遭遇すると、そのドキュメントがどのクラスターに最も類似しているかを判定し、対応する内部モデルを適用します。 このアクティビティは大規模な学習データセットを必要とせず、1 つのドキュメントから学習を開始できます。同一ドキュメントのバリアントが複数ある場合(たとえば、本質的には同一だが見た目がやや異なるドキュメントなど)、学習データセットには各バリアントを代表するドキュメントを含めることをお勧めします。 詳細については、Fast Learning アクティビティの設定を参照してください。