注: このアクティビティでは、複雑な構造(たとえば、他のテーブル内に繰り返し構造として含まれる入れ子のテーブル)や、Text 以外の型の field を抽出することはできません。そのような構造を抽出するには、Extraction Rules アクティビティを使用してください。
ユースケース
- Skill を特定のドキュメントタイプの複数のバリアントの処理に使用する場合。
- Skill がまだ学習していないドキュメントバリアントを処理する予定がある場合。たとえば、複数の異なる銀行から送られてくるローン契約書(それぞれ field 構造が異なる)から field を抽出するように、Fast Learning アクティビティで学習させた Document skill があるとします。この既存の Skill を、まだ Skill が認識していない新しい銀行のローン契約書の処理に使用すると、抽出精度が期待より低くなる可能性があります。抽出精度を向上させるには、Fast Learning アクティビティの代わりに Deep Learning アクティビティを使用できます。
仕組み
トレーニング要件
- 変動が大きいドキュメントの場合: 少なくとも 200〜300 件のサンプルドキュメント(バリアントごとに 2〜3 件のサンプルドキュメント)が必要です。
- 変動が小さいドキュメントの場合: 最低 10 件のサンプルドキュメントが必要です(バリアントごとに 2〜3 件のサンプルドキュメント)。
