サンプル画像


構造化ドキュメント用 Skill の作成
Fixed-form documents トグルを有効にしなかった場合、Skill のドキュメント処理フローは Fast Learning アクティビティのみで構成されます。
非構造要素や混在構造を含むフォームからのデータ抽出
Document Skill を作成する手順
- Advanced Designer を開きます。スタートページで Create Document Skill をクリックし、新しい Skill を作成します。
- Activities タブに移動し、Forms アクティビティをドキュメント処理フローに追加します。
- Activity Editor をクリックします。Blank Form タブで、ドキュメントの各バリアントごとに空のフォームサンプルを1つアップロードします (10種類を超えるバリアントのアップロードは推奨しません) 。データを抽出する必要がある field にラベルを付けます。ラベリングのガイドラインについては「Labeling documents」を参照してください。
- Train Activity をクリックします。
- Test Set タブをクリックし、記入済みのテストドキュメントをアップロードします。各ドキュメントで、すべての field に正しくラベルが付いていることを確認します。Test Activity をクリックします。処理が完了したら、結果を確認します。
- Activities タブに戻り、Extraction Rules アクティビティをドキュメント処理フローに追加します。
- Activity Editor をクリックし、Extraction Rules アクティビティを設定します。
- Test Skill Using Selected Documents をクリックします。処理が完了したら結果を確認します。結果に問題がなければ Skill を公開します。満足できない場合はラベリングを調整し、再度トレーニングとテストを実行します。
テーブルと繰り返しグループの扱い
現在は Text の値を持つテーブルのみが処理可能です。テーブルにチェックボックスやバーコードの列がある場合は、代わりに繰り返しグループを使用してください。
1つのフローでフォームと非構造化ドキュメントからデータを抽出する
Document skill を作成する手順
- Advanced Designer を開きます。スタートページで Create Document Skill をクリックし、新しい Skill を作成します。
- Activities タブに移動し、ドキュメント処理フローに Forms アクティビティを追加します。
- Activity Editor をクリックします。Blank Form タブで、空のサンプルフォームをアップロードし、抽出するデータの field にラベルを付けます。ラベリングのガイドラインは「Labeling documents」を参照してください。
- Train Activity をクリックします。
- Test Set タブをクリックし、記入済みのテストドキュメントをアップロードします。各ドキュメントで、すべての field に正しくラベルが付いていることを確認します。Test Activity をクリックします。処理が完了したら結果を確認します。
- Activities タブに移動し、ドキュメント処理フローに Fast Learning アクティビティを追加します。
- Activity Editor を開き、アクティビティを構成して学習させます。
- Activities タブに移動し、ドキュメント処理フローの先頭に Classify アクティビティを追加します。
- Activity Editor をクリックし、Classify アクティビティを設定します。各ドキュメントのバリアントごとにクラスを作成し、ドキュメントにクラスを割り当てて、アクティビティを学習させます。
- Activities タブに戻り、IF アクティビティを追加してドキュメント処理フローの条件分岐を設定します。このアクティビティを Forms および Fast Learning の各アクティビティに接続します。
- Test Skill Using Selected Documents をクリックします。処理が完了したら結果を確認します。結果に問題がなければ Skill を公開します。満足できない場合は、ラベリングを調整してアクティビティを再学習させます。
