サンプル画像


構造化ドキュメント用 Skill の作成
Note: 複数のバリアントを持つ構造化ドキュメントを処理する Skill の作成手順については、Setting up a Document skill for processing structured documentsを参照してください。Vantage で作成した Skill は Advanced Designer に表示されます。ドキュメント処理フローには、構造化ドキュメントの処理に特化した Forms アクティビティが含まれます。
Note: Fixed-form documents トグルを有効にしなかった場合、Skill のドキュメント処理フローは Fast Learning アクティビティのみで構成されます。Advanced Designer では、構造化ドキュメントの処理を他の Vantage テクノロジーと組み合わせる必要がある場合に、構造化ドキュメント用の Skill を作成および編集できます。この場合、Forms アクティビティは、Advanced Designer で作成・設定された他のアクティビティと併用する必要があります。
Note: ドキュメント処理フローに、他のアクティビティと併用する Forms アクティビティが含まれる場合、または複数の Forms アクティビティが含まれる場合、Vantage での編集は Skill のプロパティ変更のみに限定され、学習は利用できません。より高度な編集には Advanced Designer を使用してください。
非構造要素や混在構造を含むフォームからのデータ抽出
Document Skill を作成する手順
- Advanced Designer を開きます。スタートページで Create Document Skill をクリックし、新しい Skill を作成します。
- Activities タブに移動し、Forms アクティビティをドキュメント処理フローに追加します。
- Activity Editor をクリックします。Blank Form タブで、ドキュメントの各バリアントごとに空のフォームサンプルを1つアップロードします(10種類を超えるバリアントのアップロードは推奨しません)。データを抽出する必要がある field にラベルを付けます。ラベリングのガイドラインについては「Labeling documents」を参照してください。
- Train Activity をクリックします。
- Test Set タブをクリックし、記入済みのテストドキュメントをアップロードします。各ドキュメントで、すべての field に正しくラベルが付いていることを確認します。Test Activity をクリックします。処理が完了したら、結果を確認します。
- Activities タブに戻り、Extraction Rules アクティビティをドキュメント処理フローに追加します。
- Activity Editor をクリックし、Extraction Rules アクティビティを設定します。
- Test Skill Using Selected Documents をクリックします。処理が完了したら結果を確認します。結果に問題がなければ Skill を公開します。満足できない場合はラベリングを調整し、再度トレーニングとテストを実行します。
テーブルと繰り返しグループの扱い
注: 処理結果にはデータのある行のみが表示されます。空行は無視されます。グループ内の行数またはインスタンス数が事前に不明な場合は、別の Vantage のテクノロジーを使用する必要があります。
注: 現在は Text の値を持つテーブルのみが処理可能です。テーブルにチェックボックスやバーコードの列がある場合は、代わりに繰り返しグループを使用してください。
1つのフローでフォームと非構造化ドキュメントからデータを抽出する
Document skill を作成する手順
- Advanced Designer を開きます。スタートページで Create Document Skill をクリックし、新しい Skill を作成します。
- Activities タブに移動し、ドキュメント処理フローに Forms アクティビティを追加します。
- Activity Editor をクリックします。Blank Form タブで、空のサンプルフォームをアップロードし、抽出するデータの field にラベルを付けます。ラベリングのガイドラインは「Labeling documents」を参照してください。
- Train Activity をクリックします。
- Test Set タブをクリックし、記入済みのテストドキュメントをアップロードします。各ドキュメントで、すべての field に正しくラベルが付いていることを確認します。Test Activity をクリックします。処理が完了したら結果を確認します。
- Activities タブに移動し、ドキュメント処理フローに Fast Learning アクティビティを追加します。
- Activity Editor を開き、アクティビティを構成して学習させます。
- Activities タブに移動し、ドキュメント処理フローの先頭に Classify アクティビティを追加します。
- Activity Editor をクリックし、Classify アクティビティを設定します。各ドキュメントのバリアントごとにクラスを作成し、ドキュメントにクラスを割り当てて、アクティビティを学習させます。
- Activities タブに戻り、IF アクティビティを追加してドキュメント処理フローの条件分岐を設定します。このアクティビティを Forms および Fast Learning の各アクティビティに接続します。
- Test Skill Using Selected Documents をクリックします。処理が完了したら結果を確認します。結果に問題がなければ Skill を公開します。満足できない場合は、ラベリングを調整してアクティビティを再学習させます。
