- File をクリックし、New Batch を選択します。
- 開いたダイアログで、先ほど作成したDocument Definitionを選択し、次に field を設定したセクションを選択して OK をクリックします。
- Look up Variant for Training Batch ウィンドウで、学習に使用する候補を選択します。
- 新しく作成した batch を選択し、NLP batch オプションを選択するか、Field extraction training > NLP batch をクリックします。

- 作成した batch をダブルクリックして開きます。
- File > Load Images…. をクリックします。
- 開いたダイアログで、Image Processing Settings… をクリックし、One document per file オプションを選択して OK をクリックします。
- NLP Modelの学習に使用するドキュメントを選択します。
- すべてのドキュメントのロードが完了したら、それらを選択して Recognition > Match Document Definition をクリックします。あるいは、選択範囲を右クリックして Match Document Definition をクリックします。続いて、適切なDocument Definitionを選択します。
- Document Definitionで定義されているすべての field は、training documents 内でマークアップされている必要があります。
- 各学習 batch には 100~500 件のドキュメントを含めることをお勧めします。この件数があれば、学習処理を遅くすることなく、プログラムがNLP Modelに最適な parameters を選択できます。
- ドキュメントをダブルクリックして開きます。
- ドキュメントから情報を抽出する field を選択します。次に、ドキュメント上でその field の値を選択するか、その周囲に四角形を描きます。この手順を各 field について繰り返します。
ボタンをクリックして次のドキュメントに進みます。残りのすべてのドキュメントについて上記の手順を繰り返します。- 変更を保存します。
