- Document Definition Editor で Document Section 名を右クリックし、Create Field を選択します。
- Text field を作成します。
- [General] タブで、[Can have region] オプションを選択します。
- [Name] field に、フィールド名 (例: PreambleSegment) を指定します。 重要! フィールド名にはスペースや英字以外の文字を含めることはできません。また、数字で始めることもできません。

セグメンテーションを使用する場合は、各セグメントごとに個別の Text field を作成する必要があります。
- 繰り返しグループ内に、非繰り返しフィールドを作成します。
- field properties で、[Text segment] オプションを選択します。
- セグメントの開始位置と終了位置が異なるページにまたがる場合は、[Allow multiple regions] オプションを選択します。
- Document Definition Editor で、Document Section 名を右クリックします。
- [Properties…] を選択します。
- 開いたダイアログで [NLP] タブをクリックし、[Create…] をクリックします。
- [Name] field に、セグメンテーションモデルの名前 (例: SegmentationModel) を指定します。
- [Model type] field で、[Segmentation] を選択します。
- [Language] リストで、必要な言語を選択します。

- [Next…] をクリックします。
- 開いたダイアログで、セグメントの抽出先となるすべてのフィールドを指定します。
- OK をクリックします。
[Allow training] オプションを使用すると、文書処理中に NLP モデルを学習させることができます。field extraction training batch を使用して field extraction を学習させると、NLP モデルも学習されます。学習結果は無効にすることも削除することもできます。学習結果を無効にするには、training batch を右クリックし、shortcut menu で [Disabled] 項目を選択します。学習結果を削除するには、training batch を右クリックし、shortcut menu で [Delete] 項目を選択します。
- Document Definition Editor で document section のプロパティを開き、[NLP] タブをクリックします。
- [Create…] をクリックします。
- NLP モデルの [Name] を指定します (例: EntitiesExtraction) 。
- データソースとして、section (セグメンテーションを使用しない場合) または segment (セグメンテーションを使用する場合) を選択します。
- [Model type] field で、[Extraction] を選択します。
- [Language] リストで、必要な言語を選択します。
- [Next…] をクリックします。
- 選択した document section または segment から抽出される結果フィールドを選択します。
- Document Definition > [Save] をクリックして、Document Definition を保存します。
- Document Definition > [Close] をクリックして、Document Definition Editor を閉じます。
- Document Definition > [Publish] をクリックして、Document Definition を公開します。
[Allow training] オプションを使用すると、文書処理中に NLP モデルを学習させることができます。field extraction training batch を使用して field extraction を学習させると、NLP モデルも学習されます。学習結果は無効にすることも削除することもできます。学習結果を無効にするには、batch を右クリックし、shortcut menu で [Disabled] 項目を選択します。学習結果を削除するには、batch を右クリックし、shortcut menu で [Delete] 項目を選択します。
