自動データ抽出を行わない Document Definition は、次のような場合に役立ちます。
- 文書セットに常に含める必要はあるものの、データを抽出すべきでない、または抽出できない文書を処理する場合。たとえば、手書きの文書や通知書などです。
- データを抽出せずに文書を分類・仕分けしたい場合。
このような場合は、対象の文書が解析ステージをスキップする Document Definition を作成できます。これにより、検証オペレーターの負担が軽減され、処理も高速化されます。
自動field抽出を行わない Document Definition を作成するには、次の条件を満たす必要があります。
- 文書にアンカー識別子がないこと (ある場合は fixed forms として扱われます) 。
- FlexiLayout がロードされていないこと。
- field学習が無効になっていること。
Document Definition Wizard で、自動データ抽出を必要としない文書を選択します。すると、1 つのセクションだけを持つ Document Definition が作成され、自動データ抽出を必要としない文書はすべて解析ステージをスキップするようになります。
通常、この種の文書では OCR は不要です。手動インデックスを使用する予定がある場合や、検証オペレーターが画像上の文字をクリックしてテキストを入力できるようにしたい場合は、文書にテキストレイヤーがあることを確認してください。文書にテキストレイヤーを追加するには、Can have region オプションを選択した field を少なくとも 1 つ作成します。
また、Create searchable PDF オプションを選択すると、エクスポートステージでテキストレイヤーを追加することもできます。
どの Document Definition でも、自動field抽出を行わないように変更できます。必要なのは、すべてのアンカーと FlexiLayouts を削除し、field学習を無効にすることだけです。