メインコンテンツへスキップ
学習時に、ABBYY FlexiCapture は受信したドキュメントを、元の会社に対応する適切な学習用バッチに振り分けます。通常、同じ会社のドキュメントは類似したレイアウトを持つため、FlexiLayout を学習させて検証段階で使用できます。同じ会社のドキュメントでもレイアウトが大きく異なる場合は、クラスタリング機能を使用してください。クラスタリング機能を有効にすると、FCFORINVOICES はドキュメントを自動的に分析し、共通する特徴に基づいてグループ (「クラスター」) に分類します。クラスターごとに個別の FlexiLayout が作成されます。 クラスタリング機能は既定で有効になっています。クラスタリングを無効にするには、次の手順を実行します。
  1. Document Definition エディターで、Document Definition → Document Definition Properties… をクリックします。
  2. 開いたダイアログで、Document Definition Settings タブをクリックします。
  3. Additional Fields and Features グループの右側にある Edit… ボタンをクリックします。
  4. Document Definition Features ダイアログで、Enable clustering オプションをオフにします。
学習用ドキュメントは、それぞれの会社に対応するバッチに配置されます。クラスタリング機能が有効で、同じ会社からレイアウトが大きく異なるドキュメントを受信した場合、その会社のドキュメントは、その会社用の学習用バッチ内でクラスタリングされます。クラスターごとに個別の FlexiLayout が学習されます。クラスターに少なくとも 1 つのドキュメントが含まれると、学習が開始されます。なお、クラスタリングは完全に自動化された処理であり、実際のクラスターはユーザーには表示されません。 データベースがなくても field の学習を使用したい場合は、ドキュメントを抽出しながらデータ セットにレコードを追加することで、会社情報を蓄積できます。詳細については、データベース内のベンダーと事業部門の検索 を参照してください。 その結果、FlexiLayout が作成されます。次の点に注意してください。
  • クラスタリング機能が無効な場合、ドキュメントは各会社に対応する適切な学習用バッチに配置され、会社ごとに FlexiLayout が作成されます。
  • クラスタリング機能が有効な場合、ドキュメントは学習用バッチ内でクラスタリングされ、クラスターごとに FlexiLayout が作成されます。
以前のバージョンの ABBYY FlexiCapture で作成されたプロジェクトを更新する場合、既存の FlexiLayout を変更せずにそのまま使用できます。ただし、クラスタリング機能を使用する場合、クラスタリング アルゴリズムによってドキュメントが学習用バッチ間で再配置され、クラスターごとに新しい FlexiLayout が作成されます。
Samples count column には、そのバッチ内のドキュメント数が表示されます。Samples matched column には、学習済みの FlexiLayout が field の 100% を検出できるドキュメント数が表示されます。 特定の会社のドキュメントの認識エラーが多すぎる場合は、カスタム FlexiLayout を作成するか、学習済みの FlexiLayout をエクスポートして ABBYY FlexiLayout Studio で編集できます。完了したら、カスタムまたは編集済みの FlexiLayout を学習用バッチに再インポートします。 ABBYY FlexiCapture から学習済みの FlexiLayout をエクスポートするには、次の操作を行います。
  1. Project Setup Station で、Field Training Open Field Extraction Training Batches をクリックして (または Ctrl + Alt + B を押して) 、学習用バッチビュー に切り替えます。
  2. バッチを右クリックし、shortcut menu で Export Trained FlexiLayout… をクリックします。
  3. 開いたダイアログで、FlexiLayout を含む *.fsp project file の保存先を選択します。 (その後、このファイルを ABBYY FlexiLayout Studio で開いて FlexiLayout を修正できます。)
変更した FlexiLayout、またはまったく新しい FlexiLayout を学習用バッチにインポートして、特定の 1 社用に使用できます (詳細については、プロジェクト設定権限を持つユーザーによる学習) を参照してください) 。 FlexiLayout を学習用バッチにインポートするには、次の操作を行います。
  1. Project Setup Station で、Fields Training Open Field Extraction Training Batches をクリックして (または Ctrl + Alt + B を押して) 、Field Extraction Training Batches view に切り替えます。
  2. バッチを右クリックし、shortcut menu で Import FlexiLayout… をクリックします。
  3. 開いたダイアログで、FlexiLayout を含む *.afl file を選択します。
クラスタリング機能を使用している場合は、次の制限事項に注意してください。
  • 新しい FlexiLayout を手動で作成する場合は、その会社に由来する可能性のあるすべての文書バリアントをカバーするようにしてください。1 つのクラスターだけを対象に FlexiLayout を手動で作成することはできません。
  • エクスポートされるのは、主要な文書フィールド用の FlexiLayout のみです。line item field には別個の機械学習アルゴリズムが使用されており、その結果はエクスポートも変更もできないため、line item field 用の FlexiLayout を生成してエクスポートすることはできません。ただし、line item field 用の FlexiLayout は手動で作成できます。
  • エクスポートされるのは、最初のクラスター用に学習された FlexiLayout のみです。
  • 新規または変更した FlexiLayout を学習用バッチにインポートした後は、次のようになります。
    • 文書の処理中に学習は実行されません。
  • このバッチではクラスタリングが無効になります。
    • インポートした FlexiLayout は、クラスターに関係なく、この会社のすべての文書の処理に使用されます。