メインコンテンツへスキップ
プロジェクト管理者は、プロジェクトのセットアップ時にいくつかの学習用バッチを使ってプログラムを学習できます。オペレーターが認識済み文書を修正すると、修正後の文書は管理者が使用する学習用バッチに追加されます。オペレーターによる学習で期待どおりの結果が得られない場合は、管理者が学習用バッチにさらに変更を加え、プログラムを再学習することもできます。 学習が完了すると、管理者は特定のバッチをロックして、処理オペレーターによる変更を防ぐことができます。特定の会社に使用する学習用バッチをロックするには、そのバッチを右クリックし、ショートカット メニューで Lock Training by Operators をクリックします。 学習を利用できるのは、ABBYY FlexiCapture がデータベース内の対応するレコードを見つけて、問題を確実に識別できる場合に限られます。 データベースがない場合でもフィールド学習を使用したいときは、文書の取り込み中にデータ セットへレコードを追加することで、会社情報を蓄積できます。詳細については、データベースでベンダーと事業部門を検索するを参照してください。
このセクションで説明する操作は、管理者、または FCFORINVOICES でプロジェクトを設定する権限を持つユーザーのみが実行できます。
学習用バッチ ビューには、学習に使用されるすべての文書画像が表示されます。学習用バッチ ビューに切り替えるには、ツールバーの (Open Field Extraction Training Batches) をクリックします。あるいは、Field Training → Open Field Extraction Training Batches をクリックします。 プログラムには、オペレーターが追加したすべての文書バリアントについて、学習用バッチの一覧が表示されます。見やすくするため、このビューには VATID、IBAN (国際銀行口座番号) 、データベース ID など、重要な会社パラメーターも表示されます。 このビューでは、文書バリアントを操作できます。
学習用バッチをダブルクリックするか、学習用バッチを右クリックしてショートカット メニューの Open をクリックします。対応する FlexiLayout バリアントに使用されるサンプル画像の一覧が表示されます。各サンプル画像は、次の 3 つの状態のいずれかになります。
  • Unused - このサンプル画像は、この FlexiLayout バリアントの学習にもテストにも使用されません。
  • For training - このサンプル画像は、この FlexiLayout バリアントの学習とテストに使用されます。
  • For testing - このサンプル画像は、この FlexiLayout バリアントのテストにのみ使用されます。
このビューでは、FlexiLayout バリアントの学習を開始するのに必要なサンプル画像は 1 つだけです。ただし、For training 状態のサンプル画像を少なくとも 3 つ用意することをお勧めします。学習用のサンプル画像が不足している場合は、Load Images… をクリックして画像をさらにロードします。既定では、新しく追加された画像はすべて For training としてマークされます。追加した画像が自動的に認識されない場合は、Recognize をクリックして認識処理を強制的に開始します。
  1. 使用する画像の状態を For training に変更します。状態を変更するには、必要な画像を選択し、それらを右クリックして、Set Document State → For training を選択します。この文書バリアントをまだ学習したことがない場合は、すべてのサンプル画像の状態を For training に変更することをお勧めします。
  2. すべての Region のマークアップを確認し、必要に応じて調整します。これは重要です。すべての Region の位置が考慮されるためです。
  3. FlexiLayout バリアントの学習を開始するには、次のいずれかを行います。
    • メイン メニューで Fields Training → Train を選択する
    • 一覧内の任意の場所を右クリックし、ショートカット メニューで Train を選択する
    • 学習用バッチ ビューに切り替え、文書バリアントのショートカット メニューで Train を選択する
学習の進行状況は Train Document Definition ウィンドウに表示されます。この学習の結果として、FlexiLayout バリアントが作成されます。次に、その FlexiLayout バリアントは For training および For testing とマークされたすべての文書でテストされます。プログラムは各サンプル画像に FlexiLayout を適用し (この処理はユーザーには表示されません) 、その結果を参照レイアウト (つまり、ユーザーが手動で作成したレイアウト) と比較します。その後、マッチングの品質が判定されます。新しい FlexiLayout バリアントが、この FlexiLayout バリアントの以前のバージョンおよびメインの FlexiLayout より優れている場合、新しい FlexiLayout バリアントが保存され、以降のデータ取り込みに使用されます。一部のサンプル画像が学習に悪影響を与えていると思われても、それらをテストには使用したい場合は、その状態を For testing に変更します。学習時には、これらのサンプル画像上のすべてのフィールドの Region が正しい位置にあることを確認してください。テスト処理自体はユーザーには表示されません。
文書バリアントを右クリックし、ショートカット メニューで Export Trained FlexiLayout… を選択します。サンプル画像を追加または削除するだけでは目的の結果を得られない場合は、この操作が必要になることがあります。
文書バリアントを右クリックし、ショートカット メニューで Import FlexiLayout… を選択します。この文書バリアント用に FlexiLayout Studio で手動作成した FlexiLayout がある場合は、この操作が必要になることがあります。
文書バリアントを右クリックし、ショートカット メニューで Lock Training by Operators を選択します。指定した文書バリアントの FlexiLayout がすでに学習済みであるか、または手動で作成されており、処理中にそれ以上学習する必要がない場合は、学習を禁止するとよいでしょう。
文書バリアントを右クリックし、ショートカット メニューで Disabled を選択します。指定した会社の文書を処理する際に、メインの FlexiLayout のみを使用したい場合は、このオプションを選択します。
オペレーターがドキュメントの取り込みを開始する前に FlexiLayout バリアントを学習させたい場合は、新しい学習用バッチを作成するとよいでしょう。
  1. 学習用バッチビューで、空白のフィールドを右クリックし、ショートカットメニューから New Batch… を選択します。
学習用バッチを作成したら、それに関連付ける Document Definition (プロジェクトで複数の Document Definitions を使用している場合) と、学習結果を使用する会社を選択します。
  1. プロジェクトに 複数の Document Definition がある場合は、Select Document Definition ダイアログで目的の Document Definition を選択します (バッチを右クリックし、ショートカットメニューで Change Document Definition… をクリックします) 。
  2. 学習用バッチの発行会社を選択します。
バッチ内のドキュメントは、必ずそのバッチに割り当てられた Document Definition のみを使用して認識してください。
バッチに関連付けられた会社または Document Definition を変更するには、バッチのショートカットメニューを使用します。Clear Document Definition コマンドを使用すると、バッチに関連付けられた Document Definition が削除されます。Document Definitions が関連付けられていない Batches は学習に使用できません。
  1. 学習用バッチを右クリックし、ショートカットメニューから Load Images… を選択して、ドキュメントを追加します。新しく追加したドキュメントは自動的に認識されます。
  2. フィールドRegionが正しく検出されているか確認し、必要に応じて調整します。
  3. FlexiLayout バリアントの学習に使用するドキュメントを選択し、そのうちの 1 つを右クリックして Set Document State → For training をクリックします。
  4. FlexiLayout バリアントの学習を開始します。実行方法は複数あります。
  • Main window で Fields Training メニューを開き、Train をクリックします。
  • リスト内の空白部分を右クリックし、ショートカットメニューで Train をクリックします。
  • 学習用バッチビューを開き、FlexiLayout バリアントを右クリックして、ショートカットメニューで Train をクリックします。
Use own recognition settings of FlexiLayout オプションを無効にします。これにより全文認識設定が同期され、文書処理が高速化されます。
特定の会社向けに使用するため、変更した FlexiLayout またはまったく新しい FlexiLayout を学習用バッチにインポートする場合は、次の手順を実行します。
  1. ABBYY FlexiLayout Studio で FileExport… をクリックし、表示される Export FlexiLayout ダイアログで、ファイル名と保存先フォルダーを指定します。
  2. ABBYY FlexiCapture で Train Field Extraction → Import FlexiLayout… をクリックします。
clustering 機能を使用している場合は、次の制限事項に注意してください。
  • 新しい FlexiLayout を手動で作成する場合は、指定した会社に由来するすべての 文書バリアント をカバーするようにしてください。1 つの cluster のみを対象とする FlexiLayout を手動で作成することはできません。
  • エクスポートされるのは、メインのドキュメントフィールド用の FlexiLayout のみです。line item fields では別個の機械学習アルゴリズムが使用され、その結果はエクスポートも変更もできないため、line item fields 用の FlexiLayout を生成してエクスポートすることはできません。ただし、line item fields 用の FlexiLayout を手動で作成することは可能です。
  • エクスポートされるのは、最初の cluster 用に学習された FlexiLayout のみです。
  • 新しいまたは変更した FlexiLayout を学習用バッチにインポートすると:
    • ドキュメント処理中は学習は行われません。
  • Clustering はこのバッチでは無効になります。
    • インポートした FlexiLayout は、cluster に関係なく、この会社のすべてのドキュメントの処理に使用されます。
    詳細については、Training with clustering を参照してください。