請求書向け ABBYY FlexiCapture のトレーニング

FlexiCapture for Invoices をトレーニングすることで、データキャプチャの品質を向上させることができます。管理者、または十分な権限を持つオペレーターは、文書の処理前または処理中にプログラムをトレーニングできます。トレーニングは、次の種類の画像および次のような場合にのみ利用できます。

あらかじめ設定された Document Definition でfieldsを確実に検出できない画像。
既定の Document Definitions で定義されていないfieldsからデータを抽出する必要がある場合。

学習が必要になる場合

同じ種類の文書でもfieldsの位置が異なることがある。 同じ種類の文書が続く中で、標準的な文書とはfieldsの位置が異なる例外的な文書が現れることがあります。FlexiCapture for Invoicesがそのような文書上のfieldsを確実に検出できない場合、ユーザーが正しいfieldsの位置を指定すると、プログラムはその検出方法を学習します。注: 文書の正確なレイアウトは発行元の会社によって異なります。このため、異なる会社の文書は異なる文書バリアントとして扱われ、FlexiCapture for Invoicesは各文書バリアントごとに個別に自己学習します。
ユーザーが既定では定義されていないfieldsを抽出する必要がある。 既定でサポートされている主要fieldsや追加fieldsのほかに、ユーザーはプログラムがまだ認識していないfieldsからデータを抽出する必要がある場合があります。そのためには、Document Definitionでカスタムフィールドを作成し、文書画像上でその位置を指定します.

学習の仕組み

サンプル文書を追加して検証する

通常の処理時、または特別な学習モードで、ユーザーはプログラムを学習させるために文書画像を追加します。追加された文書は自動的に認識され、検証に回されます。ユーザーは必要に応じて fields の位置を修正し、Reference layout を作成します。

文書が学習用バッチに蓄積される

学習対象の各文書は、その文書バリアント用に作成された学習用バッチに追加されます。あるバリアントに最初の文書が追加されると、プログラムはそのバッチへの文書の蓄積を開始します。管理者は、

Open Field Extraction Training Batches をクリックすると、すべての文書バリアントとそれぞれの学習用バッチを表示できます。

学習が開始される

学習用バッチに少なくとも 1 つの文書が含まれると、学習が開始されます。クラスタリングを使用する場合はクラスターごとに個別の FlexiLayout が作成され、使用しない場合は会社ごとに 1 つ作成されます。詳細は、Training with clustering を参照してください。

FlexiLayout バリアントが作成される

学習によって FlexiLayout バリアントが作成されます。これは、そのバリアントに属するすべての文書、たとえば特定のベンダーからの請求書や特定の顧客からの購買注文書に使用されます。

バリアントがテストされる

学習が完了すると、プログラムは自動的にすべてのサンプル文書に対して FlexiLayout バリアントをテストします。認識結果を Reference layout と比較して、バリアントの品質を評価します。 (学習が行われていない場合に使用されるメインの FlexiLayout も、同じ方法で評価されます。)

最適なバリアントが保持される

プログラムは、新しいバリアントの品質を、以前のバリアントおよびメインの FlexiLayout と比較します。

新しいバリアントのほうが優れている場合は、それが保存され、この文書バリアントの処理に使用されます。
新しいバリアントのほうが劣っている場合は保存されず、ユーザーには Train Document Definition ウィンドウにメッセージが表示されます。

管理者ができること

オペレーターが学習によって十分な精度を達成できない場合、管理者は

Open Field Extraction Training Batches をクリックして、学習を続行できます。管理者はさらに、次のこともできます。

学習に使用する文書画像を追加または削除する。
新しい学習用バッチを作成する。
学習には使用せず、学習済みの FlexiLayout バリアントのテストにのみ使用する文書画像を追加する。
学習済みの FlexiLayout バリアントを ABBYY FlexiLayout Studio にエクスポートする、またはそこから別の FlexiLayout をインポートする。

精度を達成したら、管理者はその文書バリアントに対するオペレーターの学習を禁止できます。

​学習が必要になる場合

​学習の仕組み

​管理者ができること

​関連トピック

学習が必要になる場合

学習の仕組み

管理者ができること

関連トピック