Document の処理中に学習する

FlexiCapture for Invoices では、Verification Station でDocument を処理しながら認識精度を向上できます。プログラムがDocument画像上で field の正しい位置を検出できなかった場合は、その正しい位置を指定できます。すると、プログラムは他のDocumentを認識する際にその情報を使用します。

前提条件

学習を利用できるのは、ABBYY FlexiCapture がデータベース内の対応するレコードを見つけて会社を確実に識別できる場合に限られます。データベースがない場合でも field の学習を使いたいときは、Document の取り込み時にデータセットにレコードを追加して、会社情報を蓄積できます。詳細は、データベースでベンダーと事業部門を検索するを参照してください。

プログラムを学習させる

文書のバッチを収集してプログラムに取り込む

文書のバッチ (たとえば、過去 1 か月以内に処理した請求書) を収集し、プログラムへの取り込みを開始します。詳しくは、請求書を抽出する方法を参照してください。

プログラムに文書を認識させて確認する

文書をプログラムに取り込むと、自動的に認識が実行されます (Options ダイアログボックスの Document Processing タブで Recognize added images automatically オプションが有効になっている場合に限ります。開くには、Tools → Options をクリックします) 。その後、データはバリデーションルールによって確認されます。

修正が必要な文書を開く

認識済み文書のステータスが Valid 以外である場合、またはプログラムが一部の field を検出できなかったと思われる場合は、その文書を文書エディターで開きます。

会社を確認する

文書フォームを確認します。Vendor/Issuer の field グループが正しく入力されている必要があります。学習は文書バリアントごとに個別に実行され、同じ会社の文書は同じバリアントとして扱われます。プログラムが発行元の会社を識別できない場合は、会社データベースから選択するか、文書画像を見ながら直接入力し、Save をクリックして保存します。Project の設定によっては、その会社の文書を学習に使用するために、発行元の会社の一意の ID を指定する必要がある場合もあります。これを行うには、VATID field に一意の ID を入力します (この field の名前は、国や Project によって異なる場合があります) 。VATID は、税務上の目的で会社に割り当てられる一意の識別番号です。同じ会社の文書でもレイアウトが大きく異なる場合は、clustering 機能を使用します。詳しくは、Training with clusteringを参照してください。

フィールド領域を調整する

学習が成功するのは、すべてのフィールド領域が正しく識別されている場合だけです。したがって、region が画像上の実際の field の位置と一致していることを確認してください。文書エディターの Image ウィンドウで、region を調整するか、プログラムが検出できなかったフィールド領域を描画します。明細のマークアップについて詳しくは、明細の学習を参照してください。フィールド領域は、次のいずれかの方法で変更できます。

データフォームの field にマウスポインターを置き、画像上の対応する region (青色で強調表示されます) を見つけてクリックします (またはマウスで矩形を描画します) 。
画像上の region (青色で強調表示されます) にマウスポインターを合わせてクリックし (または region を描画し) 、表示されるドロップダウンリストから対応する field を選択します。
マウスで境界を動かして region を調整します。
誤った位置にある region を削除します。ポインターをその矩形の上に置き、右上隅に赤い×印が表示されたら、その×印をクリックします。次に、その field に対して正しいフィールド領域を作成します。
データフォームで field に値を入力し始めます。ドロップダウンリストに、入力中の内容に似た画像から抽出済みの単語が表示されます。正しい単語を選択すると、その単語の画像上の位置がそのフィールド領域になります。

マークアップを調整すると、プログラムが文書を分析します。マークアップが変更されており、かつこの会社の文書に対する学習が禁止されていない場合、その文書はバッチに追加されます。

プログラムは、フィールド領域を描画または調整した field だけでなく、その文書内のすべての field を対象に学習します。

残りの文書について繰り返す

次の文書を開き、確認とマークアップの手順を繰り返します。

学習を実行する

学習を開始するには、学習用バッチに少なくとも 1 つの文書が含まれている必要があります。clustering を使用する場合はクラスターごとに個別の FlexiLayout が作成され、使用しない場合は会社ごとに FlexiLayout が作成されます。詳しくは、Training with clusteringを参照してください。

学習結果を確認する

プログラムは、学習済みの FlexiLayout バリアントを学習用バッチ内のすべての文書に適用し、その結果を調整済みのマークアップと比較してテストします。学習済み FlexiLayout が以前のバージョンより優れた結果を示した場合、次回この文書バリアントに属する文書を認識するときに使用されます。

学習しても結果が改善しない場合

学習済みの FlexiLayout バリアントの結果が以前のバージョンより悪い場合は、レビューとマークアップの手順を繰り返し、該当する会社の文書を使って引き続き学習してください。学習済みの FlexiLayout バリアントがすべてのフィールド領域を正しく識別できるようになれば、学習は完了です。 Project setup で管理者が行う学習については、Training done by project administrators を参照してください。

​前提条件

​プログラムを学習させる

​学習しても結果が改善しない場合

前提条件

プログラムを学習させる

学習しても結果が改善しない場合