メインコンテンツへスキップ
FCFORINVOICES では、Document を処理しながら認識精度を向上できます。プログラムがDocument画像上で field の正しい位置を検出できなかった場合は、その正しい位置を指定できます。すると、プログラムは他のDocumentを認識する際にその情報を使用します。 学習を利用できるのは、ABBYY FlexiCapture がデータベース内の対応するレコードを見つけて会社を確実に識別できる場合に限られます。データベースがない場合でも field の学習を使いたいときは、Document の取り込み時にデータ セットにレコードを追加して、会社情報を蓄積できます。詳細は、データベースでベンダーと事業部門を検索するを参照してください。 この記事では、ローカルにインストールされた Verification Station を使用して FCFORINVOICES を学習させる方法と、オペレーターが知っておく必要のある学習に関する注意点について説明します。 Document の処理中にプログラムを学習させるには、次の手順を実行します。
  1. Document のバッチ (例: 過去 1 か月以内に処理された 請求書) を収集し、プログラムへの投入を開始します。請求書を取り込む方法を参照してください。
  2. Document がプログラムに投入されると、自動的に認識されます (これは、Options ダイアログの Document Processing タブで Recognize added images automatically オプションが有効になっている場合にのみ行われます。このダイアログを開くには、Tools → Options… をクリックします) 。その後、データはバリデーションルールによってチェックされます。
  3. 認識済みDocumentのステータスが Valid 以外である場合、またはプログラムが一部の field を検出できなかったと思われる場合は、そのDocumentをDocumentエディターで開きます。
  4. Documentフォームを確認します。Vendor/Issuer の field グループが正しく入力されている必要があります。
学習は、Document バリアントごとに独立して実行されます。同じ会社のDocumentは、同じDocument バリアントに属するものと見なされます。プログラムが発行会社を識別できない場合は、会社データベースから選択するか、Document画像を見ながら手動で入力し、Save をクリックして会社データベースに保存します。 プロジェクトの設定によっては、その会社のDocumentを学習に使用するために、発行会社の一意の ID を指定する必要がある場合もあります。これを行うには、会社の一意 ID を VATID field に入力します (この field の名前は、国によってはプロジェクトごとに異なる場合があります) 。VATID は、税務上の目的で会社に割り当てられる一意の識別番号です。 同じ会社のDocumentでもレイアウトが大きく異なる場合は、クラスタリング機能を使用してください。詳細は、クラスタリングを使用した学習を参照してください。
  1. 学習を成功させるには、すべての field の Region が正しく識別されている必要があります。そのため、各 Region が画像上の対応する field の実際の位置と一致していることを確認する必要があります。Document上の明細をマークアップする方法の詳細は、明細の学習を参照してください。 これを行うには、Documentエディターの Image ウィンドウで、プログラムが検出できなかった field の Region を調整するか、Region を描画します。 その後、プログラムがDocumentを解析します。Region のマークアップが変更されており、かつこの会社のDocumentに対する学習が禁止されていない場合、そのDocumentはバッチに追加されます。
  • データ フォームで目的の field にマウス ポインターを合わせ、画像上の対応する Region を見つけます (青で強調表示されます) 。その Region をクリックします (または、マウスで Rectangle を描画します) 。
  • 画像上の目的の Region にマウス ポインターを合わせます (青で強調表示されます) 。その Region をクリックするか (または、マウスで Region を描画し) 、表示されるドロップダウンリストから対応する field を選択します。
  • 画像上の Region の境界をマウスで動かして、Region の位置を調整します。
  • 位置が誤っている Region を画像から削除します。Rectangle にマウス ポインターを合わせ、右上隅に赤い × が表示されたら、その赤い × をクリックします。Region のマークアップが削除されます。次に、この field の正しい Region を作成します。
  • データ フォームで、field に値を入力し始めます。入力中の単語に似た、画像から取得された単語の一覧を含むドロップダウンリストが表示されます。リストから正しい単語を選択すると、画像上のその単語の位置が field の Region になります。
プログラムは、Regionを描画または調整したfieldだけでなく、Document内のすべてのfieldについて学習されます。
  1. 次のDocumentを開き、手順 4 と 5 を繰り返します。
  2. 学習プロセスを開始するには、学習バッチに少なくとも 1 つのDocumentが含まれている必要があります。クラスタリングを使用する場合は、クラスターごとに個別の FlexiLayout が作成されます。使用しない場合は、会社ごとに FlexiLayout が作成されます (詳細については、「クラスタリングを使用した学習」を参照してください) 。
  3. プログラムは、学習済みの FlexiLayout バリアントを学習バッチ内のすべてのDocumentに適用し、その結果を手順 5 で修正したマークアップと比較してテストします。プログラムが、学習済みの FlexiLayout のほうが以前のバージョンよりも良い結果をもたらすと判断した場合、次回このDocumentバリアントに属するDocumentを認識する際には、その学習済みの FlexiLayout が使用されます。
プログラムが、学習済みの FlexiLayout バリアントの結果が以前のバージョンよりも悪いと判断した場合は、その会社のDocumentを使って引き続き学習を行う必要があります (手順 4 と 5) 。学習プロセスは、学習済みの FlexiLayout バリアントがすべてのfield Regionを正しく識別できるようになった時点で完了します。 ABBYY FlexiCapture for Invoices のセットアップ時の学習