メインコンテンツへスキップ
FCFORINVOICES をトレーニングすることで、データキャプチャの品質を向上させることができます。ユーザーは、文書の処理前または処理中にプログラムをトレーニングできます。 トレーニングは、次の種類の画像および次のような場合にのみ利用できます。
  • あらかじめ設定された Document Definition でフィールドを確実に検出できない画像。
  • 既定の Document Definitions で定義されていないフィールドからデータを抽出する必要がある場合。
  • 同じ種類の文書でもフィールドの位置が異なる 同じ種類の文書が連続する中でも、標準的な文書とはフィールドの位置が異なる例外的な文書が現れることがあります。このような文書で FCFORINVOICES がフィールドを確実に検出できない場合、ユーザーは正しいフィールド位置を指定できます。するとプログラムは、これらのフィールドをどのように検出すればよいかを「学習」します。 注: 文書の正確なレイアウトは発行元の会社によって異なります。そのため、異なる会社の文書は別々のバリアントとして扱われ、FCFORINVOICES は文書バリアントごとに個別に自己学習します。
  • ユーザーが既定で定義されていないフィールドを抽出する必要がある 既定でサポートされている主要フィールドおよび追加フィールドに加え、ユーザーはまだプログラムに認識されていないフィールドからデータを取得する必要がある場合があります。これは、Document Definition にカスタムフィールドを作成し、文書画像上でその位置を指定することで実現できます。
通常の文書処理中、または特別なトレーニングモードで、ユーザーはプログラムのトレーニングに使用する文書画像を追加します。追加された文書は自動的に認識され、検証に回されます。ユーザーは文書を検証し、必要に応じてフィールド位置を修正することで、参照レイアウトを作成します。次に、学習用文書は、その文書バリアント用に作成された学習用バッチに配置されます。管理者は、 Open Field Extraction Training Batches をクリックして、すべての文書バリアントとその学習用バッチの一覧を表示できます。文書バリアントに対して最初のトレーニング文書が追加されると、プログラムは対応する学習用バッチへの文書の蓄積を開始します。トレーニング処理を開始するには、学習用バッチに少なくとも 1 つの文書が含まれている必要があります。clustering を使用する場合は、cluster ごとに個別の FlexiLayout が作成されます。そうでない場合は、会社ごとに 1 つの FlexiLayout が作成されます (詳細は「Training with clustering」を参照してください) 。トレーニングでは FlexiLayout バリアントが作成され、これは指定した文書バリアントに属するすべての文書 (たとえば、特定のベンダーからの請求書や特定の顧客からの購買注文書) に使用されます。トレーニングが完了すると、プログラムは自動的にすべてのサンプル文書で FlexiLayout バリアントをテストします。新しい FlexiLayout バリアントの品質は、認識結果をユーザーが指定した参照レイアウトと比較することで判定されます (同様に、トレーニングが行われていない場合に使用されるメインの FlexiLayout の品質も、プログラムによって判定されます) 。次に、FlexiLayout バリアントの品質が、以前の FlexiLayout バリアントまたはメインの FlexiLayout の品質と比較されます。
  • 新しい FlexiLayout バリアントの品質が、古い FlexiLayout バリアントまたはメインの FlexiLayout の品質より低い場合、新しい FlexiLayout バリアントは保存されず、ユーザーには Train Document Definition ウィンドウに対応するメッセージが表示されます。
  • 新しい FlexiLayout バリアントの品質が、古い FlexiLayout バリアントまたはメインの FlexiLayout の品質より高い場合、それは保存され、この文書バリアントの処理に使用されます。
FCFORINVOICES は、管理者または十分な権限を持つオペレーターのいずれでもトレーニングできます。プログラムをトレーニングするには、ユーザーは作業バッチに文書画像を追加する必要があります。すると、それらは自動的に認識され、検証に回されます。ユーザーが結果を検証し、必要に応じてフィールド位置を修正すると、文書は指定された文書バリアントに使用される学習用バッチに追加されます。プログラムがその文書バリアントについて十分な数の文書を取得すると、トレーニングが自動的に開始されます。プログラムは、トレーニングを通じて得た知識を使って、この文書バリアントに属する今後のすべての文書を認識します。 オペレーターがトレーニングによって十分な精度を達成できない場合、管理者は Open Field Extraction Training Batches を開いて、自らプログラムのトレーニングを続行できます。さらに管理者は次のこともできます。
  • トレーニングに使用する文書画像の追加または削除。
  • 新しい学習用バッチの作成。
  • トレーニングには使用しないが、学習済み FlexiLayout バリアントのテスト時に使用する文書画像の追加。
  • 学習済み FlexiLayout バリアントを ABBYY FlexiLayout Studio にエクスポートする、または ABBYY FlexiLayout Studio から別の FlexiLayout をインポートする。
望ましい精度が達成されたら、管理者は指定した文書バリアントについてオペレーターによるトレーニングを禁止できます。

関連項目:

文書の処理中に学習する Document Variantsビューでの学習