- あらかじめ設定された Document Definition でフィールドを確実に検出できない画像。
- 既定の Document Definitions で定義されていないフィールドからデータを抽出する必要がある場合。
トレーニングが必要になる場合
トレーニングが必要になる場合
- 同じ種類の文書でもフィールドの位置が異なる 同じ種類の文書が連続する中でも、標準的な文書とはフィールドの位置が異なる例外的な文書が現れることがあります。このような文書で FCFORINVOICES がフィールドを確実に検出できない場合、ユーザーは正しいフィールド位置を指定できます。するとプログラムは、これらのフィールドをどのように検出すればよいかを「学習」します。 注: 文書の正確なレイアウトは発行元の会社によって異なります。そのため、異なる会社の文書は別々のバリアントとして扱われ、FCFORINVOICES は文書バリアントごとに個別に自己学習します。
- ユーザーが既定で定義されていないフィールドを抽出する必要がある 既定でサポートされている主要フィールドおよび追加フィールドに加え、ユーザーはまだプログラムに認識されていないフィールドからデータを取得する必要がある場合があります。これは、Document Definition にカスタムフィールドを作成し、文書画像上でその位置を指定することで実現できます。
トレーニングの仕組み
トレーニングの仕組み
通常の文書処理中、または特別なトレーニングモードで、ユーザーはプログラムのトレーニングに使用する文書画像を追加します。追加された文書は自動的に認識され、検証に回されます。ユーザーは文書を検証し、必要に応じてフィールド位置を修正することで、参照レイアウトを作成します。次に、学習用文書は、その文書バリアント用に作成された学習用バッチに配置されます。管理者は、
Open Field Extraction Training Batches をクリックして、すべての文書バリアントとその学習用バッチの一覧を表示できます。文書バリアントに対して最初のトレーニング文書が追加されると、プログラムは対応する学習用バッチへの文書の蓄積を開始します。トレーニング処理を開始するには、学習用バッチに少なくとも 1 つの文書が含まれている必要があります。clustering を使用する場合は、cluster ごとに個別の FlexiLayout が作成されます。そうでない場合は、会社ごとに 1 つの FlexiLayout が作成されます (詳細は「Training with clustering」を参照してください) 。トレーニングでは FlexiLayout バリアントが作成され、これは指定した文書バリアントに属するすべての文書 (たとえば、特定のベンダーからの請求書や特定の顧客からの購買注文書) に使用されます。トレーニングが完了すると、プログラムは自動的にすべてのサンプル文書で FlexiLayout バリアントをテストします。新しい FlexiLayout バリアントの品質は、認識結果をユーザーが指定した参照レイアウトと比較することで判定されます (同様に、トレーニングが行われていない場合に使用されるメインの FlexiLayout の品質も、プログラムによって判定されます) 。次に、FlexiLayout バリアントの品質が、以前の FlexiLayout バリアントまたはメインの FlexiLayout の品質と比較されます。
- 新しい FlexiLayout バリアントの品質が、古い FlexiLayout バリアントまたはメインの FlexiLayout の品質より低い場合、新しい FlexiLayout バリアントは保存されず、ユーザーには Train Document Definition ウィンドウに対応するメッセージが表示されます。
- 新しい FlexiLayout バリアントの品質が、古い FlexiLayout バリアントまたはメインの FlexiLayout の品質より高い場合、それは保存され、この文書バリアントの処理に使用されます。
- トレーニングに使用する文書画像の追加または削除。
- 新しい学習用バッチの作成。
- トレーニングには使用しないが、学習済み FlexiLayout バリアントのテスト時に使用する文書画像の追加。
- 学習済み FlexiLayout バリアントを ABBYY FlexiLayout Studio にエクスポートする、または ABBYY FlexiLayout Studio から別の FlexiLayout をインポートする。
