グループ要素を使用してFlexiLayoutの構造と検索を最適化する

オブジェクトの検索には、グループ 要素を使用するのが最も効率的です。要素をグループ化すると、各要素に対する仮説の数が減り、その結果、FlexiLayout 全体の仮説の検索が高速になるためです。さらに、要素のグループ化がドキュメントの論理を反映していれば、FlexiLayout の構造の最適化に役立ち、より明確になります。複数の要素を 1 つのグループ要素にまとめると、FlexiLayout Studio はその要素セット全体を、独自の仮説 (グループ内の各要素の個別の仮説で構成される) を持つ 1 つのまとまりとして扱えるようになります。仮説とその要素の解析はグループ要素内で行われ、その後ほかの要素を検索する際には、ユーザーが指定した数の最良の仮説 (既定では 1 個) だけが使用されます。要素ツリー全体を 1 つのグループ要素と見なすことができ、その最良の仮説が FlexiLayout のマッチング結果になります。

GroupSample.fsp sample プロジェクト

GroupSample.fsp プロジェクト (フォルダー %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Group\Project1) は、グループ要素をどのように使用できるかを示しています。目的は、画像上の請求書番号、請求日、合計金額のフィールドを検出することです。

GroupSample.fsp プロジェクトで使用されるサンプル請求書画像のスクリーンショット。検出対象の請求書番号、請求日、合計金額のフィールドが表示されています。

請求書のフィールドをInvoiceRequisiteGroupにグループ化する

画像が示すように (そしてこれは一般にあらゆる財務文書に当てはまりますが) 、文書の番号と日付は隣接するフィールドです。別の文書でフィールドの配置が異なっていても、これらはやはり互いに近い位置にあります。さらに、これらは文書上の論理的なつながりも持っています。つまり、これらは特定の明細を表し、1つの論理ブロックを構成しているからです。FlexiLayoutの構造をより明確にするため、このプロジェクトではこれらをInvoiceRequisiteGroupという名前のグループ要素にまとめています。

要素をグループ化する前に、特別な識別要素が作成されました。 (識別要素については、ABBYY FlexiCaptureでのFlexiLayoutの識別と処理で詳しく説明されています。) この要素は、その中にグループ要素がある場合とない場合で、仮説ツリーがどのように「分岐」するかを示すためだけに作成されたものです。ツリー内のすべての要素は、識別要素を除いて省略可能であり、それらのヌル仮説のデフォルトの品質は0.97であると仮定します。

グループ内の最初の要素は、Static Text型の要素InvoiceNumHeaderで、「Invoice number」というフィールド名の検索条件を定義します。この要素の値には、文字列「Invoice」が指定されています。使用可能な画像の解析に基づき、請求書番号は、その名前の右側で、InvoiceNumという名前の要素を使って検索されます。同様に、請求書番号の行の下には、日付フィールド用の要素InvoiceDateHeaderがプロジェクトに含まれています。日付そのものを検索するために、このプロジェクトでは次のサブ要素を持つグループDateGroupを使用します: InvoiceDate と InvoiceDateAsString。詳細については、高品質または低品質の認識後の日付検索を参照してください。請求書の合計金額のフィールドを検出するために、このプロジェクトでは2つの要素を使用します。TotalSumHeaderという名前のStatic Text要素 (値「Totalsum(EUR):」はスペースなしで記述) と、合計金額そのものを直接検索するTotalSumという名前のCharacter String要素です。

要素の設定については、ここでは説明しません。プロジェクト内で直接確認できます。

要素InvoiceNumHeaderの値として指定されている文字列「Invoice」は、テスト画像内で3回現れる可能性があります。1つはフィールド「Invoice number」の名前として、1つはフィールド「Invoice date」の名前の部分文字列として、もう1つは請求書の下部にある請求条件「Current invoice is…」内の部分文字列としてです。また、InvoiceNumHeader要素が検出することを想定している「INVOICE」という文字列はノイズが非常に多く、そのため文字列内に誤りが生じています。他の行では文字列「Invoice」は明瞭であるため、対応する仮説の品質は、この名前に対する仮説の品質より高くなるはずです。

グループが最良の仮説チェーンを選択する方法

次に、batch 内の test images で FlexiLayout のマッチングを試してみましょう。 Match コマンドを選択して FlexiLayout のマッチング手順を開始すると、仮説ツリーが 1 本のチェーンだけで構成されていることがわかります。

ABBYY FlexiLayout Studio の GroupSample.fsp Project における仮説ツリーのスクリーンショット。InvoiceRequisiteGroup グループ要素で最良のチェーンの品質と一致する品質を持つ 1 本のチェーンが表示されています。 — 仮説ツリーは 1 本のチェーンだけで構成されています。グループの品質は、グループ内で最良のチェーンの品質と一致します。

InvoiceRequisiteGroup をダブルクリックして Properties ダイアログを開くと、そのサブ要素に対してどのような仮説が生成されたか、グループ内でどのチェーンが最良と判断されたか、またその理由を確認できます。 InvoiceNumHeader 要素には 3 つの仮説があることがわかります。これは、検出された “invoice” 文字列の数と一致しています。目的の仮説の品質が低い (約 0.99) のは、その画像領域にノイズがあり、FlexiLayout Studio が “INVOICE” ではなく “INVOIC” としか認識できなかったためです。一方、他の 2 つの仮説の品質は最大です (チェーンの品質 = 1) 。 InvoiceNum 要素のプロパティでは、請求書番号は桁数を問わず、名前の右側を検索するよう指定されています。この画像では、この条件が 3 つすべてのケースで満たされていたため、FlexiLayout Studio は “Invoice number” field 名の各仮説について、仮説チェーンの作成を続行できました。 InvoiceNum 要素の各仮説の Pre-search quality が 1 であるにもかかわらず、正しいと考えられるチェーンが依然として最も低いという点に注目してください。これは、チェーンの品質が、そのチェーンを構成するすべての仮説の品質を乗算して評価されるためです。必須の名前については、この品質は約 0.99 です。グループに他の要素がなければ、この段階での最終選択は誤っていたでしょう。

Post-search relations はどの要素にも指定されていないため、各要素の Post-search quality は = 1 であり、任意の仮説の品質は Pre-search quality で判断できます。

ABBYY FlexiLayout Studio の InvoiceRequisiteGroup Properties ダイアログのスクリーンショット。グループのサブ要素に対して生成された仮説チェーンと、最良のチェーンの選択に使用された比較済みの品質値が表示されています。 — 最良の仮説の検索はグループ内で行われます。すべてのチェーンの品質が解析され、比較されます。グループの品質は、グループ内で最良のチェーンの品質によって決まります。

初期品質が低くても正しいチェーンが勝つ理由

前述のとおり、InvoiceDateHeader 要素のプロパティでは、請求書番号の行の下を検索するよう指定しました。しかし、最良の品質を持つチェーン (チェーンの品質 = 1) ではどれも、日付フィールド名の仮説は得られませんでした。そのため、これらのチェーンでは InvoiceDateHeader 要素に対してヌル仮説が生成されました。ヌル仮説のデフォルト品質を変更していないため、対応するチェーンの最終的なチェーンの品質は 0.97 に低下しました。一方、最も品質の低いチェーンでは、日付フィールド名に対応する要素が見つかりました。その仮説の品質は約 0.993 です。これが 1 未満なのは、名前の領域の画像にノイズがあるためで、その結果、認識エラーが発生し、認識されたテキストと InvoiceDateHeader 要素のプロパティで指定された値との一致が不完全になったためです。その結果、見つかった仮説には減点が適用され、最終的な品質は約 0.98 になりました (0.99 と 0.993 を乗算した結果) 。それでも、この仮説の最終品質は他のもの (0.97) より高いため、この段階ではこのチェーンが最良です。日付フィールドを検出するために、この Project ではグループ要素 DateGroup を使用します。これは、一方の要素が見つかった場合、もう一方の要素の少なくとも 1 つは見つからないよう指定するものです (Dontfind function を使用) 。ドキュメントの layout 上の特徴と、InvoiceDateAsString 要素に指定したプロパティ (そのアルファベットは数字を許可する) により、FlexiLayout Studio はすべてのチェーンについて日付フィールドを見つけることができましたが、3 つの仮説のうち実際に正しいのは 1 つだけです。各グループでは一方の要素が見つかり、もう一方が見つかっていないため、DateGroup グループそれぞれのチェーンの最終品質は 0.97 です (1 にヌル仮説のデフォルト品質 0.97 を乗算した値) 。この例では、DateGroup チェーンの最終品質は、InvoiceDateHeader 要素を検出する時点での仮説間の「バランス」に影響しません。つまり、各チェーンの品質にはさらに 0.97 が乗算されます。最終的に、FlexiLayout Studio はグループ要素 InvoiceRequisiteGroup に対して 1 つの仮説を生成しました。これはグループ内で最良のチェーンに対応しています。その品質は約 0.953 であり、つまり「グループアプローチ」によって、初期品質が低かったにもかかわらず正しい仮説が勝つことができました。

グループ要素のない仮説ツリー

FlexiLayout でグループ要素を使用しない場合に仮説ツリーがどのようになるかを確認するには、Group\Project2 フォルダー内の GroupSample.fsp プロジェクトを開きます。ツリーは次の図に示されています。図からわかるように、FormID 要素が検出されると、InvoiceNumHeader 要素に対して複数の仮説が生成されるため、仮説ツリーは分岐します。その結果、FlexiLayout Studio は各チェーンの品質を比較するために、その都度、先頭の要素から末尾の要素までたどる必要があります。さらに、この例より複雑なレイアウトのドキュメントでは、グループ要素のない FlexiLayout は分岐が多すぎる仮説ツリーを生成するため、FlexiLayout のマッチングはいっそう難しくなります。

探している要素をすべて 1 つのルートグループに配置することは避けてください。これは、要素数が 10 未満の非常に単純な FlexiLayout にのみ適していますが、実際のタスクでそのようなケースはごくまれです。ルートグループ内の要素数が増えると、仮説の数は急激に増加し、10,000 という上限に達するか、仮説ツリーに割り当てられたメモリを使い切るまで増え続けます。どちらの場合でも、FlexiLayout のマッチングに失敗する可能性があります。

実際のタスクでは、通常、ある要素のすべての仮説と他のすべての要素のすべての仮説との、考えられるすべての組み合わせを調べる必要はありません。多くの要素は互いに独立して検出できるためです。そのため、解析する組み合わせの数を減らして検索を高速化するには、要素をできるだけ小さなグループ要素にまとめる必要があります。

グループ化されていない GroupSample.fsp プロジェクトについて、ABBYY FlexiLayout Studio に表示された仮説ツリーのスクリーンショット。FormID 要素の後でツリーが多数のチェーンに分岐し、視覚的な解析が困難になっている様子を示しています。 — グループ化されていない仮説ツリーは分岐が多すぎるため、見た目で解析するのが困難です。

さらに、最終的なチェーンの品質は、そのチェーン内のすべての仮説の品質を掛け合わせて計算されるため、分岐が多すぎるツリーでは計算量が大幅に増える可能性があり、その結果、FlexiLayout のマッチングが遅くなります。

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

グループ要素を使用してFlexiLayoutの構造と検索を最適化する

GroupSample.fsp sample プロジェクト

請求書のフィールドをInvoiceRequisiteGroupにグループ化する

グループが最良の仮説チェーンを選択する方法

初期品質が低くても正しいチェーンが勝つ理由

グループ要素のない仮説ツリー

​GroupSample.fsp sample プロジェクト

​請求書のフィールドをInvoiceRequisiteGroupにグループ化する

​グループ が最良の仮説チェーンを選択する方法

​初期品質が低くても正しいチェーンが勝つ理由

​グループ要素のない仮説ツリー

GroupSample.fsp sample プロジェクト

請求書のフィールドをInvoiceRequisiteGroupにグループ化する

グループが最良の仮説チェーンを選択する方法

初期品質が低くても正しいチェーンが勝つ理由

グループ要素のない仮説ツリー