メインコンテンツへスキップ
FlexiLayout は、非構造化文書のセットを形式化して記述したもので、データキャプチャアプリケーションが文書上のデータfieldを特定し、それらのfieldから情報を抽出できるようにします。 文書画像上で検出する必要がある各オブジェクトまたはオブジェクトのグループごとに、FlexiLayoutelement を作成します。element のプロパティは、対応するオブジェクトの特性を記述します。つまり、探すオブジェクトが picture、text fragment、または barcode のいずれであるか、その大きさはどの程度か、さらに文書画像上のどこに存在する可能性が高いかを、element がプログラムに伝えます。 FlexiLayout の block は、データを取得する対象のオブジェクトをどこで探すかをプログラムに指示します。Block の座標は、直接指定することも、element を使って指定することもできます。 ABBYY FlexiLayout Studio には、element と block で構成される FlexiLayout を作成できる、使いやすい視覚的なインターフェイスが用意されています。ただし、FlexiLayout の作成にはある程度の工夫が必要です。というのも、同じオブジェクトでも多くの場合は複数の方法で検出できるため、どの検出戦略を使用するかをユーザー自身が判断しなければならないからです。 FlexiLayout の作成は、次の段階で構成されます。

プロジェクトは、すべての FlexiLayout データを含むファイルです。レイアウトの定義内容を記述したもので、FlexiLayout のコンパイルやテストに使用されます。

詳細…

バッチとは、処理対象となる文書群全体を適切に代表するサンプル文書画像のセットです。

詳細…

事前認識は、ABBYY FlexiLayout Studio が画像上のテキストフラグメント、区切り線、チェックボックスなどの個々のオブジェクトを検出する処理です。事前認識により、 バッチ内の文書でどのような要素を探せるかを把握できます。

詳細…

文書の事前認識が完了したら、バッチ内のすべての文書で確実に検出できるオブジェクトを見つけるために、その結果を分析する必要があります。確認すべき点は次のとおりです。

  • すべての文書でまったく同じ位置にあるオブジェクト (ロゴ、ヘッダー、タイトルなど)
  • 確実に認識されており、すべての文書画像に存在するオブジェクト
  • 印刷やスキャンの品質の影響をほとんど受けないオブジェクト

このようなオブジェクトが十分にあれば、それらを基準として、文書上のほかのすべてのオブジェクトの位置を指定できます。この段階では、文書上の特定のオブジェクトを探す最適な方法を選択することもできます。

詳細…

まず、ドキュメント上の他のオブジェクトを参照せずに検出できるオブジェクト (たとえば、各ドキュメントに含まれるタイトルやその他のテキストフラグメント) の要素を作成する必要があります。次に、その他のオブジェクトの位置を、すでに作成した要素を基準にして記述します。FlexiLayout の要素は、最も信頼性の高いオブジェクトから最も信頼性の低いオブジェクトへとつながる要素ツリーを形成します。

あるドキュメントセットを他のセットと区別できるオブジェクトがドキュメントに含まれている場合は、そのようなオブジェクトの要素を最初に作成する必要があります。これらのオブジェクトは識別子として使用されるため、あるドキュメントセット用に作成した FlexiLayout が、別のセットのドキュメントに誤って照合されるのを防ぐことができます。これにより、ドキュメント処理が高速化され、データキャプチャの信頼性も向上します。

どの要素やブロックを最初に作成すべきかを判断できるのは、ユーザーだけです。ただし、新しい要素またはブロックを作成するたびに FlexiLayout をテストして、その新しい要素がすべてのサンプル画像で、対象のオブジェクトを実際に検出するために使用できることを確認することをお勧めします。

ドキュメントを視覚的にいくつかの論理的な部分に分け、それぞれの部分の画像オブジェクトを順に記述していくと便利な場合があります。これにより、その後の FlexiLayout のデバッグがしやすくなります。

詳細…

FlexiLayout をコンパイルすると、ロジックと整合性がチェックされます。

詳細…

FlexiLayout をテストするには、サンプルの文書画像とのマッチングを試します。FlexiLayout はすべてのサンプル画像にマッチするだけでなく、対応するオブジェクトをプログラムが正しく検出できるようにする必要があります。新しい要素や Block を追加するたびに、FlexiLayout をテストすることをお勧めします。この段階であれば、完成した FlexiLayout で確認する場合に比べて、FlexiLayout の誤りをはるかに見つけやすくなります。特に、文書のレイアウトが複雑な場合はなおさらです。

詳細…

FlexiLayout の作成が完了したら、ABBYY FlexiLayout Studio からエクスポートして、データキャプチャアプリケーションにインポートする必要があります。

詳細…