画像を分析する

FlexiLayout の骨格となるオブジェクトを見つけるために、バッチ内の画像を分析します。つまり、すべての画像に共通して存在し、確実に検出できるオブジェクトを見つける必要があります。画像を分析する際にもう 1 つ重要なのは、オブジェクトをどの順序で記述するかを決めることです。この順序によって、FlexiLayout と画像をマッチングする際に要素が使用される順序が決まります。

バッチ内の画像を分析する

バッチ内の画像を確認する

大半の画像に1回だけ現れるオブジェクトを見つける

ほとんどの画像に存在し、各画像で1回しか現れないオブジェクトを目視で探します。そのようなオブジェクトの要素は、FlexiLayout の作成の初期段階で作成します。

識別子オブジェクトを見つける

識別子として使用できるオブジェクトを見つけます。これはタイトルでも、文書が特定の文書タイプに属していることを明確に示せる他のオブジェクトでもかまいません。識別子オブジェクトはすべての文書に存在している必要があり、可能であればエラーなく認識される必要があります。識別子オブジェクトを表す要素を必須要素として設定します。この要素に対応するオブジェクトが見つからない場合、FlexiLayout のマッチングは停止します。つまり、その文書はその FlexiLayout で記述された文書タイプには属していないということです。

要素の順序を計画する

要素をどの順序で作成するか、またそれらを FlexiLayout ツリー内でどのように配置するかを検討します。ツリー内の要素の順序によって、対応するオブジェクトを画像上で検索する順序が決まります。

各オブジェクトの検索メソッドを選択する

各オブジェクトを見つけるために使用できるメソッドを検討します。FlexiLayout では、これらのメソッドは要素のプロパティで記述されます。まず、最も信頼性の高いオブジェクト、つまり大半の画像に存在し、同じ画像内にあまり多く現れないオブジェクトから始めます。後で、それらを起点または参照要素として使って、信頼性の低い要素を探すことができます。最も信頼性の高い仮説を立てられるよう、できるだけ厳しい検索条件を選択してください。

仮説ツリーが際限なく増大するのを防ぐため、Number of surviving hypotheses フィールドのデフォルト値を維持してください。

グループ要素を計画する

一部の要素をグループ要素にまとめることを検討します。グループ要素は、互いに独立した FlexiLayout の各部分をテストするのに便利です。たとえば、合計 100 個の要素で構成される FlexiLayout でも、最上位レベルにはタイトル、本文、文書の下部という 3 つのグループ要素しか含まれない場合があります。これら 3 つのグループ要素はそれぞれ、文書のより小さな部分を記述するグループ要素で構成できます。このようにグループ要素を入れ子にすると、可能な検索の組み合わせ数が減り、FlexiLayout の各部分を個別に扱えるため、FlexiLayout のデバッグも容易になります。

事前認識を実行して結果を表示する

要素

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

バッチ内の画像を分析する

​バッチ内の画像を分析する

バッチ内の画像を分析する