Tips and tricks
ヒントとコツ
低品質な画像からデータを抽出する FlexiLayout を構築するためのヒントとコツを紹介します。一般的な検索上の問題を扱うサンプルプロジェクトも収録しています。
この章では、低品質な画像上のデータ field を探す FlexiLayout を作成するための代表的な方法をいくつか説明します。このような画像は珍しくなく、主に不適切なスキャン設定によって生じるさまざまなスキャン不良が見られます。たとえば、明るさの設定が適切でないと、画像が明るすぎたり暗すぎたりすることがあります。その結果、画像上の一部の情報が失われたり、画像の一部にノイズが入ったりする場合があります。
文書を再スキャンできるとは限らず、損傷した画像からデータを抽出しなければならないことも少なくありません。さらに、有用な情報の上に手書きのメモが書き込まれている文書もあり、これが認識エラーの原因になることもよくあります。
ここで説明するテキスト損傷のいずれのケースも、事前認識の品質を大きく低下させます。事前認識の品質は、認識モードを Accurate に変更することで改善できる場合があります。ただし、残念ながらこれが常に有効とは限らず、事前認識にかかる時間も大幅に長くなります。
FlexiLayout Studio で FlexiLayout を作成する際には、通常、次の方法が使用されます。ユーザーは、事前認識の結果が不正確になる可能性、つまり元のテキストと異なる可能性があることを FlexiLayout で指定できます。これは要素の標準設定、たとえば Static Text 型の要素における最大エラー数や、Character String 要素における非アルファベット文字の割合などに反映されます。実際には、データ field を検索する段階では高い事前認識品質は必須ではありません。ただし、検出された field を FlexiCapture で認識する際には必要です。これらのプログラムでは、各 field に対して専用のデータ型が用意されており、認識品質を大幅に向上させます。FlexiLayout Studio における事前認識はページ全体に対する OCR であり、実際には、文書上のデータ field を検出するには通常これで十分であることがわかっています。
実際のプロジェクトでは、高品質な画像を問題なく処理できる FlexiLayout を作成するのに、通常は数個の要素を作成するだけで十分です。必要なデータ field を画像の約 70% で検出できる FlexiLayout であれば、どのユーザーでも簡単に作成できます。このような FlexiLayout は FlexiCapture で使用できます。さらに、FlexiLayout を更新して、低品質な画像からもデータを抽出できるように「学習」させることも可能です。こうした修正の程度は、対象のタスクとユーザーが使える時間によって異なります。
FlexiLayout の修正には、これまで検出できなかった要素を検出できるようにすることや、追加の要素 (場合によっては別の型の要素) を使って、より緩い検索制約でそれらを見つけようとすることが含まれます。
このほかにも、追加要素の作成を含めて FlexiLayout の修正が必要になる状況があります。たとえば、異なるソースから受け取った類似文書を処理しなければならないことがよくあり、政府機関の異なる地域支部で作成された文書などがこれに当たります。このような文書は一見よく似ていても、データ field のレイアウトが異なる場合があります。そのような場合は、少しずつ異なる FlexiCapture の Document Definition を複数作成するのではなく、1 つの FlexiLayout を作成することをお勧めします。
文書によって使用されている区切り線の種類が異なることがあり、また、手書きだけでなくプリンターで記入されている場合もあります。プログラムにそのような field を見つけられるよう学習させるには、この章で説明する方法を使用してください。
テスト画像と検証済みの FlexiLayout を含む FlexiLayout Studio プロジェクトは、%public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks にあります。
事前認識品質が低い場合の日付の検出
複数の static text 値を設定する。類似した値を持つ static text を検索する
Exclude を使用して要素を除外する
グループ要素を使用して FlexiLayout の構造と検索を最適化する
単一行の Static Text 要素を検索する
RestrictSearchArea で検索範囲を制限する
品質の異なる文書上で、既知または未知の形式を持つ単一行 field を検索する
Nearest と FuzzyQuality を使用した要素検索
グループ要素の検索を最適化する
グループ要素の “Optional” プロパティ
数字文字列の検索
ヌル仮説を持つ補助要素によって FlexiLayout を簡素化する
枠付き文字を含むテキストの field の説明
