メインコンテンツへスキップ
事前認識は、半構造化文書を処理する最初の段階です。コンピューター処理を前提として設計されている固定文書とは異なり、非構造化文書は文書ごとに構造が異なり、データfieldもページ上のさまざまな位置に配置されます。そのため、データfieldの位置を示す手がかりとなる文書上のオブジェクトを検出するために、事前認識が使用されます。 事前認識は文書解析の最初の段階です。事前認識にはかなり時間がかかることがあるため、FlexiLayout Studio では、FlexiLayout のマッチングとは切り離して事前認識だけを一度実行できるようになっており、FlexiLayout の作成とテストに専念できます。 ただし、FlexiLayout の作成を始める前に、事前認識の結果の品質を評価する必要があります。事前認識の品質は、バッチ内のテスト画像の品質に左右されます。また、テスト画像の品質は、明るさ、コントラスト、解像度などのスキャンパラメーターに左右されます。事前認識の結果の品質に満足できない場合は、スキャンオプションを変更してテスト文書を再スキャンする必要があるかもしれません。また、FlexiLayout Studio では異なる解像度でスキャンした画像を追加できるため、事前認識と FlexiLayout のマッチングを試しながら、最適なスキャンオプションを選択できます。 事前認識は、高速モードまたは完全モードで実行できます (詳細は 事前認識パラメーター を参照) 。FlexiLayout の開発時には、事前認識は必ずしも完璧である必要はありません。いくつかの認識エラーがあっても、実際にはほぼあらゆるデータfieldを見つける方法があります。実際、事前認識では品質よりも速度の方が重要な場合もあります。認識品質については、後続の data capture アプリケーションの段階で対処できます。そこでは各 field のデータ型を指定できるため、認識の品質を大幅に向上させることができます。 事前認識では、プログラムがさまざまな色のドットの位置を解析し、基本オブジェクトを検出し、text fragment を単語や行にまとめます。 プログラムは次の種類の基本オブジェクトを検出します。
  • Text
  • Picture
  • 句読点
  • 反転テキスト
  • Separator
  • Barcode
  • Checkmark
基本オブジェクトが検出されると、プログラムはテキストオブジェクトの認識を開始します。認識されたテキストは、次の 2 つの型で表示できます。
  • 認識済みの単語
  • 認識済みの行

詳細:

事前認識パラメーター 事前認識の実行と結果の表示 画像の解析