事前認識

事前認識は、半構造化文書を処理する最初の段階です。コンピューター処理を前提として設計されている固定文書とは異なり、非構造化文書は文書ごとに構造が異なり、データfieldもページ上のさまざまな位置に配置されることがあります。そのため、データfieldの位置を示す手がかりとなる文書上のオブジェクトを検出するために、事前認識が使用されます。事前認識にはかなり時間がかかることがあるため、FlexiLayout Studio では、FlexiLayout のマッチングとは切り離して事前認識だけを一度実行できるようになっており、FlexiLayout の作成とテストに専念できます。

事前認識結果の品質を評価する

FlexiLayout の作成を始める前に、事前認識の結果の品質を評価してください。事前認識の品質は、バッチ内のテスト画像の品質に左右されます。また、テスト画像の品質は、明るさ、コントラスト、解像度などのスキャンパラメーターに左右されます。事前認識の結果の品質に満足できない場合は、スキャンオプションを変更してテスト文書を再スキャンする必要があるかもしれません。また、FlexiLayout Studio では異なる解像度でスキャンした画像を追加できるため、事前認識と FlexiLayout のマッチングを試しながら、最適なスキャンオプションを選択できます。

事前認識モード

事前認識は、高速モードまたは完全モードで実行できます。詳細は事前認識パラメーターを参照してください。 FlexiLayout の開発時には、事前認識は必ずしも完璧である必要はありません。いくつかの認識エラーがあっても、実際にはほぼあらゆるデータfieldを見つける方法があります。実際、事前認識では品質よりも速度の方が重要な場合もあります。認識品質については、後続の data capture アプリケーションの段階で対処できます。そこでは各データfield のデータ型を指定できるため、認識の品質を大幅に向上させることができます。

事前認識時に検出される基本オブジェクト

事前認識では、FlexiLayout Studio がさまざまな色のドットの位置を解析し、基本オブジェクトを検出し、text fragment を単語や行にまとめます。次の種類の基本オブジェクトが検出されます。

Text
Picture
句読点
反転テキスト
区切り線
Barcode
Checkmark

基本オブジェクトが検出されると、テキストオブジェクトが認識されます。認識されたテキストは、次の 2 つの型のいずれかとして表示できます。

認識済みの単語
認識済みの行

ABBYY FlexiLayout Studioでの複数ページ文書のサポート

事前認識パラメーター

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

事前認識結果の品質を評価する

事前認識モード

事前認識時に検出される基本オブジェクト

​事前認識結果の品質を評価する

​事前認識モード

​事前認識時に検出される基本オブジェクト

​関連トピック

事前認識結果の品質を評価する

事前認識モード

事前認識時に検出される基本オブジェクト

関連トピック