事前認識パラメーター

FlexiLayouts と分類器には、認識言語、テキストタイプ、事前認識モード、領域などの事前認識設定を含む、さまざまなユーザー定義の設定があります。適切な事前認識設定を選択することで、documents の処理に適した FlexiLayouts と分類器を作成できます。事前認識設定は、事前認識のプロパティダイアログで変更できます。このダイアログを開くには、次のいずれかを実行します。

FlexiLayout メニューまたは Classifier メニュー、あるいは FlexiLayout または分類器のショートカットメニューで Properties… をクリックします。
FlexiLayout または分類器のプロパティダイアログの General タブで、Advanced Pre-recognition Properties… ボタンをクリックします。

事前認識のプロパティダイアログでは、以下のオプションを使用できます。

一般タブ

名前 – documents 上のテキストの印字方法です。テキストタイプを判別して品質を評価し、次のいずれかを選択します。

活字
ドットマトリックスプリンター
タイプライター

事前認識モード – documents の事前認識に使用するモードです。

モード	説明
高速	カラー画像およびハーフトーン画像は、認識前に二値化されます (白黒に変換されます) 。高速認識は短時間で完了し、概ね良好な結果が得られます。
バランス重視	画像の色も考慮されるため、認識速度は遅くなりますが、品質は向上します。バランス重視モードのアルゴリズムは、速度と品質の最適な水準にすでに達しているため、今後これ以上変更される予定はありません。
通常	既定のモードです。また、高速モードまたはバランス重視モードでの事前認識で複数のエラーが発生する場合にも推奨されます。
高精度	判読が難しいデジタル画像や低品質の documents からデータを抽出することを目的としています。このモードは最も時間がかかるため、問題のある画像や documents にのみ使用してください。

言語タブ

テキスト言語 – documents で使用されている言語です。ドロップダウンリストから、1つまたは複数の言語を選択できます。使用可能な言語の一覧については、ABBYY FlexiLayout™ StudioでサポートされているOCR言語を参照してください。 ユーザー辞書 – このオプショングループでは、ユーザー辞書を追加できます。ユーザー辞書は、専門用語、略語、会社名などを追加して組み込み辞書を補完し、認識精度を向上させます。

詳細設定タブ

バーコード

Option	Description
バーコードの抽出を無効にする	画像内のバーコードを検出しない場合に選択します。これにより、文書認識が大幅に高速化されます。
2Dバーコードを抽出する: Data Matrix、Aztec、QR Code	処理対象の画像に Data Matrix、Aztec、QR Code のバーコードが含まれている場合に選択します。このオプションが有効でない場合、これらのバーコードは画像上で検出されず、Barcode element’s properties でも使用できません。
郵便バーコードを抽出する	画像に郵便バーコード (Australia Post など) が含まれている場合に選択します。このオプションを選択しない場合、郵便バーコードは画像上で検出されず、Barcode element properties でも使用できません。郵便バーコードを抽出すると、認識速度が低下します。

CJK

CJK (中国語、日本語、韓国語) の処理オプションです。 ふりがな分離モード – ふりがな (読み仮名) が付いた日本語テキストを処理する際の認識精度を向上させるには、このオプションを選択します。

NER 認識

固有表現を抽出する – NLP を使用して、field または field グループから意味のある情報を抽出する場合は、このオプションを選択します。

このオプションは、NLP モジュールを含むライセンスでのみ使用できます。

縦書きテキストの抽出

オプション	説明
すべての言語に対して抽出する	サポートされている任意の言語で記述された縦向きテキストを検出します。
抽出しない	縦向きテキストの検出を無効にします。
CJK 言語に対して抽出する	中国語、日本語、韓国語で記述された縦書きテキストを検出します。

事前認識領域

事前認識を行う領域です。ページの端を基準に、事前認識領域の位置を指定できます。

ユーザーパターン

PTN または FBT 形式のユーザーパターンを追加します。documentsに標準以外のフォントや文字が含まれている場合は、ユーザーパターンを使用してください。

事前認識

事前認識を実行して結果を表示する

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

一般タブ

言語タブ

詳細設定タブ

バーコード

CJK

NER 認識

縦書きテキストの抽出

事前認識領域

ユーザーパターン

​一般タブ

​言語タブ

​詳細設定タブ

​バーコード

​CJK

​NER 認識

​縦書きテキストの抽出

​事前認識領域

​ユーザーパターン

一般タブ

言語タブ

詳細設定タブ

バーコード

CJK

NER 認識

縦書きテキストの抽出

事前認識領域

ユーザーパターン