- ICR - field に手書き文字または活字体の手書き文字の固定テキストが含まれる場合は、このオプションを有効にします。文字の書き方は国によって大きく異なることがあるため、適切な国を指定する必要があります。
| ロシア式の「2」 | |
|---|---|
| 一般的な「5」 (どの書体にも見られます) | |
| 日本式の「5」 | |
| ロシア式の「1」 | |
| ドイツ式の「1」 | |
| 一般的な「9」 (どの書体にも見られます) | |
| チェコ式の「9」 (上部が途切れた丸付き) |
- OCR (printed) - field に機械印字された固定テキストが含まれる場合は、このオプションを有効にします。ドロップダウンリストから印字スタイル (活字、ドットマトリクスプリンター、タイプライターなど) を選択します。あわせてサポートされているテキストタイプも参照してください。
- Advanced - このオプションを使用すると、複数のテキストタイプを選択したり、カスタムのテキストタイプを指定したりできます。また、PTN または FBT 形式のパターンファイルをロードすることもできます。パターンをロードするには、Modify… をクリックします。開いたダイアログで Use pattern を選択し、ファイルのパスを指定します。
パターン
パターン
パターンとは、パターン学習によって作成される「文字画像 — キーボード文字」の組の集合です。ユーザーパターンは、プログラムに追加情報を与える情報源です。パターン学習は、次のような場合に役立ちます。
- 装飾フォントで組まれたテキスト
- 特殊な文字 (例: 数学記号) を含むテキスト
- field の認識時には、不確かに認識された文字だけがパターンファイルの値で置き換えられます。
- 全文認識時には、すべての文字がパターンファイルの値で置き換えられます。
- Marking type - マーキングタイプを選択します。選択しやすいように、ドロップダウンリストからサンプルを選択してください。スキャン時にマーキングが消える場合、そのマーキングタイプは等幅 (Grey boxes) です。スキャン時にマーキングが消えず、文字スペースごとのセルに分かれている場合は、セルの総数を入力する必要があります。プログラムがこのようなマーキングのある field を自動的に検出する場合、セル数も自動的に判定されます。 注: 一部のマーキングタイプ (Grey boxes、Simple、Underlined) では、行末で分割された単語は自動的に再結合されます。選択したマーキングタイプが Simple または Underlined の場合、単語はハイフンで分割されているときにのみ結合されます。Grey boxes のマーキングタイプを使用している場合は、ハイフンがなくても分割された単語が検出され、結合されます。単語が辞書で検出された場合、その単語は再結合されます。
- Letter case - field 内の文字の大文字/小文字を選択します。小文字と大文字の両方があり得る場合は、Auto オプションを有効のままにします。
- Orientation - テキストの向きを指定します。
- Direction of CJK text - 中国語、日本語、または韓国語のテキストを OCR する際に使用する読み方向を選択します。使用可能なオプションは Auto、Horizontal Script、Vertical Script です。既定では Auto が選択されており、CJK テキストを含まない field に推奨されるオプションです。
- One line - 常に 1 行だけで構成される field では、このオプションを選択します。このオプションを使用すると、認識が不十分な筆跡や文字の高さのばらつきによって、field 内のテキストが複数行テキストとして解釈されるのを防げます。 注: 複数行の field ではこのオプションを無効にしてください。
- 値が常に 1 単語のみで構成される field では、One word オプションを有効にします。また、含まれる単語数に関係なく field 全体に正規表現を適用したい場合にも、このオプションを有効にできます。 注: One word オプションが有効な場合、カスタム辞書にスペース文字を含む式を入れることは推奨されません。
-
Invert は、認識時に画像の色と明るさを反転します (この反転は一時的なもので、認識にのみ影響し、元の画像の色は output file に保持されます)。
- Autodetect は、テキスト色と背景色を自動的に検出し、必要に応じて反転します。暗い背景に明るい文字がある部分と、明るい背景に暗い文字がある部分の両方を含む文書に推奨される設定です。
- Invert は、画像全体を反転します。
- Don’t invert は、元の色を保持します (このオプションは既定で有効になっています)。
- Remove texture は、テクスチャを除去します。
- Despeckle - 画像からごみを除去するには、このオプションを有効にします。
- Clear the garbage of specified size only - 指定したサイズのごみだけを除去する場合は、このオプションを有効にします。ごみのサイズを指定します。このオプションが無効で、Despeckle オプションが有効な場合は、ごみのサイズは自動的に選択されます。
