Static Text 要素のプロパティ
Properties ダイアログを表示、Static Text タブ
Properties ダイアログを表示、Static Text タブ

- Search text 画像上で検索するテキストです。 語句や複数の単語を検索する必要があり、それらが常に同じ行に配置されることがわかっている場合は、スペースを無視することをお勧めします (つまり、Take spaces into account オプションをオフのままにします) 。そのほうが検索が高速になります。この場合、検索語句はスペースを入れずに入力できます。Take spaces into account オプションが選択されていなければ、プログラムがスペースを削除するためです。
| E.g.: | すべての文書で 1 行に記載されている ‘Purchase Agreement’ という名前を検索するには、PURCHASEAGREEMENT と入力する必要があります。 |
|---|
- Search text from database データベース内のテキストフラグメントを画像上で検索できます。テーブル内の該当するフィールドを検索するには、SELECT コマンドで始まる SQL クエリを使用します。プログラムは、見つかった field に含まれるテキストを画像上で検索します。
-
Connection string フィールドにデータベース接続文字列を入力するか、
をクリックして標準のデータベース接続ダイアログを開きます。
- Query text field にクエリを入力します。
をクリックすると、別のデータ入力ウィンドウが開くので、そこにクエリを入力することもできます。
- Query text field にクエリを入力します。
- Search text from file ファイル内のテキストフラグメントを検索できます。Browse… ボタンをクリックして目的のファイルを選択します。データベースとファイルの使用方法の詳細については、FlexiLayout language でのデータベースとテキストファイルの使用を参照してください。
- Max number of errors
- 単語内で許容されるエラーの最大数です。語句内の単語がスペースで区切られている場合、プログラムは各単語を個別にチェックします。そうでない場合、語句は 1 つの単語だけで構成されるものと見なされます。単語内のエラー数がこのフィールドで指定した数を超えると、その単語は検出されなかったものと見なされます。1 つのエラーは、Search text field に入力されたテキストに一致するようにテキストを調整するために必要な、1 回の削除、挿入、または置換操作に相当します。 デフォルトでは、このプロパティの値は無制限です。
| E.g.: | Search text field に ‘meet’ という単語が含まれ、エラーの最大数が 1 に設定されているとします。プログラムがこの search area で ‘moot’ という単語を見つけた場合、その単語には 2 つのエラーがあることになり、‘meet’ という単語は見つからなかったものと見なされます。 |
|---|
- 最大エラー率 単語内で許容されるエラーの最大割合です (仮説内のエラー数を仮説内の文字数で割って算出されます) 。単語内のエラー率がこの field で指定した割合を上回る場合、その単語は未検出と見なされます。デフォルト値は 30% です。 注: 最大エラー数と最大エラー率の両方を指定した場合、プログラムはより厳しい条件を使用し、もう一方は無視します。
- 最大スペース長 検出されたオブジェクト内のスペースの最大長を指定できます。
- 完全一致する単語のみ 単語全体に一致する場合のみ検索します。
- 大文字と小文字を区別 大文字と小文字を区別する検索を有効にします (プログラムは小文字と大文字を区別します) 。
- Take spaces into account 検索文字列内でスペースを使用できます。このオプションが選択されていない場合、検索文字列からスペースは削除されます。スペースを無視すると検索は高速になります。ただし、検索フレーズが複数行にまたがる可能性がある場合や、フレーズ内の一部の単語が欠けている可能性がある場合は、[Take spaces into account] オプションを有効にし、スペースを保持したまま検索フレーズを入力する必要があります。
- 複数行を許可 - フレーズを複数行にわたって記述できるようにします。
- 改行ペナルティ - 単語間の改行に対するペナルティを設定します。ペナルティは 0 から 1 までの数値です。仮説の品質は、フレーズ内の改行数と同じ回数だけこの数値で乗算されます。フレーズ内で改行を許可する場合は、このパラメーターを 1 に設定します (仮説の品質に 1 を掛けても品質は低下しません) 。
- 単語の欠落を許可 - フレーズ内で単語が欠けていてもよいようにします。
- 単語欠落ペナルティ - 欠落した単語に対するペナルティを設定します。ペナルティは 0 から 1 までの数値です。仮説の品質は、フレーズ内の欠落単語数と同じ回数だけこの数値で乗算されます。フレーズ内で一部の単語が欠ける可能性がある場合は、このパラメーターを 1 に設定します (仮説の品質に 1 を掛けても品質は低下しません) 。
Static Text要素の作成に関する推奨事項
- 選択した静的テキストがすべての画像で確実に認識されることを確認するには、
または
をクリックして、すべての画像で事前認識結果を確認します。これらはそれぞれ単語および語句に対応します。文字が正しく単語としてまとめられ、単語が正しく行としてまとめられていることを確認してください。 - 品質の低いスキャンでも変わらず、OCR誤認識の数も予測しやすい、大きめの文字で印字された静的テキストを選択するのが最適です。
- 文書上に小さい文字の静的テキストしかなく、事前認識で確実に認識できない場合 (つまり、画像ごとに誤りの数や種類が大きく異なる場合) は、そのようなテキスト断片は Static Text ではなく、Text オプションと Punctuation mark オプションを選択した Object Collection として記述するほうが適しています。 (Picture オプションも選択する必要がある場合があります。その場合はツールバーの
(Raw Objects )をクリックし、画像上で対応するオブジェクトを選択してください。オブジェクトの型は、Properties ウィンドウの DataType 行に表示されます。) - 誤検出を防ぎ、追加の検索条件を最小限に抑えるため、一意の静的テキスト断片を選択することをお勧めします。
- 単語1つの名前 (Static Text 要素で見つける予定のもの) と、その単語1つの名前と同じ単語を含む語句名の両方がある場合は、まず語句用の要素を作成してください。これにより、プログラムが語句名の中にある単語1つの名前を誤って検出するのを防げます。
表意文字を使用する言語に関する推奨事項
これらの言語では、単語単位の検索は使用できません。これらの言語で書かれたテキストは、明示的に単語へ分割されていないことが多いためです。
