メインコンテンツへスキップ
Static Text は、あらかじめ定義されたテキストを表す FlexiLayout の要素です。テキストは、単語または語句で構成できます。語句は、少なくとも 1 つのスペースを含む点で単語とは異なります。また、語句は複数行で記述されることもあります。 Static Text 要素は、FlexiLayout ツリー内で で示されます。 プログラムは Static Text 要素を使用して、静的テキスト、つまりあらかじめ分かっているテキストを検索します。プログラムは、事前認識 中に検出され、要素の検索領域内にある 認識済みの単語 および Recognized Lines オブジェクトを、静的テキストの候補として扱います。 通常、バッチ内のすべてまたは多くの画像には静的テキストが含まれています。これは、文書の見出し (例: Invoice) や field 名 (例: Date、to:、From:) である場合があります。このようなオブジェクトは事前認識中に 認識済みの単語 として検出され、通常は対応する field に入力されるテキストを探す際の「目印」として使用されます。たとえば、静的テキスト “Date” の隣に日付があると考えるのは自然です。

Static Text 要素のプロパティ

対応するオブジェクトを設定するには、Properties ダイアログの Search text from file タブをクリックします。Properties ダイアログを開くには、FlexiLayout ツリーで要素を右クリックし、ショートカットメニューから Properties… を選択します。
  • Search text 画像上で検索するテキストです。 語句や複数の単語を検索する必要があり、それらが常に同じ行に配置されることがわかっている場合は、スペースを無視することをお勧めします (つまり、Take spaces into account オプションをオフのままにします) 。そのほうが検索が高速になります。この場合、検索語句はスペースを入れずに入力できます。Take spaces into account オプションが選択されていなければ、プログラムがスペースを削除するためです。
E.g.:すべての文書で 1 行に記載されている ‘Purchase Agreement’ という名前を検索するには、PURCHASEAGREEMENT と入力する必要があります。
候補を区切るには、縦棒 (記号 ’|’) を使用します。 | E.g.: | 類似した文書に Contract や Agreement という名前が含まれる可能性がある場合は、CONTRACT|AGREEMENT と入力する必要があります。 | | --- | --- | 語句の候補は中かっこで囲み、縦棒で区切ります: { }|{ }。語句内の単語の候補を列挙することもできます (Take spaces into account オプションを選択しておく必要があります) 。 | E.g.: | Search text field に {SALE|PURCHASE AGREEMENT|CONTRACT}|{CUSTOMER|CLIENT APPLICATION} と入力すると、プログラムは次の語句を検索します: sale agreement、purchase agreement、sale contract、purchase contract、customer application、client application。 | | --- | --- | 長い文字列を入力するには、 をクリックします。クリックすると、別のデータ入力ウィンドウが開きます。
  • Search text from database データベース内のテキストフラグメントを画像上で検索できます。テーブル内の該当するフィールドを検索するには、SELECT コマンドで始まる SQL クエリを使用します。プログラムは、見つかった field に含まれるテキストを画像上で検索します。
  • Connection string フィールドにデータベース接続文字列を入力するか、 をクリックして標準のデータベース接続ダイアログを開きます。
    • Query text field にクエリを入力します。 をクリックすると、別のデータ入力ウィンドウが開くので、そこにクエリを入力することもできます。
  • Search text from file ファイル内のテキストフラグメントを検索できます。Browse… ボタンをクリックして目的のファイルを選択します。データベースとファイルの使用方法の詳細については、FlexiLayout language でのデータベースとテキストファイルの使用を参照してください。
  • Max number of errors
  • 単語内で許容されるエラーの最大数です。語句内の単語がスペースで区切られている場合、プログラムは各単語を個別にチェックします。そうでない場合、語句は 1 つの単語だけで構成されるものと見なされます。単語内のエラー数がこのフィールドで指定した数を超えると、その単語は検出されなかったものと見なされます。1 つのエラーは、Search text field に入力されたテキストに一致するようにテキストを調整するために必要な、1 回の削除、挿入、または置換操作に相当します。 デフォルトでは、このプロパティの値は無制限です。
E.g.:Search text field に ‘meet’ という単語が含まれ、エラーの最大数が 1 に設定されているとします。プログラムがこの search area で ‘moot’ という単語を見つけた場合、その単語には 2 つのエラーがあることになり、‘meet’ という単語は見つからなかったものと見なされます。
  • 最大エラー率 単語内で許容されるエラーの最大割合です (仮説内のエラー数を仮説内の文字数で割って算出されます) 。単語内のエラー率がこの field で指定した割合を上回る場合、その単語は未検出と見なされます。デフォルト値は 30% です。 注: 最大エラー数と最大エラー率の両方を指定した場合、プログラムはより厳しい条件を使用し、もう一方は無視します。
  • 最大スペース長 検出されたオブジェクト内のスペースの最大長を指定できます。
  • 完全一致する単語のみ 単語全体に一致する場合のみ検索します。
  • 大文字と小文字を区別 大文字と小文字を区別する検索を有効にします (プログラムは小文字と大文字を区別します) 。
  • Take spaces into account 検索文字列内でスペースを使用できます。このオプションが選択されていない場合、検索文字列からスペースは削除されます。スペースを無視すると検索は高速になります。ただし、検索フレーズが複数行にまたがる可能性がある場合や、フレーズ内の一部の単語が欠けている可能性がある場合は、[Take spaces into account] オプションを有効にし、スペースを保持したまま検索フレーズを入力する必要があります。
[Take spaces into account] が選択されている場合にのみ、次のオプションを使用できます。
  • 複数行を許可 - フレーズを複数行にわたって記述できるようにします。
  • 改行ペナルティ - 単語間の改行に対するペナルティを設定します。ペナルティは 0 から 1 までの数値です。仮説の品質は、フレーズ内の改行数と同じ回数だけこの数値で乗算されます。フレーズ内で改行を許可する場合は、このパラメーターを 1 に設定します (仮説の品質に 1 を掛けても品質は低下しません) 。
  • 単語の欠落を許可 - フレーズ内で単語が欠けていてもよいようにします。
  • 単語欠落ペナルティ - 欠落した単語に対するペナルティを設定します。ペナルティは 0 から 1 までの数値です。仮説の品質は、フレーズ内の欠落単語数と同じ回数だけこの数値で乗算されます。フレーズ内で一部の単語が欠ける可能性がある場合は、このパラメーターを 1 に設定します (仮説の品質に 1 を掛けても品質は低下しません) 。

Static Text要素の作成に関する推奨事項

静的テキストは事前に分かっているため、Static Text要素を参照要素として使用し、ほかの画像オブジェクトを検索できます。次のガイドラインに従ってください。
  • 選択した静的テキストがすべての画像で確実に認識されることを確認するには、またはをクリックして、すべての画像で事前認識結果を確認します。これらはそれぞれ単語および語句に対応します。文字が正しく単語としてまとめられ、単語が正しく行としてまとめられていることを確認してください。
  • 品質の低いスキャンでも変わらず、OCR誤認識の数も予測しやすい、大きめの文字で印字された静的テキストを選択するのが最適です。
  • 文書上に小さい文字の静的テキストしかなく、事前認識で確実に認識できない場合 (つまり、画像ごとに誤りの数や種類が大きく異なる場合) は、そのようなテキスト断片は Static Text ではなく、Text オプションと Punctuation mark オプションを選択した Object Collection として記述するほうが適しています。 (Picture オプションも選択する必要がある場合があります。その場合はツールバーの(Raw Objects )をクリックし、画像上で対応するオブジェクトを選択してください。オブジェクトの型は、Properties ウィンドウの DataType 行に表示されます。)
  • 誤検出を防ぎ、追加の検索条件を最小限に抑えるため、一意の静的テキスト断片を選択することをお勧めします。
  • 単語1つの名前 (Static Text 要素で見つける予定のもの) と、その単語1つの名前と同じ単語を含む語句名の両方がある場合は、まず語句用の要素を作成してください。これにより、プログラムが語句名の中にある単語1つの名前を誤って検出するのを防げます。

表意文字を使用する言語に関する推奨事項

中国語、日本語、韓国語の文字列では、特別な検索パラメーターを使用できます。このパラメーターは、見つかった候補について、Search text 要素に指定した値と比較したときの誤り数の数え方に影響します。このパラメーターを有効にすると、挿入、削除、置換の各操作では、それぞれ 1 つの誤りとして数えられる文字について、置換文字として字形が似た文字 (表意文字) だけが許可されます。したがって、ある文字を似た文字に置き換えた場合は 1 つの誤りとして数えられますが、似ていない文字に置き換えた場合は、文字の削除と新しい文字の挿入という 2 つの操作が行われるため、2 つの誤りとして数えられます。 この検索モードが影響するのは、中国語、日本語、韓国語の文字列の検索のみです。
これらの言語では、単語単位の検索は使用できません。これらの言語で書かれたテキストは、明示的に単語へ分割されていないことが多いためです。
この検索モードを有効にするには、次のコードを Advanced タブの 高度な事前検索リレーション ペインに入力します。 SuggestOnlySimilarChars(Logic value = true); 既定では、SuggestOnlySimilarChars パラメーターは false に設定されています。

関連項目:

要素の作成と削除 要素のプロパティの概要 検索領域 Static Text 要素の追加検索条件