メインコンテンツへスキップParagraph 要素のプロパティを設定して、整列、行数、行間隔のパラメータを指定した複数行のテキストブロックを検索します。
What to search for セクションの Paragraph 要素には、次のプロパティがあります:
- テキストの配置 は、段落内のテキストの配置方式を指定します。指定可能な値は Any、Left、Right、Justified、Center です。
- 行数 は、段落内のテキスト行の最小数と最大数を指定します。
- 行内の最大スペース は、ユーザー定義の単位で、検出されたオブジェクト内部のスペースに許容される最大の絶対長を指定します。テキストを検索する際は、隣接する文字間の距離が 行内の最大スペース の値を上回るまで、文字が文字列に追加されます。
- 行間の最大スペース は、ユーザー定義の単位で行間の最大距離を指定します。
- 相対行間の最大スペース は、上側の行の高さに対する相対値として、2 行間の最大距離を指定します。行間の距離がこの値より大きい場合、2 行目は仮説に含まれません。
- 行の高さ は、行の最小および最大の高さを指定します。
- 行の幅 は、行の最小および最大の幅を指定します。
- 単語の一部を検索 は、検索領域に一部しか含まれない単語の断片を仮説に含めるかどうかを指定します。単語の断片を仮説から除外する必要がある場合は、このオプションを無効にします。
- スタンプを削除。支払用の文書を認識する際、テキストの上に押されたスタンプが問題になることがあります。通常、スタンプはテキストの右下隅に押されます。スタンプが重なったテキストの断片は実質的に判読できず、プログラムでは意味をなさない語句の断片として認識されがちです。これを避けるには、スタンプが押されたテキストの断片をブロックに含めず、画像から手動でテキストを入力してください(誤認識されたテキストを削除する必要がなくなります)。Remove stamp が有効な場合、プログラムは検索領域の右下隅を分析し、重ね押しされたスタンプによって生じた可能性のあるテキストの断片を削除します。
- 区切り記号を無視 は、段落を検索する際に区切り記号を無視するかどうかを指定します。段落が区切り記号で区切られている場合は、このオプションを無効にしてください。
詳細プロパティを表示するには、Properties ペインで advanced mode の icon をクリックします。