メインコンテンツへスキップ
検索領域とは、特定の要素に対応するオブジェクトをプログラムが検索する画像上の領域です。これは、プロパティペインの検索対象セクションで指定された条件に基づいて算出されます。 半構造化ドキュメントでは、オブジェクトがドキュメントごとに異なる位置に現れることがあり、そのため絶対的な検索領域だけでは常に検出できない場合があります。この場合、固定位置の要素や、すでに検出済みのfieldを基準に相対的な検索領域を定義できます。検索領域を定義しなくても要素を検出できるケース(例:ドキュメント固有の語を常に含む Static Text 要素は、その語のみで検出可能)や、検索領域をドキュメントの最初または最後のページに限定する方法もあります。

検索領域の指定

要素の検索領域を指定するには:
  1. いわゆるアンカー要素を作成して設定します。すでに検出済みの要素は、検出したい要素との関係を定義できる場合、アンカー要素として使用できます。画像に対して要素を Match コマンドで照合し、正しく検出されることを確認します。
  2. 検出したい画像オブジェクトに対応する要素を作成し、What to search for セクションでそのプロパティを指定します。
  3. Where to search セクションで検索領域を指定します。 a. Search on ドロップダウンリストで、文書全体を検索する場合は Whole Document、検索を先頭ページまたは最終ページに限定する場合は First Page または Last Page を選択します。この方法で検索領域を指定する場合、アンカー要素は不要です。 b. 必要に応じて、検出対象の要素と他の要素との関係を指定するか、画像上に検索領域を直接描画します。検索領域の境界を他の要素に対して指定したり、特定の要素を検索領域から除外したり、検出対象の要素に最も近い要素またはページ端を指定したりできます。
  4. すべての文書で要素が正しく検出されることを確認するために Match をクリックします。

ドキュメント画像上で検索領域を指定する

多くの場合、アンカーとして使用する他の検索要素の位置に対して相対的に検索領域を指定します。要素は画像上で正常に検出されている場合にのみアンカーとして使用できます。そのため、まずアンカーとして使用する要素を設定し、マッチングを行ってください。 Draw on Image ボタンをクリックして、画像上に検索領域を描画します。検索領域は、アンカー要素の領域に近接または交差している必要があります。Where to search セクションには、描画した検索領域に対して Right ofBelowLeft ofAbove のプロパティが表示され、これらのプロパティについて、検索領域とアンカー要素の関係に基づく距離を指定するための座標も表示されます。これらのプロパティは画像上の検索領域と同期しています。画像上の領域を編集するか、Properties ペインで関係プロパティを変更することで、いつでも検索領域を調整できます。Properties ペインで関係を選択すると、その関係で規定される半平面がドキュメント画像上でハイライト表示されます。 次に、要素の領域をクリックして表示されるアンカー要素ツールバーを使って、アンカー要素と検索領域の関係を調整します。 AD_ExtractionRules_SearchArea_Tools
  • 方向矢印ツールは、要素に対する該当方向でのオブジェクト検索の関係を有効/無効にします。
  • 関係削除ツールは、選択した要素に設定されたすべての関係を削除します。
  • 最近傍ツールは、すべての要素仮説の中から、他の条件が同等に満たされている場合に、選択した要素に最も近いものを採用するよう指定します。仮説が確定される際、選択した要素に最も近いオブジェクトが選択されます。このツールを使用すると、Nearest to プロパティが Properties ペインに表示されます。このプロパティは、アンカー要素は1つのみに設定できます。
  • 除外ツールは、選択した要素を検索領域から除外します。これは、検索領域内の要素が検索対象のオブジェクトと誤認される可能性がある場合に使用します。たとえば、特定の文字集合を持つ Character String 要素を探している場合、同じまたは類似の文字集合を持つ別の Character String 要素が誤って選択される可能性があります。これを防ぐには、除外ツールを使用して後者の要素を検索領域から除外します。このツールを使用すると、Exclude プロパティが Properties ペインに表示されます。
検索領域の設定が完了したら、Draw on Image ボタンをクリックして Draw Search Area モードを終了します。

プロパティペインで検索領域を指定する

これらのリレーションは、前述のアンカー要素ツールバーで設定したものと同等です。各リレーションは個別に編集できます。 Draw Search Area モードをオンにすると、選択したリレーションで定義された検索領域と半平面がドキュメント画像上に表示されます。検索領域はリレーションのプロパティと同期されます。

右、下、左、上、除外

Where to search セクションで Add をクリックし、設定したいリレーションタイプを選択します。表示されたダイアログボックスでアンカー要素を選択します。現在の要素より上にあるアクティブな要素であれば任意に選択できます。 これらの各タイプについて、複数のリレーションを追加できます。 Right ofBelowLeft ofAbove の各リレーションでは、オフセットを変更して検索範囲を調整できます。正のオフセット値は、リレーションで指定された方向と同じ方向に境界が移動することを意味します。負のオフセット値は、指定された方向とは反対方向に境界を移動します。例えば、Right of に負のオフセットを設定すると、境界は左方向に移動します。 また、検索範囲の基準となる要素のどの境界から計算するかも選択できます。既定では、アンカー要素が検索範囲に含まれないように(上端より上、下端より下 など)境界が選択されます。アンカー要素の反対側の境界(下端より上、上端より下 など)や中心を基準に検索範囲を計算することも可能です。この設定を調整するには、該当するリレーションに表示される境界アイコンをクリックします。

特定の文字列を、あるドキュメントでは事前定義された静的テキストの上に、別のドキュメントではその静的テキストと同じ高さにあるものを見つける必要があるとします。Above の値を 0 に設定すると、検索領域は静的テキストと同じ高さの要素を含めないため、一部の画像では該当要素が検索領域に入らなくなります。 Example 1 Example 1b 一方、Above の値を -50 に設定するか、境界の icon をクリックして Bottom Boundary of Region を選択すると、静的テキストと同じ高さの領域とその上の領域の両方が検索範囲に含まれるため、すべての画像で該当要素が検索領域内に確実に入ります。 Example 2 Example 2b

最も近い位置

このリレーションを Properties ペインで設定する際は、アンカーとして検索要素またはページ端のいずれかを選択できます。これはツリー内の最初の要素に対してのみ設定できる唯一のリレーションです。この種類のリレーションは1つだけ追加できます。Group 要素および繰り返しグループ要素にはこのリレーションを追加できませんが、グループまたは繰り返しグループの子要素には追加できます。

繰り返しグループ要素をアンカー要素として使用する

リレーションのアンカー要素を選択しようとすると、繰り返しグループ要素とその子要素は常にグレー表示になります。ただし、これらの要素もアンカー要素として使用できます。繰り返しグループ要素をアンカーにしてリレーションを設定するには、要素名の右側にある編集用ドロップダウンのアイコンをクリックし、アンカー要素として使用するインスタンスを選択します。最後に検出されたインスタンス、完了済みのすべてのインスタンス、または特定の番号のインスタンスを指定できます。

関係の編集と削除

既存の関係のアンカー要素は、Properties ペインでその関係をダブルクリックして変更できます。オフセットと境界の設定はそのまま保持されます。 既存の関係は、アンカー要素ペインからも、Properties ペイン内の対象プロパティの横にある削除ボタンからも削除できます。 検索領域を削除するには、検索領域上の「関係を削除」アイコンをクリックします。あるいは、Search on プロパティで Whole DocumentFirst PageLast Page のいずれかを選択します。