メインコンテンツへスキップ要素を必須、任意、または禁止に設定して要素検出の挙動を構成し、オブジェクトが存在しない、または誤って検出された場合のマッチング継続を制御します。
半構造化ドキュメントは、構造化ドキュメントと異なり、画像ごとに保持するfieldの集合が変動します。要素を作成する際は、対応するオブジェクトが一部の画像には存在しない可能性があり、その場合は検出できないことを念頭に置いてください。画像が不適切にスキャンされる(例:一部の領域が暗すぎる、または明るすぎる)ことでデータが失われる場合もあります。この場合も対応するオブジェクトは検出されません。Extraction Rules Activity Editor を使用すると、特定の要素が画像に存在しない場合でも、プログラムは他の要素の検索を継続できます。特定のオブジェクトを含まない画像でマッチングを続けるには、そのオブジェクトを任意に設定する必要があります。
必須 要素で記述された画像オブジェクトは、常に画像上に存在することを前提としており、Extraction Rules アクティビティでの照合時には検出される必要があります。なお、そのようなオブジェクトが検出されない場合、照合はそこで停止します。
任意要素で記述された画像オブジェクトは、画像に存在しない場合や検出されない場合があります。ただし、必須要素とは異なり、これによってマッチングが中断されることはなく、他の要素で記述された画像オブジェクトは引き続き検出されます。
既定では、すべての単純要素は任意であり、画像に存在している必要はありません。単純要素とは異なり、すべての複合要素は既定で必須として設定されています。
特定の要素が存在する場合、その仮説連鎖は誤りと見なすべきことがあります。こうした要素は禁止要素と呼ばれます。この種の要素が検出されると、その要素が見つかった仮説ツリーの生成はそこで停止します。これらの要素は、誤った Extraction Rules アクティビティがドキュメントにマッチするのを防ぐために使用できます。
要素を必須・任意・禁止のいずれにするかを変更するには、Properties ペインで Element is プロパティを使用します。