メインコンテンツへスキップ半構造化ドキュメントは、構造化ドキュメントと異なり、画像ごとに保持するfieldの集合が異なります。要素を作成する際は、対応するオブジェクトが一部の画像に現れず、その画像では検出できない可能性があることを考慮する必要があります。画像が正しくスキャンされないこともあり(例:一部の領域が暗すぎる、または明るすぎる)、その結果、データが失われる場合があります。この場合、対応するオブジェクトも検出されません。Extraction Rules Activity Editor では、特定の要素が画像に存在しない場合でも、他の要素の検索を継続できます。特定のオブジェクトを含まない画像でマッチングを続行するには、そのオブジェクトを任意に設定します。
必須 要素で記述された画像オブジェクトは、常に画像上に存在することを前提としており、Extraction Rules アクティビティでの照合時には検出される必要があります。なお、そのようなオブジェクトが検出されない場合、照合はそこで停止します。
任意要素で記述された画像オブジェクトは、画像に存在しない場合や検出されない場合があります。ただし、必須要素とは異なり、これによってマッチングが中断されることはなく、他の要素で記述された画像オブジェクトは引き続き検出されます。
既定では、すべての単純要素は任意であり、画像に存在している必要はありません。単純要素とは異なり、すべての複合要素は既定で必須として設定されています。
特定の要素が存在する場合、その仮説連鎖は誤りと見なすべきことがあります。こうした要素は禁止要素と呼ばれます。この種の要素が検出されると、その要素が見つかった仮説ツリーの生成はそこで停止します。これらの要素は、誤った Extraction Rules アクティビティがドキュメントにマッチするのを防ぐために使用できます。
要素を必須・任意・禁止のいずれにするかを変更するには、Properties ペインで Element is プロパティを使用します。