メインコンテンツへスキップ
検索要素とは、1つまたは複数のドキュメント画像オブジェクトを記述するもので、特定の領域内でオブジェクトの検索条件を設定できます。要素には、検索対象の画像オブジェクトの種類、オブジェクトのプロパティ、およびその検索領域に関する情報が含まれます。要素のプロパティを用いて得られた検索結果は、画像上で検出されたオブジェクトの領域(検出されたオブジェクトを囲む1つまたは複数の矩形から成る領域)を形成するためにアクティビティによって使用されます。その後、field および他の要素の位置は、検出された要素の位置を基準に決定されます。 要素を作成するには、Create Element をクリックし、表示されるリストから適切な要素タイプを選択します。要素を作成したら、Properties ペインでそのプロパティを設定します(詳細は 要素のプロパティ を参照)。指定したプロパティはコード形式でも表示および編集できます(詳細は FlexiLayout Language を参照)。要素はドキュメントの構造に応じてツリー内で移動できます。なお、ツリー内の要素の位置が検索順序を決定します。要素の検索は降順で実行されます。 検索要素を作成する際は、見つけたいオブジェクトに応じてそのタイプを選択します。以下に、Extraction Rules アクティビティで利用可能な検索要素タイプの概要を示します。 検索要素を作成したら、そのプロパティをこちらの説明に従って構成します。

静的テキスト

この要素は、あらかじめ定義されたテキストを説明します。ほとんどのドキュメント画像には通常、静的なテキストが含まれます。これは、ドキュメント名(例: “Invoice”)や、データのfieldに対する補助ラベル(例: “Date”、“to:”、“from:“)の場合があります。こうしたテキストは、事前認識の段階でRecognized Wordsオブジェクトとして認識され、通常、対応するfieldの値を検出するためのアンカーとして機能します(例: 日付は一般的にラベル “Date” の隣に記載されます)。このテキストは単語またはフレーズで構成される場合があります。フレーズは少なくとも1つの空白を含む点で単語と異なります。フレーズは複数行にわたって記述されることもあります。この要素を検索する際には、画像の事前認識で検出され、要素の検索領域内にあるRecognized WordsおよびRecognized Linesオブジェクトが考慮されます。

文字列

この要素は、1 行の中で左から右へ並ぶ文字の列を表します。文字列は、認識済みテキストオブジェクト(Recognized Words)から構成され、たとえば単語全体や複数のテキストオブジェクト断片からまとめられます。この要素は、事前に定義されていないテキストを検索するために設計されています。画像の事前認識で検出され、要素の検索領域内にある Recognized Words オブジェクトが対象となります。 通常、このアクティビティは、すでに検出済みの静的テキストの周囲で文字列を検索します。たとえば、請求書番号を探す場合、まず静的テキスト “Invoice No.” を見つけ、その後、同じ行の静的テキストの右側で文字列を検索します(この場合は数字のみ)。
注: 右から左への記述であるため、このアクティビティはアラビア語およびヘブライ語では Character String 要素を検索しません。

段落

この要素はテキストの段落を表します。この要素を使った検索では、検索範囲と交差するすべてのテキストオブジェクトが対象になります。この要素は、あらかじめ定義されていないテキストの段落を検索するために設計されています。事前認識で検出され、要素の検索領域内にある Recognized Words および Recognized Lines オブジェクトが考慮されます。

Key value

これは、ラベル付きのfieldを検索するために設計されたグループ要素です。この要素を作成するには、ラベルのプロパティ、メインの検索用field、そして両者の間隔を指定する必要があります。さらに、プライマリ要素のタイプと適切なプロパティを指定することもできます。静的テキストと空白領域は、プライマリfieldの補助的な検索手段として機能します。静的テキストの検索では、画像の事前認識で検出され、要素の検索field内にある Recognized Words および Recognized Lines オブジェクトが考慮されます。静的テキスト要素が検出されると、アクティビティは要素の値を含む対応するfieldを検索します。

日付

この要素は日付を説明します。日付はさまざまな形式で表記でき、日と年度の値は常に数字で、月の値は文字で表記される場合もあります。日付の形式はユーザーが指定します。

金額

この要素は、整数または小数点以下が2桁の数値を表します。既定では、小数部のプレースホルダー記号が許可されます。たとえば、12. は 12.00 と認識されます。整数部は区切り文字でグループ化できます(スペースおよび次の記号は既定で区切り文字として使用可能です: . , ’)。検索対象の数値には接頭辞や接尾辞(数値の前後に置かれるテキスト要素など)を付与できます。接頭辞は数値と同じ行にある必要があります。この形式は通常、金額に用いられ、通貨名が接頭辞として機能します。

電話

この要素は電話番号を表します。通常、「Tel.」「Home Tel.」などのキーワードが付記され、市外局番・地域コードは番号の残りの部分と括弧で区切られます。電話番号と対応するキーワードは同じ行に記載されている必要があります。

領域

この要素は、内容に関する定義を伴わないドキュメント画像上の領域を表します。要素「領域」は、互いに離れた複数の領域から構成される場合があります。この要素は、含まれるオブジェクトに関係なく領域をマーキングするために、アクティビティで使用されます。この要素は、同じ field がドキュメントによって異なる要素で検出される場合に使用します。たとえば、標準形式と非標準形式の両方で記載され得る日付を見つけるために、Date と Character String を使用するケースです。この場合、Date と Character String は副次的な要素であり、抽出結果を記録するために Region が使用されます。

仕切り

この要素は、縦または横の区切り線を表します。区切り線の検索を目的として設計された要素です。画像の事前認識で検出され、要素の検索領域内に完全に位置する区切り線オブジェクトが対象となります。これらのオブジェクトは、検索領域内に完全に含まれている場合もあれば、領域と交差している場合もあります。

White Gap

この要素は、画像上の矩形領域を示し、通常は他のオブジェクトをほとんど含みません。他の要素を検索する際の補助要素として使用できます。たとえば、処理対象の文書で住所とヘッダーの間に常に白い空隙がある場合、White Gap 要素を使って住所を含む要素を検索できます。

バーコード

この要素はバーコードを記述します。Advanced Designer がサポートするバーコードの種類を検出するように設計されています。画像の事前認識で検出され、要素の検索領域内にあるバーコードオブジェクトが対象となります。

オブジェクトコレクション

この要素は、検索条件を満たすさまざまな種類のオブジェクトの集合を表します。Object Collection 要素は、ほかのどの要素タイプでも検出できないオブジェクトを探す際に主に使用されます。たとえば、この要素を使うと、任意のテキスト行や他のテキストオブジェクトに属さない独立した句読点や、多数の無関係なオブジェクトの影響で認識できなかったテキストを見つけられます。また、画像やマーキングなどの非テキストオブジェクトを見つけることもできます。

グループ

これは複数の他の要素(サブ要素と呼びます)の集合です。サブ要素はシンプル要素にもグループ要素にもなり得ます。サブ要素を含まないグループ要素は推奨しません。 グループ要素は次の目的で使用できます。
  • 要素をまとめてグループ化する。これにより、Extraction Rules アクティビティの独立した部分のデバッグが容易になります。たとえば、アクティビティにはヘッダー、本文、フッターという 3 つの部分に分割された 100 個の要素が含まれているかもしれません。これら 3 つの各グループ要素には、アクティビティの論理的な一部を構成する小さな断片を探索するために設計された、さらに複数のグループ要素が含まれます。アクティビティで考慮すべき可能性の数を最小限に抑えられるだけでなく、このような構造を用いることで、将来的にも独立した部分に分割されているため、デバッグや編集が容易になります。
  • ツリー内の要素の論理的な階層を確立し、アクティビティのナビゲーションを容易にする。
  • 要素仮説の候補数を減らし、アクティビティ全体の最終仮説の探索を高速化する。要素をグループ化すると、そのグループは独自の仮説を持つ単一のエンティティとして扱われ、グループ全体としての品質評価が可能になります。
  • 複合要素では、すべてのサブ要素に共通する検索領域の制約を指定できます。グループ要素内の特定のサブ要素の検索領域は、そのサブ要素とグループ要素の検索領域の交差として算出されます。
要素(グループ要素とシンプル要素の両方)は、必須、任意、または禁止のいずれかに設定できます。任意の複合要素に必須のサブ要素が含まれている場合、そのサブ要素が一致しないと、グループ要素にはヌル仮説が形成されます。これは Extraction Rules アクティビティのマッチングを中断しません。

繰り返しグループ

この要素は、出現回数が不明な繰り返し要素のグループを検出するために設計されています。代表例はデータテーブルです。繰り返し要素は、繰り返しに関するパラメーターの点で、通常の複合要素とは異なります。このグループは、1つのページ上でも文書全体にわたっても複数回出現する可能性があります。文書内でこのグループが繰り返されるため、そのすべてのインスタンス(繰り返しのパラメーターを含む)を1つの要素として記述できます。これにより、繰り返しグループを使用すると文書構造をより迅速に定義できます。 この要素は次の用途に使用できます:
  • テーブルを検出する。
  • 複数ページ文書で各ページのヘッダーを検出する。
  • 不明な件数の繰り返しデータ項目を検出する。

Input Field

この要素は、別のアクティビティで抽出された field の領域を検出するために設計されています。この要素は、他の要素を検索するためにも使用できます。 たとえば、ある Skill に、学習後も常に画像上に残る field が含まれている場合、Extraction Rules アクティビティで要素を検索する際のアンカーとなる field として利用できます。これを行うには、Input Field 要素を作成し、Skill 構造内で該当する field を選択します。これにより、選択した要素と field を関連付けるコードを含む Region 要素が、Search Conditions タブに作成されます。

Deep Learning

この要素は、Hypothesis Filtering コンテナー内で Deep Learning アクティビティによって見つかった値にアクセスし、その出力を Extraction Rules アクティビティに渡すためのものです。この要素は Hypothesis Filtering コンテナー内でのみ使用できます。 この検索要素に条件を指定することで、Deep Learning アクティビティの出力を制御できます。たとえば、Deep Learning アクティビティが繰り返し出現する値を検出するように設定されている場合、抽出したいインスタンスの優先位置を指定できます。