メインコンテンツへスキップ
通常、field は名前によって検出されますが、この文書内のすべての field に名前が付いているわけではありません。たとえば、レシピ名が入っている field には名前がありません。そのため、この field を検出するには別の方法を使う必要があります。 まず思いつく最も単純な方法は、レシピ名はフォームの見出しに最も近い object であるとプログラムに指示することです。しかし、テスト画像 6 を見ると、この画像では最も近い field が Recipe #: であることがわかります。場合によっては、プログラムが 2 つの field を区別できるように追加の検索条件を指定することもできますが、このケースでは 2 つの field を見分けるのが非常に困難です。というのも、レシピ名と Recipe #: field は非常に近い位置にあり、構造も似ているためです。
  1. Recipe #: という名前と field 自体は同じ高さに配置されています。また、この field には、レシピ名に使われる可能性のある文字と同じ文字が含まれる場合があります。
  2. レシピ名のテキストが、Recipe #: という名前とその field より常に長いとは限りません。
ただし、事前認識では、すべてのテスト画像で Recipe #: という名前が一貫して検出される点に注意してください。つまり、まず Recipe #: を探すようプログラムに指示できます。その後、プログラムはレシピ名を探します。つまり、文書の見出しに最も近い object を探す必要がありますが、それは Recipe #: ではありません (その時点ですでに検出されているためです) 。