メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Document skill の学習とテストのために、代表的なドキュメント一式にラベル付けします。以下のガイドラインは、構造化ドキュメントと半構造化文書を対象としています。
非構造化文書については、非構造化文書のラベル付けを参照してください。

構造化ドキュメント

構造化ドキュメントには、常にまったく同じ種類の情報が、まったく同じ位置に含まれます。構造化ドキュメントの例としては、あらかじめ書式設定されたフォームがあります。レイアウトが変わらないため、学習用としてはサンプルドキュメントを少数だけラベル付けすれば十分です。 構造化ドキュメントにラベル付けする際は、次のガイドラインに従ってください。
  • 各fieldの領域を正確に指定してください。値だけでは学習に不十分です。
  • fieldの領域を指定する際は、その値をクリックせず、プレースホルダー全体を囲んでください。
  • fieldに値がない場合は、空のプレースホルダーを囲んでください。
  • fieldが複数の部分で構成されている場合は、Shift キーを押しながら部分を追加します。すべての部分が同一のページ上になければなりません。
  • 固定フォームにテーブルが含まれている場合は、空の行も含めてすべての行を囲んでください。
  • ラベル付けを開始した後でfieldを追加した場合は、その新しいfieldが存在するトレーニングセット内のすべてのドキュメントでラベル付けしてください。

半構造化文書

半構造化文書には通常、同じ種類または類似した種類の情報が含まれますが、field の位置、サイズ、数は文書ごとに異なる場合があります。例としては、請求書、支払指図書、インボイスなどがあります。 半構造化文書にラベル付けする際は、次のガイドラインに従ってください。
  • 各 field の領域を正確に指定してください。学習には field の値だけでは不十分です。
  • field の領域を指定するには、その値、つまりそこに含まれる単語をクリックします。領域は自動的に作成されます。
  • field に値がない場合は、その領域を作成しないでください。
  • 単語の一部だけを指定しないでください。Vantage が学習できるのは単語全体のみです。
  • field が複数の部分で構成されている場合は、Shift キーを押したまま各部分を追加します。すべての部分が同じページ上にある必要があります。
  • 繰り返しデータについては、まず文書を分析し、適切な構造を選択してください。
    繰り返しデータが次のような場合…使用するもの
    共通のヘッダーがあり、値の近くにキーワードがない表Table field
    値の横にキーワードがある、あまり構造化されていないデータAllow multiple items を有効にした Group
    文書ごとにレイアウトが異なる場合大半の文書に適したオプションを選択します
  • 表にラベル付けするには、最初の行のセルを 1 つずつ指定します。Vantage が列を自動的に作成します。次に Continue table from this row をクリックし、表全体が正しくラベル付けされていることを確認します。
  • ある field の領域を別の field の領域内に配置しないでください。親が個別の field (住所など) であっても、表のセルであっても同様です。大きなテキストフラグメントからデータを抽出するには、Advanced Designer を使用してください。
  • ラベル付けの開始後に field を追加した場合は、すべての文書を見直し、その field が存在するすべての文書で新しい field にラベル付けしてください。
表が大きく、文書ページの見た目が似ている場合は、類似したページを削除して、最初のページ、最後のページ、およびその間の数ページのみにラベル付けできます。

fieldの追加

Editorタブでfieldにマークを付け、型ごとにfieldプロパティを設定します。

非構造化文書のラベル付け

非構造化文書のラベル付けに関するAdvanced Designerガイド。

Document skillを設定する

構造化フォームやオンラインラーニングを含むDocument skillの作成、学習、公開を行います。

Document skillの学習とテスト

Document skillの学習、テスト、品質測定に関するAdvanced Designerガイド。