メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Advanced Designerで文書からデータを抽出するには、Document skill を作成します。使用するアクティビティは文書の構造によって異なります。Vantageでは、文書は大きく4つのカテゴリに分けられます。

文書タイプ

構造化文書

構造化文書 (固定フォームとも呼ばれます) は、常に同じfieldが同じレイアウト、またはごく少数のレイアウトで配置されています。例:フォーム、質問票、アンケート。
構造化ドキュメントのサンプル — fieldの位置が一定のフォーム

半構造化文書

半構造化文書には、ドキュメント間で類似した情報が含まれますが、field の位置・サイズ・数は異なります。Vantage は、要素間の空間的・論理的な関係を利用してデータを特定します。例: 請求書、支払指図書、船荷証券。
半構造化ドキュメントのサンプル — field の位置が異なる請求書

非構造化文書

非構造化文書とは、段落や文から成る自由形式のテキストで、必要なfieldが複数のページにまたがることがあります。例: 契約書、メール、研究論文。
非構造化文書のサンプル — 自由形式のテキストによる段落

混在ドキュメントセット

混在ドキュメントセット には、異なる種類のドキュメントが含まれます。たとえば、半構造化ドキュメントと非構造化ドキュメントが混在している場合や、1つのドキュメント内で両者が混在している場合 (プレーンテキストの段落とテーブルが交互に現れる場合など) です。

シナリオを選択

文書タイプを特定したら、該当するシナリオに進んでください。

構造化文書を処理

固定または限られたレイアウトのフォーム向けのSkillを作成します。

半構造化文書を処理

請求書、船荷証券など、レイアウトが変動する文書向けのSkillを作成します。

非構造化文書を処理

契約書、メール、その他の自由形式テキスト向けのSkillを作成します。

混合セットを処理

複数の構造タイプが混在する文書セットを処理します。