メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

固有表現 (NER) アクティビティは、自然言語処理 (NLP) を使用して、契約書、書簡、注文書、プレスリリースなど、ルールで定義できる明確な構造を持たない非構造化ドキュメントから固有表現を抽出するよう設計されています。固有表現 (NER) アクティビティでこれらのドキュメントを処理するには、エンティティの値を抽出する先となる Skill の field に固有表現をマッピングする必要があります。このアクティビティはドキュメントを解析し、固有表現を対応する field に抽出します。 他のアクティビティで抽出された field に対しても、固有表現の抽出を設定できます。たとえば、抽出対象の組織名と住所が各契約書の最初の段落にあることがわかっている場合、Segmentation アクティビティで最初の段落を抽出し、その段落から固有表現 (NER) アクティビティで会社名と住所を抽出できます。この方法は、抽出対象の領域を限定して制御できるため、ドキュメント全体から固有表現を抽出するよりも信頼性が高くなります。
このアクティビティがサポートするのは、データ型が Text、Date、または Money に設定された Text タイプの field のみです。

固有表現 (NER) アクティビティを設定する

1

アクティビティを追加する

Activities タブで、ドキュメント処理フローに固有表現 (NER) アクティビティを追加します。
2

ソースを選択する

アクティビティ プロパティ ペインで、Source ドロップダウンリストを使用して、アクティビティが固有表現の抽出元として使用するソースを選択します。ドキュメント全体、または別のアクティビティによって抽出された単一の field を指定できます。
3

出力 field を選択する

Output field で、固有表現の抽出先となる field を選択します。出力 field は、ソース field と同じネストレベルにあるか、その 1 つ下のレベルになければなりません。
4

マッピングを作成する

Create Mapping をクリックします。表示されたダイアログで、Entity to extract リストの各 field に抽出する固有表現を選択します。Save をクリックします。Edit Mapping をクリックすると、マッピングはいつでも編集できます。
5

Skill をテストする

Test Skill をクリックして Skill を実行し、Results タブで固有表現の抽出結果を確認します。

サポートされている固有表現

エンティティ名説明サポート対象のデータ型サポートされている言語
人名John Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Location地名Anytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Organization組織名ABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
住所住所123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Money金額$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
Date日付November 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
期間期間Twelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Italian, Portuguese (Standard), Dutch