IFieldExtractor - ABBYY Documentation

目的

Documentのテキスト内にあるfieldを識別します。

変更できるのは抽出スクリプト内のみです。

メソッド


ExtractRegularExpression( regularExpression : string, resultCollectionName : string )	テキスト範囲を識別するための正規表現を指定します。 resultCollectionName パラメーターは、生成されるオブジェクトのコレクションの名前を設定します。コレクション名は、ドキュメントに対して実行する XML クエリで使用できます。また、生成されたコレクションには、その名前を使ってアクセスすることもできます。
ExtractNerObjects()	フィールド識別機能に、文書のテキスト内にある NER エンティティを識別するよう指示します。オブジェクトが識別されると、フィールド識別機能では、NerPerson、NerOrg、NerGeo、NerAddress、NerMoney、NerDate という事前定義名を持つコレクションを利用できるようになります。注: NerMoney オブジェクトと NerDate オブジェクトは、抽出スクリプトでのみ使用され、ABBYY FlexiLayout Studio では利用できません。
ExtractWordsFromUserDictionary( userDictionaryName : string, languageName : string )	フィールド識別メカニズムに対し、Document のテキスト内でユーザー辞書の単語を識別するよう指示します。単語は、テキスト内で任意の活用形で出現する場合があります。ユーザー辞書は、スクリプトルールの [Properties] タブで選択できます。辞書には名前でアクセスされます。 languageName パラメーターは、ユーザー辞書内の単語の活用形を生成する言語を指定します。
ParseAddress()	field またはセクション内のテキストを解析し、住所の各構成要素に分割します。
ParseAddressInPosition( resultCollectionNamePrefix : string, startPos : int, endPos : int )	field またはセクション内の、指定した開始位置から終了位置までのテキストフラグメントを住所コンポーネントとして解析します。
ParseAddressInSpan(resultCollectionNamePrefix : string, span : IInterval )	field またはセクション内の指定した区間に含まれるテキストフラグメントを解析し、住所の構成要素に分解します。
PutSpanToField( startPos : int, endPos : int, fieldName : IField )	テキストの部分文字列について、指定した範囲に対応するテキスト断片をドキュメントフィールドに保存します。
PutTextToField( startPos : int, endPos : int, fieldName : IField )	テキストの部分文字列について指定された開始位置と終了位置に対応するテキストフラグメントを、ドキュメント field に保存します。
RunQuery( xmlQuery : string, queryName : string ) : IExtractedObjects	ドキュメントのテキストおよび識別されたテキスト範囲に対して XML クエリを実行します。識別された結果の string を含むテキスト範囲の array として、結果の collection を返します。 queryName parameter ではクエリ名を指定します。この名前は、field 識別メカニズムから結果の collection を取得するために使用できます。
RunQueryAndSaveToField( xmlQuery : string, queryName : string, fieldName : string )	ドキュメントのテキストおよび特定されたテキスト範囲に対して XML クエリを実行し、その結果をドキュメントのfieldに保存します。
SaveSpanToField( span : IInterval, fieldName : string )	テキストの部分文字列について指定した span に対応するテキスト断片を、ドキュメントの field に保存します。重要！このメソッドは、FlexiCapture Release 3 Update 4 以降では廃止されています。FlexiCapture Release 3 Update 4 以降の新規プロジェクトでこのメソッドを使用すると、そのプロジェクトは Exceptions に送られます。
SaveTextToField( startPos : int, endPos : int, fieldName : string )	テキストの部分文字列について指定した開始位置と終了位置に対応するテキストフラグメントを、ドキュメント field に保存します。重要! このメソッドは、FlexiCapture Release 3 Update 4 以降では廃止されています。FlexiCapture Release 3 Update 4 以降の新規プロジェクトでこのメソッドを使用すると、そのプロジェクトは Exceptions に送られます。
ExtractedObjects( collectionName : string, [optional] objectTypeName : VARIANT) : IExtractedObjects	コレクション名で識別されるオブジェクトのコレクションにアクセスできます。住所コンポーネントとして識別される NER オブジェクトのコレクションについては、次のいずれかを行います。 collectionName には、ParseAddress… メソッドに resultCollectionNamePrefix として渡した名前を使用します。さらに、objectTypeName にコレクションの型名 (例: “NerStreet” または “NerCity”) を設定するか、または、objectTypeName をオプション引数として指定せず、collectionName に [resultCollectionNamePrefix ]_[ objectTypeName] を指定します。
QueryResults( queryName : string ) : IExtractedObjects	クエリ名を指定して、XML クエリの結果にアクセスできます。

プロパティ

名前	型	アクセス許可	値
SourceText()	string	読み取り	field の特定メカニズムの適用対象であるDocumentまたは field のテキストです。
SourceNode()	IField	読み取り	field の特定メカニズムの適用対象である field またはセクションです。
SourceDocument()	IDocument	読み取り	SourceNode を含むDocumentです。

オブジェクトの型

IExtractedObjects

⌘I