IFieldExtractor - ABBYY Documentation

Zweck

Dient zum Identifizieren von Feldern im Text eines Dokuments.

Kann nur in einem Extraktionsskript geändert werden.

Methoden


ExtractRegularExpression( regularExpression : string, resultCollectionName : string )	Gibt einen regulären Ausdruck zum Identifizieren von Textbereichen an. Der Parameter resultCollectionName legt einen Namen für die resultierende Sammlung von Objekten fest. Der Name der Sammlung kann in XML-Abfragen verwendet werden, die auf Dokumenten ausgeführt werden. Sie können auch über ihren Namen auf die resultierende Sammlung zugreifen.
ExtractNerObjects()	Veranlasst die Felderkennung, NER-Entitäten im Text eines Dokuments zu identifizieren. Sobald die Objekte identifiziert wurden, stehen der Felderkennung Sammlungen mit den folgenden vordefinierten Namen zur Verfügung: NerPerson, NerOrg, NerGeo, NerAddress, NerMoney und NerDate. Hinweis: Die Objekte NerMoney und NerDate werden nur in Extraktionsskripten verwendet und sind in ABBYY FlexiLayout Studio nicht verfügbar.
ExtractWordsFromUserDictionary( userDictionaryName : string, languageName : string )	Weist den Mechanismus zur Feldidentifikation an, Wörter aus einem Benutzerwörterbuch im Text eines Dokuments zu identifizieren. Die Wörter können im Text in beliebiger flektierter Form vorkommen. Ein Benutzerwörterbuch kann auf der Registerkarte Properties der Skriptregel ausgewählt werden. Auf das Wörterbuch wird über seinen Namen zugegriffen. Der Parameter languageName gibt die Sprache an, in der die flektierten Formen der Wörter im Benutzerwörterbuch erzeugt werden.
ParseAddress()	Zerlegt den Text in einem Feld oder Abschnitt in Adresskomponenten.
ParseAddressInPosition( resultCollectionNamePrefix : string, startPos : int, endPos : int )	Parst das Textfragment zwischen den angegebenen Start- und Endpositionen in einem Feld oder Abschnitt und zerlegt es in Adresskomponenten.
ParseAddressInSpan(resultCollectionNamePrefix : string, span : IInterval )	Analysiert das Textfragment innerhalb eines angegebenen Intervalls in einem Feld oder Abschnitt und zerlegt es in Adresskomponenten.
PutSpanToField( startPos : int, endPos : int, fieldName : IField )	Speichert das Textfragment, das der für einen Textteil angegebenen Spanne entspricht, in einem Dokumentfeld.
PutTextToField( startPos : int, endPos : int, fieldName : IField )	Speichert das Textfragment, das den angegebenen Start- und Endpositionen eines Textausschnitts entspricht, in einem Dokumentfeld.
RunQuery( xmlQuery : string, queryName : string ) : IExtractedObjects	Führt eine XML-Abfrage für den Text eines Dokuments und die identifizierten Textspannen aus. Gibt eine Sammlung von Ergebnissen als Array von Textspannen zurück, die die identifizierten Ergebnis-Strings enthalten. Der Parameter queryName gibt einen Namen für die Abfrage an, der dann verwendet werden kann, um die resultierende Sammlung über den Mechanismus zur Feldidentifizierung abzurufen.
RunQueryAndSaveToField( xmlQuery : string, queryName : string, fieldName : string )	Führt eine XML-Abfrage für den Text eines Dokuments und die identifizierten Textbereiche aus und speichert die Ergebnisse in einem Dokumentfeld.
SaveSpanToField( span : IInterval, fieldName : string )	Speichert das dem für eine Textteilzeichenfolge angegebenen span entsprechende Textfragment in einem Dokumentfeld. Wichtig! Diese Methode ist in FlexiCapture Release 3 Update 4 und höher veraltet. Wenn diese Methode in neuen Projekten mit FlexiCapture Release 3 Update 4 und höher verwendet wird, werden solche Projekte an Exceptions gesendet.
SaveTextToField( startPos : int, endPos : int, fieldName : string )	Speichert das durch die angegebenen Start- und Endpositionen definierte Textfragment in einem Dokumentfeld. Wichtig! Diese Methode ist ab FlexiCapture Release 3 Update 4 veraltet. Wenn diese Methode in neuen Projekten mit FlexiCapture Release 3 Update 4 oder höher verwendet wird, werden diese Projekte an Exceptions gesendet.
ExtractedObjects( collectionName : string, [optional] objectTypeName : VARIANT) : IExtractedObjects	Ermöglicht den Zugriff auf eine Sammlung identifizierter Objekte über den Namen der Sammlung. Gehen Sie bei Sammlungen von NER-Objekten, die als Adresskomponenten identifiziert wurden, auf eine der folgenden Arten vor: Verwenden Sie für collectionName den Namen, der als resultCollectionNamePrefix an die ParseAddress…-Methoden übergeben wird. Setzen Sie außerdem objectTypeName auf den Namen des Typs der Sammlung (z. B. “NerStreet” oder “NerCity”), oder Geben Sie collectionName als [resultCollectionNamePrefix ]_[ objectTypeName] an, ohne objectTypeName als optionales Argument anzugeben.
QueryResults( queryName : string ) : IExtractedObjects	Ermöglicht den Zugriff auf das Ergebnis einer XML-Abfrage über den Namen der Abfrage.

Eigenschaften

Name	Typ	Berechtigungen	Wert
SourceText()	string	Lesen	Der Text des Dokuments oder Felds, auf den der Mechanismus zur Feldidentifikation angewendet wird.
SourceNode()	IField	Lesen	Das Feld oder der Abschnitt, auf den der Mechanismus zur Feldidentifikation angewendet wird.
SourceDocument()	IDocument	Lesen	Das Dokument, das SourceNode enthält.

IExtractedObjects

⌘I