RecognizerParams-Objekt (IRecognizerParams-Schnittstelle)

Mit diesem Objekt können Sie die Erkennungsparameter anpassen. Jeder Textblock und jede Tabellenzelle im Layout besitzt ein eigenes untergeordnetes Objekt vom Typ RecognizerParams. Außerdem wird dieses Objekt als Unterobjekt des Objekts PageProcessingParams an die Layoutanalyse-/Erkennungsfunktionen von ABBYY FineReader Engine übergeben. Die Erkennungsfunktionen verwenden die Erkennungsparameter, die in den untergeordneten Objekten vom Typ RecognizerParams der Textblöcke und Tabellenzellen definiert sind. Wenn während der Layoutanalyse ein Textblock oder eine Tabellenzelle erstellt wird, werden die Eigenschaften des zugehörigen untergeordneten Objekts vom Typ RecognizerParams mit den Werten der Eigenschaften des Objekts RecognizedParams initialisiert, das an die Analysefunktion übergeben wurde. Die Eigenschaften eines Unterobjekts des Blocks, das mit der Methode AddNew des Objekts LayoutBlocks erstellt wird, werden auf sinnvolle Standardwerte gesetzt. Informationen zum Standardwert einer bestimmten Eigenschaft finden Sie in ihrer Beschreibung. Das RecognizerParams-Objekt ist ein persistentes Objekt. Das bedeutet, dass der aktuelle Zustand des Objekts in persistentem Speicher abgelegt werden kann. Später kann das Objekt durch Lesen seines Zustands aus dem persistenten Speicher erneut erstellt werden. Die folgenden Methoden ermöglichen die Persistenz des Objekts: Linux: SaveToFile und LoadFromFile Windows: SaveToFile, LoadFromFile, SaveToMemory und LoadFromMemory.

Eigenschaften


	,read-only	Gibt das Engine-Objekt zurück.

		Gibt die für die Erkennung zu verwendende Sprache an. Diese Eigenschaft lässt sich einfach über dieMethode festlegen. Die Eigenschaft gibt ein konstantes Objekt zurück. Um die Erkennungssprache zu ändern, müssen Sie zunächst ein intermediäres TextLanguage-Objekt mithilfe einer geeigneten Erstellungsmethode abrufen, die erforderlichen Parameter ändern und das erhaltene Objekt anschließend der Eigenschaft zuweisen. Standardmäßig wird dieser Parameter mit der englischen Sprache initialisiert.
		Steuert die automatische Spracherkennung. Wenn die automatische Spracherkennung aktiviert ist, wird die Erkennungssprache für jedes Wort im Text ermittelt. Sie wird aus der Liste der in der Eigenschaft TextLanguage angegebenen Sprachen ausgewählt. Die automatische Erkennung ist für die Verarbeitung von Dokumenten gedacht, deren Sprache nicht bekannt ist. Die automatische Spracherkennung funktioniert nur mit vordefinierten Sprachen (die vollständige Liste finden Sie unterVordefinierte Sprachen in ABBYY FineReader Engine). Wenn Sie sicher wissen, dass alle angegebenen Sprachen im Dokument vorhanden sind, ist die automatische Erkennung überflüssig. Deaktivieren Sie sie, indem Sie diese Eigenschaft auf TSPV_No setzen. Die Liste der im erkannten Dokument oder auf der erkannten Seite erkannten Sprachen können Sie über die Eigenschaft DetectedLanguages desoderObjekts abrufen. Standardmäßig ist der Wert dieser Eigenschaft TSPV_Auto.
		Der Wert dieser Eigenschaft ist eine ODER-Verknüpfung derEnumerationskonstanten, die mögliche Texttypen für die Erkennung bezeichnen. Wenn die Eigenschaft beispielsweise auf TT_Normal \| TT_Index gesetzt ist, geht ABBYY FineReader Engine davon aus, dass der Text ausschließlich gewöhnlichen typografischen Text und Ziffern im PLZ-Stil enthält, und ignoriert alle anderen Varianten. Siehe auchUsing Text Type Autodetection. Hinweise: Wenn diese Eigenschaft einer beliebigen Kombination aus TT_Matrix, TT_Typewriter, TT_OCR_A und TT_OCR_B entspricht, werden kursive Schriftarten und Hoch-/Tiefstellungen nicht erkannt, unabhängig von den Werten der Eigenschaften ProhibitItalic, ProhibitSubscript und ProhibitSuperscript. Wenn diese Eigenschaft auf TT_Handwritten gesetzt ist, kann die Ausrichtung des Bildes nicht korrigiert werden. Unter Windows: Wenn diese Eigenschaft auf TT_Handwritten oder TT_Index gesetzt ist, kann die Eigenschaft TrainUserPatterns nicht auf TRUE gesetzt werden. Wenn die Eigenschaft TrainUserPatterns auf TRUE gesetzt ist, darf die Eigenschaft TextTypes nur einen Texttyp enthalten. Standardmäßig ist diese Eigenschaft auf TT_Normal gesetzt.
		Gibt an, dass der Texttyp für jeden Textblock separat bestimmt werden soll. Diese Einstellung ist nützlich, wenn verhältnismäßig kleine Textblöcke mit unterschiedlichen Texttypen vorhanden sind, kann die Verarbeitung jedoch geringfügig verlangsamen. Der Standardwert dieser Eigenschaft ist FALSE.

		Gibt den Erkennungsmodus an, der auf die Zieldokumente angewendet werden soll. Jeder Modus bietet ein eigenes Verhältnis von Erkennungsgeschwindigkeit und -genauigkeit, um bei Bildern und Dokumenten mit unterschiedlichen Besonderheiten zufriedenstellende Ergebnisse zu erzielen. Standardmäßig ist diese Eigenschaft auf RM_Normal gesetzt. Im genauen Modus werden stets integrierte Muster verwendet. Um die Verwendung der integrierten Muster zu deaktivieren, wechseln Sie in den normalen Modus (RM_Normal).

		Gibt an, ob Text auf einem Bild mit niedriger Auflösung erkannt wird. Diese Eigenschaft ist nützlich beim Erkennen von Faxen, Kleindrucken sowie Bildern mit niedriger Auflösung oder schlechter Druckqualität. Standardmäßig ist der Wert dieser Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, davon auszugehen, dass der Text in dem Block, zu dem das aktuelle RecognizerParams-Objekt gehört, nicht mehr als eine Zeile enthält. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, davon auszugehen, dass keine Textzeile mehr als ein Wort enthalten kann, sodass die Textzeilen jeweils als einzelnes Wort erkannt werden. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine kursiv gedruckten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine kursiven Buchstaben enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild kursive Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine tiefgestellten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine tiefgestellten Zeichen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild tiefgestellte Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine hochgestellten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine hochgestellten Zeichen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild hochgestellte Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, wird die Erkennung von Zeilentrennungen unterbunden. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine Trennungen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind im erkannten Block Trennungen vorhanden und diese Eigenschaft auf TRUE gesetzt, werden die getrennten Wörter falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine Kapitälchen zu erkennen. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, geht ABBYY FineReader Engine davon aus, dass Text aus einem Block nicht in den nächsten Block übernommen werden kann. Standardmäßig ist diese Eigenschaft FALSE.
		Diese Eigenschaft legt den Modus der Groß-/Kleinschreibungserkennung fest. Standardmäßig ist der Wert dieser Eigenschaft CRM_AutoCase, was der automatischen Groß-/Kleinschreibungserkennung entspricht.
		Diese Eigenschaft legt den Markierungstyp um Buchstaben fest (z. B. Unterstreichung, Rahmen, Kästchen usw.). Für Markierungstypen, bei denen sich jeder Buchstabe in einer separaten Zelle befindet, verwenden Sie die Eigenschaft CellsCount, um die Anzahl der Zeichenzellen für einen erkannten Block festzulegen. Standardmäßig ist der Wert dieser Eigenschaft FMT_SimpleText, was bedeutet, dass keine Markierung verwendet wird.
		Gibt die Anzahl der Zeichenzellen im Block an. Dies ist nur für die Feldmarkierungstypen (die Eigenschaft FieldMarkingType) relevant, bei denen jeder Buchstabe in einer separaten Zelle steht. Der Standardwert dieser Eigenschaft ist 1. Sie sollten jedoch den passenden Wert festlegen, um den Text korrekt zu erkennen.

Nur Windows.		Diese Eigenschaft gibt an, ob benutzerdefinierte Muster während der Erkennung trainiert werden sollen. Das DialogfeldMusterschulungwird während der Erkennung angezeigt. Damit der Musterschulungsprozess korrekt funktioniert, ist Folgendes erforderlich: Legen Sie den Wert des HWND-Handles des übergeordneten Fensters fest (Eigenschaft) Geben Sie eine benutzerdefinierte Musterdatei in der Eigenschaft UserPatternsFile an Siehe auchRecognizing with Training. Wenn diese Eigenschaft auf TRUE gesetzt ist: darf die Eigenschaft TextTypes nur einen Texttyp enthalten, und dieser Texttyp darf nicht TT_Handwritten oder TT_Index sein darf die Eigenschaftdes Objekts PagePreprocessingParams nicht auf TRUE gesetzt werden Musterschulung wird für Chinesisch, Japanisch und Koreanisch nicht unterstützt. Standardmäßig ist diese Eigenschaft FALSE.
		Wenn diese Eigenschaft auf TRUE gesetzt ist, verwendet ABBYY FineReader Engine seine eigenen integrierten Muster zur Erkennung. Muster sind Dateien, die die Beziehung zwischen einem Zeichenbild und dem jeweiligen Zeichen definieren. Setzen Sie diese Eigenschaft auf FALSE, wenn Sie die standardmäßigen ABBYY FineReader Engine-Muster für die Zeichenerkennung nicht verwenden möchten, sondern ausschließlich benutzerdefinierte Muster. Dies kann bei der Erkennung von Text mit dekorativen oder nicht standardmäßigen Schriftarten hilfreich sein. In diesem Fall empfiehlt es sich, die integrierten Muster von ABBYY FineReader Engine nicht zu verwenden, sondern eigene benutzerdefinierte Muster einzusetzen, die für diese Schriftarten trainiert wurden. Der Pfad zur benutzerdefinierten Musterdatei wird in der Eigenschaft UserPatternsFile gespeichert. Wenn die Eigenschaft UserPatternsFile leer ist, wird die Eigenschaft UseBuiltInPatterns ignoriert. Für Windows siehe auchRecognizing with Training. Standardmäßig ist diese Eigenschaft TRUE. Diese Eigenschaft kann im normalen und schnellen Erkennungsmodus auf FALSE gesetzt werden. Für den genauen Modus kann die Verwendung der integrierten Muster nicht deaktiviert werden (siehe Beschreibung der EigenschaftMode).
		Enthält den vollständigen Pfad zur Benutzermusterdatei, die für die Erkennung verwendet wird. Wenn der Wert dieser Eigenschaft nicht leer ist, werden die Informationen aus der Benutzermusterdatei während der Erkennung verwendet. Wenn die Eigenschaft UseBuiltInPatterns FALSE ist – d. h. während der Erkennung werden keine Standard-ABBYY FineReader Engine-Muster verwendet –, muss diese Eigenschaft einen Pfad zu einer benutzerdefinierten Musterdatei enthalten, da ausschließlich die darin gespeicherten Informationen verwendet werden. Für Windows siehe auchRecognizing with Training. Standardmäßig enthält diese Eigenschaft eine leere Zeichenfolge. Benutzermusterdateien, die in ABBYY FineReader Engine 10 oder früher erstellt wurden, können in FineReader Engine 12 Release 6 oder höher nicht geöffnet werden. Um sie weiterhin verwenden zu können, speichern Sie die älteren Benutzermusterdateien im neuen Format: Verwenden Sie FineReader Engine 11 oder FineReader Engine 12 Release 5 oder früher. Rufen Sie die Methodedes-Objekts auf und übergeben Sie eine string-Sammlung mit dem Namen der älteren Musterdatei sowie dem vollständigen Pfad zur neuen Datei.

		Gibt an, ob bei unsicher erkannten Zeichen die Eigenschaft IsSuspicious auf TRUE gesetzt werden soll. Der Name der Eigenschaft spiegelt wider, dass ABBYY FineReader verdächtige Zeichen im Text farblich hinterlegt, was die manuelle Überprüfung durch den Benutzer erleichtert. Standardmäßig ist diese Eigenschaft TRUE.
		Diese Eigenschaft ist veraltet und wird in zukünftigen Versionen entfernt.
		Gibt an, ob die genauen Zeichenbereiche () gespeichert werden. Der Standardwert ist FALSE.
		Gibt an, ob die Erkennungsvarianten von Zeichen gespeichert werden. Die EigenschaftICharParams::CharacterRecognitionVariantsgibt eine Sammlung von Erkennungsvarianten für ein Zeichen zurück. Siehe auchUsing Voting API. Der Standardwert ist FALSE.
		Gibt an, ob die Erkennungsvarianten eines Wortes gespeichert werden. Die MethodeIParagraph::GetWordRecognitionVariantsund die EigenschaftICharParams::WordRecognitionVariantsgeben eine Sammlung von Erkennungsvarianten für ein Wort zurück. Siehe auchUsing Voting API. Der Standardwert ist FALSE.

Methoden

Name	Beschreibung
CopyFrom	Initialisiert die Eigenschaften des aktuellen Objekts mit den Werten entsprechender Eigenschaften eines anderen Objekts.
LoadFromFile	Stellt den Inhalt des Objekts aus einer Datei auf dem Datenträger wieder her.
LoadFromMemory Hinweis: Nur unter Windows.	Stellt den Inhalt des Objekts aus dem globalen Speicher wieder her.
SaveToFile	Speichert den Inhalt des Objekts in einer Datei auf dem Datenträger.
SaveToMemory Hinweis: Nur unter Windows.	Speichert den Inhalt des Objekts im globalen Speicher.
SetPredefinedTextLanguage	Legt als Erkennungssprache eine der vordefinierten Sprachen von ABBYY FineReader Engine fest.

Objektdiagramm

Ausgabeparameter

Dieses Objekt ist der Ausgabeparameter der Methode CreateRecognizerParams des Engine-Objekts.

Eingabeparameter

Dieses Objekt wird als Eingabeparameter an die folgenden Methoden übergeben:

Preprocess, PreprocessPages, Analyze, AnalyzePages des Objekts FRDocument
Preprocess, Analyze, AnalyzeRegion, AnalyzeTable, IsEmpty des Objekts FRPage

Beispiele

C#-Code

FREngine.IEngine engine;
string fileName;
// Benutzermuster während der Erkennung trainieren
FREngine.IDocumentProcessingParams processingParams = Engine.CreateDocumentProcessingParams();
FREngine.IRecognizerParams recognizerParams = processingParams.PageProcessingParams.RecognizerParams;
Engine.CreateEmptyUserPattern( fileName );
Engine.MultiProcessingParams.MultiProcessingMode = FREngine.MultiProcessingModeEnum.MPM_Sequential;
recognizerParams.UserPatternsFile = fileName;
recognizerParams.TrainUserPatterns = true;
Document.Process(processingParams);

Das Objekt wird in den folgenden Codebeispielen verwendet:

Linux: CustomLanguage, CommandLineInterface
Windows: CustomLanguage, CommandLineInterface sowie in den Demo-Tools: BatchProcessingRecognition, Classification, MultiProcessingRecognition, PDFExportProfiles, User Pattern Training Utility

Siehe auch

Parameter für die Feinabstimmung der Vorverarbeitung, Analyse, Erkennung und Synthese Erkennung handschriftlicher Texte PageProcessingParams TextBlock Arbeiten mit Eigenschaften

​Eigenschaften

​Methoden

​Verwandte Objekte

​Ausgabeparameter

​Eingabeparameter

​Beispiele

​Siehe auch