Eigenschaften
Gibt das Engine-Objekt zurück. | ||
Gibt die für die Erkennung zu verwendende Sprache an. Diese Eigenschaft lässt sich einfach über dieMethode festlegen. Die Eigenschaft gibt ein konstantes Objekt zurück. Um die Erkennungssprache
zu ändern, müssen Sie zunächst ein intermediäres TextLanguage-Objekt
mithilfe einer geeigneten Erstellungsmethode abrufen, die erforderlichen Parameter
ändern und das erhaltene Objekt anschließend der Eigenschaft zuweisen. Standardmäßig wird dieser Parameter mit der englischen Sprache initialisiert. | ||
Steuert die automatische Spracherkennung. Wenn die automatische Spracherkennung aktiviert ist, wird die Erkennungssprache für jedes Wort im Text ermittelt. Sie wird aus der Liste der in der Eigenschaft TextLanguage angegebenen Sprachen ausgewählt. Die automatische Erkennung ist für die Verarbeitung von Dokumenten gedacht, deren Sprache nicht bekannt ist. Wenn Sie sicher wissen, dass alle angegebenen Sprachen im Dokument vorhanden sind, ist die automatische Erkennung überflüssig. Deaktivieren Sie sie, indem Sie diese Eigenschaft auf TSPV_No setzen. Die Liste der im erkannten Dokument oder auf der erkannten Seite erkannten Sprachen können Sie über die Eigenschaft DetectedLanguages desoderObjekts abrufen. Standardmäßig ist der Wert dieser Eigenschaft TSPV_Auto. | ||
Der Wert dieser Eigenschaft ist eine ODER-Verknüpfung derEnumerationskonstanten, die mögliche Texttypen für die Erkennung bezeichnen. Wenn die Eigenschaft beispielsweise auf TT_Normal | TT_Index gesetzt ist, geht ABBYY FineReader Engine davon aus, dass der Text ausschließlich gewöhnlichen typografischen Text und Ziffern im PLZ-Stil enthält, und ignoriert alle anderen Varianten. Siehe auchUsing Text Type Autodetection. Hinweise:
Standardmäßig ist diese Eigenschaft auf TT_Normal gesetzt. | ||
Gibt an, dass der Texttyp für jeden Textblock separat bestimmt werden soll. Diese Einstellung ist nützlich, wenn verhältnismäßig kleine Textblöcke mit unterschiedlichen Texttypen vorhanden sind, kann die Verarbeitung jedoch geringfügig verlangsamen. Der Standardwert dieser Eigenschaft ist FALSE. | ||
Gibt den Erkennungsmodus an, der auf die Zieldokumente angewendet werden soll. Jeder Modus bietet ein eigenes Verhältnis von Erkennungsgeschwindigkeit und -genauigkeit, um bei Bildern und Dokumenten mit unterschiedlichen Besonderheiten zufriedenstellende Ergebnisse zu erzielen. Standardmäßig ist diese Eigenschaft auf RM_Normal gesetzt. | ||
Gibt an, ob Text auf einem Bild mit niedriger Auflösung erkannt wird. Diese Eigenschaft ist nützlich beim Erkennen von Faxen, Kleindrucken sowie Bildern mit niedriger Auflösung oder schlechter Druckqualität. Standardmäßig ist der Wert dieser Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, davon auszugehen, dass der Text in dem Block, zu dem das aktuelle RecognizerParams-Objekt gehört, nicht mehr als eine Zeile enthält. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, davon auszugehen, dass keine Textzeile mehr als ein Wort enthalten kann, sodass die Textzeilen jeweils als einzelnes Wort erkannt werden. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine kursiv gedruckten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine kursiven Buchstaben enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild kursive Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine tiefgestellten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine tiefgestellten Zeichen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild tiefgestellte Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine hochgestellten Buchstaben zu erkennen. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine hochgestellten Zeichen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind auf dem Bild hochgestellte Buchstaben vorhanden und diese Eigenschaft auf TRUE gesetzt, werden diese Buchstaben falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, wird die Erkennung von Zeilentrennungen unterbunden. Dies ist nützlich, wenn ein Text erkannt wird, der voraussichtlich keine Trennungen enthält – in diesem Fall kann die Erkennung beschleunigt werden. Sind im erkannten Block Trennungen vorhanden und diese Eigenschaft auf TRUE gesetzt, werden die getrennten Wörter falsch erkannt. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, weist sie ABBYY FineReader Engine an, keine Kapitälchen zu erkennen. Standardmäßig ist diese Eigenschaft FALSE. | ||
Wenn diese Eigenschaft auf TRUE gesetzt ist, geht ABBYY FineReader Engine davon aus, dass Text aus einem Block nicht in den nächsten Block übernommen werden kann. Standardmäßig ist diese Eigenschaft FALSE. | ||
Diese Eigenschaft legt den Modus der Groß-/Kleinschreibungserkennung fest. Standardmäßig ist der Wert dieser Eigenschaft CRM_AutoCase, was der automatischen Groß-/Kleinschreibungserkennung entspricht. | ||
Diese Eigenschaft legt den Markierungstyp um Buchstaben fest (z. B. Unterstreichung, Rahmen, Kästchen usw.). Für Markierungstypen, bei denen sich jeder Buchstabe in einer separaten Zelle befindet, verwenden Sie die Eigenschaft CellsCount, um die Anzahl der Zeichenzellen für einen erkannten Block festzulegen. Standardmäßig ist der Wert dieser Eigenschaft FMT_SimpleText, was bedeutet, dass keine Markierung verwendet wird. | ||
Gibt die Anzahl der Zeichenzellen im Block an. Dies ist nur für die Feldmarkierungstypen (die Eigenschaft FieldMarkingType) relevant, bei denen jeder Buchstabe in einer separaten Zelle steht. Der Standardwert dieser Eigenschaft ist 1. Sie sollten jedoch den passenden Wert festlegen, um den Text korrekt zu erkennen. | ||
Nur Windows. | Diese Eigenschaft gibt an, ob benutzerdefinierte Muster während der Erkennung trainiert werden sollen. Das DialogfeldMusterschulungwird während der Erkennung angezeigt. Damit der Musterschulungsprozess korrekt funktioniert, ist Folgendes erforderlich:
Siehe auchRecognizing with Training. Wenn diese Eigenschaft auf TRUE gesetzt ist:
Musterschulung wird für Chinesisch, Japanisch und Koreanisch nicht unterstützt. Standardmäßig ist diese Eigenschaft FALSE. | |
Wenn diese Eigenschaft auf TRUE gesetzt ist, verwendet ABBYY FineReader Engine seine eigenen integrierten Muster zur Erkennung. Muster sind Dateien, die die Beziehung zwischen einem Zeichenbild und dem jeweiligen Zeichen definieren. Setzen Sie diese Eigenschaft auf FALSE, wenn Sie die standardmäßigen ABBYY FineReader Engine-Muster für die Zeichenerkennung nicht verwenden möchten, sondern ausschließlich benutzerdefinierte Muster. Dies kann bei der Erkennung von Text mit dekorativen oder nicht standardmäßigen Schriftarten hilfreich sein. In diesem Fall empfiehlt es sich, die integrierten Muster von ABBYY FineReader Engine nicht zu verwenden, sondern eigene benutzerdefinierte Muster einzusetzen, die für diese Schriftarten trainiert wurden. Der Pfad zur benutzerdefinierten Musterdatei wird in der Eigenschaft UserPatternsFile gespeichert. Wenn die Eigenschaft UserPatternsFile leer ist, wird die Eigenschaft UseBuiltInPatterns ignoriert. Für Windows siehe auchRecognizing with Training. Standardmäßig ist diese Eigenschaft TRUE. | ||
Enthält den vollständigen Pfad zur Benutzermusterdatei, die für die Erkennung verwendet wird. Wenn der Wert dieser Eigenschaft nicht leer ist, werden die Informationen aus der Benutzermusterdatei während der Erkennung verwendet. Wenn die Eigenschaft UseBuiltInPatterns FALSE ist – d. h. während der Erkennung werden keine Standard-ABBYY FineReader Engine-Muster verwendet –, muss diese Eigenschaft einen Pfad zu einer benutzerdefinierten Musterdatei enthalten, da ausschließlich die darin gespeicherten Informationen verwendet werden. Für Windows siehe auchRecognizing with Training. Standardmäßig enthält diese Eigenschaft eine leere Zeichenfolge.
| ||
Gibt an, ob bei unsicher erkannten Zeichen die Eigenschaft IsSuspicious auf TRUE gesetzt werden soll. Der Name der Eigenschaft spiegelt wider, dass ABBYY FineReader verdächtige Zeichen im Text farblich hinterlegt, was die manuelle Überprüfung durch den Benutzer erleichtert. Standardmäßig ist diese Eigenschaft TRUE. | ||
Diese Eigenschaft ist veraltet und wird in zukünftigen Versionen entfernt. | ||
Gibt an, ob die genauen Zeichenbereiche () gespeichert werden. Der Standardwert ist FALSE. | ||
Gibt an, ob die Erkennungsvarianten von Zeichen gespeichert werden. Die EigenschaftICharParams::CharacterRecognitionVariantsgibt eine Sammlung von Erkennungsvarianten für ein Zeichen zurück.
Siehe auchUsing Voting API. Der Standardwert ist FALSE. | ||
Gibt an, ob die Erkennungsvarianten eines Wortes gespeichert werden. Die MethodeIParagraph::GetWordRecognitionVariantsund die EigenschaftICharParams::WordRecognitionVariantsgeben eine Sammlung von Erkennungsvarianten für ein Wort zurück. Siehe
auchUsing Voting API. Der Standardwert ist FALSE. | ||
Methoden
| Name | Beschreibung |
|---|---|
| CopyFrom | Initialisiert die Eigenschaften des aktuellen Objekts mit den Werten entsprechender Eigenschaften eines anderen Objekts. |
| LoadFromFile | Stellt den Inhalt des Objekts aus einer Datei auf dem Datenträger wieder her. |
| LoadFromMemory <Note> Nur unter Windows. </Note> | Stellt den Inhalt des Objekts aus dem globalen Speicher wieder her. |
| SaveToFile | Speichert den Inhalt des Objekts in einer Datei auf dem Datenträger. |
| SaveToMemory <Note> Nur unter Windows. </Note> | Speichert den Inhalt des Objekts im globalen Speicher. |
| SetPredefinedTextLanguage | Legt als Erkennungssprache eine der vordefinierten Sprachen von ABBYY FineReader Engine fest. |
Objektdiagramm
Ausgabeparameter
Eingabeparameter
- Preprocess, PreprocessPages, Analyze, AnalyzePages des Objekts FRDocument
- Preprocess, Analyze, AnalyzeRegion, AnalyzeTable, IsEmpty des Objekts FRPage
Beispiele
C#-Code
C#-Code
- Linux: CustomLanguage, CommandLineInterface
- Windows: CustomLanguage, CommandLineInterface sowie in den Demo-Tools: BatchProcessingRecognition, Classification, MultiProcessingRecognition, PDFExportProfiles, User Pattern Training Utility
