ABBYY FineReader Engine unterstützt zahlreiche Parameter, mit denen Sie die Engine fein abstimmen können. In den meisten Fällen müssen Sie jedoch nicht alle Werte selbst festlegen: Die Eigenschaften neuer Objekte werden bei ihrer Erstellung auf sinnvolle Standardwerte gesetzt, und für die wichtigsten Anwendungsszenarien stellen wir gut getestete vordefinierte Profile bereit. Wenn Ihr Szenario spezifischer ist und Sie die optimalen Einstellungen für die bestmögliche Verarbeitungsgeschwindigkeit und -qualität ermittelt haben, erstellen Sie ein eigenes Profil. Alle Parameter für Bildvorverarbeitung, Analyse, Erkennung, Synthese und Export lassen sich über ein Profil ändern. Wenn Ihre Anwendung Erkennungsergebnisse beispielsweise im TXT-Format exportiert (reiner Text ohne Formatierung), sind viele layoutbezogene Eigenschaften irrelevant und können deaktiviert werden. Nach dem Laden eines Profils mithilfe der Methoden LoadPredefinedProfile/LoadProfile des Objekts Engine werden die Eigenschaften neu erstellter Objekte auf die im Profil festgelegten Standardwerte gesetzt.”Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Vordefinierte Profile
Geeignet zumExtrahieren von Datenaus einem Dokument und zur Darstellung in einem strukturierten Format. Alle Objekte – einschließlich Tabellen, Bilder, Häkchen und Handschriften – werden zusammen mit ihrer Position und ihren Attributen gespeichert. Dieses Profil eignet sich am besten für die Weiterverarbeitung der extrahierten Daten oder die Integration in andere Anwendungen. | |
Geeignet zumKonvertieren von Dokumentenin ein bearbeitbares Format (z. B. RTF, DOCX). Die Einstellungen wurden auf Genauigkeit optimiert:
| |
Geeignet zumKonvertieren von Dokumentenin ein bearbeitbares Format (z. B. RTF, DOCX). Die Einstellungen wurden auf Verarbeitungsgeschwindigkeit optimiert:
| |
Geeignet zum Erstellen eineselektronischen Archivs(Konvertierung in PDF, PDF/A, PDF und PDF/A mit MRC). Die Einstellungen wurden auf Genauigkeit optimiert:
| |
Geeignet zum Erstellen eineselektronischen Archivs(Konvertierung in PDF, PDF/A, PDF und PDF/A mit MRC). Die Einstellungen wurden auf Verarbeitungsgeschwindigkeit optimiert:
| |
Geeignet zumExtrahieren von Textaus einem Dokument. Die Einstellungen wurden auf Genauigkeit optimiert:
Der Text wird in derselben Reihenfolge extrahiert, in der ein Mensch ihn lesen würde. Dies gewährleistet die Datenkonsistenz beim Einsatz für Training und Verarbeitung mit Natural Language Processing (NLP)-Engines. | |
Geeignet zumExtrahieren von Textaus einem Dokument. Die Einstellungen wurden auf Verarbeitungsgeschwindigkeit optimiert:
Der Text wird in derselben Reihenfolge extrahiert, in der ein Mensch ihn lesen würde. Dies gewährleistet die Datenkonsistenz beim Einsatz für Training und Verarbeitung mit Natural Language Processing (NLP)-Engines. | |
Geeignet fürdie Erkennung kurzer Textfragmente. Derzeit verwendet dieses Profil die Standardeinstellungen. | |
Geeignet fürdie Barcode-Extraktion. Es werden nur Barcodes extrahiert (Texte, Bilder oder Tabellen werden nicht erkannt). Die Einstellungen sind auf Genauigkeit optimiert. Aus Kompatibilitätsgründen können Sie auch unter dem Namen BarcodeRecognition auf dieses Profil zugreifen. | |
Geeignet fürdie Barcode-Extraktion. Es werden nur Barcodes extrahiert (Texte, Bilder oder Tabellen werden nicht erkannt). Die Einstellungen sind auf Verarbeitungsgeschwindigkeit optimiert. | |
Geeignet zum Erstellen hoch komprimierter PDF-Dateien, die vollständige Dokumente als Bilder enthalten. Dabei werden die folgenden Einstellungen verwendet:
| |
Geeignet fürdie Erkennung von Visitenkarten. Dabei werden die folgenden Einstellungen verwendet:
| |
Geeignet fürdie Extraktion von Daten aus einer maschinenlesbaren Zone(MRZ). Dabei werden die folgenden Einstellungen verwendet:
| |
Geeignet für die Erkennung technischer Zeichnungen. Dabei werden die große Größe und Komplexität technischer Diagramme sowie die Möglichkeit unterschiedlicher Textausrichtungen innerhalb des Bildes berücksichtigt. Das Profil ist für die Konvertierung solcher Bilder in ein durchsuchbares PDF vorgesehen. Dabei werden die folgenden Einstellungen verwendet:
| |
Setzt alle Verarbeitungsparameter auf die Standardwerte. |
- FRE-Benutzer unter Linux finden die vordefinierten Profildateien im Distributionspaket im Ordner Bin Libraries.
- FRE-Benutzer unter macOS finden die vordefinierten Profildateien im Distributionspaket im Ordner /PredefinedProfiles.
- Um mithilfe der Datei FREngineDistribution.csv zu ermitteln, welche Ressourcendateien für die Funktionsfähigkeit Ihrer Anwendung erforderlich sind, lesen Sie die Seite zu dem von Ihnen gewählten Szenario.
Benutzerprofile
- Boolesche Eigenschaftswerte werden als Zeichenfolgen dargestellt: true oder false.
- Eigenschaftswerte von Aufzählungstypen werden durch Konstantennamen dargestellt.
- String-Eigenschaftswerte werden ohne Anführungszeichen geschrieben.
- PrepareImageMode
- ImageProcessingParams
- DocumentProcessingParams
- PageProcessingParams
- PagePreprocessingParams
- PageAnalysisParams
- TableAnalysisParams
- TextLayerInjectionParams
- BarcodeParams
- ObjectsExtractionParams
- RecognizerParams1
- SortingBlocksParams
- SynthesisParamsForPage
- SynthesisParamsForDocument
- DocumentStructureDetectionParams
- FontFormattingDetectionParams
- JpegExtendedParams
- TiffExtendedParams
- PngExtendedParams
- EmptyPageDetectionParams
- RTFExportParams
- HTMLExportParams
- XLExportParams
- TextExportParams
- PPTExportParams
- XMLExportParams
- AltoExportParams
- JsonExportParams
- EBookExportParams
- XPSExportParams
- PDFExportParams
- PDFExportFeatures
- PDFEncryptionInfo
- PaperSizeParams2
- PictureExportParams2
- DocumentContentInfoWritingParams3
- PDFPictureCompressionParams
- PDFMRCParams
- MrzJsonExportParams
- MrzXmlExportParams
- ComparisonParams
- PageMargins4
DocumentContentInfoWritingParams festzulegen, geben Sie die Parameter direkt im Abschnitt des übergeordneten Objekts an. Für das PDF-Format ist dies das Objekt PDFExportFeatures; für andere Formate ist es das entsprechende Objekt für die Exportparameter. So können Sie für verschiedene Exportformate unterschiedliche Einstellungen für die Inhaltsinformationen festlegen. Wenn Sie beispielsweise den Dokumentautor nicht in die ausgegebenen PDF-Dateien schreiben möchten, fügen Sie die folgenden Zeilen in das Profil ein:
PageMargins-Objekts festzulegen, geben Sie die Parameter direkt im Abschnitt des übergeordneten Objekts an. Beachten Sie, dass die auf TRUE gesetzte Eigenschaft UseCustomPageMargins vor den Werten für die Seitenränder angegeben werden muss:
