Release 7
Sicherheitsbehebungen
Vordefinierte Profile
Bildöffnung und Vorverarbeitung
- Um die Bildvorbereitung zu beschleunigen, können Sie den Dokumenttyp (IPrepareImageMode::DocumentType) festlegen, wenn er bekannt ist, sodass kein Dokumentklassifizierer ausgeführt werden muss.
- Neue Eingabeformate: HEIF, SVG, WebP.
- Dokumenttyp für technische Zeichnungen mit vielen Textfragmenten in verschiedenen Richtungen (DocumentTypeEnum::DT_TechnicalDrawing).
Export
- Die aus dem Document extrahierten Daten können nun in das JSON-Format exportiert werden (JsonExportParams).
OCR- und ICR-Verbesserungen
- Häkchen können jetzt bei der Layout-Analyse erkannt werden (IPageAnalysisParams::DetectCheckmarks)
- Spezieller Analysemodus für Dokumente mit komplexem Layout und Tabellen (IPageAnalysisParams::AnalysisMode)
- Mit einer neuen Einstellung können Stempel als Bilder gespeichert werden (IPageAnalysisParams::DetectStamps)
- Zusätzlich zu handschriftlich in Druckbuchstaben geschriebenem Text wird auch kursiver handschriftlicher Text für Englisch, Spanisch, Französisch, Deutsch und Japanisch erkannt (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- Eine neue, wahrscheinlichkeitbasierte Eigenschaft schätzt die Genauigkeit der Zeichenerkennung (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Windows Code-Beispiele
- Neues HelloBCR-Beispiel für .NET Core
- Neues DataExtraction-Beispiel für .NET Core
Release 5
Neue und verbesserte Spracherkennung
- Spracherkennung für Bangla
- Spracherkennung für die Sondersprache
Arabic_Amountunter Windows
OCR and ICR improvements
- Die Synthese von Visitenkarten kann nun unter Verwendung zusätzlicher Parameter durchgeführt werden (IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- Der neue genaue Erkennungsmodus (Accurate) kann nun verwendet werden (IRecognizerParams::Mode)
- Neue Eigenschaft zur Überprüfung des Vorhandenseins von Barcodes mit Ausnahme von Postbarcodes (IBarcodeParams::EnableBarcodesCheck)
- Der Barcode-Typ kann nun erkannt werden, wobei Postbarcodes mithilfe der Konstante BT_AutodetectWithoutPostal ausgeschlossen werden (BarcodeTypeEnum)
- ABBYY FineReader Engine erkennt nun japanische Postal Customer Codes (BarcodeTypeEnum, Barcode Types)
Bildöffnung und Vorverarbeitung
- Sie können jetzt Dokumente laden, die mit zuvor unterstützten Versionen von ABBYY FineReader Engine gespeichert wurden (IFRDocument::ConvertFromOldVersion)
- Sie können Informationen über das Vorhandensein einer digitalen Signatur in einem Dokument abrufen (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- Der Text-Layer kann jetzt auf Zuverlässigkeit geprüft werden (IFRDocument::CheckTextLayer)
- Verbesserter Standardmodus für die Verarbeitung digital erstellter PDF-Dateien (SourceContentReuseModeEnum::CRM_Auto)
- Das Erscheinungsbild der ausgegebenen PDF-Datei kann jetzt geändert werden (ITextLayerInjectionParams::AllowChangePDFAView)
- Sie können jetzt Dateien vom Typ PDF Portfolio erkennen und öffnen (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
Export
- Der Export nach ALTO unterstützt jetzt die ALTO-Versionen 4.0, 4.1, 4.2 (AltoVersionEnum)
- Neue Modi für die Einbettung von Schriftarten in ausgegebene PDF-Dateien (FontEmbeddingModeEnum)
- Neue Schnittstellen zum Hinzufügen benutzerdefinierter Bilder zu ausgegebenen PDFs (IPDFPictures, IPDFPicture)
- Die Formate XLS und XPS stehen jetzt für den Document-Export unter Linux und macOS zur Verfügung (XLExportParams, XPSExportParams)
Codebeispiele
- Neues Hello-Beispiel für .NET Core
Weitere Verbesserungen
- Sie können Informationen zur für das Dokumentobjekt reservierten Speichergröße abrufen (IFRDocument::AllocatedSize)
- Neue Optionen zum Freigeben einer Online License (IEngine::ReleaseOnlineLicense, „Online-Lizenzen freigeben…” in der License Manager Utility) unter Linux und Windows
- Das ABBYY FineReader Engine-Installationsprogramm für Windows verwendet jetzt das Windows Installer XML Toolset (WiX)
- Neue Option LICENSEDATADIR zum Ändern des Ordners für die Speicherung der Hilfsinformationen (Installing the ABBYY FineReader Engine Library in Automatic Mode) unter Windows
- ABBYY FineReader Engine 12 kann jetzt innerhalb von Azure Services unter Windows ausgeführt werden
- Das Verlängerungsdatum für die Lizenzbeschränkungen hinsichtlich der Anzahl verarbeiteter Seiten kann jetzt abgerufen werden (ILicense::VolumeRefreshingDate)
- Neuer Unterabschnitt zur Ausführung des Licensing Service als Nicht-Root-Benutzer (Installieren des Licensing Service) unter Linux
Release 4
Besondere Funktionen
- Sie können entweder zwei Dokumente oder zwei Seiten vergleichen (IComparator::CompareDocuments, IComparator::ComparePages)
- Die Methoden der Document Comparison API ermöglichen es, Änderungen in Texten zu erkennen (IChange::GetAsTextChange) und das Vergleichsergebnis in ein XML- oder DOCX-Format zu exportieren (IComparisonResult::Export)
- Sie können Ihren Code, der das ABBYY ScanDifFinder SDK verwendet, auf die in ABBYY FineReader Engine implementierte Document Comparison API migrieren (Migrationshandbuch: Migration vom ScanDifFinder SDK zur Document Comparison API) – unter Windows
OCR- und ICR-Verbesserungen
- Neu unterstützte Postbarcodes: KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, Barcode Types)
Bildöffnung und Vorverarbeitung
- Das Document-Layout kann im Stream gespeichert und daraus gelesen werden (ILayout::SaveToStream, IEngine::CreateLayoutFromStream) oder als Array von Bytes gespeichert werden (ILayout::SaveToArray)
Export
- Export in PDF unterstützt die Einstellung der Seitenorientierung (IPDFExportFeatures::PageOrientation)
- Export in RTF unterstützt die Anpassung von Seitenrändern (IRTFExportParams::PageMargins) sowie die Vergrößerung des Seitenformats, wenn der Inhalt nicht auf die Seite passt (IRTFExportParams::IncreasePaperSizeToFitContent)
- Export in XLSX unterstützt die Einbettung von Grafiken in das Ausgabedokument (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
Codebeispiele
- Neues Document Comparison Windows-Demo-Tool und Document Comparison Beispiel. Diese demonstrieren, wie Sie ein Dokument oder eine Seite mit einem anderen vergleichen können.
- Aktualisiertes CommandLineInterface Beispiel für Linux und Windows.
- Neues CommandLineInterface Beispiel für macOS. Dieses Beispiel stellt die Kommandozeilen-Schnittstelle von ABBYY FineReader Engine bereit
- Neues SAFEARRAY_Hello Beispiel für macOS. Dieses Beispiel demonstriert die Dokumentenverarbeitung unter Verwendung des SAFEARRAY-Typs
Weitere Verbesserungen
Linux und Windows
- Eine Online-Lizenz begrenzt die Anzahl der für eine Workstation verfügbaren CPU-Kerne.
- Für eine Online-Lizenz muss jetzt auf dem Computer, auf dem der Licensing Service installiert ist, die GoDaddy Trusted Root Certification Authority verwendet werden.
- Die Liste der Parameter für die unbeaufsichtigte Installation unter Linux wurde aktualisiert.
Release 3
Besondere Funktionen
- MRZ kann jetzt aus Dokumentbildern extrahiert werden (IFRPage::ExtractMrz)
- Die aus der MRZ extrahierten Daten enthalten Felder und Zeilen (MrzField, MrzData, MrzLine) mit Informationen über das Dokument und seinen Inhaber und können in eine XML-Datei oder JSON-Datei exportiert werden
Neue und verbesserte Spracherkennung
- Spracherkennung für Georgisch
- Spracherkennung für mathematische Formeln
Bildöffnung und Vorverarbeitung
- Sie können jetzt unter Linux und Windows digital erstellte Dokumente mit denselben Methoden wie Bilder öffnen; die digitalen Dokumente werden konvertiert und ihre Inhalte geladen (OfficeConversionSettings, OfficeConverters)
- Sie können den Schwellenwert für die Binärisierung während der Bildvorverarbeitung festlegen (IPrepareImageMode::BinarizationThreshold)
- Der Modus für die Verarbeitung von Dokumentseiten im Speicher kann unter Linux und Windows vor der Konvertierung von Eingabebildern festgelegt werden (IBatchProcessor::PageFlushingPolicy)
Export
- Erstellungs- und Änderungsdatum können jetzt angezeigt und geändert werden. Außerdem können Sie festlegen, wie die Datumsangaben in das Ausgabedokument geschrieben werden (DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). Nur Datumsangaben im korrekten Format können in das Dokument geschrieben werden. Tritt beim Export ein Fehler auf, geben Sie das Datum im korrekten Format an oder ändern Sie den Schreibmodus und rufen Sie die Exportmethode erneut auf (Fehlerbehandlung beim PDF/XPS-Export)
- Ursprüngliches Zeitformat im Ausgabedokument (TimeZoneTypeEnum)
Codebeispiele
- Neues MRZExtraction-Beispiel für Linux und Windows. Dieses Beispiel zeigt, wie Daten aus einer maschinenlesbaren Zone (MRZ) extrahiert werden
- Neues Windows-Codebeispiel, das zeigt, wie ein Timer implementiert wird, der die Verarbeitung abbricht, wenn ein Methodenaufruf zu lange dauert
- Neues ICR-Beispiel für Linux, das zeigt, wie handschriftliche Druckschrift aus einem Bilddokument erkannt wird
Weitere Verbesserungen
- Die Datenblöcke können jetzt anhand ihrer Position sortiert werden (ILayout::SortedBlocks)
- Die Datei mit der Endbenutzer-Lizenzvereinbarung ist jetzt im ABBYY FineReader Engine Distribution Kit verfügbar
Linux und Windows
- Amazon Linux AMI wird jetzt in ABBYY FineReader Engine for Linux unterstützt
- Eine Online-Lizenz erfordert keine spezifischen Einstellungen, aber Sie müssen ihre Parameter festlegen, wenn Sie die Lizenz mit dem Proxyserver verwenden möchten
- Eine Online-Lizenz kann jetzt für eine begrenzte Anzahl von Verbindungen verwendet werden; diese Anzahl kann nach Ablauf der autonomen Laufzeit der Lizenz geändert werden
- ABBYY FineReader Engine 12 kann jetzt in einem Docker-Container ausgeführt werden
- Die Liste der unterstützten Java Development Kits finden Sie in den Systemanforderungen
- Die Build-Nummer von ABBYY FineReader Engine ist jetzt bereits vor dem Laden der Module verfügbar. Sie finden sie im Namen der JAR-Datei, die im ABBYY FineReader Engine Distribution Kit enthalten ist
Release 2
Besondere Funktionen
- Die aktualisierten Klassifizierungstechnologien unterstützen die Klassifizierung anhand von Bildmerkmalen, Merkmalen des erkannten Textes oder einer Kombination aus Bild- und Textmerkmalen (ClassifierTypeEnum)
- Die Klassifizierung ist jetzt sowohl für Dokumente als auch für Seiten verfügbar (IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- Neue Klassifizierungsmodelle können mithilfe der k-fachen Kreuzvalidierung trainiert werden (ValidationParams); detaillierte Informationen zur Modellleistung sind ebenfalls verfügbar (ValidationResult)
Neue und verbesserte Spracherkennung
- Spracherkennung für Burmesisch
- Verbessertes Japanisch (Modern) für eine bessere Erkennung japanischer Texte, die auch einige lateinische oder griechische Buchstaben enthalten können. Jetzt auch für Business Card Recognition verfügbar
- Aktualisierte Farsi-OCR
OCR- und ICR-Verbesserungen
- Für alle Erkennungsvarianten von Zeichen sind Koordinaten verfügbar (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
Bildöffnung und Vorverarbeitung
- Bilder können jetzt während der Vorverarbeitung automatisch auf die Dokumentränder zugeschnitten werden (IPagePreprocessingParams::CropImage)
- Zur Verbesserung der Erkennungsqualität kann ein Filter zur Rauschunterdrückung angewendet werden (IImageDocument::ApplySigmaFilter)
- Auf dem Bild können schwarze Referenzquadrate erkannt werden (IImageDocument::FindBlackSquares)
Export
- PDF-Version 2.0 wird für den Export unterstützt
- Die Injektion der Textebene unterstützt Tagged-PDF-Dateien und unter Windows die Konformität mit dem PDF/A-Standard
- Der PDF-Export unter Windows unterstützt zusätzlich zu RC4 die AES-256-Verschlüsselung sowie PDF/A-2b- und PDF/A-3b-Konformität (IPDFExportParams::PDFAComplianceMode)
- Der PDF-Export unter Linux unterstützt zusätzlich zu RC4 und AES-128 die AES-256-Verschlüsselung (IPDFEncryptionInfo::EncryptionAlgorithm) sowie PDF/A-2b- und PDF/A-3b-Konformität (IPDFExportParams::PDFAComplianceMode)
- Vollständige Unterstützung für ZUGFeRD-konforme PDFs: Dokumente, die mit auf TRUE gesetztem IPDFExportFeatures::EnableZugferdCompliance exportiert werden, bestehen jetzt den offiziellen ZUGFeRD-Validator
- Der Export nach Excel unterstützt die Arbeitsblattausrichtung von rechts nach links (IXLExportParams::CreateRtlSheets)
- Der Export nach ALTO unterstützt jetzt ALTO-Version 3.1 (IAltoExportParams::AltoVersion)
- Beim RTF-Export können durch Deaktivieren der Filterung mehr Trennlinien in der Ausgabe beibehalten werden (IRTFExportParams::FilterSeparators)
- Bessere Unterstützung für gepunktete Trennlinien in DOCX
- Unterstützung für HTML 5.0 (Konstante HFM_Format50 der HTMLFormatModeEnum)
- Unterstützung für PDF/UA-konforme Dokumente (IPDFExportFeatures::EnablePDFUACompliance)
- Erweiterte Modi zur Layout-Emulation für den Export nach TXT (ITextExportParams::LayoutRetentionMode)
Scanning-API (Windows)
- Papiergröße und Farbmodus beim Scannen können jetzt automatisch erkannt werden (ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- Leere Seiten können übersprungen und Bildschieflagen beim Scannen automatisch korrigiert werden, sofern diese Funktionen vom Scanner unterstützt werden (IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
Codebeispiele
- Neues Codebeispiel zur Classification (Windows) und Classification (Linux und macOS) für die Klassifizierung von Dokumenten beliebiger Typen
- Aktualisiertes Windows-Beispiel EnginesPool für Java
- Neue Linux-Codebeispiele Hello (Outproc) und Multithreading für C++ und Java. Die Beispiele demonstrieren die Bildverarbeitung mit der Engine, die als Out-of-Process-Server in einen separaten Prozess geladen wird
- Neues Linux-Beispiel SAFEARRAY_Hello. Dieses Beispiel demonstriert die Dokumentverarbeitung unter Verwendung des Typs SAFEARRAY
Weitere Verbesserungen für Linux und Windows
- Einfachere Verwendung von FineReader Engine in Multithread-Java-Anwendungen unter Windows (EnginesPool-Implementierung zum Java-Wrapper hinzugefügt)
- Einheitliches Verfahren zum Laden der Engine für alle Lizenztypen einschließlich der Online-Lizenz, sodass Sie Ihren Code beim Wechsel zwischen Lizenztypen nicht neu schreiben müssen. Siehe InitializeEngine und IEngineLoader::InitializeEngine (Windows)
- Multithread-Anwendungen können jetzt unter Linux in C++ implementiert werden
