Version 7
Correctifs de sécurité
Profils prédéfinis
Ouverture et prétraitement des images
- Pour accélérer la préparation des images, vous pouvez définir le type de document (IPrepareImageMode::DocumentType) lorsqu’il est connu, afin d’éviter d’exécuter le classificateur de documents.
- Nouveaux formats d’entrée : HEIF, SVG, WebP.
- Type de document pour les dessins techniques contenant de nombreux fragments de texte orientés dans différentes directions (DocumentTypeEnum::DT_TechnicalDrawing).
Export
- Les données extraites du document peuvent désormais être exportées au format JSON (JsonExportParams).
Améliorations de l’OCR et de l’ICR
- Les coches peuvent désormais être détectées lors de l’analyse de la mise en page (IPageAnalysisParams::DetectCheckmarks)
- Mode d’analyse spécial pour les documents à mise en page complexe et comportant des tableaux (IPageAnalysisParams::AnalysisMode)
- Un nouveau paramètre vous permet d’enregistrer les tampons sous forme d’images (IPageAnalysisParams::DetectStamps)
- L’écriture manuscrite cursive est reconnue en plus de l’écriture manuscrite en lettres détachées, pour l’anglais, l’espagnol, le français, l’allemand et le japonais (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- Une nouvelle propriété de type probabilité permet d’estimer la précision de la reconnaissance des caractères (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Exemples de code pour Windows
- Nouvel exemple HelloBCR pour .NET Core
- Nouvel exemple DataExtraction pour .NET Core
Version 5
Reconnaissance des langues : nouveautés et améliorations
- Reconnaissance du bangla
- Reconnaissance de la langue spéciale Arabic_Amount sous Windows
Améliorations de l’OCR et de l’ICR
- La synthèse de cartes de visite peut désormais être effectuée à l’aide de paramètres supplémentaires (IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- Vous pouvez désormais utiliser le nouveau mode de reconnaissance Accurate (IRecognizerParams::Mode)
- Nouvelle propriété permettant de vérifier la présence de codes-barres, à l’exception des codes postaux (IBarcodeParams::EnableBarcodesCheck)
- Vous pouvez désormais détecter le type de code-barres, à l’exclusion des codes postaux, à l’aide de la constante BT_AutodetectWithoutPostal (BarcodeTypeEnum)
- ABBYY FineReader Engine reconnaît désormais les codes client postaux japonais (BarcodeTypeEnum, Barcode Types)
Ouverture et prétraitement des images
- Vous pouvez désormais charger les documents enregistrés par les anciennes versions prises en charge d’ABBYY FineReader Engine (IFRDocument::ConvertFromOldVersion)
- Vous pouvez désormais obtenir des informations sur la présence d’une signature numérique dans un document (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- La fiabilité du calque de texte peut désormais être vérifiée (IFRDocument::CheckTextLayer)
- Amélioration du mode par défaut pour le traitement des fichiers PDF natifs (SourceContentReuseModeEnum::CRM_Auto)
- L’apparence du fichier PDF de sortie peut désormais être modifiée (ITextLayerInjectionParams::AllowChangePDFAView)
- Vous pouvez désormais identifier et ouvrir des fichiers de type PDF Portfolio (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
Export
- L’exportation vers ALTO prend désormais en charge les versions 4.0, 4.1 et 4.2 d’ALTO (AltoVersionEnum)
- Nouveaux modes d’incorporation des polices dans les fichiers PDF de sortie (FontEmbeddingModeEnum)
- Nouvelles interfaces permettant d’ajouter des images définies par l’utilisateur aux PDF de sortie (IPDFPictures, IPDFPicture)
- Les Formats XLS et XPS sont désormais disponibles pour l’exportation de documents (XLExportParams, XPSExportParams) sous Linux et macOS
Exemples de code
- Nouvel exemple Hello pour .NET Core
Autres améliorations
- Vous pouvez obtenir des informations sur la quantité de mémoire allouée à l’objet document (IFRDocument::AllocatedSize)
- Nouvelles options de libération d’une licence en ligne (IEngine::ReleaseOnlineLicense, « Release Online Licenses… » dans l’utilitaire License Manager) sous Linux et Windows
- Le programme d’installation d’ABBYY FineReader Engine pour Windows utilise désormais Windows Installer XML Toolset (WiX)
- Nouvelle option LICENSEDATADIR pour modifier le dossier utilisé pour stocker les informations auxiliaires (Installing the ABBYY FineReader Engine Library in Automatic Mode) sous Windows
- ABBYY FineReader Engine 12 peut désormais s’exécuter dans Azure Services sous Windows
- Vous pouvez désormais obtenir la date de renouvellement des limitations de licence concernant le nombre de pages traitées (ILicense::VolumeRefreshingDate)
- Nouvelle sous-section décrivant l’exécution du service de licence par un utilisateur non root (Installing the Licensing Service) sous Linux
Version 4
Fonctionnalités spéciales
API de comparaison de documents:- Vous pouvez comparer soit deux documents, soit deux pages (IComparator::CompareDocuments, IComparator::ComparePages)
- Les méthodes de l’API de comparaison de documents permettent de détecter les modifications dans les textes (IChange::GetAsTextChange) et d’exporter le résultat de la comparaison au format XML ou DOCX (IComparisonResult::Export)
- Vous pouvez faire évoluer votre code utilisant ABBYY ScanDifFinder SDK vers l’API de comparaison de documents implémentée dans ABBYY FineReader Engine (Guide de migration de ScanDifFinder SDK vers API de comparaison de documents) sous Windows
Améliorations de l’OCR et de l’ICR
- Nouveaux Barcode postaux pris en charge : KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, Barcode Types)
Ouverture et prétraitement des images
- La mise en page du document peut être enregistrée et chargée depuis un flux (ILayout::SaveToStream, IEngine::CreateLayoutFromStream) ou enregistrée sous forme de tableau d’octets (ILayout::SaveToArray)
Export
- L’export au format PDF prend en charge le réglage de l’orientation de la page (IPDFExportFeatures::PageOrientation)
- L’export au format RTF prend en charge le réglage des marges de la page (IRTFExportParams::PageMargins) ainsi que l’augmentation de la taille de la page si le contenu n’y tient pas (IRTFExportParams::IncreasePaperSizeToFitContent)
- L’export au format XLSX prend en charge l’insertion d’images dans le document de sortie (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
Exemples de code
- Nouvel outil de démonstration Windows Document Comparison et nouvel exemple Document Comparison. Ils montrent comment comparer un document ou une page à un autre document ou à une autre page.
- Exemple CommandLineInterface mis à jour pour Linux et Windows.
- Nouvel exemple CommandLineInterface pour macOS. Cet exemple fournit l’interface en ligne de commande d’ABBYY FineReader Engine
- Nouvel exemple SAFEARRAY_Hello pour macOS. Cet exemple illustre le traitement de documents à l’aide du type SAFEARRAY
Autres améliorations
Linux et Windows
- Une licence en ligne limite le nombre de cœurs de processeur disponibles sur un poste de travail.
- Une licence en ligne nécessite désormais l’utilisation de GoDaddy Trusted Root Certification Authority sur l’ordinateur où est installé le service de licence.
- La liste des paramètres d’installation silencieuse a été mise à jour pour Linux.
Version 3
Fonctionnalités spécifiques
- La MRZ peut désormais être extraite des images du document (IFRPage::ExtractMrz)
- Les données extraites de la MRZ comprennent des champs et des lignes (MrzField, MrzData, MrzLine) contenant des informations sur le document et son titulaire, et peuvent être exportées dans un fichier XML ou un fichier JSON
Nouveautés et améliorations de la reconnaissance des langues
- Reconnaissance du géorgien
- Reconnaissance des formules mathématiques
Ouverture et prétraitement des images
- Vous pouvez désormais ouvrir des documents nativement numériques à l’aide des mêmes méthodes que pour l’ouverture d’images sous Linux et Windows ; les documents numériques seront convertis et leur contenu chargé (OfficeConversionSettings, OfficeConverters)
- Vous pouvez désormais définir le seuil de binarisation lors du prétraitement de l’image (IPrepareImageMode::BinarizationThreshold)
- Le mode de gestion en mémoire des pages du document peut être défini avant la conversion des images d’entrée (IBatchProcessor::PageFlushingPolicy) sous Linux et Windows
Export
- Les dates de création et de modification peuvent désormais être consultées et modifiées. Vous pouvez également définir le mode d’écriture de ces dates dans le document de sortie (DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). Seules les dates au format correct peuvent être écrites dans le document. Si une erreur se produit lors de l’exportation, indiquez la date dans un format correct ou modifiez son mode d’écriture, puis appelez de nouveau la méthode d’exportation (Gestion des erreurs lors de l’exportation PDF/XPS)
- Format horaire d’origine dans le document de sortie (TimeZoneTypeEnum)
Exemples de code
- Nouvel exemple MRZExtraction pour Linux et Windows. Cet exemple montre comment extraire des données d’une zone lisible par machine (MRZ)
- Nouvel exemple de code pour Windows illustrant comment implémenter un minuteur qui interrompt le traitement si un appel de méthode prend trop de temps
- Nouvel exemple ICR pour Linux, montrant comment reconnaître du texte manuscrit en lettres détachées dans l’image du document
Autres améliorations
- Les blocs de données peuvent désormais être triés en fonction de leur position (ILayout::SortedBlocks)
- Le fichier du contrat de licence utilisateur final est désormais disponible dans ABBYY FineReader Engine Distribution Kit
Linux et Windows
- Amazon Linux AMI est désormais pris en charge par ABBYY FineReader Engine pour Linux
- Une licence en ligne ne nécessite aucun paramètre spécifique, mais vous devez définir ses paramètres si vous souhaitez utiliser la licence avec le serveur proxy
- Une licence en ligne est désormais autorisée pour un nombre limité de connexions, qui peut être modifié une fois la durée d’exécution autonome de la licence écoulée
- ABBYY FineReader Engine 12 peut désormais être exécuté dans un conteneur Docker
- La liste des Java Development Kits pris en charge figure dans la Configuration système requise
- Le numéro de build d’ABBYY FineReader Engine est désormais disponible avant le chargement de ses modules. Vous le trouverez dans le nom du fichier JAR inclus dans ABBYY FineReader Engine Distribution Kit
Version 2
Fonctionnalités spéciales
API de classification améliorée :- Les technologies de classification mises à jour prennent en charge la classification à partir des caractéristiques de l’image, des caractéristiques du texte reconnu, ou d’une combinaison des caractéristiques de l’image et du texte (ClassifierTypeEnum)
- La classification est désormais disponible à la fois pour les documents et pour les pages (IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- De nouveaux modèles de classification peuvent être entraînés à l’aide de la technique de validation croisée à k plis (ValidationParams), avec des informations détaillées sur les performances du modèle (ValidationResult)
Reconnaissance des langues : nouveautés et améliorations
- Reconnaissance de la langue birmane
- Japonais (moderne) amélioré pour une meilleure reconnaissance des textes japonais pouvant inclure certaines lettres latines ou grecques. Il est désormais disponible pour la reconnaissance des cartes de visite
- Mise à jour de l’OCR du farsi
Améliorations de l’OCR et de l’ICR
- Les coordonnées sont disponibles pour toutes les variantes de reconnaissance des caractères (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
Ouverture et prétraitement des images
- Les images peuvent désormais être automatiquement recadrées sur les bords du document lors du prétraitement (IPagePreprocessingParams::CropImage)
- Un filtre de réduction du bruit peut être appliqué pour améliorer la qualité de la reconnaissance (IImageDocument::ApplySigmaFilter)
- Des carrés noirs de repérage peuvent être détectés dans l’image (IImageDocument::FindBlackSquares)
Export
- La version 2.0 du format PDF est prise en charge à l’export
- L’injection d’un calque de texte prend en charge les fichiers PDF balisés et la conformité à la norme PDF/A sous Windows
- L’export PDF sous Windows prend en charge le chiffrement AES-256 en plus de RC4, ainsi que la conformité PDF/A-2b et PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- L’export PDF sous Linux prend en charge le chiffrement AES-256 en plus de RC4 et AES-128 (IPDFEncryptionInfo::EncryptionAlgorithm), ainsi que la conformité PDF/A-2b et PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- Prise en charge complète des PDF conformes à ZUGFeRD : les documents exportés avec IPDFExportFeatures::EnableZugferdCompliance défini sur TRUE passent désormais le validateur officiel ZUGFeRD
- L’export vers Excel prend en charge l’orientation de feuille de calcul de droite à gauche (IXLExportParams::CreateRtlSheets)
- L’export vers ALTO prend désormais en charge la version 3.1 d’ALTO (IAltoExportParams::AltoVersion)
- L’export RTF permet de conserver davantage de Separator dans le fichier de sortie en désactivant leur filtrage (IRTFExportParams::FilterSeparators)
- Meilleure prise en charge des Separator en pointillés dans DOCX
- Prise en charge de HTML 5.0 (constante HFM_Format50 de HTMLFormatModeEnum)
- Prise en charge des documents conformes à PDF/UA (IPDFExportFeatures::EnablePDFUACompliance)
- Modes avancés d’émulation de mise en page pour l’export vers TXT (ITextExportParams::LayoutRetentionMode)
API de numérisation (Windows)
- Le format de papier et le mode couleur de numérisation peuvent désormais être déterminés automatiquement (ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- Les pages vides peuvent être ignorées et l’inclinaison de l’image peut être corrigée automatiquement lors de la numérisation, si ces fonctionnalités sont prises en charge par le scanner (IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
Exemples de code
- Nouvel exemple de code illustrant la classification (Windows) et la classification (Linux et macOS) de documents de tout type
- Exemple Windows EnginesPool mis à jour pour Java
- Nouveaux exemples de code Linux Hello (Outproc) et Multithreading pour C++ et Java. Les exemples illustrent le traitement d’images avec Engine chargé en tant que serveur hors processus dans un processus distinct
- Nouvel exemple Linux SAFEARRAY_Hello. Cet exemple illustre le traitement de documents avec le type SAFEARRAY
Autres améliorations pour Linux et Windows
- Méthode simplifiée pour utiliser FineReader Engine dans des applications Java multithread sous Windows (implémentation d’EnginesPool ajoutée au wrapper Java)
- Procédure unifiée de chargement d’Engine pour tous les types de licence, y compris la licence en ligne, afin que vous n’ayez pas à réécrire votre code lors du passage d’un type de licence à un autre. Voir InitializeEngine et IEngineLoader::InitializeEngine (Windows)
- Les applications multithread peuvent désormais être implémentées en C++ sous Linux
