Passer au contenu principal
ABBYY FineReader Engine prend en charge de nombreux paramètres qui vous permettent de régler finement l’Engine. Dans la plupart des cas, vous n’aurez pas besoin de définir vous-même toutes les valeurs : lors de leur création, les nouveaux objets reçoivent des valeurs par défaut adaptées et, pour les principaux scénarios d’utilisation, nous fournissons des profils prédéfinis éprouvés. Si votre scénario est plus spécifique et que vous avez déterminé les réglages optimaux pour obtenir la meilleure vitesse de traitement et la meilleure qualité, créez votre propre profil. Tous les paramètres de prétraitement d’image, d’analyse, de reconnaissance, de synthèse et d’exportation peuvent être modifiés via un profil. Par exemple, si votre application exporte les résultats de reconnaissance au format TXT (texte brut sans mise en forme), de nombreuses propriétés liées à la mise en page ne sont pas pertinentes et peuvent être désactivées. Après avoir chargé un profil à l’aide des méthodes LoadPredefinedProfile/LoadProfile de l’objet Engine, les propriétés des objets nouvellement créés seront définies sur les valeurs par défaut spécifiées dans le profil.

Profils prédéfinis

ABBYY FineReader Engine fournit un ensemble de profils prédéfinis conçus pour les principaux scénarios d’utilisation. La plupart de ces profils existent en deux versions : l’une optimisée pour offrir la meilleure qualité du document résultant, l’autre pour assurer la vitesse de traitement la plus élevée. Pour consulter la spécification complète de tous les profils prédéfinis, reportez-vous à la spécification des profils prédéfinis.

Convient pourextraire des donnéesd’un document et les présenter dans un format structuré. Tous les objets, y compris les tableaux, les images, les cases à cocher et l’écriture manuscrite, sont enregistrés avec leur emplacement et leurs attributs. Ce profil est idéal pour le traitement ultérieur des données extraites ou leur intégration dans d’autres applications.

Convient pourconvertir des documentsdans un format modifiable (par exemple, RTF, DOCX). Les paramètres ont été optimisés pour la précision :

  • Qualité optimale. Active la détection du style de police et la synthèse complète de la structure logique d’un document.

Convient pourconvertir des documentsdans un format modifiable (par exemple, RTF, DOCX). Les paramètres ont été optimisés pour la vitesse de traitement :

  • Qualité optimale. Active la détection du style de police et la synthèse complète de la structure logique d’un document.
  • L’orientation de l’image n’est pas corrigée.
  • Le processus d’analyse du document est accéléré.

Convient pour créer unearchive électronique(conversion en PDF, PDF/A, PDF et PDF/A avec MRC). Les paramètres ont été optimisés pour la précision :

  • Active la détection du maximum de texte sur une image, y compris le texte intégré dans l’image.
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.
Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces fins.

Convient pour créer unearchive électronique(conversion en PDF, PDF/A, PDF et PDF/A avec MRC). Les paramètres ont été optimisés pour la vitesse de traitement :

  • Active la détection du maximum de texte sur une image, y compris le texte intégré dans l’image.
  • La correction de l’inclinaison n’est pas effectuée.
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.
  • Les processus d’analyse et de reconnaissance du document sont accélérés.
Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces fins.

Convient pourextraire du texted’un document. Les paramètres ont été optimisés pour la précision :

  • Active la détection de tout le texte sur une image, y compris les petites zones de texte de faible qualité (les images et les tableaux ne sont pas détectés).
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.

Le texte est extrait dans l’ordre dans lequel un être humain le lirait, ce qui garantit la cohérence des données lors de leur utilisation pour l’entraînement et le traitement avec des moteurs de traitement du langage naturel (NLP).

Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces fins.

Convient pourextraire du texted’un document. Les paramètres ont été optimisés pour la vitesse de traitement :

  • Active la détection de tout le texte sur une image, y compris les petites zones de texte de faible qualité (les images et les tableaux ne sont pas détectés).
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.
  • Les processus d’analyse et de reconnaissance du document sont accélérés.

Le texte est extrait dans l’ordre dans lequel un être humain le lirait, ce qui garantit la cohérence des données lors de leur utilisation pour l’entraînement et le traitement avec des moteurs de traitement du langage naturel (NLP).

Ce profil n’est pas conçu pour convertir un document au format RTF, DOCX ou PDF texte seul. Utilisez les profils de conversion de documents à cette fin.

Adapté àla reconnaissance de courts fragments de texte. Actuellement, ce profil utilise les paramètres par défaut.

Adapté àl’extraction de codes-barres. Extrait uniquement les codes-barres (les textes, les images et les tableaux ne sont pas détectés). Les paramètres ont été optimisés pour une précision maximale.

Pour des raisons de compatibilité, vous pouvez également accéder à ce profil sous le nom BarcodeRecognition.

Ce profil nécessite le moduleBarcode Autolocationdisponible dans la licence.

Adapté àl’extraction de codes-barres. Extrait uniquement les codes-barres (les textes, les images et les tableaux ne sont pas détectés). Les paramètres ont été optimisés pour la vitesse de traitement.

Ce profil nécessite le moduleBarcode Autolocationdisponible dans la licence.

Adapté à la création de fichiers PDF fortement compressés contenant des documents entiers enregistrés sous forme d’images. Les paramètres suivants sont utilisés :

  • La reconnaissance du document et la synthèse de sa structure logique ne sont pas effectuées.
  • La correction de l’inclinaison n’est pas effectuée.
  • L’exportation PDF est optimisée pour réduire au minimum la taille du fichier obtenu.
  • L’intégralité du document est enregistrée sous forme d’image (modePEM_ImageOnly).

Adapté àla reconnaissance de cartes de visite. Les paramètres suivants sont utilisés :

  • Détecte uniquement les cartes de visite.
  • Active la détection de l’ensemble du texte d’une image, y compris les petites zones de texte de faible qualité (les images et les tableaux ne sont pas détectés).
  • La correction de la résolution est effectuée.
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.

Adapté àl’extraction de données d’une zone lisible par machine(MRZ). Les paramètres suivants sont utilisés :

  • Active la détection et l’extraction de l’ensemble du texte d’une image (les images, les graphiques vectoriels et les tableaux ne sont pas détectés).
  • La correction de la résolution et de la géométrie est effectuée automatiquement.

Adapté à la reconnaissance de dessins techniques. Il tient compte de la grande taille et de la complexité des schémas techniques, ainsi que de la possibilité de différentes orientations du texte dans l’image. Ce profil est conçu pour convertir ce type d’images au format PDF interrogeable. Les paramètres suivants sont utilisés :

  • Active la détection de l’ensemble du texte sur une image, y compris des blocs de texte orientés verticalement.
  • La synthèse complète de la structure logique d’un document n’est pas effectuée.
Ce profil n’est pas conçu pour convertir un document au format RTF, DOCX ou PDF texte seul. Utilisez les profils de conversion de documents à cette fin.

Rétablit les valeurs par défaut de tous les paramètres de traitement.

Les paramètres fournis avec ces profils peuvent être chargés à l’aide de la méthode LoadPredefinedProfile de l’objet Engine. Une fois le profil chargé, les objets nouvellement créés auront les nouvelles valeurs par défaut définies dans le profil.
  • Les utilisateurs de FRE for Linux peuvent trouver les fichiers de profils prédéfinis dans leur package de distribution, dans le dossier Bin Libraries.
  • Les utilisateurs de FRE for macOS peuvent trouver les fichiers de profils prédéfinis dans leur package de distribution, dans le dossier /PredefinedProfiles.
  • Pour déterminer l’ensemble des fichiers de ressources nécessaires au fonctionnement de votre application à l’aide du fichier FREngineDistribution.csv, consultez la page correspondant au scénario choisi.

Profils utilisateur

Vous pouvez également créer un profil utilisateur personnalisé. La syntaxe d’un fichier de profil est similaire à celle d’un fichier *.ini. Pour ajouter des commentaires, commencez une ligne par un point-virgule. Les sections contiennent, entre crochets, les noms des objets, et les clés contiennent les propriétés avec leurs nouvelles valeurs. La section spéciale appelée UserData peut contenir n’importe quelles clés définies par l’utilisateur. Les propriétés de différents types peuvent être écrites aux formats suivants :
  • Les valeurs des propriétés booléennes sont représentées par les chaînes true ou false.
  • Les valeurs des propriétés d’énumération sont représentées par des noms de constantes.
  • Les valeurs des propriétés de type string sont écrites sans guillemets.
Par exemple :
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; ceci est un commentaire
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
La méthode LoadProfile de l’objet Engine vous permet de charger un fichier de profil utilisateur. Une fois le profil utilisateur chargé, les objets nouvellement créés auront leurs propriétés définies selon les valeurs spécifiées dans le profil. Le chargement des paramètres à partir d’un profil est comparable à la définition des propriétés correspondantes dans le code du programme, mais il simplifie la logique de l’application. Si vous appelez LoadProfile avec une chaîne vide en entrée, les valeurs par défaut standard seront utilisées. La validité des nouvelles valeurs des propriétés et leur conformité à la licence sont vérifiées lors de la création de l’objet correspondant. Un fichier de profil peut être utilisé pour redéfinir toutes les propriétés des objets suivants : 1 Notez que la propriété UserPatternsFile de l’objet RecognizerParams accepte uniquement le chemin d’accès complet vers le fichier de modèles, avec la barre oblique appropriée comme Separator. La valeur du chemin ne doit pas être placée entre guillemets. Sous Windows, par exemple :
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
Pour Linux : /home/user/Documents/Patterns/ et macOS : /Users/user/Documents/
2 Pour définir les propriétés des objets PictureExportParams ou PaperSizeParams, indiquez les paramètres directement dans la section de l’objet de paramètres d’exportation (et non dans la section PictureExportParams ou PaperSizeParams). Vous pourrez ainsi utiliser des paramètres différents selon les formats d’exportation. Par exemple, pour spécifier le format d’image en gris pour les fichiers RTF :
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 Pour définir les propriétés de l’objet DocumentContentInfoWritingParams, spécifiez les paramètres directement dans la section de son objet parent. Pour le format PDF, il s’agit de l’objet PDFExportFeatures ; pour les autres formats, de l’objet de paramètres d’exportation correspondant. Vous pouvez ainsi définir des paramètres d’informations de contenu différents selon le format d’exportation. Par exemple, si vous ne souhaitez pas inclure l’auteur du document dans les fichiers PDF de sortie, insérez les lignes suivantes dans le profil :
[PDFExportFeatures]
WriteAuthor = false
4 Pour définir les propriétés de l’objet PageMargins, spécifiez directement les paramètres dans la section de l’objet parent. Notez que la propriété UseCustomPageMargins définie sur TRUE doit être spécifiée avant les valeurs des marges de la page :
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000

Utilisation simultanée de profils prédéfinis et de profils utilisateur

Un profil prédéfini et un profil utilisateur peuvent être chargés simultanément. Un profil utilisateur a priorité sur un profil prédéfini, c’est-à-dire que si le profil utilisateur définit le même paramètre que le profil prédéfini, la valeur du profil utilisateur sera utilisée. Si vous chargez un autre profil prédéfini, ce nouveau profil remplace le profil prédéfini précédent. De même, un nouveau profil utilisateur remplace le profil utilisateur précédent. Notez que le chargement d’un profil réinitialise la session de reconnaissance en cours (ce qui équivaut à appeler la méthode IEngine::CleanRecognizerSession).

Voir aussi

Réglage des paramètres de prétraitement, d’analyse, de reconnaissance et de synthèse Réglage des paramètres d’exportation