ABBYY FineReader Engine prend en charge de nombreux paramètres qui vous permettent de régler finement l’Engine. Dans la plupart des cas, vous n’aurez pas besoin de définir vous-même toutes les valeurs : lors de leur création, les nouveaux objets reçoivent des valeurs par défaut adaptées et, pour les principaux scénarios d’utilisation, nous fournissons des profils prédéfinis éprouvés.
Si votre scénario est plus spécifique et que vous avez déterminé les réglages optimaux pour obtenir la meilleure vitesse de traitement et la meilleure qualité, créez votre propre profil. Tous les paramètres de prétraitement d’image, d’analyse, de reconnaissance, de synthèse et d’exportation peuvent être modifiés via un profil. Par exemple, si votre application exporte les résultats de reconnaissance au format TXT (texte brut sans mise en forme), de nombreuses propriétés liées à la mise en page ne sont pas pertinentes et peuvent être désactivées.
Après avoir chargé un profil à l’aide des méthodes LoadPredefinedProfile/LoadProfile de l’objet Engine, les propriétés des objets nouvellement créés seront définies sur les valeurs par défaut spécifiées dans le profil.
ABBYY FineReader Engine fournit un ensemble de profils prédéfinis conçus pour les principaux scénarios d’utilisation. La plupart de ces profils existent en deux versions : l’une optimisée pour offrir la meilleure qualité du document résultant, l’autre pour assurer la vitesse de traitement la plus élevée. Pour consulter la spécification complète de tous les profils prédéfinis, reportez-vous à la spécification des profils prédéfinis.
| |
|---|
| Convient pourextraire des donnéesd’un document et les présenter dans un format structuré. Tous les objets,
y compris les tableaux, les images, les cases à cocher et l’écriture manuscrite, sont enregistrés
avec leur emplacement et leurs attributs. Ce profil est idéal pour
le traitement ultérieur des données extraites ou leur intégration dans d’autres
applications. |
| Convient pourconvertir des documentsdans un format modifiable (par exemple, RTF, DOCX). Les paramètres ont
été optimisés pour la précision : - Qualité optimale. Active la détection du style de police et la synthèse complète de la
structure logique d’un document.
|
| Convient pourconvertir des documentsdans un format modifiable (par exemple, RTF, DOCX). Les paramètres ont
été optimisés pour la vitesse de traitement : - Qualité optimale. Active la détection du style de police et la synthèse complète de la
structure logique d’un document.
- L’orientation de l’image n’est pas corrigée.
- Le processus d’analyse du document est accéléré.
|
| Convient pour créer unearchive électronique(conversion en PDF, PDF/A, PDF et PDF/A avec MRC). Les paramètres ont
été optimisés pour la précision : - Active la détection du maximum de texte sur une image, y compris le texte
intégré dans l’image.
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX
ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces
fins. |
| Convient pour créer unearchive électronique(conversion en PDF, PDF/A, PDF et PDF/A avec MRC). Les paramètres ont
été optimisés pour la vitesse de traitement : - Active la détection du maximum de texte sur une image, y compris le texte
intégré dans l’image.
- La correction de l’inclinaison n’est pas effectuée.
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
- Les processus d’analyse et de reconnaissance du document sont accélérés.
Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX
ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces
fins. |
| Convient pourextraire du texted’un document. Les paramètres ont été optimisés pour la précision : - Active la détection de tout le texte sur une image, y compris les petites zones de texte
de faible qualité (les images et les tableaux ne sont pas détectés).
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
Le texte est extrait dans l’ordre dans lequel un être humain le lirait,
ce qui garantit la cohérence des données lors de leur utilisation pour l’entraînement et
le traitement avec des moteurs de traitement du langage naturel (NLP). Ce profil n’est pas destiné à la conversion d’un document en RTF, DOCX
ou en PDF texte uniquement. Utilisez les profils de conversion de documents à ces
fins. |
| Convient pourextraire du texted’un document. Les paramètres ont été optimisés pour la vitesse de
traitement : - Active la détection de tout le texte sur une image, y compris les petites zones de texte
de faible qualité (les images et les tableaux ne sont pas détectés).
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
- Les processus d’analyse et de reconnaissance du document sont accélérés.
Le texte est extrait dans l’ordre dans lequel un être humain le lirait,
ce qui garantit la cohérence des données lors de leur utilisation pour l’entraînement et
le traitement avec des moteurs de traitement du langage naturel (NLP). Ce profil n’est pas conçu pour convertir un document au format RTF, DOCX
ou PDF texte seul. Utilisez les profils de conversion de documents à cette
fin. |
| Adapté àla reconnaissance de courts fragments de texte. Actuellement, ce profil utilise les paramètres par défaut. |
| Adapté àl’extraction de codes-barres. Extrait uniquement les codes-barres (les textes, les images et les tableaux ne sont pas
détectés). Les paramètres ont été optimisés pour une précision maximale. Pour des raisons de compatibilité, vous pouvez également accéder à ce profil sous le nom
BarcodeRecognition. |
| Adapté àl’extraction de codes-barres. Extrait uniquement les codes-barres (les textes, les images et les tableaux ne sont pas
détectés). Les paramètres ont été optimisés pour la vitesse de traitement. |
| Adapté à la création de fichiers PDF fortement compressés contenant des
documents entiers enregistrés sous forme d’images. Les paramètres suivants sont utilisés : - La reconnaissance du document et la synthèse de sa structure logique
ne sont pas effectuées.
- La correction de l’inclinaison n’est pas effectuée.
- L’exportation PDF est optimisée pour réduire au minimum la taille du fichier obtenu.
- L’intégralité du document est enregistrée sous forme d’image (modePEM_ImageOnly).
|
| Adapté àla reconnaissance de cartes de visite. Les paramètres suivants sont utilisés : - Détecte uniquement les cartes de visite.
- Active la détection de l’ensemble du texte d’une image, y compris les petites
zones de texte de faible qualité (les images et les tableaux ne sont pas détectés).
- La correction de la résolution est effectuée.
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
|
| Adapté àl’extraction de données d’une zone lisible par machine(MRZ). Les paramètres suivants sont utilisés : - Active la détection et l’extraction de l’ensemble du texte d’une image (les images,
les graphiques vectoriels et les tableaux ne sont pas détectés).
- La correction de la résolution et de la géométrie est effectuée automatiquement.
|
| Adapté à la reconnaissance de dessins techniques. Il tient compte de la
grande taille et de la complexité des schémas techniques, ainsi que de la
possibilité de différentes orientations du texte dans l’image. Ce
profil est conçu pour convertir ce type d’images au format PDF
interrogeable. Les paramètres suivants sont utilisés : - Active la détection de l’ensemble du texte sur une image, y compris des blocs de texte
orientés verticalement.
- La synthèse complète de la structure logique d’un document n’est pas
effectuée.
Ce profil n’est pas conçu pour convertir un document au format RTF, DOCX
ou PDF texte seul. Utilisez les profils de conversion de documents à cette
fin. |
| Rétablit les valeurs par défaut de tous les paramètres de traitement. |
Les paramètres fournis avec ces profils peuvent être chargés à l’aide de la méthode LoadPredefinedProfile de l’objet Engine. Une fois le profil chargé, les objets nouvellement créés auront les nouvelles valeurs par défaut définies dans le profil.
- Les utilisateurs de FRE for Linux peuvent trouver les fichiers de profils prédéfinis dans leur package de distribution, dans le dossier Bin Libraries.
- Les utilisateurs de FRE for macOS peuvent trouver les fichiers de profils prédéfinis dans leur package de distribution, dans le dossier /PredefinedProfiles.
- Pour déterminer l’ensemble des fichiers de ressources nécessaires au fonctionnement de votre application à l’aide du fichier FREngineDistribution.csv, consultez la page correspondant au scénario choisi.
Vous pouvez également créer un profil utilisateur personnalisé. La syntaxe d’un fichier de profil est similaire à celle d’un fichier *.ini. Pour ajouter des commentaires, commencez une ligne par un point-virgule.
Les sections contiennent, entre crochets, les noms des objets, et les clés contiennent les propriétés avec leurs nouvelles valeurs. La section spéciale appelée UserData peut contenir n’importe quelles clés définies par l’utilisateur. Les propriétés de différents types peuvent être écrites aux formats suivants :
- Les valeurs des propriétés booléennes sont représentées par les chaînes true ou false.
- Les valeurs des propriétés d’énumération sont représentées par des noms de constantes.
- Les valeurs des propriétés de type string sont écrites sans guillemets.
Par exemple :
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; ceci est un commentaire
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
La méthode LoadProfile de l’objet Engine vous permet de charger un fichier de profil utilisateur. Une fois le profil utilisateur chargé, les objets nouvellement créés auront leurs propriétés définies selon les valeurs spécifiées dans le profil. Le chargement des paramètres à partir d’un profil est comparable à la définition des propriétés correspondantes dans le code du programme, mais il simplifie la logique de l’application. Si vous appelez LoadProfile avec une chaîne vide en entrée, les valeurs par défaut standard seront utilisées.
La validité des nouvelles valeurs des propriétés et leur conformité à la licence sont vérifiées lors de la création de l’objet correspondant.
Un fichier de profil peut être utilisé pour redéfinir toutes les propriétés des objets suivants :
1 Notez que la propriété UserPatternsFile de l’objet RecognizerParams accepte uniquement le chemin d’accès complet vers le fichier de modèles, avec la barre oblique appropriée comme Separator. La valeur du chemin ne doit pas être placée entre guillemets. Sous Windows, par exemple :
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
Pour Linux : /home/user/Documents/Patterns/ et macOS : /Users/user/Documents/
2 Pour définir les propriétés des objets PictureExportParams ou PaperSizeParams, indiquez les paramètres directement dans la section de l’objet de paramètres d’exportation (et non dans la section PictureExportParams ou PaperSizeParams). Vous pourrez ainsi utiliser des paramètres différents selon les formats d’exportation. Par exemple, pour spécifier le format d’image en gris pour les fichiers RTF :
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 Pour définir les propriétés de l’objet DocumentContentInfoWritingParams, spécifiez les paramètres directement dans la section de son objet parent. Pour le format PDF, il s’agit de l’objet PDFExportFeatures ; pour les autres formats, de l’objet de paramètres d’exportation correspondant. Vous pouvez ainsi définir des paramètres d’informations de contenu différents selon le format d’exportation. Par exemple, si vous ne souhaitez pas inclure l’auteur du document dans les fichiers PDF de sortie, insérez les lignes suivantes dans le profil :
[PDFExportFeatures]
WriteAuthor = false
4 Pour définir les propriétés de l’objet PageMargins, spécifiez directement les paramètres dans la section de l’objet parent. Notez que la propriété UseCustomPageMargins définie sur TRUE doit être spécifiée avant les valeurs des marges de la page :
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000
Utilisation simultanée de profils prédéfinis et de profils utilisateur
Un profil prédéfini et un profil utilisateur peuvent être chargés simultanément. Un profil utilisateur a priorité sur un profil prédéfini, c’est-à-dire que si le profil utilisateur définit le même paramètre que le profil prédéfini, la valeur du profil utilisateur sera utilisée.
Si vous chargez un autre profil prédéfini, ce nouveau profil remplace le profil prédéfini précédent. De même, un nouveau profil utilisateur remplace le profil utilisateur précédent. Notez que le chargement d’un profil réinitialise la session de reconnaissance en cours (ce qui équivaut à appeler la méthode IEngine::CleanRecognizerSession).
Réglage des paramètres de prétraitement, d’analyse, de reconnaissance et de synthèse
Réglage des paramètres d’exportation