Passer au contenu principal
Cet objet vous permet de régler les paramètres de reconnaissance. Chaque bloc de texte et chaque cellule de tableau dans la mise en page possède son propre objet enfant de type RecognizerParams. En outre, cet objet est transmis en tant que sous-objet de l’objet PageProcessingParams aux fonctions d’analyse de mise en page et de reconnaissance d’ABBYY FineReader Engine. Les fonctions de reconnaissance utilisent les paramètres de reconnaissance définis dans les objets enfants de type RecognizerParams des blocs de texte et des cellules de tableau. Chaque fois qu’un bloc de texte ou une cellule de tableau est créé lors de l’analyse de la mise en page, les propriétés de son objet enfant de type RecognizerParams sont initialisées avec les valeurs des propriétés de l’objet RecognizedParams transmis à la fonction d’analyse. Les propriétés d’un sous-objet du bloc créé à l’aide de la méthode AddNew de l’objet LayoutBlocks sont définies sur des valeurs par défaut appropriées. Pour connaître la valeur par défaut de telle ou telle propriété, consultez sa description. L’objet RecognizerParams est un objet persistant. Cela signifie que l’état actuel de l’objet peut être enregistré dans un stockage persistant. L’objet pourra ensuite être recréé en lisant son état depuis ce stockage persistant. Les méthodes suivantes assurent la persistance de l’objet : Linux : SaveToFile et LoadFromFile Windows : SaveToFile, LoadFromFile, SaveToMemory et LoadFromMemory.

Propriétés

,lecture seule

Retourne l’objet Engine.

Spécifie la langue à utiliser pour la reconnaissance. Cette propriété peut être définie facilement via la méthode.

La propriété retourne un objet constant. Pour modifier la langue de reconnaissance, vous devez d’abord obtenir un objet TextLanguage intermédiaire à l’aide d’une méthode de création appropriée, modifier les paramètres nécessaires, puis assigner l’objet obtenu à la propriété.

Par défaut, ce paramètre est initialisé avec la langue anglaise.

Gère la détection automatique de la langue.

Lorsque l’autodétection de la langue est activée, la langue de reconnaissance est déterminée pour chaque mot du texte. Elle est sélectionnée dans la liste des langues spécifiées dans la propriété TextLanguage. L’autodétection est destinée à être utilisée lors de la reconnaissance de documents dont la langue est inconnue.

L’autodétection de la langue ne fonctionne qu’avec les langues prédéfinies (voir la liste complète dansPredefined Languages in ABBYY FineReader Engine).

Si vous savez avec certitude que toutes les langues spécifiées sont présentes dans le document, l’autodétection est inutile. Désactivez-la en définissant cette propriété sur TSPV_No.

Vous pouvez consulter la liste des langues détectées dans le document reconnu ou la page reconnue à l’aide de la propriété DetectedLanguages de l’objetou.

Par défaut, la valeur de cette propriété est TSPV_Auto.

La valeur de cette propriété est une superposition OR des constantes de l’énumérationqui désignent les types de texte possibles utilisés pour la reconnaissance. Par exemple, si elle est définie sur TT_Normal | TT_Index, ABBYY FineReader Engine supposera que le texte contient uniquement du texte typographique courant et des chiffres écrits en style de code postal, en ignorant toutes les autres variantes. Voir aussiUsing Text Type Autodetection.

Remarques :

  • Si cette propriété est égale à toute combinaison de TT_Matrix, TT_Typewriter, TT_OCR_A et TT_OCR_B, les polices italiques et les exposants/indices ne seront pas reconnus, quelles que soient les valeurs des propriétés ProhibitItalic, ProhibitSubscript et ProhibitSuperscript.
  • Si cette propriété est TT_Handwritten, l’orientation de l’image ne peut pas être corrigée.
  • Sous Windows :
    • si cette propriété est définie sur TT_Handwritten ou TT_Index, la propriété TrainUserPatterns ne peut pas être définie sur TRUE.
    • si la propriété TrainUserPatterns est définie sur TRUE, la propriété TextTypes ne doit contenir qu’un seul type de texte.

Par défaut, cette propriété est définie sur TT_Normal.

Indique que le type de texte doit être déterminé pour chaque bloc de texte séparément. Ce paramètre est utile lorsque vous disposez de blocs de texte relativement petits avec des types de texte différents, bien qu’il puisse légèrement ralentir le traitement.

La valeur par défaut de cette propriété est FALSE.

Spécifie le mode de reconnaissance à appliquer aux documents cibles. Chaque mode offre un niveau de vitesse et de précision de reconnaissance qui lui est propre, afin d’obtenir des résultats satisfaisants sur des images et des documents présentant diverses particularités.

Par défaut, cette propriété est définie sur RM_Normal.

Les motifs intégrés sont toujours utilisés en mode précis. Pour désactiver l’utilisation des motifs intégrés, passez en mode normal (RM_Normal).

Indique si le texte d’une image à faible résolution doit être reconnu. Cette propriété est utile lors de la reconnaissance de télécopies, de petits caractères, d’images à faible résolution ou de mauvaise qualité d’impression.

Par défaut, la valeur de cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine suppose que le texte du bloc auquel appartient l’objet RecognizerParams actuel ne contient pas plus d’une chaîne.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine suppose qu’aucune ligne de texte ne peut contenir plus d’un mot ; les lignes de texte sont alors reconnues comme un mot unique.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine ne reconnaît pas les lettres imprimées en italique. Elle est utile lorsqu’un texte ne contenant vraisemblablement aucune lettre en italique est reconnu, auquel cas elle peut accélérer la reconnaissance. Si des lettres en italique sont présentes sur l’image et que cette propriété est TRUE, ces lettres seront reconnues incorrectement.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine ne reconnaît pas les lettres en indice. Elle est utile lorsqu’un texte ne contenant vraisemblablement aucun indice est reconnu, auquel cas elle peut accélérer la reconnaissance. Si des lettres en indice sont présentes sur l’image et que cette propriété est TRUE, ces lettres seront reconnues incorrectement.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine ne reconnaît pas les lettres en exposant. Elle est utile lorsqu’un texte ne contenant vraisemblablement aucun exposant est reconnu, auquel cas elle peut accélérer la reconnaissance. Si des lettres en exposant sont présentes sur l’image et que cette propriété est TRUE, ces lettres seront reconnues incorrectement.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, elle interdit la reconnaissance des coupures de mots de ligne en ligne. Elle est utile lorsqu’un texte ne contenant vraisemblablement aucune coupure de mot est reconnu, auquel cas elle peut accélérer la reconnaissance. Si des coupures de mots sont présentes dans le bloc reconnu et que cette propriété est TRUE, les mots avec coupure seront reconnus incorrectement.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine ne reconnaît pas les petites capitales.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine considère que le texte d’un bloc ne peut pas être reporté sur le bloc suivant.

Par défaut, cette propriété est FALSE.

Cette propriété définit le mode de reconnaissance de la casse des lettres.

Par défaut, la valeur de cette propriété est CRM_AutoCase, ce qui correspond à la reconnaissance automatique de la casse.

Cette propriété définit le type de marquage autour des lettres (par exemple, soulignement, cadre, case, etc.).

Pour les types de marquage où chaque lettre se trouve dans une cellule distincte, utilisez la propriété CellsCount pour définir le nombre de cellules de caractères d’un bloc reconnu.

Par défaut, la valeur de cette propriété est FMT_SimpleText, ce qui signifie l’absence de marquage.

Définit le nombre de cellules de caractères dans le bloc.

Cette propriété n’est pertinente que pour les types de marquage de champ (propriété FieldMarkingType) dans lesquels chaque lettre est écrite dans une cellule distincte.

La valeur par défaut de cette propriété est 1, mais vous devez définir la valeur appropriée pour reconnaître le texte correctement.

Windows uniquement.

Cette propriété indique si les motifs utilisateur doivent être entraînés pendant la reconnaissance. La boîte de dialogueEntraînement des motifss’affiche pendant la reconnaissance.

Pour que le processus d’entraînement des motifs fonctionne correctement, il est nécessaire de :

  • définir la valeur du handle HWND de la fenêtre parente (propriété)
  • indiquer un fichier de motifs utilisateur dans la propriété UserPatternsFile

Voir aussiRecognizing with Training.

Si cette propriété est définie sur TRUE :

  • la propriété TextTypes ne doit contenir qu’un seul type de texte, et ce type de texte ne peut pas être TT_Handwritten ou TT_Index
  • la propriétéde l’objet PagePreprocessingParams ne peut pas être définie sur TRUE
L’entraînement des motifs n’est pas pris en charge pour les langues chinoise, japonaise et coréenne.

Par défaut, cette propriété est FALSE.

Lorsque cette propriété est définie sur TRUE, ABBYY FineReader Engine utilise ses propres motifs intégrés pour la reconnaissance. Les motifs sont des fichiers qui établissent une correspondance entre l’image d’un caractère et le caractère lui-même. Définissez cette propriété sur FALSE si vous ne souhaitez pas utiliser les motifs standard de ABBYY FineReader Engine pour la reconnaissance de caractères, mais uniquement des motifs utilisateur. Cela peut être utile pour la reconnaissance de texte saisi avec des polices décoratives ou non standard. Dans ce cas, il est préférable de ne pas recourir aux motifs intégrés de ABBYY FineReader Engine, mais d’utiliser vos propres motifs entraînés pour ces polices.

Le chemin vers le fichier de motifs utilisateur est stocké dans la propriété UserPatternsFile. Si la propriété UserPatternsFile est vide, la propriété UseBuiltInPatterns est ignorée. Pour Windows, voir aussiRecognizing with Training.

Par défaut, cette propriété est TRUE.

Vous pouvez définir cette propriété sur FALSE avec les modes de reconnaissance normal et rapide. Il n’est pas possible de désactiver l’utilisation des motifs intégrés pour le mode précis (voir la description de la propriétéMode).

Contient le chemin complet vers un fichier de motif utilisateur employé pour la reconnaissance. Si la valeur de cette propriété n’est pas vide, les informations du fichier de motif utilisateur seront utilisées lors de la reconnaissance.

Si la propriété UseBuiltInPatterns est FALSE, ce qui signifie que les motifs standard d’ABBYY FineReader Engine ne sont pas utilisés lors de la reconnaissance, cette propriété doit contenir le chemin vers un fichier de motif défini par l’utilisateur, car seules les informations qui y sont stockées seront utilisées. Pour Windows, voir aussiRecognizing with Training.

Par défaut, cette propriété contient une chaîne vide.

Les fichiers de motif utilisateur créés dans ABBYY FineReader Engine 10 ou antérieur ne peuvent pas être ouverts dans FineReader Engine 12 Release 6 ou ultérieur. Pour continuer à les utiliser, enregistrez les anciens fichiers de motif utilisateur dans le nouveau format :
  • Utilisez FineReader Engine 11 ou FineReader Engine 12 Release 5 ou antérieur.
  • Appelez la méthodede l’objet, en passant une collection de chaînes contenant le nom de l’ancien fichier de motif et le chemin complet vers le nouveau fichier.

Indique si la propriété IsSuspicious doit être définie sur TRUE pour les caractères reconnus avec incertitude.

Le nom de la propriété reflète le fait qu’ABBYY FineReader met en évidence les caractères suspects dans le texte par une couleur d’arrière-plan, ce qui facilite la vérification manuelle par l’opérateur.

Par défaut, cette propriété est TRUE.

Cette propriété est obsolète et sera supprimée dans les versions futures.

Indique si les régions exactes des caractères () sont enregistrées.

La valeur par défaut est FALSE.

Indique si les variantes de reconnaissance des caractères sont enregistrées.

La propriétéICharParams::CharacterRecognitionVariantsretourne une collection de variantes de reconnaissance pour un caractère. Voir aussiUtilisation de l’API Voting.

La valeur par défaut est FALSE.

Indique si les variantes de reconnaissance d’un mot sont enregistrées.

La méthodeIParagraph::GetWordRecognitionVariantset la propriétéICharParams::WordRecognitionVariantsretournent une collection de variantes de reconnaissance pour un mot. Voir aussiUtilisation de l’API Voting.

La valeur par défaut est FALSE.

Méthodes

NomDescription
CopyFromInitialise les propriétés de l’objet courant avec les valeurs des propriétés correspondantes d’un autre objet.
LoadFromFileRestaure le contenu de l’objet à partir d’un fichier sur disque.
LoadFromMemory <Note> Windows uniquement. </Note>Restaure le contenu de l’objet à partir de la mémoire globale.
SaveToFileEnregistre le contenu de l’objet dans un fichier sur disque.
SaveToMemory <Note> Windows uniquement. </Note>Enregistre le contenu de l’objet dans la mémoire globale.
SetPredefinedTextLanguageDéfinit la langue de reconnaissance sur l’une des langues prédéfinies d’ABBYY FineReader Engine.
RecognizerParams Diagramme d’objets

Paramètre de sortie

Cet objet est le paramètre de sortie de la méthode CreateRecognizerParams de l’objet Engine.

Paramètre d’entrée

Cet objet est passé en tant que paramètre d’entrée aux méthodes suivantes :

Exemples

FREngine.IEngine engine;
string fileName;
// Entraîner le user pattern lors de la reconnaissance
FREngine.IDocumentProcessingParams processingParams = Engine.CreateDocumentProcessingParams();
FREngine.IRecognizerParams recognizerParams = processingParams.PageProcessingParams.RecognizerParams;
Engine.CreateEmptyUserPattern( fileName );
Engine.MultiProcessingParams.MultiProcessingMode = FREngine.MultiProcessingModeEnum.MPM_Sequential;
recognizerParams.UserPatternsFile = fileName;
recognizerParams.TrainUserPatterns = true;
Document.Process(processingParams);
Cet objet est utilisé dans les exemples de code suivants :

Voir aussi

Réglage des paramètres de prétraitement, d’analyse, de reconnaissance et de synthèse Reconnaissance des textes manuscrits PageProcessingParams TextBlock Utilisation des propriétés