Passer au contenu principal
Voici la liste des noms internes des langues prédéfinies prises en charge par ABBYY FineReader Engine. La disponibilité de telle ou telle langue de reconnaissance prédéfinie dépend de la présence des modules correspondants dans les fichiers d’ABBYY FineReader Engine. Consultez la section Installation pour savoir à quels modules d’ABBYY FineReader Engine correspondent les différentes langues de reconnaissance. ABBYY FineReader Engine fournit des langues de reconnaissance de base pour la Reconnaissance optique de caractères (OCR) et l’ICR, avec prise en charge complète des dictionnaires intégrés. Certaines langues de reconnaissance sont disponibles uniquement pour l’OCR ou ne prennent pas entièrement en charge les dictionnaires intégrés. Consultez le tableau ci-dessous pour plus de détails.
ABBYY FineReader Engine pour Windows fournit également un ensemble de langues de reconnaissance spécifiques. Ces langues contiennent des unités linguistiques spéciales (adresses, date et heure, noms de personnes, etc.). Elles peuvent être utilisées pour la reconnaissance de champs. Consultez la liste des langues prédéfinies spéciales pour plus d’informations.
Nom interneLangue de reconnaissanceUtilisable pour l’OCRPrise en charge complète du dictionnairePrise en charge du texte manuscrit (++) ou écrit en lettres moulées (+)1Peut être utilisé pour la classification de texte2Peut être utilisé pour la BCR
AbkhazeAbkhaze*
adyghéadyghé-
afrikaansafrikaans*-
agoulAgoul*
AlbanaisAlbanais-*
AltaïqueAltaïque-
ArabeArabe (Arabie saoudite)*-3*
ArmenianEasternarménien (oriental)-*-
ArmenianGrabarArménien (grabar)*-*
ArmenianWesternArménien (occidental)-*-
AwarAvar*
AymaraAymara-*
AzeriCyrillicAzéri (cyrillique)-
AzeriLatinAzéri (latin)*-*-
BanglaBangla*
bachkirbachkir-*-
Basiclangage de programmation BASIC*
Basquebasque-*
Biélorussebiélorusse-
BembaBemba*-
BlackfootBlackfoot*-
Bretonbreton*-
BugotuBugotu*-
BulgarianBulgare*-*-
BirmanBirman*
BouriateBouriate-*
C++langage de programmation C/C++-
Catalancatalan*-*
chamorrochamorro-*
ChechenTchétchène-
ChemistryFormules chimiques simples*
ChinesePRCChinois simplifié-*
ChineseTaiwanchinois traditionnel-*
Chukchatchouktche-
ChuvashTchouvache*
CMC7Pour le texte de type MICR (CMC-7)4-
COBOLlangage de programmation COBOL*
CorsicanCorse-*
CrimeanTatarTatar de Crimée-*
CroateCroate-*-*
Crowcri-*
Czechtchèque-*-*-
DanishDanois*-*-*
DargwaDargwa-
DigitsChiffres*-
Dounganedoungane*
Néerlandaisnéerlandais (Pays-Bas)-*-*-
DutchBelgianNéerlandais (Belgique)*-*-
E13BPour le type de texte MICR (E-13B)4*
AnglaisAnglais-*++<br />(y compris le texte manuscrit)-*
EskimoCyrillicEsquimau (cyrillique)-
EskimoLatinEsquimau (latin)*
Esperantoespéranto-
Estonianestonien*-*-*
ÉvèneÉvène-*
EvenkiEvenki-*
FéroïenFéroïen-
PersanPersan*-*
FidjienFidjien-*
FinnoisFinnois-*-*-
Fortranlangage de programmation Fortran*
FrançaisFrançais-*++<br />(y compris le texte manuscrit)-*
frisonfrison-*
frioulanfrioulan-*
GaelicScottishgaélique écossais5-*
Gagauzgagaouze-
GalicienGalicien*-
GandaGanda*-
GéorgienGéorgien6*
AllemandAllemand-*++<br />(y compris l’écriture manuscrite)-*
GermanLuxembourgAllemand (Luxembourg)-*
GermanNewSpellingAllemand (nouvelle orthographe)-*-*
grecgrec-*-*-
GuaraniGuarani*-
HaniHani*-
HaoussaHaoussa*
HawaïenHawaïen-*
HébreuHébreu-*-
HongroisHongrois*-*-*
islandaisislandais-
idoido*-
indonésienindonésien*-*-*
IngoucheIngouche-
InterlinguaInterlingua*-
IrlandaisIrlandais5*-
ItalienItalien*-*-*
Japonaisjaponais-*++<br />(y compris l’écriture manuscrite)-*
JapaneseModernJaponais (moderne)-*-*
Javalangage de programmation Java-
KabardienKabardien*
KalmoukKalmouk-
KarachayBalkarkaratchaï-balkar*-
Karakalpakkarakalpak*
Kasubkachoube-*
Kawakawa-*
kazakhkazakh-*
khakassekhakasse-
KhantyKhanty*
KikuyuKikuyu-
KirgizKirghize*-
KongoKongo*-
CoréenCoréen*-*-
KoreanHangulcoréen (hangul)*-*
KoriakKoriak-
KpelléKpellé*-
koumykkoumyk*-
kurdekurde*-
LakLak*
Lappishsami (lapon)-*
LatinLatin-*-*
LatvianLetton-*-*
LatvianGothicLetton en écriture gothique-
LezginLezghien*
LithuanianLituanien-*-*
LubaLuba-*
MacédonienMacédonien-
MalgacheMalgache*-
MalaisMalais*
malinkémalinké-*
maltaismaltais-
MansiMansi*
MaoriMaori-*
MathématiqueMathématique-
MariMari*
MayaMaya-*
MiaoMiao-*
MinankabawMinangkabau-*
Mohawkmohawk-*
Mongolmongol-*
MordveMordve-*
NahuatlNahuatl-*
Nenetsnénètse-*
Nivkhnivkhe-*
NogaïNogaï-*
NorvégienNorvégien nynorsk et norvégien bokmål-*-*-
NorwegianBokmalnorvégien (bokmål)*-*-*
NorwegianNynorsknorvégien (nynorsk)-*-*-
NyanjaNyanja*-
OccidentalOccidental*
OcrAPour le type de texte OCR-A-
OcrBPour le type de texte OCR-B*
Ojibwayojibwé-*
OldEnglishvieil anglais-*-*
OldFrenchancien français-*-*
OldGermanvieux haut allemand-*-*
OldItalianItalien ancien-*-*
OldSlavonicvieux-slave-
OldSpanishvieil espagnol*-*-
OssèteOssète*
PapiamentoPapiamento-*
Pascallangage de programmation Pascal-
PidginEnglishTok Pisin*-
polonaispolonais*-*-*
PortugueseBrazilianportugais (Brésil)-*-*-
PortugueseStandardPortugais (Portugal)*-*-*
provençalprovençal-
quechuaquechua*-
RhaetoRomanicRhéto-roman*-
RomanianRoumain*-*-
RomanianMoldaviaRoumain (Moldavie)*-
romaniromani*-
rouandarouanda*-
RundiRundi*-
RussianOldSpellingRusse (ancienne orthographe)*-*
RussianRusse-*-*-
RussianWithAccentRusse (avec des accents indiquant la position de l’accent tonique)*-*
samoansamoan-*
selkoupeselkoupe-*
SerbianCyrillicserbe (cyrillique)-*
SerbianLatinSerbe (latin)-*
ShonaShona-
Siouxsioux (dakota)*-
slovaqueslovaque*-*-
SlovèneSlovène*-*-
somalisomali*-
sorabesorabe*
sothosotho-*
espagnolespagnol-*++<br />(y compris l’écriture manuscrite)-*
Sundasoundanais-
swahiliswahili*-
swatiswati*-
SuédoisSuédois*-*-*
TabassaranTabassaran-
TagalogTagalog*-
tahitientahitien*-
tadjiktadjik*-
tatartatar*-*
thaïthaï-*-
TinpoJingpo*-
TongienTonguien*-
TswanaTswana*-
TunTun*-
TurkishTurc*-*-*
Turkmenturkmène-
TurkmenLatinturkmène (latin)*-
TuvinTouvain*-
UdmurtOudmourte*
UighurCyrillicouïghour (cyrillique)-
UighurLatinouïghour (latin)*-
UkrainienUkrainien*-*-*
UzbekCyrillicOuzbek (cyrillique)-
UzbekLatinOuzbek (latin)*-
VietnamienVietnamien*-*
VisayenCebuano-*
GalloisGallois-
WolofWolof*-
XhosaXhosa*-
IakouteIakoute*
yiddishyiddish+7
zapotèquezapotèque-*
Zuluzoulou-
1Plusieurs langues prennent en charge la reconnaissance du texte manuscrit : anglais, allemand, français, japonais et espagnol. Les autres langues marquées dans cette colonne prennent uniquement en charge le texte en caractères d’imprimerie. Les mêmes paramètres (IPageAnalysisParams::DetectHandwritten et IRecognizerParams::TextTypes = TT_Handwritten) permettent de reconnaître du texte manuscrit ou en caractères d’imprimerie, selon l’option prise en charge par la langue. 2Le classificateur qui utilise uniquement les caractéristiques de l’image peut être utilisé pour des documents dans n’importe quelle langue. Les classificateurs basés sur le texte (ClassifierTypeEnum::CT_Combined, ClassifierTypeEnum::CT_Text) sont disponibles uniquement pour les documents reconnus dans des langues qui disposent d’une prise en charge complète des dictionnaires. 3 La reconnaissance ICR de l’arabe n’est pas prise en charge. Cependant, les chiffres arabes en caractères d’imprimerie peuvent être reconnus. Voir Reconnaissance des chiffres arabes en caractères d’imprimerie. 4 Si vous souhaitez reconnaître un bloc avec le type de texte MICR, utilisez uniquement des langues comportant des caractères latins, et non des combinaisons de langues latines et CJK. 5 FineReader Engine ne prend pas en charge certains symboles spéciaux comportant des signes diacritiques en gaélique écossais et en irlandais. 6 Les caractères nuskhuri et mtavruli sont reconnus séparément, mais les deux types de caractères sont enregistrés dans les chaînes Unicode du nuskhuri. 7 Quelques caractères standard (veys בֿ, pasekh alef אַ, komets alef אָ, pasekh tsvey yudn ײַ, melupm vov וּ) ne sont pas pris en charge dans la langue yiddish prédéfinie. Pour reconnaître ces caractères, créez une nouvelle langue personnalisée et ajoutez-y ces caractères à l’aide de la propriété LetterSet de l’objet TextLanguage (voir Utilisation des langues), puis définissez la nouvelle langue comme langue de reconnaissance. Sous Windows, utilisez le scénario décrit dans Reconnaissance avec apprentissage et Apprentissage pour reconnaître les ligatures. Voir aussi LanguageIdEnum Utilisation des langues