Langues prédéfinies dans ABBYY FineReader Engine

Voici la liste des noms internes des langues prédéfinies prises en charge par ABBYY FineReader Engine. La disponibilité de telle ou telle langue de reconnaissance prédéfinie dépend de la présence des modules correspondants dans les fichiers d’ABBYY FineReader Engine. Consultez la section Installation pour savoir à quels modules d’ABBYY FineReader Engine correspondent les différentes langues de reconnaissance. ABBYY FineReader Engine fournit des langues de reconnaissance de base pour la Reconnaissance optique de caractères (OCR) et l’ICR, avec prise en charge complète des dictionnaires intégrés. Certaines langues de reconnaissance sont disponibles uniquement pour l’OCR ou ne prennent pas entièrement en charge les dictionnaires intégrés. Consultez le tableau ci-dessous pour plus de détails.

ABBYY FineReader Engine pour Windows fournit également un ensemble de langues de reconnaissance spécifiques. Ces langues contiennent des unités linguistiques spéciales (adresses, date et heure, noms de personnes, etc.). Elles peuvent être utilisées pour la reconnaissance de champs. Consultez la liste des langues prédéfinies spéciales pour plus d’informations.

Nom interne	Langue de reconnaissance	Utilisable pour l’OCR	Prise en charge complète du dictionnaire	Prise en charge du texte manuscrit (++) ou écrit en lettres moulées (+)1	Peut être utilisé pour la classification de texte2	Peut être utilisé pour la BCR
Abkhaze	Abkhaze	*
adyghé	adyghé	-
afrikaans	afrikaans	*		-
agoul	Agoul	*
Albanais	Albanais	-		*
Altaïque	Altaïque	-
Arabe	Arabe (Arabie saoudite)	*	-	3	*
ArmenianEastern	arménien (oriental)	-	*		-
ArmenianGrabar	Arménien (grabar)	*	-		*
ArmenianWestern	Arménien (occidental)	-	*		-
Awar	Avar	*
Aymara	Aymara	-		*
AzeriCyrillic	Azéri (cyrillique)	-
AzeriLatin	Azéri (latin)	*	-	*	-
Bangla	Bangla	*
bachkir	bachkir	-	*		-
Basic	langage de programmation BASIC	*
Basque	basque	-		*
Biélorusse	biélorusse	-
Bemba	Bemba	*		-
Blackfoot	Blackfoot	*		-
Breton	breton	*		-
Bugotu	Bugotu	*		-
Bulgarian	Bulgare	*	-	*	-
Birman	Birman	*
Bouriate	Bouriate	-		*
C++	langage de programmation C/C++	-
Catalan	catalan	*	-		*
chamorro	chamorro	-		*
Chechen	Tchétchène	-
Chemistry	Formules chimiques simples	+
ChineseSimplified	Chinois simplifié	+				+
ChineseTraditional	Chinois traditionnel	+				+
Chukcha	Tchoukhtche	+
Chuvash	Tchouvache	+
CMC7	Pour le texte de type MICR (CMC-7)4	+
COBOL	Langage de programmation COBOL	+
Corsican	Corse	+		+
CrimeanTatar	Tatar de Crimée	+		+
Croatian	Croate	+	+	+	+
Crow	Cri	+		+
Czech	Tchèque	+	+	+	+	+
Danish	Danois	+	+	+	+	+
Dargwa	Dargwa	+
Digits	Chiffres	+		+
Dungan	Doungane	+
Dutch	Néerlandais (Pays-Bas)	+	+	+	+	+
DutchBelgian	Néerlandais (Belgique)	+	+	+	+
E13B	Pour le type de texte MICR (E-13B)4	+
English	Anglais	+	+	++ (y compris le texte manuscrit)	+	+
EskimoCyrillic	Esquimau (cyrillique)	+
EskimoLatin	Esquimau (latin)	+
Esperanto	Espéranto	+
Estonian	Estonien	+	+	+	+	+
Even	Évène	+		+
Evenki	Evenki	+		+
Faeroese	Féroïen	+
Farsi	Persan	+	+		+
Fijian	Fidjien	+		+
Finnish	Finnois	+	+	+	+	+
Fortran	langage de programmation Fortran	+
Français	Français	+	+	++ (y compris le texte manuscrit)	+	+
frison	frison	+		+
frioulan	frioulan	+		+
GaelicScottish	gaélique écossais5	+		+
Gagauz	gagaouze	+
Galicien	Galicien	+		+
Ganda	Ganda	+		+
Géorgien	Géorgien6	+
Allemand	Allemand	+	+	++ (y compris l’écriture manuscrite)	+	+
GermanLuxembourg	Allemand (Luxembourg)	+		+
GermanNewSpelling	Allemand (nouvelle orthographe)	+	+	+	+
grec	grec	+	+	+	+	+
Guarani	Guarani	+		+
Hani	Hani	+		+
Haoussa	Haoussa	+
Hawaïen	Hawaïen	+		+
Hébreu	Hébreu	+	+		+
Hongrois	Hongrois	+	+	+	+	+
islandais	islandais	+
ido	ido	+		+
indonésien	indonésien	+	+	+	+	+
Ingouche	Ingouche	+
Interlingua	Interlingua	+		+
Irlandais	Irlandais5	+		+
Italien	Italien	+	+	+	+	+
Japonais	japonais	+	+	++ (y compris l’écriture manuscrite)	+	+
JapaneseModern	Japonais (moderne)	+	+		+	+
Java	langage de programmation Java	+
Kabardien	Kabardien	+
Kalmouk	Kalmouk	-
KarachayBalkar	karatchaï-balkar	*		-
Karakalpak	karakalpak	*
Kasub	kachoube	-		*
Kawa	kawa	-		*
kazakh	kazakh	-		*
khakasse	khakasse	-
Khanty	Khanty	*
Kikuyu	Kikuyu	-
Kirgiz	Kirghize	*		-
Kongo	Kongo	*		-
Coréen	Coréen	*	-		*	-
KoreanHangul	coréen (hangul)	*	-		*
Koriak	Koriak	-
Kpellé	Kpellé	*		-
koumyk	koumyk	*		-
kurde	kurde	*		-
Lak	Lak	*
Lappish	sami (lapon)	-		*
Latin	Latin	-	*	-	*
Latvian	Letton	-	*	-	*
LatvianGothic	Letton en écriture gothique	-
Lezgin	Lezghien	*
Lithuanian	Lituanien	-	*	-	*
Luba	Luba	-		*
Macédonien	Macédonien	-
Malgache	Malgache	*		-
Malais	Malais	*
malinké	malinké	-		*
maltais	maltais	-
Mansi	Mansi	*
Maori	Maori	-		*
Mathématique	Mathématique	-
Mari	Mari	*
Maya	Maya	-		*
Miao	Miao	-		*
Minankabaw	Minangkabau	-		*
Mohawk	mohawk	-		*
Mongol	mongol	-		*
Mordve	Mordve	-		*
Nahuatl	Nahuatl	-		*
Nenets	nénètse	-		*
Nivkh	nivkhe	-		*
Nogaï	Nogaï	-		*
Norvégien	Norvégien nynorsk et norvégien bokmål	-	*	-	*	-
NorwegianBokmal	norvégien (bokmål)	*	-	*	-	*
NorwegianNynorsk	norvégien (nynorsk)	-	*	-	*	-
Nyanja	Nyanja	*		-
Occidental	Occidental	*
OcrA	Pour le type de texte OCR-A	-
OcrB	Pour le type de texte OCR-B	*
Ojibway	ojibwé	-		*
OldEnglish	vieil anglais	-	*	-	*
OldFrench	ancien français	-	*	-	*
OldGerman	vieux haut allemand	-	*	-	*
OldItalian	Italien ancien	-	*	-	*
OldSlavonic	vieux-slave	-
OldSpanish	vieil espagnol	*	-	*	-
Ossète	Ossète	*
Papiamento	Papiamento	-		*
Pascal	Pascal programming language	+
PidginEnglish	Tok Pisin	+		+
Polish	Polish	+	+	+	+	+
PortugueseBrazilian	Portuguese (Brazil)	+	+	+	+	+
PortugueseStandard	Portuguese (Portugal)	+	+	+	+	+
Provencal	Provencal	+
Quechua	Quechua	+		+
RhaetoRomanic	Rhaeto-Romanic	+		+
Romanian	Romanian	+	+	+	+
RomanianMoldavia	Romanian (Moldavia)	+		+
Romany	Romany	+		+
Ruanda	Ruanda	+		+
Rundi	Rundi	+		+
RussianOldSpelling	Russian (old spelling)	+	+		+
Russian	Russian	+	+	+	+	+
RussianWithAccent	Russian (with accents marking stress position)	+	+		+
Samoan	Samoan	+		+
Selkup	Selkup	+		+
SerbianCyrillic	Serbian (Cyrillic)	+		+
SerbianLatin	Serbian (Latin)	+		+
Shona	Shona	+
Sioux	Sioux (Dakota)	+		+
Slovak	Slovak	+	+	+	+
Slovenian	Slovenian	+	+	+	+
Somali	Somali	+		+
Sorbian	Sorbian	+
Sotho	Sotho	+		+
Spanish	Spanish	+	+	++ (including handwritten)	+	+
Sunda	Sunda	+
Swahili	Swahili	+		+
swati	swati	*		-
Suédois	Suédois	*	-	*	-	*
Tabassaran	Tabassaran	-
Tagalog	Tagalog	*		-
tahitien	tahitien	*		-
tadjik	tadjik	*		-
tatar	tatar	*	-		*
thaï	thaï	-	*		-
Tinpo	Jingpo	*		-
Tongien	Tonguien	*		-
Tswana	Tswana	*		-
Tun	Tun	*		-
Turkish	Turc	*	-	*	-	*
Turkmen	turkmène	-
TurkmenLatin	turkmène (latin)	*		-
Tuvin	Touvain	*		-
Udmurt	Oudmourte	*
UighurCyrillic	ouïghour (cyrillique)	-
UighurLatin	ouïghour (latin)	*		-
Ukrainien	Ukrainien	*	-	*	-	*
UzbekCyrillic	Ouzbek (cyrillique)	-
UzbekLatin	Ouzbek (latin)	*		-
Vietnamien	Vietnamien	*	-		*
Visayen	Cebuano	-		*
Gallois	Gallois	-
Wolof	Wolof	*		-
Xhosa	Xhosa	*		-
Iakoute	Iakoute	*
yiddish	yiddish	+7
zapotèque	zapotèque	-		*
Zulu	zoulou	-

1Plusieurs langues prennent en charge la reconnaissance du texte manuscrit : anglais, allemand, français, japonais et espagnol. Les autres langues marquées dans cette colonne prennent uniquement en charge le texte en caractères d’imprimerie. Les mêmes paramètres (IPageAnalysisParams::DetectHandwritten et IRecognizerParams::TextTypes = TT_Handwritten) permettent de reconnaître du texte manuscrit ou en caractères d’imprimerie, selon l’option prise en charge par la langue. 2Le classificateur qui utilise uniquement les caractéristiques de l’image peut être utilisé pour des documents dans n’importe quelle langue. Les classificateurs basés sur le texte (ClassifierTypeEnum::CT_Combined, ClassifierTypeEnum::CT_Text) sont disponibles uniquement pour les documents reconnus dans des langues qui disposent d’une prise en charge complète des dictionnaires. 3 La reconnaissance ICR de l’arabe n’est pas prise en charge. Cependant, les chiffres arabes en caractères d’imprimerie peuvent être reconnus. Voir Reconnaissance des chiffres arabes en caractères d’imprimerie. 4 Si vous souhaitez reconnaître un bloc avec le type de texte MICR, utilisez uniquement des langues comportant des caractères latins, et non des combinaisons de langues latines et CJK. 5 FineReader Engine ne prend pas en charge certains symboles spéciaux comportant des signes diacritiques en gaélique écossais et en irlandais. 6 Les caractères nuskhuri et mtavruli sont reconnus séparément, mais les deux types de caractères sont enregistrés dans les chaînes Unicode du nuskhuri. 7 Quelques caractères standard (veys בֿ, pasekh alef אַ, komets alef אָ, pasekh tsvey yudn ײַ, melupm vov וּ) ne sont pas pris en charge dans la langue yiddish prédéfinie. Pour reconnaître ces caractères, créez une nouvelle langue personnalisée et ajoutez-y ces caractères à l’aide de la propriété LetterSet de l’objet TextLanguage (voir Utilisation des langues), puis définissez la nouvelle langue comme langue de reconnaissance. Sous Windows, utilisez le scénario décrit dans Reconnaissance avec apprentissage et Apprentissage pour reconnaître les ligatures. Voir aussi LanguageIdEnum Utilisation des langues