Idiomas predefinidos no ABBYY FineReader Engine

A seguir, a lista de nomes internos dos idiomas predefinidos compatíveis com o ABBYY FineReader Engine. A disponibilidade de cada idioma de reconhecimento predefinido depende da presença dos módulos correspondentes nos arquivos do ABBYY FineReader Engine. Consulte a seção Instalação para saber quais idiomas de reconhecimento correspondem a quais módulos do ABBYY FineReader Engine. O ABBYY FineReader Engine oferece os principais idiomas de reconhecimento para OCR e ICR com suporte completo a dicionário integrado. Alguns idiomas de reconhecimento estão disponíveis apenas para OCR ou não contam com suporte completo a dicionário integrado. Veja os detalhes na tabela abaixo.

O ABBYY FineReader Engine for Windows também oferece um conjunto de idiomas de reconhecimento específicos. Esses idiomas contêm unidades linguísticas especiais (endereços, data e hora, nomes de pessoas etc.). Esses idiomas podem ser usados para reconhecimento de campos. Consulte a lista de idiomas predefinidos especiais para mais informações.

Nome interno	Idioma de reconhecimento	Pode ser usado para OCR	Suporte completo a dicionário	Suporta texto manuscrito (++) ou manuscrito em letra de forma (+)1	Pode ser usado para classificação com base em texto2	Pode ser utilizado para BCR
Abkhaz	Abecásio	*
Adigue	Adigue	-
Africâner	Africâner	*		-
Agul	Agul	*
Albanian	Albanês	-		*
Altaic	Altaico	-
Árabe	Árabe (Arábia Saudita)	*	-	3	*
ArmenianEastern	Armênio (oriental)	-	*		-
ArmenianGrabar	Armênio (Grabar)	*	-		*
ArmenianWestern	Armênio (Ocidental)	-	*		-
Awar	Ávaro	*
Aymara	Aimará	-		*
AzeriCyrillic	Azerbaijano (Cirílico)	-
AzeriLatin	Azerbaijano (Latim)	*	-	*	-
Bangla	Bangla	*
Bashkir	Basquir	-	*		-
Basic	Linguagem de programação BASIC	*
Basco	Basco	-		*
Bielorrusso	Bielorrusso	-
Bemba	Bemba	*		-
Blackfoot	Blackfoot	*		-
Bretão	Bretão	*		-
Bugotu	Bugotu	*		-
Búlgaro	Búlgaro	*	-	*	-
Birmanês	Birmanês	*
Buriato	Buriato	-		*
C++	linguagem de programação C/C++	-
Catalão	Catalão	*	-		*
Chamorro	Chamorro	-		*
Chechen	Checheno	-
Chemistry	Fórmulas químicas simples	*
ChinesePRC	Chinês simplificado	-				*
ChineseTaiwan	chinês tradicional	-				*
Chukcha	chukcha	-
Chuvash	Chuvache	*
CMC7	Para texto do tipo MICR (CMC-7)4	-
COBOL	linguagem de programação COBOL	*
Corsican	Corso	-		*
CrimeanTatar	Tártaro da Crimeia	-		*
Croata	Croata	-	*	-	*
Crow	Crow	-		*
Czech	Tcheco	-	*	-	*	-
Danish	Dinamarquês	*	-	*	-	*
Dargwa	Dargwa	-
Dígitos	Números	*		-
Dungano	Dungano	*
Holandês	Holandês (Países Baixos)	-	*	-	*	-
DutchBelgian	Holandês (Bélgica)	*	-	*	-
E13B	Para texto do tipo MICR (E-13B)4	*
Inglês	Inglês	-	*	++<br />(incluindo texto manuscrito)	-	*
EskimoCyrillic	Esquimó (Cirílico)	-
EskimoLatin	Esquimó (Latino)	*
Esperanto	Esperanto	-
Estoniano	Estoniano	*	-	*	-	*
Even	Even	-		*
Evenki	Evenki	-		*
Feroês	Feroês	-
Persa	Persa	*	-		*
Fijiano	Fijiano	-		*
Finlandês	Finlandês	-	*	-	*	-
Fortran	Linguagem de programação Fortran	*
Francês	Francês	-	*	++<br />(incluindo texto manuscrito)	-	*
Frísio	Frísio	-		*
Friulano	Friulano	-		*
GaelicScottish	Gaélico escocês5	-		*
Gagauz	Gagauz	-
Galego	Galego	*		-
Ganda	Ganda	*		-
Georgiano	Georgiano6	*
Alemão	Alemão	-	*	++<br />(incluindo texto manuscrito)	-	*
GermanLuxembourg	Alemão (Luxemburgo)	-		*
NovaOrtografiaDoAlemão	Alemão (nova ortografia)	-	*	-	*
Grego	Grego	-	*	-	*	-
Guarani	Guarani	*		-
Hani	Hani	*		-
hauçá	hauçá	*
havaiano	havaiano	-		*
Hebraico	Hebraico	-	*		-
Húngaro	Húngaro	*	-	*	-	*
Islandês	Islandês	-
Ido	Ido	*		-
Indonésio	Indonésio	*	-	*	-	*
Inguche	Inguche	-
Interlíngua	Interlíngua	*		-
Irlandês	Irlandês5	*		-
Italiano	Italiano	*	-	*	-	*
Japonês	Japonês	-	*	++<br />(incluindo texto manuscrito)	-	*
JapaneseModern	Japonês (moderno)	-	*		-	*
Java	idioma de programação Java	-
Cabardiano	Cabardiano	*
Calmuco	Calmuco	-
Carachai-Bálcaro	Carachai-Bálcaro	*		-
Caracalpaque	Caracalpaque	*
Kasub	Cassúbio	-		*
Kawa	Kawa	-		*
Cazaque	Cazaque	-		*
Khakas	Khakas	-
Khanty	Khanty	*
Kikuyu	Kikuyu	-
Quirguiz	Quirguiz	*		-
Quicongo	Quicongo	*		-
Coreano	Coreano	*	-		*	-
KoreanHangul	Coreano (Hangul)	*	-		*
Koriak	Koriak	-
Kpelle	Kpelle	*		-
Cumique	Cumique	*		-
Curdo	Curdo	*		-
Lak	Lak	*
Lapão	Sami (lapão)	-		*
Latim	Latim	-	*	-	*
Latvian	Letão	-	*	-	*
LatvianGothic	Idioma letão escrito na escrita gótica	-
Lezguiano	Lezguiano	*
Lituano	Lituano	-	*	-	*
Luba	Luba	-		*
Macedônio	Macedônio	-
Malgaxe	Malgaxe	*		-
Malaio	Malaio	*
Malinquê	Malinquê	-		*
Maltês	Maltês	-
Mansi	Mansi	*
Maori	Maori	-		*
Matemática	Matemática	-
Mari	Mari	*
Maya	Maya	-		*
Miao	Miao	-		*
Minankabaw	Minangkabau	-		*
Mohawk	Mohawk	-		*
Mongol	Mongol	-		*
Mordvino	Mordvino	-		*
Náuatle	Náuatle	-		*
Nenets	Nenets	-		*
Nivkh	Nivkh	-		*
Nogai	Nogai	-		*
Norueguês	Norueguês nynorsk e norueguês bokmål	-	*	-	*	-
NorwegianBokmal	Norueguês (Bokmål)	*	-	*	-	*
NorwegianNynorsk	Norueguês (Nynorsk)	-	*	-	*	-
Nianja	Nianja	*		-
Ocidental	Ocidental	*
OcrA	Para o tipo de texto OCR-A	-
OcrB	Para o tipo de texto OCR-B	*
Ojibway	Ojíbua	-		*
OldEnglish	Inglês antigo	-	*	-	*
OldFrench	Francês Antigo	-	*	-	*
OldGerman	Alto alemão antigo	-	*	-	*
OldItalian	Italiano antigo	-	*	-	*
OldSlavonic	Eslavo antigo	-
EspanholAntigo	Espanhol antigo	*	-	*	-
Osseta	Osseta	*
Papiamento	Papiamento	-		*
Pascal	linguagem de programação Pascal	-
PidginEnglish	Tok Pisin	*		-
Polonês	Polonês	*	-	*	-	*
PortugueseBrazilian	Português (Brasil)	-	*	-	*	-
PortugueseStandard	Português (Portugal)	*	-	*	-	*
Provençal	Provençal	-
Quíchua	Quíchua	*		-
RhaetoRomanic	Reto-românico	*		-
Romanian	Romeno	*	-	*	-
RomanianMoldavia	Romeno (Moldávia)	*		-
Romani	Romani	*		-
Ruanda	Ruanda	*		-
Rundi	Rundi	*		-
RussianOldSpelling	Russo (ortografia antiga)	*	-		*
Russo	Russo	-	*	-	*	-
RussianWithAccent	Russo (com acentos indicando a posição da sílaba tônica)	*	-		*
Samoano	Samoano	-		*
Selkup	Selkup	-		*
SerbianCyrillic	Sérvio (cirílico)	-		*
SerbianLatin	Sérvio (latino)	-		*
Shona	Shona	-
Sioux	Sioux (Dakota)	*		-
Eslovaco	Eslovaco	*	-	*	-
esloveno	esloveno	*	-	*	-
Somali	Somali	*		-
Sorbiano	Sorbiano	*
Sotho	Sotho	-		*
Espanhol	Espanhol	-	*	++<br />(incluindo escrita manuscrita)	-	*
Sunda	Sundanês	-
suaíli	suaíli	*		-
suázi	suázi	*		-
Swedish	Sueco	*	-	*	-	*
Tabassaran	Tabassarano	-
Tagalog	Tagalo	*		-
Taitiano	Taitiano	*		-
Tajique	Tajique	*		-
Tártaro	Tártaro	*	-		*
Tailandês	Tailandês	-	*		-
Tinpo	Jingpo	*		-
Tongan	Tonganês	*		-
Tswana	Tswana	*		-
Tun	Tun	*		-
Turco	Turco	*	-	*	-	*
Turkmen	Turcomeno	-
TurkmenLatin	Turcomeno (latino)	*		-
Tuvin	Tuvano	*		-
Udmurt	Udmurte	*
UighurCyrillic	Uigur (Cirílico)	-
UighurLatin	Uigur (Latino)	*		-
Ucraniano	Ucraniano	*	-	*	-	*
UzbekCyrillic	Uzbeque (Cirílico)	-
UzbekLatin	Uzbeque (Latino)	*		-
Vietnamita	Vietnamita	*	-		*
Bisáio	Cebuano	-		*
Galês	Galês	-
Uolofe	Uolofe	*		-
Xhosa	Xhosa	*		-
Iacuto	Iacuto	*
Iídiche	Iídiche	+7
Zapoteca	Zapoteca	-		*
Zulu	Zulu	-

1Vários idiomas oferecem suporte ao reconhecimento de texto manuscrito: inglês, alemão, francês, japonês e espanhol. Outros idiomas marcados nesta coluna oferecem suporte apenas a texto manuscrito em letra de forma. As mesmas configurações (IPageAnalysisParams::DetectHandwritten e IRecognizerParams::TextTypes = TT_Handwritten) habilitam o reconhecimento de texto manuscrito ou manuscrito em letra de forma, dependendo da opção compatível com o idioma. 2O classificador que usa apenas características da imagem pode ser usado para documentos em qualquer idioma. Os classificadores baseados em texto (ClassifierTypeEnum::CT_Combined, ClassifierTypeEnum::CT_Text) estão disponíveis apenas para documentos reconhecidos em idiomas com suporte completo a dicionário. 3 O ICR para árabe não tem suporte. No entanto, algarismos arábicos manuscritos em letra de forma podem ser reconhecidos. Consulte Reconhecimento de algarismos arábicos manuscritos em letra de forma. 4 Se você quiser reconhecer um bloco com o tipo de texto MICR, use apenas idiomas com caracteres latinos, e não combinações de idiomas latinos e CJK. 5 O FineReader Engine não oferece suporte a alguns símbolos especiais com diacríticos nos idiomas gaélico escocês e irlandês. 6 Os caracteres Nuskhuri e Mtavruli são reconhecidos separadamente, mas ambos os tipos de caracteres são salvos nas strings Unicode de Nuskhuri. 7 Alguns caracteres padrão (veys בֿ, pasekh alef אַ, komets alef אָ, pasekh tsvey yudn ײַ, melupm vov וּ) não têm suporte no idioma iídiche predefinido. Para reconhecer esses caracteres, crie um novo idioma personalizado e adicione esses caracteres a ele usando a propriedade LetterSet do objeto TextLanguage (consulte Trabalhando com idiomas) e, em seguida, defina o novo idioma como idioma de reconhecimento. No Windows, use o cenário descrito em Reconhecimento usando treinamento e Treinamento para reconhecer ligaturas. Veja também LanguageIdEnum Trabalhando com idiomas

Visão geral

Formatos de exportação

Problemas de compatibilidade retroativa

Idiomas predefinidos no ABBYY FineReader Engine