Pular para o conteúdo principal
A seguir, a lista de nomes internos dos idiomas predefinidos compatíveis com o ABBYY FineReader Engine. A disponibilidade de cada idioma de reconhecimento predefinido depende da presença dos módulos correspondentes nos arquivos do ABBYY FineReader Engine. Consulte a seção Instalação para saber quais idiomas de reconhecimento correspondem a quais módulos do ABBYY FineReader Engine. O ABBYY FineReader Engine oferece os principais idiomas de reconhecimento para OCR e ICR com suporte completo a dicionário integrado. Alguns idiomas de reconhecimento estão disponíveis apenas para OCR ou não contam com suporte completo a dicionário integrado. Veja os detalhes na tabela abaixo.
O ABBYY FineReader Engine for Windows também oferece um conjunto de idiomas de reconhecimento específicos. Esses idiomas contêm unidades linguísticas especiais (endereços, data e hora, nomes de pessoas etc.). Esses idiomas podem ser usados para reconhecimento de campos. Consulte a lista de idiomas predefinidos especiais para mais informações.
Nome internoIdioma de reconhecimentoPode ser usado para OCRSuporte completo a dicionárioSuporta texto manuscrito (++) ou manuscrito em letra de forma (+)1Pode ser usado para classificação com base em texto2Pode ser utilizado para BCR
AbkhazAbecásio*
AdigueAdigue-
AfricânerAfricâner*-
AgulAgul*
AlbanianAlbanês-*
AltaicAltaico-
ÁrabeÁrabe (Arábia Saudita)*-3*
ArmenianEasternArmênio (oriental)-*-
ArmenianGrabarArmênio (Grabar)*-*
ArmenianWesternArmênio (Ocidental)-*-
AwarÁvaro*
AymaraAimará-*
AzeriCyrillicAzerbaijano (Cirílico)-
AzeriLatinAzerbaijano (Latim)*-*-
BanglaBangla*
BashkirBasquir-*-
BasicLinguagem de programação BASIC*
BascoBasco-*
BielorrussoBielorrusso-
BembaBemba*-
BlackfootBlackfoot*-
BretãoBretão*-
BugotuBugotu*-
BúlgaroBúlgaro*-*-
BirmanêsBirmanês*
BuriatoBuriato-*
C++linguagem de programação C/C++-
CatalãoCatalão*-*
ChamorroChamorro-*
ChechenChecheno-
ChemistryFórmulas químicas simples*
ChinesePRCChinês simplificado-*
ChineseTaiwanchinês tradicional-*
Chukchachukcha-
ChuvashChuvache*
CMC7Para texto do tipo MICR (CMC-7)4-
COBOLlinguagem de programação COBOL*
CorsicanCorso-*
CrimeanTatarTártaro da Crimeia-*
CroataCroata-*-*
CrowCrow-*
CzechTcheco-*-*-
DanishDinamarquês*-*-*
DargwaDargwa-
DígitosNúmeros*-
DunganoDungano*
HolandêsHolandês (Países Baixos)-*-*-
DutchBelgianHolandês (Bélgica)*-*-
E13BPara texto do tipo MICR (E-13B)4*
InglêsInglês-*++<br />(incluindo texto manuscrito)-*
EskimoCyrillicEsquimó (Cirílico)-
EskimoLatinEsquimó (Latino)*
EsperantoEsperanto-
EstonianoEstoniano*-*-*
EvenEven-*
EvenkiEvenki-*
FeroêsFeroês-
PersaPersa*-*
FijianoFijiano-*
FinlandêsFinlandês-*-*-
FortranLinguagem de programação Fortran*
FrancêsFrancês-*++<br />(incluindo texto manuscrito)-*
FrísioFrísio-*
FriulanoFriulano-*
GaelicScottishGaélico escocês5-*
GagauzGagauz-
GalegoGalego*-
GandaGanda*-
GeorgianoGeorgiano6*
AlemãoAlemão-*++<br />(incluindo texto manuscrito)-*
GermanLuxembourgAlemão (Luxemburgo)-*
NovaOrtografiaDoAlemãoAlemão (nova ortografia)-*-*
GregoGrego-*-*-
GuaraniGuarani*-
HaniHani*-
hauçáhauçá*
havaianohavaiano-*
HebraicoHebraico-*-
HúngaroHúngaro*-*-*
IslandêsIslandês-
IdoIdo*-
IndonésioIndonésio*-*-*
IngucheInguche-
InterlínguaInterlíngua*-
IrlandêsIrlandês5*-
ItalianoItaliano*-*-*
JaponêsJaponês-*++<br />(incluindo texto manuscrito)-*
JapaneseModernJaponês (moderno)-*-*
Javaidioma de programação Java-
CabardianoCabardiano*
CalmucoCalmuco-
Carachai-BálcaroCarachai-Bálcaro*-
CaracalpaqueCaracalpaque*
KasubCassúbio-*
KawaKawa-*
CazaqueCazaque-*
KhakasKhakas-
KhantyKhanty*
KikuyuKikuyu-
QuirguizQuirguiz*-
QuicongoQuicongo*-
CoreanoCoreano*-*-
KoreanHangulCoreano (Hangul)*-*
KoriakKoriak-
KpelleKpelle*-
CumiqueCumique*-
CurdoCurdo*-
LakLak*
LapãoSami (lapão)-*
LatimLatim-*-*
LatvianLetão-*-*
LatvianGothicIdioma letão escrito na escrita gótica-
LezguianoLezguiano*
LituanoLituano-*-*
LubaLuba-*
MacedônioMacedônio-
MalgaxeMalgaxe*-
MalaioMalaio*
MalinquêMalinquê-*
MaltêsMaltês-
MansiMansi*
MaoriMaori-*
MatemáticaMatemática-
MariMari*
MayaMaya-*
MiaoMiao-*
MinankabawMinangkabau-*
MohawkMohawk-*
MongolMongol-*
MordvinoMordvino-*
NáuatleNáuatle-*
NenetsNenets-*
NivkhNivkh-*
NogaiNogai-*
NorueguêsNorueguês nynorsk e norueguês bokmål-*-*-
NorwegianBokmalNorueguês (Bokmål)*-*-*
NorwegianNynorskNorueguês (Nynorsk)-*-*-
NianjaNianja*-
OcidentalOcidental*
OcrAPara o tipo de texto OCR-A-
OcrBPara o tipo de texto OCR-B*
OjibwayOjíbua-*
OldEnglishInglês antigo-*-*
OldFrenchFrancês Antigo-*-*
OldGermanAlto alemão antigo-*-*
OldItalianItaliano antigo-*-*
OldSlavonicEslavo antigo-
EspanholAntigoEspanhol antigo*-*-
OssetaOsseta*
PapiamentoPapiamento-*
Pascallinguagem de programação Pascal-
PidginEnglishTok Pisin*-
PolonêsPolonês*-*-*
PortugueseBrazilianPortuguês (Brasil)-*-*-
PortugueseStandardPortuguês (Portugal)*-*-*
ProvençalProvençal-
QuíchuaQuíchua*-
RhaetoRomanicReto-românico*-
RomanianRomeno*-*-
RomanianMoldaviaRomeno (Moldávia)*-
RomaniRomani*-
RuandaRuanda*-
RundiRundi*-
RussianOldSpellingRusso (ortografia antiga)*-*
RussoRusso-*-*-
RussianWithAccentRusso (com acentos indicando a posição da sílaba tônica)*-*
SamoanoSamoano-*
SelkupSelkup-*
SerbianCyrillicSérvio (cirílico)-*
SerbianLatinSérvio (latino)-*
ShonaShona-
SiouxSioux (Dakota)*-
EslovacoEslovaco*-*-
eslovenoesloveno*-*-
SomaliSomali*-
SorbianoSorbiano*
SothoSotho-*
EspanholEspanhol-*++<br />(incluindo escrita manuscrita)-*
SundaSundanês-
suaílisuaíli*-
suázisuázi*-
SwedishSueco*-*-*
TabassaranTabassarano-
TagalogTagalo*-
TaitianoTaitiano*-
TajiqueTajique*-
TártaroTártaro*-*
TailandêsTailandês-*-
TinpoJingpo*-
TonganTonganês*-
TswanaTswana*-
TunTun*-
TurcoTurco*-*-*
TurkmenTurcomeno-
TurkmenLatinTurcomeno (latino)*-
TuvinTuvano*-
UdmurtUdmurte*
UighurCyrillicUigur (Cirílico)-
UighurLatinUigur (Latino)*-
UcranianoUcraniano*-*-*
UzbekCyrillicUzbeque (Cirílico)-
UzbekLatinUzbeque (Latino)*-
VietnamitaVietnamita*-*
BisáioCebuano-*
GalêsGalês-
UolofeUolofe*-
XhosaXhosa*-
IacutoIacuto*
IídicheIídiche+7
ZapotecaZapoteca-*
ZuluZulu-
1Vários idiomas oferecem suporte ao reconhecimento de texto manuscrito: inglês, alemão, francês, japonês e espanhol. Outros idiomas marcados nesta coluna oferecem suporte apenas a texto manuscrito em letra de forma. As mesmas configurações (IPageAnalysisParams::DetectHandwritten e IRecognizerParams::TextTypes = TT_Handwritten) habilitam o reconhecimento de texto manuscrito ou manuscrito em letra de forma, dependendo da opção compatível com o idioma. 2O classificador que usa apenas características da imagem pode ser usado para documentos em qualquer idioma. Os classificadores baseados em texto (ClassifierTypeEnum::CT_Combined, ClassifierTypeEnum::CT_Text) estão disponíveis apenas para documentos reconhecidos em idiomas com suporte completo a dicionário. 3 O ICR para árabe não tem suporte. No entanto, algarismos arábicos manuscritos em letra de forma podem ser reconhecidos. Consulte Reconhecimento de algarismos arábicos manuscritos em letra de forma. 4 Se você quiser reconhecer um bloco com o tipo de texto MICR, use apenas idiomas com caracteres latinos, e não combinações de idiomas latinos e CJK. 5 O FineReader Engine não oferece suporte a alguns símbolos especiais com diacríticos nos idiomas gaélico escocês e irlandês. 6 Os caracteres Nuskhuri e Mtavruli são reconhecidos separadamente, mas ambos os tipos de caracteres são salvos nas strings Unicode de Nuskhuri. 7 Alguns caracteres padrão (veys בֿ, pasekh alef אַ, komets alef אָ, pasekh tsvey yudn ײַ, melupm vov וּ) não têm suporte no idioma iídiche predefinido. Para reconhecer esses caracteres, crie um novo idioma personalizado e adicione esses caracteres a ele usando a propriedade LetterSet do objeto TextLanguage (consulte Trabalhando com idiomas) e, em seguida, defina o novo idioma como idioma de reconhecimento. No Windows, use o cenário descrito em Reconhecimento usando treinamento e Treinamento para reconhecer ligaturas. Veja também LanguageIdEnum Trabalhando com idiomas