跳转到主要内容
以下列出了 ABBYY FineReader Engine 支持的预定义语言的内部名称。各种预定义识别语言是否可用,取决于 ABBYY FineReader Engine 文件中是否包含相应的模块。请参阅安装部分,了解哪些识别语言对应哪些 ABBYY FineReader Engine 模块。 ABBYY FineReader Engine 为 OCR 和 ICR 提供核心识别语言,并提供完整的内置字典支持。某些识别语言仅支持 OCR,或者不提供完整的内置字典支持。详情请参见下表。
ABBYY FineReader Engine for Windows 还提供一组特定的识别语言。这些语言包含特殊的语言单元 (如地址、日期和时间、人名等) 。这类语言可用于字段识别。有关更多信息,请参阅特殊预定义语言列表
内部名称识别语言可用于 OCR支持完整字典支持手写 (++) 或工整手写体 (+) 文本1可用于文本分类2可用于 BCR
阿布哈兹语阿布哈兹语*
阿迪格语阿迪格语-
南非语南非语*-
阿古尔语阿古尔语*
阿尔巴尼亚语阿尔巴尼亚语-*
阿尔泰语阿尔泰语-
阿拉伯语阿拉伯语 (沙特阿拉伯)*-3*
ArmenianEastern亚美尼亚语 (东部)-*-
ArmenianGrabar亚美尼亚语 (古亚美尼亚语)*-*
ArmenianWestern亚美尼亚语 (西部亚美尼亚语)-*-
Awar阿瓦尔语*
Aymara艾马拉语-*
AzeriCyrillic阿塞拜疆语 (西里尔字母)-
AzeriLatin阿塞拜疆语 (拉丁字母)*-*-
孟加拉语孟加拉语*
巴什基尔语巴什基尔语-*-
BasicBasic 编程语言*
巴斯克语巴斯克语-*
白俄罗斯语白俄罗斯语-
本巴语本巴语*-
黑脚语黑脚语*-
布列塔尼语布列塔尼语*-
布戈图语布戈图语*-
保加利亚语保加利亚语*-*-
缅甸语缅甸语*
布里亚特语布里亚特语-*
C++C/C++ 编程语言-
加泰罗尼亚语加泰罗尼亚语*-*
查莫罗语查莫罗语-*
车臣语车臣语-
化学简单化学公式*
ChinesePRC简体中文-*
ChineseTaiwan中文 (繁体)-*
Chukcha楚科奇语-
Chuvash楚瓦什语*
CMC7用于 MICR (CMC-7) 文本类型4-
COBOLCOBOL 程序设计语言*
Corsican科西嘉语-*
CrimeanTatar克里米亚鞑靼语-*
克罗地亚语克罗地亚语-*-*
克劳语克劳语-*
捷克语捷克语-*-*-
丹麦语丹麦语*-*-*
达尔格瓦语达尔格瓦语-
数字数字*-
东干语东干语*
荷兰语荷兰语 (荷兰)-*-*-
DutchBelgian荷兰语 (比利时)*-*-
E13B适用于 MICR (E-13B) 文本类型4*
英语英语-*++<br /> (包括手写识别)-*
EskimoCyrillic爱斯基摩语 (西里尔字母)-
EskimoLatin爱斯基摩语 (拉丁字母)*
Esperanto世界语-
爱沙尼亚语爱沙尼亚语*-*-*
埃文语埃文语-*
鄂温克语鄂温克语-*
法罗语法罗语-
波斯语波斯语*-*
斐济语斐济语-*
芬兰语芬兰语-*-*-
FortranFortran 程序设计语言*
法语法语-*++<br /> (包括手写识别)-*
弗里斯兰语弗里斯兰语-*
弗留利语弗留利语-*
GaelicScottish苏格兰盖尔语5-*
Gagauz加告兹语-
加利西亚语加利西亚语*-
卢干达语卢干达语*-
格鲁吉亚语格鲁吉亚语6*
德语德语-*++<br /> (包括手写文本)-*
GermanLuxembourg德语 (卢森堡)-*
GermanNewSpelling德语 (新正字法)-*-*
希腊语希腊语-*-*-
瓜拉尼语瓜拉尼语*-
哈尼语哈尼语*-
豪萨语豪萨语*
夏威夷语夏威夷语-*
希伯来语希伯来语-*-
匈牙利语匈牙利语*-*-*
冰岛语冰岛语-
伊多语伊多语*-
印尼语印尼语*-*-*
印古什语印古什语-
国际语国际语*-
爱尔兰语爱尔兰语5*-
意大利语意大利语*-*-*
日语日语-*++<br /> (含手写文本)-*
JapaneseModern日语 (现代日语) -*-*
JavaJava 编程语言-
Kabardian卡巴尔达语*
Kalmyk卡尔梅克语-
卡拉恰伊-巴尔卡尔卡拉恰伊-巴尔卡尔语*-
卡拉卡尔帕克卡拉卡尔帕克语*
KasubKasub-*
KawaKawa-*
哈萨克语哈萨克语-*
哈卡斯语哈卡斯语-
汉特语汉特语*
基库尤语基库尤语-
柯尔克孜语柯尔克孜语*-
Kongo刚果语*-
Korean韩语*-*-
KoreanHangul韩语 (韩文)*-*
科里亚克语科里亚克语-
克佩列语克佩列语*-
库梅克语库梅克语*-
库尔德语库尔德语*-
拉克语拉克语*
拉普语萨米语 (拉普语)-*
拉丁语拉丁语-*-*
拉脱维亚语拉脱维亚语-*-*
拉脱维亚语 (哥特体)使用哥特体书写的拉脱维亚语-
列兹金语列兹金语*
立陶宛语立陶宛语-*-*
Luba卢巴语-*
马其顿语马其顿语-
马达加斯加语马达加斯加语*-
马来语马来语*
马林凯语马林凯语-*
马耳他语马耳他语-
曼西语曼西语*
毛利语毛利语-*
数学公式数学公式-
Mari马里语*
Maya玛雅语-*
Miao苗语-*
米南加保米南加保语-*
Mohawk莫霍克语-*
Mongol蒙古语-*
莫尔多瓦语莫尔多瓦语-*
纳瓦特尔语纳瓦特尔语-*
涅涅茨语涅涅茨语-*
尼夫赫语尼夫赫语-*
诺盖语诺盖语-*
挪威语挪威尼诺斯克语和挪威博克马尔语-*-*-
NorwegianBokmal挪威语 (博克马尔语)*-*-*
NorwegianNynorsk挪威语 (尼诺斯克语)-*-*-
尼扬贾语尼扬贾语*-
奥西登塔尔语西方国际语*
OcrA适用于 OCR-A 文本类型-
OcrB适用于 OCR-B 文本类型*
Ojibway奥吉布瓦语-*
OldEnglish古英语-*-*
OldFrench古法语-*-*
OldGerman古德语-*-*
OldItalian古意大利语-*-*
OldSlavonic古教会斯拉夫语-
OldSpanish古西班牙语*-*-
奥塞梯语奥塞梯语*
帕皮阿门托语帕皮阿门托语-*
PascalPascal 编程语言-
PidginEnglishTok Pisin*-
波兰语波兰语*-*-*
巴西葡萄牙语葡萄牙语 (巴西)-*-*-
标准葡萄牙语葡萄牙语 (葡萄牙)*-*-*
普罗旺斯语普罗旺斯语-
克丘亚语克丘亚语*-
雷托罗曼语雷托-罗曼语*-
罗马尼亚语罗马尼亚语*-*-
RomanianMoldavia罗马尼亚语 (摩尔达维亚)*-
罗姆语罗姆语*-
卢旺达语卢旺达语*-
Rundi隆迪语*-
RussianOldSpelling俄语 (旧拼写)*-*
Russian俄语-*-*-
RussianWithAccent俄语 (使用重音符号标示重音位置)*-*
萨摩亚语萨摩亚语-*
塞尔库普语塞尔库普语-*
SerbianCyrillic塞尔维亚语 (西里尔文)-*
SerbianLatin塞尔维亚语 (拉丁字母)-*
Shona绍纳语-
Sioux苏语 (达科他)*-
斯洛伐克语斯洛伐克语*-*-
斯洛文尼亚语斯洛文尼亚语*-*-
索马里语索马里语*-
索布语索布语*
索托语索托语-*
西班牙语西班牙语-*++<br /> (包括手写)-*
巽他语巽他语-
斯瓦希里语斯瓦希里语*-
斯威士语斯威士语*-
Swedish瑞典语*-*-*
塔巴萨兰语塔巴萨兰语-
他加禄语他加禄语*-
塔希提语塔希提语*-
塔吉克语塔吉克语*-
塔塔尔语塔塔尔语*-*
泰语泰语-*-
Tinpo景颇语*-
Tongan汤加语*-
茨瓦纳语茨瓦纳语*-
TunTun*-
土耳其语土耳其语*-*-*
Turkmen土库曼语-
TurkmenLatin土库曼语 (拉丁字母)*-
图瓦语图瓦语*-
乌德穆尔特语乌德穆尔特语*
UighurCyrillic维吾尔语 (西里尔字母)-
UighurLatin维吾尔语 (拉丁字母)*-
乌克兰语乌克兰语*-*-*
UzbekCyrillic乌兹别克语 (西里尔文)-
UzbekLatin乌兹别克语 (拉丁文)*-
越南语越南语*-*
维萨亚语宿务语-*
威尔士语威尔士语-
沃洛夫语沃洛夫语*-
科萨语科萨语*-
雅库特语雅库特语*
意第绪语意第绪语+7
萨波特克语萨波特克语-*
祖鲁语祖鲁语-
1多种语言支持识别手写文本:英语、德语、法语、日语和西班牙语。在此列中标记的其他语言仅支持识别手写印刷体文本。相同的设置 (IPageAnalysisParams::DetectHandwrittenIRecognizerParams::TextTypes = TT_Handwritten) 会根据相应语言支持的选项,启用手写文本或手写印刷体文本的识别。 2仅使用图像特征的分类器可用于任何语言的文档。基于文本的分类器 (ClassifierTypeEnum::CT_CombinedClassifierTypeEnum::CT_Text) 仅适用于使用具备完整字典支持的语言所识别的文档。 3 不支持阿拉伯语 ICR。不过,可以识别手写印刷体阿拉伯数字。请参阅识别手写印刷体阿拉伯数字 4 如果要识别 MICR 文本类型的块,请仅使用带拉丁字符的语言,不要使用拉丁字符与 CJK 语言的组合。 5 FineReader Engine 不支持苏格兰盖尔语和爱尔兰语中的某些带变音符号的特殊字符。 6 Nuskhuri 和 Mtavruli 字符会分别识别,但这两种字符都会以 Nuskhuri 的 Unicode 字符串形式保存。 7 预定义的意第绪语不支持少数字符 (veys בֿ、pasekh alef אַ、komets alef אָ、pasekh tsvey yudn ײַ、melupm vov וּ) 。要识别这些字符,请创建一种新的自定义语言,并使用 TextLanguage 对象的 LetterSet 属性将这些字符添加到其中 (请参阅使用语言) ,然后将该新语言设置为识别语言。对于 Windows,请使用通过训练进行识别训练以识别连字中描述的方案。 另请参阅 LanguageIdEnum 使用语言