Zum Hauptinhalt springen
Hier finden Sie eine Liste der internen Namen der vordefinierten Sprachen, die in ABBYY FineReader Engine unterstützt werden. Welche vordefinierten Erkennungssprachen verfügbar sind, hängt davon ab, ob die entsprechenden Module in den ABBYY FineReader Engine-Dateien enthalten sind. Informationen dazu, welche Erkennungssprachen welchen ABBYY FineReader Engine-Modulen zugeordnet sind, finden Sie im Abschnitt Installation. ABBYY FineReader Engine unterstützt grundlegende Erkennungssprachen für Optical Character Recognition (OCR) und ICR mit vollständiger integrierter Wörterbuchunterstützung. Einige Erkennungssprachen sind nur für OCR verfügbar oder verfügen nicht über eine vollständige integrierte Wörterbuchunterstützung. Einzelheiten finden Sie in der folgenden Tabelle.
ABBYY FineReader Engine für Windows stellt außerdem eine Reihe spezieller Erkennungssprachen bereit. Diese Sprachen enthalten spezielle Sprachelemente (Adressen, Datum und Uhrzeit, Personennamen usw.). Solche Sprachen können für die Felderkennung verwendet werden. Weitere Informationen finden Sie in der Liste der speziellen vordefinierten Sprachen.
Interner NameErkennungsspracheKann für OCR verwendet werdenVollständige Wörterbuchunterstützung verfügbarUnterstützung für handschriftlichen (++) oder in Druckbuchstaben geschriebenen (+) Text1Kann für textbasierte Klassifizierung2 verwendet werdenKann für BCR verwendet werden
AbkhazAbchasisch*
AdygeischAdygeisch-
AfrikaansAfrikaans*-
AgulischAgulisch*
AlbanischAlbanisch-*
AltaischAltaisch-
ArabischArabisch (Saudi-Arabien)*-3*
ArmenianEasternArmenisch (Ostarmenisch)-*-
ArmenianGrabarArmenisch (Grabar)*-*
ArmenianWesternArmenisch (Westarmenisch)-*-
AwarAwarisch*
AymaraAymara-*
AzeriCyrillicAserbaidschanisch (Kyrillisch)-
AzeriLatinAserbaidschanisch (Lateinisch)*-*-
BanglaBangla*
BaschkirischBaschkirisch-*-
BasicProgrammiersprache Basic*
BaskischBaskisch-*
BelarussischBelarussisch-
BembaBemba*-
BlackfootBlackfoot*-
BretonBretonisch*-
BugotuBugotu*-
BulgarischBulgarisch*-*-
BirmanischBirmanisch*
BurjatischBurjatisch-*
C++Programmiersprache C/C++-
KatalanischKatalanisch*-*
ChamorroChamorro-*
ChechenTschetschenisch-
ChemistryEinfache chemische Formeln*
ChinesePRCVereinfachtes Chinesisch-*
ChineseTaiwanChinesisch (traditionell)-*
ChukchaTschuktschisch-
TschuwaschischTschuwaschisch*
CMC7Für den MICR-Texttyp (CMC-7)4-
COBOLProgrammiersprache COBOL*
CorsicanKorsisch-*
CrimeanTatarKrimtatarisch-*
KroatischKroatisch-*-*
CrowCrow-*
TschechischTschechisch-*-*-
DänischDänisch*-*-*
DargwaDargwa-
ZiffernZahlen*-
DunganischDunganisch*
NiederländischNiederländisch (Niederlande)-*-*-
DutchBelgianNiederländisch (Belgien)*-*-
E13BFür den Texttyp MICR (E-13B)4*
EnglishEnglisch-*++<br />(einschließlich handschriftlicher Texte)-*
EskimoCyrillicEskimo (Kyrillisch)-
EskimoLatinEskimo (Lateinisch)*
EsperantoEsperanto-
EstnischEstnisch*-*-*
EwenischEwenisch-*
EwenkischEwenkisch-*
FäröischFäröisch-
FarsiFarsi*-*
FidschiFidschi-*
FinnischFinnisch-*-*-
FortranProgrammiersprache Fortran*
FranzösischFranzösisch-*++<br />(einschließlich Handschrift)-*
FriesischFriesisch-*
FriulanischFriulanisch-*
GaelicScottishSchottisch-Gälisch5-*
GagauzGagauzisch-
GalicischGalicisch*-
GandaGanda*-
GeorgischGeorgisch6*
DeutschDeutsch-*++<br />(einschließlich handschriftlichem Text)-*
GermanLuxembourgDeutsch (Luxemburg)-*
GermanNewSpellingDeutsch (neue Rechtschreibung)-*-*
GriechischGriechisch-*-*-
GuaraniGuarani*-
HaniHani*-
HausaHausa*
HawaiischHawaiisch-*
HebräischHebräisch-*-
UngarischUngarisch*-*-*
IsländischIsländisch-
IdoIdo*-
IndonesischIndonesisch*-*-*
InguschischInguschisch-
InterlinguaInterlingua*-
IrischIrisch5*-
ItalienischItalienisch*-*-*
JapanischJapanisch-*++<br />(einschließlich handschriftlichem Text)-*
JapaneseModernJapanisch (Modern)-*-*
JavaProgrammiersprache Java-
KabardianKabardinisch*
KalmykKalmückisch-
KarachayBalkarKaratschai-Balkarisch*-
KarakalpakKarakalpakisch*
KasubKaschubisch-*
KawaKawa-*
KasachischKasachisch-*
ChakassischChakassisch-
KhantyChantisch*
KikuyuKikuyu-
KirgizKirgisisch*-
KongoKongo*-
KoreanischKoreanisch*-*-
KoreanHangulKoreanisch (Hangul)*-*
KorjakischKorjakisch-
KpelleKpelle*-
KumykKumykisch*-
KurdishKurdisch*-
LakLak*
LappischSami (Lappisch)-*
LateinLatein-*-*
LettischLettisch-*-*
LettischGothischLettisch in gotischer Schrift-
LezginLesgisch*
LithuanianLitauisch-*-*
LubaLuba-*
MazedonischMazedonisch-
MadagassischMadagassisch*-
MalaiischMalaiisch*
MalinkeMalinke-*
MalteseMaltesisch-
MansiMansi*
MaoriMaori-*
MathematischMathematisch-
MariMari*
MayaMaya-*
MiaoMiao-*
MinankabawMinangkabau-*
MohawkMohawk-*
MongolMongolisch-*
MordvinMordwinisch-*
NahuatlNahuatl-*
NenetsNenzisch-*
NivkhNiwchisch-*
NogaiischNogaiisch-*
NorwegischNorwegisch (Nynorsk) und Norwegisch (Bokmål)-*-*-
NorwegianBokmalNorwegisch (Bokmål)*-*-*
NorwegianNynorskNorwegisch (Nynorsk)-*-*-
NyanjaNyanja*-
OccidentalOkzidentalisch*
OcrAFür den Texttyp OCR-A-
OcrBFür den Texttyp OCR-B*
OjibwayOjibwe-*
OldEnglishAltenglisch-*-*
OldFrenchAltfranzösisch-*-*
OldGermanAltdeutsch-*-*
OldItalianAltitalienisch-*-*
OldSlavonicAltslawisch-
OldSpanishAltspanisch*-*-
OssetischOssetisch*
PapiamentoPapiamento-*
PascalProgrammiersprache Pascal-
PidginEnglishTok Pisin*-
PolnischPolnisch*-*-*
PortugueseBrazilianPortugiesisch (Brasilien)-*-*-
PortugueseStandardPortugiesisch (Portugal)*-*-*
ProvenzalischProvenzalisch-
QuechuaQuechua*-
RätoromanischRätoromanisch*-
RumänischRumänisch*-*-
RomanianMoldaviaRumänisch (Moldawien)*-
RomaniRomani*-
RuandaRuanda*-
RundiKirundi*-
RussianOldSpellingRussisch (alte Rechtschreibung)*-*
RussischRussisch-*-*-
RussianWithAccentRussisch (mit Akzenten zur Kennzeichnung der Betonung)*-*
SamoanischSamoanisch-*
SelkupischSelkupisch-*
SerbischKyrillischSerbisch (Kyrillisch)-*
SerbianLatinSerbisch (Lateinisch)-*
ShonaShona-
SiouxSioux (Dakota)*-
SlowakischSlowakisch*-*-
SlowenischSlowenisch*-*-
SomalischSomalisch*-
SorbischSorbisch*
SothoSotho-*
SpanischSpanisch-*++<br />(einschließlich handschriftlichem Text)-*
SundaSunda-
SwahiliSwahili*-
SwasiSwasi*-
SchwedischSchwedisch*-*-*
TabassaranTabassaran-
TagalogTagalog*-
TahitischTahitisch*-
TadschikischTadschikisch*-
TatarischTatarisch*-*
ThaiThai-*-
TinpoJingpo*-
TonganTongaisch*-
TswanaTswana*-
TunTun*-
TürkischTürkisch*-*-*
TurkmenTurkmenisch-
TurkmenLatinTurkmenisch (Lateinisch)*-
TuwinischTuwinisch*-
UdmurtischUdmurtisch*
UighurCyrillicUigurisch (Kyrillisch)-
UighurLatinUigurisch (Lateinisch)*-
UkrainischUkrainisch*-*-*
UzbekCyrillicUsbekisch (Kyrillisch)-
UzbekLatinUsbekisch (Lateinisch)*-
VietnamesischVietnamesisch*-*
CebuanoCebuano-*
WalisischWalisisch-
WolofWolof*-
XhosaXhosa*-
JakutischJakutisch*
JiddischJiddisch+7
ZapotekischZapotekisch-*
ZuluZulu-
1Mehrere Sprachen unterstützen die Erkennung handschriftlichen Textes: Englisch, Deutsch, Französisch, Japanisch und Spanisch. Andere in dieser Spalte gekennzeichnete Sprachen unterstützen nur handgedruckten Text. Mit denselben Einstellungen (IPageAnalysisParams::DetectHandwritten und IRecognizerParams::TextTypes = TT_Handwritten) wird je nach den von der jeweiligen Sprache unterstützten Optionen die Erkennung von handschriftlichem oder handgedrucktem Text aktiviert. 2Der Klassifikator, der nur Bildmerkmale verwendet, kann für Dokumente in jeder Sprache verwendet werden. Die textbasierten Klassifikatoren (ClassifierTypeEnum::CT_Combined, ClassifierTypeEnum::CT_Text) sind nur für erkannte Dokumente in Sprachen verfügbar, die eine vollständige Wörterbuchunterstützung haben. 3 Arabische ICR wird nicht unterstützt. Handgedruckte arabische Ziffern können jedoch erkannt werden. Siehe Erkennung handgedruckter arabischer Ziffern. 4 Wenn Sie einen Block mit dem MICR-Texttyp erkennen möchten, verwenden Sie nur Sprachen mit lateinischen Zeichen und keine Kombinationen aus lateinischen und CJK-Sprachen. 5 FineReader Engine unterstützt einige Sonderzeichen mit diakritischen Zeichen in Schottisch-Gälisch und Irisch nicht. 6 Die Nuskhuri- und Mtavruli-Zeichen werden getrennt voneinander erkannt, aber beide Zeichentypen werden in den Unicode-strings für Nuskhuri gespeichert. 7 Einige Standardzeichen (veys בֿ, pasekh alef אַ, komets alef אָ, pasekh tsvey yudn ײַ, melupm vov וּ) werden in der vordefinierten Sprache Jiddisch nicht unterstützt. Um diese Zeichen zu erkennen, erstellen Sie eine neue benutzerdefinierte Sprache und fügen Sie ihr diese Zeichen mithilfe der Eigenschaft LetterSet des Objekts TextLanguage hinzu (siehe Arbeiten mit Sprachen); legen Sie dann die neue Sprache als Erkennungssprache fest. Verwenden Sie unter Windows das in Erkennung mit Training und Training zum Erkennen von Ligaturen beschriebene Szenario. Siehe auch LanguageIdEnum Arbeiten mit Sprachen