Zum Hauptinhalt springen
Ein Benutzerwörterbuch ist ein zusätzliches, vom Benutzer erstelltes Wörterbuch, das Wörter enthält, die in den integrierten Wörterbüchern nicht enthalten sind. Integrierte Wörterbücher können durch ein Benutzerwörterbuch ergänzt werden, um die Qualität der Datenerfassung zu verbessern. Ein Benutzerwörterbuch enthält in der Regel Fachbegriffe, Abkürzungen, Firmennamen usw. Sie können Benutzerwörterbücher auf der Registerkarte Sprache des Dialogfelds Eigenschaft der Voraberkennung einrichten und aktivieren (um dieses Dialogfeld zu öffnen, öffnen Sie das Menü FlexiLayout oder Classifier, klicken Sie auf Properties und dann auf die Schaltfläche Advanced Eigenschaft der Voraberkennung…). Vorhandene Benutzerwörterbücher werden im Feld Benutzerwörterbuch zusammen mit den folgenden Informationen aufgeführt:
  • aktiviert Gibt an, ob das Benutzerwörterbuch verwendet wird.
  • Name Der Name des benutzerdefinierten Wörterbuchs.
  • Language Die Sprache des benutzerdefinierten Wörterbuchs.

Erstellen und Bearbeiten eines benutzerdefinierten Wörterbuchs

Um ein benutzerdefiniertes Wörterbuch hinzuzufügen, klicken Sie auf der Registerkarte Sprache im Dialogfeld Eigenschaften der Voraberkennung auf die Schaltfläche Hinzufügen…. Geben Sie anschließend im daraufhin geöffneten Dialogfeld Neues Wörterbuch hinzufügen die folgenden Eigenschaften an:
  • Wörterbuchname Der Name des Wörterbuchs.
  • Definitionsmethode Der Typ des Wörterbuchs:
    • Wörterbuchdatei Dieser Wörterbuchtyp basiert auf einer DIC-Datei.
    • Regulärer Ausdruck Dieser Wörterbuchtyp basiert auf einem regulären Ausdruck.
Der Typ eines Wörterbuchs kann nach seiner Erstellung nicht mehr geändert werden.
  • Ist sprachneutral Wenn diese Option aktiviert ist, wird das benutzerdefinierte Wörterbuch zusammen mit allen integrierten Wörterbüchern für alle aktivierten Erkennungssprachen verwendet. Der Parameter Language wird auf Neutral gesetzt, und diese Einstellung kann danach nicht mehr geändert werden. Diese Option ist nur für Benutzerwörterbücher des Typs Regulärer Ausdruck verfügbar.
  • Sprache (Gebietsschema) Die Sprache des Wörterbuchs kann in dieser Dropdown-Liste ausgewählt werden. Die Sprache eines Wörterbuchs kann nach seiner Erstellung nicht mehr geändert werden.
Wenn Sie auf die Schaltfläche OK klicken, wird ein Dialogfeld mit einer Liste aller bearbeitbaren und nicht bearbeitbaren Parameter angezeigt. Um die Eigenschaften eines Wörterbuchs anzuzeigen, wählen Sie ein Wörterbuch aus und klicken Sie dann auf die Schaltfläche Bearbeiten. Die Registerkarte Allgemein im Dialogfeld mit den Wörterbucheigenschaften enthält die allgemeinen Eigenschaften des Wörterbuchs: Name, Typ, Sprache und etwaige Benutzerkommentare. Der Name eines Wörterbuchs kann nach seiner Erstellung geändert werden. Die Registerkarte Wörterbuch im Dialogfeld mit den Wörterbucheigenschaften enthält Einstellungen, die vom Typ des Wörterbuchs und von den Benutzeralphabet-Einstellungen abhängen.
  • Wenn Sie beim Erstellen des Wörterbuchs den Typ Wörterbuchdatei auswählen, klicken Sie auf die Schaltfläche und geben Sie den Pfad zu einer DIC-Datei an, oder erstellen Sie ein neues Wörterbuch, indem Sie auf Neues Wörterbuch erstellen… klicken. Wenn Sie sich dafür entscheiden, ein neues Wörterbuch zu erstellen, geben Sie dessen Namen im Dialogfeld Neue Wörterbuchdatei erstellen an und klicken Sie auf OK. Legen Sie anschließend die Einstellungen im Editor fest.

Fügt einem Benutzerwörterbuch einen Wert hinzu.

Löscht den aktuell in der Liste ausgewählten Wert.

Importiert Werte aus einer TXT- oder DIC-Datei in das Benutzerwörterbuch.

Hinweis. Satzzeichen (.,;:/*{}[]<>? usw.) werden in Wörterbüchern als Trennzeichen zwischen Wörtern verwendet. Wenn Sie diese Symbole in Wörterbucheinträgen verwenden möchten, setzen Sie die folgende Zeichenfolge an den Anfang der Textdatei: “DICTIONARY_PROPERTIES=USE_CONFIDENCE”. In diesem Fall werden nur Zeilenumbrüche als Trennzeichen zwischen Wörtern behandelt. Dabei gibt die Zahl nach dem ersten Leerzeichen in der Zeichenfolge das Gewicht des Worts an, und alle anderen Symbole werden ignoriert.

Exportiert Werte aus dem Wörterbuch in eine TXT-Datei.

Schließt den Editor.

Wenn ein Wörterbuch erstellt wird, wird es als DIC-Datei im Projektordner gespeichert.
  • Wenn Sie den Wörterbuchtyp Regulärer Ausdruck ausgewählt haben, geben Sie den Ausdruck an. Sie können auf die Schaltfläche klicken, um ein Menü zu öffnen, das Sie beim Erstellen des Ausdrucks unterstützt. Weitere Informationen finden Sie unter In regulären Ausdrücken verwendetes Alphabet.
Wörter aus einem Benutzerwörterbuch haben eine höhere Priorität als Wörter aus einem integrierten Wörterbuch. Wenn Sie Wörter aus dem Wörterbuch bevorzugen aktivieren, wird die Priorität der Wörter aus einem Wörterbuch weiter erhöht.

Benutzeralphabete

Sie können auf der Registerkarte Wörterbuch im Eigenschaftendialogfeld eines Wörterbuchs in der Gruppe Alphabet ein Benutzeralphabet erstellen. Ein Benutzeralphabet ist eine Menge von Zeichen, Trennzeichen, Präfixen und Suffixen, die in einem Benutzerwörterbuch verwendet werden können. Wenn ein Benutzeralphabet zusammen mit einem Benutzerwörterbuch verwendet wird, gelten Wörterbucheinträge, die Zeichen enthalten, die nicht im Benutzeralphabet enthalten sind, als Nicht-Wörterbuchwörter. Mit anderen Worten: Ein Benutzeralphabet kann verwendet werden, um die für benutzerdefinierte Wörterbücher zulässige Zeichenmenge einzuschränken. Um zulässige Zeichen anzugeben, aktivieren Sie die Option Benutzerdefiniertes Alphabet verwenden und geben Sie dann die Symbole des Alphabets in das Textfeld ein oder verwenden Sie den Editor. Sie können den Editor öffnen, indem Sie auf die Schaltfläche Bearbeiten klicken. Um zulässige Trennzeichen, Präfixe, Suffixe und zu ignorierende Zeichen anzugeben (die in diesem Abschnitt der Einfachheit halber zusammenfassend als Satzzeichen bezeichnet werden), klicken Sie auf die Schaltfläche Erweiterte Parameter. Geben Sie im Dialogfeld Erweitertes benutzerdefiniertes Alphabet Parameter die Satzzeichen an.
  • Satzzeichen am Wortanfang Satzzeichen, die am Anfang eines Worts stehen können, wie etwa der Unterstrich in “_unknown”.
  • Satzzeichen am Wortende Satzzeichen, die am Ende eines Worts stehen können, wie etwa das kaufmännische Und in “user&”.
  • Eigenständige Satzzeichen Satzzeichen, die separat vorkommen können, wie etwa der senkrechte Strich in “January |”
Sie können in der Optionsgruppe Ausschlusszeichen Symbole angeben, die das Programm beim Abgleichen von Wörtern mit dem Benutzerwörterbuch ignorieren soll. Wenn Sie beispielsweise den regulären Ausdruck “+33NNNNNNNN” und den Bindestrich (-) als zu ignorierendes Zeichen angeben, betrachtet das Programm “+33-11111111”, “+33-111-11-111” und “+33-111-111-11” als Treffer für den regulären Ausdruck.