Vantage kann extrahierte Daten normalisieren, um eine einheitliche Darstellung sicherzustellen. Die folgenden Datentypen können normalisiert werden: Um aus einem Feld extrahierte Daten zu normalisieren, geben Sie den Datentyp an:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Feldoptionen öffnen
Klicken Sie im Datenformular auf die Schaltfläche für die Feldeinstellung neben dem Feld.

Datumsangaben normalisieren
YYYY-MM-DDfür DatumHH:MM:SSfür Uhrzeit
Beispiele
| Extrahierte Daten | Normalisierte Daten |
|---|---|
| 15.06.2023 | 2023-06-15 |
| 2023/06/15 22:17 | 2023-06-15 22:17:00 |
| 06-15-2023 | 2023-06-15 |
| 02/11/2022 | 2022-02-11 oder 2022-11-02 |
| Saturday, December 3rd, 2022 | 2022-12-03 |
| The second of May 2022 | 2022-05-02 |
Wenn sowohl die Formate Tag-Monat-Jahr als auch Monat-Tag-Jahr aktiviert sind, kann Vantage das Datum möglicherweise nicht eindeutig normalisieren. In diesem Fall können Sie zwischen den beiden möglichen Datumswerten wählen.
- Das Datum ist unvollständig — zum Beispiel
4:39 am(Uhrzeiten werden nur normalisiert, wenn sie zusammen mit einem Datum extrahiert werden). - Statt exakter Datumsangaben werden relative Zeitangaben verwendet — zum Beispiel
last month,a few days ago. - Neben dem Datum oder der Uhrzeit stehen zusätzliche Wörter oder Zeichen — zum Beispiel
2016/06/15 22. - Es werden ungewöhnliche Datumsformate verwendet — zum Beispiel
14 Jumada Al-Awwal 1445.
Zahlen normalisieren
- Westlich — Gruppiert Ziffern von rechts nach links in Dreiergruppen und verwendet Kommas zur Trennung von Tausendern, Millionen usw.
- Indisch — Gruppiert zunächst die ersten drei Ziffern von rechts und dann in Zweiergruppen für Zehntausender, Lakhs, Zehnlakhs, Crores usw.
string und konvertiert ihn in ein standardisiertes Format, wobei ein Punkt (.) als Trennzeichen zwischen Ganzzahl- und Nachkommateil verwendet wird. Zulässige Trennzeichen finden Sie unter Datentypen.
Beispiele
| Extrahierte Daten | Normalisierte Daten |
|---|---|
| 12,345,678 | 12345678 |
| -12,345.678 | -12345.678 |
| 12.0000 | 12 |
| 1.000 | 1000 oder 1 |
| 12,345.678 % | 12345.678 |
| 1,23,45,67,890 (indisches Zahlensystem) | 1234567890 |
| twenty-first | 21 |
- Zusätzliche Wörter oder Zeichen stehen direkt neben der Zahl — zum Beispiel
EURO12,345.678oder5 kilos. - Zwischen Nachkomma- und Ganzzahlteil oder zwischen Dezimal- und Tausendertrennzeichen steht eine unregelmäßige Anzahl von Ziffern — zum Beispiel
123,456,7890. Der Nachkommateil darf höchstens 3 Ziffern enthalten. Wenn123,456,789extrahiert wird, ist der normalisierte Wert123456789; wenn123,456,78extrahiert wird, ist der normalisierte Wert123456.78. - Es werden unübliche Zahlendarstellungen verwendet.
Geldbeträge normalisieren
€, EURO und euros werden alle dem Euro zugeordnet. Der normalisierte Wert verwendet genau das im extrahierten Text gefundene Symbol bzw. den dort gefundenen Namen.
Beispiele
| Extrahierte Daten | Normalisierte Daten |
|---|---|
| 12,345.678 EURO | EURO 12345.678 |
| 12,345.678 ¥ | ¥ 12345.678 |
| 13,87E | E 13.87 |
| 13 euro 87 | euro 13.87 |
| fifty dollars | dollars 50 |
| ₹1,23,455 | ₹ 123455 |
Ausgeschriebene Beträge werden nur normalisiert, wenn sie auf Englisch vorliegen und in den Skill-Einstellungen Englisch ausgewählt ist.
12 ttt.
Textfeld
Fügen Sie ein Textfeld hinzu, wählen Sie einen Datentyp aus und konfigurieren Sie die Erkennungseinstellungen.
Dokumente kennzeichnen
Richtlinien zum Kennzeichnen strukturierter und semistrukturierter Dokumente beim Training.
Unterstützte Erkennungssprachen
Vollständige Liste der OCR-Sprachen, die von Vantage Skills unterstützt werden.
