Zum Hauptinhalt springen

Übersicht

ABBYY Vantage ermöglicht die automatisierte Dokumentenverarbeitung mit intelligenten Extraktionsfunktionen. Dieser Leitfaden konzentriert sich auf den SFTP-basierten Workflow, mit dem Sie Dokumente in einen freigegebenen Ordner hochladen und verarbeitete Ergebnisse automatisch abrufen können. Was Sie erreichen werden:
  • Erstellen und Konfigurieren eines Process-Skills
  • Einrichten des SFTP-Zugriffs für Eingabe und Ausgabe
  • Hochladen von Dokumenten über die Befehlszeile
  • Herunterladen von Extraktionsergebnissen
Benötigte Zeit: 15–20 Minuten

Schritt 1: Erstellen eines Process Skills

Ein Process Skill ist die Grundlage Ihres Dokumentverarbeitungs-Workflows in Vantage.
  1. Navigieren Sie zum Bereich Documents in ABBYY Vantage.
  2. Klicken Sie in der linken Seitenleiste auf Skill Designer.
  3. Wählen Sie Process Skill aus den Skill-Typen.
Selecting Process Skill
  1. Geben Sie im Dialogfeld Create Process skill Folgendes ein:
    • Skill Name: Ein aussagekräftiger Name für Ihren Prozess (z. B. „Process Skill Test 1“)
    • Description: Optionale Beschreibung, welche Aufgabe dieser Skill erfüllt
    • Technology Core Version: 3.0 (empfohlen)
Naming Process Skill
  1. Klicken Sie auf Create

Schritt 2: Process-Skill-Workflow konfigurieren

Nachdem Sie Ihren Skill erstellt haben, richten Sie den Dokumentverarbeitungs-Workflow ein.
  1. Im Skill Designer sehen Sie rechts das Panel Select Process Skill
  2. Wählen Sie Simple Document skill workflow für die Verarbeitung einzelner Dokumenttypen
Selecting Simple Workflow Hierdurch wird ein vorkonfigurierter Workflow mit folgenden Komponenten erstellt:
  • Input-Connector: Eingangspunkt, an dem Dokumente in das System gelangen
  • OCR-Skill: Optical Character Recognition (OCR)
  • Extract-Skill: Datenextraktion
  • Output-Connector: Punkt, an dem die Ergebnisse ausgegeben werden
Der Workflow wird in der mittleren Arbeitsfläche wie folgt angezeigt: Input → OCR → Extract → Output

Schritt 3: Eingabe über SFTP einrichten

Konfigurieren Sie die Input-Aktivität so, dass sie Dokumente per SFTP entgegennimmt.
  1. Klicken Sie im Workflow auf die Aktivität Input.
  2. Aktivieren Sie im rechten Bereich Actions das Kontrollkästchen Select additional source.
  3. Wählen Sie das Optionsfeld Shared folder.
  4. Klicken Sie auf Settings, um die Konfiguration vorzunehmen.
Konfigurieren der Input-Aktivität

Eingabeeinstellungen konfigurieren

Im Dialog Input Settings: Shared Folder: Input Settings Dialog Ordner­einstellungen:
  • Ordnername: Input (Standard)
  • Importmethode: Single file
Zugangsdaten für den Import (zu Ihrer Information angezeigt):
  • Ordnerlink: .../Input
  • Link zum Ausnahmeordner: .../Input-exception
  • Benutzername: Eine generierte UUID (z. B. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Passwort: Wird mit einer Option zum Anzeigen/Ausblenden angezeigt
Hinweis: Kopieren Sie diese Zugangsdaten – Sie benötigen sie für die Verbindung über SFTP. Dateien, die nicht importiert werden können, werden in den Ausnahmeordner verschoben. Vantage sucht alle 20 Sekunden nach Dateien, nachdem der Skill veröffentlicht wurde.
  1. Klicken Sie auf Save.

Schritt 4: Ausgabe über SFTP einrichten

Konfigurieren Sie die Aktivität Output, um Ergebnisse per SFTP bereitzustellen.
  1. Klicken Sie im Workflow auf die Aktivität Output.
  2. Aktivieren Sie im Bereich Actions die Option Select additional destination.
  3. Wählen Sie das Optionsfeld Shared folder.
  4. Klicken Sie auf Settings, um die Konfiguration vorzunehmen.
Configuring Output Activity

Ausgabe-Einstellungen konfigurieren

Im Dialogfeld Output Settings: Shared Folder: Output Settings Dialog Info:
  • Folder name: Output (Standardwert)
  • Folder: .../Output
  • Username: Eine generierte UUID (z. B. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Wird mit einer Option zum Ein- bzw. Ausblenden angezeigt
Exportierte Daten:
  • Fields (JSON): Standard-Exportformat
Hinweis: Ergebnisse werden in Unterordnern abgelegt, die nach der Quelldatei und der Transaction-ID benannt sind (z. B. invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). Dateien werden automatisch gemäß der Datenaufbewahrungsrichtlinie gelöscht.
  1. Klicken Sie auf Save.

Schritt 5: Extraktions-Skills konfigurieren

Legen Sie fest, welche Dokumenttypen die Extract-Aktivität erkennen und verarbeiten soll.
  1. Klicken Sie im Workflow auf die Aktivität Extract.
  2. Im Bereich Actions sehen Sie Document Skills.
Configuring Extraction Skills Verfügbare Document Skills sind:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Wählen Sie die für Ihren Anwendungsfall relevanten Dokumenttypen aus.
  2. Klicken Sie auf Add Skill, wenn Sie zusätzliche Dokumenttypen benötigen.
  3. Verwenden Sie Edit Mapping, um die Feldextraktion bei Bedarf anzupassen.

Schritt 6: Veröffentlichen und Skill-ID abrufen

Bevor Sie SFTP verwenden können, müssen Sie die Skill veröffentlichen und ihre ID ermitteln.
  1. Klicken Sie oben rechts im Skill Designer auf die Schaltfläche Publish.
  2. Nachdem die Skill veröffentlicht wurde, notieren Sie sich die Skill ID aus der Browser-URL.
Getting Skill ID from URL Das URL-Format lautet:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Zum Beispiel: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Warnung: Halten Sie Ihre Skill-ID griffbereit – Sie benötigen sie, um in SFTP auf die richtigen Input- und Output-Ordner zuzugreifen.

Schritt 7: Verbindung mit SFTP herstellen

Jetzt sind Sie bereit, sich über SFTP mithilfe der Zugangsdaten aus Ihren Input/Output-Einstellungen zu verbinden.

Verbindungsdetails

In Ihren Input/Output-Einstellungen finden Sie:
  • Server: 172.172.228.138
  • Port: 2022
  • Benutzername: Ihre generierte UUID
  • Passwort: Ihr generiertes Passwort
  • Basispfad: /{skill-id}/

Per Terminal verbinden

Öffnen Sie ein Terminal und verbinden Sie sich mit:
sftp -P 2022 {username}@172.172.228.138
Beispiel:
sftp -P 2022 [email protected]
Hinweis: Verwenden Sie ein großes -P für die Angabe des Ports bei SFTP (ein kleines -p wird für einen anderen Zweck verwendet). Wenn Sie dazu aufgefordert werden, geben Sie Ihr Passwort ein.

Schritt 8: In der SFTP-Ordnerstruktur navigieren

Sobald die Verbindung hergestellt ist, sehen Sie die SFTP-Eingabeaufforderung: sftp>

Verfügbare Skills anzeigen

Listen Sie alle verfügbaren Process-Skills auf:
sftp> ls
Accessing Skill Folders Sie sehen Ordner für alle Skills (identifiziert anhand ihrer Skill-IDs) sowie:
  • Catalogs - Document-Skill-Kataloge
  • Catalogs-exception - Fehlgeschlagene Katalogimporte
  • skills-import - Skill-Importverzeichnis
Verwenden Sie die Skill-ID aus Schritt 6:
sftp> cd {your-skill-id}
sftp> ls
Sie sollten drei Ordner sehen:
  • Input - Hier laden Sie Dokumente zur Verarbeitung hoch
  • Input-exception - Fehlgeschlagene Importe werden hierher verschoben
  • Output - Hier erscheinen die verarbeiteten Ergebnisse

Schritt 9: Dokumente zur Verarbeitung hochladen

Navigieren Sie zum Ordner „Input“ und laden Sie Ihre Dokumente hoch.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Eine einzelne Datei hochladen

Laden Sie eine Datei mit dem vollständigen Dateipfad hoch:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Oder wechseln Sie zunächst in Ihr lokales Verzeichnis:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Hochladen und Herunterladen von Dateien

Mehrere Dateien hochladen

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Hinweis: Dateien, die im Bereich Input hochgeladen werden, werden nach erfolgreicher Verarbeitung automatisch gelöscht (normalerweise innerhalb von 20 Sekunden). Wenn Sie Ihre Datei nach dem Hochladen nicht mehr sehen, bedeutet das, dass Vantage sie bereits zur Verarbeitung übernommen hat!

Upload prüfen

Überprüfen Sie, ob die Dateien noch im Eingabeordner liegen:
sftp> ls
Wenn der Ordner leer ist oder Ihre Datei fehlt, wurde die Verarbeitung gestartet.

Schritt 10: Verarbeitungsstatus überprüfen

Ordner „Input-exception“ überwachen

Wenn der Import einer Datei fehlschlägt, wird sie hier angezeigt:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Ein leerer Ordner bedeutet, dass alle Dateien erfolgreich importiert wurden.

Auf die Verarbeitung warten

Die Verarbeitungszeit variiert je nach:
  • Dokumentkomplexität
  • konfigurierten Extraktions-Skills
  • aktueller Systemauslastung
In der Regel werden einfache Rechnungen innerhalb von 30–60 Sekunden verarbeitet.

Schritt 11: Verarbeitete Ergebnisse herunterladen

Sobald die Verarbeitung abgeschlossen ist, erscheinen die Ergebnisse im Output-Ordner.
sftp> cd ..
sftp> cd Output
sftp> ls

Ausgabestruktur verstehen

Die Ergebnisse sind in Unterordnern mit folgendem Namensmuster organisiert:
{original-filename}-{transaction-id}
Beispiel:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Inhalt eines Ergebnisordners anzeigen

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Typische Inhalte:
  • Invoice_US.json - Extrahierte Daten im JSON-Format
  • Invoice_US.csv - Extrahierte Daten im CSV-Format (falls konfiguriert)
  • Zusätzliche Dateien, je nach Ihren Ausgabeeinstellungen

Ergebnisse herunterladen

Legen Sie Ihr lokales Verzeichnis für Downloads fest:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Eine einzelne Datei herunterladen:
sftp> get Invoice_US.json
Laden Sie alle Dateien aus dem Ordner herunter:
sftp> mget *
Laden Sie den gesamten Ergebnisordner rekursiv herunter:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Die JSON-Ausgabe verstehen

Die Standardausgabe ist eine JSON-Datei, die Folgendes enthält:
  • Dokumentstruktur – Layout und Aufbau
  • Extrahierte Feldwerte – Aus dem Dokument ausgelesene Daten
  • Konfidenzwerte – Zuverlässigkeit jeder Extraktion
  • Regelfehler – Etwaige Validierungsprobleme
  • Feldmetadaten – Zusätzliche Informationen zu jedem Feld
Beispielstruktur:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Ausführliche Informationen zum JSON-Schema finden Sie in der ABBYY Vantage-API-Dokumentation.

Nützliche SFTP-Befehle

BefehlBeschreibungBeispiel
lsEntfernte Dateien auflistenls
llsLokale Dateien auflistenlls
pwdEntferntes Verzeichnis anzeigenpwd
lpwdLokales Verzeichnis anzeigenlpwd
cd folderIn entferntes Verzeichnis wechselncd Output
lcd folderIn lokales Verzeichnis wechselnlcd ~/Downloads
put fileEinzelne Datei hochladenput invoice.pdf
mput filesMehrere Dateien hochladenmput *.jpg
get fileEinzelne Datei herunterladenget result.json
mget filesMehrere Dateien herunterladenmget *
get -r folderOrdner rekursiv herunterladenget -r results/
exitVerbindung trennenexit

Fehlerbehebung

Verbindungsprobleme

Problem: Fehler wie „Connection refused“ oder Zeitüberschreitungen (Timeout-Fehler) Lösungen:
  • Überprüfen Sie, ob Sie mit dem Unternehmens-VPN verbunden sind
  • Prüfen Sie die Portnummer (sollte 2022 mit großgeschriebenem -P sein)
  • Stellen Sie sicher, dass Ihr Benutzername und Ihr Passwort korrekt sind
  • Testen Sie die grundlegende Netzwerkverbindung: ping 172.172.228.138

Upload-Probleme

Problem: Dateien werden nicht verarbeitet Lösungen:
  • Überprüfen Sie den Ordner Input-exception auf fehlgeschlagene Importe
  • Prüfen Sie, ob das Dateiformat unterstützt wird (PDF, JPG, PNG, TIFF usw.)
  • Stellen Sie sicher, dass der Process-Skill veröffentlicht ist
  • Prüfen Sie die Beschränkungen für die Dateigröße (variieren je nach Konfiguration)

Keine Ausgabedateien

Problem: Der Ausgabeordner ist nach dem Hochladen leer Lösungen:
  • Etwas länger warten – die Verarbeitung kann 30–60 Sekunden oder länger dauern
  • Prüfen, ob Output mit dem Ziel „Shared folder“ konfiguriert ist
  • Vorgangsprotokolle in der Vantage-Weboberfläche überprüfen
  • Sicherstellen, dass die Extract-Aktivität mit entsprechenden Document-Skills konfiguriert ist

Berechtigungsfehler

Problem: „Zugriff verweigert“ beim Hochladen oder Herunterladen Lösungen:
  • Überprüfen Sie, ob Sie die richtigen Zugangsdaten für Input bzw. Output verwenden
  • Input-Zugangsdaten erlauben: Hochladen, Löschen
  • Output-Zugangsdaten erlauben: Anzeigen, Herunterladen, Umbenennen, Löschen
  • Stellen Sie sicher, dass der Skill veröffentlicht und aktiv ist

Bewährte Vorgehensweisen

Sicherheit

  • SFTP-Zugangsdaten niemals im Klartext weitergeben
  • Passwörter nur über sichere Kanäle übertragen
  • Zugangsdaten regelmäßig ändern
  • SFTP-Zugriff auf unbedingt benötigtes Personal beschränken

Dateiverwaltung

  • Verwenden Sie aussagekräftige Dateinamen, die Datumsangaben oder IDs enthalten
  • Verarbeiten Sie Dateien nach Möglichkeit stapelweise außerhalb der Spitzenzeiten
  • Laden Sie Ergebnisse zeitnah herunter und archivieren Sie sie
  • Bereinigen Sie alte Ergebnisordner regelmäßig

Überwachung

  • Ordner „Input-exception“ regelmäßig auf fehlgeschlagene Importe prüfen
  • Verarbeitungszeiten überwachen, um Engpässe zu identifizieren
  • Konfidenzwerte der Extraktion in den Ergebnissen überprüfen
  • Benachrichtigungen für kritische Fehler einrichten (falls verfügbar)

Workflow-Optimierung

  • Gruppieren Sie ähnliche Dokumenttypen
  • Konfigurieren Sie geeignete Document-Skills für Ihren Anwendungsfall
  • Testen Sie mit Beispieldokumenten, bevor Sie in die Produktion gehen
  • Dokumentieren Sie Ihren SFTP-Workflow als Referenz für Ihr Team

Nächste Schritte

Jetzt, da Sie eine funktionierende SFTP-basierte Dokumentenverarbeitungs-Pipeline haben:
  1. Mit verschiedenen Dokumenten testen – Laden Sie unterschiedliche Dateitypen und Dokumentvarianten hoch
  2. Extraktionsgenauigkeit überprüfen – Prüfen Sie die JSON-Ergebnisse und Konfidenzwerte
  3. Extraktion anpassen – Verwenden Sie Edit Mapping, um die Feldextraktion zu verfeinern
  4. Uploads automatisieren – Erstellen Sie Skripte, um Dateiuploads zu automatisieren
  5. In Systeme integrieren – Verbinden Sie Ihre Anwendungen über die Vantage REST API
  6. Workflow skalieren – Fügen Sie weitere Document-Skills hinzu oder erstellen Sie zusätzliche Process-Skills
Für erweiterte Konfigurationen, API-Integration oder benutzerdefinierte Workflows lesen Sie die ABBYY Vantage-Dokumentation.

Zusätzliche Ressourcen

  • REST-API-Dokumentation: Für programmgesteuerte Datei-Uploads und das Abrufen von Ergebnissen
  • Skill Catalog: Vorgefertigte Document-Skills durchsuchen
  • Support: Wenden Sie sich für technische Unterstützung an den ABBYY Support

Zusammenfassung

Sie haben erfolgreich:
  • ✅ Einen Process-Skill in ABBYY Vantage erstellt
  • ✅ SFTP-Zugriff für Eingabe und Ausgabe konfiguriert
  • ✅ Dokumentenextraktions-Skills eingerichtet
  • ✅ Über die SFTP-Kommandozeile eine Verbindung hergestellt
  • ✅ Dokumente zur Verarbeitung hochgeladen
  • ✅ Extraktionsergebnisse heruntergeladen
Ihre Dokumentverarbeitungs-Pipeline ist nun funktionsfähig und bereit für den Produktivbetrieb!