Zum Hauptinhalt springen

Übersicht

ABBYY Vantage ermöglicht die automatisierte Dokumentverarbeitung mit intelligenten Extraktionsfunktionen. Diese Anleitung konzentriert sich auf den SFTP-basierten Workflow, mit dem Sie Dokumente in einen freigegebenen Ordner hochladen und die verarbeiteten Ergebnisse automatisch abrufen können. Was Sie erreichen werden:
  • Erstellen und Konfigurieren eines Process-Skills
  • Einrichten des SFTP-Zugriffs für Eingabe und Ausgabe
  • Hochladen von Dokumenten über die Befehlszeile
  • Herunterladen von Extraktionsergebnissen
Benötigte Zeit: 15–20 Minuten

Schritt 1: Einen Process-Skill erstellen

Ein Process-Skill ist die Grundlage Ihres Workflows zur Dokumentenverarbeitung in Vantage.
  1. Navigieren Sie zum Bereich Documents in ABBYY Vantage.
  2. Klicken Sie in der linken Seitenleiste auf Skill Designer.
  3. Wählen Sie Process Skill aus den Skill-Typen.
Selecting Process Skill
  1. Geben Sie im Dialogfeld Create Process skill Folgendes ein:
    • Skill Name: Ein aussagekräftiger Name für Ihren Prozess (z. B. „Process Skill Test 1“)
    • Description: Optionale Beschreibung, wozu dieser Skill dient
    • Technology Core Version: 3.0 (empfohlen)
Naming Process Skill
  1. Klicken Sie auf Create.

Schritt 2: Process-Skill-Workflow konfigurieren

Nachdem Sie Ihren Skill erstellt haben, richten Sie den Dokumentenverarbeitungsablauf ein.
  1. Im Skill Designer sehen Sie rechts den Bereich Select Process Skill
  2. Wählen Sie Simple Document skill workflow für die Verarbeitung einzelner Dokumenttypen
Selecting Simple Workflow Dadurch wird ein vorkonfigurierter Workflow erstellt mit:
  • Input-Connector: Hier gelangen Dokumente in das System
  • OCR-Skill: Optical Character Recognition
  • Extract-Skill: Datenextraktion
  • Output-Connector: Hier werden die Ergebnisse bereitgestellt
Der Workflow wird in der zentralen Arbeitsfläche wie folgt angezeigt: Input → OCR → Extract → Output

Schritt 3: Eingabe über SFTP einrichten

Konfigurieren Sie die Input-Aktivität, um Dokumente per SFTP zu empfangen.
  1. Klicken Sie im Workflow auf die Aktivität Input.
  2. Aktivieren Sie im Bereich Actions auf der rechten Seite die Option Select additional source.
  3. Wählen Sie die Option Shared folder.
  4. Klicken Sie auf Settings, um sie zu konfigurieren.
Konfiguration der Input-Aktivität

Eingabeeinstellungen konfigurieren

Im Dialog Input Settings: Shared Folder: Input Settings Dialog Ordnereinstellungen:
  • Ordnername: Input (Standard)
  • Importmethode: Single file
Anmeldedaten für den Import (werden zu Ihrer Information angezeigt):
  • Ordnerlink: .../Input
  • Link zum Ausnahmeordner: .../Input-exception
  • Benutzername: Eine generierte UUID (z. B. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Passwort: Wird mit Option zum Ein-/Ausblenden angezeigt
Hinweis: Kopieren Sie diese Anmeldedaten, Sie benötigen sie für die Verbindung über SFTP. Dateien, die nicht importiert werden können, werden in den Ausnahmeordner verschoben. Vantage prüft alle 20 Sekunden nach der Veröffentlichung des Skills, ob neue Dateien vorhanden sind.
  1. Klicken Sie auf Save.

Schritt 4: Ausgabe über SFTP einrichten

Konfigurieren Sie die Output-Aktivität, um Ergebnisse per SFTP auszugeben.
  1. Klicken Sie im Workflow auf die Aktivität Output.
  2. Aktivieren Sie im Bereich Actions die Option Select additional destination.
  3. Wählen Sie das Optionsfeld Shared folder.
  4. Klicken Sie auf Settings, um die Ausgabe zu konfigurieren.
Configuring Output Activity

Ausgabeeinstellungen konfigurieren

Im Dialogfeld Output Settings: Shared Folder: Output Settings Dialog Info:
  • Folder name: Output (Standard)
  • Folder: .../Output
  • Username: Eine generierte UUID (z. B. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Wird mit einer Ein-/Ausblendeoption angezeigt
Exported Data:
  • Fields (JSON): Standard-Exportformat
Hinweis: Die Ergebnisse werden in Unterordnern organisiert, die nach der Quelldatei und der Vorgangs-ID benannt sind (z. B. invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). Dateien werden automatisch gemäß der Richtlinie zur Datenaufbewahrung entfernt.
  1. Klicken Sie auf Save.

Schritt 5: Extraktions-Skills konfigurieren

Legen Sie fest, welche Dokumenttypen von der Extract-Aktivität erkannt und verarbeitet werden sollen.
  1. Klicken Sie im Workflow auf die Aktivität Extract.
  2. Im Bereich Actions sehen Sie Document-Skills.
Extraktions-Skills konfigurieren Verfügbare Document-Skills sind:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Wählen Sie die für Ihren Anwendungsfall relevanten Dokumenttypen aus.
  2. Klicken Sie auf Add Skill, wenn Sie weitere Dokumenttypen benötigen.
  3. Verwenden Sie Edit Mapping, um die Feldextraktion bei Bedarf anzupassen.

Schritt 6: Veröffentlichen und Skill-ID abrufen

Bevor Sie SFTP verwenden können, müssen Sie die Skill veröffentlichen und die zugehörige ID ermitteln.
  1. Klicken Sie auf die Schaltfläche Publish oben rechts im Skill Designer.
  2. Sobald die Skill veröffentlicht wurde, notieren Sie die Skill-ID aus der Browser-URL.
Getting Skill ID from URL Das URL-Format lautet:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Zum Beispiel: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Warnung: Halten Sie Ihre Skill-ID bereit – Sie benötigen sie, um über SFTP auf die richtigen Eingabe- und Ausgabeordner zuzugreifen.

Schritt 7: Verbindung mit SFTP herstellen

Jetzt können Sie sich per SFTP mit den Zugangsdaten aus Ihren Input-/Output-Einstellungen verbinden.

Verbindungsdetails

Aus Ihren Ein-/Ausgabe-Einstellungen erhalten Sie:
  • Server: 172.172.228.138
  • Port: 2022
  • Benutzername: Ihre generierte UUID
  • Passwort: Ihr generiertes Passwort
  • Basispfad: /{skill-id}/

Über das Terminal verbinden

Öffnen Sie Ihr Terminal und verbinden Sie sich mit:
sftp -P 2022 {username}@172.172.228.138
Beispiel:
sftp -P 2022 [email protected]
Hinweis: Verwenden Sie für die Portnummer bei SFTP ein großes -P (das kleine -p hat einen anderen Zweck). Wenn Sie dazu aufgefordert werden, geben Sie Ihr Passwort ein.

Schritt 8: In der SFTP-Ordnerstruktur navigieren

Sobald die Verbindung hergestellt wurde, sehen Sie die SFTP-Eingabeaufforderung: sftp>

Verfügbare Skills anzeigen

Listen Sie alle verfügbaren Process-Skills auf:
sftp> ls
Zugriff auf Skill-Ordner Sie sehen Ordner für jeden Skill (identifiziert durch die jeweilige Skill-ID) sowie:
  • Catalogs - Document-Skill-Kataloge
  • Catalogs-exception - fehlgeschlagene Katalogimporte
  • skills-import - Skill-Import-Verzeichnis
Verwenden Sie die Skill-ID aus Schritt 6:
sftp> cd {your-skill-id}
sftp> ls
Sie sollten drei Ordner sehen:
  • Input - Hier laden Sie Dokumente zur Verarbeitung hoch
  • Input-exception - Fehlgeschlagene Importe werden hierher verschoben
  • Output - Hier erscheinen die verarbeiteten Ergebnisse

Schritt 9: Dokumente zur Verarbeitung hochladen

Navigieren Sie zum Ordner „Input“ und laden Sie Ihre Dokumente hoch.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Eine einzelne Datei hochladen

Laden Sie eine Datei unter Angabe des vollständigen Dateipfads hoch:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Oder wechseln Sie zuerst in Ihr lokales Verzeichnis:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Dateien hoch- und herunterladen

Mehrere Dateien hochladen

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Hinweis: Dateien, die in Input hochgeladen werden, werden nach erfolgreicher Verarbeitung automatisch gelöscht (in der Regel innerhalb von 20 Sekunden). Wenn Sie Ihre Datei nach dem Hochladen nicht sehen, bedeutet das, dass Vantage sie bereits zur Verarbeitung übernommen hat!

Upload überprüfen

Prüfen Sie, ob sich noch Dateien im Ordner „Input“ befinden:
sftp> ls
Wenn der Ordner leer ist oder Ihre Datei fehlt, wurde die Verarbeitung gestartet.

Schritt 10: Verarbeitungsstatus überprüfen

Ordner „Input-exception“ überwachen

Wenn eine Datei nicht importiert werden konnte, erscheint sie hier:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Ein leerer Ordner zeigt an, dass alle Dateien erfolgreich importiert wurden.

Auf die Verarbeitung warten

Die Verarbeitungszeit variiert je nach:
  • Komplexität des Dokuments
  • konfigurierten Extraction Skills
  • aktueller Systemauslastung
In der Regel werden einfache Rechnungen innerhalb von 30–60 Sekunden verarbeitet.

Schritt 11: Verarbeitete Ergebnisse herunterladen

Sobald die Verarbeitung abgeschlossen ist, erscheinen die Ergebnisse im Ordner „Output“.
sftp> cd ..
sftp> cd Output
sftp> ls

Ausgabestruktur verstehen

Die Ergebnisse sind in Unterordnern mit folgendem Namensmuster organisiert:
{original-filename}-{transaction-id}
Beispiel:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Inhalte eines Ergebnisordners anzeigen

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Typische Inhalte:
  • Invoice_US.json - Extrahierte Daten im JSON-Format
  • Invoice_US.csv - Extrahierte Daten im CSV-Format (falls konfiguriert)
  • Zusätzliche Dateien, abhängig von Ihren Ausgabeeinstellungen

Ergebnisse herunterladen

Legen Sie Ihr lokales Verzeichnis für Downloads fest:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Eine Datei herunterladen:
sftp> get Invoice_US.json
Alle Dateien im Ordner herunterladen:
sftp> mget *
Laden Sie den gesamten Ergebnisordner rekursiv herunter:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Die JSON-Ausgabe verstehen

Die Standardausgabe ist eine JSON-Datei mit:
  • Dokumentstruktur - Layout und Struktur
  • Extrahierte Feldwerte - Aus dem Dokument übernommene Daten
  • Konfidenzwerte - Zuverlässigkeit jeder Extraktion
  • Regelfehler - Alle Validierungsprobleme
  • Feldmetadaten - Zusätzliche Informationen zu jedem Feld
Beispielstruktur:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Ausführliche Dokumentation zum JSON-Schema finden Sie in der ABBYY Vantage-API-Dokumentation.

Nützliche SFTP-Befehle

CommandBeschreibungBeispiel
lsEntfernte Dateien auflistenls
llsLokale Dateien auflistenlls
pwdEntferntes Verzeichnis anzeigenpwd
lpwdLokales Verzeichnis anzeigenlpwd
cd folderIn anderes entferntes Verzeichnis wechselncd Output
lcd folderIn anderes lokales Verzeichnis wechselnlcd ~/Downloads
put fileEinzelne Datei hochladenput invoice.pdf
mput filesMehrere Dateien hochladenmput *.jpg
get fileEinzelne Datei herunterladenget result.json
mget filesMehrere Dateien herunterladenmget *
get -r folderOrdner rekursiv herunterladenget -r results/
exitVerbindung trennenexit

Fehlerbehebung

Verbindungsprobleme

Problem: „Connection refused“ oder Timeout-Fehler Lösungen:
  • Überprüfen Sie, ob Sie mit dem Unternehmens-VPN verbunden sind
  • Prüfen Sie die Portnummer (sollte 2022 sein; verwenden Sie dabei ein großes -P)
  • Vergewissern Sie sich, dass Ihr Benutzername und Ihr Passwort korrekt sind
  • Testen Sie die grundlegende Netzwerkverbindung: ping 172.172.228.138

Upload-Probleme

Problem: Dateien werden nicht verarbeitet Lösungen:
  • Überprüfen Sie den Ordner Input-exception auf fehlgeschlagene Importe
  • Stellen Sie sicher, dass das Dateiformat unterstützt wird (PDF, JPG, PNG, TIFF usw.)
  • Stellen Sie sicher, dass der Process-Skill veröffentlicht ist
  • Überprüfen Sie die Dateigrößenbeschränkungen (abhängig von der Konfiguration)

Keine Ausgabedateien

Problem: Der Ausgabeordner ist nach dem Hochladen leer Lösungen:
  • Länger warten – die Verarbeitung kann 30–60 Sekunden oder länger dauern
  • Prüfen, ob Output mit dem Ziel „Shared folder“ konfiguriert ist
  • Vorgangsprotokolle in der Vantage-Weboberfläche prüfen
  • Sicherstellen, dass die Extract-Aktivität mit geeigneten Document-Skills konfiguriert ist

Berechtigungsfehler

Problem: „Zugriff verweigert“ beim Hoch‑ oder Herunterladen Lösungen:
  • Überprüfen Sie, ob Sie die richtigen Zugangsdaten für Input bzw. Output verwenden
  • Input-Zugangsdaten erlauben: hochladen, löschen
  • Output-Zugangsdaten erlauben: anzeigen, herunterladen, umbenennen, löschen
  • Stellen Sie sicher, dass das Skill veröffentlicht und aktiv ist

Bewährte Methoden

Sicherheit

  • SFTP-Zugangsdaten niemals im Klartext weitergeben
  • Sichere Kanäle zur Übermittlung von Passwörtern nutzen
  • Zugangsdaten regelmäßig ändern
  • SFTP-Zugriff auf erforderliches Personal beschränken

Dateiverwaltung

  • Verwenden Sie aussagekräftige Dateinamen, die Datumsangaben oder IDs enthalten
  • Verarbeiten Sie Dateien nach Möglichkeit stapelweise außerhalb der Spitzenzeiten
  • Laden Sie Ergebnisse umgehend herunter und archivieren Sie sie
  • Löschen Sie alte Ergebnisordner regelmäßig

Überwachung

  • Überprüfen Sie den Ordner „Input-exception“ regelmäßig auf fehlgeschlagene Importe
  • Überwachen Sie die Verarbeitungszeiten, um Engpässe zu identifizieren
  • Prüfen Sie die Konfidenzwerte der Extraktion in den Ergebnissen
  • Richten Sie Benachrichtigungen für kritische Fehler ein (falls verfügbar)

Workflow-Optimierung

  • Ähnliche Dokumenttypen gruppieren
  • Geeignete Document-Skills für Ihren Anwendungsfall konfigurieren
  • Mit Beispieldokumenten testen, bevor Sie diese produktiv einsetzen
  • Ihren SFTP-Workflow zur Referenz für das Team dokumentieren

Nächste Schritte

Jetzt, da Sie über eine funktionierende SFTP-basierte Dokumentverarbeitungspipeline verfügen:
  1. Mit verschiedenen Dokumenten testen – Laden Sie unterschiedliche Dateitypen und Dokumentvarianten hoch
  2. Extraktionsgenauigkeit prüfen – Überprüfen Sie die JSON-Ergebnisse und Konfidenzwerte
  3. Extraktion anpassen – Verwenden Sie Edit Mapping, um die Feldextraktion zu verfeinern
  4. Uploads automatisieren – Erstellen Sie Skripte, um Datei-Uploads zu automatisieren
  5. Mit Systemen integrieren – Verbinden Sie Ihre Anwendungen über die Vantage REST API
  6. Workflow skalieren – Fügen Sie weitere Document-Skills hinzu oder erstellen Sie zusätzliche Process-Skills
Weitere Informationen zu erweiterten Konfigurationen, API-Integration oder benutzerdefinierten Workflows finden Sie in der ABBYY Vantage-Dokumentation.

Zusätzliche Ressourcen

  • REST API-Dokumentation: Für das programmgesteuerte Hochladen von Dateien und das Abrufen von Ergebnissen
  • Skill Catalog: Vorgefertigte Document-Skills durchsuchen
  • Support: Wenden Sie sich für technische Unterstützung an den ABBYY-Support

Zusammenfassung

Sie haben erfolgreich:
  • ✅ Einen Process-Skill in ABBYY Vantage erstellt
  • ✅ SFTP-Zugriff für Eingabe und Ausgabe konfiguriert
  • ✅ Dokumenten-Extraktions-Skills eingerichtet
  • ✅ Eine Verbindung über die SFTP-Kommandozeile hergestellt
  • ✅ Dokumente zur Verarbeitung hochgeladen
  • ✅ Extraktionsergebnisse heruntergeladen
Ihre Dokumentenverarbeitungs-Pipeline ist nun funktionsfähig und bereit für den produktiven Einsatz!