Zum Hauptinhalt springen

Einführung

Bei der Installation von ABBYY Vantage hängt die Anzahl der Services und Worker von der Last ab. ABBYY Vantage skaliert Services und Worker automatisch, um die Dokumentenverarbeitung zu optimieren. Dieser Leitfaden enthält Informationen über die Ressourcen, die ABBYY Vantage abhängig von der Last benötigt, sowie Empfehlungen für den Systemadministrator zur korrekten Bereitstellung dieser Ressourcen für ABBYY Vantage.

Referenzkonfigurationen

Der Ressourcenverbrauch hängt von Ihrem Dokumentenverarbeitungsszenario ab: der Art der verarbeiteten Dokumente, dem verwendeten Skill und der Seitenlast (also der Anzahl der Seiten, die innerhalb eines bestimmten Zeitraums verarbeitet werden). Die Referenzkonfiguration Hochverfügbar wurde beim Verarbeiten von Rechnungen mit 3 bzw. 50 Seiten mit dem Standard-Process-Skill unter folgenden Lasten getestet:
  • 50.000 Seiten innerhalb von 8 Stunden
  • 100.000 Seiten innerhalb von 8 Stunden
  • 150.000 Seiten innerhalb von 8 Stunden
  • 200.000 Seiten innerhalb von 8 Stunden
Die Referenzkonfiguration Ohne Hochverfügbarkeit wurde beim Verarbeiten von Rechnungen mit 3 Seiten mit dem Standard-Process-Skill unter folgenden Lasten getestet:
  • 10.000 Seiten innerhalb von 8 Stunden
  • 30.000 Seiten innerhalb von 8 Stunden
  • 50.000 Seiten innerhalb von 8 Stunden
Die Konfiguration Ohne Hochverfügbarkeit unterstützt kein Training von Skills mit der Deep-Learning-Aktivität.
Während der Tests der Referenzkonfigurationen wurden Dateien über die REST-API an das System übergeben. Der Standard-Process-Skill mit folgendem Workflow wurde verwendet:
  1. Dateien importieren.
  2. Dokumente erkennen.
  3. Dokumente klassifizieren und Dokumenttypen bestimmen.
  4. Daten aus Dokumenten extrahieren.
  5. Daten als JSON exportieren.

Knotentypen

KnotentypCPU-Kerne (pro Knoten)RAM, GB (pro Knoten)Festplattengröße, GB
Serviceknoten1248120*
Workerknoten1248120
*Die oben aufgeführten Anforderungen an die Festplattengröße beziehen sich auf die Mindestanforderungen; es kann zusätzlicher Speicherplatz erforderlich sein. Vantage installiert standardmäßig NFS-Dateispeicher auf virtuellen Maschinen. In diesem Fall benötigen virtuelle Maschinen, die als erster Serviceknoten dienen, je nach Last zusätzlichen Speicherplatz.

Speicheranforderungen

ConfigurationStorageStorage locationDisk size, GB
Without high availabilityInternal NFSService node500 (für die Verarbeitung von je 10.000 Seiten pro 8 Std.)
Without high availabilityExternal NFSNFS-Server500 (für die Verarbeitung von je 10.000 Seiten pro 8 Std.)
Highly availableExternal NFSNFS-Server50 (für die Verarbeitung von je 10.000 Seiten pro 8 Std.)
Highly availableLocal persistent volumeErster Serviceknoten (aus der Inventory-Datei)500 (für die Verarbeitung von je 10.000 Seiten pro 8 Std.)
Möglicherweise benötigen Sie zusätzlichen Speicherplatz, wenn Sie große Datenkataloge verwenden, Skills mit einer großen Anzahl von Aktivitäten einsetzen oder Daten in freigegebene Ordner exportieren.
Wir empfehlen die Verwendung eines externen Speichers, wenn die Auslastung mehr als 10.000 Seiten pro 8 Stunden beträgt.

Leistungsergebnisse

Abhängig von der Seitenlast benötigte ABBYY Vantage in jeder Konfiguration die folgenden Ressourcen, um Dokumente effizient zu verarbeiten:

Hochverfügbarkeitskonfiguration

Auslastung (Seiten/8 Stunden)Knoten für Services (Rechnungen mit 3 Seiten)Knoten für Services (Rechnungen mit 50 Seiten)Knoten für Worker (Rechnungen mit 3 Seiten)Knoten für Worker (Rechnungen mit 50 Seiten)
50,0004444
100,0004457
150,0004479
200,00044811
Während der Tests wurden außerdem Statistiken zu den Ein-/Ausgabevorgängen für das Laufwerk erhoben, das für den Blob-Speicher verwendet wurde. Sie können davon ausgehen, dass die Werte in Ihrem Fall diese nicht überschreiten:

Datenträger-I/O-Operationen

Auslastung (Seiten/8 Stunden)Datenträger-I/O-Operationen pro Sekunde (Rechnungen mit 3 Seiten)Datenträger-I/O-Operationen pro Sekunde (Rechnungen mit 50 Seiten)
50,00010050
100,000250100
150,000400170
200,000600230

Ohne Hochverfügbarkeitskonfiguration

Auslastung (Seiten/8 Stunden)Knoten für DiensteKnoten für Worker
10,00011*
30,00013
50,00013
*Die Konfiguration mit einem Worker-Knoten ist nur für Testzwecke vorgesehen und unterstützt kein Training von Skills.
Beim Skalieren von ABBYY Vantage wurde keine Erhöhung der Dokumentverarbeitungszeit beobachtet.

Verwalten von Knoten

Der Systemadministrator kann dem Cluster zusätzliche Worker-Knoten hinzufügen, um die benötigte Verarbeitungskapazität zu erhöhen. Weitere Informationen zur Vorbereitung eines Knotens finden Sie unter Systemanforderungen.

Hinzufügen eines Workerknotens

Führen Sie die folgenden Schritte aus, um einen Workerknoten hinzuzufügen:
  1. Öffnen Sie eine Inventardatei aus dem Installationsverzeichnis.
  2. Fügen Sie im Abschnitt [abbyy_workers] einen zusätzlichen Knoten hinzu, indem Sie dessen Namen und IP-Adresse angeben.
  3. Führen Sie das Installationsprogramm aus:
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
  1. Führen Sie das folgende Playbook aus:
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml