Passer au contenu principal

Introduction

Lors de l’installation d’ABBYY Vantage, le nombre de services et de workers dépend de la charge. ABBYY Vantage met automatiquement à l’échelle les services et les workers afin d’optimiser le traitement des documents. Ce guide contient des informations sur les ressources dont ABBYY Vantage aura besoin en fonction de la charge, ainsi que des recommandations à l’intention de l’administrateur système concernant les méthodes appropriées pour fournir ces ressources à ABBYY Vantage.

Configurations de référence

La consommation de ressources dépend de votre scénario de traitement de documents : le type de documents traités, la compétence utilisée et la charge en pages (c’est-à-dire le nombre de pages traitées sur une certaine période). La configuration de référence Haute disponibilité a été testée lors du traitement de factures de 3 pages et de 50 pages à l’aide de la Compétence de processus par défaut avec les charges suivantes :
  • 50 000 pages sur 8 heures
  • 100 000 pages sur 8 heures
  • 150 000 pages sur 8 heures
  • 200 000 pages sur 8 heures
La configuration de référence Sans haute disponibilité a été testée lors du traitement de factures de 3 pages à l’aide de la Compétence de processus par défaut avec les charges suivantes :
  • 10 000 pages sur 8 heures
  • 30 000 pages sur 8 heures
  • 50 000 pages sur 8 heures
La configuration Sans haute disponibilité ne prend pas en charge l’entraînement de compétences avec l’activité Deep Learning.
Pendant les tests des configurations de référence, les fichiers ont été envoyés au système via l’API REST. La Compétence de processus par défaut avec le flux de travail suivant a été utilisée :
  1. Importer les fichiers.
  2. Reconnaître les documents.
  3. Classer et déterminer les types de document.
  4. Extraire les données des documents.
  5. Exporter les données au format JSON.

Types de nœuds

Type de nœudCœurs CPU (par nœud)RAM, Go (par nœud)Taille du disque, Go
Nœuds de service1248120*
Nœuds de travail1248120
*Les exigences de taille de disque indiquées ci-dessus correspondent à des valeurs minimales, ce qui signifie qu’un espace disque supplémentaire peut être nécessaire. Par défaut, Vantage installe un stockage de fichiers NFS sur les machines virtuelles. Dans ce cas, les machines virtuelles utilisées comme premier nœud de service nécessiteront un espace disque supplémentaire en fonction de la charge de travail.

Exigences de stockage

ConfigurationStockageEmplacement du stockageTaille du disque, Go
Sans haute disponibilitéNFS interneNœud de service500 (pour le traitement de 10 000 pages par période de 8 heures)
Sans haute disponibilitéNFS externeMachine du serveur NFS500 (pour le traitement de 10 000 pages par période de 8 heures)
Haute disponibilitéNFS externeMachine du serveur NFS50 (pour le traitement de 10 000 pages par période de 8 heures)
Haute disponibilitéVolume persistant localPremier nœud de service (à partir du fichier d’inventaire)500 (pour le traitement de 10 000 pages par période de 8 heures)
Vous pouvez avoir besoin d’une capacité de stockage supplémentaire si vous utilisez de grands catalogues de données, des compétences comportant un grand nombre d’activités ou si vous exportez des données vers des dossiers partagés.
Nous recommandons d’utiliser un stockage externe si la charge est supérieure à 10 000 pages par période de 8 heures.

Résultats de performance

En fonction de la charge par page, ABBYY Vantage a nécessité les ressources suivantes pour traiter efficacement les documents dans chaque configuration :

Configuration à haute disponibilité

Charge (pages/8 heures)Nœuds pour les services (factures de 3 pages)Nœuds pour les services (factures de 50 pages)Nœuds pour les workers (factures de 3 pages)Nœuds pour les workers (factures de 50 pages)
50,0004444
100,0004457
150,0004479
200,00044811
Pendant les tests, des statistiques sur les opérations d’entrées/sorties du disque utilisé pour le stockage des blobs ont également été collectées. Vous pouvez vous attendre à ce que les valeurs, dans votre cas, ne dépassent pas celles-ci :

Opérations d’E/S disque

Charge (pages/8 heures)Opérations d’E/S disque par seconde (factures de 3 pages)Opérations d’E/S disque par seconde (factures de 50 pages)
50,00010050
100,000250100
150,000400170
200,000600230

Sans configuration de haute disponibilité

Charge (pages/8 heures)Nœuds pour les servicesNœuds de travail
10,00011*
30,00013
50,00013
*La configuration avec un seul nœud de travail est destinée uniquement aux tests et ne prend pas en charge l’entraînement de Skills avec un quelconque niveau d’activité.
Lors du passage à l’échelle d’ABBYY Vantage, aucune augmentation du temps de traitement des documents n’a été observée.

Gestion des nœuds

L’administrateur système peut ajouter des nœuds de travail supplémentaires au cluster afin d’augmenter la capacité de traitement. Pour plus d’informations sur la préparation d’un nœud, consultez la section Configuration système requise.

Ajout d’un nœud worker

Pour ajouter un nœud worker, procédez comme suit :
  1. Ouvrez un fichier d’inventaire à partir du répertoire d’installation.
  2. Dans la section [abbyy_workers], ajoutez un nœud supplémentaire en indiquant son nom et son adresse IP.
  3. Exécutez le programme d’installation :
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
  1. Exécutez le playbook suivant :
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml