Lors de l’installation d’ABBYY Vantage, le nombre de services et de workers dépend de la charge. ABBYY Vantage met automatiquement à l’échelle les services et les workers afin d’optimiser le traitement des documents. Ce guide contient des informations sur les ressources dont ABBYY Vantage aura besoin en fonction de la charge, ainsi que des recommandations à l’intention de l’administrateur système concernant les méthodes appropriées pour fournir ces ressources à ABBYY Vantage.
Configurations de référence
La consommation de ressources dépend de votre scénario de traitement de documents : le type de documents traités, la compétence utilisée et la charge en pages (c’est-à-dire le nombre de pages traitées sur une certaine période).
La configuration de référence Haute disponibilité a été testée lors du traitement de factures de 3 pages et de 50 pages à l’aide de la Compétence de processus par défaut avec les charges suivantes :
- 50 000 pages sur 8 heures
- 100 000 pages sur 8 heures
- 150 000 pages sur 8 heures
- 200 000 pages sur 8 heures
La configuration de référence Sans haute disponibilité a été testée lors du traitement de factures de 3 pages à l’aide de la Compétence de processus par défaut avec les charges suivantes :
- 10 000 pages sur 8 heures
- 30 000 pages sur 8 heures
- 50 000 pages sur 8 heures
La configuration Sans haute disponibilité ne prend pas en charge l’entraînement de compétences avec l’activité Deep Learning.
Pendant les tests des configurations de référence, les fichiers ont été envoyés au système via l’API REST. La Compétence de processus par défaut avec le flux de travail suivant a été utilisée :
- Importer les fichiers.
- Reconnaître les documents.
- Classer et déterminer les types de document.
- Extraire les données des documents.
- Exporter les données au format JSON.
| Type de nœud | Cœurs CPU (par nœud) | RAM, Go (par nœud) | Taille du disque, Go |
|---|
| Nœuds de service | 12 | 48 | 120* |
| Nœuds de travail | 12 | 48 | 120 |
*Les exigences de taille de disque indiquées ci-dessus correspondent à des valeurs minimales, ce qui signifie qu’un espace disque supplémentaire peut être nécessaire. Par défaut, Vantage installe un stockage de fichiers NFS sur les machines virtuelles. Dans ce cas, les machines virtuelles utilisées comme premier nœud de service nécessiteront un espace disque supplémentaire en fonction de la charge de travail.
| Configuration | Stockage | Emplacement du stockage | Taille du disque, Go |
|---|
| Sans haute disponibilité | NFS interne | Nœud de service | 500 (pour le traitement de 10 000 pages par période de 8 heures) |
| Sans haute disponibilité | NFS externe | Machine du serveur NFS | 500 (pour le traitement de 10 000 pages par période de 8 heures) |
| Haute disponibilité | NFS externe | Machine du serveur NFS | 50 (pour le traitement de 10 000 pages par période de 8 heures) |
| Haute disponibilité | Volume persistant local | Premier nœud de service (à partir du fichier d’inventaire) | 500 (pour le traitement de 10 000 pages par période de 8 heures) |
Vous pouvez avoir besoin d’une capacité de stockage supplémentaire si vous utilisez de grands catalogues de données, des compétences comportant un grand nombre d’activités ou si vous exportez des données vers des dossiers partagés.
Nous recommandons d’utiliser un stockage externe si la charge est supérieure à 10 000 pages par période de 8 heures.
En fonction de la charge par page, ABBYY Vantage a nécessité les ressources suivantes pour traiter efficacement les documents dans chaque configuration :
Configuration à haute disponibilité
| Charge (pages/8 heures) | Nœuds pour les services (factures de 3 pages) | Nœuds pour les services (factures de 50 pages) | Nœuds pour les workers (factures de 3 pages) | Nœuds pour les workers (factures de 50 pages) |
|---|
| 50,000 | 4 | 4 | 4 | 4 |
| 100,000 | 4 | 4 | 5 | 7 |
| 150,000 | 4 | 4 | 7 | 9 |
| 200,000 | 4 | 4 | 8 | 11 |
Pendant les tests, des statistiques sur les opérations d’entrées/sorties du disque utilisé pour le stockage des blobs ont également été collectées. Vous pouvez vous attendre à ce que les valeurs, dans votre cas, ne dépassent pas celles-ci :
| Charge (pages/8 heures) | Opérations d’E/S disque par seconde (factures de 3 pages) | Opérations d’E/S disque par seconde (factures de 50 pages) |
|---|
| 50,000 | 100 | 50 |
| 100,000 | 250 | 100 |
| 150,000 | 400 | 170 |
| 200,000 | 600 | 230 |
Sans configuration de haute disponibilité
| Charge (pages/8 heures) | Nœuds pour les services | Nœuds de travail |
|---|
| 10,000 | 1 | 1* |
| 30,000 | 1 | 3 |
| 50,000 | 1 | 3 |
*La configuration avec un seul nœud de travail est destinée uniquement aux tests et ne prend pas en charge l’entraînement de Skills avec un quelconque niveau d’activité.
Lors du passage à l’échelle d’ABBYY Vantage, aucune augmentation du temps de traitement des documents n’a été observée.
L’administrateur système peut ajouter des nœuds de travail supplémentaires au cluster afin d’augmenter la capacité de traitement. Pour plus d’informations sur la préparation d’un nœud, consultez la section Configuration système requise.
Pour ajouter un nœud worker, procédez comme suit :
- Ouvrez un fichier d’inventaire à partir du répertoire d’installation.
- Dans la section
[abbyy_workers], ajoutez un nœud supplémentaire en indiquant son nom et son adresse IP.
- Exécutez le programme d’installation :
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
- Exécutez le playbook suivant :
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml