Quando si installa ABBYY Vantage, il numero di servizi e di worker dipende dal carico. ABBYY Vantage scalerà automaticamente i servizi e i worker per ottimizzare l’elaborazione dei documenti. Questa guida contiene informazioni sulle risorse di cui ABBYY Vantage avrà bisogno in funzione del carico, oltre a raccomandazioni per l’amministratore di sistema su come fornire correttamente queste risorse ad ABBYY Vantage.
Configurazioni di riferimento
Il consumo di risorse dipende dallo scenario di elaborazione dei documenti: dal tipo di documenti elaborati, dalla skill utilizzata e dal carico di pagine (cioè il numero di pagine elaborate in un determinato intervallo di tempo).
La configurazione di riferimento Altamente disponibile è stata testata durante l’elaborazione di fatture di 3 e 50 pagine utilizzando la Process skill predefinita con i seguenti carichi:
- 50.000 pagine in 8 ore
- 100.000 pagine in 8 ore
- 150.000 pagine in 8 ore
- 200.000 pagine in 8 ore
La configurazione di riferimento Senza alta disponibilità è stata testata durante l’elaborazione di fatture di 3 pagine utilizzando la Process skill predefinita con i seguenti carichi:
- 10.000 pagine in 8 ore
- 30.000 pagine in 8 ore
- 50.000 pagine in 8 ore
La configurazione Senza alta disponibilità non supporta l’addestramento delle skill con l’attività Deep Learning.
Durante i test delle configurazioni di riferimento, i file sono stati inviati al sistema tramite la REST API. È stata utilizzata la Process skill predefinita con il seguente flusso di lavoro:
- Importare i file.
- Riconoscere i documenti.
- Classificare e determinare i tipi di documento.
- Estrarre i dati dai documenti.
- Esportare i dati in JSON.
| Tipo di nodo | Core CPU (per ciascun nodo) | RAM, GB (per ciascun nodo) | Dimensione disco, GB |
|---|
| Nodi di servizio | 12 | 48 | 120* |
| Nodi worker | 12 | 48 | 120 |
*I requisiti di dimensione del disco riportati sopra si riferiscono ai requisiti minimi, il che significa che potrebbe essere necessario ulteriore spazio su disco. Per impostazione predefinita, Vantage installa l’archiviazione di file NFS sulle macchine virtuali. In questo caso, le macchine virtuali utilizzate come primo nodo di servizio richiederanno spazio su disco aggiuntivo a seconda del carico.
Requisiti di archiviazione
| Configuration | Storage | Storage location | Disk size, GB |
|---|
| Without high availability | NFS interno | Nodo di servizio | 500 (per elaborare 10.000 pagine ogni 8 ore) |
| Without high availability | NFS esterno | Macchina server NFS | 500 (per elaborare 10.000 pagine ogni 8 ore) |
| Highly available | NFS esterno | Macchina server NFS | 50 (per elaborare 10.000 pagine ogni 8 ore) |
| Highly available | Local persistent volume | Primo nodo di servizio (dal file di inventario) | 500 (per elaborare 10.000 pagine ogni 8 ore) |
Potrebbe essere necessario ulteriore spazio di archiviazione se utilizzi cataloghi di dati di grandi dimensioni, skill con un numero elevato di attività o esporti dati in cartelle condivise.
Si consiglia di utilizzare uno storage esterno se il carico è superiore a 10.000 pagine ogni 8 ore.
A seconda del carico di pagina, ABBYY Vantage ha richiesto la seguente quantità di risorse per elaborare in modo efficiente i documenti in ciascuna configurazione:
Configurazione ad alta disponibilità
| Carico (pagine/8 ore) | Nodi per i servizi (fatture di 3 pagine) | Nodi per i servizi (fatture di 50 pagine) | Nodi per i worker (fatture di 3 pagine) | Nodi per i worker (fatture di 50 pagine) |
|---|
| 50,000 | 4 | 4 | 4 | 4 |
| 100,000 | 4 | 4 | 5 | 7 |
| 150,000 | 4 | 4 | 7 | 9 |
| 200,000 | 4 | 4 | 8 | 11 |
Durante i test sono state raccolte anche le statistiche sulle operazioni di input/output per il disco utilizzato per l’archiviazione dei blob. Puoi aspettarti che, nel tuo caso, i valori non superino i seguenti:
Operazioni di I/O su disco
| Carico (pagine/8 ore) | Operazioni di I/O su disco al secondo (fatture di 3 pagine) | Operazioni di I/O su disco al secondo (fatture di 50 pagine) |
|---|
| 50.000 | 100 | 50 |
| 100.000 | 250 | 100 |
| 150.000 | 400 | 170 |
| 200.000 | 600 | 230 |
Senza configurazione ad alta disponibilità
| Carico (pagine/8 ore) | Nodi per i servizi | Nodi per i worker |
|---|
| 10,000 | 1 | 1* |
| 30,000 | 1 | 3 |
| 50,000 | 1 | 3 |
*La configurazione con un nodo worker è destinata esclusivamente a scopi di test e non supporta l’addestramento di skill con alcuna attività.
Durante lo scaling di ABBYY Vantage non è stato rilevato alcun aumento dei tempi di elaborazione dei documenti.
L’Amministratore di sistema può aggiungere nodi worker al cluster per aumentare la capacità di gestire il carico previsto. Per ulteriori informazioni su come preparare un nodo, vedere System Requirements.
Aggiunta di un nodo worker
Per aggiungere un nodo worker, seguire questi passaggi:
- Aprire un file inventory dalla directory di installazione.
- Nella sezione
[abbyy_workers], aggiungere un ulteriore nodo specificandone il nome e l’indirizzo IP.
- Eseguire il programma di installazione:
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
- Esegui il playbook seguente:
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml