Vai al contenuto principale

Introduzione

Quando si installa ABBYY Vantage, il numero di servizi e di worker dipende dal carico. ABBYY Vantage scalerà automaticamente i servizi e i worker per ottimizzare l’elaborazione dei documenti. Questa guida contiene informazioni sulle risorse di cui ABBYY Vantage avrà bisogno in funzione del carico, oltre a raccomandazioni per l’amministratore di sistema su come fornire correttamente queste risorse ad ABBYY Vantage.

Configurazioni di riferimento

Il consumo di risorse dipende dallo scenario di elaborazione dei documenti: dal tipo di documenti elaborati, dalla skill utilizzata e dal carico di pagine (cioè il numero di pagine elaborate in un determinato intervallo di tempo). La configurazione di riferimento Altamente disponibile è stata testata durante l’elaborazione di fatture di 3 e 50 pagine utilizzando la Process skill predefinita con i seguenti carichi:
  • 50.000 pagine in 8 ore
  • 100.000 pagine in 8 ore
  • 150.000 pagine in 8 ore
  • 200.000 pagine in 8 ore
La configurazione di riferimento Senza alta disponibilità è stata testata durante l’elaborazione di fatture di 3 pagine utilizzando la Process skill predefinita con i seguenti carichi:
  • 10.000 pagine in 8 ore
  • 30.000 pagine in 8 ore
  • 50.000 pagine in 8 ore
La configurazione Senza alta disponibilità non supporta l’addestramento delle skill con l’attività Deep Learning.
Durante i test delle configurazioni di riferimento, i file sono stati inviati al sistema tramite la REST API. È stata utilizzata la Process skill predefinita con il seguente flusso di lavoro:
  1. Importare i file.
  2. Riconoscere i documenti.
  3. Classificare e determinare i tipi di documento.
  4. Estrarre i dati dai documenti.
  5. Esportare i dati in JSON.

Tipi di nodi

Tipo di nodoCore CPU (per ciascun nodo)RAM, GB (per ciascun nodo)Dimensione disco, GB
Nodi di servizio1248120*
Nodi worker1248120
*I requisiti di dimensione del disco riportati sopra si riferiscono ai requisiti minimi, il che significa che potrebbe essere necessario ulteriore spazio su disco. Per impostazione predefinita, Vantage installa l’archiviazione di file NFS sulle macchine virtuali. In questo caso, le macchine virtuali utilizzate come primo nodo di servizio richiederanno spazio su disco aggiuntivo a seconda del carico.

Requisiti di archiviazione

ConfigurationStorageStorage locationDisk size, GB
Without high availabilityNFS internoNodo di servizio500 (per elaborare 10.000 pagine ogni 8 ore)
Without high availabilityNFS esternoMacchina server NFS500 (per elaborare 10.000 pagine ogni 8 ore)
Highly availableNFS esternoMacchina server NFS50 (per elaborare 10.000 pagine ogni 8 ore)
Highly availableLocal persistent volumePrimo nodo di servizio (dal file di inventario)500 (per elaborare 10.000 pagine ogni 8 ore)
Potrebbe essere necessario ulteriore spazio di archiviazione se utilizzi cataloghi di dati di grandi dimensioni, skill con un numero elevato di attività o esporti dati in cartelle condivise.
Si consiglia di utilizzare uno storage esterno se il carico è superiore a 10.000 pagine ogni 8 ore.

Risultati sulle prestazioni

A seconda del carico di pagina, ABBYY Vantage ha richiesto la seguente quantità di risorse per elaborare in modo efficiente i documenti in ciascuna configurazione:

Configurazione ad alta disponibilità

Carico (pagine/8 ore)Nodi per i servizi (fatture di 3 pagine)Nodi per i servizi (fatture di 50 pagine)Nodi per i worker (fatture di 3 pagine)Nodi per i worker (fatture di 50 pagine)
50,0004444
100,0004457
150,0004479
200,00044811
Durante i test sono state raccolte anche le statistiche sulle operazioni di input/output per il disco utilizzato per l’archiviazione dei blob. Puoi aspettarti che, nel tuo caso, i valori non superino i seguenti:

Operazioni di I/O su disco

Carico (pagine/8 ore)Operazioni di I/O su disco al secondo (fatture di 3 pagine)Operazioni di I/O su disco al secondo (fatture di 50 pagine)
50.00010050
100.000250100
150.000400170
200.000600230

Senza configurazione ad alta disponibilità

Carico (pagine/8 ore)Nodi per i serviziNodi per i worker
10,00011*
30,00013
50,00013
*La configurazione con un nodo worker è destinata esclusivamente a scopi di test e non supporta l’addestramento di skill con alcuna attività.
Durante lo scaling di ABBYY Vantage non è stato rilevato alcun aumento dei tempi di elaborazione dei documenti.

Gestione dei nodi

L’Amministratore di sistema può aggiungere nodi worker al cluster per aumentare la capacità di gestire il carico previsto. Per ulteriori informazioni su come preparare un nodo, vedere System Requirements.

Aggiunta di un nodo worker

Per aggiungere un nodo worker, seguire questi passaggi:
  1. Aprire un file inventory dalla directory di installazione.
  2. Nella sezione [abbyy_workers], aggiungere un ulteriore nodo specificandone il nome e l’indirizzo IP.
  3. Eseguire il programma di installazione:
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
  1. Esegui il playbook seguente:
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml