Al instalar ABBYY Vantage, la cantidad de servicios y workers depende de la carga de trabajo. ABBYY Vantage escalará automáticamente los servicios y workers para optimizar el procesamiento de documentos. Esta guía contiene información sobre los recursos que ABBYY Vantage requerirá en función de la carga, así como recomendaciones para el administrador del sistema sobre las formas adecuadas de proporcionar estos recursos a ABBYY Vantage.
Configuraciones de referencia
El consumo de recursos depende de su escenario de procesamiento de documentos: el tipo de documentos que se están procesando, la skill que se está utilizando y el volumen de páginas (es decir, la cantidad de páginas procesadas en un determinado período de tiempo).
La configuración de referencia Alta disponibilidad se probó procesando facturas de 3 y 50 páginas usando la Habilidad de proceso predeterminada con las siguientes cargas:
- 50.000 páginas en 8 horas
- 100.000 páginas en 8 horas
- 150.000 páginas en 8 horas
- 200.000 páginas en 8 horas
La configuración de referencia Sin alta disponibilidad se probó procesando facturas de 3 páginas usando la Habilidad de proceso predeterminada con las siguientes cargas:
- 10.000 páginas en 8 horas
- 30.000 páginas en 8 horas
- 50.000 páginas en 8 horas
La configuración Sin alta disponibilidad no admite el entrenamiento de skills con la actividad Deep Learning.
Durante las pruebas de las configuraciones de referencia, los archivos se enviaron al sistema mediante la API REST. Se utilizó la Habilidad de proceso predeterminada con el siguiente flujo de trabajo:
- Importar archivos.
- Reconocer documentos.
- Clasificar y determinar tipos de documentos.
- Extraer datos de los documentos.
- Exportar datos a JSON.
| Tipo de nodo | Núcleos de CPU (por nodo) | RAM, GB (por nodo) | Tamaño de disco, GB |
|---|
| Nodos de servicio | 12 | 48 | 120* |
| Nodos de trabajo | 12 | 48 | 120 |
*Los requisitos de tamaño de disco indicados anteriormente corresponden a los requisitos mínimos, lo que significa que puede requerirse espacio de disco adicional. De forma predeterminada, Vantage instala almacenamiento de archivos NFS en máquinas virtuales. En este caso, las máquinas virtuales que se utilizan como primer nodo de servicio requerirán espacio de disco adicional según la carga.
Requisitos de almacenamiento
| Configuración | Almacenamiento | Ubicación del almacenamiento | Tamaño de disco, GB |
|---|
| Sin alta disponibilidad | NFS interno | Nodo de servicio | 500 (para procesar 10 000 páginas cada 8 horas) |
| Sin alta disponibilidad | NFS externo | Servidor NFS | 500 (para procesar 10 000 páginas cada 8 horas) |
| Alta disponibilidad | NFS externo | Servidor NFS | 50 (para procesar 10 000 páginas cada 8 horas) |
| Alta disponibilidad | Volumen persistente local | Primer nodo de servicio (del archivo de inventario) | 500 (para procesar 10 000 páginas cada 8 horas) |
Puede necesitar almacenamiento adicional si usa catálogos de datos grandes, skills con un gran número de actividades o exporta datos a carpetas compartidas.
Recomendamos usar almacenamiento externo si la carga es superior a 10 000 páginas cada 8 horas.
En función de la carga de páginas, ABBYY Vantage necesitó la siguiente cantidad de recursos para procesar documentos de manera eficiente en cada configuración:
Configuración de alta disponibilidad
| Carga (páginas/8 horas) | Nodos de servicio (facturas de 3 páginas) | Nodos de servicio (facturas de 50 páginas) | Nodos de trabajo (facturas de 3 páginas) | Nodos de trabajo (facturas de 50 páginas) |
|---|
| 50,000 | 4 | 4 | 4 | 4 |
| 100,000 | 4 | 4 | 5 | 7 |
| 150,000 | 4 | 4 | 7 | 9 |
| 200,000 | 4 | 4 | 8 | 11 |
Durante las pruebas también se recopilaron estadísticas sobre las operaciones de entrada/salida del disco utilizado para el almacenamiento de blobs. Puede esperar que, en su caso, los valores no superen los siguientes:
Operaciones de E/S de disco
| Carga (páginas/8 horas) | Operaciones de E/S de disco por segundo (facturas de 3 páginas) | Operaciones de E/S de disco por segundo (facturas de 50 páginas) |
|---|
| 50,000 | 100 | 50 |
| 100,000 | 250 | 100 |
| 150,000 | 400 | 170 |
| 200,000 | 600 | 230 |
Sin configuración de alta disponibilidad
| Carga (páginas/8 horas) | Nodos para servicios | Nodos para workers |
|---|
| 10,000 | 1 | 1* |
| 30,000 | 1 | 3 |
| 50,000 | 1 | 3 |
*La configuración con un nodo de worker está pensada solo para fines de prueba y no permite entrenar skills con ninguna actividad.
Al escalar ABBYY Vantage, no se observó un aumento en el tiempo de procesamiento de documentos.
El administrador del sistema puede agregar nodos de trabajo adicionales al clúster para manejar una mayor carga de trabajo. Para obtener más información sobre cómo preparar un nodo, consulte los Requisitos del sistema.
Agregar un nodo de trabajo
Para agregar un nodo de trabajo, siga estos pasos:
- Abra un archivo de inventario del directorio de instalación.
- En la sección
[abbyy_workers], agregue un nodo adicional especificando su nombre y dirección IP.
- Ejecute el instalador:
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
- Ejecute el siguiente playbook:
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml