Saltar al contenido principal

Introducción

Al instalar ABBYY Vantage, la cantidad de servicios y workers depende de la carga de trabajo. ABBYY Vantage escalará automáticamente los servicios y workers para optimizar el procesamiento de documentos. Esta guía contiene información sobre los recursos que ABBYY Vantage requerirá en función de la carga, así como recomendaciones para el administrador del sistema sobre las formas adecuadas de proporcionar estos recursos a ABBYY Vantage.

Configuraciones de referencia

El consumo de recursos depende de su escenario de procesamiento de documentos: el tipo de documentos que se están procesando, la skill que se está utilizando y el volumen de páginas (es decir, la cantidad de páginas procesadas en un determinado período de tiempo). La configuración de referencia Alta disponibilidad se probó procesando facturas de 3 y 50 páginas usando la Habilidad de proceso predeterminada con las siguientes cargas:
  • 50.000 páginas en 8 horas
  • 100.000 páginas en 8 horas
  • 150.000 páginas en 8 horas
  • 200.000 páginas en 8 horas
La configuración de referencia Sin alta disponibilidad se probó procesando facturas de 3 páginas usando la Habilidad de proceso predeterminada con las siguientes cargas:
  • 10.000 páginas en 8 horas
  • 30.000 páginas en 8 horas
  • 50.000 páginas en 8 horas
La configuración Sin alta disponibilidad no admite el entrenamiento de skills con la actividad Deep Learning.
Durante las pruebas de las configuraciones de referencia, los archivos se enviaron al sistema mediante la API REST. Se utilizó la Habilidad de proceso predeterminada con el siguiente flujo de trabajo:
  1. Importar archivos.
  2. Reconocer documentos.
  3. Clasificar y determinar tipos de documentos.
  4. Extraer datos de los documentos.
  5. Exportar datos a JSON.

Tipos de nodos

Tipo de nodoNúcleos de CPU (por nodo)RAM, GB (por nodo)Tamaño de disco, GB
Nodos de servicio1248120*
Nodos de trabajo1248120
*Los requisitos de tamaño de disco indicados anteriormente corresponden a los requisitos mínimos, lo que significa que puede requerirse espacio de disco adicional. De forma predeterminada, Vantage instala almacenamiento de archivos NFS en máquinas virtuales. En este caso, las máquinas virtuales que se utilizan como primer nodo de servicio requerirán espacio de disco adicional según la carga.

Requisitos de almacenamiento

ConfiguraciónAlmacenamientoUbicación del almacenamientoTamaño de disco, GB
Sin alta disponibilidadNFS internoNodo de servicio500 (para procesar 10 000 páginas cada 8 horas)
Sin alta disponibilidadNFS externoServidor NFS500 (para procesar 10 000 páginas cada 8 horas)
Alta disponibilidadNFS externoServidor NFS50 (para procesar 10 000 páginas cada 8 horas)
Alta disponibilidadVolumen persistente localPrimer nodo de servicio (del archivo de inventario)500 (para procesar 10 000 páginas cada 8 horas)
Puede necesitar almacenamiento adicional si usa catálogos de datos grandes, skills con un gran número de actividades o exporta datos a carpetas compartidas.
Recomendamos usar almacenamiento externo si la carga es superior a 10 000 páginas cada 8 horas.

Resultados de rendimiento

En función de la carga de páginas, ABBYY Vantage necesitó la siguiente cantidad de recursos para procesar documentos de manera eficiente en cada configuración:

Configuración de alta disponibilidad

Carga (páginas/8 horas)Nodos de servicio (facturas de 3 páginas)Nodos de servicio (facturas de 50 páginas)Nodos de trabajo (facturas de 3 páginas)Nodos de trabajo (facturas de 50 páginas)
50,0004444
100,0004457
150,0004479
200,00044811
Durante las pruebas también se recopilaron estadísticas sobre las operaciones de entrada/salida del disco utilizado para el almacenamiento de blobs. Puede esperar que, en su caso, los valores no superen los siguientes:

Operaciones de E/S de disco

Carga (páginas/8 horas)Operaciones de E/S de disco por segundo (facturas de 3 páginas)Operaciones de E/S de disco por segundo (facturas de 50 páginas)
50,00010050
100,000250100
150,000400170
200,000600230

Sin configuración de alta disponibilidad

Carga (páginas/8 horas)Nodos para serviciosNodos para workers
10,00011*
30,00013
50,00013
*La configuración con un nodo de worker está pensada solo para fines de prueba y no permite entrenar skills con ninguna actividad.
Al escalar ABBYY Vantage, no se observó un aumento en el tiempo de procesamiento de documentos.

Administración de nodos

El administrador del sistema puede agregar nodos de trabajo adicionales al clúster para manejar una mayor carga de trabajo. Para obtener más información sobre cómo preparar un nodo, consulte los Requisitos del sistema.

Agregar un nodo de trabajo

Para agregar un nodo de trabajo, siga estos pasos:
  1. Abra un archivo de inventario del directorio de instalación.
  2. En la sección [abbyy_workers], agregue un nodo adicional especificando su nombre y dirección IP.
  3. Ejecute el instalador:
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
  1. Ejecute el siguiente playbook:
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml