Installation

Vue d’ensemble de l’installation

Pour installer Vantage, procédez comme suit :

Préparer les ressources.
Indiquer les informations d’identification des ressources.
Exécuter les scripts d’installation.

Préparation des ressources

Machines virtuelles
Azure AKS

Avant de commencer, vérifiez que tous les prérequis indiqués dans la section Configuration système requise sont remplis.

Définition des informations d’identification des ressources

Avant d’exécuter le programme d’installation :

Configurez les fichiers de configuration.
Préparez les certificats.
Téléchargez les images de conteneurs.

Configuration des fichiers de configuration

1. Créez le répertoire d’installation : Créez un répertoire d’installation et ses sous-répertoires (ssh, kube, ssl), à partir desquels vous effectuerez l’installation. Placez-vous dans le répertoire d’installation.

mkdir -p /opt/vantage-install/{ssh,kube,ssl} && cd /opt/vantage-install

Machines virtuelles
Azure AKS

2. Créez le fichier de clé SSH :Créez un fichier dans le dossier ssh nommé ansible et placez la clé privée SSH de l’utilisateur ansible dans ce fichier.3. Créez le fichier d’inventaire :Créez un fichier inventory dans le répertoire d’installation. Remplacez X.X.X.X par les adresses IP de vos machines virtuelles :

[localhost]
127.0.0.1

###########################################
[kube_control_plane]
ub01master01 ansible_host=X.X.X.X

[abbyy_services]
ub01worker12-48-s01 ansible_host=X.X.X.X

[abbyy_workers]
ub01worker12-48-w01 ansible_host=X.X.X.X
ub01worker12-48-w02 ansible_host=X.X.X.X
ub01worker12-48-w03 ansible_host=X.X.X.X

###########################################
[kube_workers:children]
abbyy_services
abbyy_workers

[kube_cluster:children]
kube_control_plane
kube_workers

Si vous avez besoin d’une ou deux machines pour les workers au lieu de trois, supprimez les lignes en trop dans la section [abbyy_workers].

4. Créez le fichier env_specific.yml : Indiquez vos propres valeurs.

Machines virtuelles
Azure AKS

env: null
poc: true

domain: null
product_host: "{{ env }}.{{ domain }}"

logging:
  enabled: true
  elasticsearch:
    enabled: false
    host: null
    port: 9200
    username: null
    password: null
    scheme: https
  file:
    enabled: true

loadbalancer:
  external_ip: X.X.X.X

k8s:
  api:
    ip: X.X.X.X

techcore:
  use_gpu_workers: false
  use_nn_extraction_training_workers: false

platform_admin_email: admin@yourdomain.tld

source_container_registry_host: abyvtgonprm27.azurecr.io
source_container_registry_user: null      # remplacer par les identifiants obtenus lors de l'approvisionnement
source_container_registry_password: null  # remplacer par les identifiants obtenus lors de l'approvisionnement
source_container_registry_name: "{{ source_container_registry_host }}"

container_registry_host: registry.yourdomain.tld
container_registry_user: null
container_registry_password: null
container_registry_name: "{{ container_registry_host }}/vantage"

smtp:
  host: null
  login: null
  password: null
  port: 587
  useSSL: false
  secureSocketOptions: null

database:
  host: X.X.X.X
  port: 1433
  username: null
  password: null

reporting:
  enabled: false

id_reading:
  enabled: false

env: vantage
poc: false  # Définissez sur true pour une configuration sans haute disponibilité

domain: yourdomain.tld
product_host: "vantage.{{ domain }}"

loadbalancer:
  external_ip: X.X.X.X  # Adresse IP publique Azure

container_registry_host: "registry.yourdomain.tld"
container_registry_user: "service"
container_registry_password: "password"
container_registry_name: "{{ container_registry_host }}/vantage"

techcore:
  use_gpu_workers: false
  use_nn_extraction_training_workers: false

logging:
  enabled: true
  elasticsearch:
    enabled: false
    host: null
    port: 9200
    username: null
    password: null
    scheme: https
    ilm:
      create: false
  file:
    enabled: true

platform_admin_email: admin@yourdomain.tld

# Configuration des e-mails - utilisez SendGrid ou SMTP
sendgrid:
  enabled: false
  apiKey: ""

smtp:
  host: X.X.X.X
  login: null
  password: ""
  port: 587
  useSSL: false

mailFrom: noreply@yourdomain.tld

# Configuration de la base de données Azure SQL
database:
  type: sqlserver
  host: X.X.X.X  # Nom d’hôte du serveur Azure SQL
  username: login
  password: password
  encrypt: false

# Comptes de stockage Azure - remplacez par les identifiants de votre compte de stockage
s3storage:
  skills:
    accessKey: skills_storage_account_name
    secretKey: skills_storage_account_key
  processing:
    accessKey: processing_storage_account_name
    secretKey: processing_storage_account_key
  temporary:
    accessKey: temporary_storage_account_name
    secretKey: temporary_storage_account_key
  sharedfolder:
    accessKey: sharedfolder_storage_account_name
    secretKey: sharedfolder_storage_account_key
    resourcegroup: your_resource_group
  archive:
    accessKey: archive_storage_account_name
    secretKey: archive_storage_account_key

# Configuration du cluster Redis (requis uniquement pour la haute disponibilité)
# Laissez des tableaux vides pour une configuration sans haute disponibilité
redis:
  ips: ['172.16.10.101', '172.16.10.102', '172.16.10.103', '172.16.10.104', '172.16.10.105', '172.16.10.106']
  port: 6379
  password: redispassword
  ssl: false

reporting:
  enabled: false

id_reading:
  enabled: false

k8s_fips_enabled: false

Pour la section s3storage, la valeur de accessKey correspond au nom du compte de stockage Azure et la valeur de secretKey à la clé d’accès du compte de stockage. Vous pouvez les récupérer depuis le portail Azure ou en utilisant l’interface en ligne de commande Azure (Azure CLI).

Paramètres de configuration

Parameter	Description
`env`	Préfixe d’installation utilisé par défaut comme nom de sous-domaine.
`poc`	`true` pour une installation sans haute disponibilité, `false` pour une installation hautement disponible.
`domain`	Domaine principal.
`product_host`	Nom DNS permettant d’accéder au produit (valeur par défaut : `env.domain`).
`logging.enabled`	Activer ou désactiver la journalisation (`true`/`false`).
`logging.elasticsearch.enabled`	Indique si Elasticsearch doit être activé. Ce Parameter peut avoir pour valeur true ou false. Remarque : définissez la valeur de ce Parameter sur true uniquement si vous disposez déjà d’Elasticsearch et souhaitez y connecter les journaux Vantage. Si vous ne disposez pas encore d’instances Elasticsearch et Kibana, vous pouvez les déployer dans un cluster en suivant les instructions d’Elasticsearch et Kibana. Cette opération doit être effectuée avant l’installation du produit.
`logging.elasticsearch.host`	L’adresse IP du serveur.
`logging.elasticsearch.port`	Port utilisé pour la connexion à Elasticsearch.
`logging.elasticsearch.username`	Le nom d’utilisateur utilisé pour se connecter à Elasticsearch.
`logging.elasticsearch.password`	Le mot de passe utilisé pour la connexion à Elasticsearch.
`logging.elasticsearch.scheme`	Le protocole utilisé pour se connecter à Elasticsearch.
`logging.file.enabled`	Indique si les journaux doivent être enregistrés dans des fichiers. Ce Parameter peut être défini sur true ou false.
`loadbalancer.external_ip`	Adresse IP flottante de l’équilibreur de charge.
`k8s.api.ip`	Adresse IP du point de terminaison de l’API Kubernetes.
`securityContext.global.runAsUser`	Spécifie l’identifiant de l’utilisateur sous lequel le processus du conteneur doit s’exécuter. Ce paramètre s’applique uniquement aux pods qui fonctionnent avec des systèmes de stockage rwx externes (tels que NFS). Par défaut, le Parameter est fixé à 65532.
`securityContext.global.runAsGroup`	Spécifie l’identifiant du groupe sous lequel le processus du conteneur doit s’exécuter. Ce paramètre s’applique uniquement aux pods qui utilisent des stockages RWX externes (tels que NFS). Par défaut, le Parameter est défini sur 65532.
`securityContext.global.fsGroup`	Spécifie l’identifiant du groupe qui sera propriétaire des volumes associés au pod. Ce paramètre s’applique uniquement aux pods qui utilisent des espaces de stockage rwx externes (comme NFS). Par défaut, le Parameter est défini sur 65532.
`techcore.nn_training_workers.gpu`	Indique si les workers GPU doivent être déployés. Les workers GPU sont utilisés pour entraîner des compétences avec l’activité Deep Learning afin d’extraire des données à partir de documents semi‑structurés. Ce Parameter peut être défini sur true ou false. Si le Parameter est défini sur true, le Parameter `techcore.nn_training_workers.enabled` doit également être défini sur true. Vous pouvez activer cette option et définir les Parameters `techcore.nn_training_workers.gpu` et `techcore.nn_training_workers.enabled` sur true avant ou après l’installation de Vantage. Pour plus d’informations, voir Configuration du GPU.
`techcore.nn_training_workers.enabled`	Indique si les workers nn-extraction-training et nlp-model-train doivent être déployés. Ces workers sont utilisés pour entraîner des compétences avec l’activité Deep Learning afin d’extraire des données de documents semi-structurés à l’aide du CPU. Ce paramètre peut être défini sur true ou false.
`techcore.keep_previous_version`	Indique si la version 2 du noyau technologique doit être conservée lors de la mise à jour de Vantage. Par défaut, le paramètre `techcore.keep_previous_version` n’est pas défini et la version 2 du noyau technologique est supprimée. Pour la conserver, définissez la valeur de ce paramètre sur true.
`platform_admin_email`	Adresse e-mail de l’administrateur du système.
`container_registry_host`	Nom de domaine du registre de conteneurs.
`container_registry_user`	Nom de l’utilisateur ayant les droits nécessaires pour télécharger des images à partir du registre de conteneurs. Ce Parameter reste vide s’il n’y a pas de registre de conteneurs.
`container_registry_password`	Mot de passe ou jeton permettant de télécharger des images depuis le registre de conteneurs. Ce Parameter est laissé vide s’il n’y a pas de registre de conteneurs.
`container_registry_name`	Le répertoire du registre de conteneurs dans lequel les images sont hébergées.
`smtp.host`	Adresse IP ou nom d’hôte du serveur SMTP.
`smtp.login`	Nom d’utilisateur pour la connexion au serveur SMTP.
`smtp.password`	Mot de passe utilisé pour la connexion au serveur SMTP.
`smtp.port`	Le port du serveur SMTP.
`smtp.useSSL`	Spécifie si une connexion chiffrée doit être utilisée. Ce Parameter peut être défini sur true ou false.
`smtp.secureSocketOptions`	Spécifie le type de chiffrement SSL et/ou TLS à utiliser pour la connexion.
`database.enabled`	Indique si le serveur de base de données doit être activé.
`database.host`	Adresse IP du serveur SQL.
`database.port`	Le port du serveur de base de données.
`database.username`	Nom d’utilisateur permettant de se connecter à la base de données (l’utilisateur doit disposer des droits nécessaires pour créer des bases de données).
`database.password`	Le mot de passe utilisé pour se connecter à la base de données.
`reporting.enabled`	Indique si le service de reporting Warehouse doit être déployé. Ce Parameter peut être défini sur true ou sur false.
`id_reading.enabled`	Indique si le module complémentaire Identity Documents doit être déployé. Ce paramètre peut être défini sur true ou false.

Les quatre Parameter suivants sont facultatifs et ne sont requis que si la configuration à haute disponibilité est installée et si l’installation de Redis est exigée par le programme d’installation de Vantage.

Parameter	Description
`redis.ips`	L’adresse IP du cluster Redis au format suivant : [‘192.168.0.1”192.168.0.2’,,‘192.168.0.3’]. Si le Parameter est défini comme [], une instance Redis au sein du cluster sera déployée.
redis.port	Le port utilisé pour se connecter au cluster Redis.
`redis.password`	Le mot de passe utilisé pour se connecter à Redis.
`redis.ssl`	Indique si une connexion chiffrée au cluster Redis doit être utilisée. Ce Parameter peut être défini sur true ou false.

Tous les autres Parameter restent inchangés.

Préparation des certificats

Accédez au répertoire ssl. Placez le certificat générique (wildcard) ainsi que le certificat intermédiaire correspondant au nom de domaine principal dans ce répertoire, et la clé (au format PEM) dans les fichiers suivants, respectivement : ./ssl/cert.pem et ./ssl/key.pem. Vous devez convertir votre fichier CRT au format PEM en remplaçant le contenu du fichier par le format suivant :

-----BEGIN CERTIFICATE-----
[your certificate]
-----END CERTIFICATE-----

Si vous utilisez un fournisseur d’authentification externe (ADFS) avec un certificat signé par une autorité de certification (AC) interne, placez le certificat racine dans ./ssl/adfs-root.pem.

Si vous accédez à des endpoints tiers depuis Vantage (scripts d’activité personnalisés ou authentification externe), l’endpoint externe doit disposer d’un certificat émis par une autorité de certification publique.

Exécution des scripts d’installation

L’installation d’ABBYY Vantage est automatique. Elle est exécutée à l’aide de l’outil Ansible, qui est installé et configuré à l’intérieur du conteneur utilisé pour l’installation. Ansible interagit avec les machines à l’aide de différents scénarios de configuration (playbooks YAML). Pour installer ABBYY Vantage, procédez comme suit : 1. Accédez au répertoire d’installation. 2. Connectez-vous au registre de distribution de l’installateur

# remplacez <username> et <password> par les identifiants obtenus lors de l'approvisionnement
docker login abyvtgonprm27.azurecr.io -u <username> -p <password>

3. Exécutez le programme d’installation à partir d’une image Docker si vous ne l’avez pas encore fait :

Machines virtuelles
Azure AKS

docker run -it \
-v $PWD/kube:/home/ansible/.kube \
-v $PWD/ssh/ansible:/home/ansible/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
abyvtgonprm27.azurecr.io/vantage-installer:2.7.1

Parameter	Description
`-v $PWD/kube:/home/ansible/.kube`	Chemin d’accès au répertoire Kubernetes où le fichier kube/config est stocké.
`-v $PWD/ssh/ansible:/home/ansible/.ssh/ansible`	Chemin d’accès à la clé SSH privée requise pour installer et configurer le cluster Kubernetes ainsi que certains prérequis.
`-v "//var/run/docker.sock:/var/run/docker.sock"`	Requis pour synchroniser les images avec votre registre de conteneurs.
`-v $PWD/inventory:/ansible/inventories/k8s/inventory`	Chemin d’accès au fichier inventory.
`-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml`	Chemin d’accès au fichier env_specific.yml.
`-v $PWD/ssl:/ansible/files/ssl:ro`	Chemin d’accès au dossier contenant les certificats SSL, qui doit inclure les fichiers suivants : cert.pem, key.pem, adfsroot.pem.

docker run -it \
-v $PWD/env_specific.yml:/ansible/inventories/azure/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
abyvtgonprm27.azurecr.io/vantage-installer:2.7.1

Parameter	Description
`-v $PWD/env_specific.yml:/ansible/inventories/azure/group_vars/all/env_specific.yml`	Chemin d’accès au fichier env_specific.yml.
`-v $PWD/ssl:/ansible/files/ssl:ro`	Chemin d’accès au dossier contenant les certificats SSL, qui doit inclure les fichiers suivants : cert.pem, key.pem, adfsroot.pem.

4. Connectez-vous au cluster Azure AKS :

Machines virtuelles
Azure AKS

Ignorez cette étape pour les déploiements sur machines virtuelles : les informations d’identification du cluster sont configurées automatiquement pendant l’installation de Kubernetes à l’étape 7.

Après le démarrage du conteneur Docker, authentifiez-vous auprès d’Azure et connectez-vous à votre cluster AKS :

# Connexion à Azure
az login

# Définir l'abonnement (remplacez par l'ID de votre abonnement)
az account set --subscription <subscription_id>

# Récupérer les informations d'identification du cluster AKS (remplacez par votre groupe de ressources et le nom du cluster)
az aks get-credentials --resource-group <resource_group_name> --name <cluster_name>

# Vérifier la connectivité au cluster
kubectl cluster-info

5. Téléchargez les images de conteneur Les scripts de migration reposent sur les propriétés suivantes dans env_specific.yml

source_container_registry_host: sourcerepo.azurecr.io
source_container_registry_user: user
source_container_registry_password: pass
source_container_registry_name: "{{ source_container_registry_host }}/optional/subpath"

container_registry_host: destinationrepo.azurecr.io
container_registry_user: user
container_registry_password: pass
container_registry_name: "{{ container_registry_host }}/optional/subpath"

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s playbooks/validate-artifact-manifest.yml
ansible-playbook -i inventories/k8s playbooks/oci-migration.yml

ansible-playbook -i inventories/azure playbooks/validate-artifact-manifest.yml
ansible-playbook -i inventories/azure playbooks/oci-migration.yml

Machines virtuelles
Azure AKS

6. Définir les autorisations de la clé SSH :

chmod 600 /home/ansible/.ssh/ansible

7. Installer et configurer le cluster Kubernetes :

ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml

8. Exécutez la vérification pré-déploiement et acceptez les documents juridiques :

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s -v playbooks/0-PreflightCheck-k8s.yml
ansible-playbook -i inventories/k8s -v playbooks/legal.yml

ansible-playbook -i inventories/azure playbooks/0-PreflightCheck-azure.yml
ansible-playbook -i inventories/azure playbooks/legal.yml

Le playbook :

Effectue une vérification préliminaire des ressources dont les paramètres sont spécifiés dans le fichier env_specific.yml du playbook (comme la base de données et la connexion SMTP).
Demande à l’administrateur système d’accepter les conditions du CLUF et de la Politique de confidentialité ABBYY.

9. Installez le produit :

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s -v playbooks/site-k8s-deploy.yml

ansible-playbook -i inventories/azure playbooks/site-azure-deploy.yml

Le playbook va déployer le système de collecte des métriques et des journaux ainsi qu’ABBYY Vantage. Le temps nécessaire pour terminer le processus d’installation dépendra des performances des machines sélectionnées. En moyenne, le processus prendra environ 10 minutes. Vous pouvez surveiller les pods et l’exécution des tâches dans un cluster à l’aide de n’importe quel outil de gestion Kubernetes, par exemple l’utilitaire Lens. Pour ce faire, utilisez le fichier kubeconfig qui sera créé dans le dossier kube après l’installation de Kubernetes sur les machines virtuelles. Vous pouvez également télécharger les fichiers journaux de l’installation Ansible sur votre machine locale en suivant les étapes ci-dessous :

Déconnectez-vous du conteneur Docker.
Exécutez la commande suivante pour obtenir la liste des conteneurs :

docker ps -a

Identifiez le nom du conteneur contenant le programme d’installation.

Exécutez la commande suivante en remplaçant container_name par le nom du conteneur pour obtenir les journaux :

docker cp container_name:/ansible/ansible.log ansible.log

Une fois le déploiement terminé, les éléments suivants vous seront fournis :

L’URL associée au nom de domaine fourni.
Identifiant et mot de passe de l’administrateur système, qui pourront être utilisés pour se connecter, créer des tenants et traiter des documents.

Obtenir les journaux d’installation

# Exit the Docker container, then:
docker ps -a
# Recherchez le nom du conteneur, puis :
docker cp container_name:/ansible/ansible.log ansible.log

Déploiements optionnels

Déploiement du système de journalisation

Si le système de journalisation n’a pas été activé dans Vantage (la valeur du Parameter logging.enabled dans le fichier env_specific.yml était false) lors de son installation, vous pouvez l’activer après l’installation de Vantage. Pour ce faire, attribuez la valeur true au Parameter logging.enabled dans le fichier env_specific.yml et exécutez la commande suivante :

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s playbooks/6-DeployMonitoring-k8s.yml

ansible-playbook -i inventories/azure playbooks/6-DeployMonitoring-azure.yml

Déploiement de Business Processing Reporting Warehouse

Le Business Processing Reporting Warehouse est utilisé pour analyser le processus métier et suivre les données sur des périodes de temps spécifiques. Lors de l’installation de Vantage, le Business Processing Reporting Warehouse sera également installé si la valeur du paramètre reporting.enabled dans le fichier env_specific.yml est définie sur true. Si la valeur du paramètre reporting.enabled est définie sur false, vous pouvez installer Business Processing Reporting Warehouse après avoir installé Vantage en exécutant la commande suivante :

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s -v playbooks/deploy-reporting.yml

ansible-playbook -i inventories/azure -v playbooks/deploy-reporting.yml

Déploiement du module complémentaire Identity Documents

Le module complémentaire Identity Documents nécessite que Vantage dispose d’un accès Internet à https://lic.regulaforensics.com et https://lic2.regulaforensics.com.

Le service du module complémentaire Identity Documents permet d’exécuter la Skill Identity Documents, utilisée pour extraire des données à partir de documents d’identité émis dans différents pays. Lors de l’installation de Vantage, le module complémentaire Identity Documents est également installé si la valeur du Parameter id_reading.enabled dans le fichier env_specific.yml a été définie sur true. Si la valeur du Parameter id_reading.enabled a été définie sur false, vous pouvez installer le module complémentaire Identity Documents après l’installation de Vantage en exécutant la commande suivante :

Machines virtuelles
Azure AKS

ansible-playbook -i inventories/k8s -v playbooks/12-DeployDocumentReader.yml

ansible-playbook -i inventories/azure -v playbooks/12-DeployDocumentReader.yml

Il est nécessaire d’autoriser l’accès aux adresses suivantes depuis le cluster contenant l’installation de Vantage : https://lic.regulaforensics.com https://lic2.regulaforensics.com

Prise en main

Administration

Configuration avancée

Exploitation

Performance

Notes de version

Déploiements sur Microsoft Azure

Installation

Vue d’ensemble de l’installation

Préparation des ressources

Définition des informations d’identification des ressources

Configuration des fichiers de configuration

Paramètres de configuration

Préparation des certificats

Exécution des scripts d’installation

Obtenir les journaux d’installation

Déploiements optionnels

Déploiement du système de journalisation

Déploiement de Business Processing Reporting Warehouse

Déploiement du module complémentaire Identity Documents

Prise en main

Installation

Administration

Configuration avancée

Exploitation

Performance

Notes de version

Déploiements sur Microsoft Azure

​Vue d’ensemble de l’installation

​Préparation des ressources

​Définition des informations d’identification des ressources

​Configuration des fichiers de configuration

​Paramètres de configuration

​Préparation des certificats

​Exécution des scripts d’installation

​Obtenir les journaux d’installation

​Déploiements optionnels

​Déploiement du système de journalisation

​Déploiement de Business Processing Reporting Warehouse

​Déploiement du module complémentaire Identity Documents

Vue d’ensemble de l’installation

Préparation des ressources

Définition des informations d’identification des ressources

Configuration des fichiers de configuration

Paramètres de configuration

Préparation des certificats

Exécution des scripts d’installation

Obtenir les journaux d’installation

Déploiements optionnels

Déploiement du système de journalisation

Déploiement de Business Processing Reporting Warehouse

Déploiement du module complémentaire Identity Documents