Passer au contenu principal

Vue d’ensemble

ABBYY Vantage permet le traitement automatisé de documents avec des fonctionnalités d’extraction intelligente. Ce guide se concentre sur le workflow basé sur SFTP, qui vous permet de téléverser des documents dans un dossier partagé et de récupérer automatiquement les résultats du traitement. Ce que vous allez accomplir :
  • Créer et configurer une Compétence de processus
  • Configurer l’accès SFTP pour l’entrée et la sortie
  • Téléverser des documents via la ligne de commande
  • Télécharger les résultats d’extraction
Temps nécessaire : 15 à 20 minutes

Étape 1 : Créer une Compétence de processus

Une Compétence de processus est la base de votre flux de traitement des documents dans ABBYY Vantage.
  1. Accédez à la section Documents dans ABBYY Vantage.
  2. Cliquez sur Skill Designer dans la barre latérale de gauche.
  3. Sélectionnez Process Skill parmi les types de compétences.
Selecting Process Skill
  1. Dans la boîte de dialogue Create Process skill, saisissez les informations suivantes :
    • Skill Name : un nom descriptif pour votre processus (par exemple, « Process Skill Test 1 »)
    • Description : une description facultative expliquant ce que fait cette compétence
    • Technology Core Version : 3.0 (recommandé)
Naming Process Skill
  1. Cliquez sur Create

Étape 2 : Configurer le workflow de la Compétence de processus

Après avoir créé votre compétence, vous allez configurer le flux de traitement des documents.
  1. Dans le Skill Designer, vous verrez le panneau Select Process Skill sur la droite
  2. Choisissez Simple Document skill workflow pour traiter un seul type de document
Selecting Simple Workflow Cela crée un workflow préconfiguré avec :
  • Connecteur Input : point d’entrée des documents dans le système
  • Compétence OCR : reconnaissance optique de caractères (OCR)
  • Compétence Extract : extraction de données
  • Connecteur Output : point de sortie où les résultats sont fournis
Le workflow apparaîtra dans la zone centrale et affichera : Input → OCR → Extract → Output

Étape 3 : Configurer l’entrée via SFTP

Configurez l’activité Input pour accepter des documents via SFTP.
  1. Cliquez sur l’activité Input dans le workflow.
  2. Dans le panneau Actions à droite, cochez Select additional source.
  3. Sélectionnez le bouton d’option Shared folder.
  4. Cliquez sur Settings pour configurer.
Configuring Input Activity

Configurer les paramètres d’entrée

Dans la boîte de dialogue Input Settings: Shared Folder : Input Settings Dialog Paramètres du dossier :
  • Folder name: Input (valeur par défaut)
  • Import method: Single file
Identifiants pour l’import (affichés pour votre référence) :
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: Un UUID généré (par exemple, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Affiché avec une option afficher/masquer
Remarque : Copiez ces identifiants : vous en aurez besoin pour vous connecter via SFTP. Les fichiers qui ne peuvent pas être importés seront déplacés vers le dossier d’exceptions. Vantage recherche de nouveaux fichiers toutes les 20 secondes après la publication du Skill.
  1. Cliquez sur Save.

Étape 4 : Configurer la sortie via SFTP

Configurez l’activité Output pour envoyer les résultats via SFTP.
  1. Cliquez sur l’activité Output dans le workflow.
  2. Dans le panneau Actions, cochez Select additional destination.
  3. Sélectionnez le bouton radio Shared folder.
  4. Cliquez sur Settings pour configurer.
Configuring Output Activity

Configurer les paramètres de sortie

Dans la boîte de dialogue Output Settings: Shared Folder : Output Settings Dialog Informations :
  • Folder name : Output (par défaut)
  • Folder : .../Output
  • Username : Un UUID généré (par exemple, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password : Affiché avec l’option afficher/masquer
Données exportées :
  • Fields (JSON) : Format d’export par défaut
Remarque : Les résultats sont organisés dans des sous-dossiers nommés d’après le fichier source et l’ID de transaction (par exemple, invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). Les fichiers sont automatiquement supprimés conformément à la stratégie de conservation des données.
  1. Cliquez sur Save.

Étape 5 : Configurer les compétences d’extraction

Configurez quels types de documents l’activité Extract doit reconnaître et traiter.
  1. Cliquez sur l’activité Extract dans le workflow.
  2. Dans le panneau Actions, vous verrez les Compétences de document.
Configuration des compétences d'extraction Les compétences de document disponibles incluent :
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Sélectionnez les types de documents correspondant à votre cas d’usage.
  2. Cliquez sur Add Skill si vous avez besoin d’autres types de documents.
  3. Utilisez Edit Mapping pour personnaliser l’extraction des champs si nécessaire.

Étape 6 : Publier et obtenir l’ID de votre Skill

Avant de pouvoir utiliser SFTP, vous devez publier le Skill et récupérer son ID.
  1. Cliquez sur le bouton Publish en haut à droite de Skill Designer.
  2. Une fois publié, relevez l’ID du Skill à partir de l’URL du navigateur.
Getting Skill ID from URL Le format de l’URL est :
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Par exemple : fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Avertissement : Gardez votre identifiant de Skill sous la main — vous en aurez besoin pour accéder aux dossiers Input et Output appropriés dans SFTP.

Étape 7 : Se connecter à SFTP

Vous êtes maintenant prêt à vous connecter via SFTP en utilisant les informations de connexion de vos paramètres d’entrée/sortie (Input/Output).

Détails de connexion

Dans vos paramètres Input/Output, vous disposez des éléments suivants :
  • Server: 172.172.228.138
  • Port: 2022
  • Username: Votre UUID généré
  • Password: Votre mot de passe généré
  • Base Path: /{skill-id}/

Connexion via le terminal

Ouvrez un terminal et connectez-vous en utilisant la commande suivante :
sftp -P 2022 {username}@172.172.228.138
Exemple :
sftp -P 2022 [email protected]
Remarque : Utilisez -P en majuscule pour le numéro de port SFTP (la minuscule -p est utilisée à une autre fin). Lorsque vous y êtes invité, saisissez votre mot de passe.

Étape 8 : Parcourir la structure de dossiers SFTP

Une fois connecté, vous verrez l’invite SFTP : sftp>

Afficher les Skills disponibles

Répertoriez toutes les compétences de processus disponibles :
sftp> ls
Accès aux dossiers des Skills Vous verrez un dossier pour chaque Skill (identifié par son ID de Skill), ainsi que :
  • Catalogs - Catalogues de Compétences de document
  • Catalogs-exception - Importations de catalogues ayant échoué
  • skills-import - Répertoire d’import des Skills
Utilisez l’ID du Skill de l’étape 6 :
sftp> cd {your-skill-id}
sftp> ls
Vous devriez voir trois dossiers :
  • Input - Où vous importez les documents à traiter
  • Input-exception - Les importations ayant échoué sont déplacées ici
  • Output - Où apparaissent les résultats traités

Étape 9 : Téléverser des documents pour traitement

Accédez au dossier Input et téléversez vos documents.
sftp> cd Input
sftp> pwd
Répertoire de travail distant : /{skill-id}/Input

Téléverser un seul fichier

Téléversez un fichier en indiquant son chemin complet :
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Ou commencez par changer de répertoire local :
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Téléversement et téléchargement de fichiers

Importer plusieurs fichiers

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Remarque : Les fichiers téléchargés vers Input sont automatiquement supprimés après un traitement réussi (en général en moins de 20 secondes). Si vous ne voyez plus votre fichier après le téléchargement, cela signifie que Vantage l’a déjà pris en charge pour traitement !

Vérifier le chargement

Vérifiez s’il reste des fichiers dans le dossier Input :
sftp> ls
Si le dossier est vide ou si votre fichier n’apparaît plus, cela signifie que le traitement a commencé.

Étape 10 : Vérifier l’état du traitement

Surveiller le dossier Input-exception

Si l’import d’un fichier échoue, il apparaîtra ici :
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Un dossier vide indique que tous les fichiers ont été importés avec succès.

Patientez pendant le traitement

Le temps de traitement varie en fonction de :
  • la complexité du document
  • les compétences d’extraction configurées
  • la charge actuelle du système
En général, les factures simples sont traitées en 30 à 60 secondes.

Étape 11 : Télécharger les résultats du traitement

Une fois le traitement terminé, les résultats sont disponibles dans le dossier Output.
sftp> cd ..
sftp> cd Output
sftp> ls

Comprendre la structure des résultats

Les résultats sont organisés dans des sous-dossiers selon la convention de nommage suivante :
{original-filename}-{transaction-id}
Exemple :
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Afficher le contenu d’un dossier de résultats

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Contenu type :
  • Invoice_US.json - Données extraites au format JSON
  • Invoice_US.csv - Données extraites au format CSV (si configuré)
  • Fichiers supplémentaires selon vos paramètres de sortie

Téléchargement des résultats

Définissez votre dossier de téléchargement local :
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Télécharger un seul fichier :
sftp> get Invoice_US.json
Téléchargez tous les fichiers du dossier :
sftp> mget *
Téléchargez de manière récursive l’intégralité du dossier de résultats :
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Comprendre la sortie JSON

La sortie par défaut est un fichier JSON contenant :
  • Structure du document - Mise en page et organisation
  • Valeurs de champ extraites - Données extraites du document
  • Scores de confiance - Fiabilité de chaque extraction
  • Erreurs de règles - Problèmes de validation éventuels
  • Métadonnées de champ - Informations supplémentaires sur chaque champ
Exemple de structure :
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Pour une description détaillée du schéma JSON, reportez-vous à la documentation de l’API Vantage.

Commandes SFTP utiles

CommandeDescriptionExemple
lsLister les fichiers distantsls
llsLister les fichiers locauxlls
pwdAfficher le répertoire distantpwd
lpwdAfficher le répertoire locallpwd
cd folderChanger le répertoire distantcd Output
lcd folderChanger le répertoire locallcd ~/Downloads
put fileEnvoyer un fichierput invoice.pdf
mput filesEnvoyer plusieurs fichiersmput *.jpg
get fileTélécharger un fichierget result.json
mget filesTélécharger plusieurs fichiersmget *
get -r folderTélécharger un dossier récursivementget -r results/
exitSe déconnecterexit

Résolution des problèmes

Problèmes de connexion

Problème : erreurs « Connection refused » ou de dépassement de délai Solutions :
  • Vérifiez que vous êtes connecté au VPN de l’entreprise
  • Vérifiez le numéro de port (il doit être 2022 avec -P en majuscule)
  • Confirmez que votre nom d’utilisateur et votre mot de passe sont corrects
  • Testez la connectivité réseau de base : ping 172.172.228.138

Problèmes de chargement

Problème : Les fichiers ne sont pas traités Solutions :
  • Vérifiez le dossier Input-exception pour les importations ayant échoué
  • Vérifiez que le format de fichier est pris en charge (PDF, JPG, PNG, TIFF, etc.)
  • Assurez-vous que la Compétence de processus est publiée
  • Vérifiez les limites de taille de fichier (elles varient selon la configuration)

Aucun fichier de sortie

Problème : Le dossier de sortie est vide après le téléversement Solutions :
  • Attendez un peu plus longtemps : le traitement peut prendre 30 à 60 secondes ou plus
  • Vérifiez qu’Output est configuré avec la destination « Shared folder »
  • Consultez les journaux de transaction dans l’interface web de Vantage
  • Confirmez que l’activité Extract a des Compétences de document appropriées configurées

Erreurs d’autorisation

Problème : « Permission denied » lors du chargement/téléchargement Solutions :
  • Vérifiez que vous utilisez les identifiants corrects selon Input ou Output
  • Les identifiants Input permettent : charger, supprimer
  • Les identifiants Output permettent : afficher, télécharger, renommer, supprimer
  • Vérifiez que le Skill est publié et actif

Bonnes pratiques

Sécurité

  • Ne partagez jamais d’identifiants SFTP en clair
  • Utilisez des canaux sécurisés pour transmettre les mots de passe
  • Renouvelez régulièrement les identifiants
  • Limitez l’accès SFTP aux seules personnes qui en ont besoin

Gestion des fichiers

  • Utilisez des noms de fichiers explicites incluant des dates ou des identifiants
  • Traitez les fichiers en lots pendant les heures creuses si possible
  • Téléchargez et archivez les résultats sans délai
  • Supprimez régulièrement les anciens dossiers de résultats

Surveillance

  • Vérifiez régulièrement le dossier Input-exception pour détecter les échecs d’import
  • Surveillez les temps de traitement afin d’identifier les goulets d’étranglement
  • Examinez les scores de confiance de l’extraction dans les résultats
  • Configurez des alertes en cas de défaillances critiques (si cette fonctionnalité est disponible)

Optimisation du workflow

  • Regroupez les types de documents similaires
  • Configurez les Compétences de document appropriées pour votre cas d’usage
  • Testez avec des documents d’essai avant la mise en production
  • Documentez votre workflow SFTP comme référence pour l’équipe

Prochaines étapes

Maintenant que vous disposez d’un pipeline de traitement de documents fonctionnel basé sur SFTP :
  1. Testez avec différents documents - Téléversez différents types de fichiers et variantes de documents
  2. Vérifiez la précision de l’extraction - Contrôlez les résultats JSON et les scores de confiance
  3. Personnalisez l’extraction - Utilisez Edit Mapping pour affiner l’extraction des champs
  4. Automatisez les téléversements - Créez des scripts pour automatiser les téléversements de fichiers
  5. Intégrez vos systèmes - Connectez vos applications via l’API REST de Vantage
  6. Faites évoluer votre workflow - Ajoutez davantage de Compétences de document ou créez des Compétences de processus supplémentaires
Pour les configurations avancées, l’intégration API ou les workflows personnalisés, consultez la documentation ABBYY Vantage.

Ressources supplémentaires

  • Documentation de l’API REST : pour le chargement programmatique de fichiers et la récupération des résultats
  • Skill Catalog : pour parcourir les compétences de document préconfigurées
  • Support : contactez le support ABBYY pour toute assistance technique

Récapitulatif

Vous avez réussi à :
  • ✅ Créer une Compétence de processus dans ABBYY Vantage
  • ✅ Configurer l’accès SFTP pour l’import et l’export
  • ✅ Configurer des compétences d’extraction de documents
  • ✅ Vous connecter via la ligne de commande SFTP
  • ✅ Téléverser des documents pour traitement
  • ✅ Télécharger les résultats d’extraction
Votre pipeline de traitement de documents est désormais opérationnel et prêt pour une utilisation en production !