Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Cet article s’adresse aux utilisateurs de FlexiCapture sur le point de passer à Vantage. Vantage vous permet de réutiliser divers composants de vos projets FlexiCapture, notamment les FlexiLayouts. Il vous permet également de tirer parti d’une puissante technologie d’apprentissage automatique que vous pouvez facilement entraîner sur vos documents existants annotés. Nous vous recommandons de commencer par explorer les compétences intégrées disponibles dans Vantage. Dans la plupart des cas, ils seront au moins aussi efficaces que vos projets FlexiCapture. L’efficacité de l’entraînement offerte par Advanced Designer et Vantage peut également vous dispenser de réutiliser des FlexiLayouts créés dans FlexiLayout Studio. Plus de 50 compétences intégrées sont disponibles dans le Skill Catalog. Entre autres, Vantage propose des compétences pour le traitement des factures, des commandes d’achat, des reçus et des factures commerciales, susceptibles de remplacer avantageusement ABBYY FlexiCapture for Invoices.

Concepts clés

Dans Vantage, les documents sont traités dans des transactions. Contrairement aux lots, les transactions ne se voient pas attribuer de type. Le flux de traitement et les paramètres de Reconnaissance optique de caractères (OCR) d’une transaction sont définis par la compétence qui gère la transaction. En général, vous devrez remplacer les définitions de document par des Compétences de document intégrées ou configurées manuellement, créer une Compétence de processus et configurer son flux de traitement pour acheminer les documents vers les Compétences de document appropriées et vers d’autres étapes de traitement.

Correspondance des concepts clés

Concept dans FlexiCaptureÉquivalent dans Vantage
Projet FlexiCaptureCompétence de processus qui référence d’autres compétences développées dans Vantage et Advanced Designer : OCR, Classification, Document, Document Splitter
LotTransaction (équivalent partiel)
Type de lot, propriétés du projetFlux de traitement des documents configuré dans la Compétence de processus, paramètres de la compétence et paramètres d’activité
Lots de classificationEnsemble de documents d’une compétence de classification
Lots d’entraînementEnsembles de documents dans des Compétences de document (équivalent partiel)
Lots de testEnsembles de documents de test dans une Compétence de document dans Advanced Designer
Définition de documentCompétence de document
WorkflowFlux de traitement des documents dans une Compétence de processus
Autoapprentissage pour l’extraction de champsOnline learning pour les Compétences de document
Modèles NLPActivités pour documents non structurés dans une Compétence de document dans Advanced Designer

Importation de documents

Les Scanning Station FlexiCapture 12 peuvent être entièrement remplacées par les Scanning Station ABBYY Vantage. L’import depuis un dossier surveillé (appelé dossier partagé dans Vantage) ou depuis des e-mails peut être configuré dans l’activité Input d’une Compétence de processus. Le type de source, le nom du fichier source et les informations sur l’e-mail sont automatiquement enregistrés dans les paramètres d’enregistrement. Vous pouvez également importer des documents et définir des paramètres d’enregistrement personnalisés via l’API Vantage, ou utiliser des connecteurs pour importer des documents depuis diverses applications tierces.

Configuration du workflow

Pour recréer le workflow de traitement par lots, configurez une Compétence de processus. Dans Vantage, les activités d’une Compétence de processus correspondent aux étapes de traitement. Un ensemble de documents désigne une collection de documents au sein d’une transaction.

Correspondance des étapes de workflow

Étape de workflow dans FlexiCaptureÉquivalent dans Vantage
NumérisationABBYY Vantage Scanning Station (non intégrée aux activités d’une Compétence de processus)
RenumérisationNon pris en charge
ReconnaissanceUn workflow combinant les activités OCR, Classify, Extract et Assemble. L’activité OCR définit les options de pré‑reconnaissance pour tous les documents ; Classify achemine les documents vers les activités Extract, où les données sont extraites.
Vérification de l’intégrité de l’assemblage des documentsLa vérification de l’intégrité d’un ensemble de documents n’est pas prise en charge. Pour assembler des documents, vous pouvez utiliser l’activité Assemble d’une Compétence de processus.
Vérification de l’intégrité du lotLes Scanning Stations effectuent des vérifications automatiques de l’intégrité des lots avant l’envoi des documents à Vantage. Un opérateur peut également lancer une vérification manuelle sur la Scanning Station.
Vérification des données, vérification, confirmation d’exportActivité relecture manuelle d’une Compétence de processus.
ExportActivité Output ou activité personnalisée d’une Compétence de processus.
Traité, ExceptionsStatuts de Transaction attribués automatiquement par Vantage. Vous pouvez consulter les statuts de transaction dans la section Transactions du Skill Monitor.
Type d’utilisateurActivité Condition ou activité personnalisée d’une Compétence de processus.
Les workflows dans Vantage nécessitent l’intervention d’un opérateur humain uniquement si le workflow contient des activités de relecture manuelle.

Mode de traitement PDF

Dans FlexiCapture 12, le mode de traitement PDF se configure au niveau du type de lot et détermine si FlexiCapture utilise un calque de texte intégré au PDF ou effectue une Reconnaissance optique de caractères (OCR). ABBYY Vantage offre un contrôle équivalent via le paramètre Mode de traitement PDF, disponible dans les compétences OCR et les activités OCR des compétences de processus. Utilisez le tableau suivant pour faire correspondre vos paramètres FlexiCapture existants à leurs équivalents dans Vantage :
FlexiCapture 12VantageRemarques
AutoPar défaut (recommandé) — correspondance partielleLe mode Auto de FlexiCapture sélectionne dynamiquement l’option à utiliser en fonction de la qualité du calque de texte. Le mode Par défaut de Vantage repose sur une combinaison fixe et n’est donc pas totalement équivalent. Un véritable équivalent du mode Auto est prévu dans une prochaine version de Vantage.
Prefer PDF text layer if availableUtiliser uniquement le calque de texteCorrespondance proche. Dans les deux cas, le calque de texte intégré est privilégié, avec basculement vers l’OCR lorsqu’aucun calque de texte n’est présent.
Use OCR onlyUtiliser uniquement l’OCRCorrespondance directe. Dans les deux cas, tout calque de texte intégré est ignoré et l’OCR est forcé sur toutes les pages.

Guide de migration : choisissez votre point de départ

Si vous ne savez pas quel mode de Vantage utiliser, les recommandations ci-dessous font correspondre des configurations FlexiCapture courantes à un point de départ conseillé dans Vantage :
  • Vous utilisiez Auto dans FlexiCapture : commencez par Default (recommandé) et surveillez vos résultats d’extraction. Si la précision est inférieure à celle attendue, passez à Use Text Layer Only (si vos PDF comportent des calques de texte fiables) ou à Use OCR Only (si ce n’est pas le cas).
  • Vous utilisiez “Prefer PDF text layer if available” dans FlexiCapture : utilisez Use Text Layer Only dans Vantage. Vérifiez un échantillon de résultats pour confirmer que les calques de texte de vos documents sont d’une qualité suffisante.
  • Vous utilisiez “Use OCR only” dans FlexiCapture : utilisez Use OCR Only dans Vantage. Il s’agit d’un équivalent direct.
Un véritable équivalent du mode Auto de FlexiCapture — dans lequel Vantage évalue dynamiquement la qualité du calque de texte avant de choisir une méthode de traitement — est prévu dans une prochaine version de Vantage. En attendant, Default (recommandé) est l’option disponible la plus proche pour les ensembles de documents mixtes.
Contrairement à FlexiCapture, où ce paramètre est configuré une seule fois au niveau du type de lot, Vantage vous permet de définir un mode de traitement PDF différent pour chaque compétence ou activité. Vous bénéficiez ainsi d’un contrôle plus fin lorsque vous traitez différents types de documents au sein d’un même workflow.
Pour obtenir la documentation complète sur le paramètre mode de traitement PDF, notamment quand utiliser chaque option, consultez mode de traitement PDF.

Rôles utilisateurs

Vantage permet de créer plusieurs activités de relecture manuelle dans une Compétence de processus. Un opérateur de relecture manuelle peut disposer d’un accès restreint à certaines étapes de relecture manuelle. Pour créer des utilisateurs et modifier leurs autorisations, ouvrez l’onglet Users dans Vantage.

Mappage des rôles

Rôle dans FlexiCaptureRôle dans Vantage
Scanning OperatorSkill User
Data Verification OperatorManual Review Operator (avec la possibilité de restreindre l’accès à certaines compétences et étapes de relecture manuelle)
Verification OperatorManual Review Operator (avec la possibilité de restreindre l’accès à certaines compétences et étapes de relecture manuelle)
Senior Verification OperatorProcessing Supervisor
Project Settings EditorSkill Designer
Monitoring OperatorProcessing Supervisor (a également accès à la relecture manuelle)
AdministratorTenant Administrator
Web Capture OperatorSkill User + Manual Review Operator
Operators ManagerTenant Administrator (c’est le seul rôle qui permet de gérer les autorisations des utilisateurs)

Classification

Les modèles de classification ne peuvent pas être réutilisés directement dans Vantage. Pour identifier des documents de types différents, créez un Skill de classification. Dans ce Skill, vous pouvez importer des documents utilisés pour entraîner le modèle de classification dans FlexiCapture, créer des classes identiques et entraîner le Skill dans Vantage. Vous pouvez ensuite utiliser ce Skill dans une activité Classify d’une Compétence de processus et faire correspondre les classes aux activités Extract. Chaque activité Extract utilisera une Compétence de document que l’on peut considérer comme l’équivalent d’une section Document Definition. Le clustering est toujours activé dans Vantage ; ainsi, différentes variantes de documents d’un même type peuvent être identifiées automatiquement. Cependant, si les mises en page varient considérablement, envisagez de créer une Compétence de document dans Advanced Designer, d’ajouter une activité Classify à son flux de travail et de l’entraîner en conséquence. Vous pouvez configurer une activité Extraction Rules (qui est plus ou moins l’équivalent d’un FlexiLayout) pour qu’elle soit sélectionnée automatiquement en fonction de la variante de document, en plaçant un ensemble d’activités Extraction Rules après l’activité Classify. Pour séparer les documents dans un flux de pages en entrée, ajoutez une activité Assemble à une Compétence de processus. Vous devrez peut-être également créer et configurer un Skill Document Splitter dans Advanced Designer.

Définitions de document

De manière générale, vous devrez remplacer les Définitions de document correspondant à différents types de documents par des Compétences de document appropriées. Les Définitions de document couvrant différentes variantes d’un même type de document doivent être remplacées par des activités distinctes au sein d’une seule Compétence de document. Si une Définition de document contient plusieurs sections, chaque section doit être remplacée par une Compétence de document appropriée. Les paramètres d’OCR et la reconnaissance de l’écriture manuscrite se configurent dans le cadre d’une Compétence de document. Si vous utilisez une Compétence de processus pour acheminer des documents vers différentes Compétences de document, vous pouvez également configurer des paramètres généraux de préreconnaissance (langues, reconnaissance de l’écriture manuscrite et codes-barres) dans une activité OCR. Notez que la reconnaissance de l’écriture manuscrite est activée par défaut dans les paramètres de la Compétence de document et désactivée par défaut dans l’activité OCR. Traitement du calque de texte PDF : Dans ABBYY FlexiCapture, vous pouviez configurer le comportement du calque de texte PDF par rapport à l’OCR dans le cadre d’une Définition de document. Dans Vantage, le paramètre équivalent Mode de traitement PDF n’est pas configuré dans les Compétences de document — il se configure dans les compétences OCR et dans l’activité OCR d’une Compétence de processus. Pour plus de détails, consultez Mode de traitement PDF.
La technologie d’extraction de données de Vantage a été sensiblement modifiée et améliorée par rapport à FlexiCapture. Le fonctionnement des Règles d’extraction et des autres activités disponibles dans Vantage diffère de celui de leurs équivalents dans FlexiCapture, ce qui peut entraîner, dans certains cas, des résultats différents. Assurez-vous que les résultats d’extraction vous conviennent après avoir remplacé vos Définitions de document par des Compétences de document.
Développez le cas correspondant à votre projet FlexiCapture :
Les Définitions de document pour les formulaires ne peuvent pas être réutilisées directement dans Vantage. Si aucune des compétences intégrées ne répond à vos besoins, exportez le lot correspondant de documents annotés depuis FlexiCapture et importez-les dans une Compétence de document nouvellement créée dans Advanced Designer. Vous avez ensuite deux options :
  • Ajoutez une activité Fast Learning au flux de traitement de la Compétence de document et entraînez-la à l’aide des documents importés. Cette activité ne nécessite pas un grand nombre de documents pour l’entraînement. Pour démarrer l’entraînement de l’activité avec la technologie pour les formulaires, il suffit d’ajouter trois documents pouvant être identifiés comme des instances du même formulaire.
  • Ajoutez une activité Forms au flux de traitement de la Compétence de document et importez l’image d’un formulaire vierge. Étiquetez les champs sur le formulaire vierge et entraînez l’activité. Testez les résultats sur les documents importés.
Si vous n’avez pas besoin de combiner le traitement de formulaires fixes avec d’autres activités, vous pouvez créer une simple Compétence de document pour les formulaires dans Vantage, sans utiliser Advanced Designer.
Dans de nombreux cas, vous pouvez facilement remplacer une Définition de document existante par une compétence intégrée ou entraîner une nouvelle compétence dans Vantage ou Advanced Designer à l’aide de vos documents annotés. Cependant, il existe aussi une option rapide pour créer dans Advanced Designer un équivalent d’un FlexiLayout existant.Vous pouvez importer un FlexiLayout dans une Compétence de document dans Advanced Designer. Vous pouvez soit créer une nouvelle Compétence de document à partir du projet FlexiLayout, soit importer un FlexiLayout dans une activité Extraction Rules. Les paramètres de langue OCR sont hérités de ceux de FlexiLayout, mais nous vous recommandons de vérifier les paramètres OCR d’une compétence après l’importation. Les résultats de l’entraînement ne peuvent pas être transférés vers Advanced Designer, mais vous pouvez importer les documents annotés d’un lot d’entraînement et les utiliser pour réentraîner l’activité dans Advanced Designer.
Les modèles entraînés ne peuvent pas être importés dans Advanced Designer. Cependant, vous pouvez choisir l’un des modèles NLP disponibles dans Advanced Designer comme activité de compétence, téléverser des exemples de documents et entraîner l’activité. Pour entraîner votre propre modèle NLP, utilisez une activité Segmentation et/ou Deep Learning dans une Compétence de document dans Advanced Designer. Les scripts d’extraction ne peuvent pas être réutilisés dans Advanced Designer ni dans Vantage.
Les règles peuvent être recréées soit dans Vantage, soit dans Advanced Designer. Les règles de script doivent être réécrites pour être compatibles avec l’interpréteur JavaScript de Vantage.
Utilisez une activité Assemble d’une Compétence de processus. Pour ajouter un script d’assemblage de documents, créez et configurez une Skill Document Splitter dans Advanced Designer. Le script doit être réécrit afin d’être compatible avec l’interpréteur JavaScript.
Vous pouvez exporter les résultats du traitement via l’API Vantage ou utiliser des connectors pour exporter les résultats du traitement vers diverses applications tierces. L’export vers un dossier partagé peut être configuré dans l’activité Output d’une Compétence de processus. Utilisez la même activité pour configurer les formats d’export.Vous pouvez configurer l’export à l’aide d’un script dans une activité Output ou une activité personnalisée d’une Compétence de processus. Le script doit être réécrit afin d’être compatible avec l’interpréteur JavaScript de Vantage. Vantage prend en charge le stockage des identifiants de connexion pour les services tiers dans des variables d’environnement. Ces variables sont accessibles depuis ces scripts.
La structure des champs est recréée automatiquement lorsque vous importez des documents annotés ou des FlexiLayouts dans Advanced Designer. Vous pouvez ensuite utiliser Vantage ou Advanced Designer pour modifier la disposition du formulaire de données.

ABBYY FlexiCapture for Invoices

Remplacer par des compétences intégrées

Vantage propose un grand nombre de compétences intégrées pour traiter divers types de documents, notamment des factures, des reçus, des commandes d’achat et des factures commerciales. Elles fonctionnent prêtes à l’emploi et peuvent remplacer les projets créés dans ABBYY FlexiCapture for Invoices. Nous vous recommandons de tester d’abord les compétences intégrées sur vos documents. Si vous n’êtes pas satisfait des résultats d’extraction, poursuivez votre lecture pour obtenir des conseils sur la création ou la personnalisation des compétences. Les jeux de données utilisés dans le projet peuvent être importés dans des catalogues de données au format CSV. Les catalogues de données nécessaires, avec un ensemble de colonnes équivalent à celui des jeux de données, sont automatiquement créés pour les compétences Invoice, Commercial Invoice et Purchase Order.

Personnaliser avec les FlexiLayouts

Si vous utilisiez un projet FlexiCapture for Invoices entraîné sur vos documents, mais sans paramètres personnalisés manuels ni champs personnalisés, vous n’aurez pas besoin de configurer d’autres paramètres dans Vantage. Il suffit de dériver une compétence à partir de la compétence de facture intégrée souhaitée, d’importer les documents annotés, puis d’entraîner la compétence dérivée sur l’ensemble de documents obtenu. Si vous utilisiez un FlexiLayout personnalisé, nous recommandons de dériver une compétence à partir de la compétence de facture intégrée souhaitée et de créer une activité Extraction Rules en important le FlexiLayout personnalisé. Ajoutez l’activité Extraction Rules que vous avez créée après l’activité Base: <Base Skill Name>. Cette méthode peut être utilisée, par exemple, pour capturer des champs de facture supplémentaires. Si vous avez plusieurs FlexiLayouts, vous pouvez ajouter plusieurs activités Extraction Rules. Par exemple, si vous aviez un FlexiLayout dédié pour chaque fournisseur, importez chacun des FlexiLayouts en tant qu’activité Extraction Rules et associez les valeurs d’ID fournisseur (extraites par la compétence de facture de base) aux activités correspondantes. Les FlexiLayouts que vous utilisiez dans FlexiCapture pouvaient inclure de nombreux paramètres supplémentaires, tels que le formatage des devises, les paramètres régionaux ou les taux d’imposition. Ces paramètres ne sont généralement pas nécessaires dans Vantage, car ses compétences intégrées incluent déjà toutes les informations pertinentes.

Supervision et rapports

Vous pouvez suivre la productivité et les données de traitement dans Skill Monitor. Les informations sur les événements de traitement et les erreurs sont disponibles dans les sections Transactions et Journal des erreurs de Skill Monitor. Pour générer des rapports sur le traitement métier, vous pouvez utiliser l’entrepôt Business Processing Reporting inclus dans Vantage. Les informations sur les activités non liées au traitement des transactions métier sont disponibles dans le Journal de sécurité.

Liste des fonctionnalités non prises en charge dans Vantage

Les fonctionnalités FlexiCapture suivantes ne sont pas prises en charge dans Vantage :
  • Contrôle des SLA
  • Priorité de lot
  • Nouvelle numérisation
  • Vérification de l’assemblage des documents
  • Pièces jointes utilisateur pour les images importées
  • Fichiers de description pour les lots provenant d’un dossier surveillé
  • Double vérification
  • Vérification distribuée
  • Événements de l’interface de traitement
  • Paramètres d’habillage (vous pouvez uniquement supprimer le logo Vantage lors de l’intégration du client de relecture manuelle dans votre propre système)
  • Script de reconnaissance personnalisé
  • Champs de service
  • Liens vers des champs existants (les valeurs de champ de tous les documents d’une transaction sont accessibles via un script)
  • Dictionnaires pour les langues de Reconnaissance optique de caractères (OCR)
  • Chaînes de règles (ne peuvent être configurées qu’à l’aide d’une règle de script avancé)
  • Rédaction des données sensibles lors de l’exportation des documents
  • Localisation du formulaire de données, des noms de règles et des messages de script

Mode de traitement PDF

Déterminez si Vantage utilise le calque de texte PDF intégré, l’OCR ou une combinaison des deux.

Skill Catalog

Découvrez, publiez et réutilisez des compétences dans l’ensemble de votre tenant.

Configurer une Compétence de processus

Créez une Compétence de processus à partir d’un workflow prédéfini ou de zéro.

Configurer une Compétence de document

Configurez une Compétence de document pour extraire des champs d’un type de document.

Versions des compétences

Découvrez comment Vantage gère les versions des compétences et comment les afficher, les modifier et les supprimer.