Passer au contenu principal

A

ABBYY FlexiCapture

Solution logicielle de capture de données en flux unique à partir de divers types de documents structurés (formulaires fixes), semi-structurés (formulaires et documents flexibles) et non structurés (documents à format libre).

ABBYY FlexiLayout Studio

Programme permettant de créer un FlexiLayout de la structure du document, qui peut ensuite être utilisé pour la reconnaissance automatique de documents.

ABBYY FormDesigner

ABBYY FormDesigner sert à concevoir la mise en page de formulaires lisibles par machine. Une fois reproduits et remplis, ces formulaires peuvent être traités à l’aide du système automatisé de saisie de formulaires ABBYY FlexiCapture. La conception de la mise en page des formulaires est une étape importante, car la qualité de cette mise en page (sa lisibilité par machine) détermine l’efficacité de toutes les étapes de traitement suivantes : numérisation, reconnaissance, vérification et export.

FCFORINVOICES

Un FC est une solution logicielle intelligente, simple d’utilisation, pour le traitement des factures.

ADF

Chargeur automatique de documents. Dispositif d’alimentation automatique qui vous permet de numériser autant de documents que nécessaire sans intervention manuelle supplémentaire.

Administrateur

Utilisateur d’ABBYY FlexiCapture habilité à configurer le programme pour l’import de documents : création et modification de définitions de document et de profils d’importation.

Alphabet

Ensemble de caractères utilisé pour la langue décrite.

Repère

Les repères sont des éléments spéciaux de la conception des formulaires, utilisés par le système pour effectuer la mise en correspondance après la numérisation (élimination de l’inclinaison, compensation des défauts linéaires et non linéaires liés à la numérisation, calcul de l’emplacement des blocs). Les repères les plus fiables sont les carrés noirs, généralement situés dans les coins d’un formulaire. Si aucun repère spécial n’est présent sur l’image, d’autres éléments statiques peuvent être utilisés pour la mise en correspondance de la définition de document : les Separator, c’est-à-dire des lignes verticales ou horizontales, comme des lignes de tableau, des cadres, etc., ou un texte statique bien visible, à savoir : l’en-tête du formulaire, les libellés de champ, les informations explicatives, etc. L’option Use for définition de document matching doit être activée pour les éléments statiques utilisés pour la mise en correspondance de la définition de document.

Barcode de repère

Élément statique représentant un barcode non destiné à l’extraction de données. Un barcode de repère peut être utilisé pour la mise en correspondance ou l’identification d’une définition de document.

Texte de repère

Élément statique représentant un texte présent sur un formulaire vierge et non destiné à l’extraction de données. Il peut s’agir de tout texte explicatif ou d’un en-tête. Le texte de repère peut être utilisé pour la mise en correspondance ou l’identification de la définition de document.

Angle

Un repère en forme d’angle.

Annexe

Pages ne contenant aucun champ, mais incluses dans l’assemblage de documents. Aucune donnée n’est extraite de ces pages, mais elles peuvent être enregistrées sous forme d’images ou de fichiers PDF avec recherche. (Administrateur) Voir Création de définitions de document pour les documents avec annexes.

Erreur d’assemblage

Cette erreur se produit lorsqu’un document créé lors de l’assemblage de documents contient des pages d’autres documents, lorsque ses propres pages sont dans le désordre, ou lorsque les valeurs des champs principaux figurant sur les pages du document ne correspondent pas.

Auto-apprentissage

Capacité d’ABBYY FlexiCapture à apprendre automatiquement à détecter de nouveaux champs et à identifier les types de documents.

B

Barcode

Élément de formulaire lisible par machine, représenté par une alternance de barres blanches et noires d’une certaine longueur, qui codent des informations numériques. Un Barcode présent dans un document peut être utilisé pour extraire des informations (champ Barcode) ou pour associer et identifier une Document Definition (anchor Barcode).

Champ Barcode

Un champ d’une définition de document contenant un Barcode à reconnaître.

Reconnaissance de Barcode

Conversion d’une image de Barcode en nombres ou en texte.

Type de lot

Propriété d’un lot qui définit la façon dont les documents des lots correspondants sont traités. (Administrateur) Voir Types de lots.

Formulaire à lignes en noir et blanc

Formulaire dont les bordures des champs d’information sont matérialisées par de simples lignes qui ne disparaissent pas lors de la numérisation.

Carré noir

Un repère en forme de carré noir.

Luminosité

Seuil de sensibilité à la lumière qui détermine à partir de quel niveau le scanner interprète les demi-teintes en niveaux de gris comme du blanc.

C

Coche

Un élément de formulaire lisible par machine portant une marque (coche, croix, point, rature à l’encre, etc.) apposée par la personne qui remplit le formulaire.

Champ de coche

Un champ de définition de document contenant une coche.

Groupe de coches

Élément d’un formulaire lisible par machine qui regroupe plusieurs coches situées à proximité. Une ou plusieurs coches peuvent être sélectionnées dans un groupe de coches.

Champ de groupe de coches

Champ de définition de document contenant un groupe de coches.

Classificateur

Projet créé dans FlexiLayout Studio, destiné à l’identification préliminaire des pages avant l’application des définitions de document, ainsi qu’à la sélection du FlexiLayout ou de la variante de mise en page appropriée.

F-mesure du classificateur

Mesure combinée de la précision et du rappel pour la classification de documents. Elle s’exprime sous la forme d’un nombre compris entre 0 et 1 ou d’un pourcentage compris entre 0 % et 100 %. La F-mesure d’une catégorie se calcule comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision de la catégorie, R est le rappel de la catégorie, et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné. Valeur maximale = 1 (100 %) lorsque P = R = 1 (100 %). La F-mesure d’un lot de test ou d’entraînement se calcule comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision du lot de test ou d’entraînement, R est le rappel du lot de test ou d’entraînement, et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné.

Page de codes

Table de valeurs décrivant l’ensemble de caractères d’une langue donnée.

Formulaire sur fond coloré

Formulaire dont tous les champs d’information sont des rectangles blancs sur un fond coloré qui disparaît lors de la numérisation.

Contraste

Rapport entre la luminosité des zones les plus sombres et les plus claires d’une image.

Contrôle

Élément de texte, champ ou bouton du formulaire de données. (Administrateur) Pour plus de détails, voir Insérer un contrôle.

Coche corrigée

Une coche sélectionnée par erreur puis biffée à l’encre. Si l’option Autoriser les corrections est activée pour le champ de coche, le programme interprète la coche biffée comme non sélectionnée.

Croix

Un repère en forme de croix.

Type de données personnalisé

Type de données défini par l’utilisateur. (Administrateur) Voir Créer des types de données personnalisés.

D

Recherche dans la base de données

Mise en correspondance des données reconnues avec les enregistrements correspondants d’une base de données.

Jeu de données

Données utilisées pour les vérifications automatisées de documents. Un jeu de données peut être stocké sous forme de tableau dans FC et synchronisé selon un calendrier, ou récupéré à partir d’une source externe.

Type de données

L’une des caractéristiques du champ est son type de données : nombre, date, texte, nom de famille, prénom, adresse, etc. Un type de données définit l’ensemble des mots susceptibles d’apparaître dans le champ concerné. Le type de données est un paramètre de reconnaissance important qui influe sur la qualité de la reconnaissance. Un type de données correctement spécifié peut réduire considérablement le nombre de caractères mal reconnus.

Fichier de description

Fichier auxiliaire qui définit comment un lot est constitué lorsque des images sont ajoutées depuis un Hot Folder. (Administrateur) Pour plus de détails, voir Fichier de description.

Dictionary

Un dictionnaire est défini lors de la création d’un type de données. Par conséquent, le type de données associé à un champ détermine le dictionnaire utilisé pendant la reconnaissance et la vérification. Outre les types de données prédéfinis déjà fournis avec des dictionnaires prêts à l’emploi, le programme vous permet d’associer des types de données créés à partir de dictionnaires personnalisés. Vous pouvez saisir manuellement les données du dictionnaire ou les charger à partir d’un fichier.

Document

Ensemble constitué d’une ou plusieurs images de page et des données qui en sont extraites.

Lot de documents

Ensemble de documents regroupés par l’utilisateur. Un lot contient généralement une pile de documents numérisés en un seul passage ou importés à partir d’un dossier spécifique. (Administrateur) Voir Lots de documents.

Classe de documents

Ensemble de documents ou de pages partageant plusieurs caractéristiques communes.

Données du document

Données capturées après le traitement des images des pages du document (reconnaissance, vérification et modification des résultats de reconnaissance).

Définition de document

Une définition de document définit les principes d’identification et de traitement d’un type particulier de document et contient :
  • La structure du document, c’est-à-dire une description de l’ordre autorisé des pages pour les documents de ce type, qui définit comment les documents doivent être assemblés
  • Les définitions des sections du document
  • Une liste de règles auxquelles les données des champs doivent satisfaire
  • L’emplacement des champs et de leurs signatures dans la fenêtre de données (vue du formulaire de données)
  • Les paramètres d’export du document
  • Les paramètres de traitement du document

Identification de définition de document

Processus consistant à sélectionner la définition de document requise à l’aide d’identifiants.

Mise en correspondance d’une définition de document

Processus consistant à sélectionner une définition de document et à mettre ses champs en correspondance avec une image.

Publication d’une définition de document

Permet d’accéder à une nouvelle version de définition de document après sa modification. Une version publiée participe au traitement des documents provenant des lots de travail, tandis qu’une version locale non publiée ne peut participer qu’au traitement des définitions de document provenant des lots de test. (Administrateur) Voir Modification et publication d’une définition de document.

Section de définition de document

Composant d’une définition de document. Correspond à une ou plusieurs pages contenant un ensemble de champs logiquement cohérent. Les champs d’une même section peuvent se poursuivre d’une page à l’autre (par exemple, des tableaux sur plusieurs pages), tandis que les ensembles de champs de différentes sections ne se recoupent pas. Une définition de section peut être flexible ou fixe.

Identification des documents

Processus consistant à attribuer des documents à l’un de plusieurs types de documents prédéfinis.

Jeu de documents

Ensemble de documents logiquement liés et utilisés dans un but précis. Par exemple, un processus métier peut être initié par un jeu de documents fourni par un demandeur, comprenant un formulaire de demande rempli ainsi que des pièces justificatives. Selon les informations fournies par le demandeur dans le formulaire de demande, certaines de ces pièces peuvent être facultatives, tandis que d’autres doivent obligatoirement être jointes à la demande.

Texte du document

L’ensemble du texte du document capturé lors de la reconnaissance préliminaire, avant l’application du FlexiLayout. Vous pouvez choisir d’enregistrer ce texte (cela nécessite davantage d’espace sur le disque dur) afin de pouvoir l’utiliser lors de la vérification.

Type de document

Ensemble de documents présentant plusieurs caractéristiques communes et jouant un rôle spécifique dans les processus métier. Parmi les types de documents, on peut citer les factures, les contrats et les passeports.

Variante de document

Ensemble de documents appartenant au même type et partageant plusieurs caractéristiques. Par exemple, des factures provenant de différents fournisseurs ou des relevés de crédit émis par la même banque.

Texte d’imprimante matricielle

Un type de texte reconnaissable correspondant à un texte imprimé avec une imprimante matricielle.

dpi

Points par pouce. Nombre de points par pouce ; unité de mesure de la résolution d’une image.

E

Entité

Un champ ou un groupe de champs contenant des informations à extraire à l’aide de la technologie NLP. Exemples d’entités : personnes, entreprises, lieux, montants et dates.

Variable d’environnement

Chaîne de caractères utilisée pour stocker du texte, par exemple des paramètres système. Les variables d’environnement peuvent servir à stocker des chaînes de connexion à des bases de données ainsi que des variables utilisées pour spécifier les noms des fichiers exportés.

Erreur / avertissement

L’erreur / l’avertissement se produit lorsque les données extraites d’un ou de plusieurs champs ne satisfont pas aux règles appliquées lors des contrôles automatiques ou ne correspondent pas au format spécifié. Il existe deux types d’erreurs et d’avertissements :
  • les erreurs / avertissements sur un seul champ sont générés par des règles et des formats qui portent sur un seul champ ;
  • les erreurs / avertissements sur plusieurs champs sont générés par des règles qui portent sur plusieurs champs.

Texte explicatif

Élément de formulaire lisible par machine représentant un texte descriptif (nom du formulaire, noms de champs, explications des champs, etc.).

Export

Processus de transfert de données traitées vers un système d’information externe ou un fichier.

Profil d’exportation

Ensemble de paramètres qui détermine ce qui est fait des données traitées : format des fichiers de sortie, chemin de sortie, conditions d’exportation, etc.

Base de données externe

Fichier texte ou base de données compatible ODBC stockant des données de référence. Les données de référence peuvent inclure les valeurs possibles des champs capturés ou les informations nécessaires à la capture des champs.

F

Champ

Élément de document destiné à l’extraction de données. Les champs peuvent être simples (sans structure interne) ou composites, comme un champ de type tableau, dans lequel chaque cellule peut être considérée comme un sous-champ distinct du tableau. (Administrateur) Voir Création de champs d’une définition de document.

Région du champ

Une région de l’image mise en évidence dans la définition de document et destinée à l’extraction de données.

Vérification de champ

En mode de vérification de champ, les caractères incertains sont vérifiés dans le contexte de l’ensemble du champ. Les champs pour lesquels l’option Send to field verification est activée sont soumis à la vérification de champ. Nous recommandons de soumettre à la vérification de champ les champs dont l’éventail des valeurs possibles est connu ou peut être déterminé facilement. C’est le cas, par exemple, des noms de pays ou de villes : nous savons quelles valeurs ce type de champ peut prendre.

Champ avec plusieurs occurrences

Champ servant à décrire plusieurs objets du même type (objets récurrents). En pratique, ces différents objets constituent un seul et même champ et partagent les mêmes propriétés. Les champs avec plusieurs occurrences permettent d’éviter de créer plusieurs champs identiques. Les champs avec plusieurs occurrences sont exportés vers des fichiers distincts ou dans des tables de base de données distinctes. (Administrateur) Voir Champs avec plusieurs occurrences.

Champ avec plusieurs régions

Un champ composé de plusieurs régions sur l’image. Ces régions peuvent être éloignées les unes des autres, voire se trouver sur des pages différentes. Les valeurs de toutes les régions appartenant au même champ sont regroupées et exportées sous la forme d’un seul champ. Généralement utilisé pour les objets situés sur plusieurs pages, tels que les grands tableaux. (Administrateur) Voir Champs avec plusieurs régions.

Champ sans région

Champ détecté dans une définition de document, mais sans région sur l’image. (Administrateur) Voir Champs sans région.

Formulaire fixe

Document comportant des champs d’information fixes, dont la mise en forme, le nombre et la disposition sont strictement définis et ne varient pas d’une instance à l’autre.

Définition de document à structure fixe

Définition d’un document ou de l’une de ses sections conçue pour traiter des formulaires à structure fixe. Les champs d’une définition de document à structure fixe occupent des emplacements fixes.

FlexiLayout

Description de la structure du document semi-structuré. Cette description est créée avec ABBYY FlexiLayout Studio et exportée vers ABBYY FlexiCapture. Format de fichier : *.afl. FlexiLayout est un ensemble d’instructions permettant de détecter et d’identifier les champs d’un formulaire flexible.

variante de FlexiLayout

Un FlexiLayout pour une variante de document, soit développé spécifiquement pour cette variante, soit entraîné sur celle-ci. Utilisé conjointement avec un FlexiLayout générique.

Définition de document flexible

Définition d’un document ou de l’une de ses sections, conçue pour le traitement de documents semi-structurés. Créée en y attachant un FlexiLayout. Les champs d’une telle définition de document n’ont pas d’emplacement fixe. Ils sont détectés à l’aide d’un FlexiLayout. (Administrateur) Voir Création d’une définition de document pour le traitement de documents semi-structurés.

Formulaire

Document composé d’une ou plusieurs pages, conçu pour être rempli par une personne à la main ou à l’aide de toute autre technique d’impression.

Texte encadré

Type de marquage du texte où un cadre délimite le texte.

Texte encadré sur une zone à peigne

G

Formulaire sur fond gris

Formulaire dans lequel tous les champs d’information sont des rectangles blancs sur un fond gris qui disparaît lors de la numérisation.

Vérification de groupe

Les champs pour lesquels l’option Envoyer à la vérification de groupe est activée sont envoyés pour vérification de groupe. Nous vous recommandons également d’envoyer pour vérification de groupe les caractères des champs numériques, ainsi que les coches.

H

Texte manuscrit en caractères d’imprimerie

Type de texte reconnaissable correspondant à un texte écrit à la main en caractères distincts.

Texte manuscrit

Un type de texte reconnaissable dont les lettres sont attachées ou partiellement attachées. Remarque : Actuellement, seul le texte manuscrit en anglais peut être reconnu.

Dossier de surveillance

Dossier situé sur le disque dur d’un ordinateur local ou distant et utilisé pour importer des images. Il sert généralement à des téléversements d’images périodiques, sans intervention de l’utilisateur. (Administrateur) Voir Profils d’importation d’images.

Identifiant

Élément statique utilisé pour identifier avec certitude une définition de document parmi plusieurs définitions de document dont les repères sont situés aux mêmes emplacements. L’option Use for définition de document identification doit être activée dans les propriétés de ces éléments statiques.

Fournisseur d’identité

Système tiers, tel qu’Azure AD, OneLogin ou Okta, qui gère les informations d’identité et fournit des services d’authentification à ses clients, permettant à l’utilisateur final d’accéder à l’ensemble des ressources autorisées de son réseau local en ne saisissant ses identifiants qu’une seule fois.

Caractère ignoré

Ces caractères sont exclus des mots, c’est-à-dire que les mots sont associés à un type de données particulier sans tenir compte de ces caractères.

Image

Image électronique d’une page numérisée issue d’un document papier.

Suppression du bruit de l’image

Élimination du bruit de l’image. Du bruit peut apparaître lors de la numérisation, et il est recommandé de le supprimer afin d’améliorer la reconnaissance des données. Lors de cette opération, le programme supprime également les points d’arrière-plan ou les lignes de contour des formulaires rasterisés.

Import d’images

Processus consistant à ajouter des images à un lot en vue de leur traitement. L’importation peut être effectuée en ajoutant des images depuis des fichiers, un scanner ou à l’aide de profils d’importation. (Administrateur, Vérification) Voir Ajout d’images de page.

Rotation de l’image

Rotation d’une image autour de son centre.

Profil d’importation

Combinaison de paramètres permettant d’ajouter des images à un lot : source d’importation, options de traitement des images, options de nettoyage du Hot Folder, etc. (Administrateur) Voir Profils d’importation d’images.

Caractère reconnu de manière incorrecte

Statut attribué automatiquement à un caractère au cours de la reconnaissance s’il a été reconnu avec un niveau d’incertitude élevé.

Champ d’indexation

Un champ dont la valeur est utilisée pour indexer les documents à des fins de tri et de recherche. (Administrateur) Voir Champs d’indexation.

Image inversée

Une image dont le texte clair se détache sur un fond sombre.

Facture

Document répertoriant les marchandises fournies, leur quantité, leur prix, leurs caractéristiques (telles que la couleur, le poids, etc.), les conditions d’expédition et les coordonnées des parties concernées. Les factures peuvent être traitées à l’aide d’une solution distincte, FCFORINVOICES. (Administrateur, Vérification) Voir ABBYY FlexiCapture for Invoices.

ICR, reconnaissance intelligente de caractères

Cela désigne des technologies ou des systèmes conçus pour le traitement en masse de documents comportant des lettres et des chiffres écrits en lettres moulées, c’est-à-dire la reconnaissance de caractères écrits en lettres moulées.

K

Champ principal

Champ permettant de vérifier automatiquement l’assemblage des pages en documents. Les valeurs des champs principaux doivent être identiques sur toutes les pages d’un même document.

L

Langue (locale)

Propriété d’un champ qui détermine la langue d’écriture ainsi que les paramètres régionaux associés (tels que le format de date ou d’adresse).

Mise en page

L’emplacement des champs sur l’image d’un document. Les mises en page peuvent être générées automatiquement ou créées manuellement. (Administrator) Voir aussi Disposition de référence.

Lettres dans des cadres

Lettres dans des cadres séparés

Lettres sur un peigne

M

Texte imprimé

Type de texte reconnaissable imprimé au moyen d’un équipement typographique ou d’une imprimante laser ou jet d’encre, avec une résolution minimale de 300 dpi.

Formulaire lisible par machine

Formulaire spécialement conçu pour la saisie automatisée. Il contient des éléments de traitement (repères, code-barres, lignes, etc.) nécessaires à son traitement correct.

Champ de saisie manuelle

Champ d’une définition de document contenant du texte non reconnaissable (par exemple, un texte composé de lettres fusionnées) qui doit être saisi au clavier.

MRC (Mixed Raster Content)

Méthode de compression utilisée pour les images qui contiennent à la fois du texte et des fragments raster. L’image est décomposée en fragments, puis un algorithme de compression optimal est sélectionné pour chacun d’eux. Cette approche offre de meilleurs taux de compression tout en préservant la qualité visuelle des images.

Texte à chasse fixe

Type de marquage du texte dans lequel chaque lettre est située dans un cadre de même hauteur et de même largeur, mais dont la bordure disparaît lors de la numérisation.

Document multipage

Un document composé de plusieurs pages.

Multitenance

Fonctionnalité permettant à plusieurs utilisateurs indépendants d’utiliser ABBYY FlexiCapture. Les données de chaque tenant sont totalement isolées de celles des autres tenants, et le système alloue une partie de ses ressources à chaque tenant.

N

NER (reconnaissance des entités nommées) Une tâche d’extraction d’informations consistant à repérer des attributs dans du texte non structuré et à les classer dans des catégories prédéfinies. NLP (traitement automatique du langage naturel) Un sous-domaine de l’intelligence artificielle et de la linguistique mathématique. Il est consacré à l’analyse et à la synthèse informatiques des langues naturelles. L’une de ses applications possibles est l’extraction d’informations pertinentes à partir de texte. Il inclut notamment : la traduction automatique, les chatbots, la classification, l’analyse du ton, l’extraction de données, etc.

Modèle NLP

Mécanisme qui détermine quelles entités et quels segments doivent être extraits à partir de textes, et de quelle manière. Le domaine d’application et l’algorithme d’extraction sont sélectionnés lors de l’entraînement d’un modèle NLP.

O

OCR (Reconnaissance optique de caractères)

Reconnaissance optique des textes imprimés.

OMR (reconnaissance optique de marques)

Cette technologie permet à ABBYY FlexiCapture de reconnaître avec un haut degré de fiabilité les marques ordinaires (coches, croix, etc.) sur les formulaires et d’identifier correctement les marques faites par erreur puis raturées à l’encre.

Opérateur

Utilisateur d’ABBYY FlexiCapture chargé de la saisie des documents : ajout d’images, reconnaissance et vérification, exportation des données reconnues.

Rôle d’opérateur

Propriété d’un compte utilisateur dans ABBYY FlexiCapture qui détermine quelles données sont accessibles à l’utilisateur et quelles actions peuvent être effectuées sur ces données. (Administrateur, Vérification) Voir Utilisation d’un projet configuré.

Superposition

Processus consistant à combiner la numérisation d’un formulaire rempli avec l’image d’un exemplaire vierge du même formulaire dans le définition de document Editor.

P

Page

Image d’une page d’un document papier et des résultats de son traitement.

Disposition de la page

Schéma montrant l’emplacement des champs sur une image.

Orientation de la page

Position de la page par rapport à l’orientation standard : de haut en bas, de gauche à droite. L’orientation de la page peut être déterminée automatiquement lors de la reconnaissance de l’image de la page ; à cet effet, ABBYY FlexiCapture vous permet de spécifier les orientations possibles.

Image

Élément d’un formulaire lisible par machine qui ne fait pas l’objet d’une reconnaissance, mais qui est destiné à être exporté sous la forme d’un objet graphique (par exemple, un fichier).

Champ d’image

Un champ de définition de document contenant une image. Précision Une caractéristique permettant à l’utilisateur d’évaluer la qualité de la classification automatique. Elle est calculée en divisant le nombre de documents de classe A correctement identifiés par le nombre total de documents identifiés comme appartenant à la classe A, qu’ils le soient correctement ou non.

Préreconnaissance

Reconnaissance intégrale du texte des images de document afin de faciliter la détection des champs à l’aide d’une définition de document.

Débit de traitement

Le nombre moyen de pages, de documents ou de lots traités sur une période donnée.

(Distribué) Étape de traitement

(Distribué) Étape d’un flux de travail au cours de laquelle certaines actions sont effectuées sur un document ou un lot (automatiquement ou par un Opérateur). (Administrateur, Développeur, Distribué) Voir Étapes de traitement et files d’attente.

Caractère interdit

La définition de tels caractères peut considérablement améliorer la vitesse et la qualité de la reconnaissance. Par exemple, lors de la reconnaissance de textes composés uniquement de lettres majuscules, indiquez toutes les lettres minuscules comme caractères interdits.

Projet

Un projet est un environnement unique qui regroupe les lots de documents et les paramètres nécessaires à leur traitement, tels que les définitions de document, les profils d’importation, etc. (Administrateur) Voir Création d’un projet.

(Distributed) Q

(Distributed) File d’attente

(Distributed) Documents regroupés en tâches et/ou en lots, en attente d’être traités à une étape de traitement donnée. (Administrator, Developer, Distributed) Voir Étapes de traitement et files d’attente.

R

Formulaire tramé

Formulaire dans lequel les champs d’information sont représentés par des rectangles blancs sur un fond gris constitué de lignes tramées ou par des rectangles délimités par des lignes tramées.

Ligne raster

Une ligne composée de points espacés régulièrement. Rappel Une mesure qui permet à l’utilisateur d’évaluer la qualité de la classification automatique. Elle est calculée en divisant le nombre de documents de classe A correctement identifiés par le nombre total de documents de classe A.

Reconnaissance

Processus de mise en correspondance entre des éléments d’image et des caractères spécifiques.

Langue de reconnaissance

Langue utilisée par ABBYY FlexiCapture pour la reconnaissance de texte. Classes de référence Une classe de référence est une classe attribuée à un document par un expert lors d’une classification manuelle. Une section de document, ainsi qu’une variante de document, peuvent constituer une classe de référence.

Disposition de référence

Mise en page créée par l’utilisateur et servant de référence pour les mises en page générées automatiquement. Cette comparaison permet d’évaluer dans quelle mesure le programme détecte correctement les régions de champ.

(Administrateur) Expression régulière

(Administrateur) Description de la structure d’un mot ou de toute valeur saisie à l’aide d’un langage spécial. Le programme vous permet de spécifier non seulement le jeu de caractères autorisés, mais aussi la structure du contenu d’un champ. Vous pouvez décrire cette structure à l’aide d’une expression régulière lors de la définition de contraintes pour un champ Text ou de la création d’un type de données personnalisé. Voir Alphabet utilisé dans les expressions régulières.

Résolution

Paramètre Image. La résolution se mesure en points par pouce (dpi). Classes de résultat Une classe de résultat est une classe attribuée à un document lors d’une classification automatique.

Validation des règles

Vérification automatique des données reconnues au regard de règles prédéfinies. Voir Validation des règles.

Règles

Certaines conditions appliquées aux données des champs et vérifiées automatiquement par le programme. (Administrateur, Vérification) Voir Validation des règles.

S

Numérisation

Processus consistant à obtenir une image électronique d’un formulaire papier à l’aide d’un scanner. Segment Fragment de texte constitué d’un ou de plusieurs paragraphes contenant des données à extraire. Un segment peut également être un champ à extraire (par exemple, les conditions de résiliation d’un contrat). Segmentation Processus d’identification des segments. La segmentation précède l’extraction d’informations et s’avère utile pour les documents volumineux, car elle limite la recherche d’entités à des fragments de texte spécifiques.

Section

Une partie logiquement distincte d’un document contenant un ensemble de champs extractibles. Les sections sont utilisées à diverses fins au cours du processus de reconnaissance, par exemple pour assembler des documents à partir de pages. Elles peuvent comprendre une seule page ou plusieurs pages, et être fixes ou flexibles. (Administrator) Voir Création de définitions de document pour les documents multipages.

Document semi-structuré

Document contenant un ensemble de champs d’information dont la présentation, le nombre et la disposition peuvent varier considérablement d’un exemplaire du document à l’autre. Voir Quels types de documents peuvent être traités avec ABBYY FlexiCapture.

Separator

Un élément de formulaire lisible par machine qui représente une ligne verticale ou horizontale.

Champ de service

Champ qui n’a pas de région sur l’image du document. Les valeurs des champs de service sont déterminées automatiquement à partir des données de la source spécifiée dans leurs propriétés. (Administrateur) Voir Champs de service.

Ensemble de caractères autorisés

Cet ensemble est déterminé par le type de données. En d’autres termes, le type de données associé à un champ détermine l’ensemble de caractères utilisé lors de la reconnaissance.Outre la sélection des caractères inclus dans cet ensemble, vous pouvez configurer des paramètres supplémentaires pour le restreindre. Par exemple, vous pouvez spécifier :
  • Les caractères dont vous savez qu’ils n’apparaîtront pas lors de la reconnaissance d’un champ donné : caractères interdits (par exemple, vous pouvez indiquer toutes les lettres minuscules comme interdites pour un champ dans lequel seuls des caractères majuscules peuvent apparaître).
  • Les caractères pouvant apparaître à l’intérieur des mots sans affecter leur vérification : caractères ignorés (par exemple, les traits d’union, les accents, etc.).

Texte simple

Type de marquage du texte dans lequel le texte est inséré dans un bloc sans délimiteur.

Saisie de données en flux unique

Extraction automatisée de données à partir de documents analogiques (imprimés) et numériques (images numérisées).

Entrée de documents en flux unique

Conversion automatisée de documents papier au format électronique.

SLA (accord de niveau de service)

Accord régissant la fourniture de services informatiques. Dans ABBYY FlexiCapture 12, un accord de niveau de service définit les délais de traitement des lots.

Éléments statiques

Éléments non reconnaissables destinés à la mise en correspondance et à l’identification de la définition de document. Ces éléments sont : repères, texte de repère, Separator, Barcode de repère.

Section de synthèse

La section de synthèse est une section de définition de document qui affiche tous les principaux champs d’un jeu de documents. Elle permet aux opérateurs de relire beaucoup plus facilement les documents d’un jeu, car ils peuvent voir en un seul endroit toutes les erreurs et les données à faible niveau de confiance, et n’ouvrir que les documents qui doivent être relus au lieu d’ouvrir chaque document.

T

Tableau

Données organisées dans une grille bidimensionnelle qui n’est pas nécessairement visible. Le programme traite des tableaux composés de colonnes contenant des données du même type et de lignes qui se répètent.

Champ de tableau

Un champ de définition de document contenant un tableau. Il s’agit d’un champ composite dans lequel chaque colonne du tableau représente un jeu de champs du même type : Text, coches, code-barres ou images.

Tâche (distribuée)

(Distribuée) Ensemble de documents provenant du même lot et traités ensemble. Selon les paramètres du projet et l’étape de traitement, une tâche peut contenir un nombre variable de documents. Si une étape de traitement exige qu’un lot soit traité dans son intégralité, le lot entier est inclus dans la tâche. Lorsque les tâches de vérification sont créées automatiquement, chaque tâche contient 10 documents (si un lot contient moins de 10 documents non vérifiés, ils sont tous traités dans une seule tâche).

Tenant

Une instance isolée d’ABBYY FlexiCapture qui peut être utilisée indépendamment des autres utilisateurs.

Lots de documents de test

Lots de documents conçus pour tester et configurer les définitions de document. Des copies locales des lots de documents servent à traiter les lots de test. (Administrateur) Voir Lots de documents.

Champ Text

Un élément de formulaire lisible par machine, conçu pour permettre la saisie de texte lors du remplissage d’un formulaire.

Marquage du champ Text

Élément graphique délimitant un champ Text : cadre, peigne, ligne.

Marquage de texte

Définition d’une région de page destinée à la saisie de texte. (Administrateur) Voir des exemples de formatage du texte dans la rubrique Champ de saisie.

Orientation du texte

Orientation du texte dans un champ par rapport à la page.

Reconnaissance de texte (OCR, ICR)

Conversion d’une image en texte.

Exemple de texte

Un fichier contenant des exemples de tous les caractères de l’alphabet.

Entraînement [définition de document]

Une fonctionnalité de FCFORINVOICES qui permet aux utilisateurs d’entraîner le programme à capturer des données à partir de certains types de factures. L’entraînement améliore la qualité de la capture de données et peut être effectué soit lors de la configuration du programme, soit pendant le traitement des factures.

Lots d’entraînement

Lot de documents utilisé pour entraîner et tester une définition de document pour une variante de document spécifique. L’entraînement d’une définition de document sur un lot d’entraînement crée une variante de FlexiLayout. Voir aussi lot de documents, variante de document, variante de FlexiLayout.

Machine à écrire

Type de texte reconnaissable correspondant à un texte imprimé à la machine à écrire.

U

Texte souligné

Dictionnaire utilisateur

Dictionnaire auxiliaire créé par l’utilisateur, il contient des mots qui ne figurent pas dans les dictionnaires intégrés. Les dictionnaires intégrés peuvent être complétés par un dictionnaire utilisateur afin d’améliorer la qualité de la capture de données. En général, un dictionnaire utilisateur contient des termes spécialisés, des abréviations, des noms d’entreprise, etc.

Région non reconnaissable

Une région de l’image exclue de la reconnaissance. Une région non reconnaissable est nécessaire pour exclure une zone contenant un texte explicatif ou une image qui complique la reconnaissance des champs. (Administrateur) Voir Exclure une région de la reconnaissance.

Document non structuré

Document contenant des informations présentées sous une forme libre. Les contrats, les lettres, les commandes et les graphiques en sont des exemples. (Administrateur) Voir Création de définitions de document pour les documents non structurés et semi-structurés.

V

Fournisseur

Une personne morale ou physique qui vend des biens ou des services. Les fournisseurs émettent des factures pour leurs biens et services. Les données des factures peuvent être capturées à l’aide de FCFORINVOICES.

Vérification

La vérification consiste à s’assurer que les données ont bien été reconnues, que les pages ont été correctement assemblées en documents et que les règles n’ont signalé aucune erreur. (Standalone) La vérification s’effectue dans l’Operator Station. (Distributed) La vérification s’effectue dans la Data Verification Station (où la précision de la reconnaissance est vérifiée) et dans la Verification Station (où tous les types de contrôles peuvent être effectués). (Administrator, Verification) Voir Vérification.

W

Lots de travail

Lots de documents destinés à la saisie des données. Seules les Définitions de document publiées sont utilisées pour le traitement des lots de travail. (Administrateur) Voir Lots de documents.

Style d’écriture

Cette option permet de configurer le style d’écriture des caractères écrits en lettres moulées dans les formulaires. Le choix d’un style d’écriture dépend de la zone géographique où les formulaires sont traités (Russie, Allemagne, République tchèque, USA, etc.).

X

XFD

XML Form Definition (*.xfd) est un format de fichier spécial pour les formulaires conçus avec ABBYY FormDesigner. Un fichier au format XML Form Definition est utilisé pour créer des définitions de document dans ABBYY FlexiCapture.