Formulaires structurés fixes ;
Formulaires structurés fixes ;
Les formulaires structurés sont des documents contenant un ensemble de champs d’information repérés dont la mise en forme, le nombre et la disposition ne changent pas d’une occurrence du document à l’autre. Ces documents sont appelés formulaires fixes. Par exemple, la plupart des questionnaires et des formulaires de demande sont des formulaires fixes. Ces formulaires sont généralement diffusés sous forme de formulaires vierges et remplis à la main.Pour identifier un formulaire fixe dans un flux de documents et en extraire les données, vous devez créer une mise en page fixe unique qui indiquera au programme l’emplacement des champs contenant les données à extraire.Les formulaires fixes créés pour répondre aux exigences de la saisie automatique peuvent être traités de la façon la plus efficace. Ces formulaires sont appelés formulaires lisibles par machine. Pour en savoir plus sur les exigences applicables à ces formulaires et sur les méthodes de création, consultez la section Création de formulaires lisibles par machine.Le programme inclut un outil pratique pour concevoir des formulaires lisibles par machine : ABBYY FormDesigner (fourni avec ABBYY FlexiCapture). Vous pouvez en apprendre davantage sur la conception de formulaires à l’aide d’ABBYY FormDesigner dans le Guide de l’utilisateur et les rubriques d’aide.Les étapes de base de la création d’une Définition de document sont décrites spécifiquement pour les documents structurés.Remarque : Les formulaires fixes reçus par fax peuvent être déformés : leur taille et la position relative de leurs champs peuvent être modifiées. C’est pourquoi nous recommandons d’utiliser un FlexiLayout afin d’améliorer la qualité de la reconnaissance lors du traitement de tels formulaires.
Formulaires et documents flexibles semi-structurés ;
Formulaires et documents flexibles semi-structurés ;
Il s’agit de documents contenant un ensemble de champs d’information dont la conception, le nombre et la disposition peuvent varier considérablement d’une occurrence du document à l’autre. Ces documents sont appelés flexibles. Par exemple, les factures sont des documents semi-structurés, car elles varient souvent à la fois par le nombre de postes qu’elles comportent et par leur mise en forme, du fait qu’elles proviennent de différentes entreprises. Toutes les factures comportent un numéro de facture et un montant à payer, mais ceux-ci se trouvent à des endroits différents.Pour identifier des formulaires flexibles et en extraire les données, ABBYY FlexiCapture utilise une mise en page flexible (FlexiLayout). Une mise en page flexible est créée à l’aide d’un module spécial appelé ABBYY FlexiLayout Studio. Des informations détaillées sur ce module sont disponibles dans le Guide de l’utilisateur et les rubriques d’aide.Le traitement des documents semi-structurés diffère de celui des formulaires fixes uniquement à l’étape de création et de chargement d’une mise en page. Pour plus de détails, consultez Création d’une Définition de document pour le traitement de documents semi-structurés.
Documents non structurés à présentation libre.
Documents non structurés à présentation libre.
ABBYY FlexiCapture peut être utilisé pour traiter des documents non structurés contenant des informations présentées librement, par exemple des contrats, des lettres, des commandes et des graphiques. Le programme peut identifier automatiquement les documents non structurés comme annexes à des formulaires fixes ou flexibles, ou les identifier à l’aide d’une mise en page flexible, puis les exporter sous forme de fichiers PDF interrogeablesfichiers PDF interrogeables ou de fichiers graphiques. Vous pouvez extraire des champs d’index de documents non structurés, soit automatiquement à l’aide d’une mise en page flexible, soit par saisie manuelle.Le NLP peut être utilisé pour traiter des documents non structurés. Cette technologie s’appuie sur des modèles NLP pour extraire des informations du texte.Un scénario typique de traitement des documents non structurés se présente lorsqu’une archive papier doit être convertie au format électronique et qu’il est nécessaire d’extraire deux ou trois champs d’index afin de permettre une recherche rapide basée sur les attributs.Pour plus de détails, consultez Création de Définitions de document pour les documents non structurés et semi-structurés.
