Passer au contenu principal
ABBYY FlexiCapture peut être utilisé pour traiter des documents non structurés contenant des informations présentées sous une forme libre, par exemple des contrats, des lettres, des commandes ou des annexes. Les documents non structurés dont le texte ou les images sont séparés par des feuilles blanches ou des pages avec des code-barres sont traités et exportés au format PDF interrogeable ou sous forme de fichiers graphiques. Le traitement de ces documents consiste généralement à les convertir au format électronique, puis à lancer une recherche selon les valeurs des champs principaux. Si possible, la recherche des champs principaux (comme un numéro de contrat) dans ces documents s’effectue à l’aide d’un FlexiLayout créé avec ABBYY FlexiLayout Studio. Voir Création d’une Document Definition pour le traitement de documents semi-structurés. NLP peut être utilisé pour traiter des documents non structurés. Cette technologie s’appuie sur des modèles NLP pour extraire des informations du texte. Si la recherche automatique des champs principaux est impossible, l’opérateur peut saisir leurs valeurs manuellement. Pour ce faire, créez une Document Definition avec un champ (ou plusieurs, si nécessaire), puis activez l’option Don’t recognize (key from image field - will be entered manually) dans les propriétés de reconnaissance de ce champ. Lors de l’étape de vérification, l’opérateur pourra alors saisir manuellement les valeurs des champs principaux. Vous devez configurer l’export pour activer le stockage des données : vous pouvez exporter les valeurs des champs principaux vers un fichier ou une base de données, et enregistrer les images des documents dans un format approprié. Vous pouvez enregistrer les images des documents dans des fichiers graphiques ou au format PDF interrogeable. Soyez particulièrement attentif lors de l’assemblage des pages en documents : avec des documents non structurés, il peut être difficile de déterminer à quel document appartient une page donnée. Pour automatiser l’assemblage des documents non structurés, nous vous recommandons de séparer les documents par des feuilles blanches ou des pages avec des code-barres. Lors de l’ajout d’images à un batch (par numérisation, ajout à partir d’un fichier ou création d’un profil d’importation), vous devez ensuite activer l’option For images separated by et sélectionner la valeur blank pages ou pages with barcode dans la liste déroulante, selon le type de pages à utiliser comme séparateurs. Les pages sont alors assemblées automatiquement en documents : les pages sont ajoutées au document en cours jusqu’à la page de séparation suivante. Pour plus de détails, voir Ajout d’images de page.