Passer au contenu principal
Un document contient des champs à remplir à la main ou à l’aide d’un dispositif d’impression. Les documents peuvent comporter une ou plusieurs pages. On peut distinguer les documents « fixes » et les documents « semi-structurés ». Dans le cas des documents « fixes », les champs identiques se trouvent exactement au même endroit sur tous les documents d’un lot. Les documents fixes peuvent être traités à l’aide d’applications de traitement documentaire qui lisent les informations des champs de données et les exportent vers des bases de données, des systèmes de gestion documentaire ou des applications d’archivage. Pour ces documents, la capture de données s’effectue au moyen d’une Document Definition, qui décrit l’emplacement des champs et le type d’informations qu’ils peuvent contenir. Une seule et même Document Definition est utilisée pour capturer les données de tous les documents d’un lot donné. Elle indique à l’application de traitement documentaire où rechercher des données spécifiques dans un document et comment vérifier qu’elles ont été correctement capturées. Dans le cas des documents « semi-structurés », l’emplacement des champs de données identiques varie d’un document à l’autre. De plus, tous les champs ne sont pas nécessairement présents sur tous les documents d’un lot (par exemple, certains documents peuvent comporter un champ de signature, tandis que d’autres non). Les différents documents de paiement constituent un bon exemple de document semi-structuré. Les lettres, les formulaires d’inscription et les documents juridiques constituent un autre bon exemple de documents semi-structurés. Les documents d’un même type présentent des structures similaires, mais leurs champs peuvent néanmoins différer. Par exemple, les lettres comportent le nom et l’adresse de l’expéditeur en haut de la page, tandis que les documents juridiques comportent le nom des parties, leurs coordonnées, la date d’effet, etc. Comme l’emplacement exact des champs dans les documents semi-structurés n’est pas connu à l’avance, il n’est pas possible de capturer les données de tels documents au moyen d’une Document Definition. Cela signifie que les systèmes traditionnels de capture de données ne peuvent pas extraire de données de ce type de documents. ABBYY FlexiLayout Studio vous permet de décrire formellement des documents non structurés et de fournir au programme un algorithme de recherche, afin qu’il puisse localiser les champs de données et en extraire les informations. Une description formelle repose sur les relations entre les champs d’un document non structuré et sur la nature des données qu’ils contiennent. Les descriptions créées peuvent être testées sur des images de documents afin de vérifier que les informations peuvent être extraites de manière fiable. Les descriptions formalisées créées à l’aide d’ABBYY FlexiLayout Studio sont appelées FlexiLayouts. Pour commencer à capturer des données depuis des documents non structurés à l’aide d’un FlexiLayout, vous devez l’exporter vers une application de capture de données telle qu’ABBYY FlexiCapture. La technologie ABBYY FlexiCapture offre un large éventail de fonctionnalités de capture de données, ce qui vous permet de traiter pratiquement tout type de document.