L’activité Extraction Rules permet de définir des règles pour détecter des champs sur des documents semi-structurés et de vérifier leur fonctionnement sur des documents réels. Elle s’applique généralement lorsque l’emplacement d’un champ peut varier d’un document à l’autre, ce qui complique l’extraction des données, et lorsque vous pouvez fournir des informations supplémentaires pour détecter ces champs, par exemple la position des champs par rapport à d’autres objets dans le document ou des expressions régulières définissant les conditions de recherche d’un objet. Par exemple, vous pouvez spécifier que le champ Numéro de facture peut se trouver soit à droite de l’image, soit directement sous les mots « Order number », « Order # » ou d’autres mots-clés similaires. Nous recommandons également d’ajouter une activité Fast Learning au flux de traitement et d’activer Online Learning pour collecter des documents en production, afin de reconstruire automatiquement la compétence ultérieurement via l’apprentissage automatique.”Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Cas d’utilisation
- Lorsque votre lot de documents n’est pas suffisamment homogène pour utiliser une activité Fast Learning pour extraire des données, que vous n’avez pas assez de documents pour entraîner une activité Deep Learning et que les documents ont une structure connue que vous pouvez formaliser.
- Lorsque vous souhaitez un contrôle plus fin sur l’IA, en analysant les résultats de prédiction des activités Deep Learning et Fast Learning avant de transférer ces valeurs dans des champs du document. Par exemple, si vous prévoyez d’extraire un nombre situé près d’un mot-clé, vous pouvez exclure les hypothèses qui ne correspondent pas à un nombre et celles qui ne sont pas situées à proximité du mot-clé. De manière générale, si un post-traitement par règles est nécessaire, cela indique souvent que l’ensemble d’entraînement pour les activités Deep Learning et Fast Learning devrait être élargi, car les technologies d’apprentissage automatique peuvent « sentir » et apprendre le type de données d’un champ, son emplacement typique et son environnement.
- Lorsque vous disposez d’un fichier FlexiLayout provenant d’ABBYY FlexiLayout Studio que vous souhaitez réutiliser. Pour plus d’informations, voir Importing FlexiLayouts from ABBYY FlexiLayout Studio.
- Lorsque vos documents contiennent des structures complexes (par ex. des tableaux imbriqués, c’est‑à‑dire des structures répétées à l’intérieur d’autres tableaux) qui ne peuvent pas être extraites par d’autres activités destinées aux documents semi-structurés.
