Une Document Definition sans extraction automatique de données peut être utile dans les cas suivants :
- Lors du traitement de documents qui doivent toujours être présents dans un jeu de documents, mais à partir desquels aucune donnée ne doit ou ne peut être extraite. Il peut s’agir, par exemple, de déclarations manuscrites, d’avis, etc.
- Lorsque vous devez classer et trier des documents sans en extraire les données.
Dans les cas décrits ci-dessus, vous pouvez créer une Document Definition qui fera en sorte que les documents correspondants ignorent l’étape d’analyse. Cela réduira la charge de travail de l’opérateur de vérification et accélérera le traitement.
Pour créer une Document Definition sans extraction automatique de champs, les conditions suivantes doivent être remplies :
- Vos documents ne doivent comporter aucun identifiant d’ancrage (sinon, ils seront traités comme des formulaires fixes).
- Aucun FlexiLayout ne doit être chargé.
- L’entraînement des champs doit être désactivé.
Dans le Document Definition Wizard, sélectionnez Documents that do not require automatic data extraction. Une Document Definition ne comportant qu’une seule section sera alors créée, et tous les documents ne nécessitant pas d’extraction automatique de données ignoreront l’étape d’analyse.
En règle générale, ce type de documents ne nécessite pas d’OCR. Si vous prévoyez d’utiliser l’indexation manuelle ou si vous souhaitez que vos opérateurs de vérification puissent saisir du texte en cliquant dessus dans l’image, vous devez vous assurer que vos documents disposent d’un calque de texte. Pour ajouter un calque de texte à vos documents, créez au moins un champ avec l’option Can have region sélectionnée.
Vous pouvez également ajouter un calque de texte à l’étape d’export en sélectionnant l’option Create searchable PDF.
Toute Document Definition peut être modifiée pour empêcher l’extraction automatique de champs. Il vous suffit de supprimer tous les repères et tous les FlexiLayouts, puis de désactiver l’entraînement des champs.