Scénario standard
Scénario standard
Dans le scénario standard, effectuez les étapes suivantes :
- Créez une définition de document.
- Dans les propriétés de la section de la définition de document, sélectionnez Allow field location training.
- Créez les champs nécessaires dans la section. Sélectionnez Can have region dans les propriétés de chaque champ.
- Enregistrez et publiez la définition de document.
- Passez en mode Field Extraction Training Batches et créez un nouveau lot.
- Sélectionnez la définition de document que vous avez créée.
- Sélectionnez la variante Default dans la liste des variantes.
- Chargez les images de document et lancez leur reconnaissance. Nous vous recommandons de charger entre 3 et 50 images pour chaque type de document.
- Ajustez la position des champs.
- Définissez les états suivants pour vos documents :
- Sélectionnez une partie des documents, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For training dans le menu contextuel.
- Sélectionnez les documents restants, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For testing dans le menu contextuel. Remarque : Nous vous recommandons d’utiliser 60 % des documents du lot d’entraînement pour l’entraînement, et les 40 % restants pour les tests.
- Entraînez le programme à extraire les champs :
- (Standalone) Cliquez sur Fields Training → (Standalone) Train
- (Distributed) Cliquez sur Fields Training → (Distributed) Train pour démarrer l’entraînement sur la même machine que celle où le composant Project Setup Station est installé.
- (Distributed) Cliquez avec le bouton droit sur le lot et sélectionnez (Distributed) Send for Training dans le menu contextuel si vous souhaitez que l’entraînement soit effectué sur une Processing Station.
Projets avec plusieurs variantes de document
Projets avec plusieurs variantes de document
Dans le cas de documents dont l’emplacement des champs varie, vous devez créer des variantes et entraîner un classificateur pour les distinguer. Pour en savoir plus sur les documents dont l’emplacement des champs varie et sur les variantes, consultez Emplacements de champ variables sur des documents appartenant au même type.Effectuez les étapes suivantes :
- Créez une définition de document.
- Dans les propriétés de la section de la définition de document, sélectionnez Allow field location training.
- Créez les champs nécessaires dans la section. Dans les propriétés de chaque champ, sélectionnez Can have region.
-
Ajoutez des variantes de section à l’aide de l’une des trois méthodes suivantes :
- Créez les variantes manuellement. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton View… Cliquez ensuite sur le bouton Add… pour ajouter des variantes.
- Chargez les variantes depuis une base de données. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton Set Up… Dans la liste déroulante, sélectionnez Database comme source de données.
- Créez les variantes à l’aide d’un script. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton Set Up… Dans la liste déroulante, sélectionnez Script comme source de données.
- Enregistrez et publiez la définition de document.
-
Entraînez un classificateur sur les variantes que vous venez de créer :
- Passez en mode Open Classifier Training Batches et chargez des images de document dans un nouveau lot.
- Attribuez une classe de référence à chaque document, en utilisant les variantes comme classes distinctes :
- Cliquez sur Set Class… → Add… → Add…
- Sélectionnez Specify variant.
- Sélectionnez une variante dans la liste.
- Entraînez un classificateur en cliquant sur Classification Training → Train.
- Entraînez ABBYY FlexiCapture à détecter les régions de champ pour chaque variante :
- Passez en mode Field Extraction Training Batches.
- Créez un nouveau lot. Sélectionnez votre définition de document, puis la variante à entraîner.
- Chargez des images de document et lancez leur reconnaissance. Nous vous recommandons de charger de 3 à 50 images pour chaque type de document.
- Ajustez la position des champs.
- Définissez les états suivants pour vos documents :
- Sélectionnez certains documents, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For training dans le menu contextuel.
- Sélectionnez les documents restants, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For testing dans le menu contextuel.
- Entraînez le programme à extraire les champs :
- (Standalone) Cliquez sur Fields Training → (Standalone) Train
- (Distributed) Cliquez sur Fields Training → (Distributed) Train pour démarrer l’entraînement sur la même machine que celle où le composant Project Setup Station est installé.
- (Distributed) Cliquez avec le bouton droit sur le lot et sélectionnez (Distributed) Send for Training dans le menu contextuel si vous souhaitez que l’entraînement soit effectué sur une Processing Station.
Nous vous recommandons de configurer l’auto-apprentissage pour l’extraction de champs. Une fois l’auto-apprentissage configuré, le programme apprend automatiquement à extraire les champs pendant que les opérateurs travaillent sur le projet configuré.
(Distributed) Envoi de lots d’entraînement à une Processing Station pour entraînement
(Distributed) Avant d’envoyer un lot d’entraînement à une Processing Station, veuillez vous assurer que :
- (Distributed) Au moins une Processing Station a été ajoutée au Processing Server.
- (Distributed) Le projet a été téléversé vers le serveur.
