Passer au contenu principal
FCFORINVOICES vous permet d’améliorer la qualité de la reconnaissance pendant le traitement des documents. Si le programme ne parvient pas à détecter correctement l’emplacement d’un champ sur une image de document, vous pouvez indiquer son emplacement exact, et le programme l’utilisera lors de la reconnaissance d’autres documents. L’entraînement n’est disponible que si ABBYY FlexiCapture peut identifier l’entreprise de manière fiable en retrouvant l’enregistrement correspondant dans une base de données. Si vous ne disposez pas de bases de données, mais souhaitez malgré tout utiliser l’entraînement des champs, vous pouvez enrichir les informations sur les entreprises en ajoutant des enregistrements à vos jeux de données pendant la capture des documents. Pour plus d’informations, voir Recherche de fournisseurs et d’unités commerciales dans la base de données. Cet article explique comment entraîner FCFORINVOICES à l’aide de la version de Verification Station installée localement et présente certains points liés à l’entraînement que les opérateurs doivent connaître. Pour entraîner le programme pendant le traitement des documents, procédez comme suit :
  1. Constituez un lot de documents (par exemple, des factures traitées au cours du mois précédent) et commencez à les envoyer au programme. Voir Comment capturer des factures.
  2. Une fois les documents envoyés au programme, ils seront reconnus automatiquement (cela ne se produira que si l’option Recognize added images automatically est activée dans l’onglet Traitement des documents de la boîte de dialogue Options ; pour ouvrir cette boîte de dialogue, cliquez sur Tools → Options…) et les données seront vérifiées à l’aide des règles de validation.
  3. Si l’état d’un document reconnu n’est pas Valid ou si vous avez d’autres raisons de penser que le programme n’a pas détecté certains champs, ouvrez le document dans l’éditeur de documents.
  4. Vérifiez le formulaire du document. Le groupe de champs Vendor/Issuer doit être correctement renseigné.
L’entraînement s’effectue indépendamment pour chaque variante de document. Les documents provenant de la même entreprise sont considérés comme appartenant à la même variante de document. Si le programme ne parvient pas à identifier l’entreprise émettrice, sélectionnez-la dans votre base de données d’entreprises ou saisissez-la manuellement à partir de l’image du document, puis enregistrez-la dans votre base de données d’entreprises en cliquant sur Save. Selon les paramètres de votre projet, vous devrez peut-être aussi préciser l’ID unique de l’entreprise émettrice pour utiliser son document pour l’entraînement. Pour ce faire, saisissez l’ID unique de l’entreprise dans le champ VATID (ce champ peut porter un autre nom dans certains projets selon le pays). Le VATID est un numéro d’identification unique attribué aux entreprises à des fins fiscales. Si des documents provenant de la même entreprise présentent des mises en page très différentes, vous devez utiliser la fonction de clustering. Pour plus de détails, voir Entraînement avec clustering.
  1. L’entraînement ne réussira que si les régions de tous les champs sont correctement identifiées. Vous devez donc vous assurer que les régions correspondent aux emplacements réels de leurs champs respectifs sur l’image. Pour plus d’informations sur la façon de baliser les lignes d’articles sur un document, voir Entraînement des lignes d’articles. Pour ce faire, dans la Fenêtre Image de l’éditeur de documents, ajustez les régions ou dessinez des régions pour les champs que le programme n’a pas réussi à détecter. Le programme analysera ensuite le document. Si le balisage de la région a été modifié et que l’entraînement pour les documents de cette entreprise n’est pas interdit, le document sera ajouté au lot.
  • Placez le pointeur de la souris dans le champ voulu du formulaire de données, repérez la région correspondante sur l’image (elle sera surlignée en bleu), puis cliquez dessus (ou dessinez un rectangle avec la souris).
  • Placez le pointeur de la souris sur la région voulue de l’image (elle sera surlignée en bleu), cliquez dessus (ou dessinez la région avec la souris), puis sélectionnez le champ correspondant dans la liste déroulante qui s’ouvre.
  • Ajustez la position d’une région sur l’image en déplaçant ses limites avec la souris.
  • Supprimez de l’image une région mal positionnée : placez le pointeur de la souris sur son rectangle et, lorsqu’une croix rouge apparaît dans l’angle supérieur droit, cliquez sur cette croix. Le balisage de la région sera supprimé. Créez ensuite la région correcte pour ce champ.
  • Dans le formulaire de données, commencez à saisir une valeur dans un champ. Une liste déroulante s’affichera avec les mots capturés depuis l’image qui ressemblent au mot que vous saisissez. Sélectionnez le mot correct dans la liste : sa position sur l’image deviendra alors la région du champ.
Le programme sera entraîné sur tous les champs du document, et pas seulement sur ceux pour lesquels vous avez dessiné ou ajusté des régions.
  1. Ouvrez le document suivant et répétez les étapes 4 et 5.
  2. Pour lancer le processus d’entraînement, un lot d’entraînement doit contenir au moins un document. Si le clustering est utilisé, un FlexiLayout distinct sera créé pour chaque cluster ; sinon, un FlexiLayout sera créé pour chaque entreprise (voir Entraînement avec clustering pour plus d’informations).
  3. Le programme testera la variante de FlexiLayout entraînée en l’appliquant à tous les documents du lot d’entraînement et en comparant les résultats au balisage ajusté obtenu à l’étape 5. Si le programme détermine que le FlexiLayout entraîné donne de meilleurs résultats que sa version précédente, il sera utilisé la prochaine fois que vous reconnaîtrez des documents appartenant à cette variante de document.
Si le programme détermine que la variante de FlexiLayout entraînée donne de moins bons résultats que sa version précédente, vous devrez poursuivre son entraînement sur des documents de l’entreprise concernée (étapes 4 et 5). Le processus d’entraînement est terminé lorsque la variante de FlexiLayout entraînée peut identifier correctement toutes les régions de champ. Entraînement lors de la configuration d’ABBYY FlexiCapture for Invoices