Activité Deep Learning pour les documents semi-structurés

L’activité Deep Learning pour les documents semi-structurés est conçue pour créer des compétences cognitives prêtes pour la production afin d’extraire des champs à partir de documents semi-structurés à l’aide de réseaux neuronaux.

Cette activité ne peut pas extraire de structures complexes (par exemple, des tableaux imbriqués, c’est-à-dire des structures répétées à l’intérieur d’autres tableaux) ni de champs d’un type autre que Text. Pour extraire ce type de structures, utilisez l’activité Extraction Rules.

Cas d’utilisation

Ajoutez cette activité à votre flux de traitement des documents lorsque :

votre compétence sera utilisée pour traiter plusieurs variantes d’un même type de document.
vous prévoyez de traiter des variantes de document sur lesquelles votre compétence n’a pas encore été entraînée. Par exemple, vous pouvez avoir une Compétence de document avec une activité Fast Learning entraînée pour extraire des champs de contrats de prêt (avec différentes structures de champs) provenant de plusieurs banques. Si vous décidez d’utiliser cette compétence existante pour traiter des contrats de prêt d’une nouvelle banque que la compétence ne connaît pas encore, la qualité d’extraction risque d’être insuffisante. Pour améliorer la qualité d’extraction, vous pouvez utiliser une activité Deep Learning au lieu d’une activité Fast Learning.

Fonctionnement

Deep Learning combine des réseaux neuronaux convolutifs (CNN), des réseaux neuronaux récurrents (RNN) et des tokens de traitement du langage naturel (NLP). Grâce à cette combinaison, Deep Learning comprend les motifs visuels, la structure des documents, le contenu des champs et les libellés qui les entourent. Il nécessite un grand nombre de documents pour l’entraînement, mais il se généralise à de nouvelles mises en page de documents qu’il n’a pas encore rencontrées, offrant ainsi une véritable approche d’extraction sans modèle, seule capable de traiter des documents pour lesquels aucun ensemble exhaustif de mises en page n’est disponible au stade de l’entraînement.

Exigences d’entraînement

Pour obtenir les meilleurs résultats, il est essentiel d’annoter correctement autant de documents que possible. Le nombre d’exemples de documents utilisés pour l’entraînement a une incidence importante sur la qualité de l’extraction des champs. Le nombre recommandé d’exemples de documents est le suivant :

Pour les documents à forte variabilité : au moins 200 à 300 exemples de documents (2 à 3 exemples de documents par variante) sont requis.
Pour les documents à faible variabilité : un minimum de 10 exemples de documents est requis (2 à 3 exemples de documents par variante).

Le minimum requis est de 10, mais il est recommandé de disposer de plus de 500 documents annotés, en veillant à ce que votre jeu d’entraînement contienne un nombre à peu près équivalent de toutes les variantes de documents que vous prévoyez de traiter (idéalement, au moins quelques exemples de chaque variante). Il n’est pas nécessaire de fournir toutes les variantes possibles, mais la technologie doit voir un nombre suffisant de documents variés pour en dégager des modèles et généraliser à des variantes qu’elle n’a pas encore rencontrées. Par exemple, dans le cas des factures, la technologie devrait bien généraliser à de nouveaux fournisseurs lorsque le jeu d’entraînement comprend de 500 à 1 000 fournisseurs différents, avec deux à trois exemples de documents pour chacun. Bien que le Deep Learning tende à généraliser, il est utile d’inclure dans le jeu d’entraînement les variantes de documents les plus courantes, par exemple celles des fournisseurs qui émettent le plus grand nombre de factures.

Caractéristiques de l’entraînement

Contrairement à l’activité Fast Learning, qui est entraînée sur un plus petit nombre de documents et conçue pour des ensembles de documents plus simples, l’entraînement de l’activité Deep Learning prend beaucoup plus de temps. L’entraînement du réseau neuronal est un processus itératif. Chaque itération est appelée une epoch. Au début d’une epoch, l’ensemble de documents est divisé en un sous-ensemble d’entraînement et un sous-ensemble de validation. Au cours d’une epoch, tous les documents du sous-ensemble d’entraînement sont traités par un algorithme d’entraînement. Ensuite, les performances du réseau neuronal sont évaluées à l’aide du sous-ensemble de validation, et les métriques de chaque champ ainsi que de l’ensemble des documents sont mises à jour. Pour plus d’informations, consultez Configuration d’une activité Deep Learning.

​Cas d’utilisation

​Fonctionnement

​Exigences d’entraînement

​Caractéristiques de l’entraînement

Cas d’utilisation

Fonctionnement

Exigences d’entraînement

Caractéristiques de l’entraînement