ABBYY FlexiCapture (ou le Système) extrait des données à partir de documents arrivant en flux. C’est pourquoi les performances se mesurent en volumes traités sur une période donnée.
Pour concevoir le Système, définissez les performances cibles à l’aide de mesures de performance.
Le temps de traitement requis est défini par les procédures internes, les accords de niveau de service et les exigences des processus métier de l’entreprise cliente.
Les volumes à traiter se fondent sur les données antérieures et les tendances d’évolution de l’activité, ou sur le plan d’affaires de l’entreprise. Des hausses ponctuelles ou saisonnières des volumes peuvent survenir, par exemple à la suite de campagnes publicitaires réussies ou en fin d’exercice fiscal.
Ces paramètres déterminent la charge de travail du système :
Taille moyenne des lots, en pages
Mode couleur des images : couleur, niveaux de gris, noir et blanc
Pages par jour (c.-à-d. 24 heures), moyenne/pointe
Pages par heure, moyenne/pointe
Taille moyenne des documents, en pages
Nombre d’opérateurs de numérisation
Nombre d’opérateurs de vérification
Durée de stockage des documents
Un lot désigne un ensemble de documents connexes traités ensemble.
Ex. : un client soumet une douzaine de documents à traiter, tous dans une même requête, car les contrôles croisés et la logique métier empêchent leur traitement séparé.
Les images de documents se présentent sous toutes sortes de formes et de tailles, par exemple :
- des copies numérisées en couleur, en niveaux de gris ou en noir et blanc ;
- des photos de différentes résolutions ;
- des pièces jointes à des e-mails – fichiers PDF vectoriels, etc.
Le rendu colorimétrique des images de documents dépend de :
- La capacité à contrôler et à modifier les données d’entrée.
Par exemple : si des clients FlexiCapture sont utilisés pour la numérisation, une entreprise peut définir le même mode de numérisation (rendu colorimétrique) pour tous les documents entrants.
- Les exigences de stockage à long terme.
Par exemple : conformément aux réglementations internes, tous les documents doivent être conservés pendant 5 ans uniquement sous forme d’images en niveaux de gris. Dans ce cas, les clients FlexiCapture peuvent convertir les images couleur en images en niveaux de gris lors de la numérisation.
Bien que les entreprises soient souvent tenues de conserver les documents entrants dans leur format d’origine, elles peuvent estimer les formats auxquels s’attendre et fournir quelques exemples d’images. Le scénario le plus coûteux est celui où toutes les images de documents sont en couleur (coûts de transmission sur le réseau et de stockage des fichiers).
Pages par jour & pages par heure
Les performances moyennes et de pointe sont définies comme les nombres moyens et maximaux de pages couleur, en niveaux de gris ou en noir et blanc traitées sur une période donnée qu’une entreprise juge la plus pertinente (1 heure, 24 heures, etc.).
- Spécifiez des intervalles de temps précis : « 24 heures » est préférable à « 1 jour », qui peut être interprété à tort comme 1 journée de travail, c.-à-d. seulement 8 à 12 heures.
- Choisissez des valeurs qui ont du sens pour vous, afin de voir facilement si le système répond à vos besoins et à vos attentes.
Par ex. : pour un client, un meilleur repère est l’estimation « 1000 pages en 24 heures », et non « 0,01 page par seconde ».
Nous utilisons les pages plutôt que les documents pour estimer le volume de traitement, car la taille des documents varie considérablement. En même temps, il est généralement facile d’estimer le nombre moyen de pages pour des documents d’un même type. Par ex., une facture peut contenir 1 page ou plus de 100 pages, mais elle en comporte généralement 3 en moyenne.
Enfin, nous devons obtenir des valeurs en octets et en bits par seconde, couramment utilisées pour calculer les performances matérielles. Pour cela, nous utilisons les tailles typiques d’une page A4 selon différents modes couleur :
- A4 noir et blanc – 100 KB
- A4 en niveaux de gris – 3 MB
- A4 couleur – 10 MB
Pour une estimation plus précise, un échantillon de documents réels est nécessaire.
En disposant des tailles typiques d’une page selon différents modes couleur, ainsi que des nombres moyens et maximaux de pages par jour ou par heure, vous pouvez estimer le flux d’entrée moyen et de pointe en octets par seconde.
Il s’agit en fait du nombre d’utilisateurs qui accèdent simultanément au système lorsque le traitement des documents est en cours. Il existe 2 types d’utilisateurs :
- Les opérateurs de numérisation numérisent, vérifient et modifient les images de document, puis les transmettent au serveur d’applications.
- Les opérateurs de vérification vérifient et corrigent les données extraites, en téléchargeant les images depuis le serveur d’applications et en lui envoyant les données corrigées.
Durée de stockage des documents
A une incidence importante sur la configuration du Système et les coûts matériels, car des durées de stockage plus longues nécessitent un FileStorage plus volumineux.
La durée de stockage des documents dans le Système est un paramètre important ; elle ne doit pas être confondue avec la durée de stockage des documents au sein de l’organisation.
La durée moyenne de stockage des documents dans le Système correspond souvent au temps de traitement moyen. Parfois, lorsqu’un certain nombre d’étapes de traitement comportant des opérations manuelles entrent en jeu, elle peut atteindre plusieurs semaines.
Cependant, dans certains cas, la durée moyenne de stockage des documents dans le Système correspond en réalité à leur temps de traitement moyen, auquel s’ajoute le temps de stockage des images et des données à l’étape Traité. Cela s’explique par le fait que FlexiCapture considère un document comme traité après son export vers le système ERP de l’entreprise, même si son traitement au sein de l’organisation est toujours en cours, ce qui signifie que ce document peut être renvoyé vers l’une des étapes initiales de traitement dans le Système.
Pour cette raison, les documents ayant le statut Traité (c’est-à-dire les images de document et les données capturées) sont stockés dans FlexiCapture jusqu’à ce que :
- ils aient traversé tous les processus métier ; et
- ils soient placés dans les archives de l’entreprise.
FlexiCapture n’est pas, à proprement parler, un système d’archivage. Une durée de stockage typique d’un document dans le Système est de 2 semaines.