L’activité OCR permet de définir des options générales de préreconnaissance et d’effectuer la reconnaissance en texte intégral. D’autres activités et compétences peuvent réutiliser les résultats de l’activité OCR pour accélérer le traitement. Lors de la reconnaissance d’un document, les activités ou compétences suivantes utiliseront les résultats de l’activité OCR si toutes les conditions suivantes sont remplies :Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- L’ensemble des langues d’une activité ou compétence suivante est identique à celui de l’activité OCR ou inclut les langues de l’activité OCR.
- Les paramètres du type de texte (par exemple, options de reconnaissance Imprimé ou Manuscrit (écriture manuscrite)) d’une activité ou compétence suivante sont identiques à ceux de l’activité OCR.
- L’ensemble des Barcode Types d’une activité ou compétence suivante est identique à celui de l’activité OCR ou inclut les Barcode Types de l’activité OCR. Si aucun type de code-barres n’est activé dans les activités suivantes, les paramètres des Barcode Types de l’activité OCR seront ignorés.
Configurer l’activité OCR
Ajouter l’activité OCR
Ajoutez un bloc d’activité OCR à votre workflow, puis sélectionnez-le en cliquant avec le bouton gauche de la souris.
Ouvrir les paramètres OCR
Dans le volet Actions, cliquez sur OCR Settings. La boîte de dialogue OCR Settings s’ouvre.
Configurer PDF Processing Mode
Dans l’onglet General, sous Image Processing, sélectionnez un PDF Processing Mode pour définir comment Vantage traite les documents PDF dans cette activité :
- Default (recommandé) — Utilise le text layer PDF intégré lorsqu’il est disponible et le complète avec l’OCR si nécessaire.
- Use Text Layer Only — Extrait le texte du text layer PDF intégré ; bascule sur l’OCR si aucun text layer n’est présent.
- Use OCR Only — Ignore tout text layer intégré et effectue une reconnaissance OCR complète.
Sélectionner les langues de reconnaissance
Dans l’onglet Languages :
- Dans la section Allowed Languages, sélectionnez une ou plusieurs langues de reconnaissance des documents. Lors du traitement, la langue du document sera automatiquement choisie parmi les langues spécifiées lors de la configuration. Notez que le nombre de langues sélectionnées peut affecter la vitesse et la qualité de la reconnaissance.
- Si le document contient du texte manuscrit, activez l’option Manuscrit (écriture manuscrite) dans la section Text Appearance. Consultez les langues prises en charge pour la reconnaissance du texte manuscrit.
Activer Barcode Recognition
Dans l’onglet Barcodes, activez les Barcode Types susceptibles d’apparaître dans vos documents. Le nombre de Barcode Types sélectionnés peut affecter la vitesse de reconnaissance.Si vous n’avez pas besoin de reconnaître de code-barres, cliquez sur le bouton affichant le nombre d’options sélectionnées dans l’en-tête du tableau Barcode Types, puis cliquez sur Deselect all.
Compétence OCR
Extraire le texte des images de documents et exporter les résultats dans différents formats.
Configurer une compétence de processus
Créer une compétence de processus à partir d’un workflow prédéfini ou à partir de zéro, puis configurer chaque activité.
Langues de reconnaissance prises en charge
Liste complète des langues OCR prises en charge dans Vantage.
Types de codes-barres pris en charge
Liste de référence de tous les formats de code-barres et de QR Code que Vantage peut reconnaître.
Extract activity
Extraire les valeurs des champs des documents à l’aide d’une Compétence de document.
Classify activity
Identifier les types de documents et acheminer chaque document vers le processus en aval approprié.
