Passer au contenu principal
Les constantes de l’énumération SourceContentReuseModeEnum décrivent les modes disponibles pour la réutilisation du contenu des fichiers PDF source et des documents Office.
Les documents Office ne sont pas pris en charge sur macOS.
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

Éléments

NomDescription
CRM_AutoABBYY FineReader Engine sélectionne automatiquement le mode approprié pour traiter les fichiers PDF ou les documents Office. Si le résultat obtenu avec ce mode ne répond pas aux attentes, ou si le type de document et le mode de réutilisation correspondant sont connus à l’avance, vous pouvez sélectionner le mode manuellement.
CRM_ContentAndPicturesABBYY FineReader Engine sélectionne automatiquement le mode d’utilisation du texte et des images pour les différentes parties de chaque page du fichier PDF source ou du document Office. Cela signifie que le contenu du fichier source et les images rasterisées sont tous deux utilisés pour le traitement. Si le texte du fichier source est jugé de bonne qualité, il est utilisé ; sinon, le texte issu de la rasterisation de cette partie est utilisé.
CRM_ContentOnlyABBYY FineReader Engine utilise à la fois le texte et les images du fichier PDF source ou du document Office. <Warning> L’utilisation du contenu textuel du fichier source accélère le traitement, mais si vous choisissez ce mode alors qu’aucun calque de texte n’est présent, une erreur se produira. </Warning> Nous recommandons d’utiliser ce mode pour les fichiers sources contenant du texte visible, encodé en Unicode, ASCII ou selon une autre norme d’encodage des caractères, avec des paramètres de police et de taille corrects. Si votre fichier source est d’un autre type, utilisez CRM_Auto, CRM_ContentAndPictures ou CRM_DoNotReuse. <Warning> Ce mode n’est pas disponible lors du traitement en mémoire de documents en parallèle (MultiProcessingParams::MultiProcessingMode = MPM_Parallel). </Warning>
CRM_DoNotReuseABBYY FineReader Engine rasterise les pages du fichier PDF source ou du document Office et les traite. Le contenu du fichier source est ignoré.
Utilisez la méthode IsPdfWithTextualContent pour déterminer si le fichier contient un calque de texte.

Remarques

La reconnaissance du contenu du document s’effectue en parallèle avec le processus de détermination du type de modèle de mot (voir IWord::ModelType). Ce processus dépend du mode de réutilisation du contenu sélectionné :
  • CRM_DoNotReuse — le type de modèle de mot est toujours déterminé.
  • CRM_Auto, CRM_ContentAndPictures — la détermination du type de modèle de mot dépend de l’utilisation de la reconnaissance du contenu du document.
  • CRM_ContentOnly — le type de modèle de mot n’est jamais déterminé.

Utilisé dans

IObjectsExtractionParams::SourceContentReuseMode