Office-Dokumente werden unter macOS nicht unterstützt.
Elemente
| Name | Beschreibung |
|---|---|
| CRM_Auto | ABBYY FineReader Engine wählt automatisch den geeigneten Modus für die Verarbeitung von PDF-Dateien oder Office-Dokumenten aus. Wenn das Ergebnis dieses Modus nicht den Erwartungen entspricht oder der Dokumenttyp und der entsprechende Wiederverwendungsmodus im Voraus bekannt sind, kann der Modus manuell ausgewählt werden. |
| CRM_ContentAndPictures | ABBYY FineReader Engine wählt automatisch den Modus für die Nutzung von Text und Bildern in den einzelnen Bereichen jeder Seite der PDF-Quelldatei oder des Office-Dokuments aus. Das bedeutet, dass sowohl der Inhalt der Quelldatei als auch gerasterte Bilder für die Verarbeitung verwendet werden. Wenn der Text aus der Quelldatei als ausreichend gut eingestuft wird, wird er verwendet; andernfalls wird der Text aus dem Rasterbild dieses Bereichs verwendet. |
| CRM_ContentOnly | ABBYY FineReader Engine verwendet sowohl den Text als auch die Bilder der PDF-Quelldatei oder des Office-Dokuments. <Warning> Die Verwendung des Textinhalts der Quelldatei beschleunigt die Verarbeitung. Wenn Sie diesen Modus jedoch auswählen und keine Textebene vorhanden ist, tritt ein Fehler auf. </Warning> Wir empfehlen, diesen Modus für Quelldateien mit sichtbarem Text zu verwenden, der in Unicode, ASCII oder einem anderen Standard zur Zeichenkodierung codiert ist und korrekte Schriftart- und Größeneinstellungen aufweist. Wenn Ihre Quelldatei von einem anderen Typ ist, verwenden Sie CRM_Auto, CRM_ContentAndPictures oder CRM_DoNotReuse. <Warning> Dieser Modus ist nicht verfügbar, wenn die Dokumente parallel im Speicher verarbeitet werden (MultiProcessingParams::MultiProcessingMode = MPM_Parallel). </Warning> |
| CRM_DoNotReuse | ABBYY FineReader Engine rastert die Seiten der PDF-Quelldatei oder des Office-Dokuments und verarbeitet sie. Der Inhalt der Quelldatei wird ignoriert. |
Verwenden Sie die Methode IsPdfWithTextualContent, um festzustellen, ob die Datei eine Textebene enthält.
Bemerkungen
- CRM_DoNotReuse — der Typ des Wortmodells wird immer bestimmt.
- CRM_Auto, CRM_ContentAndPictures — die Bestimmung des Typs des Wortmodells hängt davon ab, ob die Erkennung von Dokumentinhalten verwendet wird.
- CRM_ContentOnly — der Typ des Wortmodells wird nie bestimmt.
