Vai al contenuto principale
ABBYY FineReader Engine supporta numerosi parametri che consentono di configurare con precisione il motore. Nella maggior parte dei casi, non sarà necessario impostare tutti i valori manualmente: le proprietà dei nuovi oggetti vengono inizializzate con valori predefiniti adeguati al momento della creazione e, per i principali scenari di utilizzo, mettiamo a disposizione profili predefiniti ampiamente testati. Se il tuo scenario è più specifico e hai individuato le impostazioni ottimali per ottenere la migliore velocità e qualità di elaborazione, crea un profilo personalizzato. Tutti i parametri per la preelaborazione delle immagini, l’analisi, il riconoscimento, la sintesi e l’esportazione possono essere modificati tramite un profilo. Ad esempio, se la tua applicazione esporta i risultati del riconoscimento in TXT (testo normale senza formattazione), molte proprietà relative al layout non sono rilevanti e possono essere disattivate. Dopo aver caricato un profilo utilizzando i metodi LoadPredefinedProfile/LoadProfile dell’oggetto Engine, le proprietà degli oggetti appena creati verranno impostate sui valori predefiniti specificati nel profilo.

Profili predefiniti

ABBYY FineReader Engine fornisce una serie di profili predefiniti progettati per i principali scenari di utilizzo. La maggior parte dei profili è disponibile in due varianti: ottimizzate per garantire la migliore qualità del documento risultante oppure la massima velocità di elaborazione. Per la specifica completa di tutti i profili predefiniti, vedere Specifica dei profili predefiniti.

Adatto perestrarre datida un documento e presentarli in un formato strutturato. Tutti gli oggetti, incluse tabelle, immagini, segni di spunta e testo scritto a mano, vengono salvati insieme alla loro posizione e ai relativi attributi. Questo profilo è ideale per elaborare ulteriormente i dati estratti o per integrarli con altre applicazioni.

Adatto perconvertire documentiin un formato modificabile (ad esempio, RTF, DOCX). Le impostazioni sono state ottimizzate per la precisione:

  • Qualità ottimale. Abilita il rilevamento dello stile del carattere e la sintesi completa della struttura logica del documento.

Adatto perconvertire documentiin un formato modificabile (ad esempio, RTF, DOCX). Le impostazioni sono state ottimizzate per la velocità di elaborazione:

  • Qualità ottimale. Abilita il rilevamento dello stile del carattere e la sintesi completa della struttura logica del documento.
  • L’orientamento dell’immagine non viene corretto.
  • Il processo di analisi del documento viene accelerato.

Adatto per la creazione di unarchivio elettronico(conversione in PDF, PDF/A, PDF e PDF/A con MRC). Le impostazioni sono state ottimizzate per la precisione:

  • Abilita il rilevamento della quantità massima di testo in un’immagine, incluso il testo incorporato nell’immagine.
  • La sintesi completa della struttura logica del documento non viene eseguita.
Questo profilo non è destinato alla conversione di un documento in RTF, DOCX o PDF solo testo. Per tali scopi, utilizzare i profili di conversione documenti.

Adatto per la creazione di unarchivio elettronico(conversione in PDF, PDF/A, PDF e PDF/A con MRC). Le impostazioni sono state ottimizzate per la velocità di elaborazione:

  • Abilita il rilevamento della quantità massima di testo in un’immagine, incluso il testo incorporato nell’immagine.
  • La correzione dell’inclinazione non viene eseguita.
  • La sintesi completa della struttura logica del documento non viene eseguita.
  • I processi di analisi e riconoscimento del documento vengono accelerati.
Questo profilo non è destinato alla conversione di un documento in RTF, DOCX o PDF solo testo. Per tali scopi, utilizzare i profili di conversione documenti.

Adatto perestrarre testoda un documento. Le impostazioni sono state ottimizzate per la precisione:

  • Abilita il rilevamento di tutto il testo in un’immagine, incluse le aree di testo di piccole dimensioni e bassa qualità (immagini e tabelle non vengono rilevati).
  • La sintesi completa della struttura logica del documento non viene eseguita.

Il testo viene estratto nello stesso ordine in cui verrebbe letto da un essere umano, garantendo così la coerenza dei dati quando utilizzato per l’addestramento e l’elaborazione con motori di elaborazione del linguaggio naturale (NLP).

Questo profilo non è destinato alla conversione di un documento in RTF, DOCX o PDF solo testo. Per tali scopi, utilizzare i profili di conversione documenti.

Adatto perestrarre testoda un documento. Le impostazioni sono state ottimizzate per la velocità di elaborazione:

  • Abilita il rilevamento di tutto il testo in un’immagine, incluse le aree di testo di piccole dimensioni e bassa qualità (immagini e tabelle non vengono rilevati).
  • La sintesi completa della struttura logica del documento non viene eseguita.
  • I processi di analisi e riconoscimento del documento vengono accelerati.

Il testo viene estratto nello stesso ordine in cui verrebbe letto da un essere umano, garantendo così la coerenza dei dati quando utilizzato per l’addestramento e l’elaborazione con motori di elaborazione del linguaggio naturale (NLP).

Il profilo non è previsto per la conversione di un documento in RTF, DOCX o PDF contenente solo testo. Per tali scopi, utilizzare i profili di conversione documenti.

Adatto peril riconoscimento di frammenti di testo brevi. Al momento, questo profilo utilizza le impostazioni predefinite.

Adatto perl’estrazione dei barcode. Estrae solo i barcode (testi, immagini o tabelle non vengono rilevati). Le impostazioni sono state ottimizzate per la precisione.

Per motivi di compatibilità, è possibile accedere a questo profilo anche con il nome BarcodeRecognition.

Questo profilo richiede il moduloBarcode Autolocationdisponibile nella licenza.

Adatto perl’estrazione dei barcode. Estrae solo i barcode (testi, immagini o tabelle non vengono rilevati). Le impostazioni sono state ottimizzate per la velocità di elaborazione.

Questo profilo richiede il moduloBarcode Autolocationdisponibile nella licenza.

Adatto alla creazione di file PDF altamente compressi che contengono documenti interi salvati come immagini. Vengono applicate le seguenti impostazioni:

  • Non viene eseguito il riconoscimento del documento né la sintesi della struttura logica del documento.
  • Non viene eseguita la correzione dell’inclinazione.
  • L’esportazione in PDF è ottimizzata per minimizzare le dimensioni del file risultante.
  • L’intero documento viene salvato come immagine (PEM_ImageOnlymodalità).

Adatto peril riconoscimento dei biglietti da visita. Vengono applicate le seguenti impostazioni:

  • Rileva solo i biglietti da visita.
  • Abilita il rilevamento di tutto il testo su un’immagine, incluse piccole aree di testo di scarsa qualità (immagini e tabelle non vengono rilevate).
  • Viene eseguita la correzione della risoluzione.
  • Non viene eseguita la sintesi completa della struttura logica di un documento.

Adatto perl’estrazione dei dati da una zona a lettura meccanica(MRZ). Vengono applicate le seguenti impostazioni:

  • Abilita il rilevamento e l’estrazione di tutto il testo su un’immagine (immagini, grafici vettoriali e tabelle non vengono rilevati).
  • La correzione della risoluzione e della geometria viene eseguita automaticamente.

Adatto al riconoscimento di disegni tecnici. Considera le dimensioni elevate e la complessità dei diagrammi ingegneristici, nonché la possibilità di diverse orientazioni del testo all’interno dell’immagine. Il profilo è concepito per convertire tali immagini in formato PDF ricercabile. Vengono applicate le seguenti impostazioni:

  • Abilita il rilevamento di tutto il testo su un’immagine, inclusi i blocchi di testo in orientamento verticale.
  • Non viene eseguita la sintesi completa della struttura logica di un documento.
Il profilo non è previsto per la conversione di un documento in RTF, DOCX o PDF contenente solo testo. Per tali scopi, utilizzare i profili di conversione documenti.

Imposta tutti i parametri di elaborazione sui valori predefiniti.

Le impostazioni fornite con questi profili possono essere caricate utilizzando il metodo LoadPredefinedProfile dell’oggetto Engine. Dopo aver caricato il profilo, gli oggetti creati successivamente avranno i nuovi valori predefiniti specificati nel profilo.
  • Gli utenti di FRE per Linux possono trovare i file dei profili predefiniti nel pacchetto di distribuzione, nella cartella Bin Libraries.
  • Gli utenti di FRE per macOS possono trovare i file dei profili predefiniti nel pacchetto di distribuzione, nella cartella /PredefinedProfiles.
  • Per determinare l’insieme dei file di risorse necessari al funzionamento dell’applicazione utilizzando il file FREngineDistribution.csv, consultare la pagina corrispondente allo scenario scelto.

Profili utente

Puoi anche creare un profilo utente personalizzato. La sintassi di un file di profilo è simile a quella dei file *.ini. Puoi aggiungere commenti iniziando una riga con un punto e virgola. Le sezioni contengono i nomi degli oggetti tra parentesi quadre e le chiavi contengono le proprietà con i rispettivi nuovi valori. La sezione speciale denominata UserData può contenere qualsiasi chiave definita dall’utente. Le proprietà di tipi diversi possono essere scritte nei seguenti formati:
  • I valori delle proprietà booleane sono rappresentati dalle stringhe true o false.
  • I valori delle proprietà di enumerazione sono rappresentati da nomi di costanti.
  • I valori delle proprietà string sono scritti senza virgolette.
Ad esempio:
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; questo è un commento
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
Il metodo LoadProfile dell’oggetto Engine consente di caricare un file di profilo utente. Dopo il caricamento del profilo utente, gli oggetti creati successivamente avranno le proprietà impostate sui valori specificati nel profilo. Caricare i parametri da un profilo è analogo a impostare le proprietà corrispondenti nel codice del programma, ma semplifica la logica dell’applicazione. Se si chiama LoadProfile con una stringa vuota come input, verranno utilizzati i valori predefiniti standard. La correttezza dei nuovi valori delle proprietà e la loro conformità alla licenza vengono verificate al momento della creazione dell’oggetto corrispondente. Un file di profilo può essere utilizzato per ridefinire tutte le proprietà dei seguenti oggetti: 1 Si noti che la proprietà UserPatternsFile dell’oggetto RecognizerParams accetta solo il percorso completo del file di pattern, usando come Separator il simbolo slash appropriato. Il valore del percorso non deve essere racchiuso tra virgolette. In Windows, ad esempio:
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
Per Linux: /home/user/Documents/Patterns/ e per macOS: /Users/user/Documents/
2 Per impostare le proprietà degli oggetti PictureExportParams o PaperSizeParams, specificare i parametri direttamente nella sezione dell’oggetto parametro di esportazione (non nella sezione PictureExportParams o PaperSizeParams). In questo modo sarà possibile utilizzare impostazioni diverse per formati di esportazione differenti. Ad esempio, per specificare il formato immagine in scala di grigi per i file RTF:
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 Per impostare le proprietà dell’oggetto DocumentContentInfoWritingParams, specifica i parametri direttamente nella sezione dell’oggetto padre. Per il formato PDF si tratta dell’oggetto PDFExportFeatures; per gli altri formati, del corrispondente oggetto dei parametri di esportazione. In questo modo puoi specificare impostazioni diverse delle informazioni sul contenuto per i diversi formati di esportazione. Ad esempio, se non vuoi scrivere l’autore del documento nei file PDF di output, inserisci le righe seguenti nel profilo:
[PDFExportFeatures]
WriteAuthor = false
4 Per impostare le proprietà dell’oggetto PageMargins, specificare direttamente i parametri nella sezione dell’oggetto padre. Si noti che la proprietà UseCustomPageMargins impostata su TRUE deve essere specificata prima dei valori dei margini della pagina:
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000

Uso simultaneo di profili predefiniti e profili utente

È possibile caricare contemporaneamente un profilo predefinito e un profilo utente. Il profilo utente ha la priorità su quello predefinito; in altre parole, se il profilo utente imposta lo stesso parametro del profilo predefinito, verrà usato il valore del profilo utente. Se si carica un altro profilo predefinito, questo sostituisce quello precedente. Analogamente, un nuovo profilo utente sostituisce il precedente. Si noti che il caricamento di un profilo reimposta la sessione di riconoscimento corrente (equivalente alla chiamata del metodo IEngine::CleanRecognizerSession).

Vedi anche

Regolazione dei parametri di pre-elaborazione, analisi, riconoscimento e sintesi Regolazione dei parametri di esportazione