- Pre-elaborazione delle immagini scansionate o delle foto
- Riconoscimento della massima quantità possibile di testo nell’immagine di un documento
Implementazione dello scenario
Gli esempi di codice forniti in questo argomento sono specifici per Windows.
Passaggio 1. Caricamento di ABBYY FineReader Engine
Passaggio 1. Caricamento di ABBYY FineReader Engine
Per iniziare a lavorare con ABBYY FineReader Engine, è necessario creare l’oggetto Engine. L’oggetto Engine è l’oggetto di livello più alto nella gerarchia degli oggetti di ABBYY FineReader Engine e fornisce varie impostazioni globali, alcuni metodi di elaborazione e metodi per la creazione degli altri oggetti.Per creare l’oggetto Engine, è possibile utilizzare la funzione InitializeEngine. Vedere anche altri modi per caricare l’oggetto Engine (Win).
C#
C++ (COM)
Passaggio 2. Caricamento delle impostazioni per lo scenario
Passaggio 2. Caricamento delle impostazioni per lo scenario
Le impostazioni più adatte per questo scenario possono essere selezionate in ABBYY FineReader Engine utilizzando il metodo LoadPredefinedProfile dell’oggetto Engine. Questo metodo riceve il nome del profilo come parametro di input. Per ulteriori informazioni, vedere Working with Profiles.ABBYY FineReader Engine supporta 2 varianti di impostazioni per questo scenario:
Se si desidera modificare le impostazioni di elaborazione, utilizzare gli appositi oggetti parametro. Per ulteriori informazioni, vedere ottimizzazione aggiuntiva per attività specifiche di seguito.
Nome del profilo | Descrizione |
|---|---|
TextExtraction_Accuracy | Le impostazioni sono state ottimizzate per la precisione:
|
TextExtraction_Speed | Le impostazioni sono state ottimizzate per la velocità di elaborazione:
|
C#
C++ (COM)
Passaggio 3. Caricamento e preelaborazione delle immagini
Passaggio 3. Caricamento e preelaborazione delle immagini
ABBYY FineReader Engine fornisce l’oggetto FRDocument, che consente di elaborare documenti multipagina.Per caricare e preelaborare le immagini di un singolo documento, è necessario creare l’oggetto FRDocument e aggiungervi le immagini. È possibile procedere in uno dei seguenti modi:
- Creare l’oggetto FRDocument utilizzando il metodo CreateFRDocumentFromImage dell’oggetto Engine. Questo metodo crea l’oggetto FRDocument e carica le immagini dal file specificato.
- Creare l’oggetto FRDocument mediante il metodo CreateFRDocument dell’oggetto Engine, quindi aggiungere al FRDocument creato le immagini da file (utilizzare il metodo AddImageFile, AddImageFileWithPassword o AddImageFileWithPasswordCallback dell’oggetto FRDocument).
C#
C++ (COM)
Passaggio 4. Riconoscimento del documento
Passaggio 4. Riconoscimento del documento
Per riconoscere il documento, è necessario utilizzare i metodi di analisi e riconoscimento dell’oggetto FRDocument. Questo oggetto mette a disposizione un’ampia gamma di metodi per l’analisi e il riconoscimento del documento. Il metodo più pratico, che consente di eseguire analisi, riconoscimento e sintesi del documento con una sola chiamata, è Process. Inoltre, sfrutta nel modo più efficiente le funzionalità di elaborazione simultanea dei sistemi multiprocessore e multicore. In alternativa, è anche possibile eseguire in sequenza pre-elaborazione, analisi, riconoscimento e sintesi utilizzando i metodi Preprocess, Analyze, Recognize e Synthesize.
C#
C++ (COM)
Passaggio 5. Ricerca di informazioni importanti
Passaggio 5. Ricerca di informazioni importanti
Durante l’analisi, ABBYY FineReader Engine seleziona i blocchi dell’immagine che contengono testo, tabelle, immagini e così via. Durante il riconoscimento, i blocchi che contengono dati testuali vengono popolati con il testo riconosciuto.In ABBYY FineReader Engine, l’oggetto Layout funge da contenitore per i blocchi e il testo riconosciuto. Nello scenario principale di elaborazione dei documenti, il layout viene gestito all’interno dell’oggetto FRDocument, che rappresenta il documento in elaborazione. Per accedere al layout di una pagina del documento, utilizzare la proprietà IFRPage::Layout.Per cercare parole chiave, è possibile visualizzare il testo riconosciuto utilizzando l’oggetto Text, accessibile tramite le proprietà dei blocchi di testo, tabella o Barcode.I dati importanti individuati possono essere salvati o elaborati in base alle esigenze. Per informazioni più dettagliate, vedere ottimizzazione aggiuntiva per attività specifiche di seguito.
(Facoltativo) Passaggio 6. Esportazione del documento
(Facoltativo) Passaggio 6. Esportazione del documento
In alternativa, è possibile salvare il testo estratto in un formato facilmente ricercabile, come TXT, oppure in un formato strutturato che consenta di recuperare facilmente in seguito le informazioni necessarie, come JSON.Utilizzare il metodo Export dell’oggetto FRDocument con una costante FileExportFormatEnum corrispondente come uno dei parametri. È possibile modificare i parametri di esportazione predefiniti utilizzando il relativo oggetto di esportazione. Per ulteriori informazioni, vedere ottimizzazione aggiuntiva per attività specifiche di seguito.Dopo aver terminato il lavoro con l’oggetto FRDocument, rilasciare tutte le risorse utilizzate da questo oggetto. Utilizzare il metodo IFRDocument::Close.
C#
C++ (COM)
Passaggio 7. Scaricamento di ABBYY FineReader Engine
Passaggio 7. Scaricamento di ABBYY FineReader Engine
Dopo aver terminato di utilizzare ABBYY FineReader Engine, è necessario scaricare l’oggetto Engine. A tale scopo, utilizza la funzione esportata DeinitializeEngine.
C#
C++ (COM)
Risorse richieste
Ottimizzazione aggiuntiva per attività specifiche
-
Scansione - Solo Windows
- Scansione
Descrizione dello scenario ABBYY FineReader Engine per la scansione di documenti.
- Scansione
-
Riconoscimento
- Ottimizzazione dei parametri di pre-elaborazione, analisi, riconoscimento e sintesi
Personalizzazione dell’elaborazione dei documenti mediante gli oggetti dei parametri di analisi, riconoscimento e sintesi.
- Ottimizzazione dei parametri di pre-elaborazione, analisi, riconoscimento e sintesi
-
Riconoscere il testo scritto a mano
I profili TextExtraction_*** non includono il riconoscimento del testo manoscritto o in stampatello. Se devi riconoscere testo scritto a mano, imposta la proprietà DetectHandwritten dell’oggetto PageAnalysisParams su TRUE. -
Oggetto PageProcessingParams
Questo oggetto consente di personalizzare i parametri di analisi e riconoscimento. Utilizzando questo oggetto, puoi indicare quali caratteristiche dell’immagine e del testo devono essere rilevate (immagine invertita, orientamento, Barcode, lingua di riconoscimento, margine di errore del riconoscimento). -
Oggetto SynthesisParamsForPage
Questo oggetto include i parametri responsabili del ripristino della formattazione di una pagina durante la sintesi. -
Oggetto SynthesisParamsForDocument
Questo oggetto consente di personalizzare la sintesi del documento: il ripristino della sua struttura e formattazione. -
Oggetto MultiProcessingParams - Solo Linux e Windows
L’elaborazione simultanea può essere utile quando si elabora un numero elevato di immagini. In questo caso, il carico di elaborazione verrà distribuito tra i core del processore durante l’apertura e la pre-elaborazione delle immagini, l’analisi del layout e il riconoscimento, rendendo possibile accelerare l’elaborazione.
Le modalità di lettura (simultanea o consecutiva) vengono impostate utilizzando la proprietà MultiProcessingMode. La proprietà RecognitionProcessesCount controlla il numero di processi che possono essere avviati. -
Ricerca di informazioni importanti
- Lavorare con Layout e blocchi
Informazioni sul layout della pagina, sui tipi di blocco e su come lavorare con essi. - Oggetto Layout
I parametri di questo oggetto forniscono accesso al layout della pagina e al testo riconosciuto dopo il riconoscimento del documento. - Lavorare con il testo
Lavorare con il testo riconosciuto, i paragrafi, le parole e i simboli.
- Lavorare con Layout e blocchi
-
Rilettura del documento mediante parametri speciali per il tipo di dati specificato
- Riconoscimento a livello di field
Descrizione dello scenario per il riconoscimento di brevi segmenti di testo.
- Riconoscimento a livello di field
-
Salvataggio dei dati
- Per salvare i dati riconosciuti, puoi utilizzare i metodi Export o ExportPages dell’oggetto FRDocument, assegnando la costante FileExportFormatEnum come uno dei parametri.
- Archiviazione dei documenti
Descrizione dello scenario per il salvataggio di una copia elettronica del documento.
