Employer Identification Number (EIN)
- Tecnologia OCR: il riconoscimento del testo stampato è disponibile per 211 lingue, tra cui:
- Lingue europee (alfabeti latino, cirillico, armeno e greco)
- Cinese (semplificato e tradizionale), giapponese e coreano (CJK)
- Arabo, thai, vietnamita, ebraico e farsi
- Birmano — anteprima tecnica
- FineReader XIX — un modulo OCR progettato specificamente per la digitalizzazione e l’archiviazione di vecchi documenti, libri e giornali pubblicati tra il XVII e il XX secolo, molti dei quali rari e unici. Conservati negli archivi storici di biblioteche e organizzazioni governative, costituiscono un patrimonio nazionale che deve essere preservato. FineReader XIX offre una capacità unica di riconoscere testi pubblicati nel periodo dal 1600 al 1937 in inglese, francese, tedesco, italiano e spagnolo. Supporta il riconoscimento di caratteri antichi come Fraktur, Schwabacher e della maggior parte dei caratteri gotici.

- 56 lingue dispongono del supporto di dizionario e analisi morfologica, che migliora significativamente l’accuratezza dell’OCR.
- La funzionalità di riconoscimento di documenti multilingue consente di riconoscere più lingue, ad esempio tedesco e cinese oppure inglese, russo e coreano, nello stesso documento.
- Riconoscimento di documenti stampati con stampanti ad aghi — ABBYY FineReader Engine riconosce testi stampati con stampanti ad aghi di molti tipi. È stato addestrato utilizzando diverse migliaia di campioni prodotti da una varietà di stampanti, tra cui stampanti ad aghi, a margherita, a catena e a nastro, nonché con le modalità di stampa draft e Near Letter Quality (NLQ).
- Riconoscimento di documenti dattiloscritti.
- Riconoscimento dei caratteri OCR-A, OCR-B, MICR (E13B) e CMC7.
Riconoscimento intelligente dei caratteri (ICR)
- Tecnologia ICR: riconoscimento di caratteri manoscritti in stampatello per oltre 126 lingue.
- 39 lingue (con alfabeti latino, greco e cirillico) con supporto morfologico e del dizionario.
- ICR per le cifre indiane utilizzate negli Stati arabi.
- 30 stili regionali di scrittura in stampatello a mano utilizzati in diversi Paesi e regioni del mondo (per le lingue ICR supportate).
- Riconoscimento di caratteri manoscritti in stampatello in field e riquadri: field sottolineati, caselle, field in stile comb, ecc.
- ICR multilingue. Uno dei principali vantaggi della tecnologia ICR di ABBYY è che offre praticamente lo stesso elevato livello di accuratezza sul riconoscimento di cifre e di cifre combinate con lettere di una o più lingue, anche se i field contengono sia lettere maiuscole sia minuscole.
Optical Mark Recognition (OMR)
- segni di spunta in una cornice quadrata
- segni di spunta su sfondo vuoto
- tipi di segni di spunta non standard (i segni di spunta speciali richiedono un addestramento prima di poter essere riconosciuti)
Riconoscimento ottico dei barcode (OBR)
- Tipi di barcode 1D e 2D. ABBYY OCR SDK supporta il riconoscimento dei tipi più comuni di barcode 1D e 2D. Vedi l’elenco dei tipi di barcode supportati.
- Estrazione rapida dei barcode. Questa funzionalità consente il rilevamento e il riconoscimento automatici dei barcode con qualsiasi orientamento all’interno di un documento. Funziona sia con i barcode 1D che con quelli 2D
Modalità di riconoscimento
- Modalità di riconoscimento Accurate
- Modalità di riconoscimento Fast
- Modalità di riconoscimento Normal
Riconoscimento full-text e a livello di field
| Specifica | Riconoscimento full-text | Riconoscimento a livello di field |
|---|---|---|
| Dove viene utilizzato | Conversione di documenti, archiviazione di libri | Acquisizione dati |
| --- | --- | --- |
| Analisi del documento | Analisi generale del documento, analisi del documento per le fatture, analisi del documento per l’indicizzazione full-text | Specifica manuale dei blocchi per il riconoscimento a livello di field |
| Riconoscimento | OCR con accuratezza generale di circa il 96-99% | OCR, ICR, OMR e riconoscimento di Barcode con tipi di dati e intervalli di valori predefiniti. L’accuratezza è di circa il 100% |
| Verifica | Consigliata per il riutilizzo dei contenuti | Obbligatoria nella maggior parte dei casi |
| Sintesi | Utilizzata per il recupero dei documenti | Non utilizzata |
| Esportazione dei risultati del riconoscimento | File di documento (RTF, DOCX, PDF, ecc.) | Esportazione in file XML o database |
- Archiviazione di documenti
- Conversione di documenti per il riutilizzo dei contenuti
- Estrazione del testo di base per il rilevamento dei field e la classificazione dei documenti
- Estrazione di dati da field con vari bordi e cornici, inclusi combo box, field sottolineati, riquadri e persino field in cui i dati non rientrano nei bordi del field
- Definizione del contenuto del field impostando alfabeti, dizionari, espressioni regolari, tipi di segmentazione, stili di scrittura a mano (solo Windows), ecc.
- Rilevamento della spaziatura all’interno del field, con riconoscimento accurato dei field in cui gli spazi sono consentiti. ABBYY FineReader Engine 12 consente inoltre di utilizzare dizionari che contengono combinazioni di parole con spazi
- Elaborazione intelligente di blocchi con parti e linee intersecanti, che consente il riconoscimento del testo (parole e simboli) situato interamente entro i bordi del blocco, risparmiando il tempo dedicato al riconoscimento di blocchi di testo non pertinenti
- Rimozione dei puntini dai blocchi di testo, con la possibilità di specificare la dimensione del “disturbo” bianco o nero
Lingue utente
- Nei documenti compilati a mano, i valori nei field del modulo appartengono solitamente a un insieme specifico, come nomi di città, paesi, codici postali, codici prodotto, importi ecc. Per migliorare la qualità del riconoscimento ICR, puoi usare le lingue utente per descrivere le informazioni che possono essere inserite in ciascun field.
- Se un documento contiene “strutture” come codici prodotto, numeri di telefono, numeri di passaporto ecc., possono verificarsi errori di riconoscimento. Questo accade perché il programma legge queste strutture lettera per lettera. Per migliorare il riconoscimento dei codici prodotto e simili, puoi creare una nuova lingua di riconoscimento che aiuterà il programma a leggere correttamente specifici tipi di dati.
