Modalità di elaborazione PDF

Modalità	Descrizione	Quando usarla
Predefinita (consigliata)	Usa il livello di testo PDF incorporato quando disponibile e lo integra con OCR, se necessario. Questo è il comportamento di elaborazione standard di Vantage.	Uso generale. Consigliata per la maggior parte dei set di documenti con un mix di PDF con livello di testo e PDF composti solo da immagini.
Usa solo il livello di testo	Estrae il testo esclusivamente dal livello di testo PDF incorporato. Se non esiste alcun livello di testo, Vantage ricorre automaticamente all’OCR.	Da utilizzare quando si dispone di livelli di testo affidabili e di alta qualità e si desidera un’estrazione più rapida senza OCR completo. Utile in ambienti regolamentati in cui il livello di testo esistente è la fonte autorevole.
Usa solo OCR	Ignora qualsiasi livello di testo PDF incorporato ed esegue un OCR completo su ogni pagina del documento.	Da utilizzare quando i livelli di testo PDF sono noti per essere inaffidabili o corrotti, oppure quando è necessaria un’estrazione coerente basata su OCR per tutti i documenti, indipendentemente dalla loro struttura.

Modalità

Descrizione

Quando usarla

Predefinita (consigliata)

Usa il livello di testo PDF incorporato quando disponibile e lo integra con OCR, se necessario. Questo è il comportamento di elaborazione standard di Vantage.

Uso generale. Consigliata per la maggior parte dei set di documenti con un mix di PDF con livello di testo e PDF composti solo da immagini.

Usa solo il livello di testo

Estrae il testo esclusivamente dal livello di testo PDF incorporato. Se non esiste alcun livello di testo, Vantage ricorre automaticamente all’OCR.

Da utilizzare quando si dispone di livelli di testo affidabili e di alta qualità e si desidera un’estrazione più rapida senza OCR completo. Utile in ambienti regolamentati in cui il livello di testo esistente è la fonte autorevole.

Usa solo OCR

Ignora qualsiasi livello di testo PDF incorporato ed esegue un OCR completo su ogni pagina del documento.

Da utilizzare quando i livelli di testo PDF sono noti per essere inaffidabili o corrotti, oppure quando è necessaria un’estrazione coerente basata su OCR per tutti i documenti, indipendentemente dalla loro struttura.

Usa solo il livello di testo

La tua organizzazione elabora fatture PDF create digitalmente ed esportate dal sistema ERP di un fornitore. Il livello di testo incorporato è accurato e generato automaticamente. L’opzione Usa solo il livello di testo consente un’estrazione rapida e affidabile senza eseguire OCR non necessario.

Predefinita (consigliata)

Elabori, nello stesso workflow, un volume elevato e diversificato di documenti cartacei acquisiti tramite scansione e PDF creati digitalmente. Alcuni file hanno livelli di testo puliti, altri no. Predefinita (consigliata) gestisce automaticamente entrambi i casi senza richiedere alcuna configurazione per singolo documento.

Usa solo OCR

Il tuo document set è costituito da PDF prodotti da un sistema di scansione legacy che incorpora un livello di testo di bassa qualità durante la scansione. Questo livello incorporato contiene errori di riconoscimento che compromettono l’estrazione dei field. Usa solo OCR lo ignora completamente ed estrae testo pulito direttamente dall’immagine della pagina.

Ambienti regolamentati

Lavori in un settore regolamentato, come i servizi finanziari o la sanità, in cui i risultati dell’estrazione devono essere completamente riproducibili e verificabili. Impostare la modalità su Usa solo il livello di testo oppure Usa solo OCR garantisce che venga sempre utilizzato lo stesso percorso di elaborazione, indipendentemente dal modo in cui arrivano i documenti.

Skill Designer

Modalità disponibili

Scenari di esempio

Dove configurare

Versioni supportate di Technology Core

Skill Designer

​Modalità disponibili

​Scenari di esempio

​Dove configurare

​Versioni supportate di Technology Core

Modalità disponibili

Scenari di esempio

Dove configurare

Versioni supportate di Technology Core