Vai al contenuto principale

Panoramica

ABBYY Vantage consente l’elaborazione automatizzata dei documenti con funzionalità di estrazione intelligente. Questa guida è incentrata sul flusso di lavoro SFTP, che ti permette di caricare documenti in una cartella condivisa e recuperare automaticamente i risultati elaborati. Cosa realizzerai:
  • Creare e configurare una Process Skill
  • Configurare l’accesso SFTP per input e output
  • Caricare documenti tramite riga di comando
  • Scaricare i risultati di estrazione
Tempo necessario: 15-20 minuti

Passaggio 1: Creare una Process Skill

Una Process Skill è la base del flusso di lavoro di elaborazione dei documenti in Vantage.
  1. Vai alla sezione Documenti in ABBYY Vantage.
  2. Fai clic su Skill Designer nella barra laterale sinistra.
  3. Seleziona Process Skill dai tipi di skill.
Selezione del Process Skill
  1. Nella finestra di dialogo Create Process skill, inserisci:
    • Skill Name: un nome descrittivo per il processo (ad es. “Process Skill Test 1”)
    • Description: descrizione facoltativa di cosa fa questa skill
    • Technology Core Version: 3.0 (consigliata)
Assegnazione del nome alla Process Skill
  1. Fai clic su Create

Passaggio 2: Configurare il flusso di lavoro della Process skill

Dopo aver creato la tua skill, imposterai il flusso di elaborazione dei documenti.
  1. In Skill Designer, vedrai il pannello Select Process Skill sulla destra
  2. Scegli Simple Document skill workflow per elaborare singole tipologie di documento
Selecting Simple Workflow Questo crea un workflow preconfigurato con:
  • Connettore Input: Punto in cui i documenti entrano nel sistema
  • Skill OCR: Optical Character Recognition (OCR)
  • Skill Extract: Estrazione dei dati
  • Connettore Output: Punto in cui vengono recapitati i risultati
Il workflow verrà visualizzato nell’area centrale mostrando: Input → OCR → Extract → Output

Passaggio 3: Configurare l’input tramite SFTP

Configura l’attività Input per accettare documenti tramite SFTP.
  1. Fai clic sull’attività Input nel flusso di lavoro.
  2. Nel pannello Actions sulla destra, seleziona Select additional source.
  3. Seleziona il pulsante di scelta Shared folder.
  4. Fai clic su Settings per configurare.
Configuring Input Activity

Configurare le impostazioni di input

Nella finestra di dialogo Input Settings: Shared Folder: Input Settings Dialog Impostazioni della cartella:
  • Folder name: Input (valore predefinito)
  • Import method: Single file
Credenziali per l’importazione (visualizzate per il tuo uso):
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: Uno UUID generato (ad es. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Visualizzata con opzione mostra/nascondi
Nota: Copia queste credenziali: ti serviranno per connetterti tramite SFTP. I file che non possono essere importati verranno spostati nella cartella delle eccezioni. Vantage controlla la presenza di file ogni 20 secondi dopo la pubblicazione della Skill.
  1. Fai clic su Save.

Passaggio 4: Configurare l’output tramite SFTP

Configura l’attività Output per inviare i risultati tramite SFTP.
  1. Fai clic sull’attività Output nel flusso di lavoro.
  2. Nel pannello Actions, seleziona Select additional destination.
  3. Seleziona l’opzione Shared folder.
  4. Fai clic su Settings per configurare.
Configuring Output Activity

Configurare le impostazioni di output

Nella finestra di dialogo Output Settings: Shared Folder: Output Settings Dialog Informazioni:
  • Folder name: Output (predefinito)
  • Folder: .../Output
  • Username: Un UUID generato automaticamente (ad esempio, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Mostrata con l’opzione mostra/nascondi
Dati esportati:
  • Fields (JSON): Formato di esportazione predefinito
Nota: I risultati sono organizzati in sottocartelle denominate in base al file di origine e all’ID della transaction (ad esempio, invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). I file vengono rimossi automaticamente in base alla policy di conservazione dei dati.
  1. Fare clic su Save.

Step 5: Configura le Skill di estrazione

Configura quali tipi di documento l’attività Extract deve riconoscere ed elaborare.
  1. Fai clic sull’attività Extract nel flusso di lavoro.
  2. Nel pannello Actions, vedrai Document Skills.
Configurazione delle Skill di estrazione Le Document skill disponibili includono:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Seleziona i tipi di documento rilevanti per il tuo caso d’uso.
  2. Fai clic su Add Skill se hai bisogno di tipi di documento aggiuntivi.
  3. Usa Edit Mapping per personalizzare l’estrazione dei field, se necessario.

Passaggio 6: Pubblica e ottieni lo Skill ID

Prima di poter utilizzare SFTP, devi pubblicare la Skill e individuarne lo Skill ID.
  1. Fai clic sul pulsante Publish in alto a destra in Skill Designer.
  2. Una volta pubblicata, annota lo Skill ID dall’URL del browser.
Ottenere lo Skill ID dall'URL Il formato dell’URL è:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Ad esempio: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Attenzione: Tieni a portata di mano il tuo Skill ID: ti servirà per accedere alle cartelle Input e Output corrette su SFTP.

Passaggio 7: Connettersi a SFTP

Ora sei pronto per connetterti tramite SFTP utilizzando le credenziali delle impostazioni di input/output.

Dettagli di connessione

Dalle impostazioni di input/output, ottieni:
  • Server: 172.172.228.138
  • Porta: 2022
  • Nome utente: Il tuo UUID generato
  • Password: La tua password generata
  • Percorso base: /{skill-id}/

Connettersi dal terminale

Apri il terminale e connettiti utilizzando:
sftp -P 2022 {username}@172.172.228.138
Esempio:
sftp -P 2022 [email protected]
Nota: Usa -P maiuscola per il numero di porta in SFTP (-p minuscola viene usata per un altro scopo). Quando richiesto, inserisci la password.

Passaggio 8: Esplorare la struttura delle cartelle SFTP

Una volta effettuata la connessione, visualizzerai il prompt SFTP: sftp>

Visualizzare le Skill disponibili

Elenca tutte le Process Skill disponibili:
sftp> ls
Accesso alle cartelle delle skill Vedrai le cartelle per ciascuna skill (identificate dai rispettivi ID skill), oltre a:
  • Catalogs - cataloghi delle Document skill
  • Catalogs-exception - importazioni di cataloghi non riuscite
  • skills-import - directory di importazione delle skill
Utilizza l’ID dello Skill dal passaggio 6:
sftp> cd {your-skill-id}
sftp> ls
Dovresti vedere tre cartelle:
  • Input - Dove carichi i documenti per l’elaborazione
  • Input-exception - Le importazioni non riuscite vengono spostate qui
  • Output - Dove compaiono i risultati elaborati

Passaggio 9: Carica i documenti per l’elaborazione

Vai alla cartella Input e carica i tuoi documenti.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Caricare un singolo file

Carica un file indicando il percorso completo:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Oppure cambia prima la directory locale:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Caricamento e download dei file

Carica più documenti

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Nota: I file caricati in Input vengono eliminati automaticamente dopo essere stati elaborati correttamente (solitamente entro 20 secondi). Se non vedi più il tuo file dopo il caricamento, significa che Vantage lo ha già preso in carico per l’elaborazione!

Verifica il caricamento

Verifica se i file sono ancora presenti nella cartella Input:
sftp> ls
Se la cartella è vuota o il tuo file manca, l’elaborazione è stata avviata.

Passaggio 10: Controllare lo stato di elaborazione

Monitora la cartella Input-exception

Se un file non viene importato, verrà visualizzato qui:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Una cartella vuota indica che tutti i file sono stati importati correttamente.

Attendere il completamento dell’elaborazione

Il tempo di elaborazione varia in base a:
  • complessità del documento
  • skill di estrazione configurate
  • carico di lavoro attuale del sistema
In genere, le fatture semplici vengono elaborate in 30-60 secondi.

Passaggio 11: Scaricare i risultati elaborati

Una volta completata l’elaborazione, i risultati vengono visualizzati nella cartella Output.
sftp> cd ..
sftp> cd Output
sftp> ls

Comprendere la struttura dell’output

I risultati sono organizzati in sottocartelle secondo il seguente modello di denominazione:
{original-filename}-{transaction-id}
Esempio:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Visualizzare il contenuto di una cartella dei risultati

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Contenuti tipici:
  • Invoice_US.json - Dati estratti in formato JSON
  • Invoice_US.csv - Dati estratti in formato CSV (se abilitato)
  • File aggiuntivi in base alle impostazioni di output

Scarica i risultati

Imposta la directory di download locale:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Scarica un singolo file:
sftp> get Invoice_US.json
Scarica tutti i file nella cartella:
sftp> mget *
Scarica l’intera cartella dei risultati in modo ricorsivo:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Comprendere l’output JSON

L’output predefinito è un file JSON che contiene:
  • Struttura del documento - Layout e organizzazione
  • Valori dei field estratti - Dati prelevati dal documento
  • Punteggi di confidenza - Attendibilità di ciascuna estrazione
  • Errori delle regole - Eventuali problemi di validazione
  • Metadati dei field - Informazioni aggiuntive su ciascun field
Esempio di struttura:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Per una documentazione dettagliata dello schema JSON, consultare la documentazione dell’API ABBYY Vantage.

Comandi SFTP utili

CommandDescriptionExample
lsElenca i file remotils
llsElenca i file localills
pwdMostra la directory remotapwd
lpwdMostra la directory localelpwd
cd folderCambia la directory remotacd Output
lcd folderCambia la directory localelcd ~/Downloads
put fileCarica un singolo fileput invoice.pdf
mput filesCarica più filemput *.jpg
get fileScarica un singolo fileget result.json
mget filesScarica più filemget *
get -r folderScarica una cartella in modo ricorsivoget -r results/
exitDisconnette dal serverexit

Risoluzione dei problemi

Problemi di connessione

Problema: errori “Connection refused” o timeout Soluzioni:
  • Verifica di essere connesso alla VPN aziendale
  • Controlla il numero di porta (deve essere 2022 con l’opzione -P maiuscola)
  • Conferma che il tuo nome utente e la tua password siano corretti
  • Verifica la connettività di rete di base: ping 172.172.228.138

Problemi di caricamento

Problema: i file non vengono elaborati Soluzioni:
  • Controlla la cartella Input-exception per le importazioni non riuscite
  • Verifica che il formato del file sia supportato (PDF, JPG, PNG, TIFF, ecc.)
  • Assicurati che la Process skill sia pubblicata
  • Controlla i limiti di dimensione dei file (variano in base alla configurazione)

Nessun file di output

Problema: La cartella di output è vuota dopo il caricamento Soluzioni:
  • Attendere più a lungo: l’elaborazione può richiedere 30-60 secondi o più
  • Verificare che Output sia configurato con destinazione “Shared folder”
  • Controllare i log della transazione nell’interfaccia web di Vantage
  • Confermare che l’attività Extract abbia configurate le appropriate Document skill

Errori di autorizzazione

Problema: “Accesso negato” durante il caricamento o il download Soluzioni:
  • Verifica di utilizzare le credenziali corrette per Input e Output
  • Le credenziali di Input consentono: caricare, eliminare
  • Le credenziali di Output consentono: visualizzare, scaricare, rinominare, eliminare
  • Controlla che lo skill sia pubblicato e attivo

Procedure consigliate

Sicurezza

  • Non condividere mai le credenziali SFTP in chiaro
  • Usa canali sicuri per trasmettere le password
  • Esegui una rotazione periodica delle credenziali
  • Limita l’accesso SFTP al personale strettamente necessario

Gestione dei file

  • Usa nomi di file descrittivi che includano date o ID
  • Elabora i file in batch durante i periodi di minor carico, quando possibile
  • Scarica e archivia i risultati tempestivamente
  • Elimina regolarmente le vecchie cartelle dei risultati

Monitoraggio

  • Controlla regolarmente la cartella Input-exception per individuare le importazioni non riuscite
  • Monitora i tempi di elaborazione per identificare eventuali colli di bottiglia
  • Verifica i punteggi di confidenza dell’estrazione nei risultati
  • Configura avvisi per gli errori critici (se disponibili)

Ottimizzazione del flusso di lavoro

  • Raggruppa tipi di documenti simili
  • Configura le Document skill appropriate per il tuo scenario d’uso
  • Effettua test con documenti di esempio prima dell’uso in produzione
  • Documenta il flusso di lavoro SFTP come riferimento per il team

Prossimi passi

Ora che hai una pipeline SFTP per l’elaborazione dei documenti funzionante:
  1. Esegui test con diversi documenti - Carica diversi tipi di file e varianti di documenti
  2. Verifica l’accuratezza dell’estrazione - Controlla i risultati JSON e i punteggi di confidenza
  3. Personalizza l’estrazione - Usa Edit Mapping per perfezionare l’estrazione dei field
  4. Automatizza i caricamenti - Crea script per automatizzare il caricamento dei file
  5. Integra con i tuoi sistemi - Collega le tue applicazioni tramite la Vantage REST API
  6. Scala il tuo flusso di lavoro - Aggiungi altre Document skill o crea ulteriori Process skill
Per configurazioni avanzate, integrazione tramite API o workflow personalizzati, consulta la documentazione di ABBYY Vantage.

Risorse aggiuntive

  • Documentazione dell’API REST: per il caricamento programmatico dei file e il recupero dei risultati
  • Skill Catalog: esplora le Document skill predefinite
  • Supporto: contatta il supporto ABBYY per assistenza tecnica

Hai completato con successo le seguenti operazioni:
  • ✅ Creato una Process Skill in ABBYY Vantage
  • ✅ Configurato l’accesso SFTP per l’input e l’output
  • ✅ Configurato le skill di estrazione dei documenti
  • ✅ Effettuato la connessione tramite riga di comando SFTP
  • ✅ Caricato documenti per l’elaborazione
  • ✅ Scaricato i risultati di estrazione
La tua pipeline di elaborazione dei documenti è ora operativa e pronta per l’uso in produzione!