Vai al contenuto principale

Panoramica

ABBYY Vantage consente l’elaborazione automatizzata dei documenti con funzionalità di estrazione intelligente. Questa guida è incentrata sul flusso di lavoro basato su SFTP, che consente di caricare documenti in una cartella condivisa e recuperare automaticamente i risultati elaborati. Cosa realizzerai:
  • Creare e configurare una Process Skill
  • Configurare l’accesso SFTP per input e output
  • Caricare documenti tramite la riga di comando
  • Scaricare i risultati dell’estrazione
Tempo necessario: 15-20 minuti

Passaggio 1: Creare una Process Skill

Una Process Skill è la base del flusso di elaborazione dei documenti in Vantage.
  1. Vai alla sezione Documents in ABBYY Vantage.
  2. Fai clic su Skill Designer nella barra laterale sinistra.
  3. Seleziona Process Skill dai tipi di skill disponibili.
Selecting Process Skill
  1. Nella finestra di dialogo Create Process skill, inserisci:
    • Skill Name: Un nome descrittivo per il processo (ad es. “Process Skill Test 1”)
    • Description: Descrizione facoltativa delle funzionalità di questa skill
    • Technology Core Version: 3.0 (consigliata)
Naming Process Skill
  1. Fai clic su Create

Passaggio 2: Configurare il workflow della Process Skill

Dopo aver creato la tua skill, imposterai il flusso di elaborazione dei documenti.
  1. In Skill Designer, vedrai il pannello Select Process Skill sulla destra
  2. Scegli Simple Document skill workflow per elaborare singoli tipi di documento
Selecting Simple Workflow Questo crea un workflow preconfigurato con:
  • connettore Input: punto in cui i documenti entrano nel sistema
  • skill OCR: Optical Character Recognition (OCR)
  • skill Extract: estrazione dei dati
  • connettore Output: punto in cui i risultati vengono consegnati
Il workflow verrà visualizzato nell’area centrale mostrando: Input → OCR → Extract → Output

Passaggio 3: Configurare l’Input tramite SFTP

Configura l’attività Input per ricevere documenti tramite SFTP.
  1. Fai clic sull’attività Input nel workflow.
  2. Nel pannello Actions a destra, seleziona Select additional source.
  3. Seleziona l’opzione Shared folder.
  4. Fai clic su Settings per configurare.
Configuring Input Activity

Configurare le impostazioni di input

Nella finestra di dialogo Input Settings: Shared Folder: Input Settings Dialog Impostazioni cartella:
  • Folder name: Input (predefinito)
  • Import method: Single file
Credenziali per l’importazione (visualizzate per tuo riferimento):
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: Un UUID generato (ad esempio, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Visualizzata con un’opzione mostra/nascondi
Nota: Copia queste credenziali: ti serviranno per connetterti tramite SFTP. I file che non possono essere importati verranno spostati nella cartella delle eccezioni. Vantage controlla la presenza di file ogni 20 secondi dopo la pubblicazione della Skill.
  1. Fai clic su Save.

Passaggio 4: Configurare l’output tramite SFTP

Configura l’attività Output per recapitare i risultati tramite SFTP.
  1. Fai clic sull’attività Output nel flusso di lavoro.
  2. Nel pannello Actions, seleziona Select additional destination.
  3. Seleziona l’opzione Shared folder.
  4. Fai clic su Settings per configurare.
Configurazione dell'attività Output

Configurare le impostazioni di output

Nella finestra di dialogo Output Settings: Shared Folder: Output Settings Dialog Informazioni:
  • Folder name: Output (predefinito)
  • Folder: .../Output
  • Username: Un UUID generato (ad es. 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Visualizzata con un’opzione mostra/nascondi
Dati esportati:
  • Fields (JSON): Formato di esportazione predefinito
Nota: I risultati sono organizzati in sottocartelle denominate in base al file sorgente e all’ID della transaction (ad es. invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). I file vengono rimossi automaticamente in base ai criteri di conservazione dei dati.
  1. Fare clic su Save.

Step 5: Configurare le skill di estrazione

Configura quali tipi di documento l’attività Extract deve riconoscere ed elaborare.
  1. Fai clic sull’attività Extract nel flusso di lavoro.
  2. Nel pannello Actions, vedrai Document Skills.
Configuring Extraction Skills Le Document skill disponibili sono:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Seleziona i tipi di documento pertinenti al tuo caso d’uso.
  2. Fai clic su Add Skill se hai bisogno di tipi di documento aggiuntivi.
  3. Usa Edit Mapping per personalizzare l’estrazione dei field, se necessario.

Step 6: Pubblica e ottieni l’ID dello Skill

Prima di poter utilizzare SFTP, devi pubblicare lo Skill e individuarne l’ID.
  1. Fai clic sul pulsante Publish in alto a destra in Skill Designer.
  2. Dopo la pubblicazione, annota lo Skill ID dall’URL del browser.
Getting Skill ID from URL Il formato dell’URL è:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Ad esempio: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Attenzione: Tieni a portata di mano il tuo Skill ID: ti servirà per accedere alle cartelle Input e Output corrette in SFTP.

Passaggio 7: Connessione a SFTP

Ora sei pronto per connetterti via SFTP utilizzando le credenziali ottenute dalle impostazioni di input/output.

Dettagli di connessione

Nelle impostazioni di Input/Output sono indicati:
  • Server: 172.172.228.138
  • Porta: 2022
  • Nome utente: UUID generato
  • Password: password generata
  • Percorso base: /{skill-id}/

Collegarsi dal terminale

Apri il terminale e collegati usando:
sftp -P 2022 {username}@172.172.228.138
Esempio:
sftp -P 2022 [email protected]
Nota: usa l’opzione -P maiuscola per il numero di porta in SFTP (l’opzione -p minuscola viene usata per uno scopo diverso). Quando richiesto, inserire la password.

Passaggio 8: Esplorare la struttura delle cartelle SFTP

Una volta effettuata la connessione, vedrai il prompt SFTP: sftp>

Visualizzare le Skill disponibili

Elenca tutte le Process Skills disponibili:
sftp> ls
Accesso alle cartelle delle Skill Vedrai le cartelle per ogni skill (identificate dal rispettivo ID skill), oltre a:
  • Catalogs - Cataloghi di Document skill
  • Catalogs-exception - Importazioni di cataloghi non riuscite
  • skills-import - Directory di importazione delle skill
Usa l’ID della skill dal Passaggio 6:
sftp> cd {your-skill-id}
sftp> ls
Dovresti visualizzare tre cartelle:
  • Input - Dove carichi i documenti da elaborare
  • Input-exception - Qui vengono spostate le importazioni non riuscite
  • Output - Dove appaiono i risultati elaborati

Passaggio 9: Carica i documenti per l’elaborazione

Vai alla cartella Input e carica i documenti.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Carica un singolo file

Carica un file indicando il percorso completo:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
In alternativa, cambia prima la directory locale:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Caricamento e scaricamento dei file

Carica più documenti

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Nota: I file caricati in Input vengono eliminati automaticamente dopo l’elaborazione completata con successo (di solito entro 20 secondi). Se non vedi più il tuo file dopo il caricamento, significa che Vantage lo ha già acquisito per l’elaborazione!

Verifica il caricamento

Verifica se i file sono ancora presenti nella cartella Input:
sftp> ls
Se la cartella è vuota o il tuo file non è presente, l’elaborazione è stata avviata.

Passaggio 10: Controllare lo stato dell’elaborazione

Monitorare la cartella Input-exception

Se un file non viene importato correttamente, apparirà qui:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Una cartella vuota indica che tutti i file sono stati importati correttamente.

Attendere l’elaborazione

Il tempo di elaborazione varia in base a:
  • Complessità del documento
  • Skill di estrazione configurate
  • Carico attuale del sistema
In genere, le fatture semplici vengono elaborate entro 30-60 secondi.

Passaggio 11: scaricare i risultati elaborati

Al termine dell’elaborazione, i risultati compaiono nella cartella Output.
sftp> cd ..
sftp> cd Output
sftp> ls

Comprendere la struttura dell’output

I risultati sono organizzati in sottocartelle con il seguente schema di denominazione:
{original-filename}-{transaction-id}
Esempio:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Visualizzare il contenuto della cartella dei risultati

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Contenuti tipici:
  • Invoice_US.json - Dati estratti in formato JSON
  • Invoice_US.csv - Dati estratti in formato CSV (se previsto)
  • File aggiuntivi a seconda delle impostazioni di output

Scarica i risultati

Imposta la directory locale di download:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Scarica un singolo file:
sftp> get Invoice_US.json
Scarica tutti i file della cartella:
sftp> mget *
Scarica ricorsivamente l’intera cartella dei risultati:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Comprendere l’output JSON

L’output predefinito è un file JSON che contiene:
  • Struttura del documento - Layout e organizzazione
  • Valori dei field estratti - Dati estratti dal documento
  • Punteggi di confidenza - Affidabilità di ciascuna estrazione
  • Errori delle regole - Eventuali problemi di validazione
  • Metadati dei field - Informazioni aggiuntive su ciascun field
Struttura di esempio:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Per una documentazione dettagliata sullo schema JSON, fare riferimento alla documentazione dell’API Vantage di ABBYY.

Comandi SFTP utili

CommandDescriptionExample
lsElenca i file remotils
llsElenca i file localills
pwdMostra la directory remotapwd
lpwdMostra la directory localelpwd
cd folderCambia la directory remotacd Output
lcd folderCambia la directory localelcd ~/Downloads
put fileCarica un singolo fileput invoice.pdf
mput filesCarica più filemput *.jpg
get fileScarica un singolo fileget result.json
mget filesScarica più filemget *
get -r folderScarica una cartella in modo ricorsivoget -r results/
exitTermina la connessioneexit

Risoluzione dei problemi

Problemi di connessione

Problema: errori “Connection refused” o di timeout Soluzioni:
  • Verifica di essere connesso alla VPN aziendale
  • Controlla il numero di porta (deve essere 2022 con -P maiuscola)
  • Conferma che nome utente e password siano corretti
  • Verifica la connettività di rete di base: ping 172.172.228.138

Problemi di caricamento

Problema: I file non vengono elaborati Soluzioni:
  • Controllare nella cartella Input-exception le importazioni non riuscite
  • Verificare che il formato del file sia supportato (PDF, JPG, PNG, TIFF, ecc.)
  • Assicurarsi che la Process Skill sia pubblicata
  • Verificare i limiti di dimensione dei file (variano in base alla configurazione)

Nessun file di output

Problema: La cartella di output è vuota dopo il caricamento Soluzioni:
  • Attendere più a lungo: l’elaborazione può richiedere 30-60 secondi o più
  • Verificare che Output sia configurato con destinazione “Shared folder”
  • Controllare i log della transazione nell’interfaccia web di Vantage
  • Verificare che l’attività Extract abbia configurate le Document skill appropriate

Errori di autorizzazione

Problema: “Permission denied” durante il caricamento o il download Soluzioni:
  • Verifica di utilizzare le credenziali corrette per Input e Output
  • Le credenziali di Input consentono: caricamento, eliminazione
  • Le credenziali di Output consentono: visualizzazione, download, rinomina, eliminazione
  • Verifica che la skill sia pubblicata e attiva

Buone pratiche

Sicurezza

  • Non condividere mai le credenziali SFTP in chiaro
  • Usa canali sicuri per trasmettere le password
  • Ruota periodicamente le credenziali
  • Limita l’accesso SFTP al solo personale necessario

Gestione dei file

  • Utilizza nomi di file descrittivi che includano date o ID
  • Elabora i file in batch durante le ore di minor carico, se possibile
  • Scarica e archivia tempestivamente i risultati
  • Pulisci regolarmente le vecchie cartelle dei risultati

Monitoraggio

  • Controlla regolarmente la cartella Input-exception per individuare le importazioni non riuscite
  • Monitora i tempi di elaborazione per identificare eventuali colli di bottiglia
  • Esamina i punteggi di attendibilità dell’estrazione nei risultati
  • Configura avvisi per gli errori critici (se disponibili)

Ottimizzazione del workflow

  • Raggruppa i tipi di documento simili
  • Configura le Document skill appropriate per il tuo caso d’uso
  • Esegui test con documenti di esempio prima di passare alla produzione
  • Documenta il tuo workflow SFTP come riferimento per il team

Prossimi passaggi

Ora che disponi di una pipeline di elaborazione dei documenti basata su SFTP già funzionante:
  1. Esegui test con vari documenti - Carica diversi tipi di file e varianti di documenti
  2. Verifica la precisione di estrazione - Controlla i risultati JSON e i punteggi di confidenza
  3. Personalizza l’estrazione - Usa Edit Mapping per perfezionare l’estrazione dei field
  4. Automatizza i caricamenti - Crea script per automatizzare il caricamento dei file
  5. Integra con i sistemi - Collega le tue applicazioni tramite la Vantage REST API
  6. Scala il tuo flusso di lavoro - Aggiungi altri Document skill o crea ulteriori Process skill
Per configurazioni avanzate, integrazione tramite API o flussi di lavoro personalizzati, consulta la documentazione di ABBYY Vantage.

Risorse aggiuntive

  • Documentazione REST API: Per il caricamento dei file tramite API e il recupero dei risultati
  • Skill Catalog: Esplora le Document skill predefinite
  • Supporto: Contatta il supporto ABBYY per assistenza tecnica

Hai completato con successo:
  • ✅ Creato una Process skill in ABBYY Vantage
  • ✅ Configurato l’accesso SFTP per input e output
  • ✅ Impostato le skill per l’estrazione dei documenti
  • ✅ Effettuato la connessione tramite la riga di comando SFTP
  • ✅ Caricato i documenti per l’elaborazione
  • ✅ Scaricato i risultati dell’estrazione
La tua pipeline di elaborazione dei documenti è ora operativa e pronta per l’uso in produzione!