release 7
Correzioni di sicurezza
Profili predefiniti
apertura e preelaborazione delle immagini
La preelaborazione automatica delle immagini è stata migliorata. Molte impostazioni non sono più necessarie e alcune sono state spostate da PrepareImageMode a PagePreprocessingParams. Per maggiori dettagli, consulta Version 12 Release 7 Changes.- Per velocizzare la preparazione delle immagini, puoi impostare il tipo di documento (IPrepareImageMode::DocumentType) se è noto, così da evitare di eseguire il classificatore di documenti.
- Nuovi formati di input: HEIF, SVG, WebP.
- Tipo di documento per disegni tecnici con numerosi frammenti di testo orientati in varie direzioni (DocumentTypeEnum::DT_TechnicalDrawing).
Esportazione
- Ora è possibile esportare i dati estratti dal documento in formato JSON (JsonExportParams).
miglioramento dell’OCR e dell’ICR
- Ora è possibile rilevare i segni di spunta durante l’analisi del layout (IPageAnalysisParams::DetectCheckmarks)
- Modalità di analisi speciale per documenti con layout complesso e tabelle (IPageAnalysisParams::AnalysisMode)
- Una nuova impostazione consente di salvare i timbri come immagini (IPageAnalysisParams::DetectStamps)
- Oltre al testo in stampatello, ora viene riconosciuto anche quello scritto a mano in inglese, spagnolo, francese, tedesco e giapponese (IPageAnalysisParams::DetectHandwritten, TextTypeEnum::TT_Handwritten)
- Una nuova proprietà, simile a una probabilità, che stima l’accuratezza del riconoscimento dei caratteri (IPlainText::ErrorProbability, ICharParams::ErrorProbability)
Esempi di codice per Windows
- Nuovo esempio HelloBCR per .NET Core
- Nuovo esempio DataExtraction per .NET Core
release 5
Riconoscimento delle lingue nuovo e migliorato
- Riconoscimento del bengalese
- Riconoscimento della lingua speciale Arabic_Amount su Windows
Miglioramenti dell’OCR e dell’ICR
- È ora possibile eseguire la sintesi dei biglietti da visita utilizzando parametri aggiuntivi (IFRPage::SynthesizeBusinessCardEx, ISynthesisParamsForPage::BusinessCardSynthesisParams)
- Ora è possibile usare la nuova modalità di riconoscimento Accurate (IRecognizerParams::Mode)
- Nuova proprietà per verificare la presenza di barcode, esclusi quelli postali (IBarcodeParams::EnableBarcodesCheck)
- Ora è possibile rilevare il tipo di barcode, esclusi quelli postali, con la costante BT_AutodetectWithoutPostal (BarcodeTypeEnum)
- ABBYY FineReader Engine ora riconosce i codici Japanese Postal Customer Code (BarcodeTypeEnum, Tipi di barcode)
Apertura e preelaborazione delle immagini
- Ora è possibile caricare i documenti salvati nelle versioni precedenti supportate di ABBYY FineReader Engine (IFRDocument::ConvertFromOldVersion)
- È ora possibile ottenere informazioni sulla presenza di una firma digitale in un documento (IFRDocument::SourceHasDigitalSignature, IFRPage::SourceHasDigitalSignature)
- È ora possibile verificare l’affidabilità del livello di testo (IFRDocument::CheckTextLayer)
- Modalità predefinita migliorata per l’elaborazione dei file PDF nativi digitali (SourceContentReuseModeEnum::CRM_Auto)
- È ora possibile modificare l’aspetto del file PDF di output (ITextLayerInjectionParams::AllowChangePDFAView)
- È ora possibile identificare e aprire file di tipo PDF Portfolio (IEngine::IsPdfPortfolio, IEngine::IsPdfPortfolioFromStream, IFRDocument::AddImageFileFromAttachment)
Esportazione
- L’esportazione in ALTO ora supporta le versioni ALTO 4.0, 4.1 e 4.2 (AltoVersionEnum)
- Nuove modalità di incorporamento dei font nei file PDF di output (FontEmbeddingModeEnum)
- Nuove interfacce per aggiungere ai PDF di output immagini definite dall’utente (IPDFPictures, IPDFPicture)
- I formati XLS e XPS sono ora disponibili per l’esportazione dei documenti (XLExportParams, XPSExportParams) in Linux e macOS
Esempi di codice
- Nuovo esempio Hello per .NET Core
Altri miglioramenti
- È possibile ottenere informazioni sulle dimensioni della memoria allocata per l’oggetto documento (IFRDocument::AllocatedSize)
- Nuove opzioni per il rilascio di una licenza online (IEngine::ReleaseOnlineLicense, “Release Online Licenses…” nell’utilità License Manager) in Linux e Windows
- Il programma di installazione di ABBYY FineReader Engine per Windows ora utilizza Windows Installer XML Toolset (WiX)
- Nuova opzione LICENSEDATADIR per modificare la cartella usata per archiviare le informazioni ausiliarie (Installing the ABBYY FineReader Engine Library in Automatic Mode) in Windows
- ABBYY FineReader Engine 12 ora può essere eseguito in Azure Services in Windows
- Ora è possibile ottenere la data di rinnovo delle limitazioni della licenza relative al numero di pagine elaborate (ILicense::VolumeRefreshingDate)
- Nuova sottosezione che descrive l’esecuzione del servizio di gestione delle licenze come utente non root (Installing the Licensing Service) in Linux
Release 4
Funzionalità speciali
- È possibile confrontare due documenti oppure due pagine (IComparator::CompareDocuments, IComparator::ComparePages)
- I metodi dell’API di confronto dei documenti consentono di rilevare le modifiche nel testo (IChange::GetAsTextChange) e di esportare il risultato del confronto in formato XML o DOCX (IComparisonResult::Export)
- In Windows, è possibile aggiornare il codice che utilizza ABBYY ScanDifFinder SDK a un’API di confronto dei documenti implementata in ABBYY FineReader Engine (Guida alla migrazione da ScanDifFinder SDK all’API di confronto dei documenti)
miglioramento dell’OCR e dell’ICR
- Nuovi barcode postali supportati: KIX, Royal Mail 4-State, Australian Post 4-State (BarcodeTypeEnum, Tipi di Barcode)
Apertura e preelaborazione delle immagini
- Il layout del documento può essere salvato in un flusso e letto da un flusso (ILayout::SaveToStream, IEngine::CreateLayoutFromStream) oppure salvato come array di byte (ILayout::SaveToArray)
Esportazione
- L’esportazione in PDF consente di impostare l’orientamento della pagina (IPDFExportFeatures::PageOrientation)
- L’esportazione in RTF consente di regolare i margini della pagina (IRTFExportParams::PageMargins) e di aumentare le dimensioni della pagina se il contenuto non vi entra (IRTFExportParams::IncreasePaperSizeToFitContent)
- L’esportazione in XLSX supporta l’incorporamento delle immagini nel documento di output (IXLExportParams::WritePictures, IXLExportParams::PictureExportParams)
Esempi di codice
- Nuovo strumento dimostrativo per Windows Document Comparison e nuovo esempio Document Comparison. Mostrano come confrontare un documento o una pagina con un altro.
- Esempio CommandLineInterface aggiornato per Linux e Windows.
- Nuovo esempio CommandLineInterface per macOS. Questo esempio fornisce l’interfaccia a riga di comando di ABBYY FineReader Engine
- Nuovo esempio SAFEARRAY_Hello per macOS. Questo esempio illustra l’elaborazione dei documenti con il tipo SAFEARRAY
Altri miglioramenti
Linux e Windows
- Una licenza online limita il numero di core CPU disponibili per una workstation.
- Una licenza online ora richiede l’uso di GoDaddy Trusted Root Certification Authority sul computer in cui è installato il servizio di gestione delle licenze.
- L’elenco dei parametri per l’installazione silenziosa è stato aggiornato per Linux.
Release 3
Funzionalità speciali
- Ora è possibile estrarre la MRZ dalle immagini del documento (IFRPage::ExtractMrz)
- I dati estratti dalla MRZ contengono field e righe (MrzField, MrzData, MrzLine) con informazioni sul documento e sul relativo titolare e possono essere esportati in un file XML o in un file JSON
Nuove e migliorate funzionalità di riconoscimento delle lingue
- Riconoscimento del georgiano
- Riconoscimento delle formule matematiche
Apertura e pre-elaborazione delle immagini
- Ora è possibile aprire documenti nativi digitali con gli stessi metodi usati per aprire le immagini in Linux e Windows; i documenti digitali verranno convertiti e il relativo contenuto verrà caricato (OfficeConversionSettings, OfficeConverters)
- È possibile impostare la soglia di binarizzazione durante la pre-elaborazione dell’immagine (IPrepareImageMode::BinarizationThreshold)
- In Linux e Windows, la modalità di gestione in memoria delle pagine del documento può essere impostata prima della conversione delle immagini di input (IBatchProcessor::PageFlushingPolicy)
Esportazione
- Le date di creazione e di modifica ora possono essere visualizzate e modificate. Inoltre, è possibile impostare la modalità di scrittura delle date nel documento di output (DocumentContentInfo::CreationDate, DocumentContentInfo::ModificationDate, DocumentContentInfoWritingParams::WriteCreationDate, DocumentContentInfoWritingParams::WriteModificationDate). Nel documento possono essere scritte solo date in formato corretto. Se durante l’esportazione si verifica un errore, specificare la data nel formato corretto oppure modificarne la modalità di scrittura e richiamare il metodo di esportazione (Handling Errors During PDF/XPS Export)
- Formato orario originale nel documento di output (TimeZoneTypeEnum)
Esempi di codice
- Nuovo esempio MRZExtraction per Linux e Windows. Questo esempio mostra come estrarre dati da una zona a lettura ottica (MRZ)
- Nuovo esempio di codice per Windows che illustra come implementare un timer che interrompe l’elaborazione se la chiamata a un metodo richiede troppo tempo
- Nuovo esempio ICR per Linux, che mostra come riconoscere il testo manoscritto in stampatello da un’immagine di documento
Altri miglioramenti
- I blocchi di dati ora possono essere ordinati in base alla posizione (ILayout::SortedBlocks)
- Il file del contratto di licenza con l’utente finale è ora disponibile nel ABBYY FineReader Engine Distribution Kit
Linux e Windows
- Amazon Linux AMI è ora supportato in ABBYY FineReader Engine for Linux
- Una licenza online non richiede impostazioni specifiche, ma è necessario configurarene i parametri se si desidera utilizzare la licenza con il server proxy
- Una licenza online può ora essere utilizzata per un numero limitato di connessioni, che può essere modificato al termine del periodo di esecuzione autonoma della licenza
- ABBYY FineReader Engine 12 può ora essere eseguito all’interno di un container Docker
- L’elenco dei Java Development Kit supportati è riportato nei Requisiti di sistema
- Il numero di build di ABBYY FineReader Engine è ora disponibile prima del caricamento dei moduli. È possibile trovarlo nel nome del file JAR incluso in ABBYY FineReader Engine Distribution Kit
release 2
Funzionalità speciali
- Le tecnologie di classificazione aggiornate supportano la classificazione in base alle caratteristiche dell’immagine, alle caratteristiche del testo riconosciuto oppure a una combinazione di caratteristiche dell’immagine e del testo (ClassifierTypeEnum)
- La classificazione è ora disponibile sia per i documenti che per le pagine (IClassificationEngine::CreateObjectFromDocument, IClassificationEngine::CreateObjectFromPage)
- I nuovi modelli di classificazione possono essere addestrati utilizzando la tecnica di convalida incrociata k-fold (ValidationParams), con informazioni dettagliate sulle prestazioni del modello (ValidationResult)
Novità e miglioramenti nel riconoscimento delle lingue
- Riconoscimento della lingua birmana
- Lingua giapponese (moderna) migliorata per un riconoscimento più accurato dei testi giapponesi che possono includere alcune lettere latine o greche. Ora è disponibile anche per il riconoscimento dei biglietti da visita
- OCR in farsi aggiornato
Miglioramenti dell’OCR e dell’ICR
- Le coordinate sono disponibili per tutte le varianti di riconoscimento dei caratteri (ISynthesisParamsForPage::SaveCharacterCoordinatesForAllVariants)
Apertura e pre-elaborazione delle immagini
- Ora le immagini possono essere ritagliate automaticamente lungo i bordi del documento durante la pre-elaborazione (IPagePreprocessingParams::CropImage)
- È possibile applicare un filtro di riduzione del rumore per migliorare la qualità del riconoscimento (IImageDocument::ApplySigmaFilter)
- È possibile rilevare nell’immagine i quadrati neri di ancoraggio (IImageDocument::FindBlackSquares)
Esportazione
- La versione PDF 2.0 è supportata per l’esportazione
- L’inserimento del livello di testo supporta i file PDF con tag e la conformità allo standard PDF/A in Windows
- L’esportazione in PDF su Windows supporta la crittografia AES-256 oltre a RC4, nonché la conformità a PDF/A-2b e PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- L’esportazione in PDF su Linux supporta la crittografia AES-256 oltre a RC4 e AES-128 (IPDFEncryptionInfo::EncryptionAlgorithm), nonché la conformità a PDF/A-2b e PDF/A-3b (IPDFExportParams::PDFAComplianceMode)
- Supporto completo per PDF conformi a ZUGFeRD: i documenti esportati con IPDFExportFeatures::EnableZugferdCompliance impostato su TRUE ora superano il validatore ufficiale ZUGFeRD
- L’esportazione in Excel supporta l’orientamento del foglio di lavoro da destra a sinistra (IXLExportParams::CreateRtlSheets)
- L’esportazione in ALTO ora supporta la versione ALTO 3.1 (IAltoExportParams::AltoVersion)
- L’esportazione in RTF consente di mantenere più separatori nell’output disattivando il filtro dei separatori (IRTFExportParams::FilterSeparators)
- Supporto migliorato per i separatori puntinati in DOCX
- Supporto per HTML 5.0 (costante HFM_Format50 di HTMLFormatModeEnum)
- Supporto per documenti conformi a PDF/UA (IPDFExportFeatures::EnablePDFUACompliance)
- Modalità avanzate di emulazione del layout per l’esportazione in TXT (ITextExportParams::LayoutRetentionMode)
API di scansione (Windows)
- Il formato della carta e la modalità colore della scansione possono ora essere determinati automaticamente (ScanPaperSizeEnum::SPS_Auto, ScanColorModeEnum::SCM_Auto)
- Le pagine vuote possono essere ignorate e l’inclinazione dell’immagine può essere corretta automaticamente durante la scansione, se queste funzionalità sono supportate dallo scanner (IScanSourceSettings::DiscardBlankPages, IScanSourceSettings::CorrectSkew)
Esempi di codice
- Nuovo esempio di codice che illustra la Classification (Windows) e la Classification (Linux e macOS) di documenti di qualsiasi tipo
- Esempio Windows EnginesPool aggiornato per Java
- Nuovi esempi di codice Linux Hello (Outproc) e Multithreading per C++ e Java. Gli esempi illustrano l’elaborazione delle immagini con l’Engine caricato come server out-of-process in un processo separato
- Nuovo esempio Linux SAFEARRAY_Hello. Questo esempio illustra l’elaborazione dei documenti tramite l’utilizzo del tipo SAFEARRAY
Altri miglioramenti per Linux e Windows
- Un modo più semplice per utilizzare FineReader Engine in applicazioni Java multithread in Windows (implementazione di EnginesPool aggiunta al wrapper Java)
- Procedura unificata di caricamento di Engine per tutti i tipi di licenza, inclusa la licenza online, così da non dover riscrivere il codice quando si passa da un tipo di licenza a un altro. Vedere InitializeEngine e IEngineLoader::InitializeEngine (Windows)
- Ora è possibile implementare applicazioni multithread in C++ su Linux
