Vai al contenuto principale
Questo oggetto consente di accedere a vari parametri di un singolo carattere del testo riconosciuto: la formattazione, il rettangolo nell’immagine, la lingua di riconoscimento e le ipotesi di riconoscimento. Tutte le proprietà booleane di un oggetto di questo tipo appena creato sono impostate su FALSE.
Se si desidera lavorare con i parametri di uno specifico carattere nel testo riconosciuto, è necessario prima chiamare una delle funzioni che eseguono la sintesi (ad esempio, il metodo Process o Synthesize dell’oggetto FRDocument), poiché questi parametri acquisiscono significato solo dopo la sintesi.
Se il carattere proviene dal testo di un biglietto da visita, vengono impostate solo le seguenti proprietà dell’oggetto:
  • BaseLine
  • Bottom
  • Left
  • Right
  • Top
  • IsSuspicious
  • ErrorProbability
  • CharacterRegion
  • CharacterRecognitionVariantIndex
  • CharacterRecognitionVariants
  • SelectedCharacterRecognitionVariant
  • WordRecognitionVariants
  • IsFromSourceContent
  • IsWordFirst
  • IsWordLeftmost

Proprietà

,read-only

Returns the Engine object.

Specifies the ID of the language of the character. To convert it to Win32 LCID use themethod.

By default, this property is initialized with the system default language ID.

Stores and allows you to set internal name of the language for a character.

If onebase recognition languagecorresponds to one recognized word, the LanguageName property for each character in this word is set to the internal name of the base language after recognition. If several base recognition languages correspond to one word (e.g., for bilingual compound words), the LanguageName property for the characters in this word is empty. While the LanguageId property contains the identifier of the base language no matter what the recognized word is.

By default, the value of this property is an empty string.

Specifies the character exact region. The region may not be rectangular and initially is contained in the rectangle defined by the Left, Top, Right, and Bottom properties. If you change the character exact region, the Left, Top, Right, and Bottom properties are not changed.

The property is only available after recognition with theproperty set to TRUE.

La proprietà restituisce un oggetto costante. Per modificare la regione esatta del carattere, occorre prima ottenere un oggetto Region intermedio utilizzando il metodoIEngine::CreateRegion, modificare i parametri necessari e quindi assegnare l’oggetto ottenuto alla proprietà.

, read-only

Memorizza la coordinata del bordo inferiore del rettangolo del carattere. Questo rettangolo è definito sull’immagine, senza tenere conto dell’orientamento del testo. Potrebbe non essere definito, nel qual caso tutte e quattro le coordinate sono pari a zero. Questa proprietà non può essere modificata direttamente, ma tramite il metodo SetRect.

The default value of this property is 0.

, read-only

Memorizza la coordinata del bordo sinistro del rettangolo del carattere. Questo rettangolo è definito sull’immagine, senza tenere conto dell’orientamento del testo. Potrebbe non essere definito, nel qual caso tutte e quattro le sue coordinate sono pari a zero. Questa proprietà non può essere modificata direttamente, ma tramite il metodo SetRect.

The default value of this property is 0.

, read-only

Memorizza la coordinata del bordo destro del rettangolo del carattere. Questo rettangolo è definito sull’immagine, senza tenere conto dell’orientamento del testo. Potrebbe non essere definito, nel qual caso tutte e quattro le sue coordinate sono pari a zero. Questa proprietà non può essere modificata direttamente, ma tramite il metodo SetRect.

Il valore predefinito di questa proprietà è 0.

, di sola lettura

Memorizza la coordinata del bordo superiore del rettangolo del carattere. Questo rettangolo è definito sull’immagine, indipendentemente dall’orientamento del testo. Può essere indefinito; in tal caso tutte e quattro le sue coordinate sono zero. Questa proprietà non può essere modificata direttamente, ma solo tramite il metodo SetRect.

Il valore predefinito di questa proprietà è 0.

Specifica se il carattere è il più a sinistra all’interno di una parola.

In situazioni complesse (ad esempio due parole non separate da uno spazio, oppure una parola contenente un segno di punteggiatura senza spazi) questa proprietà potrebbe non funzionare correttamente. Il riconoscitore potrebbe modificare l’ipotesi sul numero di parole dopo che i flag per i caratteri sono stati impostati.

Questa proprietà viene impostata durante la sintesi. Se viene chiamata prima del completamento della sintesi, il valore predefinito è FALSE.

Per ilcinese, il giapponese o il coreanoquesta proprietà non è affidabile, poiché le parole non vengono rilevate.

Specifica se il carattere è il primo all’interno di una parola.

Questa proprietà viene impostata durante la sintesi. Se viene chiamata prima del completamento della sintesi, il valore predefinito è FALSE.

Note:

  • Per le lingue con direzione di scrittura da destra a sinistra (ad es. l’ebraico), questa proprietà indicherà il carattere più a destra nella parola.
  • Per ilcinese, il giapponese o il coreanoquesta proprietà non è affidabile, poiché le parole non vengono rilevate.

Imposta lo scostamento di un carattere dalla linea di base della stringa in pixel. La linea di base della stringa è definita dalla proprietà. Questa proprietà viene utilizzata principalmente per le immagini incorporate nel testo.

Il valore predefinito di questa proprietà è 0.

Specifica la spaziatura aggiuntiva tra i caratteri in twip. Un twip corrisponde a 1/20 di punto, e un punto corrisponde a 1/72”.

Il valore predefinito di questa proprietà è 0.

Memorizza la scala orizzontale di un carattere in unità di 1/1000.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Il valore predefinito è 1000, che corrisponde all’assenza di ridimensionamento.

Imposta il valore RGB del colore per il simbolo. Il colore di sfondo è definito per l’intero paragrafo dalla proprietà.

Il valore di questa proprietà può essere -1, il che indica che il colore è trasparente.

Il valore int viene calcolato dalla tripletta RGB con la formula: ( valore rosso ) + (256 x valore verde ) + (65536 x valore blu ), dove il valore rosso è il primo componente della tripletta, il valore verde è il secondo e il valore blu è il terzo. Ad esempio, il valore int del colore bianco è 16777215.

Per impostazione predefinita, il colore del testo è nero, ovvero RGB(0,0,0).

Specifica se il carattere è in grassetto.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere è in corsivo.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere è sottolineato.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere è barrato.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere è in pedice. Non può essere impostata su TRUE contemporaneamente alla proprietà IsSuperscript, in quanto ciò causerebbe errori durante l’esportazione del testo riconosciuto.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere è in apice. Non può essere impostata su TRUE contemporaneamente alla proprietà IsSubscript, in quanto ciò causerebbe errori durante l’esportazione del testo riconosciuto.

Se il carattere è ottenuto dal testo di un biglietto da visita, questa proprietà assume il valore predefinito.

Questa proprietà è FALSE per impostazione predefinita.

Specifica se il carattere ha lo stile “maiuscoletto”. Ciò significa che i caratteri minuscoli vengono visualizzati come maiuscole in formato ridotto.

Questa proprietà è FALSE per impostazione predefinita.

, di sola lettura

Memorizza il nome del font per un carattere. Questa proprietà non può essere modificata direttamente, ma solo tramite il metodo SetFont.

Il valore predefinito è “Times New Roman”.

Specifica l’altezza del font del carattere in twip. Un twip corrisponde a 1/20 di punto, e un punto corrisponde a 1/72”.

Il valore predefinito di questa proprietà corrisponde a 10 punti o 200 twip.

Consente di accedere allo stile del font del carattere.

, di sola lettura

Memorizza il tipo di font per un carattere. Questa proprietà non può essere modificato direttamente ma tramite il metodo SetFont.

Per impostazione predefinita, questo valore è FT_Unknown.

Restituisce TRUE se il carattere è stato riconosciuto in modo non affidabile. Utilizzare questa proprietà per determinare se è necessaria la verifica.

Questa proprietà viene calcolata in base al valore ErrorProbability e alle impostazioni di riconoscimento. Se è necessario implementare distinzioni più dettagliate per la verifica, utilizzare invece ErrorProbability.

Per impostazione predefinita, questa proprietà è FALSE.

, di sola lettura

Restituisce la probabilità stimata (nell’intervallo da 0 a 100) che il carattere sia stato riconosciuto in modo errato.

La probabilità di errore tiene conto dell’intero contesto, motivo per cui è disponibile solo per il risultato del riconoscimento e non per ogni variante di riconoscimento del carattere. Per confrontare le varianti di riconoscimento tra loro, utilizzare.

La probabilità di errore non viene calcolata per i simboli ottenuti senza riconoscimento, ad esempio quelli estratti direttamente dal file PDF di origine.

,di sola lettura

Restituisce una raccolta di varianti di riconoscimento del carattere.

La proprietà contiene zero per i caratteri non stampabili (spazi, ritorni a capo, ecc.) e per i caratteri che non sono stati riconosciuti ma aggiunti al testo durante la modifica esplicita. Zero viene restituito anche se il testo è stato riconosciuto da una delle versioni precedenti di ABBYY FineReader Engine.

Se la proprietàè impostata su FALSE, la raccolta restituita contiene un elemento; in caso contrario, la raccolta contiene almeno un elemento e le varianti sono ordinate dalla migliore alla peggiore.

, di sola lettura

Memorizza l’indice della variante di riconoscimento del carattere selezionata nella raccolta CharacterRecognitionVariants.

,di sola lettura

Memorizza la variante di riconoscimento del carattere selezionata. Corrisponde all’elemento con indice CharacterRecognitionVariantIndex nella raccolta delle varianti di riconoscimento del carattere (proprietà CharacterRecognitionVariants).

,di sola lettura

Restituisce una raccolta di varianti di riconoscimento per la parola a cui appartiene il carattere.

La proprietà contiene zero per i caratteri non stampabili (spazi, ritorni a capo, ecc.) e per i caratteri che non sono stati riconosciuti ma aggiunti al testo durante la modifica esplicita. Zero viene restituito anche se il testo è stato riconosciuto da una delle versioni precedenti di ABBYY FineReader Engine.

Se la proprietàè impostata su FALSE, la raccolta restituita contiene un elemento; in caso contrario, la raccolta contiene almeno un elemento e le varianti sono ordinate dalla migliore alla peggiore, in base al meccanismo di stima interno.

, di sola lettura

Specifica se il carattere è stato estratto dal contenuto testuale del file di input senza riconoscimento. Ad esempio, può essere estratto da un file PDF con un livello di testo.

Indica se è stato eseguito un controllo ortografico su questo carattere. Non viene utilizzato né impostato internamente da ABBYY FineReader Engine e fornisce semplicemente un framework per la gestione dell’ortografia.

Metodi

NomeDescrizione
CopyFromInizializza le proprietà dell’oggetto corrente con i valori delle proprietà corrispondenti di un altro oggetto.
SetFontImposta un nuovo font per il simbolo.
SetRectImposta un nuovo rettangolo per il simbolo.
CharParams Diagramma degli oggetti

Parametro di output

Questo oggetto è il parametro di output dei seguenti metodi:

Parametro di input

Questo oggetto viene passato come parametro di input nei seguenti metodi:

Esempi

int suspiciousCharsCount = 0;
// Calcola il numero di caratteri sospetti in un blocco di testo
void computeStatisticsForBlock(FREngine.IBlock block)
{
 if (block.Type == FREngine.BlockTypeEnum.BT_Text)
 {
  FREngine.ITextBlock textBlock = block.GetAsTextBlock();
  int paragraphsCount = textBlock.Text.Paragraphs.Count;
  for (int iPar = 0; iPar < paragraphsCount; iPar++)
  {
   FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
   string text = par.Text;
   FREngine.ICharParams charParams = engine.CreateCharParams();
   for (int iChar = 0; iChar < text.Length; iChar++)
   {
    par.GetCharParams(iChar, charParams);
    if (charParams.IsSuspicious)
    {
     suspiciousCharsCount++;
    }
   }
  }
 }
}
L’oggetto viene utilizzato nei seguenti esempi di codice: RecognizedTextProcessing (Win) e nei Demo Tools di Windows: Profili di elaborazione predefiniti dell’Engine.

Vedi anche

Paragraph Qual è la differenza tra CharConfidence, ErrorProbability e IsSuspicious? Lavorare con il testo Lavorare con le proprietà