Regole delle espressioni regolari
| Nome elemento | Simbolo convenzionale dell’espressione regolare | Esempi di utilizzo e spiegazioni | ||
|---|---|---|---|---|
| Qualsiasi carattere | . | c.t — indica parole come “cat”, “cot” | ||
| Carattere appartenente a un intervallo di caratteri | [] | [b-d]ell — indica parole come “bell”, “cell”, “dell” [ty]ell — indica le parole “tell” e “yell” | ||
| Carattere non appartenente a un intervallo di caratteri | [^] | [^y]ell — indica parole come “dell”, “cell”, “tell”, ma esclude “yell” [^n-s]ell — indica parole come “bell”, “cell”, ma esclude “nell”, “oell”, “pell”, “qell”, “rell” e “sell” | ||
| Oppure | \ | c(a\ | u)t — indica le parole “cat” e “cut” | |
| 0 o più occorrenze consecutive | * | 10* — indica i numeri 1, 10, 100, 1000 e così via | ||
| 1 o più occorrenze consecutive | + | 10+ — consente i numeri 10, 100, 1000 e così via, ma esclude 1. | ||
| Lettera o cifra | [0-9a-zA-Z] | [0-9a-zA-Z] — consente un singolo carattere; [0-9a-zA-Z]+ — consente qualsiasi parola | ||
| Lettera latina maiuscola | [A-Z] | <br /> | ||
| Lettera latina minuscola | [a-z] | <br /> | ||
| Lettera cirillica maiuscola | [А-Я] | <br /> | ||
| Lettera cirillica minuscola | [а-я] | <br /> | ||
| Cifra | [0-9] | <br /> | ||
| Spazio | [\s] | <br /> | ||
| Carattere di sistema | @ | <br /> | ||
| Parola dal dizionario | @(Dictionary) | Il parametro Dictionary imposta il percorso del dizionario utente da cui devono essere prese le parole. Esempio di percorso Linux: @(/opt/MyDictionary.amd) esempio di percorso macOS: “/Users/user/Documents/MyDictionary.amd In Windows, le barre rovesciate nel percorso devono essere raddoppiate. Ad esempio: @(D:\MyFolder\MyDictionary.amd). <Note> Alcuni linguaggi di programmazione (come C++) richiedono di usare l’escape delle barre rovesciate nelle stringhe letterali. In questo caso, saranno necessarie due barre rovesciate con escape, con il risultato di una barra rovesciata quadruplicata. In C++, l’esempio precedente apparirà così: </Note> L"@(D:\\\\\\\\MyFolder\\\\\\\\MyDictionary.amd)" |
- Alcuni caratteri usati nelle espressioni regolari sono “ausiliari”, cioè vengono usati per scopi di sistema. Come puoi vedere dall’elenco sopra, questi caratteri includono parentesi quadre, punti e così via. Se desideri inserire un carattere ausiliario come carattere normale, metti una barra rovesciata () davanti a esso. Esempio: [t-v]x+ indica parole come “tx”, “txx”, “txxx” e così via, “ux”, “uxx” e così via, ma [t-v]x+ indica parole come “[t-v]x”, “[t-v]xx”, “[t-v]xxx” e così via.
- Se devi raggruppare determinati elementi di un’espressione regolare, usa le parentesi. Ad esempio, (a|b)+|c indica “c” e qualsiasi combinazione come “abbbaaabbb”, “ababab” e così via (una parola di qualsiasi lunghezza diversa da zero in cui può esserci un numero qualsiasi di a e b in qualsiasi ordine), mentre a|b+|c indica “a”, “c” e “b”, “bb”, “bbb” e così via.
Espressioni regolari di esempio
Uso per l’acquisizione dei dati
- Come risultati del riconoscimento devono essere consentite solo le parole presenti nel dizionario: impostare la proprietà IBaseLanguage::AllowWordsFromDictionaryOnly su TRUE. Questo è necessario per la corrispondenza esatta.
- L’insieme di lettere della lingua di riconoscimento deve contenere solo i caratteri inclusi nell’espressione regolare: specificare la proprietà IBaseLanguage::LetterSet. Questo è necessario perché i caratteri dell’alfabeto della lingua possono essere riconosciuti anche se non corrispondono all’espressione regolare.
- Impostare la proprietà IBaseLanguage::IsNaturalLanguage su FALSE.
Esempi Windows
Codice C#
Codice C#
