Règles des expressions régulières
| Nom de l’élément | Signe conventionnel d’expression régulière | Exemples d’utilisation et explications | ||
|---|---|---|---|---|
| N’importe quel caractère | . | c.t — désigne des mots tels que « cat », « cot » | ||
| Caractère appartenant à une plage de caractères | [] | [b-d]ell — désigne des mots tels que « bell », « cell », « dell » [ty]ell — désigne les mots « tell » et « yell » | ||
| Caractère n’appartenant pas à une plage de caractères | [^] | [^y]ell — désigne des mots tels que « dell », « cell », « tell », mais exclut « yell » [^n-s]ell — désigne des mots tels que « bell », « cell », mais exclut « nell », « oell », « pell », « qell », « rell » et « sell » | ||
| Ou | \ | c(a\ | u)t — désigne les mots « cat » et « cut » | |
| 0 occurrence ou plus à la suite | * | 10* — désigne les nombres 1, 10, 100, 1000, etc. | ||
| 1 occurrence ou plus à la suite | + | 10+ — autorise les nombres 10, 100, 1000, etc., mais exclut 1. | ||
| Lettre ou chiffre | [0-9a-zA-Z] | [0-9a-zA-Z] — autorise un seul caractère ; [0-9a-zA-Z]+ — autorise n’importe quel mot | ||
| Lettre latine majuscule | [A-Z] | <br /> | ||
| Lettre latine minuscule | [a-z] | <br /> | ||
| Lettre cyrillique majuscule | [А-Я] | <br /> | ||
| Lettre cyrillique minuscule | [а-я] | <br /> | ||
| Chiffre | [0-9] | <br /> | ||
| Espace | [\s] | <br /> | ||
| Caractère système | @ | <br /> | ||
| Mot du dictionnaire | @(Dictionary) | Le paramètre Dictionary définit le chemin du dictionnaire utilisateur à partir duquel les mots doivent être pris. Exemple de chemin sous Linux : @(/opt/MyDictionary.amd) exemple de chemin sous macOS : “/Users/user/Documents/MyDictionary.amd Sous Windows, les barres obliques inverses du chemin doivent être doublées. Par exemple : @(D:\MyFolder\MyDictionary.amd). <Note> Certains langages de programmation (comme C++) exigent d’échapper les barres obliques inverses dans les littéraux de chaîne. Dans ce cas, vous aurez besoin de deux barres obliques inverses échappées, ce qui donnera une barre oblique inverse quadruplée. L’exemple ci-dessus se présentera ainsi en C++ : </Note> L"@(D:\\\\\\\\MyFolder\\\\\\\\MyDictionary.amd)" |
- Certains caractères utilisés dans les expressions régulières sont « auxiliaires », c’est-à-dire qu’ils sont utilisés à des fins système. Comme vous pouvez le voir dans la liste ci-dessus, ces caractères incluent les crochets, les points, etc. Si vous souhaitez saisir un caractère auxiliaire comme un caractère normal, placez une barre oblique inverse () devant lui. Exemple : [t-v]x+ désigne des mots tels que « tx », « txx », « txxx », etc., « ux », « uxx », etc., mais [t-v]x+ désigne des mots tels que « [t-v]x », « [t-v]xx », « [t-v]xxx », etc.
- Si vous devez regrouper certains éléments d’une expression régulière, utilisez des parenthèses. Par exemple, (a|b)+|c désigne « c » et toutes les combinaisons comme « abbbaaabbb », « ababab », etc. (un mot non vide pouvant contenir n’importe quel nombre de a et de b dans n’importe quel ordre), tandis que a|b+|c désigne « a », « c » et « b », « bb », « bbb », etc.
Exemples d’expressions régulières
Utilisation pour la capture de données
- Seuls les mots du dictionnaire doivent être autorisés comme résultats de reconnaissance : définissez la propriété IBaseLanguage::AllowWordsFromDictionaryOnly sur TRUE. Cela est nécessaire pour une correspondance exacte.
- Le jeu de lettres de la langue de reconnaissance ne doit contenir que les caractères inclus dans l’expression régulière : spécifiez la propriété IBaseLanguage::LetterSet. Cela est nécessaire, car des caractères de l’alphabet de la langue peuvent être reconnus même s’ils ne correspondent pas à l’expression régulière.
- Définissez la propriété IBaseLanguage::IsNaturalLanguage sur FALSE.
Exemples pour Windows
Code C#
Code C#
