Reglas de expresiones regulares
| Nombre del elemento | Símbolo convencional de expresión regular | Ejemplos de uso y explicaciones | ||
|---|---|---|---|---|
| Cualquier carácter | . | c.t — denota palabras como “cat”, “cot” | ||
| Carácter de un rango de caracteres | [] | [b-d]ell — denota palabras como “bell”, “cell”, “dell” [ty]ell — denota las palabras “tell” y “yell” | ||
| Carácter fuera de un rango de caracteres | [^] | [^y]ell — denota palabras como “dell”, “cell”, “tell”, pero excluye “yell” [^n-s]ell — denota palabras como “bell”, “cell”, pero excluye “nell”, “oell”, “pell”, “qell”, “rell” y “sell” | ||
| O | \ | c(a\ | u)t — denota las palabras “cat” y “cut” | |
| 0 o más apariciones seguidas | * | 10* — denota los números 1, 10, 100, 1000, etc. | ||
| 1 o más apariciones seguidas | + | 10+ — permite los números 10, 100, 1000, etc., pero excluye 1. | ||
| Letra o dígito | [0-9a-zA-Z] | [0-9a-zA-Z] — permite un solo carácter; [0-9a-zA-Z]+ — permite cualquier palabra | ||
| Letra latina mayúscula | [A-Z] | <br /> | ||
| Letra latina minúscula | [a-z] | <br /> | ||
| Letra cirílica mayúscula | [А-Я] | <br /> | ||
| Letra cirílica minúscula | [а-я] | <br /> | ||
| Dígito | [0-9] | <br /> | ||
| Espacio | [\s] | <br /> | ||
| Carácter del sistema | @ | <br /> | ||
| Palabra del diccionario | @(Dictionary) | El parámetro Dictionary establece la ruta al diccionario del usuario del que deben tomarse las palabras. Ejemplo de ruta en Linux: @(/opt/MyDictionary.amd) Ejemplo de ruta en macOS: “/Users/user/Documents/MyDictionary.amd En Windows, las barras invertidas de la ruta deben duplicarse. Por ejemplo: @(D:\MyFolder\MyDictionary.amd). <Note> Algunos lenguajes de programación (como C++) requieren escapar las barras invertidas en los literales de cadena. En este caso, necesitará dos barras invertidas escapadas, lo que dará como resultado una barra invertida cuadruplicada. El ejemplo anterior se verá así en C++: </Note> L"@(D:\\\\\\\\MyFolder\\\\\\\\MyDictionary.amd)" |
- Algunos caracteres utilizados en las expresiones regulares son “auxiliares”, es decir, se usan con fines del sistema. Como puede ver en la lista anterior, estos caracteres incluyen corchetes, puntos, etc. Si desea introducir un carácter auxiliar como uno normal, anteponga una barra invertida (). Ejemplo: [t-v]x+ denota palabras como “tx”, “txx”, “txxx”, etc., “ux”, “uxx”, etc., pero [t-v]x+ denota palabras como “[t-v]x”, “[t-v]xx”, “[t-v]xxx”, etc.
- Si necesita agrupar determinados elementos de una expresión regular, use paréntesis. Por ejemplo, (a|b)+|c denota “c” y cualquier combinación como “abbbaaabbb”, “ababab”, etc. (una palabra de cualquier longitud distinta de cero en la que puede haber cualquier cantidad de a y b en cualquier orden), mientras que a|b+|c denota “a”, “c” y “b”, “bb”, “bbb”, etc.
Expresiones regulares de ejemplo
Uso para la captura de datos
- Solo se deben permitir como resultados de reconocimiento las palabras del diccionario: establezca la propiedad IBaseLanguage::AllowWordsFromDictionaryOnly en TRUE. Esto es necesario para la coincidencia exacta.
- El conjunto de letras del idioma de reconocimiento debe contener únicamente los caracteres incluidos en la expresión regular: especifique la propiedad IBaseLanguage::LetterSet. Esto es necesario porque los caracteres del alfabeto del idioma pueden reconocerse incluso si no se ajustan a la expresión regular.
- Establezca la propiedad IBaseLanguage::IsNaturalLanguage en FALSE.
Ejemplos para Windows
Código C#
Código C#
