Un diccionario de usuario es un diccionario auxiliar creado por el usuario que contiene palabras no incluidas en los diccionarios integrados. Los diccionarios integrados pueden complementarse con un diccionario de usuario para mejorar la calidad de la captura de datos. Normalmente, un diccionario de usuario contiene términos especializados, abreviaturas, nombres de empresas, etc.
Puede configurar y habilitar diccionarios de usuario en la pestaña Languages del cuadro de diálogo Propiedades de prerreconocimiento (para abrir este cuadro de diálogo, abra el menú FlexiLayout o Classifier, haga clic en Propiedades y, a continuación, en el botón Advanced pre-recognition properties…).
Los diccionarios de usuario existentes se muestran en el campo User Dictionaries junto con la siguiente información:
- Enabled
Indica si se está usando el diccionario de usuario.
- Name
El nombre del diccionario personalizado.
- Language
El idioma del diccionario personalizado.
Creación y edición de un diccionario personalizado
Para agregar un diccionario personalizado, haga clic en el botón Add… en la pestaña Languages del cuadro de diálogo Propiedades de prerreconocimiento. Luego, en el cuadro de diálogo Agregar nuevo diccionario que se abre, especifique las siguientes propiedades:
- Nombre del diccionario
El nombre del diccionario.
- Método de definición
El tipo de diccionario:
- Archivo de diccionario
Este tipo de diccionario se basa en un archivo DIC.
- Expresión regular
Este tipo de diccionario se basa en una expresión regular.
El tipo de un diccionario no se puede cambiar una vez creado.
- Es independiente del idioma
Si esta opción está habilitada, el diccionario personalizado se usará junto con todos los diccionarios integrados para todos los idiomas de reconocimiento habilitados. El parámetro Idioma se establecerá en Neutral y esta configuración ya no se podrá cambiar. Esta opción solo está disponible para diccionarios de usuario del tipo Expresión regular.
- Idioma (configuración regional)
El idioma del diccionario puede seleccionarse en esta lista desplegable. El idioma de un diccionario no se puede cambiar una vez creado.
Al hacer clic en el botón OK, aparecerá un cuadro de diálogo con una lista de todos los parámetros editables y no editables.
Para ver las propiedades de un diccionario, seleccione un diccionario y, a continuación, haga clic en el botón Editar. La pestaña General del cuadro de diálogo de propiedades de un diccionario contiene sus propiedades generales: nombre, tipo, idioma y cualquier comentario del usuario. El nombre de un diccionario puede cambiarse una vez creado.
La pestaña Dictionary del cuadro de diálogo de propiedades de un diccionario contiene opciones que dependen del tipo de diccionario y de la configuración del alfabeto del usuario.
- Si selecciona el tipo Archivo de diccionario al crear el diccionario, haga clic en el botón
y especifique la ruta a un archivo DIC, o cree un nuevo diccionario haciendo clic en Crear nuevo diccionario…. Si decide crear un nuevo diccionario, especifique su nombre en el cuadro de diálogo Crear nuevo archivo de diccionario y haga clic en OK; luego, configure sus opciones en el editor.
| |
|---|
| Agrega un valor a un diccionario de usuario. |
| Elimina el valor seleccionado actualmente en la lista. |
| Importa valores de un archivo TXT o DIC al diccionario de usuario. Nota. Los signos de puntuación (.,;:/*{}[]<>? etc.) se usan como separadores entre palabras en los diccionarios. Si desea usar estos símbolos en las palabras del diccionario,
coloque la siguiente cadena al principio del archivo de texto: “DICTIONARY_PROPERTIES=USE_CONFIDENCE”. En este caso, solo los saltos de línea se tratarán como separadores
entre palabras. En este caso, el número después del primer espacio de la cadena indicará el peso de la palabra, y todos los demás símbolos se ignorarán. |
| Exporta valores del diccionario a un archivo TXT. |
| Cierra el editor. |
Cuando se crea un diccionario, se guarda como un archivo DIC en la carpeta del proyecto.
- Si seleccionó el tipo de diccionario Expresión regular, especifique la expresión. Puede hacer clic en el botón
para abrir un menú que le ayudará a crear la expresión. Para más información, consulte Alfabeto usado en expresiones regulares.
Las palabras de un diccionario de usuario tienen mayor prioridad que las palabras de un diccionario integrado. Habilitar Preferir palabras del diccionario aumenta aún más la prioridad de las palabras del diccionario.
Puede crear un alfabeto de usuario en el grupo Alfabeto de la pestaña Dictionary del cuadro de diálogo de propiedades de un diccionario. Un alfabeto de usuario es un conjunto de caracteres, separadores, prefijos y sufijos que pueden usarse en un diccionario de usuario. Si se usa un alfabeto de usuario junto con un diccionario de usuario, las palabras del diccionario que contienen caracteres que no están en el alfabeto de usuario se consideran palabras ajenas al diccionario. En otras palabras, un alfabeto de usuario puede usarse para limitar el conjunto de caracteres permitidos para los diccionarios personalizados.
Para especificar los caracteres permitidos, habilite la opción Usar alfabeto personalizado y, a continuación, especifique los símbolos del alfabeto en el cuadro de texto o con el editor. Puede abrir el editor haciendo clic en el botón Editar.
Para especificar los separadores, prefijos, sufijos y caracteres ignorados (denominados colectivamente signos de puntuación en esta sección por simplicidad), haga clic en el botón Parámetros avanzados. En el cuadro de diálogo Alfabeto personalizado avanzado parámetros, especifique los signos de puntuación.
- Signos de puntuación adyacentes al comienzo de la palabra
Signos de puntuación que pueden aparecer junto al comienzo de una palabra, como el guion bajo en “_unknown”.
- Signos de puntuación adyacentes al final de la palabra
Signos de puntuación que pueden aparecer junto al final de una palabra, como el ampersand en “user&”.
- Signos de puntuación independientes
Signos de puntuación que pueden aparecer por separado, como la barra vertical en “January |”
Puede especificar los símbolos que quiere que el programa ignore al comprobar palabras con el diccionario de usuario en el grupo de opciones Caracteres de exclusión. Por ejemplo, si especifica la expresión regular “+33NNNNNNNN” y el guion (-) como carácter ignorado, el programa considerará “+33-11111111”, “+33-111-11-111” y “+33-111-111-11” como coincidencias de la expresión regular.