Extraction de la date d’émission
- Ouvrez la boîte de dialogue Manage Fields dans l’onglet Fields et sélectionnez un champ “Date” à utiliser dans cette activité. Cliquez sur Save.
- Accédez à l’onglet Search Elements. Vous verrez un élément de recherche de type Date créé pour le champ “Date”. Il est automatiquement associé au champ.
- Créez un élément de recherche Group appelé “IssueDateGroup”. Rendez l’élément facultatif.
- Ajoutez un élément Static Text appelé “kwDate” pour trouver le libellé qui nous aidera à localiser la date réelle.
- Cette classe de documents contient des documents en néerlandais ou en français ; il existe donc plusieurs options pour le texte du libellé. Vous pouvez saisir chaque option sur une nouvelle ligne dans la boîte de dialogue Text to find. Saisissez le texte “Date” sur la première ligne et “Datum” sur la deuxième ligne.
- Désactivez l’option Search for parts of words.
- Faites glisser et déposez l’élément de recherche “Date” dans le groupe et placez-le sous l’élément “kwDate”.
- Spécifiez la zone de recherche pour l’élément “Date”.
a. Supprimez la relation Nearest to qui a été ajoutée automatiquement lors de la création de l’élément. b. Sélectionnez l’élément “kwDate” comme étant le plus proche de l’élément que nous recherchons.
c. La date peut se trouver à droite du mot-clé ou en dessous. Spécifiez la zone de recherche sous l’élément “kwDate”.
d. La zone de recherche doit également inclure la ligne sur laquelle se trouve le mot-clé. Cliquez sur l’icône de limite inférieure à droite du nom de l’élément et sélectionnez Top Boundary of Region. Les lignes pouvant être irrégulières, définissez la valeur Below sur -10 pour étendre légèrement la zone de recherche au-dessus de la ligne. - Cliquez sur Associer pour vérifier que la date est correctement localisée.

Extraction des dates d’arrêt maladie
Vous pouvez utiliser l’élément Table Cell non seulement pour les champs situés à l’intérieur des tableaux du document. Il peut également être utile si vous devez extraire des données d’un formulaire où le contenu se trouve dans des cases similaires ou dans des structures de type tableau. Si ces cases ont des lignes de séparation nettes, l’élément Table Cell se révélera très efficace.
-
Ouvrez la boîte de dialogue Manage Fields et ajoutez les champs suivants à l’activité en cours :
- Start Date
- End Date
- Accédez à l’onglet Search Elements et créez l’élément Group pour l’extraction de la date de début. Définissez les paramètres suivants pour les éléments inclus dans le groupe :
| Parameter | Value |
|---|---|
| Group search element: | |
| Name | StartDateGroup |
| Static Text search element: | |
| Name | kwStartDate |
| Text to find | Vanaf / From, A partir du, Van |
| Search for parts of words | Disabled |
| Table Cell search elements: | |
| Name | StartDateDay |
| Search pattern | Number |
| Character count | {1, 1, 3, 3} |
| Search for parts of words | Disabled |
| Search area | Below the “kwStartDate” element, nearest to “kwStartDate” |
| Table Cell search element: | |
| Name | StartDateMonth |
| Search pattern | Number |
| Character count | {1, 1, 3, 3} |
| Search for parts of words | Disabled |
| Search area | Below the “kwStartDate” element, right of “StartDateDay”, nearest to “StartDateDay” |
| Table Cell search element: | |
| Name | StartDateYear |
| Search pattern | Number |
| Character count | {2, 2, 4, 4} |
| Search for parts of words | Disabled |
| Search area | Below the “kwStartDate” element, right of “StartDateMonth”, nearest to “StartDateMonth” |
L’élément Table Cell renvoie le texte de la cellule tel quel. Dans ce cas, le motif de recherche contient un Number qui ne reconnaît que les chiffres ; le texte renvoyé par l’élément sera donc un nombre.
- Créez une copie de l’élément “StartDateGroup” et renommez-la en “EndDateGroup”.
- Renommez les sous-éléments du groupe : “kwStartDate” en “kwEndDate”, “StartDateDay” en “EndDateDay”, “StartDateMonth” en “EndDateMonth”, “StartDateYear” en “EndDateYear”.
- Modifiez le texte à rechercher de l’élément “kwEndDate” en “Tot en met / Till and incl., Jusqu’ au, Tot en met”.
- Spécifiez la zone de recherche pour l’élément “EndDateDay”. Il doit se trouver sous l’élément “kwEndDate” et être le plus proche de celui-ci. Supprimez les autres relations.
-
Ouvrez la boîte de dialogue Manage Fields et ajoutez un Data Composition Field appelé “Start Date Composed”. Associez les éléments suivants aux champs :
- “StartDateDay” à
Day - “StartDateMonth” à
Month - “StartDateYear” à
Year
- “StartDateDay” à
-
Créez un Data Composition Field appelé “End Date Composed”. Associez les éléments suivants aux champs :
- “EndDateDay” à
Day - “EndDateMonth” à
Month - “EndDateYear” à
Year
- “EndDateDay” à
- Associez les champs de composition de données “Start Date Composed” et “End Date Composed” aux champs “Start Date” et “End Date”.

Extraction du type d’arrêt maladie
- Ouvrez la boîte de dialogue Manage Fields dans l’onglet Fields et activez le groupe de coches “Type of Sick Note”. Activez les coches “Primary” et “Secondary” dans le groupe pour qu’elles soient utilisées dans l’activité en cours. Cliquez sur Save.
- Construisez une structure similaire à celle créée pour les documents allemands, mais gardez à l’esprit que dans les documents néerlandais et belges, le libellé (le texte près de la coche) vient en premier. L’ordre des éléments enfants pour ces groupes a de l’importance. a. Créez un élément Group appelé “TypeOfSickNoteGroup”. b. Créez une copie de ce groupe et renommez-la en “PrimaryGroup”. Placez-la à l’intérieur de “TypeOfSickNoteGroup”. c. Ajoutez un élément Static Text appelé “kwCheckmark” au groupe “PrimaryGroup”. d. Définissez le texte à rechercher sur “eerste / Primary, première, primair”.
Dans ces documents, le texte près de la coche se trouve à gauche de la coche ; nous définissons donc la zone de recherche à sa gauche, et non à sa droite.
| Parameter | Value |
|---|---|
| Static Text search element: | |
| Name | Checkmark |
| Text to find | X |
| Character count | {1, 1, 3, 3} |
| Search for parts of words | Disabled |
| Search area | Right of “kwCheckmark”, nearest to “kwCheckmark” |
| Static Text search element: | |
| Name | XMark |
| Text to find | X |
| Character count | {1, 1, 3, 3} |
| Search for parts of words | Disabled |
| Search area | Below the “kwCheckmark” top boundary, Below value = -15, Left of “kwCheckmark”, Above the “kwCheckmark” bottom boundary, Above value = -15, Nearest to “kwCheckmark” |
| Under what conditions | Do not find element if “Checkmark” is found |
| Region search element: | |
| Name | CheckmarkRegion |
| Search Conditions section of the Code Editor | if Checkmark.IsFound then RSA: Checkmark.Rect; else if XMark.IsFound then RSA: XMark.Rect; else DontFind; |

- Ouvrez la fenêtre Manage Fields et ajoutez une coche “Relapse” au groupe de coches “Type of Sick Note”. Activez toutes les coches du groupe pour qu’elles soient utilisées dans l’activité en cours et cliquez sur Save.
- Associez les coches aux éléments Region correspondants et supprimez les éléments qui ont été créés automatiquement lors de l’activation des champs.
