Passer au contenu principal
Un intervalle flou est un outil qui permet au programme d’évaluer la qualité d’une hypothèse en fonction de sa longueur. Un intervalle flou peut être mesuré en unités de longueur (points, millimètres, etc.) ou en caractères (dans le cas des lignes). Pour un intervalle flou, quatre valeurs doivent être spécifiées, lesquelles déterminent l’intervalle de valeurs possibles et optimal. Pour simplifier, un éditeur d’intervalle flou facile à utiliser est fourni dans le programme. Supposons que vous disposiez d’un intervalle flou {f1,f2,f3,f4} et que la longueur de la string détectée (en caractères, ou en points pour un espace détecté) soit L. Si la longueur L se situe dans l’intervalle de f2 à f3 (c.-à-d. L>=f2 and L<=f3), la qualité de l’hypothèse est de 1. Si la longueur se situe dans l’intervalle de f1 à f2, la qualité de l’hypothèse varie proportionnellement de 0 à 1 (Quality(f1) = 0, Quality(f2) = 1). De même, si la longueur se situe dans l’intervalle de f3 à f4, la qualité de l’hypothèse varie proportionnellement de 1 à 0 (Quality(f3) = 1, Quality(f4) = 0). Si la longueur ne se situe pas dans l’intervalle de f1 à f4 (c.-à-d. L<f1 or L>f4), la qualité de l’hypothèse est de 0 (Quality(L) = 0). La qualité de l’hypothèse pour l’objet détecté est multipliée par les valeurs de la propriété Character count, sélectionnée en fonction de la longueur de l’objet détecté. Intervalle_flou
Remarque : La qualité de toute chaîne d’hypothèses pour plusieurs éléments est calculée en multipliant les qualités des hypothèses pour chaque élément de la chaîne. Si la chaîne est suffisamment longue et que les estimations de qualité des hypothèses constitutives sont trop faibles en raison de restrictions trop strictes, la qualité résultante de l’ensemble de la chaîne peut également être trop faible.
Par conséquent, il est recommandé de s’assurer que l’hypothèse sélectionnée présente l’estimation de qualité la plus élevée possible. D’un autre côté, vous devez pouvoir distinguer les hypothèses par leur qualité afin de sélectionner la meilleure. Il convient donc de configurer des intervalles flous (qui sont des fonctions mathématiques d’évaluation des hypothèses) de manière à ce que les hypothèses acceptables ne soient pas trop pénalisées. Des valeurs négatives peuvent également être utilisées pour la borne gauche de l’intervalle flou (même s’il n’existe, en réalité, aucune chaîne de longueur négative). Cela peut être utile pour rendre la courbe de qualité moins abrupte sur l’intervalle (0, 1), réduisant ainsi la pénalité de qualité. Si vous devez définir une limite inférieure pour ce paramètre (par ex. la longueur de la chaîne ne peut pas être inférieure à 10 caractères, l’intervalle flou pour la longueur de la chaîne étant [-10,20,30,40]), vous pouvez le faire directement dans Hypothesis Evaluation en définissant Value.Length >=10. Fuzzy_interval_I Nous ne recommandons pas de rendre les bornes de l’intervalle trop strictes. C’est particulièrement important lors du traitement d’images de qualité variable. Sur certaines images, par exemple, il peut y avoir des espaces avec des lettres en raison de la mauvaise qualité du document source ou de paramètres de numérisation particuliers. Dans ce cas, le programme peut interpréter un caractère comme plusieurs, ce qui peut entraîner une baisse drastique de la qualité de l’hypothèse si l’intervalle est trop strict. En conséquence, le programme peut écarter cette hypothèse (qui aurait pu être correcte dans son essence) et en sélectionner une autre. Pour cette raison, si vous devez départager des hypothèses en comparant leurs longueurs, cela doit être fait à l’aide de conditions supplémentaires dans Hypothesis Evaluation.