Passer au contenu principal
Un intervalle flou est un outil qui permet au programme d’évaluer la qualité d’une hypothèse en fonction de sa longueur. Un intervalle flou peut être mesuré en unités de longueur (points, millimètres, etc.) ou en caractères (pour les lignes). Pour un intervalle flou, quatre valeurs doivent être spécifiées, lesquelles déterminent l’intervalle de valeurs possible et optimal. Pour simplifier la configuration, un éditeur d’intervalles flous convivial est fourni dans le programme. Supposons que vous ayez un intervalle flou {f1,f2,f3,f4} et que la longueur de la chaîne détectée (en caractères, ou en points pour un espace détecté) soit L. Si la longueur L se situe entre f2 et f3 (c.-à-d. L >= f2 && L <= f3), la qualité de l’hypothèse est 1. Si la longueur se situe entre f1 et f2, la qualité de l’hypothèse varie proportionnellement de 0 à 1 (Quality(f1) = 0, Quality(f2) = 1). De même, si la longueur se situe entre f3 et f4, la qualité de l’hypothèse varie proportionnellement de 1 à 0 (Quality(f3) = 1, Quality(f4) = 0). Si la longueur ne se situe pas entre f1 et f4 (c.-à-d. L < f1 || L > f4), la qualité de l’hypothèse est 0 (Quality(L) = 0). La qualité de l’hypothèse pour l’objet détecté est multipliée par les valeurs de la propriété Character count, sélectionnée en fonction de la longueur de l’objet détecté. Fuzzy_interval Note : La qualité de toute chaîne d’hypothèses portant sur plusieurs éléments est calculée en multipliant les qualités des hypothèses de chaque élément de la chaîne. Si la chaîne est suffisamment longue et que les estimations de qualité des hypothèses qui la composent sont trop faibles en raison de restrictions trop strictes, la qualité finale de l’ensemble de la chaîne peut également être trop faible. Il est donc recommandé de vous assurer que l’hypothèse sélectionnée présente l’estimation de qualité la plus élevée possible. D’un autre côté, vous devez pouvoir distinguer les hypothèses selon leur qualité afin de sélectionner la meilleure. Par conséquent, configurez les intervalles flous (fonctions mathématiques d’évaluation des hypothèses) de manière à ne pas trop pénaliser les hypothèses acceptables. Des valeurs négatives peuvent également être utilisées pour la borne gauche de l’intervalle flou (même s’il n’existe en réalité aucune chaîne de longueur négative). Cela peut être utile pour rendre la courbe de qualité moins abrupte sur l’intervalle (0, 1), réduisant ainsi la pénalité sur la qualité. Si vous devez définir une limite inférieure pour ce paramètre (par exemple, la longueur de la chaîne ne peut pas être inférieure à 10 caractères avec l’intervalle flou pour la longueur de la chaîne défini sur [-10,20,30,40]), vous pouvez le faire directement dans Hypothesis Evaluation en définissant Value.Length >= 10. Fuzzy_interval_I Nous déconseillons de rendre les bornes de l’intervalle trop strictes. Cela est particulièrement important lors du traitement d’images de qualité variable. Sur certaines images, par exemple, il peut y avoir des espaces entre les lettres en raison de la mauvaise qualité du document source ou de paramètres de numérisation particuliers. Dans ce cas, le programme peut interpréter un caractère comme plusieurs, ce qui peut entraîner une forte baisse de la qualité de l’hypothèse si l’intervalle est trop strict. En conséquence, le programme peut rejeter cette hypothèse (qui pouvait être correcte sur le fond) et en sélectionner une autre. Pour cette raison, si vous devez départager des hypothèses en comparant leurs longueurs, faites-le à l’aide de conditions supplémentaires dans Hypothesis Evaluation.