メインコンテンツへスキップ
ファジー区間は、仮説の長さに基づいてプログラムがその品質を評価できるようにするツールです。ファジー区間は、長さの単位(ドット、ミリメートルなど)または文字数(行の場合)で測定できます。ファジー区間では、可能な値域と最適な値域を定める 4 つの値を指定する必要があります。簡便化のため、使いやすいファジー区間エディターがプログラムに用意されています。 ファジー区間 {f1,f2,f3,f4} があり、検出された string の長さ(文字数、または検出された空白の場合はドット数)が L であるとします。長さ L が f2 から f3 の範囲(すなわち L>=f2 and L<=f3)にある場合、仮説の品質は 1 です。長さが f1 から f2 の範囲にある場合、仮説の品質は 0 から 1 に比例して変化します(Quality(f1) = 0, Quality(f2)=1)。同様に、長さが f3 から f4 の範囲にある場合、仮説の品質は 1 から 0 に比例して変化します(Quality(f3) = 1, Quality(f4) = 0)。長さが f1 から f4 の範囲に含まれない場合(すなわち L<f1 または L>f4)、仮説の品質は 0 です(Quality(L) = 0)。検出されたオブジェクトの仮説品質は、検出されたオブジェクトの長さに応じて選択される Character count プロパティの値と乗算されます。 Fuzzy_interval 注意: 複数要素にわたる仮説の連鎖の品質は、連鎖内の各要素に対する仮説の品質を乗算して算出されます。連鎖が十分に長く、制約が厳しすぎるために各仮説の品質評価が低すぎる場合、連鎖全体の結果の品質も著しく低くなる可能性があります。 したがって、選択した仮説の品質評価が可能な限り高くなるようにすることを推奨します。一方で、最良のものを選別できるよう、品質によって仮説を見分けられる必要があります。そのため、許容できる仮説が過度に減点されないよう、仮説評価のための数理関数であるファジー区間を適切に設定してください。 ファジー区間の左境界には負の値も使用できます(実際には負の長さの string は存在しませんが)。これは、(0, 1) 区間における品質グラフの傾きを緩やかにして品質の減点を抑えるのに有用です。このパラメータに下限を設定する必要がある場合(例: string の長さは 10 文字未満にはならない。string の長さに対するファジー区間が [-10,20,30,40} の場合)、Hypothesis Evaluation で Value.Length >= 10 を設定することで直接指定できます。 Fuzzy_interval_I 区間の境界を過度に厳格にしないことを推奨します。これは、品質がさまざまな画像を処理する際に特に重要です。たとえば、元のドキュメントの品質が低い、またはスキャン設定の影響により、一部の画像では文字間に不要な空白が生じることがあります。この場合、プログラムが 1 文字を複数文字として解釈してしまい、区間が厳しすぎると仮説の品質が大きく低下するおそれがあります。結果として、本質的には正しい可能性がある仮説をプログラムが棄却し、別の仮説を選択してしまうことがあります。このため、長さを比較して仮説を選択する必要がある場合は、Hypothesis Evaluation で追加の条件を用いて行ってください。