web-dev-qa-db-ja.com

候補除去アルゴリズム

次のトレーニングデータセットを検討してください。

+-------+-------+----------+-------------+
| Size  | Color | Shape    | Class/Label |
+=======+=======+==========+=============+
| big   | red   | circle   | No          |
| small | red   | triangle | No          |
| small | red   | circle   | Yes         |
| big   | blue  | circle   | No          |
| small | blue  | circle   | Yes         |
+-------+-------+----------+-------------+

ネガティブな例から開始したときと、2つのネガティブな例が一緒になったときにアルゴリズムがどのように進むかを理解したいと思います。

ちなみにこれは課題問題ではありません。

他のデータセットの例も歓迎します!これは、アルゴリズムのマイナス部分を理解するためです。

35
Ravi

仮説空間(H)については、最大一般仮説(G)と最大特異仮説(S)のセットから始めます。

G0 = {<?, ?, ?>}
S0 = {<0, 0, 0>}

否定的な例が提示された場合、現在の観測と矛盾する仮説をSから削除し、Gの矛盾する仮説を、観測と矛盾しないがSの一部のメンバーよりも一般的な最小の特殊化に置き換える必要があります。

したがって、最初の(負の)例(big, red, circle)の場合、最小限の特殊化により、新しい仮説空間が作成されます。

G1 = {<small, ? , ?>, <?, blue, ?>, <?, ?, triangle>}
S1 = S0 = {<0, 0, 0>}

Sは変更されていないことに注意してください。次の例の(small, red, triangle)も負であるため、Gをさらに特殊化する必要があります。G1の2番目の仮説は新しい観測と一致しないため、G1の1番目と3番目の仮説のみを特化する必要があります。 。それはもたらすだろう

G2 = {<small, blue, ?>, <small, ?, circle>, <?, blue, ?>, <big, ?, triangle>, <?, blue, triangle>}

ただし、上記のG2の最初と最後の仮説は中間仮説(<?, blue, ?>)の特殊化であるため、これら2つを捨てて、

G2 = {<small, ?, circle>, <?, blue, ?>, <big, ?, triangle>}
S2 = S1 = S0 = {<0, 0, 0>}

肯定的な(small, red, circle)観測では、Sを一般化し、矛盾するGのすべてを削除する必要があります。

G3 = {<small, ?, circle>}
S3 = {<small, red, circle>}

(big, blue, circle)は次の否定的な例です。しかし、それはGと一致しないため、そうすることは何もありません

G4 = G3 = {<small, ?, circle>}
S4 = S3 = {<small, red, circle>}

最後に、(small, blue, circle)の肯定的な例があります。この例では、Sを一般化して、例との一貫性を保つ必要があります。

G5 = {<small, ?, circle>}
S5 = {<small, ?, circle>}

GとSは等しいため、「小さな円」の概念を学習しました。

59
bogatron