Dimension Vapnik-Chervonenkis: pourquoi quatre points sur une ligne ne peuvent-ils pas être brisés par des rectangles?

Je lis donc "Introduction to Machine Learning" 2e édition, par Bishop, et. tout. À la page 27, ils discutent de la dimension Vapnik-Chervonenkis qui est,

"Le nombre maximum de points qui peuvent être brisés par H [la classe d'hypothèses] est appelé la dimension Vapnik-Chervonenkis (VC) de H, est noté VC (H) et mesure la capacité de H."

Alors que "briser" indique une hypothèse pour un ensemble de N points de données de telle sorte qu'il sépare les exemples positifs du négatif. Dans un tel exemple, il est dit que "H brise N points". $h \in H$

Jusqu'à présent, je pense que je comprends cela. Cependant, les auteurs me perdent avec ce qui suit:

"Par exemple, quatre points sur une ligne ne peuvent pas être brisés par des rectangles."

Il doit y avoir un concept ici que je ne comprends pas complètement, car je ne comprends pas pourquoi c'est le cas. Quelqu'un peut-il m'expliquer cela?

machine-learning vc-dimension

— BrotherJack
source

Appelez les quatre points dans l'ordre le long de la ligne. Il n'y a pas de rectangle contenant et mais excluant et .

p, q, r, s

$p,q,r,s$

p

$p$

r

$r$

q

$q$

s

$s$

— JeffE

Oui, mais il existe des rectangles qui peuvent contenir et , à l'exception de et ; ou contenir et et exclure et . Voulez-vous dire que chaque combinaison doit être possible pour que les points soient brisés, et si oui POURQUOI CE N'EST PAS UNE RÉPONSE: P?

p

$p$

q

$q$

r

$r$

s

$s$

q

$q$

r

$r$

p

$p$

s

$s$

— BrotherJack

La définition de « un ensemble peut être brisé par des rectangles » est que pour chaque sous - ensemble de , il y a un rectangle qui contient précisément ce sous - ensemble et exclut le reste de . De manière équivalente, chaque marquage des points comme positif et négatif est conforme à au moins une hypothèse en . $P$ $P$ $P$ $H$

Considérons maintenant quatre points long d'une ligne dans le plan. Puisqu'il n'y a pas de rectangle contenant et mais excluant et , ces quatre points ne peuvent pas être brisés par des rectangles. $p,q,r,s$ $p$ $r$ $q$ $s$

— JeffE
source

Et voilà. Il vaut mieux avoir cela comme réponse, non?

— BrotherJack