Parler de « des points dans un hypercube » est un peu trompeur car un hypercube contient une infinité de points. Parlons plutôt du volume.99 %
Le volume d'un hypercube est le produit de ses longueurs latérales. Pour l'hypercube d'unité à 50 dimensions, nous obtenonsTotal volume=1×1×⋯×150 times=150=1.
Excluons maintenant les limites de l'hypercube et regardons «l' intérieur » (je mets cela entre guillemets parce que le terme mathématique intérieur a une signification très différente). Nous ne gardons que les points qui satisfont
x=(x1,x2,…,x50)0.05<x1<0.95 and 0.05<x2<0.95 and … and 0.05<x50<0.95.
Quel est le volume de cet «intérieur»? Eh bien, `` l'intérieur'' est à nouveau un hypercube, et la longueur de chaque côté est de0.9 (=0.95−0.05 ... cela aide à l'imaginer en deux et trois dimensions). Le volume est donc VolumeInterior volume=0.9×0.9×⋯×0.950 times=0.950≈0.005.
Conclure que le volume de la «frontière» (défini comme l'hypercube unitaire sans le «intérieur « ) est 1−0.950≈0.995.
Cela montre que 99.5% du volume d'un hypercube à 50 dimensions est concentré sur sa « frontière ».
Suivi: ignatius a soulevé une question intéressante sur la façon dont cela est lié à la probabilité. Voici un exemple.
Imaginons que vous ayez créé un modèle (d'apprentissage automatique) qui prédit les prix des logements sur la base de 50 paramètres d'entrée. Les 50 paramètres d'entrée sont indépendants et uniformément répartis entre 0 et 1 .
0.050.950.050.95
10%501−0.950≈0.995.99.5%
Règle générale: dans les dimensions élevées, les observations extrêmes sont la règle et non l'exception.