En termes non techniques, un collecteur est une structure géométrique continue ayant une dimension finie: une ligne, une courbe, un plan, une surface, une sphère, une boule, un cylindre, un tore, un "blob" ... quelque chose comme ça :
C'est un terme générique utilisé par les mathématiciens pour dire "une courbe" (dimension 1) ou "surface" (dimension 2), ou un objet 3D (dimension 3) ... pour toute dimension finie possible . Un manifold unidimensionnel est simplement une courbe (ligne, cercle ...). Un collecteur bidimensionnel est simplement une surface (plan, sphère, tore, cylindre ...). Un manifold tridimensionnel est un "objet complet" (boule, cube plein, l'espace 3D qui nous entoure ...).n
Une variété est souvent décrite par une équation: l'ensemble des points tels que x 2 + y 2 = 1 est une variété unidimensionnelle (un cercle).( x , y)x2+y2=1
Un collecteur a partout la même dimension. Par exemple, si vous ajoutez une ligne (dimension 1) à une sphère (dimension 2), la structure géométrique résultante n'est pas une variété.
Contrairement aux notions plus générales d'espace métrique ou d'espace topologique également destinées à décrire notre intuition naturelle d'un ensemble continu de points, une variété est censée être quelque chose de localement simple: comme un espace vectoriel de dimension finie: . Cela exclut les espaces abstraits (comme les espaces de dimension infinie) qui manquent souvent d'avoir une signification géométrique concrète.Rn
Contrairement à un espace vectoriel, les variétés peuvent avoir différentes formes. Certaines variétés peuvent être facilement visualisées (sphère, boule ...), certaines sont difficiles à visualiser, comme la bouteille de Klein ou le véritable plan projectif .
Dans les statistiques, l'apprentissage automatique ou les mathématiques appliquées en général, le mot "collecteur" est souvent utilisé pour dire "comme un sous-espace linéaire" mais peut-être courbe. Chaque fois que vous écrivez une équation linéaire comme: vous obtenez un sous-espace linéaire (affine) (ici un plan). Habituellement, lorsque l'équation est non linéaire comme x 2 + 2 y 2 + 3 z 2 = 7 , c'est une variété (ici une sphère étirée).3x+2y−4z=1x2+2y2+3z2=7
Par exemple, "l' hypothèse du collecteur " de ML dit "les données de haute dimension sont des points dans un collecteur de basse dimension avec un bruit de dimension élevé ajouté". Vous pouvez imaginer les points d'un cercle 1D avec du bruit 2D ajouté. Bien que les points ne soient pas exactement sur le cercle, ils satisfont statistiquement à l'équation . Le cercle est la variété sous-jacente:
x2+y2=1