Pourquoi RP n'est-il pas une projection selon cette définition?
Michael Mahoney écrit dans vos notes de cours que cela dépend de la façon dont le RP est construit , que le RP soit ou non une projection au sens algébrique linéaire traditionnel. Il le fait aux troisième et quatrième points:
Troisièmement, si les vecteurs aléatoires étaient exactement orthogonaux (comme ils l'étaient en fait dans les constructions JL d'origine), alors nous aurions que la projection JL était une projection orthogonale
...
mais bien que cela soit faux pour les Gaussiens, les variables aléatoires et la plupart des autres constructions, on peut prouver que les vecteurs résultants sont approximativement de longueur unitaire et approximativement orthogonaux{±}
...
c'est «assez bon».
Vous pourriez donc faire, en principe, la projection aléatoire avec une construction différente qui se limite aux matrices orthogonales (bien que ce ne soit pas nécessaire). Voir par exemple l'œuvre originale:
Johnson, William B. et Joram Lindenstrauss. "Extensions de mappages de Lipschitz dans un espace Hilbert." Mathématiques contemporaines 26.189-206 (1984): 1.
... si l'on choisit au hasard une projection orthogonale de rang surkln2
...
Pour être précis, nous supposons que est la projection sur les premières coordonnées de et que soit la mesure de Haar normalisée sur , le groupe orthogonal sur . Alors la variable aléatoire définie par détermine la notion de " projection de rang aléatoire ".Qkln2σO(n)ln2f:(O(n),σ)→L(ln2)
f(u)=U⋆QU
k
L'entrée wikipedia décrit la projection aléatoire de cette manière (la même chose est mentionnée dans les notes de cours aux pages 10 et 11)
https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection
La première ligne est un vecteur unitaire aléatoire choisi uniformément parmi . La deuxième ligne est un vecteur unitaire aléatoire de l'espace orthogonal à la première ligne, la troisième ligne est un vecteur unitaire aléatoire de l'espace orthogonal aux deux premières lignes, et ainsi de suite.Sd−1
Mais vous n'obtenez généralement pas cette orthogonalité lorsque vous prenez toutes les entrées matricielles dans les variables matricielles aléatoires et indépendantes avec une distribution normale (comme Whuber l'a mentionné dans son commentaire avec une conséquence très simple "si les colonnes étaient toujours orthogonales, leurs entrées pourraient ne pas être indépendant ").
La matrice et le produit dans le cas de colonnes orthonormées, peuvent être considérés comme une projection car ils concernent une matrice de projection . C'est un peu la même chose que de voir la régression des moindres carrés ordinaires comme une projection. Le produit n'est pas la projection mais il vous donne une coordonnée dans un vecteur de base différent. La projection «réelle» est , et la matrice de projection est .RP=RTRb=RTxx′=Rb=RTRxRTR
La matrice de projection doit être l' opérateur d'identité sur le sous-espace qui est la plage de la projection (voir les propriétés mentionnées sur la page wikipedia). Ou dit autrement, il doit avoir les valeurs propres 1 et 0, de sorte que le sous-espace pour lequel il est la matrice d'identité soit la portée des vecteurs propres associés aux valeurs propres 1. Avec des entrées matricielles aléatoires, vous n'obtiendrez pas cette propriété. Ceci est le deuxième point dans les notes de coursP=RTRU
... il "ressemble" à une matrice orthogonale à bien des égards ... la est un sous-espace uniformément distribué ... mais les valeurs propres ne sont pas dans .range(PTP){0,1}
notons que dans cette citation la matrice rapporte à la matrice dans la question et non à la matrice de projection qui est impliquée par la matricePRP=RTRR
La projection aléatoire par différentes constructions, comme l'utilisation d'entrées aléatoires dans la matrice, n'est donc pas exactement égale à une projection orthogonale. Mais c'est plus simple sur le plan informatique et, selon Michael Mahoney, c'est «assez bien».