Incorporation isométrique de L2 dans L1


27

On sait que, étant donné un sous-ensemble à points de d 2 (c'est-à-dire, étant donné n points dans R d avec une distance euclidienne), il est possible de les incorporer isométriquement dans ( nn2dnRd.1(n2)

L'isométrie est-elle calculable en temps polynomial (éventuellement, randomisé)?

Comme il existe des problèmes de précision finie, la question précise est

Etant donné un ensemble de n points dans R d et ϵ > 0 , existe-t-il un mappage f : X R ( nXnRdϵ>0 calculable (éventuellement en utilisant l'aléatoire) en polynôme temporel ennet logarithmique en1/ϵ detelle sorte que pour chaquex,yXnous avonsf:XR(n2)n1/ϵx,yX

||f(x)f(y)||1||xy||2(1+ϵ)||f(x)f(y)||1

(Remarque: je suis conscient qu'une cartographie avec distorsion peut être trouvée avec une forte probabilité dans le polynôme temporel en n et 1 / ϵ en projetant sur O ( ϵ - 2log n ) des lignes aléatoires, mais je ne le suis pas sûr si le nombre de dimensions peut être réduit de manière constructive à ( n(1+ϵ)n1/ϵO(ϵ2logn) ou mêmeO(n2)lorsque1/ϵest beaucoup plus grand quen, et je ne sais pas s'il existe une méthode temporelle polynomiale pour gérer le cas où1/ϵest exponentiel enn.)(n2)O(n2)1/ϵn1/ϵn


1
c'est une très belle question. @ Luca, pensez-vous que cela pourrait être difficile? (bien sûr, ma première pensée a été de regarder par-dessus «Hamming rencontre Euclide», puis j'ai vu l'identité du questionneur :)
Suresh Venkat

1
Cette référence semble être liée: Pjotr ​​Indyk, "Principes d'incertitude, extracteurs et plongements explicites de l2 dans l1", Proc. STOC'07.
Martin Schwarz

2
@David: est le nombre de points, j'ai corrigé l'endroit où j'ai utilisé n pour la dimension. Que n points dans l'espace euclidien (de n'importe quelle dimension) peuvent être intégrés isométriquement dans ( nnnnest prouvé ici:www-math.mit.edu/~goemans/18409-2006/lec1.pdfmais plutôt non constructif. (Théorème de Carathéodory pour passer d'une dimension finie mais grande à dimension(n1(n2) avec une erreur arbitrairement petite et un argument de compacité pour passer d'une erreur arbitrairement petite à une erreur nulle.)(n2)
Luca Trevisan

1
@Martin: merci pour la référence. L'article de Piotr traite du problème plus difficile de la mise en correspondance de tous les (pas seulement un ensemble fixe de n points) avec m 1 . Pour ce problème, je pense que c'est un problème ouvert, même pour atteindre, de manière constructive, m = p o l y ( d , 1 / ϵ ) et la distorsion ( 1 + ϵ ) . (Piotr obtient m = d O ( log d ) et ϵ = 12dn1mm=poly(d,1/ϵ)(1+ϵ)m=dO(logd) .)ϵ=1/d
Luca Trevisan

1
@LucaTrevisan: re: la dureté de l'incorporation dans l1, c'est vrai (c'est mentionné dans le chapitre 1 ou 2 du livre Deza et Laurent - je pense via MAX CUT)
Suresh Venkat

Réponses:


7

Suresh m'a demandé de rassembler mes commentaires ci-dessus dans une réponse, alors le voici. Je ne suis pas vraiment sûr que ce soit une réponse à la question d'origine, car il n'est pas évident de savoir comment le rendre polynomial lorsque la dimension de l'espace euclidien d'entrée n'est pas constante. Il a au moins l'avantage d'éviter tout problème avec un grand comme le demande la question d'origine, car il n'implique aucune approximation, et il semble polynomial pour d constant .1/ϵd

Quoi qu'il en soit: de la géométrie intégrale, il existe une mesure standard sur les ensembles d'hyperplans dans l' espace euclidien dimensionnel qui est invariant sous les congruences euclidiennes. Il a la propriété que la longueur de toute courbe de longueur limitée C est proportionnelle à la mesure des hyperplans qui traversent C (avec multiplicité, ce qui signifie que si un hyperplan traverse C deux fois, il contribue deux fois à la mesure totale des hyperplans traversant C ). En particulier, si C est un segment de ligne, la complication de multiplicité ne se pose pas et nous pouvons normaliser la mesure sur les hyperplans traversant C pour être exactement la longueur de CdCCCCCCC. (Les hyperplans contenant ont une mesure nulle, alors ne vous inquiétez pas de la multiplicité infinie.)C

Maintenant, étant donné un ensemble de n points dans l'espace d-dimensionnel, faites une coordonnée pour chacune des partitions des points en deux sous-ensembles induits par un hyperplan qui ne passe par aucun des points. Donnez les points d'un côté de la valeur de coordonnées de partition à zéro et les points de l'autre côté de la valeur de coordonnées de partition égaux à la mesure de l'ensemble d'hyperplans induisant cette partition.1

Si et q sont deux des n points, soit K l'ensemble des hyperplans traversant le segment de ligne p q , et soit K i les sous-ensembles de K formés par chaque partition d'hyperplan possible qui a p d'un côté et q sur le côté autre. Alors K est l'union disjointe de K i , et les différences de coordonnées entre p et q ne sont que les mesures des sous-ensembles K i . Par conséquent, le 1pqnKpqKiKpqKKipqKi1la distance entre les coordinations de et q (la somme des mesures de K i ) est la mesure de K , qui est juste la distance 2 d' origine entre p et q .pqKiK2pq

Pour les géomètres de calcul, une autre description de la même construction peut être utile: utilisez la dualité projective pour transformer les points d'entrée en n hyperplans, et séparez les hyperplans en points. La mesure de géométrie intégrale sur les ensembles d'hyperplans est ensuite transformée en une mesure plus standard sur les ensembles de points, la distance entre p et q se dualise à la mesure du double coin entre deux hyperplans, et la disposition hyperplan divise ce double coin en cellules plus petites . La valeur de coordonnées pour un point est soit la mesure de l'une des cellules de l'arrangement (si l'hyperplan double est en dessous de la cellule de ces coordonnées) ou zéro (si l'hyperplan double est au-dessus de la cellule). Par conséquent, le nnpq distance entre p et q n'est que la somme des mesures des cellules du double coin, qui est la même que la mesure de l'ensemble du double coin. Ce double point de vue permet également de calculer facilement la dimension de l'incorporation ainsi trouvée: c'est juste le nombre de cellules dans l'agencement hyperplan, qui est O ( n d ) , ou plus précisément au plusd i = 0 ( n1pqO(nd) .i=0d(ni)

Jusqu'à présent, cela donne une intégration complètement déterministe et exacte dans . Mais nous voulions une dimension plus petite, ( n1O(nd). C'est là qu'intervient le commentaire de Luca sur lethéorème de Carathéodory. L'ensemble desmétriques représentables1forme un cône polyédrique dans le(n1(n2)1 -espace dimensionnel de toutes les fonctions, des paires de points non ordonnées aux nombres réels, et l'argument géométrique ci-dessus dit que la métrique euclidienne appartient à ce cône. Les points sur les rayons extrêmes du cône sont despseudométriesunidimensionnelles1(dans lesquelles les points sont divisés en deux ensembles, toutes les distances dans un seul ensemble sont nulles et toutes les distances à travers la division sont égales), et Carathéodory dit que tout point à l'intérieur du cône (y compris celui qui nous intéresse) peut être représenté comme une combinaison convexe de points sur des rayons extrêmes dont le nombre est au plus la dimension de l'espace ambiant, ( n(n2)1 . Mais une combinaison convexe d'au plus ( n(n2) métriquesunidimensionnelles1sont un ( n(n2)1métrique.1(n2)

Enfin, comment pouvons-nous réellement calculer le -incorporation dimensionnelle? À ce stade, nous n'avons pas seulement un point dans le ( n(n2) -cône convexe dimensionnel demétriques1(la métrique de distance avec laquelle nous avons commencé), mais nous avons également un ensemble deO(nd)points extrêmes du cône (correspondant aux partitions de l'entrée en deux sous-ensembles induits par des hyperplans ) de sorte que notre métrique est une combinaison convexe de ces points extrêmes - pour les petitsd, c'est une grande amélioration par rapport aux2n-2rayons extrêmes que le cône a globalement. Maintenant, tout ce que nous devons faire est d'appliquer un algorithme gourmand qui se débarrasse des points extrêmes de notre ensemble, un par un, jusqu'à ce que ( n(n2)1O(nd)d2n2 d'entre eux sont laissés. À chaque étape, nous devons maintenir comme invariant que notre métrique est toujours à l'intérieur de la coque convexe des points extrêmes restants, ce qui n'est qu'un problème de faisabilité de programmation linéaire, et si nous le faisons, Carathéodory s'assurera qu'il reste toujours un ensemble de ( n(n2) points extrêmes dont la coque convexe contient la métrique d'entrée.(n2)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.