Quel est le minimum sur toutes les distributions de vecteurs unitaires de la variance du produit scalaire des vecteurs?


10

J'essaie de trouver une distribution sur vecteurs aléatoires, disons , sur la sphère de l'unité dimensionnelle (où ) qui minimise soumis à la contrainte \ mathbb {E} [x_i ^ Tx_j] = 0 .nx1,,xnkn>kmaxijVar(xiTxj)E[xiTxj]=0

J'ai essayé quelques distributions et presque toutes ont la variance 1/k . Par exemple, à la fois la distribution dans laquelle chaque coordonnée de chaque xi est indépendamment et uniformément choisie parmi {1/k,1/k} et la distribution dans laquelle chaque xi est un vecteur uniforme indépendant sur la sphère unité k dimensionnelle a la variance 1/k .

Est - 1/k la variance minimale entre toutes les distributions?


Dans quelle mesure êtes-vous intéressé? Autrement dit, une limite inférieure de 1 / 100k qui ne fonctionne que pour n> 100k serait-elle intéressante ou non?
daniello

@daniello, voulez-vous dire une borne inférieure de 1 / ck pour n> ck où c est une constante? Comment le prouver?
peng

Quelque chose que je ne comprends pas dans la question: au début, vous dites distribution sur les vecteurs unitaires , mais pas toutes les distributions que vous dites avoir essayé de générer des vecteurs unitaires ... Voulez-vous dire que pour tout , ? xiE[|xi|]=1
daniello

@deniello, je voulais faire de tous les vecteurs une "unité" .. Désolé, j'ai oublié de faire la normalisation sur le vecteur "gaussien", après la normalisation, ce sera la même chose que le vecteur uniforme. Merci d'avoir signalé cette erreur.
peng

Réponses:


8

Je vais présenter une formulation équivalente mais plus simple du problème, et montrer une borne inférieure de ( n / k - 1) / ( n −1). Je montre également une connexion à un problème ouvert d'informations quantiques. [Modifier dans la révision 3: dans les révisions précédentes, j'ai affirmé qu'une caractérisation exacte des cas dans lesquels la limite inférieure illustrée ci-dessous est probablement difficile à réaliser car une question analogue dans le cas complexe inclut un problème ouvert concernant les SIC-POVM dans informations quantiques. Cependant, cette connexion aux SIC-POVM était incorrecte. Pour plus de détails, voir la section «Connexion incorrecte aux SIC-POVM dans les informations quantiques» ci-dessous.]

Formulation équivalente

Tout d'abord, comme cela a déjà été souligné dans la réponse de daniello, notez que Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Donc, dans le reste de la réponse, nous oublions la variance et minimisons plutôt max ij E [( x i T x j ) 2 ].

Ensuite, une fois que nous décidons que notre objectif est de minimiser max ij E [( x i T x j ) 2 ], nous pouvons ignorer la contrainte que E [ x i T x j ] = 0. En effet, si nous avons vecteurs unitaires x 1 ,…, x n , alors nous pouvons nier chacun d'eux indépendamment avec une probabilité 1/2 pour satisfaire E [ x i T x j ] = 0 sans changer la valeur de la fonction objectif max ij E [( x i T x j) 2 ].

De plus, changer la fonction objectif de max ij E [( x i T x j ) 2 ] à (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] ne modifie pas la valeur optimale. Ce dernier est tout au plus le premier car la moyenne est tout au plus le maximum. Cependant, nous pouvons toujours faire les valeurs de E [( x i T x j ) 2 ] pour différents choix de ( i , j ) ( ij ) égal en permutant au hasard les n vecteurs x 1 ,…, x n .

Donc pour tout n et k , la valeur optimale du problème en question est égale au minimum de (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] où x 1 ,…, x n sont des variables aléatoires qui prennent comme valeurs des vecteurs unitaires dans ℝ k .

Cependant, par linéarité de l'espérance, cette fonction objectif est égale à la valeur attendue E [(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 ]. Le minimum étant au maximum la moyenne, il n'est plus nécessaire de considérer les distributions de probabilité. Autrement dit, la valeur optimale du problème ci-dessus est égale à la valeur optimale des éléments suivants:

Choisissez les vecteurs unitaires x 1 ,…, x n ∈ ℝ k pour minimiser (1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 .

Borne inférieure

En utilisant cette formulation équivalente, nous prouverons que la valeur optimale est au moins ( n / k - 1) / ( n −1).

Pour 1≤ in , soit X i = x i x i T le projecteur de rang 1 correspondant au vecteur unitaire x i . Ensuite, il soutient que ( x i T x j ) 2 = Tr ( X i X j ).

Soit Y = ∑ i X i . Ensuite, il considère que ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .

L'inégalité de Cauchy – Schwarz implique que Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , et donc ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 / k - n . En divisant par n ( n −1), on obtient que la valeur objective est au moins ( n / k - 1) / ( n −1).

En particulier, lorsque n = k +1, la réponse de daniello se situe dans un facteur 2 par rapport à la valeur optimale.

Quand cette limite inférieure peut-elle être atteinte?

La réalisation de cette limite inférieure ( n / k - 1) / ( n - 1) est équivalente à faire Y = ( n / k ) I . Je ne connais pas la caractérisation exacte quand elle est réalisable, mais les conditions suivantes existent suffisantes:

  • Lorsque n = k +1, cela peut être atteint en considérant k +1 vecteurs unitaires qui forment un k -simplex régulier centré à l'origine, passant de 2 / ( k ( k +1)) dans la réponse de daniello au 1 / k optimal 2 .
  • Lorsque n est un multiple de k , il est clairement réalisable en fixant une base orthonormée de ℝ k et en affectant chacun des vecteurs de base à n / k de v 1 ,…, v n .
  • Plus généralement que le dernier point, s'il est réalisable avec un certain choix de k et à la fois n = n 1 et n = n 2 , alors il est également réalisable pour le même k et n = n 1 + n 2 . En particulier, elle peut être atteinte si n = a k + ba et b sont des entiers satisfaisant ab ≥0.

Bien que je n'aie pas vérifié les détails, il semble que tout modèle 2 sphérique donne une solution atteignant cette limite inférieure.

Connexion incorrecte aux SIC-POVM dans les informations quantiques

Dans des révisions antérieures, j'ai déclaré:

Je soupçonne que répondre complètement à cette question est une question difficile. La raison en est que si nous considérons plutôt l'espace vectoriel complexe ℂ k , cette question est liée à un problème ouvert dans l'information quantique.

Mais cette relation était incorrecte. Je vais vous expliquer pourquoi.

Plus précisément, considérez le problème suivant:

Choisissez les vecteurs unitaires x 1 ,…, x n ∈ ℂ k pour minimiser (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

La borne inférieure ci-dessus est également valable dans cette version complexe. Considérons le cas où n = k 2 dans la version complexe. La borne inférieure est alors égale à 1 / ( k +1).

Jusqu'à présent, c'était correct.

Un ensemble de k 2 vecteurs unitaires x 1 ,…, x k 2 ∈ ℂ k atteignant la borne inférieure est appelé SIC-POVM en dimension k ,

Cette partie était incorrecte. Un SIC-POVM est un ensemble de k 2 vecteurs unitaires x 1 ,…, x n ∈ ℂ k pour lesquels | x i * x j | 2 = 1 / ( k +1) pour tout ij . Notez qu'ici, l'exigence doit être valable pour toutes les paires ij , et pas seulement la moyenne sur toutes les paires ij . Dans la section «Formulation équivalente», nous avons montré l'équivalence entre la minimisation du maximum et la minimisation de la moyenne, mais cela était possible car x 1,…, X n étaient des variables aléatoires qui y transportaient des vecteurs unitaires. Ici x 1 ,…, x n ne sont que des vecteurs unitaires, nous ne pouvons donc pas utiliser la même astuce.


5

v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

E[xaxb]=0xaxb12

Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j}1(k+12)(xaxb)2=0ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

xi

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.