Je vais présenter une formulation équivalente mais plus simple du problème, et montrer une borne inférieure de ( n / k - 1) / ( n −1). Je montre également une connexion à un problème ouvert d'informations quantiques. [Modifier dans la révision 3: dans les révisions précédentes, j'ai affirmé qu'une caractérisation exacte des cas dans lesquels la limite inférieure illustrée ci-dessous est probablement difficile à réaliser car une question analogue dans le cas complexe inclut un problème ouvert concernant les SIC-POVM dans informations quantiques. Cependant, cette connexion aux SIC-POVM était incorrecte. Pour plus de détails, voir la section «Connexion incorrecte aux SIC-POVM dans les informations quantiques» ci-dessous.]
Formulation équivalente
Tout d'abord, comme cela a déjà été souligné dans la réponse de daniello, notez que Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Donc, dans le reste de la réponse, nous oublions la variance et minimisons plutôt max i ≠ j E [( x i T x j ) 2 ].
Ensuite, une fois que nous décidons que notre objectif est de minimiser max i ≠ j E [( x i T x j ) 2 ], nous pouvons ignorer la contrainte que E [ x i T x j ] = 0. En effet, si nous avons vecteurs unitaires x 1 ,…, x n , alors nous pouvons nier chacun d'eux indépendamment avec une probabilité 1/2 pour satisfaire E [ x i T x j ] = 0 sans changer la valeur de la fonction objectif max i ≠ j E [( x i T x j) 2 ].
De plus, changer la fonction objectif de max i ≠ j E [( x i T x j ) 2 ] à (1 / ( n ( n −1))) ∑ i ≠ j E [( x i T x j ) 2 ] ne modifie pas la valeur optimale. Ce dernier est tout au plus le premier car la moyenne est tout au plus le maximum. Cependant, nous pouvons toujours faire les valeurs de E [( x i T x j ) 2 ] pour différents choix de ( i , j ) ( i ≠j ) égal en permutant au hasard les n vecteurs x 1 ,…, x n .
Donc pour tout n et k , la valeur optimale du problème en question est égale au minimum de (1 / ( n ( n −1))) ∑ i ≠ j E [( x i T x j ) 2 ] où x 1 ,…, x n sont des variables aléatoires qui prennent comme valeurs des vecteurs unitaires dans ℝ k .
Cependant, par linéarité de l'espérance, cette fonction objectif est égale à la valeur attendue E [(1 / ( n ( n −1))) ∑ i ≠ j ( x i T x j ) 2 ]. Le minimum étant au maximum la moyenne, il n'est plus nécessaire de considérer les distributions de probabilité. Autrement dit, la valeur optimale du problème ci-dessus est égale à la valeur optimale des éléments suivants:
Choisissez les vecteurs unitaires x 1 ,…, x n ∈ ℝ k pour minimiser (1 / ( n ( n −1))) ∑ i ≠ j ( x i T x j ) 2 .
Borne inférieure
En utilisant cette formulation équivalente, nous prouverons que la valeur optimale est au moins ( n / k - 1) / ( n −1).
Pour 1≤ i ≤ n , soit X i = x i x i T le projecteur de rang 1 correspondant au vecteur unitaire x i . Ensuite, il soutient que ( x i T x j ) 2 = Tr ( X i X j ).
Soit Y = ∑ i X i . Ensuite, il considère que ∑ i ≠ j Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .
L'inégalité de Cauchy – Schwarz implique que Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , et donc ∑ i ≠ j Tr ( X i X j ) = Tr ( Y 2 ) - n ≥ n 2 / k - n . En divisant par n ( n −1), on obtient que la valeur objective est au moins ( n / k - 1) / ( n −1).
En particulier, lorsque n = k +1, la réponse de daniello se situe dans un facteur 2 par rapport à la valeur optimale.
Quand cette limite inférieure peut-elle être atteinte?
La réalisation de cette limite inférieure ( n / k - 1) / ( n - 1) est équivalente à faire Y = ( n / k ) I . Je ne connais pas la caractérisation exacte quand elle est réalisable, mais les conditions suivantes existent suffisantes:
- Lorsque n = k +1, cela peut être atteint en considérant k +1 vecteurs unitaires qui forment un k -simplex régulier centré à l'origine, passant de 2 / ( k ( k +1)) dans la réponse de daniello au 1 / k optimal 2 .
- Lorsque n est un multiple de k , il est clairement réalisable en fixant une base orthonormée de ℝ k et en affectant chacun des vecteurs de base à n / k de v 1 ,…, v n .
- Plus généralement que le dernier point, s'il est réalisable avec un certain choix de k et à la fois n = n 1 et n = n 2 , alors il est également réalisable pour le même k et n = n 1 + n 2 . En particulier, elle peut être atteinte si n = a k + b où a et b sont des entiers satisfaisant a ≥ b ≥0.
Bien que je n'aie pas vérifié les détails, il semble que tout modèle 2 sphérique donne une solution atteignant cette limite inférieure.
Connexion incorrecte aux SIC-POVM dans les informations quantiques
Dans des révisions antérieures, j'ai déclaré:
Je soupçonne que répondre complètement à cette question est une question difficile. La raison en est que si nous considérons plutôt l'espace vectoriel complexe ℂ k , cette question est liée à un problème ouvert dans l'information quantique.
Mais cette relation était incorrecte. Je vais vous expliquer pourquoi.
Plus précisément, considérez le problème suivant:
Choisissez les vecteurs unitaires x 1 ,…, x n ∈ ℂ k pour minimiser (1 / ( n ( n −1))) ∑ i ≠ j | x i * x j | 2 .
La borne inférieure ci-dessus est également valable dans cette version complexe. Considérons le cas où n = k 2 dans la version complexe. La borne inférieure est alors égale à 1 / ( k +1).
Jusqu'à présent, c'était correct.
Un ensemble de k 2 vecteurs unitaires x 1 ,…, x k 2 ∈ ℂ k atteignant la borne inférieure est appelé SIC-POVM en dimension k ,
Cette partie était incorrecte. Un SIC-POVM est un ensemble de k 2 vecteurs unitaires x 1 ,…, x n ∈ ℂ k pour lesquels | x i * x j | 2 = 1 / ( k +1) pour tout i ≠ j . Notez qu'ici, l'exigence doit être valable pour toutes les paires i ≠ j , et pas seulement la moyenne sur toutes les paires i ≠ j . Dans la section «Formulation équivalente», nous avons montré l'équivalence entre la minimisation du maximum et la minimisation de la moyenne, mais cela était possible car x 1,…, X n étaient des variables aléatoires qui y transportaient des vecteurs unitaires. Ici x 1 ,…, x n ne sont que des vecteurs unitaires, nous ne pouvons donc pas utiliser la même astuce.