Précision numérique dans la méthode de la somme des carrés?


13

J'ai lu un peu sur la méthode de la somme des carrés (SOS) de l' enquête de Barak & Steurer et les notes de cours de Barak . Dans les deux cas, ils balaient les problèmes de précision numérique sous le tapis.

D'après ma compréhension (certes limitée) de la méthode, ce qui suit devrait être vrai:

Étant donné tout système d'égalités polynomiales E sur des variables de valeur réelle xRn , où tous les paramètres sont O(1) ( n , |E| et degré de chaque contrainte), le degré - " 2n " ( =O(1) ) La méthode SOS trouve une affectation satisfaisante des variables ou prouve qu'aucune n'existe en temps O(1) .

Ma première question est de savoir si la revendication ci-dessus est vraie (y a-t-il un argument naïf qui n'utilise pas SOS pour résoudre ce problème?). La deuxième question est de savoir où s'intègre la précision numérique. Si je veux obtenir une affectation qui satisfasse toutes les contraintes à une précision ε supplémentaire, comment le temps d'exécution dépend-il de 1/ε ? En particulier, est-ce polynomial?

La motivation pour cela est, par exemple, d'appliquer une approche diviser pour mieux régner sur un grand système jusqu'à ce que le scénario de base soit un système de taille O(1) .

EDIT: D'après Barak-Steurer, il apparaît que " algorithme de somme des carrés de degré l " à la p.9 (et les paragraphes qui y mènent) définissent tous des problèmes pour des solutions sur R , et en fait la définition d'un pseudo -distribution à la section 2.2 est sur R . Maintenant, je vois dans le lemme 2.2, cependant, que l'on ne garantit pas une solution / réfutation au degré 2 n sans variables binaires.lRR2n

Je peux donc affiner un peu ma question. Si vos variables ne sont pas binaires, le souci est que la séquence de sorties n'est pas finie (peut-être même pas monotone croissante?). La question est donc: est-ce que φ ( l ) continue d'augmenter? Et si oui, jusqu'où devez-vous aller pour obtenir une précision additive ε ?φ(l)φ(l)ε

Bien que cela ne changera sans doute rien, je sais que mon système est satisfiable (il n'y a pas de réfutation quelconque degré), donc je suis vraiment juste préoccupé par la taille doit être. Enfin, je m'intéresse à une solution théorique, pas à un solveur numérique.l


Réponses:


1

Voici le commentaire de Boaz Barak sur la question:

Nous balayons la précision numérique sous le tapis - la littérature SOS plus "traditionnelle" de Parrilo, Lasserre etc. traite de ces questions (par exemple, voir les enquêtes de Monique Laurent et les références qui y figurent). On sait que la hiérarchie est monotone (il n'est pas difficile de voir qu'une distribution de degré pseudo est en particulier un degré l - 1 un), et qu'elle convergera en degré fini pour tout ensemble d'équations fixe (c'est la Positivstellensatz). Le degré exact peut varier. En règle générale, si tous les coefficients des polynômes sont bornés et que vous essayez de faire la distinction entre le cas où il existe une solution et le cas où, dans toute affectation, l'une des équations est désactivée par ϵ , alors on pourrait discrétiser cela en unll1ϵ -net pour δ en fonction du nombre de variables, du degré d'équations et de ϵ , puis (en supposant que le filet est suffisamment "agréable" et "cube"), le degré requis devrait être à peu près la taille du filet.δδϵ


Publié comme réponse pour éviter que le bot de la communauté ne refasse la question à l'avenir.
Kaveh

1

Je pense que ma réponse est probablement insuffisante, mais elle reste par souci d'exhaustivité (bien que voir les commentaires de Boaz ci-dessous pour probablement une meilleure réponse)

Lorsque nous nous limitons aux variables booléennes, la revendication peut être vue lorsque pour tous(xi21)E avec l'observation que lespseudo-distributions dedegré 2 n sont des distributions réelles, c'est-à-dire, supposons que vous ayez une pseudo-distribution μ ( x ) sur les solutions x de vos égalités polynomiales E satisfaisant:i[n]2nμ(x)xE

etx { - 1x{1,1}nμ(x)pour tous les polynômespde degré au plusnx{1,1}nμ(x)p2(x)0pn

Mais les polynômes de degré incluent le polynôme indicateur (par exemple, x 1 = 1 , x 2 = - 1 , x 3 = 1 a 2 - 3 ( 1 + x 1 ) ( 1 - x 2 ) ( 1 + x 3 ) qui est tout nul ailleurs et 1 sur cette affectation). Donc μ ( x ) 0 pour tout x {nx1=1,x2=1,x3=123(1+x1)(1x2)(1+x3)μ(x)0 , nous concluons donc μ est une distribution réelle sur les solutions de E. Degré ℓ les pseudo-distributions peuvent être trouvées en utilisant une programmation semi-définie pour trouver un degré associéx{1,1}nμE opérateur pseudo-attente le temps, afinnous puissions trouver la distribution réelle μ danstemps n O ( n ) en utilisant ce pseudo- attente (maintenant une attente réelle) pour trouver tous les moments de μ .nO()μnO(n)μ

Donc, si , alors vous pouvez trouver une distribution de solutions à E en temps O ( 1 ) . Bien sûr, la recherche par force brute garantit la même chose.|E|=O(1)EO(1)

Cependant, si les solutions ne sont pas nécessairement booléennes, alors les pseudo-attentes de degré ne sont pas suffisantes pour trouver une distribution sur les solutions. Comme on peut le voir ci-dessus, la preuve que les pseudo-distributions de degré 2 n sont des distributions réelles dépend du fait que les polynômes de degré n sont suffisants pour `` repérer '' les affectations individuelles, ce qui n'est pas vrai plus généralement. Une autre façon de voir les choses est de considérer les polynômes à variable booléenne2n2nn , donc le degré de chaque monôme est au plus n .mod(xi2)n

Par exemple, on pourrait envisager de remplacer chaque variable binaire par une variable à 4 aires, par exemple en incluant . Il faudrait alors avoir unepseudo-attente dedegré 4 n pour garantir la récupération d'une distribution sur des solutions.(xi21)(xi24)E4n

Maintenant, pour des garanties théoriques, il semble que l'approximation d'une racine d'un système de polynômes soit également connue comme le 17ème problème de Smale, et apparemment il existe un algorithme de temps polynomial randomisé (Las Vegas) qui résout ce problème - voir http://arxiv.org /pdf/1211.1528v1.pdf . Notez que cela semble être dans le modèle Blum-Shub-Smale, donc les opérations réelles sont primitives. Je ne sais pas si cela donne la garantie dont vous avez besoin.


Je pense que je n'ai peut-être pas précisé cela: mes variables sont dans R , car sinon je pourrais simplement faire une recherche triviale O ( 2 n ) = O ( 1 ) sur l'hypercube booléen. J'ai mis à jour la question pour refléter cela. SDP / SOS s'applique également aux problèmes d'optimisation d'entrée réelle, non?xiRO(2n)=O(1)
Jeremy Kun

Oups, mon erreur! Oui, cela s'applique à des paramètres plus généraux, bien que nous supposions souvent que nous sommes sur l'hypercube. J'ai mis à jour ma réponse, mais ma réponse sera moins claire que je ne l'aurais espéré.
Joe Bebel

10
Nous balayons la précision numérique sous le tapis - la littérature SOS plus "traditionnelle" de Parrilo, Lasserre etc. traite de ces questions (par exemple, voir les enquêtes de Monique Laurent et les références qui y figurent). On sait que la hiérarchie est monotone (il n'est pas difficile de voir qu'un degré pseudo-distribution est en particulier un degré - 1 un), et qu'elle convergera en degré fini pour tout ensemble d'équations fixe (c'est la Positivstellensatz). 1
Boaz Barak

9
..Le degré exact peut varier. En règle générale, si tous les coefficients des polynômes sont bornés et que vous essayez de faire la distinction entre le cas où il existe une solution et le cas où, dans toute affectation, l'une des équations est désactivée par , alors on pourrait discrétiser cela en un δ - net pour δ lié au nombre de variables, au degré d'équations, etϵδδ , puis (en supposant que le filet est suffisamment "sympa" et "cubique") le degré requis devrait être à peu près la taille du filet. ϵ
Boaz Barak

4
@BoazBarak peut-être que cela pourrait être une réponse?
Suresh Venkat
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.