Preuves alternatives du lemme de Schwartz – Zippel


28

Je ne connais que deux preuves du lemme de Schwartz – Zippel. La première preuve (plus courante) est décrite dans l' entrée wikipedia . La deuxième preuve a été découverte par Dana Moshkovitz.

Existe-t-il d'autres preuves qui utilisent des idées sensiblement différentes?


2
Pourriez-vous nous parler de votre motivation? Vous cherchez des généralisations dans différentes directions? Peut-être un aperçu géométrique?
Per Vognsen

Je n'ai pas vraiment de motivation particulière. Je serai très surpris que ce soient les deux seuls moyens possibles de prouver cet important lemme!
Dai Le

Bien que je convienne que ce lemme est important, les lemmes importants n'ont pas nécessairement de nombreuses preuves connues différentes. Par conséquent, votre raison me semble un peu étrange.
Tsuyoshi Ito

1
@Tsuyushi Ito: Je suis d'accord avec votre commentaire selon lequel les lemmes importants pourraient ne pas avoir beaucoup de preuves connues. Mais je pense qu'il est significatif de demander si c'est aussi le cas pour SZ Lemma. Étant donné que la SZ est fondamentale, il est probable qu'elle ait été découverte indépendamment par de nombreuses personnes de différents contextes. Ainsi, apprendre différentes preuves est parfois assez instructif à mon humble avis. Merci encore pour les excellents commentaires de tout le monde!
Dai Le

Réponses:


16

Voici une autre idée que j'avais pour une preuve géométrique. Il utilise la géométrie projective de manière essentielle.

Soit cFm soit un point à l' extérieur du hypersurface affine S . Projetez l'hypersurface sur l'hyperplan à l'infini en utilisant c comme centre; c'est-à-dire, mappez chaque xS sur p(x) , l'intersection de la ligne unique passant par c et x avec l'hyperplan à l'infini. Les préimages sous p d'un point à l'infini se trouvent toutes sur la même ligne, et donc (encore une fois en réduisant le problème à la dimension 1) il y en a la plupart d . L'hyperplan à l'infini a une cardinalité |Fm1|, nous obtenons donc la borne supérieure familière|S|d |Fm1|.


Beau! Et juste pour souligner un point crucial, la ligne n'est pas contenue dans l'hypersurface car elle passe par le point c, qui est en dehors de la surface.
arnab

1
@arnab: En effet, vous l'avez déjà bien expliqué dans votre propre article.
Per Vognsen du

1
@arnab: BTW, j'espère qu'il est clair que je ne prétends pas que cette idée est vraiment "nouvelle". Toutes ces preuves ont une odeur similaire. C'est probablement à prévoir.
Per Vognsen du

2
@Per: Oui, mais pour une raison quelconque, j'aime mieux votre version de l'argument que celle de Moshkovitz, car elle semble plus géométrique et vous n'avez pas à penser aux monômes dominants. Mais je suis d'accord, l'idée de base est à peu près la même.
arnab

@Per: vos contributions ont déjà été merveilleuses. Oui, ils ne sont pas vraiment nouveaux, mais j'aime beaucoup votre interprétation. C'est comme donner de nouvelles interprétations à un morceau de musique classique. :-)
Dai Le

18

Dans le prolongement de la réponse de Per Vognsen, la preuve de Dana Moshkovitz suggère déjà une preuve vraiment facile pour seulement une version légèrement plus faible du lemme de Schwartz-Zippel qui, je pense, suffit pour la plupart des applications.

Soit un polynôme non nul de degré d , où F est un corps fini d'ordre q , et soit x F n un point tel que f ( x ) 0 . Il y a ( q n - 1 ) / ( q - 1 ) de nombreuses lignes distinctes passant par x telles qu'elles partitionnent F n - { x }f:FnFdFqxFnf(x)0(qn1)/(q1)xFn{x}. La restriction de à chacune de ces lignes est un polynôme univarié de degré d , qui est non nul, car il est non nul à x , et donc, a au plus d zéros. Ainsi, le nombre total de zéros de f est au plus d ( q n - 1 ) / ( q - 1 ) . Schwartz-Zippel, à titre de comparaison, donne la borne supérieure plus forte de d q n - 1 .fd xdfd(qn1)/(q1)dqn1

Étant donné la facilité de cette preuve, je suis sûr que c'est du folklore; sinon, cela devrait être :) J'apprécierais que quelqu'un puisse fournir une référence.


3
Très agréable! Saviez-vous qu'elle fait exactement la même chose, uniquement avec un point projectif à l'infini plutôt qu'un point affine? J'ai ajouté un paragraphe à ma réponse originale pour expliquer davantage la relation.
Per Vognsen

1
Ah, c'est une excellente interprétation! Merci!
arnab

14

La preuve de Moshkovitz est basée sur une géométrie simple mais le papier n'est pas trop clair à ce sujet. Voici l'idée:

Un polynôme de degré dans m variables coupe une hypersurface dans F m . L'intersection de l'hypersurface et d'une ligne indépendante (c'est-à-dire que l'intersection n'est pas la ligne entière) a au plus d points. Si vous pouvez trouver une direction partout indépendante de l'hypersurface, vous pouvez feuilleter F m par des lignes parallèles dans cette direction et compter les intersections à l'intérieur de chaque ligne. La foliation est paramétrée par le complément orthogonal de la direction, qui est un hyperplan isomorphe à F m - 1 , donc le nombre total de points d'hypersurface à travers tout F m est au plus d | FdmFmFmFm1Fm .d |F|m1

Cela suggère que d'autres preuves dans le même sens pourraient fonctionner.

Edit: Je voulais dire un peu comment la preuve d'Arnab se rapporte à Moshkovitz. Il prend un point en dehors de l'hypersurface et considère le crayon de lignes à travers ce point. Moshkovitz considère une famille de lignes parallèles. Cela semble différent mais c'est vraiment la même chose! Une famille parallèle est un crayon de lignes passant par un point à l'infini. L'algèbre d'Arnab s'applique textuellement si vous prenez d'abord l'homogénéisation du polynôme et vous limitez à l'hyperplan à l'infini en branchant , ce qui efface tous les termes non principaux.w=0

Edit: Voir mon autre réponse pour une nouvelle preuve (mais pas complètement sans rapport).


6

Tentative 1:

Avez-vous regardé le lemme A.36 (page 529) du livre d' Arora / Barak ? Il fait presque une demi-page et est basé sur l'induction.

Si vous n'avez pas accès au livre, je peux en effectuer la preuve ici.


Tentative 2:

Qu'en est-il de la curieuse histoire du lemme de Schwartz-Zippel ? Entre autres, il cite l'article de DeMillo-Lipton , datant de 1977. Plusieurs autres articles sont également nommés et comparés.


Tentative 3:

La rubrique MathOverflow suivante pourrait également être intéressante: Algorithme P / poly pour les tests d'identité polynomiale .


Oui je l'ai fait. Mais cette preuve est essentiellement la même que celle de wikipedia.
Dai Le

4

Le lemme de Schwartz-Zippel est un cas particulier d'un théorème de Noga Alon et Zoltan Füredi comme montré dans la section 4 de cet article: Sur les zéros d'un polynôme dans une grille finie , et donc toute nouvelle preuve de ce théorème donne une nouvelle preuve de Schwartz -Zippel. Pour l'instant, je connais six preuves différentes, dont deux apparaissent dans le document et d'autres y sont référencées.

Le théorème d'Alon-Furedi dit ce qui suit:

Soit un champ, soit A = n i = 1 A iF n une grille finie, soit f F [ t _ ] = F [ t 1 , , t n ] un polynôme qui ne disparaître de façon identique sur A . Alors f ( x ) 0 pour au moins min y i éléments x AFA=i=1nAiFnfF[t_]=F[t1,,tn]Af(x)0minyixAOù le minimum est pris sur l' ensemble des nombres entiers positifs avec Σ n i = 1 y i = Σ n i = 1 # A i - ° f .yi#Aii=1nyi=i=1n#Aidegf

Dans ce cas, si vous supposez et déterminez le minimum (ce qui peut être fait facilement en utilisant les trucs Balls in Bins mentionnés dans l'article), alors vous obtenez le lemme de Schwartz-Zippel sur un champ (ou un domaine) .degf<min#Ai


Pouvez-vous jeter un œil au lemme 2.2 dans web.stanford.edu/~rrwill/graph-cr.pdf ? C'est ce que Ryan Williams entend par son commentaire sous ma réponse, et il est depuis sur ma liste de tâches pour vérifier s'il peut être généralisé aux anneaux commutatifs. Il me semble que vous êtes actuellement beaucoup plus en profondeur que moi, alors pourquoi ne pas essayer?
Thomas Klimpel

@ThomasKlimpel: Je vais modifier la réponse. Je l'ai écrit quand je viens de commencer à utiliser stackexchange de la théorie CS. Et oui, le lemme 2.2 fonctionne sur des anneaux commutatifs arbitraires puisque {0,1} ^ n satisfait toujours la condition (D).
Anurag

SRxySxyA1××AnRnAi

3

La formulation originale du lemme Schwartz – Zippel ne s'applique qu'aux domaines:


PF[x1,x2,,xn]d0FSFr1,r2,,rnS
Pr[P(r1,r2,,rn)=0]d|S|.

On peut reformuler le lemme de telle sorte qu'il ait un sens pour les anneaux commutatifs arbitraires:


PR[x1,x2,,xn]d0RSRs,tS:((uR:(u0su=tu))s=t)r1,r2,,rnS
Pr[P(r1,r2,,rn)=0]d|S|.

L'avantage de la preuve de wikipedia est qu'elle généralise pour montrer que la reformulation est vraie pour les anneaux commutatifs arbitraires, ce qui a été remarqué et élaboré par Emil Jeřábek ici .

Cela donne une preuve alternative du lemme de Schwartz-Zippel, en prouvant la reformulation pour les anneaux commutatifs généraux, et en obtenant la formulation normale pour les champs comme corollaire.


Les polynômes sont l'algèbre libre des anneaux commutatifs, c'est-à-dire l'algèbre libre générée par l'addition, les inverses additifs, la multiplication et les constantes par rapport aux axiomes des anneaux commutatifs. L'espoir initial était de trouver une généralisation du lemme de Schwartz-Zippel pour l'algèbre libre qui contient en plus des inverses multiplicatifs (généralisés) par rapport aux axiomes des anneaux réguliers commutatifs . Voir aussi le travail de Jan A. Bergstra .
Thomas Klimpel

1
Zm

1
@RyanWilliams L'article sur les zéros d'un polynôme dans une grille finie cité dans la réponse récente d'Anurag Bishnoi généralise à la fois le lemme ci-dessus, le théorème d'Alon-Furedi et le lemme 2.2 de cet article SODA'15 (et prouvent la netteté de la borne) . Il était sur ma liste de tâches depuis votre commentaire pour trouver une telle généralisation, c'est donc une réalisation importante de mon point de vue (donc on pourrait féliciter les auteurs).
Thomas Klimpel
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.