Les grammaires sont des objets intrinsèquement récursifs, donc la réponse semble évidente: par induction. Cela dit, les détails sont souvent difficiles à obtenir. Dans la suite, je décrirai une technique qui permet de réduire de nombreuses preuves de correction grammaticale à des étapes mécaniques, à condition qu'un prétraitement créatif soit effectué.
L'idée de base est de ne pas se limiter aux mots de grammaire et de langage; il est difficile de saisir la structure de la grammaire de cette manière. Au lieu de cela, nous discuterons de l'ensemble de phrases que la grammaire peut créer. De plus, nous diviserons un objectif de preuve décourageant en plusieurs petits objectifs plus faciles à atteindre.
Laissez une grammaire formelle avec les non-terminaux , terminaux , les règles et de départ symbole . Nous notons l'ensemble des phrases qui peuvent être dérivées de donné , c'est-à-dire . Le langage généré par est . Supposons que nous voulons montrer que pour certains .N T δ S ∈ N ϑ ( G ) S δ α ∈ ϑ ( G )G=(N,T,δ,S)NTδS∈Nϑ(G)SδG L ( G ) = ϑ ( G ) ∩ T ∗ L = L ( G ) L ⊆ T ∗α∈ϑ(G)⟺S⇒∗αGL(G)=ϑ(G)∩T∗L=L(G)L⊆T∗
L'ansatz
Voici comment nous procédons. Nous définissons sorte queM1,…,Mk⊆(N∪T)∗
- ϑ(G)=⋃i=1kMi et
- T∗∩⋃i=1kMi=L .
Alors que 2. est généralement clair par définition du , 1. nécessite un travail sérieux. Les deux éléments ensemble impliquent clairement comme souhaité.L ( G ) = LMiL(G)=L
Pour faciliter la notation, notons .M=⋃ki=1Mi
La route rocailleuse
Il y a deux étapes principales pour effectuer une telle preuve.
Comment trouver (bon) ? Mi
Une stratégie consiste à étudier les phases de la grammaire. Toutes les grammaires ne se prêtent pas à cette idée; en général, il s'agit d'une étape créative. Cela aide si nous pouvons définir la grammaire nous-mêmes; avec une certaine expérience, nous serons en mesure de définir des grammaires plus maniables avec cette approche.
Comment prouver 1.?
Comme pour toute égalité définie, il existe deux directions.
- Gϑ(G)⊆M : induction (structurelle) sur les productions de .G
- M i SM⊆ϑ(G) : Habituellement , une induction par , à partir de celui qui contient .MiS
C'est aussi précis que possible; les détails dépendent de la grammaire et de la langue en question.
Exemple
Tenez compte de la langue
L={anbncm∣n,m∈N}
et la grammaire avec donnée parδG=({S,A},{a,b,c},δ,S)δ
SA→Sc∣A→aAb∣ε
pour laquelle nous voulons montrer que . Quelles sont les phases de cette grammaire? Eh bien, il génère d'abord puis . Cela informe immédiatement notre choix de , à savoirc m a n b n M iL=L(G)cmanbnMi
M0M1M2={Scm∣m∈N},={anAbncm∣m,n∈N},={anbncm∣m,n∈N}.
Comme et , l'élément 2. est déjà pris en charge. Vers 1., nous avons divisé la preuve en deux parties comme annoncé.M 0 ∩ T ∗ = M 1 ∩ T ∗ = ∅M2=LM0∩T∗=M1∩T∗=∅
ϑ(G)⊆M
Nous réalisons l' induction structurelle sur les règles de .G
IA: Puisque nous nous avec succès.S=Sc0∈M0
IH: On suppose pour un ensemble de phrases que nous connaissons aussi .X ⊆ MX⊆ϑ(G)X⊆M
IS: Soit arbitraire. Nous devons montrer que quelle que soit la forme a et quelle que soit la règle suivante est appliquée, nous ne laissons pas . Nous le faisons par distinction complète des cas. Par hypothèse d'induction, nous savons que (exactement) l'un des cas suivants s'applique:α Mα∈X⊆ϑ(G)∩MαM
- w = S c m m ∈ N Mw∈M0 , soit pour certains .
Deux règles peuvent être appliquées, toutes deux dérivant une phrase en :
w=Scmm∈N
M
- Scm⇒Scm+1∈M0 et
- Scm⇒Acm=a0Ab0cm∈M1 .
- w∈M1 , c'est-à-dire pour certains :
w=anAbncmm,n∈N
- w⇒an+1Abn+1cm∈M1 et
- w⇒anbncm∈M2 .
- w∈M3 : depuis , aucune autre dérivation n'est possible.w∈T∗
Comme nous avons réussi à couvrir tous les cas, l'induction est terminée.
ϑ(G)⊇M
Nous effectuons une (simple) preuve par . Notez comment nous enchaînons les preuves afin que "plus tard" puisse s'ancrer en utilisant le "plus tôt" .MiMiMi
- M1 : Nous effectuons une induction sur , ancrant dans et utilisant dans l'étape.mSc0=SS→Sc
- M2 : Nous fixons à une valeur arbitraire et induisons sur . Nous ancrons dans , en utilisant ce par la preuve précédente. L'étape progresse via .mnAcmS⇒∗Scm⇒AcmA→aAb
- M3 : Pour arbitraire nous utilisons l'ancienne preuve pour .m,n∈NS⇒∗anAbncm⇒anbncm
Ceci conclut la deuxième direction de la preuve de 1., et nous avons terminé.
Nous pouvons voir que nous exploitons fortement que la grammaire est linéaire . Pour les grammaires non linéaires, nous avons besoin de avec plus d'un paramètre variable (dans la ou les preuves), qui peut devenir laid. Si nous contrôlons la grammaire, cela nous apprend à rester simple. Considérez comme exemple dissuasif cette grammaire qui est équivalente à :MiG
SAC→aAbC∣ε→aAb∣ε→cC∣ε
Exercice
Donner une grammaire pour
L={bkal(bc)manbo∣k,l,m,n,o∈N,k≠o,2l=n,m≥2}
et prouver son exactitude.
Si vous avez des problèmes, une grammaire:
Considérons avec les productionsG=({S,Br,Bl,A,C},{a,b,c},δ,S)
SBlBrAC→bSb∣Bl∣Br→bBl∣bA→Brb∣Ab→aAaa∣C→bcC∣bcbc
et :Mi
M0M1M2M3M4M5={biSbi∣i∈N}={biBlbo∣o∈N,i≥o}={bkBrbi∣k∈N,i≥k}={bkaiAa2ibo∣k,o,i∈N,k≠o}={bkal(bc)iCa2lbo∣k,o,l,i∈N,k≠o}=L
Qu'en est-il des grammaires non linéaires?
La caractéristique de la classe des langues sans contexte est la langue Dyck : essentiellement, chaque langue sans contexte peut être exprimée comme l'intersection d'une langue Dyck et d'une langue régulière. Malheureusement, le langage Dyck n'est pas linéaire, c'est-à-dire que nous ne pouvons donner aucune grammaire intrinsèquement adaptée à cette approche.
Nous pouvons, bien sûr, encore définir et faire la preuve, mais c'est forcément plus difficile avec des inductions imbriquées et quoi d'autre. Il y a une manière générale que je connais qui peut aider dans une certaine mesure. Nous changeons l'ansatz pour montrer que nous générons au moins tous les mots requis, et que nous générons la bonne quantité de mots (par longueur). Formellement, nous montrons queMi
- ϑ(G)⊇L et
- n∈ N|L(G)∩Tn|=|L∩Tn|pour tous les .n∈N
De cette façon, nous pouvons nous limiter à la direction "facile" de l'ansatz d'origine et exploiter la structure du langage, en ignorant les fonctionnalités trop compliquées que la grammaire peut avoir. Bien sûr, il n'y a pas de déjeuner gratuit: nous obtenons la toute nouvelle tâche de compter les mots que génère pour chaque . Heureusement pour nous, c'est souvent maniable; voir ici et ici pour plus de détails¹. Vous pouvez trouver quelques exemples dans ma thèse de licence .n ∈ NG n∈N
Pour les grammaires ambiguës et non contextuelles, je crains que nous ne soyons de retour à ansatz one et aux casquettes réfléchies.
- Lorsque vous utilisez cette méthode particulière pour compter, nous obtenons en prime que la grammaire est sans ambiguïté. À son tour, cela signifie également que la technique doit échouer pour les grammaires ambiguës, car nous ne pouvons jamais en prouver 2.