Comment montrer que L = L (G)?

Spécifier des langues formelles en donnant des grammaires formelles est une tâche fréquente: nous avons besoin de grammaires non seulement pour décrire les langues, mais aussi pour les analyser, ou même pour faire une science appropriée . Dans tous les cas, il est important que la grammaire soit correcte , c'est-à-dire qu'elle génère exactement les mots souhaités.

Nous pouvons souvent discuter à un niveau élevé pourquoi la grammaire est une représentation adéquate de la langue souhaitée, en omettant une preuve formelle. Mais que faire si nous avons un doute ou si nous avons besoin d'une preuve formelle pour une raison quelconque? Quelles techniques pouvons-nous appliquer?

^{Ceci est censé devenir une question de référence . Par conséquent, veuillez prendre soin de donner des réponses générales, présentées de manière didactique, illustrées par au moins un exemple mais couvrant néanmoins de nombreuses situations. Merci!}

— Raphael
source

Les grammaires sont des objets intrinsèquement récursifs, donc la réponse semble évidente: par induction. Cela dit, les détails sont souvent difficiles à obtenir. Dans la suite, je décrirai une technique qui permet de réduire de nombreuses preuves de correction grammaticale à des étapes mécaniques, à condition qu'un prétraitement créatif soit effectué. $\newcommand{\lang}[1]{\mathcal{L}(#1)} \newcommand{\sent}[1]{\vartheta(#1)} \newcommand{\derive}{\mathbin{\Rightarrow}} \newcommand{\derivestar}{\mathbin{\Rightarrow^*}} \newcommand{\nats}{\mathbb{N}}$

L'idée de base est de ne pas se limiter aux mots de grammaire et de langage; il est difficile de saisir la structure de la grammaire de cette manière. Au lieu de cela, nous discuterons de l'ensemble de phrases que la grammaire peut créer. De plus, nous diviserons un objectif de preuve décourageant en plusieurs petits objectifs plus faciles à atteindre.

Laissez une grammaire formelle avec les non-terminaux , terminaux , les règles et de départ symbole . Nous notons l'ensemble des phrases qui peuvent être dérivées de donné , c'est-à-dire . Le langage généré par est . Supposons que nous voulons montrer que pour certains . $G=(N,T,\delta,S)$ $N$ $T$ $\delta$ $S \in N$ $\sent{G}$ $S$ $\delta$ $\alpha \in \sent{G} \iff S \derivestar \alpha$ $G$ $\lang{G} = \sent{G} \cap T^*$ $L = \lang{G}$ $L \subseteq T^*$

L'ansatz

Voici comment nous procédons. Nous définissons sorte que $M_1, \dots, M_k \subseteq (N \cup T)^*$

$\displaystyle \sent{G} = \bigcup_{i=1}^k M_i$ et
$\displaystyle T^* \cap \bigcup_{i=1}^k M_i = L$ .

Alors que 2. est généralement clair par définition du , 1. nécessite un travail sérieux. Les deux éléments ensemble impliquent clairement comme souhaité. $M_i$ $\lang{G} = L$

Pour faciliter la notation, notons . $M = \bigcup_{i=1}^k M_i$

La route rocailleuse

Il y a deux étapes principales pour effectuer une telle preuve.

Comment trouver (bon) ? $M_i$
Une stratégie consiste à étudier les phases de la grammaire. Toutes les grammaires ne se prêtent pas à cette idée; en général, il s'agit d'une étape créative. Cela aide si nous pouvons définir la grammaire nous-mêmes; avec une certaine expérience, nous serons en mesure de définir des grammaires plus maniables avec cette approche.
Comment prouver 1.?
Comme pour toute égalité définie, il existe deux directions.
- $\sent{G} \subseteq M$ : induction (structurelle) sur les productions de . $G$
- $M \subseteq \sent{G}$ : Habituellement , une induction par , à partir de celui qui contient . $M_i$ $S$

C'est aussi précis que possible; les détails dépendent de la grammaire et de la langue en question.

Exemple

Tenez compte de la langue

$\qquad \displaystyle L = \{ a^n b^n c^m \mid n,m \in \nats \}$

et la grammaire avec donnée par $G = (\{S,A\}, \{a,b,c\}, \delta, S)$ $\delta$

$\qquad \begin{align} S &\to Sc \mid A \\ A &\to aAb \mid \varepsilon \end{align}$

pour laquelle nous voulons montrer que . Quelles sont les phases de cette grammaire? Eh bien, il génère d'abord puis . Cela informe immédiatement notre choix de , à savoir $L = \lang{G}$ $c^m$ $a^n b^n$ $M_i$

$\qquad \begin{align} M_0 &= \{Sc^m \mid m \in \nats \} \;, \\ M_1 &= \{ a^n A b^n c^m \mid m,n \in \nats \} \;, \\ M_2 &= \{ a^n b^n c^m \mid m,n \in \nats \} \;. \\ \end{align}$

Comme et , l'élément 2. est déjà pris en charge. Vers 1., nous avons divisé la preuve en deux parties comme annoncé. $M_2 = L$ $M_0 \cap T^* = M_1 \cap T^* = \emptyset$

$\mathbf{\sent{G} \subseteq M}$

Nous réalisons l' induction structurelle sur les règles de . $G$

IA: Puisque nous nous avec succès. $S = Sc^0 \in M_0$

IH: On suppose pour un ensemble de phrases que nous connaissons aussi . $X \subseteq \sent{G}$ $X \subseteq M$

IS: Soit arbitraire. Nous devons montrer que quelle que soit la forme a et quelle que soit la règle suivante est appliquée, nous ne laissons pas . Nous le faisons par distinction complète des cas. Par hypothèse d'induction, nous savons que (exactement) l'un des cas suivants s'applique: $\alpha \in X \subseteq \sent{G} \cap M$ $\alpha$ $M$

w = S c m m ∈ N M , soit pour certains . Deux règles peuvent être appliquées, toutes deux dérivant une phrase en :
- $Sc^m \derive Sc^{m+1} \in M_0$ et
- $Sc^m \derive Ac^m = a^0Ab^0c^m \in M_1$ .
, c'est-à-dire pour certains :
- $w \derive a^{n+1}Ab^{n+1}c^m \in M_1$ et
- $w \derive a^nb^nc^m \in M_2$ .
$w \in M_3$ : depuis , aucune autre dérivation n'est possible. $w \in T^*$

Comme nous avons réussi à couvrir tous les cas, l'induction est terminée.

$\mathbf{\sent{G} \supseteq M}$

Nous effectuons une (simple) preuve par . Notez comment nous enchaînons les preuves afin que "plus tard" puisse s'ancrer en utilisant le "plus tôt" . $M_i$ $M_i$ $M_i$

$M_1$ : Nous effectuons une induction sur , ancrant dans et utilisant dans l'étape. $m$ $Sc^0 = S$ $S \to Sc$
$M_2$ : Nous fixons à une valeur arbitraire et induisons sur . Nous ancrons dans , en utilisant ce par la preuve précédente. L'étape progresse via . $m$ $n$ $Ac^m$ $S \derivestar Sc^m \derive Ac^m$ $A \to aAb$
$M_3$ : Pour arbitraire nous utilisons l'ancienne preuve pour . $m,n \in \nats$ $S \derivestar a^nAb^nc^m \derive a^nb^nc^m$

Ceci conclut la deuxième direction de la preuve de 1., et nous avons terminé.

Nous pouvons voir que nous exploitons fortement que la grammaire est linéaire . Pour les grammaires non linéaires, nous avons besoin de avec plus d'un paramètre variable (dans la ou les preuves), qui peut devenir laid. Si nous contrôlons la grammaire, cela nous apprend à rester simple. Considérez comme exemple dissuasif cette grammaire qui est équivalente à : $M_i$ $G$

$\qquad \begin{align} S &\to aAbC \mid \varepsilon \\ A &\to aAb \mid \varepsilon \\ C &\to cC \mid \varepsilon \end{align}$

Exercice

Donner une grammaire pour

$\qquad L = \{ b^k a^l (bc)^m a^n b^o \mid k,l,m,n,o \in \nats, k \neq o, 2l = n, m \geq 2 \}$

et prouver son exactitude.

Si vous avez des problèmes, une grammaire:

Considérons avec les productions $G = (\{S,B_r,B_l,A,C\}, \{a,b,c\}, \delta, S)$

$\quad \begin{align} S &\to bSb \mid B_l \mid B_r \\ B_l &\to bB_l \mid bA \\ B_r &\to B_r b \mid Ab \\ A &\to aAaa \mid C \\ C &\to bcC \mid bcbc \end{align}$

et : $M_i$

$\quad\begin{align} M_0 &= \{ b^i S b^i \mid i \in \nats \} \\ M_1 &= \{ b^i B_l b^o \mid o \in \nats, i \geq o \} \\ M_2 &= \{ b^k B_r b^i \mid k \in \nats, i \geq k \} \\ M_3 &= \{ b^k a^i A a^{2i} b^o \mid k,o,i \in \nats, k \neq o \} \\ M_4 &= \{ b^k a^l (bc)^i C a^{2l} b^o \mid k,o,l,i \in \nats, k \neq o \} \\ M_5 &= L \end{align}$

Qu'en est-il des grammaires non linéaires?

La caractéristique de la classe des langues sans contexte est la langue Dyck : essentiellement, chaque langue sans contexte peut être exprimée comme l'intersection d'une langue Dyck et d'une langue régulière. Malheureusement, le langage Dyck n'est pas linéaire, c'est-à-dire que nous ne pouvons donner aucune grammaire intrinsèquement adaptée à cette approche.

Nous pouvons, bien sûr, encore définir et faire la preuve, mais c'est forcément plus difficile avec des inductions imbriquées et quoi d'autre. Il y a une manière générale que je connais qui peut aider dans une certaine mesure. Nous changeons l'ansatz pour montrer que nous générons au moins tous les mots requis, et que nous générons la bonne quantité de mots (par longueur). Formellement, nous montrons que $M_i$

$\displaystyle \sent{G} \supseteq L$ et
$\displaystyle |\lang{G} \cap T^n| = |L \cap T^n|$ pour tous les . $n \in \nats$

De cette façon, nous pouvons nous limiter à la direction "facile" de l'ansatz d'origine et exploiter la structure du langage, en ignorant les fonctionnalités trop compliquées que la grammaire peut avoir. Bien sûr, il n'y a pas de déjeuner gratuit: nous obtenons la toute nouvelle tâche de compter les mots que génère pour chaque . Heureusement pour nous, c'est souvent maniable; voir ici et ici pour plus de détails¹. Vous pouvez trouver quelques exemples dans ma thèse de licence . $G$ $n \in \nats$

Pour les grammaires ambiguës et non contextuelles, je crains que nous ne soyons de retour à ansatz one et aux casquettes réfléchies.

Lorsque vous utilisez cette méthode particulière pour compter, nous obtenons en prime que la grammaire est sans ambiguïté. À son tour, cela signifie également que la technique doit échouer pour les grammaires ambiguës, car nous ne pouvons jamais en prouver 2.

— Raphael
source