Kontextfreie Sprachen Kontextfreie Grammatiken Definition 13.1 ...

Kontextfreie Sprachen 

Die Klasse der kontextfreien Sprachen über dem Alphabet $ (bezeichnet durch kfS $ ) 

• bildet eine weitere Teilklasse der formalen Sprachen, die die regulären 

Sprachen umfasst: REG $ % kfS $ 


• werden durch kontextfreie Grammatiken erzeugt 

o Die Wörter / Sätze, die von kontextfreien Grammatiken erzeugt werden, 

besitzen eine syntaktische Struktur, die für die Verwendung der Sprache 

wichtig ist. (! logische Formeln, arithmetische Ausdrücke) 

o Parsing bezeichnet den Vorgang der Zuweisung einer syntaktischen 

Struktur für eine Zeichenkette. (Parsing basiert auf Grammatiken) 

• werden durch einen spezifischen Typ von Automaten, die (nichtdeterministischen) 

Kellerautomaten, akzeptiert 

• besitzen andere Abschlusseigenschaften als die regulären Sprachen 

• Nichtzugehörigkeit zu kfS $ kann durch ein Pumpinglemma (für kontextfreie 

Sprachen) getestet werden 

FGI-1 Habel / Eschenbach Kap 13 Kontextfreie Sprachen & Grammatiken [1] 

Kontextfreie Grammatiken 

Definition 13.1 (! Def. 1.6) 

Eine kontextfreie Grammatik G ist ein 4-Tupel (!, N, P, S), für das gilt: 

• ! ist ein Alphabet, genannt das Alphabet der Terminalsymbole 

• N ist ein Alphabet (von Nichtterminalsymbolen), das disjunkt zu ! ist 

• P ist eine endliche Menge von Produktionsregeln (auch als Regeln bezeichnet), 

wobei jede Regel ein Paar (A, w) ist, mit A ! N und w ! ( ! " N )* 

• S ! N heißt Startsymbol 

Anmerkungen 

• Kontextfreie Grammatik wird auch durch kfG oder CFG abgekürzt. 

• Nichtterminale werden auch als Variable bezeichnet. 

• Regeln werden im Weiteren in der Form A # w geschrieben. 

• A wird als linke und w als rechte Seite der Regel bezeichnet. 

• Regeln, die die gleiche linke Seite haben, d.h. die Ableitungen vom gleichen 

nichtterminalen Symbol betreffen, werden häufig „zusammengefasst“ (siehe 

nächste Folie) 

• Auch A # " ist eine zulässige Regel (für kontextfreie Grammatiken) 

FGI-1 Habel / Eschenbach Kap 13 Kontextfreie Sprachen & Grammatiken [2]

Zwei Grammatiken für Arithmetische Ausdrücke 

G 4 = (!, N, P, &EXPR') 

! = { a, + , (, (, ) } N = {&EXPR'} 

P = { &EXPR' # &EXPR' + & EXPR ', &EXPR' # &EXPR' ( & EXPR ', 

&EXPR' # ( &EXPR' ), &EXPR' # a } 

Die Regeln in zusammengefasster Form: 

P = { &EXPR' # &EXPR' + & EXPR ' | &EXPR' ( & EXPR ' | ( &EXPR' ) | a } 

G 3 = (!, N, P, &EXPR') 

! = { a, + , (, (, ) } 

N = {&EXPR', &TERM', &FACTOR'} 

P = { &EXPR' # &EXPR' + &TERM' | &TERM', 

&TERM' # &TERM' ( &FACTOR' | &FACTOR', 

&FACTOR'# ( &EXPR' ) | a } 


Regelanwendung, Ableitung 

Definition 13.2 (! Def. 1.7) 

Seien u, v, w Zeichenketten über ( ! " N ), und A # w eine Regel (einer Grammatik). 

Durch die Anwendung der Regel kann aus dem Wort uAv das Wort uwv (direkt) 

abgeleitet werden. 

Man sagt auch: Die Regel A # w führt vom Wort uAv zum Wort uwv, bzw. das 

Nichtterminal / die Variable A wird durch die Regel zu w expandiert. 

• Die Regelanwendung wird auch als Ableitung (in einem Schritt) bezeichnet, 

und als uAv ) uwv geschrieben. 

Wenn u = v oder wenn eine Folge u ) u 1 )u 2 )… ) u k ) v existiert (mit k ! 0), 

so ist v aus u (in gegebenenfalls mehreren Schritten) ableitbar. Dieses wird durch 

u ) * v notiert. Die Sequenz u ) u 1 )u 2 )… ) u k ) v wird als Ableitung 

(derivation) bezeichnet. 

• Derartige Ableitungen sind stets von endlicher Länge (endliche Anzahl von 

Schritten); die Ableitungssequenz kann aber beliebige Länge haben. 

• Zeichenketten w über ( ! " N ), für die eine Ableitung S ) * w, existiert, werden als 

Satzformen bezeichnet. 


Ableitungen für Arithmetische Ausdrücke in L(G4) 

G 4 = (!, N, P, &EXPR') 

! = { a, + , (, (, ) } N = {&EXPR'} 

P = { &EXPR' # &EXPR' + & EXPR ' | &EXPR' ( & EXPR ' | ( &EXPR' ) | # a } 

Ableitungen für a + a + a ! L(G4 ) 

&EXPR' ) &EXPR' + & EXPR ' 

) &EXPR' + &EXPR' + & EXPR ' 

) a + &EXPR' + & EXPR ' 

) a + a + & EXPR ' 

) a + a + a 



) &EXPR' + &EXPR' + a 

) &EXPR' + a + a 

) a + a + a 



) a + &EXPR' + & EXPR ' 

) a + &EXPR' + a 

) a + a + a 

" Es gibt – im Allgemeinen – keine 

Festlegung, welches Nichtterminal 

durch die Regelanwendung 

expandiert wird. 

Satzformen betreffen (Zwischen-)resultate des Ableitungsprozesses. 


Linksableitung – Rechtsableitung 

Definition 13.3 

Wird in einer Ableitung (Ableitungssequenz) stets die am weitesten links (rechts) 

auftretende Variable expandiert wird, so wird die Ableitung als Linksableitung / 

Rechtsableitung (leftmost / rightmost derivation) bezeichnet. 

Wir verwenden die Symbole ) lm bzw. ) rm für Ableitungsschritte und ) * lm bzw. 

) * rm für Ableitungssequenzen, die bzgl. leftmost oder rightmost festgelegt sind. 

Linksableitung Rechtsableitung 

&EXPR' ) lm &EXPR' + & EXPR ' 

) lm &EXPR' + &EXPR' + & EXPR ' 

) lm a + &EXPR' + & EXPR ' 

) lm a + a + & EXPR ' 

) lm a + a + a 

&EXPR' ) rm &EXPR' + & EXPR ' 

) rm &EXPR' + &EXPR' + & EXPR ' 

) rm &EXPR' + &EXPR' + a 

) rm &EXPR' + a + a 

) rm a + a + a 

Satz (ohne Beweis): Zu jeder Ableitung existiert eine äquivalente Linksableitung und 

eine äquivalente Rechtsableitung. D.h.: Für eine Zeichenkette v gilt u ) * v genau 

dann, wenn u ) * lm v und genau dann, wenn u )* rm v. 


Von einer Grammatik erzeugte Sprache 

Definition 13.4 (! Def. 1.8) 

Sei G = (!, N, P, S) eine kontextfreie Grammatik, so ist 

L(G) = { w ! !* | S ) * w } 

die von G erzeugte Sprache. 

Ableitungsbäume / Strukturbäume (Parse trees) 

Sei A # w eine Regel, mit |w| = k, 

wobei w = w 1 w 2 …w k die Darstellung von w durch Symbole des Alphabets ist. 

Dann existiert ein zu A # w 1 w 2 …w k korrespondierender Baum 

des Verzweigungsgrades k mit Tiefe 2, 

der Wurzel A und den Blättern w 1 , w 2 , … ,w k . 

w1 w2 wk Sei S ) u1 )u2 )… ) uk ) w die Ableitung 

eines Wortes w ! L(G), so kann ein Ableitungsbaum (Strukturbaum) zu dieser 

Ableitung gebildet werden, indem die zu den verwendeten Regeln korrespondierenden 

Bäume „konkateniert“ werden. 


Beispiel: Arithmetische Ausdrücke in L(G4) 

Für a + a ( a ! L(G 4 ) gibt Ableitungen mit unterschiedlichen Ableitungsbäumen. 

Die unterschiedlichen Strukturbäume entsprechen unterschiedlichen Bedeutungen. 


) &EXPR' + &EXPR' ( & EXPR ' 

) a + &EXPR' ( & EXPR ' 

) a + a ( & EXPR ' 

) a + a ( a 

ist keine Linksableitung 

&EXPR' ) &EXPR' ( & EXPR ' 

) &EXPR' + &EXPR' ( & EXPR ' 

) a + &EXPR' ( & EXPR ' 

) a + a ( & EXPR ' 

) a + a ( a 

ist eine Linksableitung 


A

Mehrdeutigkeit (Ambiguität) 


Eine Zeichenkette w ist mehrdeutig, bzw. wird durch eine kfG G mehrdeutig 

abgeleitet, falls w zwei (oder mehr) verschiedene Linksableitungen besitzt. 

Eine Grammatik G ist mehrdeutig, falls es Wörter w ! L(G) gibt, die mehrdeutig sind. 

a + a ( a ! L(G 4 ) 

&EXPR' ) lm &EXPR' + & EXPR ' 

) lm a + &EXPR' 

) lm a + &EXPR' ( & EXPR ' 

) lm a + a ( & EXPR ' 

) lm a + a ( a 


# Die Grammatik G 4 ist mehrdeutig. 


Zum Selbststudium: Arithmetische Ausdrücke in L(G3) 

G 3 = (!, N, P, &EXPR') ! = { a, + , (, (, ) } N = {&EXPR', &TERM', &FACTOR'} 




&EXPR' ) lm &EXPR' + &TERM' 

) lm &TERM' + &TERM' 

) lm &FACTOR' + &TERM' 

) lm a + &TERM' 

) lm a + &TERM' ( &FACTOR' 

) lm a + &FACTOR' ( &FACTOR' 

) lm a + a ( &FACTOR' 

) lm a + a ( a 



Zum Selbststudium: Arithmetische Ausdrücke in L(G3) Forts. 

• Führen Sie eine Linksableitung der Zeichenkette (a + a) ( a durch und 

konstruieren Sie den korrespondierenden Strukturbaum. 

• Machen Sie sich klar, inwiefern die beiden Strukturbäume 

zu a + a ( a bzw. zu (a + a) ( a 

zu unterschiedlichen Auswertungen, d.h. Berechnungen der Werte der 

arithmetischen Ausdrücke führen. 

Die Grammatik G 3 ist so entworfen, dass Zeichenketten eindeutig sind und somit eine 

eindeutige Bedeutung haben. 


Parsing 

Das Parsingproblem: 

Gegeben eine kontextfreie Grammatik G und eine Zeichenkette w. 

• Jede Ableitung S ) * w bestimmt einen Strukturbaum, d.h. eine syntaktische 

Struktur, zu w. 

Die Parsingaufgabe: Bestimme die syntaktische(n) Struktur(en) von w bzgl. G. 

Anmerkungen 

• Wenn G nicht mehrdeutig ist, dann hat jedes Wort w ! L(G) genau einen 

korrespondierenden Strukturbaum. 

• Der Prozess des Parsings weist nur Wörtern aus L(G) syntaktische Strukturen zu, 

d.h. für Zeichenketten w * L(G) sollte der Parser die Nichtzugehörigkeit zu 

L(G) ausweisen. 

• Parsing ist – in gewisser Weise – eine Umkehrung der Generierung von 

Zeichenketten bei gleichzeitiger Zuweisung der syntaktischen Struktur. 

Wir werden in einem späteren Abschnitt detaillierter aufs Parsing eingehen. 


Parsing Beispiel: Arithmetische Ausdrücke in L(G3) 





a + a ( a 

+ &FACTOR' + a ( a 

+ &TERM' + a ( a 

+ & EXPR ' + a ( a 

+ & EXPR ' + &FACTOR' ( a 

+ & EXPR ' + & TERM ' ( a 

+ & EXPR ' + & TERM ' ( &FACTOR' 

+ & EXPR ' + & TERM ' 

+ & EXPR ' 

[erfolgreicher Parse, 

aber erst nach Backtracking] 


Parsing Beispiel: Arithmetische Ausdrücke in L(G3) – Forts. 





a + a ( a 

+ &FACTOR' + a ( a 

+ &TERM' + a ( a 

+ & EXPR ' + a ( a 

+ & EXPR ' + &FACTOR' ( a 

+ & EXPR ' + & TERM ' ( a 

+ & EXPR ' ( a 

+ & EXPR ' ( &FACTOR' 

+ & EXPR ' ( & TERM ' 

+ & EXPR ' ( & EXPR ' 

+ # [Backtracking notwendig!] 


Kontextfreie Grammatiken – Regelformen 

Die Regeln A # w einer Kontextfreien Grammatik haben die Form 

• A ! N und w ! ( ! " N )*, d.h. 

• linke Seite ein Nichtterminal, rechte Seite eine beliebige Kette über ( ! " N )* 

In der Theorie der formalen Sprachen wird u.a. untersucht 

• inwieweit unterschiedliche Bedingungen an die Regelform, unterschiedliche 

Sprachklassen definierten 

# reguläre Sprachen können über kfG mit spezifischer Regelform spezifiziert 

werden 

• inwieweit Grammatiken „vereinfacht“ werden können. Dies betrifft insbesondere 

die Konstruktion von Beweisen über kfG und Kellerautomaten, aber auch das 

Entwerfen und Realisieren von effizienten Parsern 

# " –Regeln, d.h. Regeln der Form A # ", werden nur benötigt, um das leere 

Wort abzuleiten. D.h. für die Erzeugung kontextfreier Sprachen, die das 

leere Wort nicht enthalten, sind " –freie Grammatiken ausreichend. 

# Normalformen, insbesondere Chomsky-Normalform: Aller Regeln haben 

die Form A # B C oder A # a mit A, B, C ! N und a ! !. 


Grammatiken für reguläre Sprachen 

Reguläre Sprachen 

• werden von endlichen Automaten verarbeitet / akzeptiert / erzeugt 

• können mit regulären Ausdrücken beschrieben werden 

• (s. Kapitel 12) 

• sind auch durch kontextfreie Grammatiken erzeugbar (noch zu zeigen) 

• bilden eine echte Teilklasse der kontextfreien Sprachen (noch zu zeigen) 

Typ-3-Grammatiken 

• sind kontextfreie Grammatiken, 

• erfüllen strukturelle Zusatzbedingungen 

• erzeugen die reguläre Sprachen 

Welche Zusatzbedingungen erfüllen Typ-3-Grammatiken ? 

• einseitige Linearität 


Einseitig lineare Grammatiken 


Sei ! ein Alphabet und G = (!, N, P, S) eine kontextfreie Grammatik über !. 

• G heißt genau dann rechtslinear, wenn P , N ( ($*N " $*). 

• G heißt genau dann linkslinear, wenn P , N ( (N$* " $*). 

• G heißt genau dann einseitig linear, wenn G rechtslinear oder linkslinear ist. 

Anmerkung 

• ‚Linearität’ bezieht sich jeweils darauf, dass in jeder zwischenzeitlich erzeugten 

Satzform maximal ein Nichtterminalsymbol auftritt. 

• ‚Einseitig’ besagt zudem, dass das Nichtterminalsymbol randständig sein und 

bleiben muss. 

• Alle Regeln der einseitig linearen Grammatik haben das Nichtterminalsymbol auf 

derselben Seite. 


Beispiel: Lineare Grammatiken 

Rechtslinear 

G rl = ({0, 1}, {S}, P rl , S) mit P rl = { S # 0S, S # 1S, S # 100 } 

L(G rl) = L([0|1]*100) 

Linkslinear 

G ll = ({0, 1}, {S, R}, P rl , S) mit P rl = { S # R100, R # R1, R # R0, R # " } 

L(G ll) = L([0|1]*100) 

Linear aber nicht einseitig linear 

G 1 = ({a, b}, {S}, P 1 , S) mit P 1 = { S # aSb, S # ab } 

L(G 1) = { a n b n | n ! 1 } 

(s. Kapitel 1) 


Einseitig linear erzeugbare Sprachen 


• ReL $ ist die Menge der durch rechtslineare Grammatiken erzeugbaren Sprachen 

über $. 

• LiL $ ist die Menge der durch linkslineare Grammatiken erzeugbaren Sprachen über 

$. 

• TYP3 $ ist die Menge der durch einseitig lineare Grammatiken erzeugbaren Sprachen 

über $ (also TYP3 $ = ReL $ " LiL $) 

Beispiele 

L(G rl) = L([0|1]*100) ! ReL {0, 1} , TYP3 {0, 1} 

L(G ll) = L([0|1]*100) ! LiL {0, 1} , TYP3 {0, 1} 

L(G 1) = { a n b n | n ! 1 } * TYP3 {0, 1} 


Rechtslineare Grammatiken für reguläre Sprachen 

Satz 13.8 

Zu jedem endlichen Automaten A über ! existiert eine rechtslineare Grammatik G A 

über ! mit L(G A) = L(A). (Also REG $ , ReL $) 

Grundidee 

• Gleichsetzung von Nichtterminalsymbolen mit Zuständen. 

• Zustandsübergänge -(s, a) = s' werden zu Ableitungsregeln s # as'. 

• In Endzuständen kann die Ableitung beendet werden (s # "). 

• Konfigurationen in der Verarbeitung durch den Automaten (s, w) korrespondieren 

mit in der Ableitung erzeugten Satzformen (ws) 

Konstruktion 

Sei A = (!, S, -, s 0, F) ein endlicher Automat. 

Die rechtslineare Grammatik G A = (!, S, P, s 0) mit 

• P = { s # as' | -(s, a) = s' } " { s # " | s ! F} 

erfüllt: L(G A) = L(A) 


Spiegelwörter und Spiegelsprachen 


Es sei ! ein Alphabet. Für die Abbildung SP: !* # !*, die jedes Wort auf sein 

Spiegelbild abbildet, gilt: 

• SP(") = "; SP(a) = a , für a ! !; SP(u!v) = SP(v)!SP(u) , für u, v ! !* 

• Ist L , !* eine Sprache, dann sei SP(L) = {SP(w) | w ! L} die ‚Spiegelsprache’ zu L. 

• Ist M , .(!*) eine Sprachfamilie, dann sei SP(M) = {SP(L) | L ! M} die Familie 

der ‚Spiegelsprachen’ zu M. 

• Eine Sprachfamilie M , .(!*) heißt genau dann abgeschlossen unter Spiegelung, 

wenn SP(M) , M. 

Beobachtungen 13.10 

1. LiL $ = SP(ReL $) und ReL $ = SP(LiL $) . 

2. M , .(!*) ist genau dann abgeschlossen unter Spiegelung, wenn SP(M) = M. 

3. TYP3 $ ist abgeschlossen unter Spiegelung. 

4. LREXP $ ist abgeschlossen unter Spiegelung. 

5. REG $ ist abgeschlossen unter Spiegelung. 


Zum Selbststudium 

Beweisen Sie obige Beobachtungen zur Übung 

Dazu ist jeweils eine Konstruktion anzugeben (z.B. bei 1) Bildung einer linkslinearen 

Grammatik für SP(L(G)) auf Basis einer rechtslinearen Grammatik G) und zu erläutern 

/ beweisen, dass die Konstruktion tatsächlich genau das leistet, was sie soll. 

2. ist natürlich darauf zurückzuführen, dass für alle Wörter w gilt SP(SP(w)) = w und 

damit Entsprechendes für die Sprachen und die Sprachfamilien. 

Was in der Liste von Beobachtungen noch fehlt, ist, dass auch LiL $ und ReL $ 

abgeschlossen unter Spiegelung (und damit identisch) sind. Das zeigen wir später über 

die Abschlusseigenschaften der beteiligten Sprachen (Satz 13.§§) 


Normalformen für einseitig lineare Grammatiken 

Die Definition für einseitig lineare Grammatiken lässt zu: 

• beliebig lange Folgen von Terminalsymbolen in den Regeln 

• beliebig viele Regeln der Art A # " 

• Regeln der Art A # w , mit w ! !* 

• Regeln der Art A # B , mit B ! N 

Satz 13.11 

Zu jeder einseitig linearen Grammatik G gibt es eine einseitig linearen Grammatik G’, 

die dieselbe Sprache erzeugt aber folgende Zusatzbedingungen erfüllt: 

• alle rechten Seiten der Regeln, in denen Terminalsymbole vorkommen, haben die 

Länge 2 (A # aB bzw. A # Ba mit A, B ! N und a ! !) 

• es gibt keine Regeln der Art A # B , mit B ! N 

• es gibt maximal 2 Regeln der Art A # ", wobei höchstens eine dieser Regeln ein 

anderes Nichtterminalsymbol als das Startsymbol ableitet. 



Konstruktion zu Satz 13.11 

‚Vernichtung’ der Regeln der Art A # B , mit B ! N 

1. Regeln der Form A # A können gelöscht werden, da Ihre Anwesenheit keinen 

Einfluss auf die generierte Sprache haben. 

2. Kommt A # B , mit B ! N, in P vor, dann kann diese Regel durch die Menge der 

Regeln { A # r | B # r ! P} ersetzt werden. 

3. Durch systematische Anwendung von 1) und 2) können alle Regeln der Art A # B 

eliminiert werden. 

Reduktion der Regeln der Art A # w , mit w ! !* auf maximal 2 Regeln der Art A # 

", wobei höchstens eine dieser Regeln ein anderes Nichtterminalsymbol als das 

Startsymbol ableitet: 

• Führe ein neues Nichterminalsymbol T und die Regel T # " ein. 

• Ersetze jede Regel der Art A # w , mit w ! ! + , durch A # wT. 

• Ersetze jede Regel der Art A # wB , mit w ! ! + und B # " ! P, durch A # wT. 

• Lösche dann alle Regeln der Art B # " außer { T # " , S # " }. 


Zum Selbststudium: Zu Satz 13.11 

Beschränkung der rechten Seiten der Regeln, in denen Terminalsymbole vorkommen, 

auf Länge 2 (A # aB bzw, A # Ba mit A, B ! N und a ! !) 

• Für jedes Paar a ! N, B ! !, für das mindestens eine Regel der Art A # waB ! P, 

mit w ! ! + , führe ein neues Nichtterminal C und die Regel C # aB ein und ersetze 

alle Regeln der Art A # waB durch A # wC. 

• Für jedes Paar a ! N, B ! !, für das mindestens eine Regel der Art A # Baw ! P, 

mit w ! ! + , führe ein neues Nichtterminal C und die Regel C # Ba ein und ersetze 

alle Regeln der Art A # Baw durch A # Cw. 

Es wäre noch zu zeigen, dass die so erzeugte Grammatik tatsächlich genau dieselbe 

Sprache erzeugt, wie die ursprüngliche. Dazu zeigt man, wie die Ableitungen der alten 

Grammatik durch die neue Grammatik ‚simuliert’ und umgekehrt. 

Bemerkung 

Die Normalformen der Grammatiken sind oft bei der Beweisführung über die 

Sprachfamilien nützlich. Für den praktischen Einsatz sind aber die allgemeinen 

Formen oft besser geeignet. 


Rechtslinear erzeugbare Sprachen sind regulär 


Zu jeder rechtslinearen Grammatik G über ! existiert ein endlicher Automat A G über ! 

mit L(G) = L(A G). (Also ReL $ , REG $) 

Konstruktion 

Sei G = (!, N, P, S) eine rechtslineare Grammatik, bei der auf den rechten Seiten der 

Produktionen maximal ein Terminalsymbol steht. (Notfalls müssen wir erst einen 

Umformungsschritt gemäß 13.11 machen.) 

Für den Automaten A G = (!, N " {ƒ}, -, S, F) mit 

• ƒ * N 

• F = {ƒ} " { B ! N | B # " ! P} 

• - = {(B, a, C) | B # aC ! P} " {(B, a, ƒ) | B # a ! P} 

gilt: L(A G) = L(G) 



ReL $ = REG $ = LiL $ = TYP3 $ 

ReL $ = REG $ = LiL $ = TYP3 $ 

Beweis 

1. REG $ , ReL $ : Satz 13: 8 

2. ReL $ , REG $ : Satz 13: 12 

3. ReL $ = REG $ : Konsequenz von 1 und 2 

4. LiL $ = SP(ReL $) : Beobachtung 13.10.1 

5. LiL $ = SP(REG $) : Konsequenz von 4 und 3 

6. SP(REG $) = REG $ : Beobachtung 13.10.2 und 5 

7. LiL $ = REG $ : Konsequenz von 5 und 6 

8. ReL $ " LiL $ = TYP3 $ : Definition 13.13 

9. TYP3 $ = REG $: Konsequenz von 3, 7, 8 


Reguläre Sprachen – Kontextfreie Sprachen 

Typ-2-Sprachen 

• Kontextfreie Sprachen werden auch als Typ-2-Sprachen bezeichnet. 

• Dementsprechend wird TYP2 $ für die Menge der Kontextfreien Sprachen 

verwendet. 

Reguläre Sprachen – Kontextfreie Sprachen 

• reguläre Sprachen sind eine echte Teilklasse der kontextfreien Sprachen 

• welche Charakteristika von Regeln, Baumstrukturen, Ableitungen sind für die 

Nicht-Regularität gewisser kontextfreier Sprachen verantwortlich? 

• wie unterscheiden sich die Abschlusseigenschaften von regulären und 

kontextfreien Sprachen? 


• welche Modifikationen des Konzeptes endlicher Automaten werden benötigt, um 

Automaten, die kontextfreie Sprachen akzeptieren, zu konstruieren? 

• welche Eigenschaften charakterisieren Sprachen als nicht-kontextfrei? 


Reguläre Sprachen – Kontextfreie Sprachen (2) 

Einseitig lineare Grammatik G 1 

S # aS, S # aB, B # bB, B # b 

L(G 1) = { a n b m | n, m ! 1 } = {a} + {b} + 

. 

Nicht einseitig lineare Grammatik G 2 

S # aSb, S # ab 

L(G 2) = { a n b n | n ! 1 } 


Normalformen für kontextfreie Grammatiken 

Ziel: Vereinfachung von kontextfreien Grammatiken 

Die wichtigsten Vereinfachungen 

1. Elimination von „nicht benötigten“ (nutzlosen) Symbolen 

2. Elimination von "-Regeln 

3. Elimination von Kettenregeln (Einheitsproduktionen), d.h. von Regeln der 

Form A # B mit A,B ! N. 

Theoreme zu vereinfachten Grammatiken (Beweise im Laufe dieser Vorlesung) 

1. Für jede kontextfreie Sprache L, d.h. L ! TYP2 $, gilt, dass L – { " } durch eine 

kfG ohne "-Regeln erzeugt werden kann. 

2. Zu jeder kfG G gibt es eine äquivalente kfG G' in Chomsky-Normalform, d.h. 

• L(G) = L(G') 

• Alle Regeln von G' haben die Form A # B C oder A # a mit A, B, C ! N 

und a ! !. Falls " ! L = L(G), ist zusätzlich die Regel S # " zugelassen. 


Elimination von nutzlosen Symbolen 

Sei G = (!, N, P, S) eine kontextfreie Grammatik. 

X ! ! " N ist nützlich in G, wenn es eine Ableitung 

S ) * uXv ) * w mit w ! !* gibt, 

d.h. X tritt in einer Satzform einer Ableitung von S zu einer terminalen Zeichenkette 

auf. Wenn X nicht nützlich ist, dann bezeichnen X wir als nutzlos. 

1. Die Sprache L(G) ist durch die Ableitungen von S zu terminalen Zeichenketten 

gegeben (Def. 13.4). Wenn X nutzlos ist, kommt X in keiner Ableitung von S zu 

einer terminalen Zeichenkette vor. 

Also kann X aus der Grammatik entfernt werden, d.h. X wird aus ! " N entfernt, 

und alle Regeln, in denen X auftritt, werden ebenfalls entfernt. 

2. Es gibt zwei Eigenschaften, die die Nützlichkeit eines Symbols ausmachen: 

a. X ist erzeugend, wenn X ) * w für ein w ! !*. 

[Da a ) * a für alle a ! !, sind alle terminalen Symbole erzeugend.] 

b. X ist erreichbar, wenn es eine Ableitung S ) * uXv gibt, 

mit u,v ! (! " N)*. 

# Wir werden zuerst alle nicht-erzeugenden und dann alle nicht-erreichbaren 

Symbole eliminieren. 


Elimination von nutzlosen Symbolen: Beispiel 

Grammatik G ist gegeben durch die Regeln: 

S # AB | a A# b 

Eliminationsreihenfolge 

nicht-erzeugende " nicht-erreichbare 

Bestimmung der erzeugenden Symbole 

• S, A wegen S ) * a bzw. A ) * b 

a, b da Terminalsymbole 

Elimination der nicht-erzeugenden 

Symbole: B 

• S # a A# b 

Bestimmung der erreichbaren Symbole 

• S, a wegen S ) * a 

Elimination der nicht-erreichbaren 

Symbole: A, b 

• S # a 

nicht-erreichbare " nicht-erzeugende " 

Bestimmung der erreichbaren Symbole 

• S, a wegen S ) * a 

A, B, b wegen S ) * AB ) * bB 

Keine Elimination nicht-erreichbarer 

Symbole notwendig 

Bestimmung der erzeugenden Symbole 

• S, A wegen S ) * a bzw. A ) * b 

a, b da Terminalsymbole 

Elimination der nicht-erzeugenden 

Symbole: B 

• S # a A# b 

Enthält zwei nutzlose Symbole 


Elimination von nutzlosen Symbolen 

Satz 3.14 

Sei G = (!, N, P, S) eine kontextfreie Grammatik mit L(G) " /. Sei G 1 = (!1, N 1, P 1, S) 

die Grammatik, die sich aus dem folgenden Verfahren ergibt: 

1. Es werden alle Symbole, die nichts erzeugen, und alle Regeln, die eines oder 

mehrere dieser Symbole enthalten, eliminiert. Die hieraus entstehende 

Grammatik bezeichnen wird durch G 2 = (!2, N 2, P 2, S). 

2. Es werden aus G 2 alle Symbole, die nicht in G 2 erreichbar sind, eliminiert, 

sowie alle Regeln, die eines oder mehrere dieser Symbole enthalten. 

Dann enthält G 1 keine nutzlosen Symbole und es gilt: L(G) = L(G 1) 

Anmerkung: 

• Da L(G) " /, ist S erzeugend, und kann somit nicht eliminiert werden. 

Beweis zur selbständigen Nacharbeit (vgl. Vossen & Witt, Kap. 5.1.2). Zu zeigen ist: 

1. G1 enthält keine nutzlosen Symbole; hier spielt die Reihenfolge der zwei 

Eliminationsstufen eine Rolle: G ! G 2! G 1 

2. L(G) = L(G 1), hier ist L(G) , L(G 1) die nicht-triviale Richtung des Beweises. 


Berechnung der erzeugenden Symbole 

Definition 3.15 (Algorithmus zur Berechnung der erzeugenden Symbole) 


Induktive Definition eines Algorithmus zur Berechnung der erzeugenden Symbole: 

1. Alle a ! !, d.h. alle terminalen Symbole, sind erzeugend. 

2. Wenn für eine Regel A # w gilt, dass jedes Symbol in w erzeugend ist, dann ist 

A erzeugend. 

Regeln: S # AB | a A# b Ableitungsbäume 

1. a, b sind erzeugend, da Terminalsymbole 

2. S ist erzeugend wg. S # a 

A ist erzeugend wg. A # b 

S # AB erfüllt nicht die Bedingungen 

von (2). 

3. Alle Regeln sind berücksichtigt; das 

Verfahren ist abgeschlossen. 


Berechnung der erzeugenden Symbole (Forts.) 

Satz 3.16 (Algorithmus zur Berechnung der erzeugenden Symbole) 

Der in Def. 3.15 induktive definierte Algorithms bestimmt die Menge der erzeugenden 

Symbole (MeS) von G = (!, N, P, S). 

Zu beweisen sind zwei Richtungen: (1), dass jedes Symbol, das durch den Algorithmus 

in MeS aufgenommen wird, wirklich ein erzeugendes Symbol ist, und (2), dass jedes 

erzeugende Symbol durch den Algorithmus in MeS aufgenommen wird. 

1. Richtung: Induktion über die Reihenfolge, in denen der Algorithmus Symbole in 

MeS aufnimmt. [zum Selbststudium!!!] 

2. Richtung: X ist erzeugendes Symbol, mit der terminalen Ableitung X ) * w für 

ein w ! !*. Induktion über die Ableitungslänge. 

• Falls die Ableitung die Länge null hat, dann ist X ist terminales Symbol. 

Daher wird im Schritt 1 des Algorithmus X als erzeugend klassifiziert und in 

MeS aufgenommen. 


Berechnung der erzeugenden Symbole (Forts.) 

• Wenn die Ableitung die Länge n hat (n > 0), dann ist X eine Variable. Die 

Ableitung X ) * w kann zerlegt werden in X ) v ) * w, d.h. es wird zuerst 

die Regel X # v angewendet. 

• Jedes Symbol von v leitet eine terminale Zeichenkette ab, die Teil von w 

ist, und diese Ableitung (# Zusammenfassung der Ableitungen, die von v 

zu w führen) hat eine Länge kleiner n. 

• Nach Induktionshypothese ist daher jedes Symbol aus v erzeugend. 

Daher ist die Voraussetzung für den Schritt (2) des Algorithmus erfüllt: 

der Algorithmus X als erzeugend klassifiziert und in MeS aufgenommen. 


Berechnung der erreichbaren Symbole 

Definition 3.17 (Algorithmus zur Berechnung der erreichbaren Symbole) 


Induktive Definition eines Algorithmus zur Berechnung der erreichbaren Symbole: 

1. Das Startsymbol S ist erreichbar. 

2. Wenn für eine Regel A # w gilt, dass A erreichbar ist, dann ist jedes Symbol in 

w erreichbar. 

Regeln: S # AB | a A# b Ableitungsbäume 

1. S ist erreichbar 

2. wg. S # AB | a 

sind ausserdem A, B und a erreichbar 

wg. A# b 

ist ausserdem b erreichbar 

3. Alle Regeln sind berücksichtigt; das 

Verfahren ist abgeschlossen. 


Berechnung der erreichbaren Symbole (Forts.) 

Satz 3.18 (Algorithmus zur Berechnung der erreichbaren Symbole) 

Der in Def. 3.16 induktive definierte Algorithms bestimmt die Menge der erreichbaren 

Symbole von G = (!, N, P, S). 

Beweis: Zum Selbststudium!!! 

Zu beweisen sind – wie beim Beweis von Satz 3.16 – zwei Richtungen. 

Verwendet wird Induktion über Ableitungen bzw. den Ablauf des Algorithmus. 


Elimination von !-Regeln 

Satz 3.19 (Elimination von !-Regeln) 

Für jede kontextfreie Sprache L gilt, dass L – { " } durch eine kfG ohne "-Regeln 

erzeugt werden kann. 

[Derartige Grammatiken werden als "-freie Grammatiken bezeichnet.] 

Anmerkungen: 

Dieser Satz deckt zwei Fälle ab: 

1. " * L. Dann ist L – { " } = L, und deswegen gibt es eine "-Regel-freie 

Grammatik G, die L erzeugt, d.h. L = L(G). 

2. " ! L. Dann gibt es eine "-freie Grammatik G, die L – { " }erzeugt. Für die 

Erzeugung des leeren Wortes kann G um eine einzige "-Regel angereichert 

werden, die nur an der Erzeugung des leeren Wortes beteiligt ist. 

Im Beweis wird daher der Fall "-freier Sprachen behandelt (Fall 1). Fall 2 erfordert 

dann nur den oben angesprochenen Schritt der Ergänzung um eine "-Regel zur 

Erzeugung des leeren Wortes. 


Elimination von !-Regeln – Beweis von Satz 3.19 

Sei " * L und G = (!, N, P, S) eine kontextfreie Grammatik mit L = L(G). 

• Wir gehen davon aus, dass alle nutzlosen Symbole aus G eliminiert wurden (vgl. 

die Sätze 3.14, 3.16 und 3.18). 

• Wir erweitern die Grammatik um ein neues Nichtterminalsymbol, S 0 , das als 

Startsymbol fungiert. Ausserdem führen wir die Regel S 0 # S ein. 

• Die neue Grammatik G' erzeugt genau die gleiche Sprache wie die Grammatik 

G, denn zu jeder G-Ableitung S ! * G w mit w ! L(G) gibt es eine 

korrespondierende G'-Ableitung S 0 ! * G' w, und zwar S 0 ! * G' S ! * G' w. 

• Diese Erweiterung der Grammatik führt dazu, dass das Startsymbol von G' nicht 

aus der rechten Seite einer Regel auftritt. 

Beispiel 

S # ASA | aB A# B | S B# b | " 

Einführung des neuen Startsymbols S 0 

S 0 # S S # ASA | aB A# B | S B# b | " 


Elimination von !-Regeln – von G'' erzeugte Sprache 

Regeln in G' Beispiel eines Strukturbaums 

S 0 # S 

S # ASA | aB 

A# B | S 

B# b | " 

Ableitung: 

S 0 ) S 

) ASA 

) SSA ) SaBA ) SaBB 

) aBaBB ) aBabB ) aBab" 

) a"ab" = aab 

Abschluss erfolgt nur über B-Regeln. 


Elimination von !-Regeln – Beweis von Satz 3.19 (Forts.) 

• "-Regeln, d.h. Regeln der Form A # " werden eliminiert; dafür werden aber 

eventuell neue Regeln eingeführt. 

• Für jedes Vorkommen von A auf der rechten Seite einer Regel bilden wir 

zusätzlich eine neue Regel ohne dieses Vorkommen von A. 

Beispiel: Sei R# uAvAw eine derartige Regel in G', so führt dies zu den Regeln 

R# uvAw, R# uAvw, R# uvw 

Falls die zu bearbeitende Regel die Form R# A hat , so fügen wir R # " in 

die Regelmenge, ausser in den Fällen, in denen R # " schon eliminiert wurde. 

• Dieses Verfahren wird durchgeführt, bis alle "-Regeln beseitigt sind. 

• In der Regelmenge P gibt es nur eine endliche Menge von Regeln und 

insbesondere nur eine endliche Menge von "-Regeln; für jedes Nichtterminal 

maximal eine "-Regel. 

• Bei der Elimination von "-Regeln können zwar neue "-Regeln entstehen, aber 

nur für solche nichtterminale Symbole, zu denen noch keine "-Regeln 

eliminiert wurden. Daher terminiert der Prozess der Elimination von "-Regeln. 


Elimination von !-Regeln – Beweis von Satz 3.19 (Forts.) 

Beispiel 

S 0 # S S # ASA | aB A# B | S B# b | " 

Elimination der "-Regel B# " 

Einführung neuer Regeln in Bezug auf S # aB S # a 

Einführung neuer Regeln in Bezug auf A# B A# " 

Elimination der "-Regel A# " 

Einführung neuer Regeln in Bezug auf S # ASA S # SA | AS | S 

Da keine "-Regel vorkommt, ist das Verfahren abgeschlossen. 

Die resultierende Regelmenge: 

S 0 # S 

S # ASA | aB | a | SA | AS | S 

A# B | S 

B# b 

Die Ausgangs-Regelmenge 

S 0 # S 

S # ASA | aB 

A# B | S 

B# b | " 


Elimination von !-Regeln – von G'' erzeugte Sprache 

Regeln in G' Beispiel eines Strukturbaums 

S 0 # S 

S # ASA | aB | a | SA | AS | S 

A# B | S 

B# b 

Ableitung: 

S 0 ) S 

) AS 

) SS ) SaB 

) aaB ) aab 


Elimination von !-Regeln – G'-Stukturbaum vs. G''-Stukturbaum 

G'-Stukturbaum G''-Strukturbaums 


Elimination von !-Regeln – Beweis von Satz 3.19 (2. Forts.) 

Die durch Elimination der "-Regeln entstandene Grammatik G'' erzeugt genau die 

gleiche Sprache wie die Grammatik G'. 

• Da die Grammatik G eine "-freie Sprache erzeugt [" * L = L(G)], werden "-Regeln 

nur für den Abschluss von Ableitungen verwendet, die zu echten Zeichenketten 

führen. 

• Wenn in einer G'-Ableitung eine "-Regel angewendet wird, dann gibt es eine 

korrespondierende G''-Ableitung die auf einer der in der "-Regel-Elimination 

ergänzten Regeln basiert. Daher ist jedes durch G' erzeugbare Wort auch durch G'' 

erzeugbar. Entsprechend kann / muss gezeigt werden, dass G'' nicht zusätzliche 

Wörter erzeugen kann. 

Damit ist der Beweis für den Fall 1 (" * L) abgeschlossen. 

Fall 2. ! ! L = L(G) 

Dann existiert eine G'-Ableitung zu ". Da nur nichtterminale Symbole getilgt werden 

können, und zwar durch "-Regeln, kann das in Fall 1 verwendete Verfahren 

angewendet werden: Wir eliminieren "-Regeln für alle Nichtterminale (ausser dem 

Startsymbol S 0 ). 

# Damit ist der Beweis für den Fall 1 (" * L) abgeschlossen.von Satz 3.19 

abgeschlossen. 


Chomsky Normalform 


Eine kontextfreie Grammatik G = (!, N, P, S) liegt in Chomsky Normalform vor, falls 

alle Regeln von G eine der folgenden Formen haben 

• A # B C 

• A # a 

• S # " 

mit A, B, C ! N und a ! !. 

Anmerkung: 

• Es gibt (echt) expandierende Regeln mit zwei nichtterminalen Symbole auf der 

rechten Seite (und somit binär verzweigende Strukturbäume) und 

• abschliessende Regeln mit genau einem terminalen Symbol auf der rechten Seite, 

sowie gegebenenfalls als Sonderfall (für die Ableitung des leeren Wortes) für 

das Startsymbol eine "-Regel (S # "). 

Satz 3.21 

Für jede kontextfreie Sprache L gibt es eine kfG G in Chomsky-Normalform, die L 

erzeugt, d.h. mit L = L(G). 


Chomsky Normalform – Beweis Satz 3.21 

Aufbauend auf den Sätzen 3.14 und 3.19 können wir davon ausgehen, dass es zur 

Sprache L eine erzeugende kfG G gibt, in der alle nutzlosen Symbole und alle "- 

Regeln (ausser im Fall " ! L, die Regel S # ") eliminiert sind. 

Wir haben zwei Typen von Regelumformungen durch zu führen: 

• Einer-Regeln, d.h. Regeln der Form A# B, mit A, B ! N, werden umgewandelt 

in Regeln mit zwei oder mehr Symbolen auf der rechten Seite. 

• Alle verbleibenden Regeln werden in die Normalform gebracht, d.h. in Regeln 

mit der zulässigen Länge der rechten Seite 

• Länge 2 für Regeln mit Nichtterminalen auf der rechten Seite 

• Länge 1 für Regeln mit Terminalen auf der rechten Seite 


Chomsky Normalform – Umwandlung von Einer-Regeln 

• Einer-Regeln, d.h. Regeln der Form A # B, mit A, B ! N, werden eliminiert; dafür 

werden aber neue Regeln eingeführt. 

• Für jede Regel B# u, mit u ! (! " N)*, bilden wir eine neue Regel A # u, 

ausser in den Fällen, in denen die Einer-Regel A # u schon eliminiert wurde. 

• Dieses Verfahren wird durchgeführt, bis alle Einer-Regeln beseitigt sind. 

• In der Regelmenge P gibt es nur eine endliche Menge von Regeln und 

insbesondere nur eine endliche Menge von Einer-Regeln. 

• Bei der Elimination von Einer-Regeln können zwar neue Einer-Regeln entstehen, 

aber nur für solche nichtterminale Symbole, zu denen noch keine Einer-Regeln 

eliminiert wurden. Daher terminiert der Prozess der Elimination von Einer-Regeln. 


Elimination von Einer-Regeln – Beweis von Satz 3.21 (Forts.) 

Beispiel 


S 0 # S 

S # ASA | aB | a | SA | AS | S 

A# B | S 

B# b 

Elimination von S # S S # ASA | aB | a | SA | AS 

Elimination von S 0 # S S 0 # ASA | aB | a | SA | AS 

Elimination von A# B A# b 

Elimination der A# S A# ASA | aB | a | SA | AS 

Die resultierende Regelmenge: 

S 0 # ASA | aB | a | SA | AS 

S # ASA | aB | a | SA | AS 

A# b | ASA | aB | a | SA | AS 

B# b 


Elimination von Einer-Regeln – G-Stukturbaum vs. G'-Stukturbaum 

G-Stukturbaum G'-Strukturbaums 

Ableitungen, die auf Einer-Regeln basieren, können „abgekürzt“ werden. 


Abschliessende Konvertierung in Chomsky Normalform 

• Sei A # u 1 u 2 …u k , wobei k ! 3 und u i ! (! " N). 

Wir ersetzen diese Regel durch die Regeln 

A # u 1 A 1 , A 1 # u 2 A 3 , … Ak-2 # u k-1 u k Die A i seine neue Variablen. 

• Jeder Anwendung der Regel A # u 1 u 2 …u k entspricht die sequentielle 

Anwendung der Regeln A # u 1 A 1 , A1 # u 2 A 3 , … Ak-2 # u k-1 u k . 

• Anschliessend ersetzen wir in allen Regeln der Form 

A # u i A j , in denen u i ! !, u i durch die neue Variable U i , d.h. modifizieren die 

Regel zu A # u i A j und führen die neue Regel A # U j ein (gleiche Terminale u i 

können durch gleiche neue Variable U i ersetzt werden). 

• Jeder Anwendung der Regel A # u i A j in G' entspricht die sequentielle 

Anwendung der Regeln A # U 1 A j und anschliessend A # U j in G''. 


Erstellung von Regeln in Ch-Normalform – Beweis von Satz 3.21 (Forts.) 

Beispiel 


S 0 # ASA | aB | a | SA | AS 

S # ASA | aB | a | SA | AS 


B# b 

Umformung von S 0 # ASA S 0 # AA 1 , A 1 # SA 

Umformung von S # ASA S # AA 1 , A 1 # SA 

Umformung der Regeln mit rechter Seite aB X # UB , U# a 

Die resultierende Regelmenge 

nach 1. Teilschritt: 

S 0 # AA 1 | aB | a | SA | AS 

S # AA 1 | aB | a | SA | AS 


A 1 # SA 

B# b 

Die resultierende Regelmenge 

nach 2. Teilschritt: 

S 0 # AA 1 | UB | a | SA | AS 

S # AA 1 | UB | a | SA | AS 

A# b | ASA | UB | a | SA | AS 

A 1 # SA 

U # a 

B# b 


Chomsky Normalform – G-Stukturbaum vs. G'-Stukturbaum 

G'-Stukturbaum G''-Strukturbaums 

Ableitungen, die auf Nicht-Normalform-Regeln basieren, werden durch Sequenzen 

von Normalformableitungen durchgeführt. 


Normalformen Zusammenfassung 

Aufgabe: Vereinfachung von kontextfreien Grammatiken 

Theoreme zu vereinfachten Grammatiken 

• Für jede kontextfreie Sprache L, d.h. L ! TYP2 $, gilt, dass L – { " } durch eine kfG 

ohne "-Regeln erzeugt werden kann. 

• Zu jeder kfG G gibt es eine äquivalente kfG G' in Chomsky-Normalform, d.h. 

L(G) = L(G') 

Alle Regeln von G' haben die Form A # B C oder A # a mit A, B, C ! N und a 

! !. Falls " ! L = L(G), ist zusätzlich die Regel S # " zugelassen. 

Chomsky Normalform ist wichtig für Beweise, z.B. Pumpinglemma für kontextfreie 

Sprachen. 


Kellerautomaten: Grundidee 

Ergänzung des endlichen Automaten mit einem einfachen Speicher 

Zur Erinnerung: Der Speicher des endlichen Automaten 

• besteht allein aus dem Zustandsspeicher 

• entspricht einer Zelle mit endlicher Kapazität (einer von endlich viele Zuständen) 

Kellerspeicher: LIFO-Prinzip (last in – first out) 

• Im Prinzip unbeschränkte Kapazität (keine Beschränkung der Anzahl der 

Speicherzellen) 

• die einzelnen Speicherzellen des Kellers haben aber nur endliche Kapazität 

( = 1 Symbol aus dem (endlichen) Keller-Alphabet) 

• Es ist immer nur das 'oberste' Symbol des Speichers zugreifbar. 

• In der Beschränkung der Zugriffsmöglichkeit besteht der entscheidende Unterschied 

zu den Turingmaschinen. 

• Das Kelleralphabet und das Eingabealphabet können übereinstimmen, müssen es 

aber nicht. 


! 

Kellerautomat 


Definition (nichtdeterministischer) Kellerautomat 


Ein (nichtdeterministischer) Kellerautomat K = (!, Q, ", #, q0, $, F), besteht aus: 

• ! : ein Alphabet (Eingabealphabet) 

• " : ein Alphabet (Kelleralphabet) ! 

• Q : eine endliche Menge, die Menge 

der Zustände 

• # : Q % (! & {'}) % " ( )(Q % "*) 

ist die Zustandsüberführungsfunktion 

von K. 

• q0 * Q : der Startzustand 

• $ * " : das Kellerboden-Symbol 

(initialer Kellereintrag) 

• F + Q : die Menge der Endzustände 

Die Definition des Kellerautomaten spezifiziert die 'endliche Kontrolle'. 

Kellerautomat wird im Englischen als Pushdown Automaton (PDA) bezeichnet. 

" 

Abb: © Vossen & Witt (2006) 


" 

Abb: © Vossen & Witt (2006)

Zustandsüberführungsfunktion des Kellerautomaten 

(q', k 1…k n) * #(q, x, k) • Ist K im Zustand q, 

• liest auf dem Eingabeband das Symbol x 

• und auf dem Keller das Symbol k, 

• dann kann K in den Zustand q' wechseln 

• und k auf dem Keller durch k 1…k n ersetzten, 

• wobei k 1 zum obersten Symbol wird. 

(q', ') * #(q, x, k) • Ist K im Zustand q, 

• liest auf dem Eingabeband das Symbol x 

• und auf dem Keller das Symbol k, 


• und k vom Keller löschen. 

(q', k 1…k n) * #(q, ', k) • Ist K im Zustand q, 

• und liest auf dem Keller das Symbol k, 


• und k auf dem Keller durch k 1…k n ersetzten, 

• wobei k 1 zum obersten Symbol wird. 

(q', ') * #(q, ', k) • Ist K im Zustand q, 

• und liest auf dem Keller das Symbol k, 


• und k vom Keller löschen. 


Beispiel Kellerautomat 

K 1 = ({a, b}, {q 0, q 1, q f}, {1, $}, # 1, q 0, $, {q f}) mit 

# 1(q 0, ', $) = # 1(q 1, ', $) = {(q f, ')} 

# 1(q 0, a, $) = {(q 0, 1$)} 

# 1(q 0, a, 1) = {(q 0, 11)} 

# 1(q 0, b, 1) = # 1(q 1, b, 1) = {(q 1, ')} 

# 1(q 0, ', 1) = # 1(q 0, b, $) = # 1(q 1, ', 1) = 

# 1(q 1, a, $) = # 1(q 1, a, 1) = # 1(q 1, b, $) = 

# 1(q f, ', $) = # 1(q f, ', 1) = # 1(q f, a, $) = 

# 1(q f, a, 1) = # 1(q f, b, $) = # 1(q f, b, 1) = , 


Animation Kellerautomat 


Konfigurationen und Konfigurationsübergänge 


Sei K = (!, Q, ", #, q 0, $, F) ein (nichtdeterministischer) Kellerautomat. 

• Die Menge Konf K = Q % !* % "* enthält alle möglichen Konfigurationen von K. 

Dabei steht (q, w, -) * Konf K für eine Situation, in der sich K im Zustand q 

befindet, das Eingabewort w noch zu verarbeiten hat, und der aktuelle Kellerinhalt - 

ist. 

• Konfigurationsübergänge für K sind festgelegt durch die Relation 

! K + Konf K % Konf K, die definiert ist durch 

(q, xv, k!) ! K (q', v, .-) gdw., (q', .) * #(q, x, k) 

wobei q, q' * Q, x * ! & {'}, v * !*, ., - * "*, k * " 

• ! * K ist die reflexive, transitive Hülle von ! K . 



Notationsvarianten 

Falls #(q, x, k) = {(q 1, .1), … , (q m, .m)}, dann schreiben wir dies auch in der Form 

(q, x, k, {(q 1, .1), … , (q m, .m)}) 

oder 

{(q, x, k, q 1, .1), …, (q, x, k, q m, .m)} 

Wenn klar ist, über welchen Kellerautomaten K wir reden, schreiben wir auch ! 

anstelle von ! K und ! * anstelle von ! * K . 

Bemerkung 

Über die Eigenschaften der Relation ! * K kann man viel sagen und beweisen. Jeder 

sollte sich aber klar machen, dass folgendes gilt: 

Wenn (q, w, .) ! * K (q', v, -) dann gilt auch für alle u * !*, / * "*: 

(q, wu, ./) ! * K (q', vu, -/) 


Beispiel Konfigurationsfolgen Kellerautomat 

(q 0, aabb, $) ! K1 (q 0, abb, 1$) ! K1 (q 0, bb, 11$) ! K1 (q 1, b, 1$) ! K1 (q 1, ', $) ! K1 (q f, ',') 

(q 0, aabb, $) ! K1 (q f, aabb, ') 

(q 0, aab, $) ! K1 (q 0, ab, 1$) ! K1 (q 0, b, 11$) ! K1 (q 1, ', 1$) 

(q 0, abb, $) ! K1 (q 0, bb, 1$) ! K1 (q 1, b, $) ! K1 (q 1, b, $) 


Akzeptanz durch Kellerautomaten 

• Für Kellerautomaten haben sich zwei Arten der Definition von Akzeptanz als 

fruchtbar erwiesen. 

• In beiden Fällen muss das Eingabewort vollständig verarbeitet sein. 

• Die initiale Situation ist grundsätzlich (q 0, w, $). 


Sei K = (!, Q, ", #, q 0, $, F) ein (nichtdeterministischer) Kellerautomat. 

• Die von K mit Endzustand akzeptierte Sprache ist 

L F(K) = {w * !* | (q 0, w, $) ! * K (q f, ', /), q f * F, / * "*} 

• PDA F,! ist die Menge aller von einem Kellerautomaten mit Endzustand akzeptierten 

Sprachen über !. 

• Bei der Akzeptanz mit Endzustand darf im Keller beliebiges stehen. 

• Die von K mit leerem Keller akzeptierte Sprache ist 

L '(K) = {w * !* | (q 0, w, $) ! * K (q, ', ')} 

• PDA ',! ist die Menge aller von einem Kellerautomaten mit leerem Keller 

akzeptierten Sprachen über !. 

• Bei der Akzeptanz mit leerem Keller ist der finale Zustand unerheblich. 


L F(K 1) = L '(K 1) 

= {a n b n | n * ! 0} 

Beispiel akzeptierte Sprachen Kellerautomat 



Begründung für L F(K 1) = L '(K 1) = {a n b n | n * ! 0} 

• Es ist sichergestellt, dass $ nur als unterstes Symbol im Keller auftritt. 

• Um in q f zu gelangen, muss $ das oberste Symbol auf dem Keller sein. Bei diesem 

Übergang wird $ gelöscht. Da damit das unterste Symbol gelöscht wird, ist der 

Keller leer. 

• K 1 startet in q 0 und solange K 1 in q 0 ist, hat K 1 nur a verarbeitet und sich die Anzahl 

der a auf dem Keller gemerkt. 

• Sobald ein a verarbeitet wurde, kann K 1 nicht mehr direkt von q 0 in q f wechseln 

sondern muss über die Kante von q 0 zu q 1 gehen und dabei ein b verarbeiten. 

Anschließend können nur noch b verarbeitet werden. 

• Jede Verarbeitung eines b löscht eine 1 vom Keller und versetzt K 1 in Zustand q 1. 

• Es können höchstens so viele b verarbeitet werden, wie 1en bei Verlassen von q 0 im 

Keller standen. 

• Um eine 1 vom Keller zu löschen, muss ein b von der Eingabe gelesen werden. 

• Der Übergang von q 1 nach q f erfordert, dass alle 1en gelöscht wurden. 

• Es müssen also mindestens so viele b verarbeitet werden, wie 1en bei Verlassen von 

q 0 im Keller standen. 


Akzeptanzarten unterscheiden sich nicht grundsätzlich 

Für das bisherige Beispiel galt 

• L F(K) = L '(K) 

das ist natürlich nicht immer der Fall. Dennoch gilt allgemein 

Satz 13.25 

Für jedes Alphabet ! gilt: PDA F,! = PDA ',! 

Beweis 

1. Teil: PDA F,! + PDA ',! 

Dazu konstruieren wir zu einem beliebigen Kellerautomaten K einen Automaten K ', so 

dass L F(K) = L '(K '). 

2. Teil: PDA ',! + PDA F,! 

Dazu konstruieren wir zu einem beliebigen Kellerautomaten K einen Automaten K F, so 

dass L '(K) = L F(K F). 


Beweis Satz 13.25 Teil 1 

Sei K = (!, Q, ", #, q i, $, F) ein (nichtdeterministischer) Kellerautomat. 

K ' = (!, Q&{q 0, q '}, "&{0}, # ', q 0, 0, ,) 

# '(q 0, ', 0) = {(q i, $0)} 

# '(q, x, k) = #(q, x, k), falls q * Q, 

x * ! & {'}, k * " 

# '(q f, ', k) = {(q ', ')}, für q f * F&{q '}, 

k * " & {0} 

L F(K) = L '(K ') 

• K ' schreibt das Kellerbodensymbol $ von K auf den Keller und lässt dann K laufen. 

• K kann das Kellerbodensymbol 0 von K ' nicht löschen. 

• Solange K arbeitet wird also der Keller nie leer. 

• Wenn K in einen Endzustandgerät, kann K ' in den Zustand q ' gehen und den Keller 

leeren. 


Beweis Satz 13.25 Teil 2 

Sei K = (!, Q, ", #, q i, $, ,) ein (nichtdeterministischer) Kellerautomat. 

K F = (!, Q&{q 0, q f}, "&{0}, # F, q 0, 0, {q f}) 

# F(q 0, ', 0) = {(q i, $0)} 

# F(q, x, k) = #(q, x, k), falls q * Q, 

x * ! & {'}, k * " 

# F(q, ', 0) = {(q f, ')}, für q * Q 

L '(K) = L F(K F) 

• K F schreibt das Kellerbodensymbol von K auf den Keller und lässt dann K laufen. 

• Sobald K seinen Teil des Kellers geleert hat, ist 0 das oberste Zeichen. 

• Von jedem Zustand von K aus kann K F, wenn 0 oben auf dem Keller liegt, in den 

Endzustand q f wechseln. 


Kellerautomaten können kontextfreie Sprachen akzeptieren 

• Der Keller ermöglicht die Verarbeitung von Strukturen, die komplizierter sind als 

reguläre Sprachen. 

• (Nichtdeterministische) Kellerautomaten entsprechen in ihrer 

Verarbeitungsmächtigkeit den kontextfreien Grammatiken. 

Satz 13.26 

Für jedes Alphabet ! gilt: kfS ! + PDA ',! 

Beweis 

Wir konstruieren für eine beliebige kontextfreie Grammatik G einen Kellerautomaten 

K G, so dass L(G) = L '(K G). 

K G bezeichnen wir dann auch als (nichtdeterministischen) Parser für G. 

Die Konstruktionsvorschrift entspricht einem Parsergenerator für kontextfreie 

Grammatiken. 


Konstruktion für den Beweis zu Satz 13.26 


K G = (!, {q}, ! & N, #, q, S, ,) 

#(q, x, x) = {(q, ')}, für x * ! 

#(q, ', A) = {(q, w) | A ( w * P} 

L(G) = L '(K G) 

Arbeitsweise des Parsers 

• Das Startsymbol von G ist das Kellerbodensymbol (initialer Kellerinhalt) von K G. 

• K G simuliert eine Linksableitung durch G. 

• Nonterminalsymbole an oberster Stelle auf dem Keller entsprechen dem am 

weitesten links stehenden Nichtterminalsymbol einer Ableitung. 

• Sie werden durch die rechte Seite einer Produktion ersetzt. 

• Terminalsymbole auf dem Keller werden mit den Eingabesymbolen verglichen und 

bei Übereinstimmung gelöscht. 



Die Konstruktion ist natürlich noch kein Beweis. 

Es fehlt noch der Nachweis, dass nun folgendes gilt. 

Behauptung 

Ist A * N, w * !* und v * (! & N)*, dann gilt: 

A 1 * G,lm wv genau dann, wenn (q, w, A) ! * KG (q, ', v) 

Der Rest ergibt sich dann aus dem Spezialfall A 1 * G,lm w genau dann, wenn 

(q, w, S) ! * KG (q, ', '), der Setzung von S als Kellerbodensymbol in K G und den 

Definitionen von L(G) bzw. L '(K G) 

Für diesen Nachweis sind zwei Induktionsbeweise über die Anzahl der Ableitungs- 

bzw. Verarbeitungsschritte zu führen. 


Beispiel: zur Konstruktion zu Satz 13.26 

Sei G = ({a, b}, {S}, {S ( aSb, S ( '}, S). 

Die Konstruktion liefert folgenden Kellerautomaten: 

K G = ({a, b}, {q}, {a, b, S}, #, q, S, ,) 

#(q, a, a) = #(q, b, b) = {(q, ')} 

#(q, ', S) = {(q, aSb), (q, ')} 

L(G) = L '(K G) 

Konfigurationsfolge bei Akzeptanz (mit leerem Keller) von aaabbb 

(q, aaabbb, S) ! KG (q, aaabbb, aSb) ! KG (q, aabbb, Sb) ! KG (q, aabbb, aSbb) 

! KG (q, abbb, Sbb) ! KG (q, abbb, aSbbb) ! KG (q, bbb, Sbbb) ! KG (q, bbb, bbb) 

! KG (q, bb, bb) ! KG (q, b, b) ! KG (q, ', ') 

Die entsprechende Ableitung der Grammatik sieht so aus 

S 1 G aSb 1 G aaSbb 1 G aaaSbbb 1 G aaabbb 


Kellerautomaten können nur kontextfreie Sprachen akzeptieren 

Satz 13.27 

Für jedes Alphabet ! gilt: PDA ',! + kfS ! 

Beweis 

Wir konstruieren für einen beliebige Kellerautomaten K eine kontextfreie Grammatik 

G K, so dass L '(K) = L(G K). 

Diese Konstruktion ist komplizierter als die vorhergehenden Konstruktionen. 

• In den Nichtterminalsymbole der Grammatik werden folgende Aspekte einer 

Konfiguration des Kellerautomaten kodiert: 

• der aktuelle Zustand 

• ein Zeichen des Kelleralphabets 

• der Nachfolgezustand 

• Die Nichtterminalsymbole notieren wir in der Form [pkq], wobei k Kellersymbol 

und p, q Zustände von K sind. 

• Aus Sicht der Grammatik ist [pkq] aber ein atomares Nichtterminalsymbol. 

• [pkq] steht für: K kann unter Verarbeitung (Löschung) von k aus dem Zustand p 

(direkt oder über mehrere Schritte) in den Zustand q gelangen. 


Konstruktion für den Beweis zu Satz 13.27 

Sei K = (!, Q, ", #, q 0, $, ,) ein (nichtdeterministischer) Kellerautomat. 

Die kontextfreie Grammatik G K = (!, N, P, S) ist wie folgt spezifiziert: 

• N = {S} & (ein spezielles Startsymbol) 

{[pkq] | k * ", p, q * Q} (Symbole zur Kodierung von Übergängen in K) 

(insgesamt |"| * |Q| 2 + 1 verschiedene Zeichen) 

• P = {S ( [q0$q] | q * Q} & (Symbole für den Übergang vom q 0 zu anderen 

Zuständen bei Verarbeitung von $) 

{[pkp 0] ( x[p 0k 1p 1]…[p r-1k rp r] | 

(p 0, k 1…k r) * #(p, x, k), 

p, p 0, …, p r * Q, x * ! & {'}, k 1, …k r * !} 



Die Konstruktion ist natürlich noch kein Beweis. 

Es fehlt noch der Nachweis, dass nun folgendes gilt. 

Behauptung 

Sind p, q * Q, k * ", w * !* und v * (! & N)*, dann gilt: 

(p, w, k) ! * K (q, ', v) genau dann, wenn [pkq] 1 * GK,lm wv 

Der Rest ergibt sich dann aus dem Spezialfall (q 0, w, $) ! * K (q, ', ') genau dann, wenn 

[q0$q] 1 * GK,lm w, den Produktionen der Form S ( [q0$q] und den Definitionen von 

L '(K) bzw. L(G K) 

Für diesen Nachweis sind zwei Induktionsbeweise über die Anzahl der Ableitungs- 

bzw. Verarbeitungsschritte zu führen. 


Beispiel zu Satz 13.27 

K 2 = ({a, b}, {q 0, q 1}, {1, $}, # 2, q 0, $, ,) mit 

# 2(q 0, a, $) = {(q 0, 1)} 

# 2(q 0, a, 1) = {(q 0, 11)} 

# 2(q 0, b, 1) = # 2(q 1, b, 1) = {(q 1, ')} 

G K2 = (!, N, P, S) mit 

N = {S, [q 0$q 0], [q 0$q 1], [q 1$q 0], [q 1$q 1], [q 01q 0], [q 01q 1], 

[q 11q 0], [q 11q 1]} 

P = {S ( [q0$q0], S ( [q0$q1] 

[q 0$q 0] ( a[q 01q 0], [q 0$q 1] ( a[q 01q 1], 

[q 01q 0] ( a[q 01q 0][q 01q 0], [q 01q 0] ( a[q 01q 1][q 11q 0], 


[q 01q 1] ( b, [q 11q 1] ( b} 

L '(K 2) = L(K K2) = {a n b n | n * !} 

Korrespondierende Verarbeitungsfolgen 

(q 0, aabb, $) ! K2 (q 0, abb, 1) ! K2 (q 0, bb, 11) ! K2 (q 1, b, 1) ! K2 (q 1, ', ') 

S 1 GK2 [q0$q1] 1 GK2 a[q 01q 1] 1 GK2 aa[q 01q 1][q 11q 1] 1 GK2 aab[q 11q 1] 1 GK2 aabb 


Beispiel zum Beweis von 13.27 

K 2 = ({a, b}, {q 0, q 1}, {1, $}, # 2, q 0, $, ,) mit 

# 2(q 0, a, $) = {(q 0, 1)} 

# 2(q 0, a, 1) = {(q 0, 11)} 

# 2(q 0, b, 1) = # 2(q 1, b, 1) = {(q 1, ')} 

G K2 = (!, N, P, S) mit 

N = {S, [q 0$q 0], [q 0$q 1], [q 1$q 0], [q 1$q 1], [q 01q 0], [q 01q 1], 

[q 11q 0], [q 11q 1]} 

P = {S ( [q0$q0], S ( [q0$q1] 

[q 0$q 0] ( a[q 01q 0], [q 0$q 1] ( a[q 01q 1], 



[q 01q 1] ( b, [q 11q 1] ( b} 

L '(K 2) = L(K K2) = {a n b n | n * !} 

Die durch die Konstruktion erzeugte Grammatik enthält einige überflüssige (nutzlose) 

Nichtterminalzeichen und Produktionen 


Beispiel: L 3 = {w c SP(w) | w * {a, b}*} 

K 3 = ({a, b, c}, {q 0, q c, q f}, {a, b, $}, # 3, q 0, $, {q f}) mit 

# 3(q 0, a, $) = {(q 0, a$)} 

# 3(q 0, b, $) = {(q 0, b$)} 

# 3(q 0, a, a) = {(q 0, aa)} 

# 3(q 0, b, a) = {(q 0, ba)} 

# 3(q 0, a, b) = {(q 0, ab)} 

# 3(q 0, b, b) = {(q 0, bb)} 

# 3(q 0, c, $) = {(q f, ')} 

# 3(q 0, c, a) = {(q c, a)} 

# 3(q 0, c, b) = {(q c, b)} 

# 3(q c, a, a) = {(q c, ')} 

# 3(q c, b, b) = {(q c, ')} 

# 3(q c, ', $) = {(q f, ')} 

Alle restlichen = , 

• Deterministische Verarbeitung der Eingabe 

• LF(K3) = L'(K3) = {w c SP(w) | w * {a, b}*} 


Deterministische Kellerautomaten 


• Ein Kellerautomat K = (!, Q, ", #, q 0, $, F) heißt genau dann deterministisch, wenn 

für alle x * !, q * Q, k * " gilt |#(q, x, k)| + |#( q, ", k)| ! 1. 

• Eine Sprache L heißt deterministisch kontextfrei, falls es einen deterministischen 

Kellerautomaten K gibt, der L akzeptiert, d.h. für den L = L F(K) gilt. 

• Mit DPDA! bezeichnen wir die Klasse der Sprachen über ! die von 

deterministischen Kellerautomaten akzeptiert werden. 

Bemerkung 

• Ein Kellerautomat K ist genau dann deterministisch, wenn für alle Konfigurationen 

von K gilt: 

Wenn (q, w, !) ! K (q1, w1, -1) und (q, w, !) ! K (q2, w2, -2), 

dann q1 = q2, w1 = w2 und -1 = -2 

• Es gibt für jede Konfiguration maximal eine direkte Nachfolgekonfiguration. 

• Rückschau: K 3 ist ein deterministischer Kellerautomat. 


Beispiel: L 4 = {w SP(w) | w * {a, b}*} 

K 4 = ({a, b}, {q 0, q c, q f}, {a, b, $}, # 4, q 0, $, {q f}) mit 

# 4(q 0, a, $) = {(q 0, a$)} 

# 4(q 0, b, $) = {(q 0, b$)} 

# 4(q 0, a, a) = {(q 0, aa), (q c, ')} 

# 4(q 0, b, a) = {(q 0, ba)} 

# 4(q 0, a, b) = {(q 0, ab)} 

# 4(q 0, b, b) = {(q 0, bb), (q c, ')} 

# 4(q 0, ', $) = {(q f, ')} 

# 4(q c, a, a) = {(q c, ')} 

# 4(q c, b, b) = {(q c, ')} 

# 4(q c, ', $) = {(q f, ')} 

Alle restlichen = , 

• Nicht-deterministische Verarbeitung: die Wortmitte muss 'geraten' werden 

• oder alle Möglichkeiten müssen durchprobiert werden. 

• L F(K 4) = L '(K 4) = {w SP(w) | w * {a, b}*} 


DPDA! 2 PDA! 

Satz 13.29 

Für jedes Alphabet ! gilt: DPDA! + PDA! 

Für jedes Alphabet ! mit | ! | > 1 gilt: DPDA! 2 PDA! 

Kommentar zu Satz 13.29 

• DPDA! + PDA! ergibt sich daraus, das jeder deterministisch kontextfreie 

Kellerautomat auch ein (nichtdeterministischer) Kellerautomat ist. 

• Ansonsten gilt für jedes Alphabet ! mit | ! | > 1, dass es für {w SP(w) | w * !*} 

keinen deterministischen Kellerautomaten gibt. Dies zu beweisen liegt jedoch 

außerhalb der Möglichkeiten dieser Vorlesung. 

Satz 13.30 

Für jedes Alphabet ! gilt: REG! + DPDA! 

Konstruktion und Beweis zu Satz 13.30 als Hausaufgabe ! 


Deterministische Kellerautomaten und eindeutige Grammatiken 


• Eine kontextfreie Grammatik heißt genau dann eindeutig, wenn sie nicht 

mehrdeutig ist. (Also: wenn es für jedes Wort ihrer Sprache genau eine 

Linksableitung gibt.) 

• Eine kontextfreie Sprache L heißt genau dann eindeutig, wenn es eine eindeutige 

kontextfreie Grammatik G gibt, so dass L = L(G). 

Satz 13.32 

Für jeden deterministischen Kellerautomaten K gilt, dass L F(K) eindeutig kontextfrei 

ist. 

Bemerkung 

• Auch diesen Beweis führen wir hier nicht. 

• Wichtig ist aber, dass die Sprachen der deterministischen Kellerautomaten so viele 

positive Eigenschaften haben, dass bei der Definition formaler Sprachen in der 

Regel eine Sprache aus DPDA! gewählt wird. 


Akzeptanzarten bei deterministische Kellerautomaten 

Für deterministische Kellerautomaten liefern die beiden Akzeptanzarten 

unterschiedliche Beschränkungen. 


Eine Sprache L über ! heißt genau dann präfixfrei, wenn es keine zwei Wörter 

w, v * L gibt, so dass w ein echtes Präfix von v ist. 

Beobachtung 13.34 

Ist K ein deterministischer Kellerautomat, dann ist L "(K) eine präfixfreie Sprache. 

Begründung 

• Der Kellerautomat kann nicht weiterarbeiten, sobald der Keller geleert ist. 

• Der deterministische Kellerautomat hat keine alternativen Verarbeitungswege. 

• Er kann nach Verarbeitung von w nicht weiterarbeiten, um auch v zu akzeptieren. 

Satz 13.35 

Eine Sprache ist genau dann durch einen deterministischen Kellerautomaten mit 

leerem Keller akzeptierbar, wenn sie präfixfrei und durch einen deterministischen 

Kellerautomaten mit Endzustand akzeptierbar ist. 



Satz 13.36 

Jede Sprache, die durch einen deterministischen Kellerautomaten mit leerem Keller 

akzeptierbar ist, ist auch durch einen deterministischen Kellerautomaten mit 

Endzustand akzeptierbar. 

Überlegen Sie 

• warum die Konstruktion zu Satz 13.36 einen deterministischen Kellerautomaten 

wieder auf einen deterministischen Kellerautomaten abbildet. 


Pumpinglemma für kontextfreie Sprachen – Einleitung 

• Die Grundidee ist analog zum Pumpinglemma für reguläre Sprachen: 

• Alle kontextfreien Sprachen haben eine spezielle Eigenschaft. Wenn eine 

Sprache diese Eigenschaft nicht besitzt, dann ist sie nicht kontextfrei. 

• Der Unterschied zwischen den beiden Pumpinglemmata spiegelt die 

Unterschiede zwischen regulären und (nicht-regulären) kontextfreien 

Sprachen wider. 

• Die Pumping-Eigenschaft (informell): 

• Alle Wörter, die hinreichend lang sind, d.h. deren Länge einen gewissen 

Wert, genannt Pumping length (Pumpinglänge), überschreitet, können an 

gewissen Stellen „aufgepumpt“ werden. 

• Dies bedeutet im Fall der kontextfreien Sprachen: In den entsprechenden 

Wörtern existieren gewisse Paare von Teilwörtern, die beliebig oft – und 

zwar gleich oft – wiederholt werden können, wobei die resultierenden Wörter 

ebenfalls zur Sprache gehören. 


Pumpinglemma für kontextfreie Sprachen 

Satz 13.37 (Pumpinglemma für kontextfreie Sprachen) 

Sei L eine kontextfreie Sprache. Dann existiert eine natürliche Zahl p (genannt 

Pumping length), so dass für alle Wörter w * L mit | w | " p eine Zerlegung von 

w = u v x y z existiert, die die folgenden Bedingungen erfüllt 

(1) für alle i " 0 gilt u v i x y i z * L 

(2) | v y | > 0 

(3) | v x y | ! p 

Anmerkungen 

• Bedingung (2) besagt, dass v oder y nicht gleich dem leeren Wort ist. 

• Bedingung (3) besagt, die Gesamtlänge von v, x und y maximal p ist. 


Pumpinglemma für kontextfreie Sprachen – Beispiel 1 

L pl1 = { a n b n | n " 0 } 

Pumping length = 4 

Dann w = a n b n mit | w | " p = 4, d.h. mit n ! 2 

• Wir wählen die Zerlegung mit 

u = a n-1 , v = a, x = ', y = b, z = b n-1 

• dann sind für i " 0 die Wörter 

u v i x y i z = a n-1 a i b i b n-1 = a n-1+i b n-1+i 

auf ihre Zugehörigkeit zu L pl1 zu prüfen (Pumpingeigenschaft 1) 

• Da a n-1+i b n-1+i * L pl1 = { a n b n | n " 0 }, erfüllt L pl1 die 

Pumpingeigenschaft (1). 

• | v y | = | a b | = 2 > 0 ! Pumpingeigenschaft (2) 

• | v x y | = | a b | = 2 ! 4 ! Pumpingeigenschaft (3) 


Pumpinglemma für kontextfreie Sprachen – Beispiel 2 

L pl2 = { a n b n c n | n " 0 } 

Annahme: L pl2 ist kontextfrei. Sei p die Pumpinglänge für L pl2 . 

• Wir betrachten das Wort w = a p b p c p . 

• Da w * L pl2 und | w | = 3p " p, ist das Pumpinglemma anwendbar. 

• Wir untersuchen nun verschiedene Fälle von Zerlegungen w = u v x y z 

(1) v und y enthalten jeweils nur einen Typ von terminalen Symbolen. 

• Dann enthält v nicht sowohl a-Symbole als auch b-Symbole oder sowohl b- 

Symbole als auch c-Symbole. Entsprechendes gilt für y. 

• Dann enthält u v 2 x y 2 z nicht die gleiche Anzahl von a-, b- und c-Symbolen. 

! verletzt Pumpingeigenschaft (1) 

(2) v oder y enthalten mehr als einen Typ von terminalen Symbolen 

• Dann enthält u v 2 x y 2 z zwar eventuell die gleiche Anzahl von a-, b- und c- 

Symbolen, aber nicht in der korrekten Anordnung, ! verletzt 

Pumpingeigenschaft (1) 

Einer der beiden Fälle muss eintreten. Da beide Fälle zum Widerspruch der Annahme 

(L pl2 ist kontextfrei) führen, gilt, L pl2 nicht kontextfrei. 


Pumpinglemma für kontextfreie Sprachen – Beweis 

Sei L eine kontextfreie Sprache. 

• Zuerst betrachten wir zwei Sonderfälle: 

• L = ,: Da es keine Zeichenkette w * L = , gibt, erfüllen alle Wörter aus L 

die Pumpingeigenschaft. 

• L = {'}: Dann gibt es in L kein Wort w * L mit | w | " 1 (dies ist die kleinste 

Pumpinglänge, die überhaupt möglich wäre). Somit erfüllen alle Wörter aus 

L mit | w | " 1 die Pumpingeigenschaft. 

• Nach Satz 3.21 gibt es eine Grammatik G = (!, N, P, S) in Chomsky-Normalform 

mit L(G) = L – {'}. 

• Sei |N| = m, d.h. G hat m Variablen. Wir wählen p = 2 m . 

• Sei w * L mit | w | = p 

• Nach Satz 13.38 hat Parsebaum mit maximaler Pfadlänge m ein 

terminales Wort mit der maximalen Länge 2 m-1 = p/2 

• Ein solcher Parsebaum kann nicht w erzeugen, da | w | = p 

• Also haben Parsebäume, die zu w führen, einen Pfad mit der Länge m + 1 

(oder länger). 


Grösse von Parsebäumen 

Satz 13.38 

Sei G = (!, N, P, S) eine Grammatik in Chomsky-Normalform. Wenn der längste Pfad 

im Parsebaum zu w * L(G) die Länge n besitzt, so gilt | w | ! 2 n-1 . 

Beweis durch Induktion 

Beweisidee 

• Grammatiken in Chomsky- 

Normalform erzeugen Parsebäume mit 

einem Verzweigungsgrad ! 2 

• Ein nichtterminaler Parse-Baum mit 

Verzweigungsgrad 2 und der Tiefe k 

hat maximal eine Breite von 2 k . 

• Die abschliessenden Regeln (Tiefe 

k+1) verändern die Breite nicht. 


• längster Pfad zu w hat die Länge k +1. 

Parsebäume für w 

• Da k " m, kommen mindestens m +1 

Vorkommen von Variablen auf dem Pfad 

vor. 

• Da es nur m Variablen in der Grammatik 

gibt, kommt es mindestens zu eine 

Wiederholung von Variablen, etwa 

A h = A i mit k–m ! h 

• Hieraus ergibt sich eine Zerlegung für w in 

u v x y z 


u x z 

• u v 2 x y 2 z 

Parsebäume für u vi x yi z 



Kontextfreie Sprachen & Kellerautomaten – Fazit 

• bilden die für die Praxis wichtigste Klasse der formalen Sprachen, mit 

wichtigen Unterklassen reguläre Sprachen, deterministische kfS und eindeutige 

kfS 

• werden akzeptiert / erkannt / entschieden durch Kellerautomaten. Die Familie 

der Kellerautomaten weist ein grosses Spektrum von „Designvarianten“ auf, 

die z.T. unterschiedliche Sprachen spezifizieren. 

o nicht-deterministisch vs. deterministisch 

o Akzeptanz durch Endzustand – Akzeptanz durch leeren Keller 

• Nicht-Kontextfreiheit kann durch ein Pumpinglemma getestet werden. 

Was es weitergeht: 

• Abschlusseigenschaften von kontextfreien und regulären Sprachen 

• Sprachen & Automaten jenseits der Kontextfreiheit 

• Turingmaschinen als generelles Modell für Berechnungsprozesse: 

Berechenbarkeit, Entscheidbarkeit und Komplexität

Kontextfreie Sprachen Kontextfreie Grammatiken Definition 13.1 ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?