Skript

Lineare Optimierung 

Bernhard Schmitt 

Winter-Semester 2013/14 

Inhaltsverzeichnis 

1 Optimierungs-Probleme 1 

1.1 Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

Produktionsplanung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

Transportprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

Das Problem des Handlungsreisenden (TSP) . . . . . . . . . . . . . . . . . . . . . 5 

1.3 Lineare Programme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2 Simplex – Verfahren 10 

2.1 Bezeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

2.2 Matrix – Umformungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

2.3 Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.4 Das revidierte Simplex-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 

2.5 Tabellenform des Simplex-Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . 21 

2.6 Anlaufrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

Zwei-Phasen-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

Groß-M-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

2.7 Ausgeartete Ecken und praktische Aspekte . . . . . . . . . . . . . . . . . . . . . 26 

3 Konvexe Geometrie 28 

i

INHALTSVERZEICHNIS 

ii 

3.1 Spezielle Teilmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

3.2 Konvexe Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

3.3 Randflächen und Ecken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

3.4 Polyeder, Polytope, Kegel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

3.5 Der Dekompositionssatz für Polyeder . . . . . . . . . . . . . . . . . . . . . . . . . 44 

3.6 Existenzsätze für Ungleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . 47 

4 Duale Programme 49 

4.1 Optimalitätskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.2 Komplementarität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

5 Dualität beim Simplexverfahren 56 

5.1 Duales Simplexverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

5.2 Problem-Modifikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 

6 Innere-Punkt-Methoden 64 

6.1 Der zentrale Pfad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 

6.2 Newtonverfahren zur Pfadverfolgung . . . . . . . . . . . . . . . . . . . . . . . . . 66

1 OPTIMIERUNGS-PROBLEME 1 

1 Optimierungs-Probleme 

1.1 Strukturen 

Eine präzise Vorstellung für die ”Optimierung” einer Eigenschaft erfordert, dass man deren 

Qualität F quantitativ (als reelle Zahl) angeben kann und dass man sich über Einflußgrößen x 

dieser Qualität im Klaren ist. Wenn man dann die in Frage kommenden Werte der Parameter x 

zu einer Menge X zusammenfaßt ist das Qualitätsmaß F : X → R eine reelle Funktion auf X. 

In der Optimierungsaufgabe 

{ 

min F (x) 

min{F (x) : x ∈ X} bzw. 

(P) 

x ∈ X 

wird eine Minimalstelle ˆx ∈ X gesucht mit F (ˆx) ≤ F (x) ∀x ∈ X. 

Bezeichnung: F heißt Zielfunktion, X zulässiger Bereich, jedes x ∈ X zulässiger Vektor bzw. 

Element, ˆx eine (globale) Lösung von (P) und F (ˆx) der Wert von (P). 

Ein wesentlicher Teil der Problematik besteht meist darin, dass zwar die Zielfunktion F 

explizit vorliegt, der zulässige Bereich X aber nur implizit gegeben ist, etwa durch Systeme von 

Gleichungen oder Ungleichungen. Daher zerfällt schon die Grundaufgabe (P) in mehrere Teile: 

1. Frage X = ∅? 

2. für X ≠ ∅: 

(a) F (x) beschränkt auf X, d.h. inf{F (x) : x ∈ X} > −∞ ? 

Wird dann das Infimum auch angenommen (”Minimum”)? 

(b) Wenn ja: berechne ein ˆx ∈ X mit F (ˆx) ≤ F (x) ∀x ∈ X. 

Die einsetzbaren Methoden unterscheiden sich auch nach der Art und Anzahl der ”Freiheitsgrade”, 

die in der Menge X auftreten. Die Frage, ob ein Minimum oder Maximum gesucht wird, 

ist aber unerheblich, Eines kann durch Übergang zu −F (x) in das Andere überführt werden. 

Beispiel 1.1.1 a) Problem der Brachistochrone von Galilei: 

Ein Körper soll nur durch den Einfluß der Schwerkraft 

zwischen zwei Punkten bewegt werden. Gesucht ist die 

Kurve, auf der der Körper in minimaler Zeit vom höheren 

zum niederen Punkt kommt. 

Johann Bernoulli: Lösung ist Zykloide 

b) Transportproblem: Ein Unternehmen mit mehreren Produktionsstandorten beliefert verschiedene 

Abnehmer mit seinen Produkten (Massen-/Stückgut). Gesucht ist ein Transportplan mit 

möglichst geringen Kosten


Einordnung der Beispiele: Da die Weghöhe beim Brachistochronen-Problem an jedem reellen 

Punkt s der Strecke unbekannt ist, hat man eine unendliche Anzahl an Freiheitsgraden 

(überabzählbar). Zur korrekten Beschreibung wäre die Menge X als ein Raum geeigneter Funktionen 

x(s), s ∈ [a, b], zu wählen. Derartige Probleme werden in der Variationsrechnung und 

Steuerungstheorie (optimal control) behandelt. Beim Transportproblem sind dagegen die endlich 

vielen, vom Produktionsort P i zum Kunden K j zu liefernden Mengen unbekannt. Bei Massengütern 

können diese (nichtnegative) reelle Werte, bei Stückgütern ganzzahlige Werte annehmen. 

Die Grundmenge X ist also (ein Teil) eines geeigneten R n oder Z n ⊆ R n . In dieser 

Vorlesung wird nur der Fall X ⊆ R n behandelt. 

Eine weitere Klassifikation des Problems ergibt sich aus den 

Eigenschaften der Zielfunktion F : 

✟ 

✟ 

✟ 

✟ 

beliebig 

stetig 

❍ ❍❍❍ 

❅ 

❅ 

❅ 

❅❅ 

diffbar stw. diffbar nicht diffbar 

2-mal diffbar 

konvex 

quadratisch 

linear 

stw. linear 

Die Gestalt des zulässigen Bereichs X ist in der Regel nicht explizit bekannt, sondern durch 

Einschränkungen an die Parameter x. Die Art dieser Nebenbedingungen schränkt ebenfalls die 

Auswahl möglicher Verfahren ein. Daher ist es zweckmäßig, die Nebenbedingungen aufzuteilen 

in funktionale und mengenmäßige. Ab jetzt sei also 

X := {x ∈ R n : f(x) ≤ 0, g(x) = 0, x ∈ C}, (1.1.1) 

mit f : R n → R p , g : R n → R m , C ⊆ R n . Generell werden Ungleichungen wie in dieser 

Beschreibung komponentenweise verstanden, f i (x) ≤ 0, i = 1, . . . , p, für f = (f i ) p i=1 

. Auch die 

Eigenschaften der Funktionen f, g gehen in die Klassifikation von Optimierungsproblemen ein, 

da durch Umformulierungen mit Zusatzvariablen wie x n+1 := F (x), die Zielfunktion auch in 

Nebenbedingungen verlagert werden kann. Als Grundmengen C treten oft folgende Fälle auf 

• R n , R n +, R n 1 

+ × Rn 2 

die Nichtnegativität ließe sich auch bei f unterbringen 

• B r (y) Kugel um y vom Radius r, allgemeiner: Ellipsoid 

• Z n , R n 1 

× Z n 2 

ganzzahlige, gemischt-ganzzahlige Probleme, 

• B n = {0, 1} n boolesche Optimierungsprobleme.


In dieser Vorlesung werden nur Lineare Programme (LP) behandelt, das sind kontinuierliche 

Optimierungsprobleme (C = R n ) mit Funktionen 

F (x) = c T x + d, f i , g j affin linear. 

Bei einer (in der Praxis üblichen) großen Anzahl von Unbekannten n ist eine Sonderbehandlung 

bei speziellen Strukturen sinnvoll, etwa bei linearen Transport- oder Fluß-Problemen. Lösungsmethoden 

für Optimierungsprobleme haben offensichtlich im Unternehmensbereich (Kostenminimierung) 

eine erhebliche ökonomische Bedeutung. Aber auch in theoretischer Hinsicht (Komplexitätstheorie) 

sind sie eine große Herausforderung. Naheliegende Fragestellungen sind: 

Theorie: 

Allgemeine Aussagen, z.B. zur Struktur 

Existenz und Eindeutigkeit 

Kriterien für Optimalität 

Empfindlichkeit der Lösungen (Stabilität des Problems) 

Komplexität des Problems 

Praxis: 

Algorithmenentwicklung 

Empfindlichkeit der berechneten Lösung (Stabilität des Algorithmus) 

Komplexität des Algorithmus 

In die erste Kategorie fallen bei Linearen Programmen Erkenntnisse zur Geometrie des zulässigen 

Bereichs X. Diese hat zentrale Bedeutung, denn X ist ein konvexes Polyeder (Vielflächner), das 

Minimum wird auf dem Rand angenommen, da nicht-konstante lineare Funktionen keine inneren 

Extrema besitzen. Daher werden in §3 auch Grundlagen der Konvexen Geometrie behandelt. 

1.2 Beispiele 

Produktionsplanung 

In einem Unternehmen können n verschiedene Produkte P j erzeugt werden unter Nutzung von 

m unterschiedlichen Resourcen R i (Arbeitszeit, Rohstoffe, Energie,. . . ). Der Gewinn bei Produktion 

einer Einheit von Produkt P j sei c j . 

Die zu erzeugende Menge des Produkts P j wird als Unbekannte x j eingeführt. Eine triviale 

Nebenbedingung ist offensichtlich x j ≥ 0, der erzielte Gesamtgewinn ist ∑ n 

j=1 c jx j = 

F (x 1 , . . . , x n ) und stellt die Zielfunktion des Problems dar. Nimmt man weiter an, dass zur 

Poduktion von P j jeweils a ij Einheiten von durch Größen b i beschränkte Resourcen R i , i = 

1, . . . , m, verwendet werden, sind ausserdem die Restriktionen 

n∑ 

a ij x j ≤ b i , 

j=1 

i = 1, . . . , m


einzuhalten. Insgesamt lautet das Problem somit 

∑ 

max n c j x j 

j=1 

n∑ 

a ij x j ≤ b i , 

j=1 

x i ≥ 0, 

i = 1, . . . , m 

i = 1, . . . , n 

Hier bietet sich die Vektor-/Matrix-Notation für eine kompaktere Schreibweise an. Mit x = 

(x 1 , . . . , x n ) T , c := (c 1 , . . . , c n ) T , b = (b 1 , . . . , b m ) T , A = (a ij ) m,n 

i,j=1 ist F (x) = cT x und man hat 

die äquivalente Formulierung 

max c T x 

Ax ≤ b 

x ≥ 0. 

Die Ungleichungen bei Vektoren sind dabei wieder komponentenweise zu verstehen. Da alle 

Restriktionen Ungleichungen sind, ist der zulässige Bereich X := {x ∈ R n : Ax ≤ b, x ≥ 0}. 

Beispiel 1.2.1 Fall n = 2, m = 3, die Produkte P 1 (Gewinn c 1 = 4 EUR) und P 2 (Gewinn 

c 2 = 3 EUR) sollen mit Hilfe der Resourcen Arbeitszeit, Lagerkapazität, Energie produziert 

werden. Die Einschränkungen seien 

A: x 1 + x 2 ≤ 16 (gleicher Arbeitsaufwand) 

L: x 2 ≤ 12 (Rohstoffe nur für P 2 zu lagern) 

E: 3x 1 + x 2 ≤ 36 (3-facher Energiebedarf P 1 ) 

Gesamtformulierung und zulässiger Bereich: 

max (4, 3) · x 

⎛ ⎞ ⎛ ⎞ 

1 1 16 

⎜ ⎟ ⎜ ⎟ 

⎝0 1⎠ x ≤ ⎝12⎠ , 

3 1 36 

x ≥ 0. 

Der Pfeil c ist der (konstante!) Gradient der Zielfunktion 

F (x) = c T x = 4x 1 + 3x 2 , das Maximum 

wird im markierten Randpunkt (ˆx 1 , ˆx 2 ) = 

(10, 6) angenommen mit dem Wert F (ˆx) = 58. 

x 2 

❅ 

✻ ❅ ❇ 

L 

❅ 

❇ 

❅ 

❇ 

❅ 

❇ 

E 

❅ 

❇ 

❅ 

❇ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ❅♣ ♣ ❇♣ ♣ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ❅ 

♣❇♣ 

✚ ✚✚❃ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ X♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ❅ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ 

❇ 

♣ ♣ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣❇♣ ♣ 

❅ 

♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ❇♣ ♣ ❅ A 

❇ ❅ 

❇ ❅ 

c 

✲ 

x1 

Transportprobleme 

Hier soll ein Massengut (beliebig teilbar) von 

m Produktions-/Lagerstätten P i mit Kapazität 

s i zu n Verbrauchern V j mit Bedarf r j transportiert 

werden. Die Gesamtmengen bei Produktion 

und Verbrauch sollen dabei gleich sein 

m∑ ∑ 

s i = n r j (oBdA). 

i=1 

j=1 

✗✔ 

P 1 

V 1 

✖✕ 

✟ ✟✟✟✯ ❍❨ 

❍ 

❍ 

✛✘❍ 

✲ V 2 

✛ 

✚✙ 

❍ ✟ 

❍❍❍❥ 

✛✘ 

✟ 

✟✙ 

✟ 

V 3 

P 2 

✚✙


Als Unbekannte werden die von P i nach V j transportierten Mengen x ij ≥ 0 eingeführt, der 

Transport einer Einheit auf dieser Strecke habe den Preis c ij . Für den optimalen Transportplan, 

der minimale Kosten verursacht, ergibt sich das Programm 

min m ∑ 

i=1 j=1 

n∑ 

c ij x ij 

(Gesamt-Transportkosten) 

n∑ 

x ij = s i , i = 1, . . . , m (alle Produkte abtransportiert) 

j=1 

m∑ 

x ij = r j , j = 1, . . . , n (jeder Bedarf abgedeckt) 

i=1 

x ij ≥ 0 

∀i, j 

Die Restriktionen sind hier ausschließlich lineare Gleichungen und reine Vorzeichen–Bedingungen 

an alle Variable. Zum LGS gehört ein affin-linearer Lösungsraum, der zulässige Bereich X ist 

daher der Durchschnitt dieses Lösungsraums mit dem Positivkegel R mn 

+ . Diese Struktur wird bei 

dem Standard-Lösungsverfahren zugrunde gelegt. Beim Transport von Stückgut sind aber nur 

ganzzahlige Werte x ij ∈ Z + zulässig. Dann liegt ein ganzzahliges Optimierungsproblem vor. 

Modifikation: Transport in Netzwerk (Graph), wenn nur ein Teil der Transportstrecken vorhanden 

ist. Hierbei können reine Umschlagknoten (ohne Produktion und Verbrauch) auftreten. 

Das Problem des Handlungsreisenden (TSP) 

Dieses Problem (”traveling salesman problem”) 

hat in der Komplexitätstheorie die Bedeutung 

eines extrem schwierigen Referenz-Problems. In 

der Grundform soll ein Reisender eine Anzahl 

von n Orten je einmal besuchen und zum Ausgangspunkt 

zurückkehren. Ziel ist eine Tour mit 

minimaler Gesamtstrecke. Dies ist also die moderne 

Form der klassischen Odyssee (rechts: eine 

optimale Lösung derselben). 

Dazu sei N = {1, . . . , n} die Menge der Orte und w ij ≥ 0 die Entfernung von i nach j. Ist 

die Rundreise (Tour) gegeben durch die Liste (p(1), . . . , p(n)) der besuchten Orte, so können in 

der Gesamtstrecke ∑ n−1 

j=1 w p(j)p(j+1) +w p(n)p(1) die Summanden w offensichtlich nach dem ersten 

Index umsortiert werden. Im zweiten Index steht dann eine zyklische Permutation π ∈ S n mit 

π(p(j)) = p(j + 1). Die Menge der zyklischen n-Permutationen S z,n ⊆ S n enthält alle diejenigen, 

welche aus einem einzigen Zyklus bestehen. Das Problem lautet daher 

n∑ 

min{ w i,π(i) : π ∈ S z,n } 

i=1 

(TSP) 

In der allgemeinen Form sind die Entfernungsangaben w ij ≥ 0 nicht weiter eingeschränkt. Sinnvolle 

Spezialfälle sind aber offensichtlich das


symmetrische TSP: w ij = w ji (z.B., keine Einbahnstraßen) 

euklidsche TSP: w ij ≤ w ik + w kj ∀i, j, k (Gültigkeit der Dreieckungleichung) 

In der Form (TSP) liegt ein kombinatorisches Optimierungsproblem vor. Wegen |S z,n | = (n−1)! 

ist eine reine Enumeration aller Möglichkeiten zur Lösung nur für kleine n möglich, denn, z.B., 

ist 5! = 120, 10! = 368800, 30! > 2 · 10 32 . Der z.Z. schnellste Rechner (Tianhe-2 mit 33800 Tera- 

FLOPS > 33 PetaFLOPS) schafft ca. 3 · 10 21 Operationen pro Tag. 

Eine alternative Formulierung als (LP) ist möglich durch Betrachtung des charakteristischen 

Vektors x = (x ij ) ∈ B k , k = n(n − 1) beim allgemeinen und k = ( n 

2) 

= n(n − 1)/2 beim 

symmetrischen Problem. Beim symmetrischen Problem haben die Variablen x ij , i < j, folgende 

Bedeutung 

x ij = 

{ 

1 der Weg zwischen i und j wird benutzt, 

0 sonst. 

Damit sich eine Tour ergibt, müssen zu jedem Ort genau zwei Wege benutzt werden, also 

∑ 

ji 

x ij = 2 ∀1 ≤ i ≤ n. (1.2.1) 

Allerdings sind dadurch Teiltouren noch nicht ausgeschlossen. Zusätzlich kann man dazu fordern, 

dass in keiner echten Teilmenge U ⊆ N ein Kreis auftritt, ∑ i,j∈U x ij ≤ |U| − 1, bzw. die Menge 

wieder verlassen wird 

∑ 

i∈U,j /∈U 

Diese Formulierung des (TSP) ist damit 

x ij ≥ 2 ∀U ⊂ N, 1 ≤ |U| ≤ n − 1. (1.2.2) 

min ∑ n 

i,j=1 w ijx ij 

x ∈ X := {x ∈ B (n 2) : (1.2.1), (1.2.2) gelten}. 

(TSPB) 

Dieses (TSPB) ist also ein boolesches lineares Programm mit n Gleichungen und ∑ n−1 

( n 

) 

k=1 k = 

2 n − 2 Ungleichungen. Wegen dieser vielen Bedingungen und der booleschen Variablen ist auch 

diese (und jede) Form des (TSP) schwierig zu lösen. 

Daten zur Geschichte des Problems, Lösungsrekorde: 

1930 Karl Menger Formulierug des Problems, einzige Lösungs- 

1934 Hasler Whitney möglichkeit vollständige Enumeration 

1954 G.B. Dantzig, D.R. Fulkerson, Lösen 42-Städte-Problem mit Schnittebenen- 

S.M. Johnson 

Verfahren und linearen Programmen, 

1972 R.M Karp TSP ist NP-vollständig, 

1979 Crowder, Padberg 318 Orte, Branch-and-Cut-Verfahren, 

1995 Applegate, Bixby, Chvátal, Cook 7397-Städte-Problem, Parallelrechner 

2001 dito 15112 Städte Deutschland 

2004 dito+Helsgaun 24978 Städte Schweden 

2006 A+B+C+C+E+G+H 85900 Punkte VLSI (s.u.)


Der aktuelle Rekord (www.tsp.gatech.edu/) berechnet die optimale Rundreise durch 85900 

Punkte einer VLSI-Schaltung, ein Vorgänger-Rekord 2001 betraf 15112 deutsche Städte (elib.zib.de): 

Statt des Booleschen Problems (TSPB) kann man auch seine stetige Relaxation betrachten, 

mit dem zulässigen Bereich 

X 1 := {x ∈ R (n 2) : 0 ≤ x ≤ 1l, und (1.2.1), (1.2.2)} ⊃ X. (1.2.3) 

Da dessen zulässige Menge X umfaßt, erhält man daraus zumindestens eine untere Schranke W 1 

für den Wert W des (TSPB): W ≥ W 1 . Bei den erwähnten Schnittebenen-Verfahren legt man 

tatsächlich (1.2.3) zugrunde und eliminiert schrittweise unbrauchbare Lösungen durch Hinzunahme 

weiterer Nebenbedingungen, die nichtganzzahlige Lösungen abschneiden. 

Anwendungen Viele praktische Fragen lassen sich als TSP formulieren: 

— Leiterplatinen-Produktion, Computerverdrahtung 

— Tourenplanung 

— Ablaufplanung (job-shop scheduling) 

Zur Bestückung von Platinen mit Bauteilen sind für deren Anschlußdrähte Bohrungen in den 

Leiterplatten anzubringen. Da die Zeit pro Bohrung konstant ist, wird die Gesamtzeit v.a. durch 

die Fahrzeit zwischen den Bohrpunkten bestimmt. Unter der Annahme, dass die Fahrzeit proportional 

zur Entfernng ist, entspricht c ij dem euklidschen Abstand der Punkte. Die im folgenden 

Beispiel mit n = 2392 Punkten per Hand geplante Tour ist um 90% länger als die optimale.


”manuelle” Lösung mit Länge 718876 Optimale Lösung der Länge 378032 

1.3 Lineare Programme 

Für Lineare Optimierungsprobleme hat sich der Begriff Lineare Programme eingebürgert. In dem 

allgemeinen Rahmen der Form (P) mit dem zulässigen Bereich (1.1.1) sind alle auftretenden 

Funktionen (affin) linear, es gelten also Darstellungen der Form 

F (x) = c T x, f i (x) = a T i x + α i , g j (x) = b T j x + β j , 

mit Vektoren a i , b j ∈ R n , i = 1, . . . , p, j = 1, . . . , m. Dabei wurde F oBdA als linear angenommen, 

da eine Konstante zwar den Wert des Problems, aber nicht die Lösung ˆx ändert. In den 

Beispielen traten Ungleichungsrestriktionen of in sehr einfacher Form auf, als reine Vorzeichenbeschränkungen. 

Wegen ihrer vielfältigen Sonderrolle werden diese im folgenden gesondert notiert, 

man teilt die Unbekannten auf in freie und vorzeichenbeschränkte Variable. Zusammen mit der 

Aufteilung in Ungleichungen und Gleichungen können die Restriktionen in einer Blockmatrix 

gesammelt werden. Die allgemeine Form eines linearen Programms lautet daher 

⎫ 

min c T 1 x 1 + c T 2 x 2 

A 11 x 1 + A 12 x 2 ≥ b 

⎪⎬ x 1 , c 1 ∈ R n 1 

, x 2 , c 2 ∈ R n 2 

, n = n 1 + n 2 , 

1 

b 1 ∈ R m 1 

, b 2 ∈ R m 2 

, m = m 1 + m 2 , 

A 21 x 1 + A 22 x 2 = b 2 

x 1 ≥ 0 

⎪⎭ A ij ∈ R m i×n j 

, i, j = 1, 2. 

(LP) 

Allerdings kann man durch elementare Umformungen daraus auch jedes der folgenden, einfacheren 

Standardprogramme erzeugen mit A ∈ R m×n , 

min{ c T x : Ax ≥ b} 

min{ c T x : Ax ≥ b, x ≥ 0} 

min{ c T x : Ax = b, x ≥ 0} 

(LP1) 

(LP2) 

(LP3) 

Bei diesen ist in der allgemeinen Form (LP) jeweils nur ein Matrixblock nichttrivial, nämlich 

A 12 ≠ 0 bei (LP1), A 11 ≠ 0 bei (LP2) und A 21 ≠ 0 bei (LP3). Folgende elementare Umformungen 

können eingesetzt werden, die auf äquivalente Probleme führen:


1. eine Gleichung a T x = α kann durch die beiden Ungleichungen a T x ≥ α, −a T x ≥ −α 

ersetzt werden. 

2. eine freie Variable ξ kann als Differenz ξ = ξ + − ξ − von zwei nichtnegativen Variablen 

ξ + , ξ − ≥ 0 geschrieben werden. 

3. Ungleichungen a T x ≥ α können durch Einführung einer Schlupfvariablen η ≥ 0 durch die 

Gleichung a T x − η = α ersetzt werden. 

4. jede Vorzeichenbeschränkung ξ ≥ 0 kann als Ungleichungsrestriktion ξ ≥ 0 einer freien 

Variablen ξ nach A 12 verlagert werden. 

Durch diese Umformungen können sich die Dimensionen m, n vergrößern, die wesentlichen Eigenschaften 

aus §1.1 (X ≠ ∅? inf{F (x) : x ∈ X} > −∞?) bleiben aber unverändert. Allerdings 

unterscheiden sich die geometrischen Eigenschaften der zulässigen Bereiche bei den 3 Standardformen. 

Dies eröffnet die Möglichkeit, je nach Fragestellung die passende zu wählen, es gilt: 

(LP1) X = {x : Ax ≥ b} = ⋂ m 

i=1 {(eT i A)x ≥ b i} mit den Einheitsvektoren e i ∈ R n . Da jede 

Ungleichung der Form a T x ≥ β einen abgeschlossenen Halbraum definiert, ist X als 

Durchschnitt von Halbräumen ein Polyeder. Hier erwartet man Dimensionen m > n. 

(LP2) X = {x : Ax ≥ b, x ≥ 0} ist Durchschnitt des gerade erwähnten Polyeders mit dem 

positiven Kegel {x ∈ R n : x ≥ 0} = R n +, also wieder ein Polyeder. 

(LP3) X = {x : Ax = b, x ≥ 0} ist als Durchschnitt U ∩ R n + ein ”dünnes” Polyeder. Dabei 

wird der Positivkegel geschnitten mit dem affinen Unterraum U := {x : Ax = b} = 

{ˆx} + kern(A) aller Lösungen des Gleichungssystems. Für einen Kern ist i.d.R. m < n 

erforderlich.

2 SIMPLEX – VERFAHREN 10 

2 Simplex – Verfahren 

2.1 Bezeichnungen 

Es wird der n-dimensionale Vektorraum R n zugrundegelegt. Die Vektoren der Einheitsbasis 

heißen e i = (δ ij ) n j=1 und es sei 1l := ∑ n 

i=1 e i der Vektor aus Einsen. Allgemein werden Elemente 

x ∈ R n als Spaltenvektoren geschrieben, 

⎛ ⎞ 

x 1 

) n 

x = ⎜ 

⎝ . 

⎟ 

⎠ 

(x = i . 

i=1 

x n 

√ ∑n 

Meist wird die Euklidnorm ‖x‖ = ‖x‖ 2 := 

i=1 x2 i 

verwendet, eine andere interessante Norm 

ist die Maximumnorm ‖x‖ ∞ := max n i=1 |x i|. Ungleichungen zwischen Vektoren sind komponentenweise 

zu verstehen. Eine solche wird in der Definition R n + := {x : x ≥ 0} des positiven Kegels 

verwendet (s.o.). Die Menge der reellen m × n-Matrizen heißt R m×n . Im Folgenden werden oft 

Untermatrizen aus ausgewählten Spalten oder Zeilen einer Matrix betrachtet. Zu A ∈ R m×n 

seien daher a j = Ae j ∈ R m die Spalten und a (i) = A T e i ∈ R n die Zeilen von A. Dann gelten 

folgende Schreibweisen 

⎛ 

⎞ 

⎛ ⎞ 

a 11 · · · a 1n 

a (1)T 

A = ⎜ 

⎝ . . 

⎟ 

⎠ = (a ij) = (a 1 , . . . , a n ) = ⎜ 

⎝ . 

⎟ 

⎠ . 

a m1 · · · a mn a (m)T 

Elemente einer Vektorfolge werden ebenfalls durch einen oberen Index unterschieden, x (i) = 

(x (i) 

1 , . . . , x(i) n ) T . 

2.2 Matrix – Umformungen 

Das später behandelte Simplex-Verfahren benutzt die Problemform (LP3) und durchläuft spezielle 

Lösungen des Linearen Gleichungssystems Ax = b, m < n, welche durch reguläre quadratische 

Untermatrizen von A gegeben sind. Die Lösung von regulären Gleichungssystemen spielt 

daher eine zentrale Rolle bei der Optimierung. Zwischen aufeinanderfolgenden Schritten des 

Simplexverfahrens ändern sich die Systeme aber nur wenig. Um Rechenaufwand zu sparen nutzt 

man daher oft Aktualisierungs-Formeln (”matrix update”). Denn bei Änderung einer Matrix 

durch eine Rang-1-Matrix ist die Inverse explizit bekannt und läßt sich effizient berechnen. 

Satz 2.2.1 Die Matrix B ∈ R m×m sei regulär, mit Vektoren u, v ∈ R m sei β := 1+v T B −1 u ≠ 0. 

Dann ist auch die Matrix B + uv T regulär und ihre Inverse ist 

(B + uv T ) −1 = B −1 − 

1 

1 + v T B −1 u B−1 uv T B −1 . (2.2.1)


Wenn dabei in B nur die Spalte Nummer s ∈ {1, . . . , m} durch einen anderen Vektor a ersetzt 

wird, d.h., v = e s und u = a − b s gilt, ist β = e T s B −1 a und die Zeilen der Inversen ändern sich 

nach den Regeln 

Bew 

{ 1 

e T i (B + ue T s ) −1 β 

= 

eT s B −1 , i = s, 

( ) 

e T i B−1 − e T i B−1 a 1 

β eT s B −1 , i ≠ s. 

(2.2.2) 

In den Zeilen mit i ≠ s treten insbesondere die durch die Klammer hervorgehobenen Werte der 

neuen Zeile s auf. Einfacher ist die Formel (2.2.1) für den Fall B = I mit (I+uw T ) −1 = I− 1 β uwT , 

β = 1 + w T u. Aber auch hieraus folgt schon die allgemeine Version, denn mit w T := v T B −1 ist 

(B + uv T ) −1 = 

( 

(I + uw T )B) −1 

= B −1 (I − 1 β uwT ) = B −1 − 1 β B−1 uv T B −1 . 

Die Formel (2.2.2) wird in der klassischen Tabellenform des Simplexverfahrens (Handrechnung) 

benutzt, da der Rechenaufwand bei O(m 2 ) arithmetischen Operationen (FLOP: FLoating 

point OPeration) liegt. Dies hat aber den Nachteil, dass sich bei größeren Problemen und insbesondere 

für kleine Werte β Rundungsfehler ansammeln. 

Für große (Computer-) Anwendungen greift man zur Lösung auf den Gauß-Algorithmus oder 

verwandte Methoden zurück. Auch dieser läßt sich so anpassen, dass geringfügige Änderungen 

der Matrix mit geringem Aufwand berücksichtigt werden können. Dazu ist es nützlich, die Zeilenumformungen 

im Gauß-Algorithmus als Matrixmultiplikation zu interpretieren. Mit z ∈ R m 

und A = (a ij ) ∈ R m×n betrachtet man 

⎛ 

⎞ 

⎛ 

1 

L j (z) := 

⎜ 

⎝ 

⎞ 

a 11 . . . a 1n 

. .. . 

. 

1 

−z j+1 1 

, L j (z)A = 

a j1 . . . a jn 

a j+1,1 − z j+1 a j1 . . . a j+1,n − z j+1 a . 

jn 

. . .. ⎟ 

⎜ 

⎟ 

⎠ 

⎝ . 

. ⎠ 

−z m 1 

a m1 − z m a j1 . . . a mn − z m a jn 

Die Matrix L j beschreibt also den Effekt einer vollständigen Elimination in Spalte j und läßt 

sich auch kompakt in der Form L j = I − ze T j schreiben. Wegen e T j z = 0 ist ihre Inverse nach 

(2.2.1) einfach L −1 

j 

= I + ze T j . Beim Gauß-Algorithmus werden der Reihe nach Umformungen 

A → L 1 A → L 2 L 1 A etc. angewendet, um die Matrix auf obere Dreieckgestalt (Stufenform) zu 

bringen. Da Produkte von unteren Dreieckmatrizen wieder solche Dreieckmatrizen sind, kann 

das Ergebnis des Gauß-Algorithmus folgendermaßen zusammengefaßt werden. 

Satz 2.2.2 Wenn der einfache Gauß-Algorithmus, der die Matrix A = A 1 ∈ R m×n , m ≤ n, mit 

Zeilenumformungen A j+1 = (a (j+1) 

ik 

) := L j (z (j) )A j , j = 1, . . . , m − 1, und 

z (j) = 1 

a (j) 

jj 

( 

0, . . . , 0, a (j) 

j+1,j , . . . , a(j) mj) T, 

(2.2.3)


in obere Dreieckgestalt R := A m überführt, durchführbar ist (a (j) 

jj 

≠ 0∀j), erzeugt er eine LR- 

Zerlegung der Matrix als Produkt einer unteren Dreieckmatrix L = L −1 

1 · · · L −1 

m−1 und einer 

oberen R = A m : 

⎛ 

⎞ ⎛ 

⎞ 

1 

r 11 r 12 . . . . . . . r 1n 

z (1) 

A = LR, L = 

2 1 

⎜ 

. 

⎝ . .. ⎟ 

⎠ , R = r 22 . . . . . . . r 2n 

⎜ . 

⎝ .. ⎟ . ⎠ . 

z m (1) . . . z m (m−1) 1 

r mm . r mn 

Die Berechnung der LR-Zerlegung hat einen Aufwand von i.w. (n − 1 3 m)m2 

Operationen, also 2 3 m3 FLOP für m = n. 

arithmetischen 

Im Satz wurde implizit vorausgesetzt, dass die Pivot-Elemente a (j) 

jj 

= r jj, durch welche dividiert 

wird, von Null verschieden sind. Bei einer Rechnung mit Maschinenzahlen endlicher Genauigkeit 

muß aber nicht nur der Fall a (j) 

jj 

= 0 durch Zeilenvertauschungen vermieden werden, sondern 

∼ = 0. Sonst zeigen sich die gleichen Probleme wie 

auch die Verwendung kleiner Pivot-Werte a (j) 

jj 

bei Verwendung der Rang-1-Formel (2.2.2). Daher bringt man durch Vertauschungen möglichst 

große Elemente in die Hauptdiagonale (s.u.). 

Durch Berechnung einer LR-Zerlegung wird die Berechnung der Inversen absolut überflüssig. 

Denn mit der Zerlegung kostet die Auflösung eines quadratischen linearen Gleichungssystem 

Bx = c nur noch den Aufwand der Lösung von zwei gestaffelten (Dreieck-) Systemen: 

x = B −1 c = R −1 L −1 c ⇐⇒ Ly = c, Rx = y. 

Außerdem kann diese Auflösung ohne Zusatzvariable (am Platz) durchgeführt werden. Die folgenden 

Anweisungen überschreiben die rechte Seite c = (c i ) zunächst mit der Zwischenlösung 

y, dann mit der Gesamtlösung x: 

löst Rx = c, c := x 

löst Ly = c, c := y 

für i = m abwärts bis 1 { 

für i = 2 bis m { 

für j = i + 1 bis m {c i := c i − r ij c j ;} 

für j = 1 bis i − 1 { c i := c i − l ij c j ;} 

c i := c i /r ii ; 

} 

} 

Der Rechenaufwand beträgt pro Teilsystem i.w. m 2 Operationen. Damit ist der Gesamtaufwand 

zur Lösung von Bx = LRx = c mit 2m 2 Operationen nicht höher als die reine Multiplikation 

B −1 c, jeweils für jede neue rechte Seite c. 

Zeilenvertauschungen bei einer m × n-Matrix A können formal mit Hilfe einer Permutationsmatrix 

P ∈ B m×m dargestellt werden. So wird etwa mit einer Permutation π die entsprechende 

Umordnung der Zeilen in A = (a ij ) folgendermaßen bewirkt (δ: Kronecker-Symbol): 

( ) m 

A ′ = (a ′ kj ) = (a π(i),j) ⇐⇒ A ′ = P A, P = δ π(i),j . 

i,j=1 

Permutationsmatrizen entstehen durch Vertauschungen bei der Einheitsmatrix und sind unitär, 

die Transponierte P T = P −1 bewirkt die inverse Permutation. In der praktischen Realisierung 

bestimmt man im Gaußalgorithmus vor Elimination der j-ten Spalte das betragsmaximale


Element unterhalb von a jj und tauscht dessen Zeile mit der j-ten. Dann ist a (j) 

jj 

in (2.2.3) betragsmaximal 

und alle Elemente von L daher im Betrag kleiner gleich eins. Die Permutationen 

protokolliert man am Besten in einem Indexfeld P[1..m], in dem man alle Zeilenvertauschungen 

der Matrix A synchron durchführt. Der obige Satz 2.2.2 kann damit in folgender Weise verallgemeinert 

werden: 

Für jede reguläre Matrix A ∈ R m×m 

Zerlegung P A = LR existiert. 

gibt es eine Permutationsmatrix P so, dass die LR- 

Beispiel 2.2.3 Die folgende Matrix A besitzt offensichtlich keine LR-Zerlegung, da schon das 

erste Pivotelement verschwindet, 

⎛ ⎞ 

⎛ ⎞ 

0 1 2 

0 0 1 

⎜ ⎟ 

⎜ ⎟ 

A = ⎝1 0 1⎠ . Mit P = ⎝1 0 0⎠ 

2 1 1 

0 1 0 

gilt aber 

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 

2 1 1 1 0 0 2 1 1 

⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 

P A = ⎝0 1 2⎠ = ⎝0 1 0⎠ 

⎝0 1 2⎠ = LR. 

1 

1 0 1 

2 

− 1 3 

2 

1 0 0 

2 

Bei der Elimination ist hier die Diagonale jeweils größer als die Elemente darunter, daher sind 

tatsächlich alle Beträge im L-Faktor nicht größer als eins. 

Anpassung der LR-Zerlegung Der Aufwand bei einem Gauß-Eliminationsschritt, also der 

”Multiplikation” mit einer Matrix L j (z (j) ) ist proportional zur Zahl der nichttrivialen Elemente 

von z (j) , also der Anzahl solcher Elemente in der j-ten Spalte von B j . Tauscht man in der 

(quadratischen) Matrix B mit B = LR wieder die Spalte s aus, C := B + ue T s , u = a − b s , 

tritt in L −1 C dort eine volle Spalte auf, deren Elimination (etwa bei s = 1) fast den vollen 

Aufwand einer Neuzerlegung verursacht. Denn bei Elimination in Spalte s füllt sich der vorher 

freie Bereich hinter dieser Spalte i.a. vollständig auf! Dies läßt sich dadurch vermeiden, dass 

man die neue Spalte a am Ende einfügt, und die Spalten s + 1 bis m nach vorne schiebt: 

⎛ 

⎞ 

⎛ 

⎞ 

b 1s 

a 1 

B = ⎜ 

⎝ . 

⎟ 

⎠ ↦→ C′ = ⎜ 

⎝ 

. 

⎟ 

⎠ 

a m 

b ms 

Der R-Faktor ändert sich dann folgendermaßen mit dem Vektor c := L −1 a am Ende: 

⎛ s ⎞ 

⎛ s ⎞ 

❅ 

❅ 

c 1 ❅ R = L −1 ❅ 

B = 

⎜ 

❅ 

↦→ L −1 C ′ = 

❅ . 

=: R ′ . 

⎟ 

⎜ ❅ ⎟ 

⎝ ❅ ⎠ 

⎝ ❅ 

⎠ 

❅ 

❅ c 

❅ 

❅ m 

Jetzt tritt ab Spalte s nur je ein Element unter der Diagonale auf, welches man mit Zeilenoperationen, 

die nur je eine Zeile betreffen (Aufwand O(m) pro Elimination!) eliminieren kann,


evtl. nach Zeilenvertauschung. Dabei wendet man die Umformungen gleichzeitig auf L und 

R ′ = L −1 C ′ an, um danach wieder eine gültige LR-Zerlegung von C ′ zu bekommen. Bei der 

Elimination von r ′ s+1,s mit L s(z) etwa hat z = ζe s+1 nur ein nichttriviales Element und durch 

( 

) ( 

C ′ = LR ′ = (LL −1 

s ) (L s R ′ ) = L(I + ζe s+1 e T s ) (I − ζe s+1 e T s )R ′) , 

wird beim R-Faktor nur die Zeile s + 1 geändert, beim L-Faktor nur die Spalte s. Daher ist der 

Gesamtaufwand für diese Anpassung der LR-Zerlegung in der Größenordnung O(m 2 ). 

2.3 Basen 

Bei der numerischen Durchführung der Optimierung geht man vom Programm (LP3) aus 

min{c T x : x ∈ X}, X := {x ∈ R n : Ax = b, x ≥ 0}, 

und betrachtet ohne Einschränkung den Fall A ∈ R m×n , Rang(A) = m < n. Denn für Rang(A) < 

m wäre der affine Unterraum U = {x : Ax = b} entweder leer, oder es könnten Gleichungen 

entfernt werden. 

Der zulässige Bereich X = {x : Ax = b, x ≥ 0} = U ∩R n + ist der Schnitt des affinen Unterraums 

U mit dem positiven Oktanten R n +. Da die Zielfunktion x ↦→ c T x linear ist, ist ihr Gradient c T 

konstant und daher gibt es keine inneren Extrema. Daher liegt das Optimum auf dem Rand von 

X = U ∩ R n + und somit auf dem Rand des Positivkegels R n +. Trivialerweise hat x ∈ X daher 

Komponenten, die entweder positiv oder null sind, letzteres insbesondere auf dem Rand von X. 

Daher sind zur Beschreibung folgende Bezeichnungen nützlich. Zu einem Punkt x ∈ R n sei 

J + (x) := {i : x i > 0}, J − (x) := {i : x i < 0}, J(x) := J − (x) ∪ J + (x) 

die Menge der (positiven, negativen bzw. aller) Stützindizes von x. Für x ≥ 0 ist J(x) = J + (x). 

In (LP3) kann man zu unterbestimmten Gleichungssystem für eine spezielle Lösung ¯x ∈ X 

einige Spalten von A ”auslassen”, denn mit J + (¯x) = {j 1 , . . . , j l } ⊆ N := {1, . . . , n} ist 

b = A¯x = a j1 ¯x j1 + a j2 ¯x j2 + . . . + a jl ¯x jl , l ≤ n. (2.3.1) 

Dies entspricht einem Gleichungssystem der Dimension m × l. Als Bezeichnung wird zur Indexmenge 

J = {j 1 , . . . , j l } ⊆ {1, . . . , n}, |J| = l, daher folgende Untermatrix von A eingeführt 

A J = (a j1 , . . . , a jl ) ∈ R m×l . 

Die analoge Bezeichnung (vgl. §2.1) für ausgewählte Zeilen L = {l 1 , . . . , l k } ⊆ {1, . . . , m} der 

Matrix ist 

⎛ 

a (l 1) T ⎞ 

A (L) = ⎜ 

⎝ . 

⎟ 

⎠ ∈ Rk×n . (2.3.2) 

a (l k) T


Wie in (2.3.1) werden damit die verschwindenden Komponenten von ¯x aus dem Gleichungssystem 

A¯x = b entfernt. Denn mit J := J(¯x) und dem Komplement K = N \ J gilt (etwa nach 

geeigneter Umordnung) A = (A J , A K ), ¯x T = (¯x T J , ¯xT K ) und 

( ) 

∑ 

b = A¯x = n ¯x J 

a j ¯x j = A J ¯x J + A K ¯x K = (A J , A K ) 

¯x K 

j=1 

J = J(¯x) ⇒ A J ¯x J = b, ¯x K = 0. 

(2.3.3) 

Dieser Umgang mit Indexmengen hat für die Optimierung eine fundamentale Bedeutung. Man 

stellt sich dabei vor, dass an jede Matrixspalte und x-Variable ihr Index angeheftet ist und sich 

in dem Produkt nur zusammenpassende Paare bilden. Umgekehrt berechnet man bei gegebener 

Indexmenge J aus der letzten Beziehung in (2.3.3) direkt eine spezielle Lösung von Ax = b, 

wenn die Untermatrix A J regulär ist, also insbesondere |J| = m gilt. Eine solche Lösung ist aber 

nicht unbedingt schon zulässig. 

Definition 2.3.1 a) Ein ¯x ∈ X heißt zulässige Basislösung, wenn Rang(A J(¯x) ) = |J(¯x)| ist. 

b) Zu J = {j 1 , . . . , j m } ⊆ {1, . . . , n} heißt A J Basis, wenn B := A J ∈ R m×m regulär ist, 

det(B) ≠ 0. Die Basis A J heißt zulässig, wenn A −1 

J 

b ≥ 0 gilt. 

Zu jeder Basis A J bekommt man über (2.3.3) die Basislösung ¯x T = (¯x T J , ¯xT K ) mit ¯x J := A −1 

J b, 

¯x K := 0, K = N \ J. Mit einer geeigneten Ergänzung des Systems (2.3.3) durch 

( ) ( ) ( ) 

A J A K ¯x J b 

= 

(2.3.4) 

0 I n−l ¯x K 0 

ist auch die ganze Basislösung ¯x Lösung eines regulären Systems. Mit l = |J(¯x)| hat dessen 

Gesamtmatrix Dimension (m + n − l) × n, ihr Rang ist Rang(A J ) + n − l und das System also 

eindeutig lösbar für Rang(A J ) = l. Für l < m ist das System (2.3.4) allerdings nicht quadratisch 

(überbestimmt). Man nennt dann ¯x eine ausgeartete Basislösung. Allgemein gilt 

Satz 2.3.2 Es sei ¯x ∈ X zulässige Basislösung. Dann besitzt ¯x höchstens m positive Komponenten, 

es gilt also |J(¯x)| ≤ m, und die Untermatrix A J(¯x) kann zu einer Basis A J ∈ R m×m , 

J ⊇ J(¯x), erweitert werden. 

Beweis Da Rang(A) = m ist und daher Rang(A J(¯x) ) = |J(¯x)| =: l ≤ m sein muss, hat ¯x höchstens 

l ≤ m positive Komponenten. Die Gesamtmatrix A besitzt maximalen Rang m, es existiert also eine 

Basis des R m aus Spalten von A. Nach dem Basis-Austauschsatz können daher die l linear unabhängigen 

Spalten von A J(¯x) zu einer vollen Basismatrix A J , mit |J| = m und J ⊇ J(¯x) ergänzt werden. 

Da die im Satz genannte Ergänzung nicht eindeutig ist, gehören zu einer ausgearteten Basislösung 

mehrere verschiedene Basen. Dies kann im demnächst behandelten Simplexverfahren 

zu Problemen führen (→ läuft im Kreis), da es nicht durch die Orte ¯x, sondern die zugehörigen 

Basen B gesteuert wird.


Der geometrische Hintergrund für die folgenden Überlegungen ist die Tatsache, dass die zulässige 

Menge X ein konvexes Polyeder ist und Basislösungen gerade den Ecken dieser Menge entsprechen. 

Diese Begriffe und Eigenschaften werden aber erst im Geometrie-Kapitel §3 genauer 

definiert. Eines der zentralen Ergebnisse dort besagt, dass man beim Linearen Programm nur 

Basislösungen untersuchen muß. 

Basisdarstellung von X: Zu jeder Basislösung ¯x von X gibt es eine Basis B = A J mit 

A J ¯x J = b, ¯x K = 0, J ∪ K = {1, . . . , n}. Aber nicht nur dieser spezielle Punkt ¯x, sondern jeder 

Punkt x ∈ X kann mit Hilfe dieser Basis dargestellt werden. Dazu wird analog zu (2.3.3) die 

Gesamtmatrix A = (A J , A K ) aufgeteilt und das Gleichungssystem Ax = b umgeformt. Da A −1 

J 

existiert, gilt nämlich für x ∈ U 

Ax = A J x J + A K x K = b ⇐⇒ x J = A −1 

J 

b − A−1 

J 

A Kx K = ¯x J − A −1 

J A Kx K . (2.3.5) 

Dies ist die aus der Linearen Algebra bekannte Parameterdarstellung des Lösungsraums U mit 

den Variablen x K ≥ 0 als ”freien” und den x J als ”abhängigen” Variablen und der speziellen 

Lösung ¯x. Nach Einführung von n − m = |K| echten Parametern λ K ≥ 0 heißt das also 

( ) ( ) ( ) 

x J ¯x J −A −1 

J 

Ax = b, x ≥ 0 ⇐⇒ x = = + 

A K 

λ K = ¯x − W K λ K ≥ 0. (2.3.6) 

x K 0 K I n−m 

Im letzten Schritt wurde die Abkürzung 

( ) ( ) 

A −1 

J 

A K W (J) 

) 

K 

=: 

−I n−m W (K) = W K = 

(w i,kj ∈ R n×(n−m) , K = {k 1 , . . . , k n−m }, 

K 

benutzt. Im Simplexverfahren spielt nur der Teil W (J) 

K 

, vgl. (2.3.2), eine Rolle und das hier 

gewählte Vorzeichen führt dort zu einfacheren Regeln. Die Spalten von W K sind wegen I n−m 

linear unabhängig und bilden eine Basis von kern(A). In 

x 3 ✻ 

einer Umgebung der Basislösung ¯x sieht die zulässige Menge 

✂ X also aus wie ein Kegel aus positiven Linearkombinationen 

✂ 

✂ ✂ der Vektoren −w j . Denn nach (2.3.6) gilt 

✂ 

✁ ✂ ✂ x − ¯x ∈ {− ∑ w j λ j : λ j ≥ 0} und x ∈ R n +. 

✁ X x2 

j∈K ✂ ✁ 

✁ 

✁✁☛ x 1 

✟ 

✟✂ 

✁ ¯x ✟✟✟✟✟✟ 

Im Bild befindet sich, von ¯x aus gesehen, der Bereich X ⊆ R 3 

in dem angegebenen Kegel, der allerdings an der gepunkteten 

Linie den Positivkegel R 3 + verläßt. 

Mit den Spalten von W können nun spezielle, von ¯x ausgehende Strahlen (Halbgeraden) in X 

beschrieben werden, bei denen genau eine K-Komponente positiv ist. Dazu wird zu festem l ∈ K 

und t ∈ R + der elementare Strahl 

x(t) := ¯x − tw l 

⇐⇒ 

{ 

x J (t) = ¯x J − tA −1 

J 

a l 

x k (t) = tδ kl , k ∈ K, 

(2.3.7)


betrachtet. Da der Vektor x(t) die Gestalt (2.3.6) hat, ist das System Ax(t) ≡ b erfüllt ∀t ∈ R. 

Für die Zugehörigkeit x(t) ! ∈ X muß nur noch das Vorzeichen x(t) ≥ 0 geprüft werden für Werte 

t = x l (t) ≥ 0. Außerdem interessiert natürlich, wie sich die Zielfunktion auf x(t) ändert. 

Durch Einsetzen der Basisdarstellung (2.3.5) in die Zielfunktion und Betrachtung der Vorzeichenbedingungen 

kann man wichtige Aussagen zur Bedeutung einer Basislösung machen. Denn 

mit einer Basislösung ¯x und zugehöriger Basis A J gilt für beliebige zulässige Punkte x ∈ X 

c T x = c T J x J + c T (2.3.5) 

Kx K = c T J (¯x J − A −1 

J 

A Kx K ) + c T 

( 

) 

Kx K 

= c T J ¯x J + c T K − c T J A −1 

J 

A K x K = } c{{ T¯x } + γKx T K . (2.3.8) 

} {{ } 

aktuelle ZF 

Änderung 

Damit wird das Verhalten der Zielfunktion in der Nähe von ¯x alleine durch die Nichtbasis- 

Variablen x K beschrieben. Da c T¯x der Zielwert in der aktuellen Ecke ist, beschreibt der n-Vektor 

γ T := c T − c T J A −1 

J A mit γT K = c T K − c T J A −1 

J A K = −c T W K (2.3.9) 

der sogenannten reduzierten Kosten die Änderung der Zielfunktion bei Vergrößerung der Nichtbasis- 

Variablen x K ≥ 0. Für die Basisindizes gilt offensichtlich γ T J = cT J − cT J A−1 J A J = 0 T . 

Satz 2.3.3 (Optimalität) Gegeben sei eine Basis A J mit Basislösung ¯x ∈ X. Wenn alle 

reduzierten Kosten nicht-negativ sind, γ ≥ 0, dann ist ¯x (Minimal-) Lösung von (LP3). 

Beweis Mit der Basisdarstellung (2.3.6) können alle Punkte x ∈ X erreicht werden. Damit gilt aber für 

die Zielfunktion nach (2.3.8) bei jedem beliebigen x ∈ X, dass 

also ist ¯x (eine) Lösung. 

c T x = c T J ¯x J + γ T Kx K = c T¯x + 

T 

γ K 

}{{} 

≥0 

x K 

}{{} 

≥0 

≥ c T¯x, 

Die Aussage bezieht sich auf eine gewählte Basis, für eine bestimmte Basislösung ¯x ist das 

Kriterium aber nur hinreichend, da zu einer ausgearteten Basislösung ¯x verschiedene Basen 

existieren können, die möglicherweise nicht alle das Optimalitätskriterium des Satzes erfüllen. 

Wenn also negative Kosten γ l < 0 existieren, kann die Zielfunktion evtl. noch verkleinert 

werden, indem man auf einem Strahl (2.3.7) entlangläuft. Wenn dieser allerdings als Ganzes in 

X liegt, kann die Zielfunktion beliebig klein werden und dann existiert keine Lösung für (LP3). 

Satz 2.3.4 (Unbeschränktheit) Gegeben sei eine Basis A J mit Basislösung ¯x ∈ X. Wenn 

für ein l ∈ K gilt γ l < 0 und w (J) 

l 

= A −1 

J 

a l ≤ 0, dann ist (LP3) unbeschränkt. 

Beweis Zu dem genannten l ∈ K mit γ l < 0 wird der Strahl (2.3.7) x(t) = ¯x − tw l ∈ U := {x : Ax = b} 

im Lösungsraum des LGS betrachtet. Für w (J) 

l 

≤ 0 gilt sogar für den Gesamtvektor −w l ≥ 0. Also ist 

x(t) = 

}{{} 

¯x +t (−w l ) ≥ 0 ∀t ≥ 0, 

} {{ } 

≥0 ≥0


wegen x(t) ∈ X ∀t ≥ 0 gibt es keine Einschränkung an t. Auf diesem Strahl fällt aber die Zielfunktion 

c T x(t) = c T J ¯x − tc T w l = c T J ¯x − t(c T Jw (J) 

l 

beliebig weit, das Problem ist unbeschränkt. 

− c l ) = c T J ¯x + t(c l − c T JA −1 

J 

a l) = c T J ¯x + t γ 

}{{} l → −∞ (t → ∞) 

0} = ¯x p 

w pl 

≥ 0. (2.3.10) 

Dieser Wert wurde gerade so bestimmt, dass eine Komponente x p (t l ) null wird, und deren Index 

p ∈ J ist einer, in dem das Minimum in (2.3.10) angenommen wird. Für eine nicht ausgeartete 

Basislösung ist ¯x J > 0 und daher t l > 0. Im neuen Punkt ist nun die Komponente x l (t l ) = t l > 0 

und mit x p (t l ) = 0 ändert sich die Stützmenge zu J(x(t l )) = J \ {p} ∪ {l}. In diesem Punkt 

liegt also ein Kandidat für eine neue Basis vor, deren Regularität aber zu prüfen ist. 

Satz 2.3.5 (Basiswechsel) Gegeben sei die Basis B = A J mit Basislösung ¯x ∈ X. Sei für 

l ∉ J : 

γ l = −c T w l = c l − c T J A −1 

J a l < 0 und J + (w l ) ≠ ∅. 

Mit einem Index p ∈ J, in dem das Minimum in (2.3.10) angenommen wird, bildet man die 

neue Menge J ′ := J \ {p} ∪ {l}. Dann ist B ′ = A J ′ neue Basis mit Basislösung x ′ = x(t l ), 

wobei x ′ J ′ = (B ′ ) −1 b ≥ 0, und neuem Zielfunktionswert c T x ′ ≤ c T¯x. Die Ungleichung gilt streng 

c T x ′ < c T¯x, wenn t l > 0 ist in (2.3.10). 

Beweis Das Hauptproblem ist die Regularität der Matrix B ′ . Es sei s die Position von a p in B und 

a p = Be s . Die neue Spalte a l werde bei B ′ an der Stelle s eingefügt, damit gilt also B ′ = B + (a l − a p )e T s 

und B ′ e s = a l . Die Bedingung zur Anwendung der Rang-1-Formel (2.2.2) ist erfüllt, da 

Denn die Zeile p von A −1 

J 

β = e T s B −1 a l = e T p A −1 

J a l = w pl > 0. 

steht bei B −1 in Zeile s, und w pl > 0 ist das Element, das den Wert t l in 

′ b kann ebenfalls mit 

(2.3.10) bestimmt. Also ist B ′ regulär. Die zu B ′ gehörige Basislösung x ′ = A −1 

J 

(2.2.2) bestimmt werden, es gilt mit A −1 

J 

a l = w (L) 

l 

und der Definiton von t l : 

x ′ l = eT s (B ′ ) −1 b = 1 β eT s B −1 b = 1 β ¯x p = t l , 

x ′ i = 

eT i A−1 J b − 1 β w il¯x p = ¯x i − t l w il , i ∈ J. 

Insbesondere gilt x ′ p = 0. Für die Zielfunktion im neuen Punkt x ′ erhält man demnach 

c T x ′ = c T¯x + t l (c l − ∑ i∈J 

c i w il ) = c T¯x + t l (−c T w l ) ≤ c T¯x. 

} {{ } 

γ l 0 (d.h. ¯x J > 0) tritt hier auch eine echte Änderung t l γ l < 0 auf.


2.4 Das revidierte Simplex-Verfahren 

In der Basislösung ¯x mit Basis A J sind am Vektor γ der reduzierten Kosten alle diejenigen 

Richtungen ablesbar, in denen die Zielfunktion fällt, nämlich alle x K ≥ 0 mit γK T x K < 0. Aus 

Effizienzgründen beschränkt man sich aber darauf, dass pro Schritt nur eine einzige Komponente 

x l , l ∈ K, des aktuellen Vektors ¯x K = 0 vergrößert wird und die Zielfunktion dabei nicht wächst. 

Man bewegt sich also nur auf einem elementaren Strahl (2.3.7). Daher besteht der Ablauf, 

ausgehend von einer zulässigen Startbasis A J , grob aus folgenden Schritten: 

1. Berechne ¯x J und γ K zu K = {1, . . . , n} \ J, 

2. suche γ l < 0, l ∈ K, 

3. wenn aber γ K ≥ 0, nach S. 2.3.3 : Optimum!, 

4. wenn w (J) 

l 

≤ 0, nach S. 2.3.4 : unbeschränkt! 

5. bestimme Minimalindex p, w pl > 0, in (2.3.10), 

6. Basiswechsel zu J := J \ {p} ∪ {l}. 

Die erforderlichen Berechnungen sollten möglichst effizient erfolgen. Benötigt werden dazu in 

jeder besuchten Basis die Größen 

γK T = c T K − (c T J A −1 

J )A K, w (J) 

l 

= A −1 

J a l, ¯x J = A −1 

J b. 

Wenn die Berechnung von γ K in der angegebenen Weise geklammert wird, mit y T := c T J A−1 J , 

kostet die Bestimmung der drei Lösungen 

y T A J = c T J , A J w (J) 

l 

= a l , A J ¯x J = b, 

bei vorhandener LR-Zerlegung A J = LR nur einen Aufwand von höchstens 6m 2 Operationen. 

Außerdem kann diese LR-Zerlegung mit der Technik aus §2.2 mit einem O(m 2 )-Aufwand zu 

einer Zerlegung von A J ′, J ′ = J \ {p} ∪ {l}, umgebaut werden. Die Dimension n > m geht nur 

bei γ K = c T K − yT A K in Schritt 2 ein, der Aufwand wäre hier 2m(n − m) Operationen, wenn alle 

Komponenten bestimmt würden. Man muss aber nur einen Teil der γ j berechnen, wenn man 

eines der ersten γ l < 0 akzeptiert. Das Vorgehen ergibt den 

Simplex-Algorithmus 

Eingabe: Zulässige Basis A J , J ⊆ {1, . . . , n} 

Schritt 1 x J := A −1 

J 

b, yT := c T J A−1 J 

, K := {1, . . . , n} \ J, 

2 suche γ l < 0 unter γ j := c j − y T a j , j ∈ K. 

3 wenn γ j ≥ 0 ∀j ∈ K: STOP, Optimum! 

4 w (J) 

l 

:= A −1 

J a l, wenn w il ≤ 0 ∀i ∈ J: STOP, unbeschränkt! 

5 

Bestimme p ∈ J: 

x p /w pl = min{x i /w il : w il > 0, i ∈ J} = t l 

6 J := J \ {p} ∪ {l}, weiter mit 1


Beispiel 2.4.1 Simplexverfahren mit m = 3, n = 6 bei (LP3) mit c T = (−9, −6, −7, 0, 0, 0), 

⎛ 

⎞ ⎛ ⎞ 

3 1 2 1 0 0 

20 

⎜ 

⎟ ⎜ ⎟ 

A = ⎝1 1 1 0 1 0⎠ , b = ⎝11⎠ . 

4 3 4 0 0 1 

40 

Das Problem ist aus einem (LP2) durch Einführung von Schlupfvariablen entstanden. Hier gehört 

zu J = {4, 5, 6} eine Startbasis A J = I 3 mit Basislösung ¯x J = b ≥ 0. Auftretende Simplex-Basen: 

⎛ ⎞ 

20 

⎜ ⎟ 

B-1 1. J = {4, 5, 6}, A J = I, ¯x J = ⎝11⎠, y T = 0 T , γK T = (γ 1, γ 2 , γ 3 ) = (−9, −6, −7). 

40 

⎛ ⎞ ⎛ ⎞ 

w 42 

1 

2+4. wähle l = 2: w (J) ⎜ ⎟ ⎜ ⎟ 

2 = ⎝w 52 ⎠ = Ia 2 = ⎝1⎠, 

w 62 3 

⎫ 

x 4 (t) = 20 − t ≥ 0 ⎪⎬ 

5. (2.3.10): x 5 (t) = 11 − t ≥ 0 

⎪⎭ ⇒ t 2 = 11, p = 5. 

x 6 (t) = 40 − 3t ≥ 0 

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 

1 1 0 

0 1 0 11 

⎜ ⎟ 

B-2 1. J = {2, 4, 6}, K = {1, 3, 5}, A J = ⎝1 0 0⎠, A −1 ⎜ ⎟ ⎜ ⎟ 

J 

= ⎝1 −1 0⎠, ¯x J = ⎝ 9 ⎠, 

3 0 1 

0 −3 1 

7 

⎛ ⎞ 

3 2 0 

y T = (c 2 , c 4 , c 6 )A −1 

J 

= (0, −6, 0), γK T = (c ⎜ ⎟ 

1, c 3 , c 5 ) − (0, −6, 0) ⎝1 1 1⎠ = (−3, −1, 6). 

4 4 0 

⎛ ⎞ 

⎛ ⎞ 

w 21 

1 

2+4. wähle l = 1: w (J) ⎜ ⎟ 

1 = ⎝w 41 ⎠ = A −1 

J a ⎜ ⎟ 

1 = ⎝2⎠, 

w 61 1 

⎫ 

x 2 (t) = 11 − t ≥ 0 ⎪⎬ 

5. (2.3.10): x 4 (t) = 9 − 2t ≥ 0 

⎪⎭ ⇒ t 1 = 9 2 , p = 4. ✛ 

Kontrolle: 

insbesondere 

ist x 1 = t 1 

x 6 (t) = 7 − t ≥ 0 

✡ 

✡ 

✡✢ 

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ vom Schritt vorher! 

3 1 0 

1 −1 0 

9 

⎜ ⎟ 

B-3 1. J = {1, 2, 6},A J = ⎝1 1 0⎠, A −1 

J 

= 1 ⎜ ⎟ 

2 ⎝−1 3 0⎠, ¯x J = 1 ⎜ ⎟ 

2 ⎝13⎠, 

4 3 1 

−1 −5 2 

5 

⎛ ⎞ 

2 1 0 

y T = (c 1 , c 2 , c 6 )A −1 

J 

= 1 2 (−3, −9, 0), γT K = (c 3, c 4 , c 5 )− 1 2 (−3, −9, 0) ⎜ ⎟ 

⎝1 0 1⎠ = ( 1 2 , 3 2 , 9 2 ). 

4 0 0 

3. γ K > 0, ¯x J > 0: eindeutiges Minimum!


Zwei offene Fragen zum Simplex-Algorithmus müssen noch genauer behandelt werden: 

— Bestimmung einer Start-Basis (Anlaufrechnung, vgl. §2.6) 

— Der Algorithmus ist endlich, wenn Basen nicht wiederholt auftreten. 

Das zentrale Ergebnis von Kapitel 3 wird der Dekompositionssatz sein, der eine endliche Darstellung 

des Polyeders X durch Ecken und Kanten garantiert. Dies sind auch die im Simplexverfahren 

verwendeten Größen und daher terminiert dieses in endlicher Zeit, wenn jede Basis nur 

einmal auftritt. Allerdings ist dies beim ”Kreisen” des Simplex-Verfahrens nicht gegeben, dort 

werden Basen zyklisch wiederholt ohne dass sich ¯x ändert. Dieses Problem tritt aber nur in ausgearteten 

Basislösungen auf, in normalen ¯x ∈ X mit |J(¯x)| = m gibt es beim Basiswechsel nach 

Satz 2.3.5 dagegen eine echte Abnahme der Zielfunktion, was eine Rückkehr zu ¯x ausschließt. 

Ausgeartete Basen treten eher selten auf (nicht-generischer Fall), wenn ¯x ”zufälligerweise” auf 

mehr als n − m Hyperebenen {x : a (i)T x = b i } bzw. {x : x j = 0} liegt. Vor allem bei Problemen 

mit (kleinen) ganzzahligen Koeffizienten ist dieser Fall aber nicht auszuschließen. Das Kreisen 

kann durch Zusatzmaßnahmen verhindert werden (§2.7). 

Gesamtaufwand des Simplex-Verfahrens Der einzelne Simplex-Schritt, der im Algorithmus 

formuliert wurde, ist zwar effizient durchführbar mit einem Aufwand von O ( m(m + n) ) Operationen. 

Der Gesamtaufwand hängt aber von der Anzahl der untersuchten Basen ab und kann 

durch Änderungen bei den Auswahlentscheidungen in Schritt 2 und 5 im Einzelfall verbessert 

werden. Unglücklicherweise fallen aber generelle Aussagen zur Anzahl der zu untersuchenden 

Basen eher negativ aus. 

Beispiel 2.4.2 (Klee-Minty) Zu n ∈ N, ɛ ∈ (0, 1 2 

) betrachte man 

min{−e T nx : x ∈ X}, 

X := {x : 0 ≤ x 1 ≤ 1, ɛx i ≤ x i+1 ≤ 1 − ɛx i , i = 1, . . . , n − 1}. 

Es läßt sich zeigen, dass das Polyeder X genau 2 n Ecken besitzt, und einen Simplexpfad, der alle 

besucht. Dieses Problem kann auch nicht durch verbesserte Auswahlstrategien umgangen werden, 

auch dafür gibt es meist Gegenbeispiele mit exponentiellem Aufwand. In der Praxis arbeitet 

das Simplexverfahren aber sehr effizient, bei genügend allgemeiner Verteilung der Restriktionen 

ist beim Problem (LP1) im Mittel mit O( n−1√ m · n 3 ) Schritten zu rechnen. 

2.5 Tabellenform des Simplex-Verfahrens 

Beim revidierten Simplexverfahren werden nur die für die Durchführung der einzelnen Schritte 

erforderlichen Größen berechnet. Der zugehörige Verwaltungsaufwand (Indexmenge J) ist nur 

gering, für Handrechnung aber irritierend. In der älteren Tabellenform des Simplexverfahrens 

wird immer das gesamte System umgeformt und notiert in der ursprünglichen Reihenfolge der 

Spalten, H = . A −1 

J 

A. Der Punkt deutet dabei die unterschiedliche Indizierung der Zeilen bei H 

und A −1 

J 

A an. Dieses System Hx = . A −1 

J 

Ax = A−1 

J 

b = ¯x J wird außerdem ergänzt durch die 

aktuelle Zielfunktion ω = c T¯x, den gesamten Kostenvektor γ T = c T − c T J A−1 A und als Tableau 

J


geschrieben in der Form 

( 

−c T¯x 

) ( 

c T − c T J A−1 J 

A −ω 

J A = 

¯x J 

A −1 

J b A−1 

γ T 

H 

) 

=: ¯H 

) m,n 

= 

(h ij . (2.5.1) 

i,j=0 

Die zusätzlichen Daten werden also als nullte Zeile und Spalte des Tableaus geführt. Wegen H J 

. = 

A −1 

J A J = I stehen in den Spalten zu Basisindizes j ∈ J die Einheitsvektoren, dort gilt γ j = 0 

und He j ∈ {e 1 , . . . , e m } ⊆ R m . Zur Vereinfachung der folgenden Regeln wird zur Indizierung der 

Zeilen von H die Position i und nicht der Basisindex j i aus J = {j 1 , . . . , j m } verwendet, da die 

entsprechende Zuordnung der Zeilen wechselt. Die Zuordnung der Komponenten aus der nullten 

Spalte (h i0 ) = ¯x J (Steuerspalte) wird durch die Position der Einheitsvektoren hergestellt, es gilt 

h i0 = x ji und e i steht in Spalte j i von H. In der nullten Steuerzeile stehen die reduzierten Kosten 

h 0j = γ j , j ≥ 1. Der aktuelle Zielfunktionswert wird negativ in h 00 = −c T J ¯x J notiert, dann gilt 

mit c 0 := 0 in der nullten Zeile die einheitliche Vorschrift h 0j = c j − ∑ i c j i 

h ij , j = 0, . . . , n. 

Die Anordnung hat den Vorteil, dass jetzt ein Basiswechsel zu dem Tableau, welches zur 

neuen Basis A J ′ mit J ′ = J \ {p} ∪ {l} gehört, durch Anwendung der Rang-1-Formel (2.2.2) 

auf das Gesamttableau ¯H durchgeführt werden kann. Für p = j s entspricht das ”Pivot-Element” 

h sl = w pl aus (2.3.10). Die Formeln für den Basiswechsel lauten einheitlich für alle Daten: 

h ′ sj = h ⎫ 

sj 

, 

⎬ 

h sl 

h ′ ij = h ij − h il h ′ sj , i ∈ {0, . . . , m} \ {s} ⎭ 

j = 0, . . . , n. (2.5.2) 

In der zweiten Zeile, für i ≠ s, wurde insbesondere zur Vereinfachung berücksichtigt, dass bei 

der Korrektur die auftretenden Quotienten h sj /h sl = h ′ sj 

schon in Zeile s berechnet wurden. 

Satz 2.5.1 Es sei ¯H das Simplex-Tableau (2.5.1) zur zulässigen Basis A J . Dann wird der Übergang 

zum Tableau ¯H ′ , das zur Basis A ′ J mit J ′ = J \ {j s } ∪ {l}, h sl ≠ 0, gehört, durch (2.5.2) 

hergestellt. 

Beweis Das Tableau zur Basis B = . A J ist die Matrix H = . B −1 A. Durch Austausch in Spalte s wechselt 

. 

die Basis zu A J ′ = B ′ = B + ue T s mit p = j s und u = a l − a p und B −1 u = h l − e s . Zur Berechnung des 

neuen Tableaus dient Satz 2.2.1, dabei ist β = 1 + e T s B −1 u = 1 + e T s (h l − e s ) = h sl und es gilt 

H ′ = (B ′ ) −1 A = B −1 A − 1 β B−1 u e T s B −1 A 

} {{ } = H − 1 β (h l − e s )h (s)T 

Zeilenweise bedeutet dies wie in (2.2.2) 

e T i H ′ = 

{ 1 

Insbesondere gilt die Formel sinngemäß auch für 

¯x J ′ 

h sl 

e T s H, ✟ ✟ ( ❄ 

) i = s, 

e T i H − h 1 

il h sl 

e T s H , i ≠ s. 

. 

= h ′ 0 = (B ′ ) −1 b = B −1 b − 1 β B−1 u e T s B −1 b 

} {{ } = h 0 − 1 β (h l − e s )h s0 = h 0 − (h l − e s )h ′ s0. 

Beim Kostenvektor (Steuerzeile) ist zu beachten, dass die Zeilennummern ∈ {1, . . . , m} von H die Indexposition 

in der Liste J = {j 1 , . . . , j m } angeben. Daher sei ˜c T = (˜c 1 , . . . , ˜c m ) . = (c j1 , . . . , c jm ) = c T J . Damit


ist dann h (0)T = γ T = c T − c T J A−1 J 

A = cT − ˜c T H. Beim Basiswechsel ändert sich ˜c ′T = ˜c T + (c l − c p )e T s 

und führt zum neuen Kostenvektor 

γ ′ T 

= c T − ˜c ′T H ′ = c T − (˜c T + (c l − c p )e T s )H ′ 

= c T − ˜c T( H − 1 β (h l − e s )h (s)T ) 

− (cl − c p )e T s H ′ 

= c T − ˜c T H +˜c 

} {{ } 

T (h l − e s ) 1 β h(s)T − (c l − c p ) 1 β h(s)T 

γ T 

= γ T − ( c l − c p + c p − ˜c T ) 1 

( 

) s 

h l 

} {{ } β h(s)T = h 0j − h 0l h ′ sj . 

j=1 

γ l 

Wegen ˜c s = c js = c p ist der geklammerte Ausdruck gerade γ l = h 0l . Der Wert −c T J ′x J ′ = −˜c ′T h ′ 0 ist ein 

Spezialfall davon. 

Damit läßt sich das Tableau-Verfahren angeben (Schritte wie in §2.4). Die Formulierung nimmt 

dabei keinerlei Bezug auf die Bedeutung der Zeilenindizes. 

Eingabe: 

Zulässiges Tableau ¯H 

2 suche h 0l < 0, 1 ≤ l ≤ n, 

Simplex-Tableau-Verfahren 

3 wenn h 0j ≥ 0 ∀1 ≤ j ≤ n: STOP, Optimum! 

4 wenn h il ≤ 0 ∀1 ≤ i ≤ m: STOP, unbeschränkt! 

5 

Bestimme s: 

h s0 /h sl = min{h i0 /h il : h il > 0, 1 ≤ i ≤ m} 

6 Basiswechsel nach (2.5.2), weiter mit 2 

Beispiel 2.5.2 Mit dem Ablauf aus Beispiel 2.4.1.1 bekommt man beim Tableauverfahren 

folgende Tabellen. In den Steuer-Zeilen und -Spalten ist jeweils das ausgewählte Element h 0l = γ l 

bzw. h 0s = ¯x p , p = j s , unterstrichen, außerdem wurde das Pivotelement für den Basiswechsel 

eingerahmt. Unter den Tabellen ist die Position der Basisindizes angegeben. Das erste Tableau 

ist zulässig, das dritte Tableau optimal, da keine negativen Kosten mehr auftreten. 

0 −9 −6 −7 0 0 0 

→ 

20 3 1 2 1 0 0 

11 1 1 1 0 1 0 

J : j 1 j 2 j 3 

40 4 3 4 0 0 1 

66 −3 0 −1 0 6 0 

→ 

9 2 0 1 1 −1 0 

11 1 1 1 0 1 0 

j 2 j 1 j 3 

7 1 0 1 0 −3 1 

159 

1 3 9 

2 

0 0 

2 2 2 

0 

9 

1 1 

2 

1 0 

2 2 

− 1 2 

0 

13 

1 

2 

0 1 

2 

− 1 3 

2 2 

0 

5 

1 

2 

0 0 

2 

− 1 2 

− 5 2 

1 

j 1 j 2 j 3 

Das Tabellenverfahren hat (für Handrechnung) den vordergründigen Vorteil, dass der Basiswechsel 

mit einer einheitlichen Vorschrift für alle Daten des Linearen Programms durchgeführt 

werden kann. Für große Probleme ist aber ein wesentlicher Nachteil, dass immer wieder die ganze 

Matrix umgeformt (und damit zerstört) wird und sich die Pivotwahl nicht nach der Größe von 

h sl richtet. Insbesondere können kleine Pivotwerte h sl 

∼ = 0 zu großen Rundungsfehlern führen 

und die Fehler der Schritte summieren sich in H. Außerdem ist der Aufwand für einen Schritt 

immer (2m + 1)(n + 1) Operationen.


Beispiel 2.5.3 (Rechner-Demo) In dem gezeigten 

Transportnetz soll ein Produkt von den Produzenten 

F und G zu den Abnehmern C,D,E geliefert 

werden, die Knoten A und B sind nur Umschlagplätze 

mit Bedarf 0. Transporte verlaufen längs der 

numerierten Kanten j in der angezeigten Richtung 

(Menge x j ≥ 0). Das zugehörige (LP3) ist in der 

folgenden Tabelle beschrieben, die Transportkosten 

der Kanten in der nullten Zeile, der Bedarf in den 

Knoten in der nullten Spalte. Die Kosten sollen minimiert 

werden. Die Restriktionen sind Bilanzgleichungen 

in den einzelnen Knoten, die Differenz aller 

eingehenden und ausgehenden Mengen entspricht 

dem Bedarf des Knotens. Die Zeile zu Knoten G 

fehlt, da sie redundant ist (Bedarf=−15), die Summe aller Zeilen der Gesamtmatrix ist null. 

53 18 29 8 60 28 37 5 44 38 98 14 23 59 

A : 0 −1 −1 −1 1 1 

B : 0 −1 −1 −1 −1 1 1 

C : 6 1 1 1 

D : 10 1 1 1 

E : 8 1 1 −1 1 

F : −9 −1 −1 −1 −1 

2.6 Anlaufrechnung 

Das Simplexverfahren setzt die Kenntnis einer zulässigen Startbasis voraus. Eine Startbasis 

konstruiert man durch Betrachtung von erweiterten Hilfsproblemen, welche die gleichen Restriktionen, 

aber eine andere Zielfunktion verwenden. 

Zwei-Phasen-Methode 

Diese basiert auf der Beobachtung, dass man beim Übergang von einem Problem (LP2) mit 

b ≤ 0 zur Form (LP3) durch Einführung von Schlupfvariablen Ax − y = b direkt eine Startbasis 

mit zulässiger Basislösung ¯x = 0, ȳ = −b ≥ 0 angeben kann (vgl. Beispiel 2.4.1). Diese Kenntnis 

nutzt man beim Problem (LP3) 

min{c T x : Ax = b, x ≥ 0}, 

b ≥ 0 (oBdA), 

und führt dort künstliche Schlupfvariable ein. Da b die rechte Seite eines Gleichungssystems 

ist, ist die Vorzeichenbedingung an die b i keine Einschränkung. Zu (LP3) wird demnach mit


1l = (1, . . . , 1) T ∈ R m das Hilfsproblem (Phase I) 

min 1l T y : Ax + y = b, x ≥ 0, y ≥ 0, (2.6.1) 

mit der Matrix D := (A, I m ) ∈ R m×(n+m) betrachtet. Die Variablen können zu einem Vektor 

z T = (x T , y T ) zusammengefaßt werden. Mit J = {n + 1, . . . , n + m} ist D J = I m eine Basis 

und die Basislösung ¯z J = ȳ = b ≥ 0 zulässig. Die neue Zielfunktion 1l T y = ∑ m 

i=1 y i ≥ 0 ist 

eine Straffunktion, sie bestraft die künstlichen Schlupfvariablen und ist nach unten durch null 

beschränkt, das Hilfsproblem also lösbar. Mit der Lösung ẑ T = (ˆx T , ŷ T ), die das Verfahren mit 

der Indexmenge J ⊆ {1, . . . , n + m} bestimmt, gilt die 

Fallunterscheidung: 

a) ŷ ≠ 0: Das Ausgangsproblem (LP3) ist inkonsistent. 

b) ŷ = 0: ˆx ist zulässig bei (LP3), dabei 

b1) J ⊆ {1, . . . , n}: A J bildet eine zulässige Basis für (LP3). 

b2) J ⊈ {1, . . . , n}: P := J ∩ {n + 1, . . . , n + m} ≠ ∅, die Lösung ẑ ist ausgeartet. Für 

p = j s ∈ P ist ẑ p = ŷ p−n = h s0 = 0 und ein Austauschschritt mit einem beliebigen 

Pivot h sl = w pl ≠ 0, l ∈ {1, . . . , n} \ J ändert wegen t l = 0 nicht die Basislösung 

ẑ, verkleinert aber P . Wenn bei P ≠ ∅ kein Austausch mehr möglich ist, gilt also 

h sj = w pj = 0, j = 1, . . . , n und die Matrix D −1 A hat eine Nullzeile, A also einen 

J 

Rangdefekt. Dann kann Zeile p − n (zur Schlupfvariable z p ) aus A entfernt werden. 

Im Fall b) kann die Rechnung mit dem Simplex-Verfahren aus §2.4 fortgesetzt werden, für das 

Tabellenverfahren aus §2.5 ist dazu die Steuerzeile aus c neu zu berechnen. Die Neuberechnung 

im Tabellenverfahren läßt sich umgehen, indem man zusätzlich zur der Steuerzeile h (0)T = 

(−1l T A, 0 T ) für das Hilfsproblem (2.6.1) die zusätzliche Zeile h (−1)T = (c T , 0 T ) mitführt und 

umformt. Nach Beendigung von Phase I ersetzt man dann h (0)T durch h (−1)T . 

Wenn das Ausgangsproblem (LP3) selbst schon Schlupfvariable enthält in einigen Gleichungen, 

muß an dieser Stelle evtl. nicht noch eine weitere eingeführt werden. → 

Groß-M-Methode 

Das Umschalten von Phase I auf Phase II (Originalproblem) erspart man sich, wenn man in 

(2.6.1) die gemischte Zielfunktion 

c T x + M1l T y = (c T , M1l T )z 

mit einer ”genügend großen” Konstanten M betrachtet. Diese muß die künstlichen Variablen 

y so stark bestrafen, dass sie im Optimum nicht mehr auftreten. Allerdings ist eine geeignete 

Wahl von M nicht einfach zu treffen, insbesondere, wenn (LP3) inkonsistent ist. 

Wenn allerdings ursprünglich das Problem (LP2) mit b ≰ 0 vorliegt, hat die Methode den 

Vorteil, dass nur eine Zusatzvariable benötigt wird. Dazu sei b q = max{b i : 1 ≤ i ≤ m} > 0. 

Im erweiterten System Ax − y = b subtrahiert man nun jede Zeile von der Zeile q, ihre rechte


Seite b q − b i wird dadurch nichtnegativ. Die Zeile q selbst bleibt unverändert, bekommt aber 

eine zusätzliche Variable y m+1 ≥ 0. Damit ergibt sich das Problem 

min c T x +My m+1 

n∑ 

(a qj − a ij )x j −y q +y i = b q − b i ≥ 0, i ≠ q, 

j=1 

n∑ 

a qj x j −y q +y m+1 = b q > 0, 

j=1 

x j ≥ 0, y i , y q , y m+1 ≥ 0 

(2.6.2) 

Die Matrix mit den Spalten zu den Indizes J = {n+1, . . . , n+m+1}\{n+q} bildet eine zulässige 

Basis aus Einheitsvektoren mit Basislösung ¯x = 0, ȳ q = 0, ȳ i = b q −b i ≥ 0 (i ≠ q), ȳ m+1 = b q > 0. 

Wenn dann im Optimum (ˆx T , ŷ T ) die Zusatzvariable verschwindet, ŷ m+1 = 0, hat man natürlich 

auch eine Lösung des Ausgangsproblems gefunden. Im umgekehrten Fall ist allerdings nicht 

klar, ob nur M zu klein gewählt wurde, oder ob das Ausgangsproblem inkonsistent ist. Die 

Zwei-Phasen-Methode bietet hier eine verläßlichere Entscheidung. 

Beispiel 2.6.1 Beim folgenden Problem (LP2), einschließlich Schlupfvariablen, 

min 2x 1 −3x 2 

−2x 1 +3x 2 −y 1 = 5 

−x 1 +2x 2 −y 2 = 2 

−x 1 −2x 2 −y 3 = −6 

tritt das größte Element von b in der ersten Zeile auf. Subtraktion der übrigen Zeilen von der 

ersten und Einführung der Zusatzvariablen y 4 führt auf das folgende zulässige Tableau ¯H. Die 

Kosten für die Steuerzeile sind γ T = (c T , 0 T , M) − Me T q H, es wird also das M-fache der q-ten 

Gesamtzeile vom Zielvektor subtrahiert. Das M in der letzten Spalte hebt sich dabei auf. 

−5M 2 + 2M −3 − 3M M 0 0 0 

5 −2 3 −1 0 0 1 

3 −1 1 −1 1 0 0 

11 −1 5 −1 0 1 0 

→ 

5 0 0 −1 0 0 M + 1 

5/3 −2/3 1 −1/3 0 0 1/3 

4/3 −1/3 0 −2/3 1 0 −1/3 

8/3 7/3 0 2/3 0 1 −5/3 

Der Wert von M ≥ 0 wurde nicht festgelegt, er war hier unwichtig. Nach einem Schritt ist die 

Zusatzvariable eliminiert und das Verfahren läßt sich mit der verkleinerten Tabelle fortsetzen. 

2.7 Ausgeartete Ecken und praktische Aspekte 

Die Steuerung beim Simplexverfahren erfolgt allein über die (Indexmenge der) Basen. Da zu einer 

ausgearteten Basislösung verschiedene Basen gehören, kann es vorkommen, dass das Verfahren 

zwar die Basis wechselt, aber in der gleichen Basislösung verharrt. Dann besteht auch die Gefahr, 

dass das Verfahren (bei unveränderter Pivotwahl) zu einer früheren Basis zurückkehrt und 

dann in dieser Schleife gefangen bleibt (”Kreisen” beim Simplexverfahren). Dieses Problem kann 

insbesondere bei Restriktionen mit kleinen ganzzahligen Koeffizienten wie im Beispiel 2.5.2 auftreten. 

Im Verfahren sind ausgeartete Ecken daran zu erkennen, dass das Minimum in Schritt 5


bzw. (2.3.10), das die maximal mögliche Schrittweite 

t l = min{ ¯x i 

w il 

: i ∈ J, w il > 0} 

bestimmt, gleichzeitig in mehreren Indizes p 1 , p 2 , . . . angenommen wird. Dann gilt also x p1 (t l ) = 

x p2 (t l ) = . . . = 0 und x(t l ) ist wegen |J(x(t l ))| < m also ausgeartet. Eine einfache Abhilfe gegen 

das Kreisen besteht darin, dass man die Auswahl unter diesen Indizes durch Zusatzregeln wieder 

eindeutig macht. In der Literatur gibt es dazu unterschiedliche Strategien. 

Die folgenden kleinste Index -Regeln wählen jeweils den in Frage kommenden kleinsten Original- 

Index (Komponentenindex im R n ) und verhindert dadurch ein Kreisen. Die Schritte 2 und 5 

des Simplexverfahrens aus §2.4 sind dazu so zu präzisieren: 

2 bestimme l ∈ K : l = min{j ∈ K : γ j < 0} 

5 bestimme p ∈ J : p = min{i ∈ J : ¯x i /w il = t l } 

(2.7.1) 

Die Durchführung dieser Regel erfordert beim Tabellenverfahren und auch beim revidierten Verfahren 

(abhängig von der Indexverwaltung dort) einen geringen Organisationsaufwand (Index- 

Sortierung), da die zugehörigen Daten im Verfahren oft den Platz wechseln. 

Das Simplexverfahren basiert darauf, dass an mehreren Stellen eine Auswahl anhand des 

Vorzeichens berechneter Daten, etwa der Kosten γ K getroffen wird. Leider treten aber bei der 

Durchführung im Rechner Rundungsfehler auf und daher kann statt exakter Kosten γ j = 0 ein 

berechneter Wert ˜γ j < 0, ˜γ j 

∼ = 0 auftreten. In der Praxis müssen daher die Entscheidungen 

in (2.7.1) durch eine sorgfältig gewählte Toleranz ɛ ( ∼ = Rechengenauigkeit 10 −15 ) modifiziert 

werden: min{j ∈ K : γ j < −ɛ}. Analog ist bei der Bestimmung von p vorzugehen, es ist der 

minimale Index mit ¯x i /w il ≤ t l + ɛ zu verwenden. 

Bei sehr kritischen Anwendungen kann man versuchen, Rundungsfehler ganz zu vermeiden. 

Ein Gleichungssystem mit rationalen Koeffizienten kann durch Erweiterung ganzzahlig gemacht 

werden und die Gauß-Elimination kann dann divisionsfrei ganzzahlig durchgeführt werden. Die 

dann auftretenden Koeffizienten können allerdings eine erhebliche Größenordnung annehmen. 

Damit ist die Standardmethode zur Lösung von Linearen Programmen behandelt. Im Folgenden 

muß aber die Arbeitsgrundlage des Verfahrens, der Dekompositionssatz für Polyeder, 

noch erarbeitet werden. Außerdem werden weitere Eigenschaften von Ungleichungssystemen behandelt, 

etwa Lösbarkeits-Kriterien, die auf eine schlagkräftige Theorie über duale Programme 

führt. Damit werden strategische Diskussionen zu gestellten Optimierungsaufgaben möglich wie 

die, durch gezielte Änderungen bei einem gegebenen Problem eine zusätzliche Verkleinerung des 

Optimalwerts zu bewirken. Mit einem dualen Simplexverfahren lassen sich solche Änderungen 

auch effizient umsetzen.

3 KONVEXE GEOMETRIE 28 

3 Konvexe Geometrie 

Mit dem Simplex-Verfahren kann für jedes einzelne Programm (LP) eine Lösung berechnet werden 

oder es wird die Unlösbarkeit festgestellt. Die theoretische Grundlage für diese Behauptung 

ist aber noch offen, die geometrische Struktur der zulässigen Menge X muss geklärt werden, 

denn auf ihrem Rand liegen die Maxima der linearen Zielfunktion. Die zentrale Aussage für 

Polyeder wie X lautet, dass tatsächlich nur endlich viele Punkte bzw. Richtungen von X zu 

prüfen sind. 

3.1 Spezielle Teilmengen 

Die zulässigen Bereiche von (LP∗) lassen sich als Durchschnitte einfacher Gebilde darstellen. 

Jeder (n − 1)-dimensionale affine Unterraum H ⊆ R n ist eine Hyperebene. Sie kann durch eine 

einzelne lineare Gleichung charakterisiert werden 

H = {x : a T (x − y) = 0} = {x : a T x = α}, a ≠ 0, y ∈ H, α = a T y, (3.1.1) 

wobei a der (bis auf Skalierung eindeutige) Normalenvektor von H ist und y ∈ H beliebig. 

Kompaktschreibweise H = H(a, y) = H(a, α). Modifikationen der Darstellung H(a, α) führen 

auf die offenen Halbräume 

❆ H 

❆ H + (a, α) := {x : a T x > α}, 

❆ 

❆ 

H − (a, α) := {x : a T (3.1.2) 

x < α}. 

❆ 

❆ ✟ ✟✟✯ a 

❆ 

Die Zerlegung R n = H − ∪H ∪H + ist damit disjunkt. Die entsprechenden 

abgeschlossenen Halbräume sind H ⊕ := H + ∪ H, H ⊖ := H − ∪ H. 

❆ 

H − 

❆ 

H + 

❆ Jeder r-dimensionale affine Unterraum, r < n, ist Durchschnitt von 

❆ n − r Hyperebenen. 

Zu einer beliebigen Menge M ⊆ R n , M ≠ ∅, wird die affine Hülle aff(M) definiert als 

kleinster affiner Unterraum U ⊆ R n mit M ⊆ U, also 

aff(M) = ⋂ 

U (U ⊆ R n affiner Unterraum) (3.1.3) 

= { 

U⊇M 

k∑ 

λ i x (i) : x (i) ∈ M, λ i ∈ R, 

i=1 

k∑ 

λ i = 1, k ∈ N}. (3.1.4) 

Außerdem wird die (affine) Dimension dim M = dim aff(M) gesetzt. Umgekehrt ist der größte, 

bei jeder Verschiebung, in M ”passende” (lineare) Unterraum der Linealraum L(M) von M: 

i=1 

x + L(M) ⊆ M ∀x ∈ M. (3.1.5) 

Für 0 ∈ M ist offensichtlich L(M) ⊆ M, für beschränktes M ist L(M) = {0} trivial. 

Beispiel 3.1.1 Für eine Hyperebene H = H(a, α) ⊆ R n , a ≠ 0, ist dim H = n − 1 und für 

α ≠ 0, ist aff(H ∪ {0}) = R n und L(H) = H(a, 0).


Die beiden Darstellungen (3.1.3,3.1.4) können als Charakterisierungen der affinen Hülle von 

”außen” bzw. ”innen” gesehen werden, wobei die zweite affine Kombinationen von Vektoren 

verwendet. Da unterschiedliche Arten von Linearkombinationen auch im folgenden auftreten, 

werden sie gemeinsam eingeführt. 

Definition 3.1.2 Zu Vektoren x (1) , . . . , x (k) heißt die Linearkombination z := 

λ i ∈ R eine 

— positive Kombination für λ i > 0, i = 1, . . . , k, 

— konische Kombination für λ i ≥ 0, i = 1, . . . , k, 

k∑ 

— affine Kombination für λ i = 1, 

— konvexe Kombination für 

i=1 

k∑ 

λ i = 1, λ i ≥ 0, i = 1, . . . , k. 

i=1 

k ∑ 

i=1 

λ i x (i) mit 

Die k + 1 Punkte x (0) , . . . , x (k) ∈ R n heißen affin linear unabhängig bzw. in allgemeiner 

Lage, wenn die k Differenzen x (1) − x (0) , . . . , x (k) − x (0) linear unabhängig sind. Andernfalls 

sind x (0) , . . . , x (k) affin linear abhängig, was äquivalent zur Existenz eines nichttrivialen Tupels 

(λ 0 , . . . , λ k ) ≠ 0 ist mit 

k∑ 

k∑ 

λ i = 0, λ i x (i) = 0. (3.1.6) 

i=0 

i=0 

3.2 Konvexe Mengen 

Definition 3.2.1 Eine Menge M ⊆ R n heißt konvex, wenn 

[x, y] := {λx + (1 − λ)y : 0 ≤ λ ≤ 1} ⊆ M ∀x, y ∈ M. 

Zu jedem Paar von Punkten x, y ∈ M liegt hier die ganze Verbindungsstrecke 

[x, y] in M. Die ”offene” Strecke wird mit (x, y) = {λx + (1 − λ)y : 0 < λ < 1} 

bezeichnet (enthält Endpunkte nicht für x ≠ y). Das folgende Beispiel c) zeigt, dass Konvexität 

für uns eine zentrale Bedeutung besitzt. 

Beispiel 3.2.2 

a) Affine Unterräume U ⊆ R n sind konvex, da mit x, y ∈ U sogar [x, y] ⊆ aff(x, y) ⊆ U gilt. 

b) Der Durchschnitt ⋂ i∈I M i konvexer Mengen M i ⊆ R n , i ∈ I, ist konvex. 

c) Halbräume H ± , H ⊖ , H ⊕ sind konvex. Die Menge 

n∑ 

X := {x ∈ R n : a ij x j ≥ b i , i ∈ I} = ⋂ H ⊕ (a (i) , b i ) 

j=1 i∈I 

der Lösungen eines linearen Ungleichungssystems Ax ≥ b ist als Durchschnitt der Halbräume 

H ⊕ (a (i) , b i ) konvex.


d) Der Einheitssimplex ∆ n := {x ∈ R n : 1l T x = 1, x ≥ 0} ist ebenso konvex wie ∆ ′ n := {x ∈ 

R n : 1l T x ≤ 1, x ≥ 0}. 

e) Streckung und Addition erhalten die Konvexität. Mit λ ∈ R und konvexen Mengen M, N ⊆ 

R n sind auch folgende Mengen konvex 

λM := {λx : x ∈ M}, 

M + N := {x + y : x ∈ M, y ∈ N}. 

Definition 3.2.3 Zu M ⊆ R n ist die konvexe Hülle konv(M) die kleinste konvexe Menge, die 

M enthält. 

Offensichtlich gilt für Mengen M ⊆ R n : M konvex ⇐⇒ M = konv(M). Den Zusammenhang 

zwischen Konvexität und Konvex-Kombinationen präzisieren die folgenden Sätze. 

Satz 3.2.4 M ⊆ R n ist genau dann konvex, wenn jede konvexe Kombination von endlich vielen 

Punkten aus M wieder in M liegt. 

Beweis ”⇐” Die Konvexität folgt aus dem Spezialfall k = 2. 

”⇒” induktiv, die Behauptung für k = 2 entspricht der Definition. Nun sei M konvex und x (1) , . . . , x (k+1) ∈ 

M, k ≥ 2. Mit λ i ≥ 0, ∑ k+1 

i=1 λ i = 1 sei z := ∑ k+1 

i=1 λ ix (i) . Für λ k+1 = 1 ist z = x (k+1) ∈ M. Andererseits 

gilt für λ k+1 < 1 

z = 

k∑ 

λ i x (i) + λ k+1 x (k+1) = (1 − λ k+1 ) 

i=1 

= (1 − λ k+1 ) 

k∑ 

µ i x (i) +λ k+1 x (k+1) , 

i=1 

} {{ } 

=:˜z 

k∑ 

i=1 

λ i 

1 − λ k+1 

x (i) + λ k+1 x (k+1) 

mit µ i := λ i /(1 − λ k+1 ) ≥ 0, i = 1, . . . , k, und ∑ k 

i=1 µ i = 1. Damit ist ˜z ∈ M nach I.V. und auch z ∈ M 

als einfache Konvexkombination von ˜z und x (k+1) . 

Spezielle Charakterisierungen der konvexen Hülle von M sind auch: 

• von außen: Durchschnitt aller konvexen Obermengen: 

⋂ 

konv(M) = 

(N konvex) 

M⊆N⊆R n N 

• von innen: Menge aller konvexen Kombinationen von Punkten aus M: 

konv(M) = ⋃ k∈N{ 

k∑ 

λ i x (i) : x (i) ∈ M, λ ∈ ∆ k }. (3.2.1) 

i=1 

Der Einheitssimplex ist die konvexe Hülle aller Einheitsvektoren ∆ n = konv({e 1 , . . . , e n }) und 

∆ ′ n = konv(∆ n ∪ {0}). Dieses Beispiel läßt erwarten, dass in der Darstellung (3.2.1) nur eine 

Höchstanzahl von Summanden zu betrachten ist. Das bestätigt folgender Satz.


Satz 3.2.5 (Caratheodory) Die Menge M ⊆ R n , M ≠ ∅, besitze Dimension m. Dann kann 

jeder Punkt z ∈ konv(M) durch höchstens m + 1 Punkte konvex kombiniert werden, d.h., es 

existieren x (1) , . . . , x (k) ∈ M, k ≤ m + 1, λ ∈ ∆ k so, dass z = ∑ k 

i=1 λ ix (i) gilt. 

Beweis Für beliebiges z ∈ konv(M) gibt es ein s ∈ N so, dass 

z = 

s∑ 

λ i x (i) , (λ i ) ∈ ∆ s , x (i) ∈ M. 

i=1 

ZZ Für s > m + 1 können Punkte x (i) aus der Darstellung entfernt werden, nur der Fall λ i > 0∀i ist dabei 

nichttrivial. Tatsächlich sind für s > m + 1 die Vektoren x (2) − x (1) , . . . , x (s) − x (1) linear abhängig, da 

ihre Anzahl größer ist als dim(M). Nach (3.1.6) existiert daher (α 1 , . . . , α s ) ≠ 0 mit 

s∑ 

α i x (i) = 0, 

i=1 

s∑ 

α i = 0. 

i=1 

Man wählt den Index j so, dass |α j |/λ j = max{|α i |/λ i : 1 ≤ i ≤ s} und α j > 0 (oBdA). Dann ist 

x (j) = − ∑ i≠j α ix (i) /α j und somit auch 

z = 

s∑ 

i=1 

i≠j 

( 

λi − α i 

λ j 

α j 

) 

x 

(i) 

λ 

( 

j 

mit λ i − α i = λ i 1 − α ) 

iλ j 

≥ 0 

α j λ i α j 

eine konische Darstellung von z mit s − 1 Punkten. Die Darstellung ist auch konvex, da ∑ i≠j α i = −α j 

und ∑ i≠j (λ i − α i λ j /α j ) = ∑ i≠j λ i + λ j = 1 ist. Die Elimination kann solange wiederholt werden, bis 

höchsten m + 1 Punkte auftreten. 

Zum Zusammenspiel von Konvexität und Topologie: 

Satz 3.2.6 Bei einer nichtleeren konvexen Menge M ⊆ R n sind auch das Innere 

Abschluß ¯M konvex. 

◦ M und der 

Beweis Das Innere sei nicht leer und x, y ∈ ◦ M. Dann liegen auch ε-Kugeln um diese in ◦ M, also 

x + B ε (0) ⊆ ◦ M, y + B ε (0) ⊆ ◦ M, mit ε > 0. Zu λ ∈ [0, 1] ist n.V. z := λx + (1 − λ)y ∈ M, es gilt auch 

λ(x − z) + (1 − λ)(y − z) = 0. 

ZZ z ∈ M. ◦ Dazu sei ˜z ∈ z + B ε (0) beliebig, also ‖˜z − z‖ ≤ ε. Dann gilt tatsächlich auch ✗✔ 

✗✔ 

✗✔ 

˜z = λ(x + ˜z − z) + (1 − λ)(y + ˜z − z) ∈ M. 

 

} {{ } 

} {{ } 

✘ ✘✘ ✘ ✘✘ ✘ 

✘ ✘✘ ✘ ˜z ✘✘ ✘ 

 

y 

z ✖✕ 

x ✖✕ 

∈ B ε (x) 

∈ B ε (y) 

✖✕ 

¯M: zu ¯x, ȳ ∈ ¯M existieren Folgen mit x (i) , y (i) ∈ M und ¯x = lim i→∞ x (i) , ȳ = lim i→∞ y (i) . Zu λ ∈ [0, 1] 

ist dann z (i) = λx (i) + (1 − λ)y (i) ∈ M ∀i n.V.. Damit folgt 

und somit die Konvexität von ¯M. 

λ¯x + (1 − λ)ȳ = λ lim 

i→∞ 

x (i) + (1 − λ) lim 

i→∞ 

y (i) = lim 

i→∞ 

z (i) = z ∈ ¯M 

Bei der Übertragung topologischer Eigenschaften auf die konvexe Hülle ist Vorsicht angebracht. 

Die Abgeschlossenheit von M überträgt sich nur bei beschränkten Mengen auf konv(M).


Satz 3.2.7 Die Menge M ⊆ R n sei 

⎫ 

⎧ 

offen ⎪⎬ 

⎪⎨ offen 

beschränkt 

⎪⎭ ⇒ konv(M) ist beschränkt 

⎪ ⎩ 

kompakt 

kompakt 

Beweis Sei M offen. Zu z ∈ konv(M) existiert k ∈ N und (λ i ) ∈ ∆ k , x (i) ∈ M mit z := ∑ k 

i=1 λ ix (i) . 

N.V. ist für ein ε > 0 auch B ε (x (i) ) ⊆ M ∀i = 1, . . . , k und für ein ˜z ∈ B ε (z) ist 

˜z = ˜z + 

k∑ 

λ i (x (i) − z) = 

i=1 

eine Konvexkombination aus M heraus. 

k∑ 

λ i (x (i) + ˜z − z), 

} {{ } 

∈ B ε (x (i) ) 

Sei M kompakt, die Beschränktheit ist dann trivial. Ist nun z ∈ konv(M) ein Häufungspunkt von 

konv(M), so existiert eine Folge z (j) ∈ konv(M) mit lim j z (j) = z. Nach Satz 3.2.5 hat jedes Folgenelement 

eine konvexe Darstellung mit fester Anzahl n + 1: 

i=1 

i=1 

n+1 

∑ 

z (j) = λ j,i x (j,i) , (λ j,i ) n+1 

i=1 ∈ ∆ n+1, x (j,i) ∈ M. 

Da auch das n+1-fache cartesische Produkt M ×. . .×M und ∆ n+1 kompakt sind, existieren konvergente 

Teilfolgen mit Indizes (j k ) für die Vektorfolgen 

( ) ( ) 

(λ j,i ) n+1 

i=1 , (x (j,i) ) n+1 

i=1 . 

Deren Limites seien λ i := lim k→∞ λ jk ,i, x (i) := lim k→∞ x (j k,i) . Damit folgt 

j≥0 

j≥0 

n+1 

∑ 

z = lim 

j→∞ z(j) = lim 

k→∞ z(j k) = λ i x (i) ∈ konv(M), 

denn es ist (λ i ) n+1 

i=1 ∈ ∆ n+1 und x (i) ∈ M, da M abgeschlossen ist. 

Zu einem beliebigen Punkt x ∈ R n gibt es in einer nichtleeren konvexen, abgeschlossenen Menge 

M einen eindeutigen, nächstgelegenen Punkt. Denn bei festem x ist y ↦→ f x (y) := ‖y − x‖ 2 eine 

stetige Funktion und muss mit einem beliebigen y 0 ∈ M nur auf der Kugel B r (x), r 2 = f x (y 0 ), 

z 

 

u x 

✏ ✏✏✏ y 

i=1 

bzw. der kompakten Menge M ∩ B r (x) betrachtet werden. Dieses Minimum 

ist eindeutig aufgrund der Parallelogrammgleichung 

‖ y + z 

2 ‖2 = 1 2 ‖y‖2 + 1 2 ‖z‖2 − 1 4 ‖y − z‖2 . (3.2.2) 

Bei zwei Minimalstellen mit ‖y − z‖ > 0 wäre f x in u := (y + z)/2 ∈ M 

echt kleiner: f x (u) < f x (y) = f x (z). Dies zeigt den 

Satz 3.2.8 Die Menge M ⊆ R n , M ≠ ∅, sei konvex und abgeschlossen. Dann gibt es zu jedem 

x ∈ R n einen eindeutigen, nächstgelegenen Punkt 

ŷ ∈ M : 

ŷ = arg min{f x (y) : y ∈ M}. 

Die Zuordnung p M : R n → M, x ↦→ ŷ wird die Projektion auf M genannt.


Fixpunkte dieser Projektion p M (x) = x sind genau die Punkte x ∈ M, daher ist die Abbildung 

p M auch idempotent, p M ◦p M = p M . Bei einem affinen Unterraum U ⊆ R n ist p U die orthogonale 

Projektion auf U, mit ŷ = p M (x) ist 

x = ŷ + (x − ŷ), wobei (x − ŷ) T (ŷ − y) = 0 ∀y ∈ U. 

Bei einem linearen Unterraum ist auch p U linear. Eine zur letzten Gleichung ähnliche Charakterisierung 

von p M (x) gilt im allgemeinen Fall. 

Satz 3.2.9 Die nichtleere Menge M ⊆ R n sei konvex und abgeschlossen und ŷ ∈ M. Dann gilt 

mit x ∈ R n ŷ = p M (x) ⇐⇒ (x − ŷ) T (ŷ − y) ≥ 0 ∀y ∈ M. (3.2.3) 

Für x ∉ M ist der nächstgelegene Punkt ŷ = p M (x) also dadurch charakterisiert, dass gilt 

M ⊆ H ⊖ , mit der Hyperebene H = H(x − ŷ, ŷ), die eingezeichneten Vektoren x − ŷ und ŷ − y 

aus (3.2.3) zeigen ungefähr in die gleiche Richtung. 

Beweis ′′ ⇒ ′′ Mit ŷ = p M (x) und bel. y ∈ M sowie λ ∈ [0, 1] ist z = λy + (1 − 

λ)ŷ = ŷ + λ(y − ŷ) ∈ M. Nach Voraussetzung gilt 

 

x❅■ 

f x (ŷ) ≤ f x (ŷ + λ(y − ŷ)) = ‖ŷ − x + λ(y − ŷ)‖ 2 

❅ 

❅ ŷ 

= f x (ŷ) + 2λ(ŷ − x) T (y − ŷ) + λ 2 ‖y − ŷ‖ 2 . 

} {{ } 

❆❑ 

❆ z M 

≥0 

❆y 

Für λ → 0 führt dies auf (x − ŷ) T (ŷ − y) ≥ 0. 

H 

′′ ⇐ ′′ Für ein ŷ ∈ M gelte (x − ŷ) T (ŷ − y) ≥ 0. Ist auch x ∈ M, führt die Wahl y = x auf −‖x − ŷ‖ 2 ≥ 0 

und zeigt ŷ = x = p M (x). Für x /∈ M ist ‖x − ŷ‖ > 0 und mit y ∈ M folgt nach Cauchy-Schwarz 

0 ≤ (x − ŷ) T (ŷ − y) = (x − ŷ) T (ŷ − x + x − y) 

= −‖x − ŷ‖ 2 + (x − ŷ) T ( ) 

(x − y) ≤ ‖x − ŷ‖ −‖x − ŷ‖ + ‖x − y‖ . 

} {{ } } {{ } 

0< 

0≤ 

Also gilt f x (ŷ) = ‖x − ŷ‖ ≤ ‖x − y‖ = f x (y) ∀y ∈ M, daher ist ŷ = p M (x). 

Wie im linearen Fall sind alle Elemente von M Fixpunkte der Abbildung p M . Diese ist auch 

nicht-expandierend, aber keine echte Kontraktion: 

Satz 3.2.10 Die Menge M ⊆ R n , M ≠ ∅, sei konvex und abgeschlossen. Dann gilt für x, y ∈ R n 

‖p M (x) − p M (y)‖ ≤ ‖x − y‖. 

Hyperebenen der in Satz 3.2.9 auftretenden Art sind im Folgenden ein wichtiges Hilfsmittel. 

Definition 3.2.11 Sei M ⊆ R n konvex, M ≠ ∅. Eine Hyperebene H = H(a, α) mit M ⊆ H ⊖ , 

H ∩ ¯M ≠ ∅ heißt Stützebene für M und a T x ≤ α zulässige Ungleichung für M. Wenn B := 

H ∩ M ≠ ∅ ist, heißt B Stützmenge.


In Satz 3.2.9 liegt also p M (x) für x /∈ M in der Stützmenge der dort zur abgeschlossenen(!) Menge 

M konstruierten Stützebene H. Diese trennt den Punkt x von der Menge M. Eine entsprechende 

Aussage gilt für beliebige disjunkte, konvexe Mengen. 

Definition 3.2.12 Zur Lage einer Hyperebene H = H(a, α) relativ zu nichtleeren Mengen 

M, N ⊆ R n verwendet man folgende Begriffe. 

H trennt M und N, wenn M ⊆ H ⊖ , N ⊆ H ⊕ (bzw.umgekehrt) 

H trennt M und N echt, wenn M ⊆ H ⊖ , N ⊆ H + (bzw.umgekehrt) 

H trennt M und N strikt, wenn M ⊆ H − , N ⊆ H + (bzw.umgekehrt) 

H trennt M und N stark, wenn für ein ɛ > 0 gilt 

a T x ≤ α − ɛ < α + ɛ ≤ a T y ∀x ∈ M, y ∈ N. 

Mit Satz 3.2.9 kann direkt eine Hyperbene konstruiert werden, die einen Punkt x ∉ ¯M außerhalb 

einer konvexen Menge von dieser strikt trennt. Etwas schwieriger wird der Nachweis, wenn x auf 

dem Rand von M liegt, die trennende Ebene ist dann eine Stützebene. 

Satz 3.2.13 Die nichtleere Menge M ⊆ R n sei konvex. 

a) Ist M abgeschlossen und x /∈ M, dann existiert eine Hyperebene mit M ⊆ H − (a, α), x ∈ 

H + (a, α), d.h., 

∀y ∈ M : a T y < α < a T x. 

b) Wenn x Randpunkt von M, x ∈ ¯M \ M, ◦ ist, existiert eine Hyperebene H mit x ∈ H, M ⊆ H ⊖ . 

Beweis a) In Satz 3.2.9 ist a := x − p M (x) ≠ 0. Mit ŷ = p M (x) gilt für alle y ∈ M nach (3.2.3) 

0 ≥ a T (y − ŷ) = a T (y − x + a) = a T y − a T x + ‖a‖ 2 ⇐⇒ a T x ≥ a T y + ‖a‖ 2 . 

Durch die Wahl α := a T x − 1 2 ‖a‖2 geht die Hyperebene H(a, α) genau durch den Mittelpunkt (x + ŷ)/2 

und trennt x strikt von M: 

a T x > a T x − 1 2 ‖a‖2 = α ≥ a T y + 1 2 ‖a‖2 > a T y ∀y ∈ M. 

b) Da x Randpunkt von M ist, existiert eine Folge (x (j) ) mit x (j) /∈ ¯M und x = lim j→∞ x (j) . Zu jedem 

dieser x (j) existiert nach Teil a) eine strikt trennende Hyperebene H(a (j) , α j ). Normiert man abweichend 

von Teil a) durch ‖a (j) ‖ = 1, ist diese Folge (a (j) ) beschränkt und besitzt daher eine konvergente Teilfolge 

Mit diesem a gilt ∀y ∈ M, dass 

lim 

k→∞ a(j k) = a, ‖a‖ = 1. 

a (j k) T y < a (j k) T x (j k) 

↓ 

↓ 

a T y ≤ a T x 

für k → ∞. 

Dies bedeutet aber gerade y ∈ H ⊖ (a, x) ∀y ∈ M.


Auch im Grenzfall sich berührender konvexer Mengen ist 

noch eine Trennung möglich. 

Theorem 3.2.14 Es seien M, N ⊆ R n nichtleere, disjunkte, 

konvexe Mengen, M ∩ N 

= ∅, und M offen. Dann 

existiert eine Hyperebene H, die M und N echt trennt, 

M ⊆ H − , N ⊆ H ⊕ . 

❅❅ 

❅ 

H 

N 

✜ ✜ 

✜ 

★ 

★ 

★ 

M 

 

Beweis Die Menge aller Differenzen M − N := {u − v : u ∈ M, v ∈ N} ist konvex. Denn Punkte 

x, y ∈ M − N sind Differenzen x = u − v, y = w − z mit u, w ∈ M, v, z ∈ N. Für λ ∈ [0, 1] gilt tatsächlich 

λx + (1 − λ)y = ( ) ) 

λu + (1 − λ)w − (λv + (1 − λ)z ∈ M − N. 

} {{ } } {{ } 

∈M 

∈N 

Da wegen M ∩ N = ∅ aber 0 /∈ M − N ist, existiert nach Satz 3.2.13 eine Hyperebene H(a, 0) ∋ 0, die 

die Null von M − N trennt, also M − N ⊆ H ⊖ (a, 0). Daher gilt 

∀w ∈ M, z ∈ N : y = w − z ∈ M − N ⇒ 0 ≥ a T y = a T w − a T z, d.h. a T w ≤ a T z. 

Offensichtlich ist daher w ↦→ a T w beschränkt auf der offenen Menge M, das Supremum α := sup{a T w : 

w ∈ M} existiert, wird aber nicht angenommem. Somit gilt a T w < α ≤ a T z ∀w ∈ M, z ∈ N. 

Bei ihrer Einführung wurde die konvexe Hülle als Durchschnitt allgemeiner konvexer Obermengen 

definiert. Mit den letzten Ergebnissen ist auch eine Charakterisierung nur mit Halbräumen 

(d.h. linearen Ungleichungen) möglich. 

Satz 3.2.15 M ⊆ R n sei eine konvexe, abgeschlossene, echte Teilmenge des R n , M ≠ ∅, M ≠ 

R n . Bezeichnet H M die Menge der Stützebene an M, dann gilt 

M = 

⋂ 

H ⊖ . 

H∈H M 

Beispiel 3.2.16 Bei der Einheitskugel M := B 1 (0) ist diese Aussage sofort nachvollziehbar. 

Für jedes a ∈ R n , a ≠ 0, ist H(a, ‖a‖) eine Stützebene an M. Man sieht hier auch sofort, dass 

in der Darstellung ⋂ H∈H M 

H ⊖ unendlich viele Halbräume auftreten. 

3.3 Randflächen und Ecken 

Bekanntlich sind bei der Suche nach Extrema von Funktionen die Ränder des zulässigen Bereichs 

gesondert zu prüfen, insbesondere bei linearen Zielfunktionen. Auch eine Stützebene berührt eine 

konvexe Menge in (mindestens einem) Randpunkt. Die Definition des Randes ist bei abgeschlossenen 

konvexen Mengen aber auch mit rein geometrischen Begriffen möglich. 

Definition 3.3.1 Sei R ≠ ∅ und beide Mengen R ⊆ M ⊆ R n konvex. 

Dann heißt R Randfläche von M, wenn 

∀x, y ∈ M : (x, y) ∩ R ≠ ∅ ⇒ x, y ∈ R. 

x 

y 

R


In der Definition tritt die offene Strecke (x, y) auf, Punkte einer Randfläche R können also nur 

aus Punkten von R selbst kombiniert werden. Abhängig von der Dimension einer Randfläche R 

verwendet man folgende Bezeichnungen: 

dim R = 0: 

dim R = 1: 

R = {y} ist Ecke von M 

R ist Kante von M 

dim R = n − 1: R ist Facette von M ⊆ R n . 

Satz 3.3.2 Sei M ⊆ R n nichtleer und konvex. Dann sind folgende Bedingungen äquivalent: 

a) z ∈ M ist Ecke von M, 

b) z ∈ (x, y), x, y ∈ M ⇒ x = y = z, 

c) z = 1 (x + y), x, y ∈ M ⇒ x = y = z, 

2 

d) M \ {z} ist konvex. 

Beweis Teil b) entspricht gerade der Definition des Begriffs a), gezeigt wird nur c) ⇒ b). Dazu sei 

x, y ∈ M, z = λx + (1 − λ)y. Für λ ∈ (0, 1) existiert ein ε > 0 so, dass 0 < λ − ε < λ + ε < 1. Damit sei 

} 

˜x = (λ + ε)x + (1 − λ − ε)y ∈ M 

⇒ z = 1 ỹ = (λ − ε)x + (1 − λ + ε)y ∈ M 

2 (˜x + ỹ). x z y 

˜x ỹ 

Aus dieser Darstellung folgt aber n.V. ˜x = ỹ = z und daher 0 = ˜x − ỹ = 2ε(x − y). Wegen 2ε > 0 hat 

das auch x = y = z, also die Eckeneigenschaft, zur Folge. 

Ecken sind die wichtigsten Teile des Randes, die Menge aller Ecken von M heißt E(M). 

Beispiel 3.3.3 

a) Die Eckenmenge der Einheitskugel M = B 1 (0) = {x : ‖x‖ ≤ 1} ist die Sphäre E(M) = 

{x : ‖x‖ = 1}. Dies folgt direkt aus der Parallelogrammgleichung (3.2.2) und Satz 3.3.2b. 

Die offene Kugel hat keine Ecken E( M) ◦ = ∅. 

b) Auch Unterräume U ⊆ R n haben keine Ecken, sind aber abgeschlossen. 

c) Im folgenden treten aber in der Regel Mengen mit endlich vielen Ecken auf. Dazu gilt 

etwa: für M = konv{x (1) , . . . , x (m) } ist E(M) ⊆ {x (1) , . . . , x (m) }. 

Jede nichtleere kompakte Menge M enthält mindestens eine Ecke (Satz, denn argmax{‖x‖ : 

x ∈ M} ist Ecke). E(M) enthält dann sogar so viele Punkte, dass die ganze Menge M daraus 

rekonstruiert werden kann (Theorem 3.3.7). Zum Beweis wird benötigt: 

Satz 3.3.4 Sei M ≠ ∅, M ⊆ R n konvex und kompakt und H eine Stützebene an M. Dann ist 

R := H ∩ M eine Randfläche von M und enthält eine Ecke von M. 

Beweis Als wichtigster Teil wird die Existenz der Ecke gezeigt. Da R = H ∩ M als nichtleerer Schnitt 

ebenfalls konvex und kompakt ist, besitzt R eine Ecke z ∈ M ∩ H. Es sei H = H(a, α).


ZZ z ist Ecke der Menge M. Dazu sei z = 1 2 

(x + y) mit x, y ∈ M, also 

a T x ≤ α, a T y ≤ α, a T z = α (da z ∈ H!). 

Daher gilt 

0 = a T z − α = 1 2 aT (x + y) − α = 1 2 (aT x − α) + 1 } {{ } 2 (aT y − α) ≤ 0. 

} {{ } 

≤0 

≤0 

Also sind beide Klammern null: x, y ∈ H ∩ M = R ⇒ x = y = z, da z Ecke von R war. 

Aufgrund des Satzes ist jede Stützmenge auch Randfläche, 

aber i.a. nicht umgekehrt: 

Beispiel 3.3.5 Bei der Vereinigung M = ([−1, 0] × [0, 1]) ∪ 

(B 1 (0) ∩ R 2 +) von Quadrat und Viertelkreis ist e 2 = (0, 1) T 

zwar eine Ecke, aber selbst nur Ecke einer Stützmenge. 

 

 

✻ 

E(M) 

✲ 

Konvexität und Randflächen-Eigenschaft sind ”monotone” bzw. transitive Eigenschaften. 

Satz 3.3.6 a) M ⊆ R n , M ≠ ∅ sei konvex und kompakt. Dann ist jede Randfläche von M 

konvex und kompakt. 

b) Bei den konvexen Mengen S ⊆ R ⊆ M ⊆ R n , S ≠ ∅, sei S Randfläche von R und R 

Randfläche von M. Dann ist auch S Randfläche von M und E(R) ⊆ E(M). 

Beweis a) Betrachte zu einer Randfläche R ⊆ M den Schnitt M ∩ aff(R). 

b) Sei x, y ∈ M, (x, y) ∩ S ≠ ∅. Dann gilt auch (x, y) ∩ R ≠ ∅, da S ⊆ R. Wegen der Randeigenschaft 

von R in M ist dann x, y ∈ R und die Randeigenschaft von S in R liefert x, y ∈ S. Ecken sind der 

nulldimensionale Spezialfall. 

Theorem 3.3.7 (Krein-Milman) Sei M ≠ ∅, M ⊆ R n konvex und kompakt. Dann gilt 

M = konv(E(M)). 

Beweis Induktion über k = dim M, die Behauptung gilt für Punkt (k = 0) und Strecke (k = 1). 

Bei der folgenden Argumentation spielt die Existenz echter Stützebenen 

H von M mit M ⊈ H eine wesentliche Rolle. Daher 

wird M für k = dim M < n mit Hilfe des Komplementraums 

C := L(aff(M)) ⊥ zu einem volldimensionalen Zylinder M + C 

aufgeblasen (im Bild grün). 

Anahme: Es sei z ∈ M \ konv(E(M)) ≠ ∅. Da z keine Ecke ist, 

liegt es im Inneren einer Strecke z ∈ (x, y) zwischen Punkten 

z ≠ x, y ∈ M. Dabei können durch Verlängerung dieser Strecke x 

und y so gewählt werden, dass sie beide auf dem Rand von M liegen. 

Es sind aber nicht beide eine Ecke, da sonst z ∈ konv(E(M)) 

wäre. Sei nun x keine Ecke. Nach Satz 3.2.13 existiert dann eine 

Stützebene H an M + C mit x ∈ H und M + C ⊆ H ⊖ . H ist 

insbesondere auch eine Stützebene an M mit M ⊈ H und für die 

Stützmenge R := H ∩ M gilt dim R < k = dim M.


Nach Ind.Voraussetzung ist dann aber x ∈ konv(E(R)) ⊆ konv(E(M)), vgl. Satz 3.3.6. Analog zeigt man 

y ∈ konv(E(M)). Dies liefert den Widerspruch mit z ∈ konv(E(M)). 

3.4 Polyeder, Polytope, Kegel 

Theorem 3.3.7 liefert für kompakte, konvexe Mengen eine vollständige, explizite Darstellung 

mit Hilfe der Ecken. Für unbeschränkte Mengen muss diese Darstellung aber ergänzt werden. 

Dazu konzentrieren wir uns jetzt auf Polyeder. Dieser Begriff wurde schon mehrfach informell 

für die Lösungsmengen von Ungleichungssystemen benutzt und wird nun zusammen mit einem 

verwandten Begriff eingeführt. Insbesondere werden auch die Ecken und Kanten des Polyeders 

über seine algebraische Definition mit Daten aus dem Simplexverfahren identifiziert. Deshalb 

werden sowohl die zulässigen Polyeder von (LP1) als auch (LP3) betrachtet. 

Definition 3.4.1 Es sei M ⊆ R n eine nichtleere Menge. 

a) M heißt Polyeder, wenn eine Matrix A ∈ R m×n und ein Vektor b ∈ R m existieren mit 

M = {x ∈ R n : Ax ≥ b}. 

b) M heißt Polytop, wenn (endlich viele) Punkte x (0) , . . . , x (k) ∈ R n existieren mit M = 

konv(x (0) , . . . , x (k) ). Wenn die Punkte x (0) , . . . , x (k) dabei affin linear unabhängig sind, nennt 

man M einen k-Simplex. 

Polyeder und Polytope sind natürlich konvex. Beim Polyeder treten insbesondere in Satz 3.2.15 

nur endlich viele (höchstens m) Halbräume auf. Ein Polytop M = konv(x (0) , . . . , x (k) ) ist nach 

Satz 3.2.7 kompakt, da die Eckenmenge E(M) ⊆ {x (0) , . . . , x (k) } kompakt ist. In einem k- 

Simplex S hat jeder Punkt z ∈ S eine eindeutige Darstellung 

z = 

k∑ 

λ j x (j) , (λ j ) ∈ ∆ k+1 . 

j=0 

Die zugehörigen λ j sind die baryzentrischen Koordinaten von z in S, und ¯x = 1 

k+1 

∑ k 

j=0 x(j) der 

Schwerpunkt von S. 

Nach Theorem 3.3.7 ist ein Polytop durch seine Ecken explizit darstellbar. Im kompakten 

Fall gilt das auch für Polyeder, die zulässigen Bereiche von (LP): 

Satz 3.4.2 Ein nichtleeres, beschränktes Polyeder ist ein Polytop. 

Der Satz folgt direkt aus Theorem 3.3.7, wenn man weiß, dass jedes Polyeder nur endlich viele 

Ecken hat. Diese Tatsache wiederum folgt elementar aus dem jetzt hergeleiteten Zusammenhang 

(Satz 3.4.3) zwischen den Ecken von X = {x : Ax ≥ b} und ihrer algebraischen Charakterisierung 

durch die regulären n × n-Untermatrizen von A. Da es überhaupt nur ( m 

n) 

quadratische 

n × n-Untermatrizen gibt, ist diese Zahl auch eine obere Schranke für die der Ecken.


Dabei spielen reguläre Untermatrizen A (L) ∈ R n×n , L ⊆ {1, . . . , m}, n ≤ m, bei (LP1) bzw 

A J ∈ R m×m , J ⊆ {1, . . . , n}, n ≥ m, bei (LP3) eine entscheidende Rolle (zur Defin.vgl. §2.3). 

Satz 3.4.3 a) Das Polyeder X = {x : Ax ≥ b} zu (LP1) sei durch A ∈ R m×n , b ∈ R m , gegeben 

und es sei z ∈ X. Dann ist z genau dann Ecke, wenn es eine reguläre n × n-Untermatrix A (L) , 

L ⊆ {1, . . . , m}, |L| = n, gibt mit A (L) z = b L . 

b) Das Polyeder X = {x : Ax = b, x ≥ 0} zu (LP3) sei durch A ∈ R m×n , b ∈ R m , gegeben 

und es sei z ∈ X. Dann ist z genau dann Ecke, wenn z ≥ 0 eine zulässige Basislösung ist, 

rang(A J(z) ) = |J(z)|. 

Bemerkung: a) Wenn die Matrix A bei (LP1) nicht vollen Spaltenrang hat, also ein nichttrivialer 

Kern existiert, besitzt das Polyeder überhaupt keine Ecken, da mit Ay = 0, y ≠ 0, und x ∈ X 

auch x + ty ∈ X ∀t ∈ R gilt. Tatsächlich ist dann der Linealraum L(X) = kern(A). 

b) Bei (LP1) definiert das Teilsystem A (L) z = b L aus ”straffen” Bedingungen eindeutig den 

Schnittpunkt der n Hyperebenen H(a (i) , b i ), i ∈ L. Für eine Ecke z müssen aber auch die 

übrigen Zulässigkeitsbedingungen A (K) z ≥ b K mit K = {1, . . . , m} \ L erfüllt sein. Diese sind 

i.d.R. ”locker”, A (K) z > b K . 

c) Die Aussage zu (LP3) kann wegen Satz 2.3.2 analog zum ersten Teil von Satz 3.4.3 formuliert 

werden: z ∈ X ist genau dann Ecke, wenn es eine reguläre m×m-Untermatrix A J , J ⊆ {1, . . . , n}, 

|J| = m, gibt mit A J z J = b. Einzige Zusatzbedingung ist hier z ≥ 0. 

Beweis a) Nach Bemerkung a) ist oBdA m ≥ n und Rang(A) = n. 

”⇐” Für ein z ∈ X gelte A (L) z = b L und z = 1 2 

(x + y) mit x, y ∈ X. Dann folgt 

0 = A (L) z − b L = 1 2 A(L) (x + y) − b L = 

2( 1 A (L) x − b 

} {{ L 

} 

≥0 

) 

+ 

1 

2 

( 

A (L) ) 

y − b 

} {{ L ≥ 0. 

} 

≥0 

Beide Klammern sind also null, wegen der Regularität von A (L) ist daher x = z = y, also z Ecke. 

”⇒” Es sei z ∈ X Ecke. Die Ungleichungen des Systems teilt man in straffe und lockere: 

{ 

A (L) z = b L , 

A (K) K + L = {1, . . . , m}. 

z > b K , 

Wenn RangA (L) < n wäre, gäbe es ein u ≠ 0 mit A (L) u = 0 und mit t ∈ [−ε, ε], ε > 0, gilt 

{ 

A (L) (z + tu) = b L , 

A (K) (z + tu) = A (K) z + tA (K) für A (K) z − ε|A (K) u| ≥ b K . 

u ≥ b K , 

Dann ergibt sich aber ein Widerspruch, denn z = 1 2 (x(−) +x (+) ) ist echter Mittelpunkt der beiden Punkte 

x (−) = z − εu ≠ z + εu = x (+) . 

b) Hier sei J = J(z), also z J > 0, K := N \ J. 

”⇒” Es sei z Ecke und Rang(A J ) < |J|. Dann existiert ein u ≠ 0 mit A J u J = 0, u K = 0. Wie in Teil a) 

ist dann A J (z J + tu J ) = b ∀t ∈ R und mit ε := min{z j /|u j | : j ∈ J, u j ≠ 0} erhält man den Widerspruch 

aus 

x (−) = z − εu ≥ 0, x (+) = z + εu ≥ 0, z = 1 2 (x(−) + x (+) ).


”⇐” Für RangA J = |J| sei z = 1 2 

(x + y) mit x, y ∈ X. In den K-Komponenten folgt damit aber 

0 = z K = 1 2 ( x K + y 

}{{} K ) ⇒ x 

}{{} K = y K = 0. 

≥0 ≥0 

Damit bleiben die eindeutig lösbaren Systeme Ax = A J x J = b = A J y J ⇒ x J = z J = y J . 

Beispiel 3.4.4 Bei (LP1) sei m = 4, n = 2 und 

⎛ ⎞ ⎛ ⎞ 

✻ 

−1 1 

0 

A = 

−1 −1 

⎜ 

⎝ 0 −1 

⎟ 

⎠ , b = −4 

 

❅ 

 

❅ 

⎜ 

⎝−3 

⎟ 

❅ 

⎠ 

✟ ✟✟✟✟✟✟✟✟ ❅ 

1 −2 −6 

 

❅❅ 

 

Es gibt ( 4 

X 

2) 

= 6 Indexmengen L mit |L| = 2, und da die 

 

 

zugehörigen Untermatrizen regulär sind, auch entsprechend 

viele Kreuzungspunkte von Hyperebenen (=Geraden). Allerdings 

sind nur drei davon zulässig, also Ecken von X: 

 

 

( ) ( ) ( ) 

( ) 

1) L = {1, 2} : A (L) −1 1 x 1 0 

x = 

= = b L : x (1) 2 

= , 

−1 −1 x 2 −4 

2 

( ) ( ) ( ) 

( ) 

2) L = {2, 3} : A (L) −1 −1 x 1 −4 

x = 

= = b L : x (2) 1 

= , 

0 −1 x 2 −3 

3 

( ) ( ) ( ) 

( ) 

3) L = {3, 4} : A (L) 0 −1 x 1 −3 

x = 

= = b L : x (3) 0 

= . 

1 −2 x 2 −6 

3 

✲ 

Das Beispiel zeigt, daß die Ecken hier nicht ausreichen, um die Menge X zu beschreiben. Die 

Menge enthält zusätzlich bestimmte Richtungen, in denen sie sich unendlich weit trichterförmig 

ausdehnt. Diese Gestalt läßt sich durch Kegel beschreiben, welche gegenüber konischen Kombinationen 

(vgl. Defin. 3.1.2) abgeschlossen sind. 

Definition 3.4.5 a) Die nichtleere Menge K ⊆ R n heißt konvexer Kegel, wenn λx + µy ∈ K, 

∀x, y ∈ K, λ, µ ∈ R + . 

b) Der konvexe Kegel K ⊆ R n , K ≠ ∅, heißt spitz, wenn K ∩ (−K) = {0} ist. 

c) Zu einer beliebigen Menge M ⊆ R n ist 

keg(M) := 

k∈N{ 

⋃ k∑ 

λ i x (i) : x (i) ∈ M, λ i ∈ R + } 

i=1 

der von M erzeugte Kegel. Ein Kegel K heißt endlich erzeugt, wenn K = keg(b 1 , . . . , b k ) ist, 

b 1 , . . . , b k ∈ R n , d.h., 

K = B · R k + = {By : y ∈ R k +} mit B = (b 1 , . . . , b k ) ∈ R n×k . (3.4.1)


Bemerkung: a) K konvexer Kegel ⇐⇒ K = keg(K). 

b) Wenn M schon konvex war, gilt einfach keg(M) = R + · M = {λx : x ∈ M, λ ≥ 0}. Daher ist 

für beliebiges M auch keg(M) = R + · konv(M). 

c) Analog zur Situation bei konvexen Mengen sind Durchschnitte und Linearkombinationen von 

konvexen Kegeln wieder welche. 

d) Die Darstellung (3.4.1) besagt, dass K als lineares Bild des Standard-Kegels R k + darstellbar 

ist (unter der zu B gehörigen linearen Abbildung). 

e) Für einen konvexen Kegel K ist die affine Hülle aff(K) = K − K und der Linealraum L(K) = 

K ∩ (−K). Spitze Kegel haben also trivialen Linealraum. 

Beispiel 3.4.6 a) R n + ist natürlich ein endlich erzeugter konvexer Kegel. 

b) Lineare Unterräume U ⊆ R n sind endlich erzeugte konvexe Kegel. Mit einer Basismatrix 

B ∈ R n×l , U = B · R l , läßt sich U auch als Kegel schreiben, U = (B, −B) · R 2l 

+ (vgl. §1.3, 

Umformung 2). 

Der folgende Kegel hat für die Behandlung von Polyedern zentrale Bedeutung. 

Satz 3.4.7 Gegeben sei das Polyeder X = {x : Ax ≥ b}, A ∈ R m×n , b ∈ R m . Dann ist 

O + (X) := {x : Ax ≥ 0} ein konvexer Kegel. Er wird Ausdehnungskegel von X genannt, es gilt 

O + (X) = {y : x + λy ∈ X ∀x ∈ X, λ ∈ R + }. (3.4.2) 

Beweis a) Für y (j) ∈ O + (X) gilt also Ay (j) ≥ 0. Mit Vorfaktoren λ j ≥ 0 folgt aus 

( ∑ 

A λ j y (j)) = ∑ λ j Ay (j) ≥ 0 

}{{} } {{ } 

j 

j 

≥0 ≥0 

die Kegel-Eigenschaft. Und mit Ax ≥ b, Ay ≥ 0, λ ≥ 0 gilt auch A(x + λy) = Ax + λAy ≥ Ax ≥ b. 

b) Sei x ∈ X, für y ∈ R n und λ > 0 gelte 

A(x + λy) = Ax + λAy ≥ b ⇒ Ay ≥ 1 (b − Ax) → 0 (λ → ∞). 

λ } {{ } 

≤0 

Das bedeutet Ay ≥ 0. 

Die Formel (3.4.2) läßt sich als Definition des Kegels 

O + (X) für beliebige konvexe Mengen verstehen. Dieser Kegel 

enthält alle Richtungen, in die sich X unendlich weit ausdehnt. 

Bei Polyedern ist O + (X) insbesondere die Lösungsmenge 

des homogenen Ungleichungssystems analog zur Situation 

bei Linearen Gleichungssystemen. 

Bemerkung: Für Polyeder X ≠ ∅ gilt offensichtlich 

a) X + O + (X) = X. 

b) X kompakt ⇐⇒ O + (X) = {0}. 

O + (X) 

✻ 

✁ ✁✁ 

✁ ✁✁ ✁ 

✁ ✁ ✁ ✁ 

✁ 

✁ ✁ 

✁ ✁ ✁ X 

✁ 

✁ ✁ 

✁ ✁ 

✁ 

✁ 

❅ ✲


c) O + (X) ist spitz, wenn L(X) = kern(A) = {0}. 

d) Bedeutung für (LP1), min{c T x : x ∈ X}: Für nichttriviales c ∈ −O + (X) ist (LP) unbeschränkt, 

denn da dann mit ¯x ∈ X auch x = ¯x − λc ∈ X ∀λ ≥ 0 ist und c T (¯x − λc) = c T¯x − λ‖c‖ 2 , folgt 

inf{c T (¯x − λc) : λ ≥ 0} = −∞. 

Beispiel 3.4.8 Zum Beispiel 3.4.4 ist der Ausdehnungskegel O + (X) durch das homogene System 

⎛ ⎞ 

−1 1 

−1 −1 

⎜ 

⎝ 0 −1 

⎟ 

⎠ y ≥ 0 

1 −2 

bestimmt. Dieses entspricht den Bedingungen y 1 ≤ y 2 ≤ 0, y 2 ≤ −y 1 , y 2 ≤ y 1 /2. Also kommt 

nur y 1 ≤ 0 in Frage und es bleiben nur y 1 ≤ y 2 ≤ 1 2 y 1. Das sind die Bedingungen zu A (L) y ≥ 0 

mit L = {1, 4}. Die beiden homogenen Lösungen zu a (j)T y (j) = 0, j ∈ L, erzeugen diesen Kegel 

( ) ( ) 

−1 −2 

O + (X) = keg{y (1) , y (4) } = keg{ , }. 

−1 −1 

Im zentralen Dekompositionssatz wird der Ausdehnungskegel benötigt, um Theorem 3.3.7 

für unbeschränkte Polyeder zu ergänzen. Bisher ist aber nur die implizite Beschreibung von 

O + (X) aus Satz 3.4.7 durch das homogene Ungleichungssystem bekannt, unklar ist auch, ob 

eine endliche Erzeugermenge für ihn existiert. 

Satz 3.4.9 Der konvexe Kegel K := {x ∈ R n : Ax ≥ 0}, A ∈ R m×n , ist endlich erzeugt. 

Beweis Der Nachweis, dass K := {x : Ax ≥ 0} endlich erzeugt ist, wird über die Behauptung geführt, 

dass mit einem linearen Unterraum U ⊆ R n auch der Schnitt U ∩ R n + endlich erzeugt ist. 

a) Spezialfall: Y := Kern(B) ∩ R m + = {x : Bx = 0, x ≥ 0} ist endlich erzeugt. Durch eine Homogenisierung 

betrachtet man den kompakten Schnitt 

M := Y ∩ H(1l, 1) = Kern(B) ∩ R m + ∩ H(1l, 1) = Kern(B) ∩ ∆ m . 

Dabei ist ∆ m kompakt, also auch M (≠ ∅ oBdA). Daher ist M ein Polytop (Satz 3.4.2), ist also Hülle 

seiner endlichen Eckenmenge E(M), M = konv(E(M)). Durch Streckung von M bekommt man Y zurück: 

Y = R + M = keg(E(M)) ist endlich erzeugt. 

b) Anwendung für Y := AK ⊆ R m + : Jeder lineare Unterraum, auch U := Bild(A) = AR n = {Ax : 

x ∈ R n }, ist Kern einer linearen Abbildung, U = Kern(B). Nach Teil a) ist Y endlich erzeugt, daher 

existieren y (j) = Ax (j) ∈ U, j = 1, . . . , k, mit 

Y = U ∩ R m + = keg(y (1) , . . . , y (k) ) = keg(Ax (1) , . . . , Ax (k) ). 

Außerdem sei Kern(A) = span(z (1) , . . . , z (l) ). Für x ∈ K ist y := Ax ∈ Y und es gilt: 

y = Ax = 

k∑ 

λ j Ax (j) , (λ j ) ≥ 0 ⇐⇒ A(x − 

j=1 

k∑ 

λ j x (j) ) = 0. 

j=1 

} {{ } 

∈Kern(A)


⇒ x − 

k∑ 

λ j x (j) = 

j=1 

l∑ 

i=1 

( 

µ i z (i) ⇐⇒ x ∈ keg x (1) , . . . , x (k) , z (1) , . . . , z (l) , −z (1) , . . . , −z (l)) , 

denn jedes Kernelement ist Linearkombination der z (i) , bzw. konische Kombination der ±z (i) . 

Bevor die Zerlegung von Polyedern weiter verfolgt wird, wird kurz ein abgeleiteter Kegel studiert, 

der die Interpretation einiger Ergebnisse erleichtert. 

Definition 3.4.10 Der Polarkegel (duale Kegel) zu einer nichtleeren Menge M ⊆ R n ist 

M ∗ := {x ∈ R n : y T x ≤ 0 ∀y ∈ M} = ⋂ 

H ⊖ (y, 0). 

y∈M 

❆ y ⊥ ✻ 

❅ 

❆ 

❅ ❆ z 

❅ 

❆ 

y 

❅ 

❆ 

❅ ❆ 

 

❅ 

❆ 

❅ ❆ 

✟ ✟✟✟✟✟✟✟✟ ❆ 

✲ 

❆ ✻ 

❆ 

✁ ✁✁ 

❆ 

✁ 

✟ 

❆ 

❍ 

✁ ✁ ❍❍❍❍❍❍❍❍❍❍❍❍❍❍❍❍❍❍❍ 

❆ 

M 

❆ 

❆ 

✁ 

❆ 

✟✁ ✁ ❆ 

✟✟✟✟✟✟✟✟✟✟ ✲ 

{y, z} ∗ 

❅ 

❆ ❅ ❆ 

❅ 

❆ ❅ 

❆ 

❅ ❆ 

❆ 

❆❆ 

❅ z ⊥ 

❅ M ∗ 

❆ 

❆ 

❆ 

❆ 

❆ 

❆ 

❆❆ 

Bemerkung: a) Für einen linearen Unterraum U ⊆ R n ist U ∗ = U ⊥ . 

b) Für M ≠ ∅ gilt M ∗ = ( keg(M) ) ∗ und M ⊆ M ∗∗ := (M ∗ ) ∗ . 

c) Der Definition nach entspricht der Polyeder-Kegel K = {x : Ax ≥ 0} = O + (X) gerade dem 

Polarkegel zu den negativen Zeilen von A, K = {−a (1) , . . . , −a (m) } ∗ = (−A T · R m + ) ∗ . 

Bemerkung b) kann für die hier interessierenden Kegel präzisiert werden (o.Bew.). 

Satz 3.4.11 Für einen endlich erzeugten konvexen Kegel K gilt K ∗∗ = K. 

Also ist für K = {x : Ax ≥ 0} der Polarkegel K ∗ = −A T · R m + und beide daher endlich 

erzeugt. Mit diesem Satz kann die obige Bemerkung d) zur Unbeschränkheit von (LP1) präzisiert 

werden. Für ¯x ∈ X, y ∈ O + (X) ist auf dem Strahl {x = ¯x + λy : λ ≥ 0} ⊆ X der Wert 

der Zielfunktion c T x = c T¯x + λc T y genau dann (nach unten) beschränkt, wenn c T y ≥ 0 gilt. 

Beschränkheit erfordert also c T v ≥ 0 ∀v ∈ O + (X). Dies heißt aber gerade, dass −c im Polarkegel 

(O + (X)) ∗ = −A T · R m + liegt. Dieses Ergebnis (LP1) beschränkt ⇐⇒ c ∈ A T · R m + wird in der 

Dualitätstheorie wieder auftauchen.


3.5 Der Dekompositionssatz für Polyeder 

Zur Ergänzung der Polyeder-Zerlegung muss auch der Ausdehnungskegel berücksichtigt werden. 

Bei der endlichen Darstellung von Polyeder-Kegeln, vgl. Satz 3.4.9, kann eine Minimalmenge 

erforderlicher Richtungen identifiziert werden, die Kanten des Kegels. Daher wird jetzt das 

dem Satz 3.4.3 (Eckendarstellung) entsprechende Resultat für die Kanten der der zu (LP1) 

bzw. (LP3) gehörenden zulässigen Mengen formuliert. Bei (LP1) wird die Aussage wegen des 

Dekompositionssatzes auf den Ausdehnungskegel beschränkt. Bei (LP3) wird dagegen konkret 

gezeigt, dass der elementare Strahl (2.3.7) gerade eine Polyeder-Kante darstellt, wenn er eine 

positive (evtl. unendliche) Länge hat. Letzteres ist an den Vorzeichen des Vektors w (J) 

l 

= A −1 

J 

a l 

erkennbar. Damit wird der Zusammenhang zu den Daten des Simplexverfahrens hergestellt. 

Satz 3.5.1 a) Es sei A ∈ R m×n , gegeben. Zu y ∈ {x : Ax ≥ 0} \ {0} ist keg(y) genau dann 

Kante, wenn eine Untermatrix A (L) maximalen Ranges |L| = n − 1 existiert mit A (L) y = 0. 

b) Das Polyeder X = {x : Ax = b, x ≥ 0} zu (LP3) sei durch A ∈ R m×n , b ∈ R m , gegeben und 

es sei z ∈ X Ecke mit Basis A J . Für l ∈ K = {1, . . . , n} \ J und den Spaltenvektor w l = A −1 

J 

a l 

der Matrix W K aus (2.3.6) gelte 

Dann ist {z − tw l : t ≥ 0} ∩ X Kante von X. 

J + (w l ) ⊆ J(z), d.h. w il > 0 ⇒ z i > 0 ∀i ∈ J. 

Beweis a) ist analog zum Beweis von Satz 3.4.3a), wegen des eindimensionalen Kerns ist der Vorfaktor 

bei ty frei. 

b) Nach (2.3.7) wird das Gleichungssystem Ax(t) = b durch jeden Punkt des Strahls 

( 

) 

A −1 

J 

x(t) = z − tw l = 

(b − ta l) 

te (K) 

l 

erfüllt. Zu prüfen ist das Vorzeichen x(t) ≥ 0, ∀t ∈ [0, ε], ε > 0. Dabei ist der Fall 

• w il ≤ 0: keine Einschränkung an t, 

• z i > 0, w il > 0: erfüllbar mit t > 0, 

• z i = 0, w il > 0: unerfüllbar für t > 0. 

✻ 

Nach Voraussetzung tritt der letzte (rote) Fall nicht auf und die Kante 

hat daher eine positive Länge t l > 0, vgl. (2.3.10). 

ZZ S := {x(t) : t ∈ [0, ∞)} ∩ X ist Kante. Für festes t > 0 ist J(x(t)) ⊆ 

J ∪ {l} mit l ∈ K. Nun sei x(t) = 1 2 

(u + v) mit u, v ∈ X. 

Wie früher folgt daraus J(u), J(v) ⊆ J ∪ {l}, denn für einen Index k ∈ K gilt, wenn 

k = l : x l (t) = t = 1 2 (u l + v l ) ⇒ u l = αt, v l = (2 − α)t, α ∈ [0, 2], 

k ≠ l : x k (t) = 0 = 1 2 (u k + v k ) ⇒ u k = v k = 0. 

Mit der Basisdarstellung (2.3.5) überträgt sich das auf die J-Komponenten: 

u J = z J − αtA −1 

J a l ∈ S, v J = z J − (2 − α)tA −1 

J a l ∈ S, 

somit kann x(t) nur aus Elementen von S konvex kombiniert werden, S ist daher Kante. 

z i − tw il 

✏ 

 

❍ 

✏ ❍❍❍❍❍❍❍❍ 

✏✏✏✏✏✏✏ 

 

 

✲ t


Nur spitze Kegel besitzen Ecken. Eine wichtige Schlußweise in spitzen Kegeln K ist, dass für 

die Null nur die triviale konische Kombination möglich ist, 

k∑ 

λ i y (i) = 0, mit y (i) ∈ K, λ i ≥ 0 ⇒ (λ i ) = 0. 

i=1 

Denn andernfalls wäre für λ j > 0 mit y (j) auch −y (j) = ∑ i≠j (λ i/λ j )y (i) ∈ K und K hätte 

nichttrivialen Linealraum, da keg(y (j) , −y (j) ) = span(y (j) ) ⊆ L(K). 

Satz 3.5.2 Wenn der konvexe Kegel K := {x : Ax ≥ 0}, A ∈ R m×n , spitz ist, kann K durch 

die Richtungen seiner Kanten erzeugt werden. 

Beweis Nach Satz 3.4.8 ist K = keg(y (1) , . . . , y (k) ) darstellbar. Diese Darstellung sei oBdA minimal, 

also kein y (i) als konische Kombination der anderen darstellbar. Alle y ∈ K \ {0} besitzen eine konische 

Darstellung y = ∑ k 

i=1 λ iy (i) , λ i ≥ 0. Wenn dabei mindestens zwei λ i > 0 sind, ist keg{y} keine Kante. 

ZZ Strahl S := keg(y (j) ) = {αy (j) : α ≥ 0} ist Kante von K. Dazu wird für α > 0 eine beliebige 

Konvexkombination betrachtet mit x = ∑ k 

i=1 µ iy (i) , z = ∑ k 

i=1 ν iy (i) , (µ i ), (ν i ) ∈ R k +, und λ ∈ (0, 1) für 

αy (j) = λx + (1 − λ)z = 

⇒ (α − λ j )y (j) = ∑ i≠j 

k∑ 

i=1 

(λµ i + (1 − λ)ν i 

) 

y (i) = 

λ i y (i) , λ i = λµ i + (1 − λ)ν i ≥ 0. 

k∑ 

λ i y (i) 

i=1 

Fall α − λ j > 0: Division durch α − λ j > 0 ergibt konische Kombination von y (j) , Widerspruch 

zur Minimalannahme. 

λ j − α > 0: 0 = (λ j − α)y (j) + ∑ i≠j λ iy (i) ist nichttriviale konische Kombination der Null, 

die aber n.V. nur trivial möglich ist, 

λ j − α = 0 und λ i = 0 für i ≠ j ist die einzige mögliche Situation 

⇒ αy (j) = λ j y (j) ist nur durch x, z ∈ S selbst darstellbar, also ist S Kante. 

Für das folgende Theorem wird keg(∅) := {0} verabredet. 

Theorem 3.5.3 (Dekompositionssatz) Es sei X := {x ∈ R n : Ax ≥ b} ≠ ∅ das durch A ∈ 

R m×n , b ∈ R m bestimmte Polyeder, und L(X) = {0}. Dann ist X die Summe eines Polytops und 

eines endlich erzeugten Kegels. Mit den Ecken x (i) , i = 1, . . . , k, von X und Kantenrichtungen 

y (j) , j = 1, . . . , l, von O + (X) gilt 

X = konv ( E(X) ) + O + (X) 

= konv ( x (1) , . . . , x (k)) + keg ( y (1) , . . . , y (l)) . 

Beweis Der Beweis verläuft analog zum Satz von Krein-Milman unter Einbeziehung des Ausdehnungskegels 

durch Induktion über q = dim X. Für die Existenz nichttrivialer Stützebenen wird bei Bedarf 

wieder mit dem volldimensionalen konvexen Polyeder X + C, C = L(aff(X)) ⊥ , gearbeitet. Für Punkt 

oder Strecke/Strahl gilt die Aussage mit q ≤ 1. Nun sei z ∈ X beliebig. Dann gilt einer der Fälle


a) z ∈ Rd(X + C): nach S. 3.2.13 existiert eine Stützebene H mit 

z ∈ H ∩ X, (X + C) ⊆ H ⊖ und X ⊈ H. Dann ist dim(X ∩ H) < q 

und die Behauptung folgt aus der I.V. 

b) z liegt im Inneren von X +C. Dann existiert eine Gerade G := {z+ 

tu : t ∈ R} durch z, die ein Stück weit in X verläuft, G∩(X\{z}) ≠ ∅. 

Dabei ist u ∈ L(aff(X)). Wegen L(X) = {0} kann G nicht vollständig 

zu X gehören, G ⊈ X, und schneidet daher den Rand von X + C. 

b1) Es gibt zwei Schnittpunkte x, y mit dem Rand und z = λx + (1 − 

λ)y, λ ∈ (0, 1). Für x und y trifft Fall a) zu. 

b2) Es gibt einen Schnittpunkt x mit dem Rand und x + tu ∈ X 

∀t ≥ 0. Dann ist u ∈ O + (X) = keg(y (1) , . . . , y (l) ) nach Satz 3.5.2 

und zeigt die Behauptung, denn für x trifft wieder Fall a) zu. 

Der Dekompositionssatz verallgemeinert den Satz über Lösungsmengen von Linearen Gleichungssystemen, 

verwendet aber mehrere spezielle inhomogene Lösungen E(X) und die allgemeine 

homogene Lösung im Kegel O + (X). 

LGS Ax = b : X = {ˆx} + Kern(A) 

UGlS Ax ≥ b : X = konv(E(X)) + O + (X). 

Beispiel 3.5.4 Zusammenfassung der Beispiele 3.4.4/8: das Polyeder X := {x : Ax ≥ b} mit 

⎛ ⎞ ⎛ ⎞ 

−1 1 

0 

✻ 

A = 

−1 −1 

⎜ 

⎝ 0 −1 

⎟ 

⎠ , b = −4 

⎜ 

⎝−3 

⎟ 

⎠ 

❍ 

 

❍❍❍❍❍ 

1 −2 −6 

 

♣ ♣ ♣ ♣ ♣ ♣ 

♣ ♣ ♣ 

❅ 

❅❅ 

✟ 

✟ ✟✟✟✟ 

♣ ♣ ♣ 

♣ ♣ 

♣ ♣ 

♣ ♣ 

läßt sich darstellen in der Form 

♣ 

♣ 

♣ ♣ 

 

✟ 

 

( ( ( ( ) ( ) X 

2 1 0 −1 −2 

 

X = konv{ , , } + keg{ , }. 

2) 

3) 

3) 

−1 −1 

✟ ✟✟✟✟✟✟✟✟✟✟ 

✲ 

Im Bild zeigt der punktierte Teil das Polytop konv(E(X)), 

unten ist schraffiert der Ausdehnungskegel O + (X) eingezeichnet, 

welcher im Theorem an jeden Punkt des Polytops 

✟ ✟✟✟✟✟ 

 

”angeheftet” wird. Die zwei extremalen verschobenen Kegel 

sind ebenfalls angedeutet. 

Bedeutung für das Simplex-Verfahren: Der Dekompositions-Satz 3.5.3 ist die Arbeitsgrundlage 

für das Simplexverfahren. Da das Minimum der linearen Zielfunktion von (LP), wenn 

es existiert, auch auf den Ecken angenommen wird, müssen daher nur diese untersucht werden. 

Und Satz 3.4.3 bestätigt, dass diese gerade durch Basislösungen gegeben sind. Um zusätzlich 

die Beschränktheit sicherzustellen, sind auch diejenigen Kanten des Polyeders, auf denen die 

Zielfunktion wächst, auf endliche Länge zu prüfen. Satz 3.5.1 stellt hierfür die Verbindung zum 

Simplexverfahren her.


3.6 Existenzsätze für Ungleichungssysteme 

Die bisherigen Sätze bezogen sich naturgemäß auf den Fall nichtleerer zulässiger Bereiche X. 

Kriterien für die Gültigkeit dieser Voraussetzung, d.h., die Lösbarkeit der Ungleichungssysteme, 

werden jetzt als weitere Anwendung der Trennungssätze aus §3.2 hergeleitet. Grundlage ist das 

folgende Lemma von Farkas, es bildet insbesondere auch die Basis für die wichtige Dualitätstheorie 

linearer Programme. Die klassische Form orientiert sich an (LP3): 

Satz 3.6.1 (Farkas) Mit A ∈ R m×n , b ∈ R m gilt 

( 

{x ∈ R n : Ax = b, x ≥ 0} ≠ ∅ ⇐⇒ y T A ≤ 0 T ⇒ y T b ≤ 0 ∀y ∈ R m) . (3.6.1) 

Beweis ”⇒” Wenn ein ˆx ≥ 0 existiert mit Aˆx = b ergibt sich direkt 

y T A ≤ 0 ⇒ y T b = (y T A) 

}{{} 

ˆx ≤ 0. 

≥0 

”⇐” Nun gelte die Folgerung ”y T A ≤ 0 T ⇒ y T b ≤ 0 ∀y ∈ R m ”, die Lösungsmenge sei aber leer. Dann liegt 

also b nicht im abgeschlossenen Kegel K := AR n + = {Ax : x ≥ 0} = keg{a 1 , . . . , a n }. Nach Satz 3.2.13 

existiert daher eine strikt trennende Hyperebene H(q, α) mit 

K ⊆ H − (q, α) und b ∈ H + (q, α) ⊆ H + (q, 0). 

Denn wegen 0 ∈ K ist dabei 0 < α und daher q T b > α > 0. Für alle Strahlen y (j) := λa j = λAe j , λ > 0, 

j ∈ N, gilt natürlich y (j) ∈ K ⊆ H − , also 

q T y (j) = λq T a j < α ⇒ q T α 

a j ≤ inf = 0 ∀j = 1, . . . , n. 

λ>0 λ 

Damit ist aber q T A ≤ 0 und n.V. q T b ≤ 0, also b ∈ H ⊖ (q, 0) im Widerspruch zu b ∈ H + (q, 0). 

Geometrische Interpretation: Die Lösbarkeit des Systems auf der linken Seite bedeutet, dass 

b als konische Kombination der Spalten von A ausgedrückt werden kann, b ∈ AR n + =: K. Die 

rechte Seite von (3.6.1) heißt, dass y ∈ H ⊖ (b, 0) = {b} ∗ gilt für jeden Vektor y ∈ {a 1 , . . . , a n } ∗ 

aus dem Polarkegel K ∗ = (AR n +) ∗ . Also entspricht (3.6.1) der einfachen Aussage: 

b ∈ A · R n + = keg{a 1 , . . . , a n } ⇐⇒ {a 1 , . . . , a n } ∗ ⊆ {b} ∗ = H ⊖ (b, 0). 

❆ 

Beispiel 3.6.2 Bei 

❆ 

✁ ✁✁ 

b ⊥ ❆ a 2 

( ) 

✁ K 

❆ 

3 1 1 

❍ ❆ 

✁ ✁✕ 

A = 

❍ 

❍ ❆ 

✁ a 3 

1 2 1 

b ✏✶ 

❍ 

❍ ❆ 

❍ ❆ 

✁ 

ist a 3 = 1 5 a 1 + 2 5 a ❍ 

2, also K := AR 3 ❍ 

+ = keg{a 1 , a 2 }. 

❆ 

✟✏ ✏✏✏✏✏✏✏✏✏ 

✟✟✟✟✟✯ ✁ ✒ a1 

✁ 

❇ 

Daher ist der Polarkegel K ∗ ❆ 

= {y : 3y 1 + y 2 ≤ 0, y 1 + 

❇ 

2y 2 ≤ 0}, und ist darstellbar als K ∗ = keg{y (1) , y (2) K ∗ ❆ 

❇ 

} 

mit y (1) = ( ) 

1 

−3 , y (2) = ( ❆ 

) 

❇ 

−2 

❆ 

1 . Es liegt K ∗ ⊆ {b} ∗ , wenn 

❇ 

❆ 

alle Erzeugenden y (i) ❇ 

dies tun. Also gilt b ∈ K ⇐⇒ 

❆ 

❇ ❆ 

b T y (i) ≤ 0, i = 1, 2. 

❇❇ 

❆


Analoge Lösbarkeitssätze gibt es auch für die allgemeine Standardform. 

Satz 3.6.3 Mit A ij ∈ R m i×n j 

, b i ∈ R m i 

, i, j = 1, 2, sind äquivalent: 

∃ x 1 ∈ R n 1 

, x 2 ∈ R n 2 

mit 

⎧ 

⎪⎨ 

⎪⎩ 

A 11 x 1 + A 12 x 2 ≥ b 1 

A 21 x 1 + A 22 x 2 = b 2 

x 1 ≥ 0 

und 

∀ y 1 ∈ R m 1 

, y 2 ∈ R m 2 

mit 

⎧ 

⎪⎨ 

⎫ 

⎪⎬ 

y1 TA 11 + y2 TA 21 ≤ 0 T 

y1 ⎪⎩ 

TA 12 + y2 TA 22 = 0 T 

⎪⎭ ⇒ yT 1 b 1 + y2 T b 2 ≤ 0. 

y 1 ≥ 0 

Beweis Umformung mit Schlupfvariablen z ≥ 0 und der Zerlegung x 2 = x + 2 − x− 2 , x± 2 

Form A¯x = b, ¯x ≥ 0 mit 

( 

) 

A 11 A 12 −A 12 −I 

A = 

, b = 

A 21 A 22 −A 22 0 

( ) 

b 1 

, ¯x = 

b 2 

⎛ 

⎜ 

⎝ 

x 1 

x + 2 

x − 2 

z 

⎞ 

⎟ 

⎠ 

≥ 0, ergibt die 

Dieses ist genau dann lösbar, wenn die Folgerung gilt: 

⎛ 

0 ≥ A T y = ⎜ 

⎝ 

A T 11y 1 + A T 21y 2 

A T 12y 1 + A T 22y 2 

−A T 12y 1 − A T 22y 2 

−y 1 

⎞ 

⎟ 

⎠ ⇒ yT b = y1 T b 1 + y2 T b 2 ≤ 0. 

Die mittleren Ungleichungen bedeuten natürlich A T 12y 1 + A T 22y 2 = 0. 

Die anderen Formen der Standardprogramme sind darin als Spezialfälle enthalten, als Übersicht: 

(LP1) {x ∈ R n : Ax ≥ b} ≠ ∅ ⇐⇒ {y T A = 0 T ⇒ y T b ≤ 0 ∀y ∈ R m + } 

(LP2) {x ∈ R n : Ax ≥ b, x ≥ 0} ≠ ∅ ⇐⇒ {y T A ≤ 0 T ⇒ y T b ≤ 0 ∀y ∈ R m + } 

(LP3) {x ∈ R n : Ax = b, x ≥ 0} ≠ ∅ ⇐⇒ {y T A ≤ 0 T ⇒ y T b ≤ 0 ∀y ∈ R m } 

(LGS) {x ∈ R n : Ax = b} ≠ ∅ ⇐⇒ {y T A = 0 T ⇒ y T b = 0 ∀y ∈ R m } 

Als vierte Variante wurden Gleichungssysteme aufgenommen. Das Lösbarkeitskriterium dort ist 

bekanntlich b ∈ (A · R n ) = kern(A T ) ⊥ und wird oft als Fredholm-Alternative formuliert. Auch 

die obigen Kriterien können als Alternativsätze formuliert werden, z.B.: 

(LGS) Entweder ist Ax = b lösbar, oder y T A = 0 T , y T b = 1 

(LP1) Entweder ist Ax ≥ b lösbar, oder y T A = 0 T , y ≥ 0, y T b = 1 

(LP3) Entweder ist Ax = b, x ≥ 0 lösbar, oder y T A ≤ 0 T , y T b = 1 

Die Merkregeln für den Zusammenhang zwischen den Alternativsystemen entsprechen denen bei 

der Dualität und werden dort formuliert.

4 DUALE PROGRAMME 49 

4 Duale Programme 

4.1 Optimalitätskriterien 

Im letzten Abschnitt konnte die Lösbarkeit eines Ungleichungssystems mit Eigenschaften eines 

davon abgeleiteten Systems in Beziehung gesetzt werden. Dieser Zusammenhang kann auf 

vollständige Lineare Programme durch Betrachtung ihrer dualen Versionen ausgeweitet werden. 

Als wichtige Arbeitshilfe für die Praxis werden dabei Kriterien für die Optimalität eines zulässigen 

Punktes x hergeleitet, die (etwa durch einen Auftraggeber) effektiv nachprüfbar sind, da sie 

nur wenige Berechnungsschritte erfordern (”Einsetzen”). 

Ansatzpunkt ist eine Standardmethode bei Extremalproblemen mit Nebenbedingungen, die 

Verwendung von Lagrange-Multiplikatoren. Beim Problem (LP1) hat man m Nebenbedingungen 

Ax − b ≥ 0, verwendet dazu also Multiplikatoren y ∈ R m und bildet die Lagrangefunktion 

φ(x, y) = c T x + y T (b − Ax) = y T b + (c T − y T A)x. 

Die rechte Version zeigt, dass φ auch als Lagrangefunktion eines Extremalproblems für y, des 

dualen Problems, interpretiert werden kann. Beim Umgang damit sind aber auch Vorzeichenbedingungen 

zu berücksichtigen. Der Vollständigkeit halber wird die duale Form (LP*) zunächst 

zum allgemeinen primalen Programm (LP) angegeben. 

⎫ ⎧ 

min c T 1 x 1 + c T 2 x 2 

max b T 1 

A 11 x 1 + A 12 x 2 ≥ b 

⎪⎬ ⎪⎨ 

y 1 + b T 2 y 2 

1 

A T 11 

(LP) 

y 1 + A T 21 y 2 ≤ c 1 

A 21 x 1 + A 22 x 2 = b 2 

A T 12 

x 1 ≥ 0 

⎪⎭ ⎪⎩ 

y 1 + A T 22 y 2 = c 2 

y 1 ≥ 0 

In der Regel betrachtet man aber eine der Standardformen (LP1..3), für diese ist 

(LP1) 

(LP2) 

(LP3) 

min 

Ax 

min 

Ax 

min 

Ax 

c T x 

≥ b 

c T x 

≥ b 

x ≥ 0 

c T x 

= b 

x ≥ 0 

max 

A T y 

max 

A T y 

max 

A T y 

b T y 

= c 

y ≥ 0 

b T y 

≤ c 

y ≥ 0 

b T y 

≤ c 

(LP1*) 

(LP2*) 

(LP3*) 

(LP*) 

Die Übersicht zeigt jetzt den Grund, warum die Form (LP2) überhaupt betrachtet wird. Es ist 

dasjenige Programm, bei dem das duale i.w. die gleiche Gestalt hat. Die Übergänge (LP) → (LP*) 

und (LP*) → (LP**)=(LP) sind symmetrisch. Die Begründung für die Details der dualen Form 

liefern die im Anschluß folgenden Sätze, der Übergang geschieht nach folgenden Merkregeln: 

1. Aus einem Minimum-Problem wird ein Maximierungsproblem,


2. die Koeffizientenmatrix wird transponiert, 

3. der Gradientenvektor der Zielfunktion wird mit der rechten Seite des (Un-) Gleichungssystems 

getauscht, 

4. Ungleichungsrestriktionen werden ausgetauscht durch vorzeichenbeschränkte Variable, Gleichungen 

durch freie Variable und umgekehrt. 

Für die Zielfunktionen in zulässigen Punkten von primalem und dualem Programm gibt es 

einen grundlegenden Zusammenhang: 

Satz 4.1.1 Der Vektor x T = (x T 1 , xT 2 ) sei zulässig für (LP) und yT = (y1 T, yT 2 ) zulässig für 

(LP*). Dann gilt für die Zielfunktionen c T x = c T 1 x 1 +c T 2 x 2 und b T y = b T 1 y 1 +b T 2 y 2 die Beziehung 

c T x ≥ b T y. 

Bei Gleichheit, c Tˆx = b T ŷ, ist ˆx optimal für (LP) und ŷ optimal für (LP*). 

Beweis Für primal zulässige x ∈ X ⊆ R n bzw. dual zulässige y ∈ Y ⊆ R m gilt 

y T b = y1 T b 1 + y2 T b 2 ≤ y1 

T (A 11 x 1 + A 12 x 2 ) + y2 T (A 21 x 1 + A 22 x 2 ) 

}{{} 

≥0 

= (y1 T A 11 + y2 T A 21 ) x 

}{{} 1 +(y1 T A 12 + y2 T A 22 )x 2 ≤ c T 1 x 1 + c T 2 x 2 = c T x. 

≥0 

Für Punkte ˆx ∈ X und ŷ ∈ Y mit c Tˆx = b T ŷ ist dann insbesondere auch c T x ≥ b T ŷ = c Tˆx ∀x ∈ X und 

b T y ≤ c Tˆx = b T ŷ ∀y ∈ Y , also ˆx, ŷ extremal. 

Anwendung Bei Kenntnis von zulässigen Punkten ˆx, ŷ ist die Prüfung auf Optimalität, ”c Tˆx = 

b T ŷ?”, trivial (z.B., für Auftraggeber). Und trivialerweise erhält man mit jedem dual zulässige 

y aus b T y eine untere Schranke für den Optimalwert bei (LP). 

Einzelne Eigenschaften der Programme haben eine bestimmte Bedeutung für das dazu duale. 

Es sei daran erinnert, dass mit der Lösung eines Programms eine Optimallösung gemeint ist. 

Ein Problem mit nichtleerem zulässigem Bereich nennt man konsistent, ansonsten inkonsistent. 

Die folgenden Sätze werden jeweils nur für dasjenige Standardprogramm (LPi) bewiesen, dessen 

Form sich dazu anbietet. Sie gelten aber natürlich für (LP). In den folgenden Beweisen spielt 

das Lemma von Farkas eine zentrale Rolle. 

Satz 4.1.2 Die Probleme (LP) und (LP*) seien beide konsistent. Dann existieren auch Lösungen 

für beide Programme. 

Beweis Der Nachweis erfolgt für das symmetrisch aufgebaute Programm (LP2). Mit dem Satz von 

Farkas, (3.6.1) ist die Voraussetzung X ≠ ∅, Y ≠ ∅ äquivalent mit 

{ 

∀u ≥ 0 mit u T A ≤ 0 ⇒ u T b ≤ 0, 

∀v ≥ 0 mit −Av ≤ 0 ⇒ −v T (4.1.1) 

c ≤ 0.


Und mit Satz 4.1.1 entspricht die Behauptung der Lösbarkeit des Systems 

⎛ ⎞ ⎛ ⎞ 

A 0 ( ) b ( ) 

⎜ 

⎝ 0 −A T ⎟ x ⎜ ⎟ x 

⎠ ≥ ⎝−c⎠ , ≥ 0. (4.1.2) 

−c T b T y 

y 

0 

Man beachte, dass dabei in der letzten Zeile wegen Satz 4.1.1 nur Gleichheit in Frage kommt. Nach 

Farkas, (3.6.1) ist diese Lösbarkeit äquivalent mit 

{ 

} 

u T A ≤ λc T 

∀u ≥ 0, v ≥ 0, λ ≥ 0 mit 

⇒ u T b ≤ v T c. (4.1.3) 

Av ≥ λb 

Wenn dabei λ = 0 ist, entspricht dies der Voraussetzung (4.1.1), ist deshalb erfüllt und zeigt die Lösbarkeit. 

Im Fall λ > 0 kann man aber die Folgerung von (4.1.3) direkt aus den Prämissen von (4.1.3) 

schließen, indem man diese mit v, u ≥ 0 multipliziert: 

}{{} 

λ c T v ≥ (u T A)v = u T (Av) ≥ 

>0 

}{{} 

λ 

>0 

Also gilt auch im Fall λ > 0: u T b ≤ v T c in (4.1.3) und zeigt die Lösbarkeit von (4.1.2). 

Man beachte, dass in (4.1.2) die Lösung von (LP) und (LP ∗ ) auf ein reines Ungleichungssystem 

zurückgeführt wurde. 

Der folgende Satz nutzt die Tatsache aus, dass in einer Lösung von Problem (LP1) nur ein Teil 

der Restriktionen straff sind, vgl. Satz 3.4.3. Im Beweis wird ein Zusammenhang zwischen den 

Lösungen von Primal- und Dual-Problem konstruiert, der weitergehende Bedeutung hat. 

u T b. 

Satz 4.1.3 Es sei ˆx ∈ R n eine Lösung von (LP1) und A ∈ R m×n , b ∈ R m . 

a) Mit L ⊆ {1, . . . , m}, K = {1, . . . , m} \ L gelte dabei 

A (L)ˆx = b L , A (K)ˆx > b K . 

Dann ist ˆx auch Lösung des reduzierten Programms min{c T x : A (L) x ≥ b L }. 

b) Dann hat das duale Programm (LP1*) eine Lösung. 

Beweis a) Da im reduzierten Programm weniger Restriktionen gelten, hat es keinen größeren Wert als 

(LP1). Nun sei angenommen, es besitze eine Lösung ¯x mit Wert c T¯x < c Tˆx. Damit werden die Punkte 

x(λ) := λ¯x + (1 − λ)ˆx = ˆx + λ(¯x − ˆx), λ ∈ [0, 1], betrachtet. Diese erfüllen die L-Restriktionen, denn 

A (L) x(λ) = λA (L)¯x + (1 − λ)A (L)ˆx ≥ (λ + 1 − λ)b L = b L . 

Wegen des Spielraums in den lockeren Restriktionen gibt es aber ein ɛ > 0 so, dass auch noch 

A (K) x(ɛ) = A (K)ˆx + ɛA (K) (¯x − ˆx) ≥ b K 

gilt, also ist x(ɛ) zulässig bei (LP1). Nach Annahme ist dort aber die Zielfunktion 

c T x(ɛ) = c Tˆx + ɛ (c T¯x − c Tˆx) < c Tˆx 

} {{ } 


echt kleiner und widerspricht der Voraussetzung über ˆx. 

b) Für ein beliebiges zulässiges Element x des reduzierten Programms gilt nach Teil a) A (L) x ≥ b L = 

A (L)ˆx und c T x ≥ c Tˆx, also die Folgerung 

A (L) (ˆx − x) ≤ 0 ⇒ c T (ˆx − x) ≤ 0 ∀x ∈ R n . 

Nach Satz 3.6.3 (Farkas) ist daher die Menge Y L := {y L : y T L A(L) = c T , y L ≥ 0} ≠ ∅. Daraus folgt aber 

sofort, dass der zulässige Bereich Y := {y ∈ R m : y T A = c T , y ≥ 0} von (LP1*) ebenfalls nicht leer ist. 

Denn mit y L ∈ Y L liegt y T := (y T L , yT K ), y K := 0 K in Y , es gilt 

y T A = y T LA (L) + 0 T KA (K) = c T , sowie y T b = y T Lb L + 0 T Kb K = y T LA (L)ˆx = c Tˆx. (4.1.4) 

Da die Zielfunktionen gleiche Werte haben, ist nach Satz 4.1.1 jedes solche y optimal bei (LP1*). 

Im Beweis wurde also mit den straffen Restriktionen eine duale Lösung konstruiert. Wenn die 

zugehörige Untermatrix A (L) maximalen Rang hat, besteht Y L aus genau einem Punkt y L , der 

durch Nullen zu einer Lösung y T = (yL T, 0T K 

) von (LP1*) ergänzt werden kann. 

Theorem 4.1.4 (Dualitätssatz) 

Das Lineare Programm (LP) ist genau dann lösbar, wenn (LP*) lösbar ist. 

Beweis Der Beweis wird bei (LP1) geführt, im Satz 4.1.3 wurde dazu schon die Lösbarkeit von (LP1 ∗ ) 

bei Lösbarkeit von (LP1) gezeigt. Umgekehrt sei (LP1 ∗ ) lösbar, also auch das äquivalente Programm 

⎛ ⎞ ⎛ ⎞ 

A T c 

min(−b T ⎜ 

y) : ⎝−A T ⎟ ⎜ ⎟ 

⎠ y ≥ ⎝−c⎠ =: d. 

I 0 

Dieses hat die Standardform (LP1) und nach Satz 4.1.3 ist dann dessen Dual auch lösbar, also existiert 

ẑ T = (z T −, z T +, u T ) ≥ 0 T mit 

max d T z = d T ẑ = c T (z − − z + ) mit − b T = (z−, T z+, T u T ⎜ 

) ⎝−A T ⎟ 

⎠ = z−A T T − z+A T T + u T . 

I 

Der Vektor ˆx := z + − z − ∈ R n erfüllt also Ax = A(z + − z − ) = b + u ≥ b und ist Maximalstelle von −c T x, 

also Lösung von (LP1). 

Wenn beide Probleme inkonsistent sind, ist die Situation klar. Andernfalls gilt: 

⎛ 

A T 

⎞ 

Satz 4.1.5 Wenn nur eines der Programme (LP) oder (LP*) zulässige Punkte hat, dann ist 

dessen Zielfunktion unbeschränkt. 

Beweis Ist (LP1 ∗ ) inkonsistent, also {y : A T y = c, y ≥ 0} = ∅, gibt es aufgrund der Farkas-Alternative 

in §3.6 ein u ∈ R n mit 

−u T A T ≤ 0 T und (−u T )c = 1 ⇐⇒ Au ≥ 0, c T u = −1.


Dann ist u ∈ O + (X) und mit beliebigem zulässigem x ist auch x + tu, t ≥ 0, zulässig: A(x + tu) = 

Ax + tAu ≥ Ax ≥ b. Die Zielfunktion aber ist unbeschränkt, c T (x + tu) = c T x − t → −∞ (t → ∞). 

Die Beschränktheit von (LP1) wurde schon am Ende von §3.4 behandelt, dort wurde das Kriterium 

c ∈ A T R m + über Polarkegel hergeleitet. Es entspricht gerade der Lösbarkeit des Systems 

A T y = c, y ≥ 0. 

Insgesamt ergibt sich folgende Situation: 

Zusammenfassung (LP) hat zulässige Punkte (LP) inkonsistent 

(LP*) hat zulässige Punkte (LP) und (LP*) lösbar (LP*) unbeschränkt 

(LP*) inkonsistent (LP) unbeschränkt keine Lösungen 

4.2 Komplementarität 

Zur Vorbereitung des Dualitätssatzes wurde in Satz 4.1.3 i.w. die Konstruktion einer dualen 

Optimallösung aus der primalen durchgeführt. Ansatzpunkt war die Erkenntnis, dass in Optimallösungen 

bestimmte Restriktionen straff sind, d.h., Gleichheit gilt. Eine analoge Formulierung 

bzw. Schlußweise verwendet dazu die folgende strukturelle Orthogonalität bei nicht-negativen 

Vektoren: 

u, v ≥ 0, u T v = 0 ⇒ ∀i : 

{ 

} 

u i = 0 oder v i = 0 

Satz 4.2.1 (Komplementarität) 

a) Es sei x zulässig für (LP1), y für (LP1*). Beide Punkte sind genau dann optimal, wenn gilt 

{ 

y T y i > 0 ⇒ a (i)T x = b i 

(Ax − b) = 0, d.h., für i = 1, . . . , m : 

a (i)T x > b i ⇒ y i = 0 . 

b) Es sei x zulässig für (LP) und y für (LP*). Beide Punkte sind genau dann optimal, wenn gilt 

y T (Ax − b) = 0 und (c T − y T A)x = 0. (4.2.1) 

Beweis Für zulässige x, y gilt beim allgemeinen Problem 

y T (Ax − b) = y1 T (A 11 x 1 + A 12 x 2 − b 1 ) + y2 T (A 21 x 1 + A 22 x 2 − b 2 ) ≥ 0 

(c T − y T A)x = (c T 1 − y1 T A 11 − y2 T A 21 )x 1 + (c T 2 − y1 T A 12 − y2 T A 22 )x 2 ≥ 0 

Addition der beiden Formeln liefert 

0 ≤ y T (Ax − b) + (c T − y T A)x = y T Ax − y T b + c T x − y T Ax = c T x − y T b, 

und die Differenz verschwindet nach Satz 4.1.1 genau dann, wenn x und y optimal sind. 

Anmerkung: In Teil b) des Satzes wurde zur einfacheren Darstellung eine etwas verkürzte 

Schreibweise gewählt. Die Anteile der Gleichungsrestriktionen an den Innenprodukten verschwinden 

von vorneherein. In den restlichen bedeutet (4.2.1) ausführlich 

y1 T (A 11 x 1 + A 12 x 2 − b 1 ) = 0, (c T 1 − y1 T A 11 − y2 T A 21 )x 1 = 0.


Damit markieren die nichtverschwindenen Komponenten von y 1 die straffen Restriktionen von 

(LP) und die nichttrivialen bei x 1 die straffen bei (LP*). 

Man redet im Zusammenhang mit Satz 4.2.1 auch von komplementärem Schlupf. Denn die Ungleichungen 

in (LP) und (LP*) können durch Einführung von Schlupfvariablen u 1 ≥ 0, v 1 ≥ 0 

zu Gleichungsrestriktionen gemacht werden, A 11 x 1 + A 12 x 2 − u 1 = b 1 , A T 11 y 1 + A T 21 y 2 + v 1 = c 1 . 

Damit entspricht die Bedingung (4.2.1) einfach der Aussage 

y1 T u 1 = 0, v1 T x 1 = 0, 

dass je Komponente die Schlupfvariable im { primalen 

dualen 

Problem verschwindet. 

Problem oder die Variable im { 

dualen 

primalen 

Schattenpreise: Außer den Existenzaussagen zu Lösungen können aus dem dualen Problem 

auch quantitative Angaben zum Primalproblem abgeleitet werden. Die Größe b enthält in (LP1) 

die unteren Grenzen für die einzelnen Restriktionen (Resourcen bei Produktionsplanung in §1.2), 

die einer Verringerung der Kosten c T x im Wege stehen. In einem Lösungs-Paar ˆx, ŷ wird die 

Aufteilung der Restriktionen wie in Satz 4.1.3 benutzt, 

A (L)ˆx = b L , A (K)ˆx > b K , 

L ∪ K = {1, . . . , m}. 

Die Restriktionen zu L sind also straff, die zu K locker und aus dem Komplementaritätssatz 

folgt ŷ K = 0. Für die Zielfunktion gilt damit W := c Tˆx = b T ŷ = b T LŷL. Für eine Verringerung der 

Kosten ist es sicher nicht sinnvoll, lockere Restriktionen aus K weiter zu lockern. In dem dualen 

Wert b T ŷ kommt das dadurch zum Ausdruck, dass eine Verkleinerung von b K wegen ŷ K = 0 

keine Auswirkung hätte. Dagegen stellen die straffen Restriktionen aus L Flaschenhälse dar. Bei 

einer kleinen Verringerung b L → b L −¯b L ≤ b L (‖¯b L ‖ ≤ ɛ) bleibt die zugehörige Lösung ˆx−¯x in der 

Regel (z.B., im generischen Fall |L| = n, A (L) regulär) weiterhin zulässig mit A (K) (ˆx − ¯x) ≥ b K , 

und die Zielfunktion verändert sich gemäß 

c T (ˆx − ¯x) = (b L − ¯b L ) T ŷ L = W − ¯b T Lŷ L . (4.2.2) 

Also gibt die Komponente ŷ i für i ∈ L an, welche direkte Auswirkung eine Verkleinerung der 

Schranke b i auf den Zielwert hätte. 

Geometrische Interpretation Die nichttrivialen Werte ŷ L 

der dualen Variablen erfüllen die Bedingungen ŷ T L A(L) = 

c T , ŷ L ≥ 0. Geometrisch bedeutet das, dass der Zielgradient 

c konische Kombination der L-Zeilen von A ist, also 

in dem davon erzeugten Kegel liegt, c ∈ keg{a (j) : j ∈ L}. 

Dies ist auch geometrisch klar, denn da die a (j) die nach 

innen (!) zeigenden Normalen auf den Randflächen H j des 

Polyeders X sind, würde andernfalls das Minimum überhaupt 

nicht in ˆx (roter Punkt) angenommen. Verringert 

✻❆ H 1 X 

❆ 

❆ 

❆ c 

❆ 

❆ y 2 a (2) 

❆ ✒ 

❆ ✻ 

H 2 ❆✟ ✟✟✟✟✯ y 1 a (1) 

 

❆ ❜ 

❆ 

❆ 

✲H 2 

′


man im Bild (J = {1, 2}) den Wert b 2 etwas, entspricht die neue Nebenbedingung der gestrichelten 

Ebene H 2 ′ und der Optimalpunkt bewegt sich mit (offener Kreis). Der Wert cT x ändert 

sich aber nicht im gleichen Ausmaß, nur proportional zu y 2 , da a (2) im Bild nur einen kleineren 

Anteil an c hat. 

Ökonomische Interpretation Man nennt die Komponenten ŷ i der dualen Variablen auch 

Schattenpreise, da ihr Wert angibt, bei welchem Preis sich für den Nutzer eine Verkleinerung 

von b i lohnt, da die Änderung der Kostenfunktion c T x nach (4.2.2) gerade −ŷ i multipliziert mit 

der Änderung ¯b i ist. Diese Interpretation läßt sich anhand der Beispiele aus §1.2 erläutern. 

Beispiel 4.2.2 Die Produktionsplanung ist ein Maximierungsproblem, wobei c j der Gewinn für 

das Produkt P j und b i der Umfang der begrenzten Resource R i ist. Mit einer Lösung y des 

dualen Programms 

m∑ 

min b T y, y i a ij ≥ c j , j = 1, . . . , n, y ≥ 0, 

i=1 

kann y i als innerer oder Schattenpreis der Resource R i interpretiert werden. Nach der Vorüberlegung 

darf die (Vergrößerung der) Resource R i höchstens diesen Preis y i kosten, damit beim 

Verkauf ein Zugewinn bleibt. Das duale Programm bestimmt diese Preise so, dass der innere 

Gesamtpreis der verwendeten Resourcen ∑ i b iy i = c T x beim Verkauf der Produkte (x j ) exakt 

erzielt wird. Dabei unterschreitet der innere Einzelpreis ∑ i y ia ij von Produkt P j nicht den beim 

Verkauf erzielten äußeren Preis c j . Die Folgerungen des Komplementaritätssatzes 

{ n∑ 

j=1 

} 

a ij x j 

{ m ∑ 

i=1 

} 

y i a ij > c j ⇒ x j = 0 

können so interpretiert werden: 

• Eine Resource, die nicht ausgeschöpft wird, ist im Überfluß vorhanden und bekommt den 

inneren Preis null. 

• Ein Produkt, dessen innerer Preis höher als der außen erzielbare ist, wird nicht hergestellt. 

Beispiel 4.2.3 Beim Transportproblem aus §1.2 war s i die Kapazität von Produzent P i und r j 

der Bedarf von Abnehmer V j . Für die Formulierung mit Ungleichungen min{ ∑ m ∑ n 

i=1 j=1 c ijx ij : 

∑ n 

j=1 x ij ≤ s i , ∑ m 

i=1 x ij ≥ r j , x ij ≥ 0} hat das duale Problem die Form 

( n∑ 

max v j r j − 

j=1 

m∑ ) 

u i s i : v j − u i ≤ c ij , u i , v j ≥ 0. 

i=1 

Interpretiert man u i als Herstellungspreis bei P i und v j als Abnahmepreis bei V j , bedeutet diese 

Form, dass zwar der Gesamtgewinn ∑ v j r j − ∑ u i s i maximiert wird, aber die Gewinnspannen 

v j − u i im Einzelfall nicht über den Transportkosten c ij liegen.

5 DUALITÄT BEIM SIMPLEXVERFAHREN 56 

5 Dualität beim Simplexverfahren 

Die Dualitätsaussagen aus §4 liefern wichtige Hintergrundinformation zu den Eigenschaften eines 

linearen Programms. Tatsächlich kann zwischen den Daten des Simplexverfahrens zum Primalproblem 

(LP3) und dessen Dualprogramm (LP3*) ein direkter Zusammenhang hergestellt 

werden, der zusätzliche Möglichkeiten bei der Implementierung von Simplexverfahren eröffnet. 

Bei (LP3) sind die beiden Programme 

min{c T x : Ax = b, x ≥ 0}, max{y T b : y T A ≤ c T } 

zueinander dual. Im Simplexverfahren aus §2.4 wird ein Hilfsvektor y T = c T J A−1 J 

berechnet. 

Wenn A J Basis zu einer (Optimal-) Lösung ˆx ist, gilt damit für den Vektor γ der reduzierten 

Kosten die Ungleichung 

0 ≤ γ T = c T − c T J A −1 

J A = cT − y T A, d.h. y T A ≤ c T . (5.0.1) 

Also ist dieser Vektor y eine dual zulässige Lösung. Wenn man die Lagrangefunktion φ = c T x + 

y T (b − Ax) aus der Einleitung von §4.1 betrachtet, ist der Kostenvektor gerade deren Gradient 

bezgl. x, γ T = ∇ x φ(x, y) = c T −y T A. Wegen γ J = 0 sind die J-Ungleichungen straff, y T A J = c T J , 

was genau der Aussage des Komplementaritätssatzes 0 = (y T A − c T )ˆx = 0 entspricht. Damit 

stimmen auch die Zielfunktionen y T b = c T J A−1 J 

b = cTˆx überein und der Vektor y ist daher sogar 

(Optimal-) Lösung von (LP3*). 

5.1 Duales Simplexverfahren 

Vollkommen unabhängig von der Zulässigkeit des primalen Vektors A −1 

J 

b gehört zu jeder Basis, 

die (5.0.1) erfüllt, ein dual zulässiger Vektor y. 

Definition 5.1.1 Eine Basis A J heißt dual zulässig, wenn (5.0.1) gilt mit y T = c T J A−1 J 

, sie 

heißt primal zulässig, wenn ¯x J = A −1 b ≥ 0, und optimal, wenn sie primal und dual zulässig ist. 

J 

Beim dualen Simplexverfahren arbeitet man mit den gleichen Basen A J wie in §2.4, startet 

aber mit einer dual zulässigen Basis. In Bezug auf das Primal-Problem ist der zugehörige Vektor 

¯x J = A −1 b zwar ”optimal”, aber i.A. nicht zulässig. Beim Basisaustausch werden daher negative 

J 

Komponenten ¯x p < 0 eliminiert. 

Mit dieser Variante gewinnt man zusätzliche Wahlmöglichkeiten der Verfahrensgestaltung. 

Z.B. gehört beim Problem (LP2), 

min{c T x : Ax − z = b, x ≥ 0, z ≥ 0}, 

das hier durch Schlupfvariablen ergänzt wurde, mit D = (A, −I) zu J = {n + 1, . . . , n + m} die 

Basis D J mit c J = 0. Die Basislösungen sind (¯x, ¯z) = (0, −b) und ȳ = 0. Daher 

ist die Basis D J = −I m 

{ 

primal zulässig für b ≤ 0, 

dual zulässig für c ≥ 0.


Im zweiten Fall läßt sich die Anlaufrechnung also durch Verwendung des jetzt entwickelten 

dualen Simplexverfahrens einsparen. 

Zur Herleitung sei jetzt also A J eine dual zulässige Basis mit 

y T = c T J A −1 

J 

, γT = c T − y T A ≥ 0, ¯x J = A −1 b, K = {1, . . . , n} \ J. 

Ist nun ¯x p < 0 für ein p ∈ J, so ist die duale Zielfunktion 

y T b = c T J A −1 

J 

b = cT J ¯x J 

noch nicht maximal. Der negative ”duale Schattenpreis” x p < 0 zeigt an, dass durch eine virtuelle 

Verkleinerung von c p , p ∈ J, eine Vergrößerung dieser Zielfunktion y ↦→ y T b erfolgen kann. Unter 

Inkaufnahme zusätzlichen Schlupfs in der Ungleichung c p − y T a p ≥ 0 betrachtet man analog zu 

(2.3.7) daher den Strahl 

y(λ) T := (c − λe p ) T J A −1 

J 

Für die duale Zielfunktion gilt dort tatsächlich 

J 

= y T − λ(e p ) T J A −1 

J 

, λ ≥ 0. (5.1.1) 

y(λ) T b = y T b − λ(e p ) T J A −1 

J b = yT b − λ¯x p > y T b für λ > 0. 

Allerdings muß dabei, wieder analog zu (2.3.10), die duale Zulässigkeit von y(λ) geprüft werden. 

Es ist zu fordern 

0 T ! ≤ c T − y(λ) T A = c T − y T A + λ(e p ) T J A −1 

J A = γT + λu T p , u T p := (e p ) T J A −1 

J A. 

Wegen γ J = 0 ist diese Bedingung für Indizes aus J automatisch erfüllt, γ T J + λ(e p) T J A−1 J A J = 

λ(δ pj ) j∈J ≥ 0 T . Auch ist für u p ≥ 0 zu erkennen, dass λ beliebig groß werden darf. In diesem 

Fall ist (LP3*) unbeschränkt und (LP3) inkonsistent, vgl. §4.1. Nur für negative Komponenten 

von u p = (u pj ) j ergeben sich Einschränkungen und führen zum maximal zulässigen Wert 

λ p := min{ γ j 

−u pj 

: u pj < 0, j ∈ K} = 

γ l 

−u pl 

. (5.1.2) 

Wenn das Minimum, wie angegeben, im Index l ∈ K angenommen wird, wird die entsprechende 

Ungleichung straff, 

0 = γ l + λ p u pl = c l − y T a l + λ p (e p ) T J A −1 

J a l = c l − y(λ p ) T a l . 

Der Index l wandert also in die Stützmenge J der straffen Ungleichungen bei (LP3 ∗ ), vgl. 

Satz 3.4.3. Umgekehrt ist für λ p > 0 in der Ungleichung zu p ∈ J nach Konstruktion das 

Gegenteil der Fall, 0 < c p − y(λ p ) T a p = λ p . Daher ist y(λ p ) die duale Basislösung zur Basis 

A J ′, 

J ′ = J \ {p} ∪ {l}. 

Analog zu Satz 2.3.5 läßt sich zeigen, dass A J ′ wegen u pl < 0 tatsächlich regulär ist. Die obigen 

Überlegungen werden zusammengefaßt zum folgenden Algorithmus:


Duales Simplex-Verfahren 

Eingabe: Dual zulässige Basis A J , J ⊆ {1, . . . , n} 

Schritt 1 x J := A −1 

J 

b, yT := c T J A−1 J 

, K := {1, . . . , n} \ J, 

2 suche x p < 0 unter x i , i ∈ J. 

3 wenn x i ≥ 0 ∀i ∈ J: STOP, Optimum! 

4 u pj := (e p ) T J A−1 J a j, j ∈ K, wenn u pj ≥ 0 ∀j ∈ K: STOP, (LP3) inkonsistent! 

5 

γ j := c j − y T a j , j ∈ K, suche l ∈ K: 

−γ l /u pl = min{−γ j /u pj : u pj < 0, j ∈ K} = λ p 

6 J := J \ {p} ∪ {l}, weiter mit 1 

Zur Durchführung sind wie beim Primalverfahren drei Gleichungssysteme zu lösen, etwa mit einer 

fortlaufend angepaßten LR-Zerlegung von A J . Dies sind zunächst wieder die drei Systeme 

A J x J = b, y T A J = c T J , und f T A J = (e p ) T J . Der Aufwand dafür liegt wieder bei O(m2 ) einschließlich 

der LR-Anpassung. Dann sind folgende Innenprodukte zu berechnen 

u pj = f T a j , j ∈ K, sowie c j − y T a j , für u pj < 0. 

Hierfür sind zwischen 2m(n − m) und 4m(n − m) Operationen nötig, dieser Anteil ist also etwa 

doppelt so groß wie beim primalen Verfahren aus §2.4. Bei vorhandener Wahlmöglichkeit hat 

das Primalverfahren also einen Effizienzvorteil. 

Beispiel 5.1.2 Für das Problem 

min 2x 1 + x 2 + 3x 3 

x 1 + x 2 + x 3 ≥ 1 

2x 1 − x 2 + 2x 3 ≤ −2 

x 1 + 2x 2 − 2x 3 ≥ 1 

x i ≥ 0 

⎫ 

⎪⎬ 

⎪⎭ 

⇐⇒ 

⎧ 

⎪⎨ 

⎪⎩ 

min 2x 1 + x 2 + 3x 3 

−x 1 − x 2 − x 3 +x 4 = −1 

2x 1 − x 2 + 2x 3 +x 5 = −2 

−x 1 − 2x 2 + 2x 3 +x 6 = −1 

x i ≥ 0 

gehört zu J = {4, 5, 6} eine dual, aber nicht primal zulässige Basis. Das duale Simplexverfahren 

führt hier mit den folgenden Daten in 2 Schritten zum Ziel: 

B-1 1. J = {4, 5, 6}, A J = I, ¯x T J = (−1, −2, −1), y = 0, yT b = 0. 

2. wähle p = 4, u T = (e 4 ) T J A−1 J A = eT 1 A = (−1, −1, −1, 1, 0, 0), (γ 1, γ 2 , γ 3 ) = (2, 1, 3); 

λ p = min{2, 1, 3} = 1 angenommen in l = 2. 

⎛ ⎞ 

−1 0 0 

B-2 1. J = {2, 5, 6}, A −1 

J 

= A J = 

(−1, 0, 0), y T b = −b 1 = 1 = c T¯x. 

⎜ 

⎝−1 1 

⎟ 

0⎠ = B, x J 

−2 0 1 

= A −1 

J b = (1, −1, 1)T , y T = 

2. wähle p = 5, u T = (e 5 ) T J A−1 J A = eT 2 BA = (3, 0, 3, −1, 1, 0), γ 4 = 1, λ p = −γ 4 /u p4 = 1 

mit l = 4. 

⎛ ⎞ 

0 −1 0 

B-3 1. J = {2, 4, 6}, A −1 

J 

= 

⎜ ⎟ 

⎝1 −1 0⎠, ¯x J = A −1 

J 

0 −2 1 

b = (2, 1, 3)T optimal, y T b = c T¯x = 2. 

} {{ } 

>0


Auch beim dualen Verfahren besteht die Gefahr des Kreisens, wenn das Minimum bei (5.1.2) 

nicht in einem einzigen Index l angenommen wird. Diese Gefahr läßt sich auch hier wieder durch 

kleinste Index -Regeln ausschalten. Diese lauten in Schritt 2 und 5: 

2 bestimme p ∈ J : p = min{i ∈ J : x i < 0} 

5 bestimme l ∈ K : l = min{j ∈ K : −γ j /u pj = λ p } 

5.2 Problem-Modifikationen 

In die Formulierung praktischer Probleme gehen oft Daten ein, deren Wert nicht genau bekannt 

oder vorhersehbar ist (z.B., die Preis- oder Zinsentwicklung bei einer Produktions- oder Finanzplanung). 

Dann ist es klug, auch Varianten des Ausgangsproblems zu lösen (”was passiert, wenn 

der Euro über 1.40 Dollar steigt?”), etwa in Abhängigkeit von einem künstlichen Parameter 

t ∈ R (”parametrische Optimierung”). Oft will man auch unerwünschte Lösungen nachträglich 

durch weitere Restriktionen ausschließen, etwa nicht-ganzzahlige in der ganzzahligen Optimierung. 

In diesen Fällen kann man durch eine geschickte Kombination aus primalem und dualem 

Simplexverfahren eine bekannte Lösung dem veränderten Problem anpassen. Wir betrachten 

vier Situationen, Ausgangspunkt sei jeweils eine bekannte (Optimal-) Lösung ˆx mit Basis A J . 

• Änderung der Zielfunktion c. Die Untersuchung einer parametrischen Änderung c(t) = 

c + t˜c, t ≥ 0, (zur Vereinfachung) ist vorteilhaft, da Änderungen der Ausgangssituation 

dann schrittweise eintreten. Es sei daher 

W (t) := min{(c + t˜c) T x : Ax = b, x ≥ 0}. 

Die Lösung ˆx zu t = 0 ist auch primal zulässig für t ≠ 0. Der Kostenvektor ist allerdings 

γ(t) T = c(t) T − c J (t) T A −1 

J A = γ(0)T + t˜γ T , ˜γ T = ˜c T − ˜c T J A −1 

J A. 

Da ˆx optimal in t = 0 war, ist γ(0) ≥ 0 und ˆx bleibt solange optimal, wie 

γ(t) = γ(0) + t˜γ ≥ 0 ⇐⇒ t ≤ min{ γ j(0) 

−˜γ j 

: ˜γ j < 0, j ∈ K} =: t max , 

(γ J (t) ≡ 0 gilt weiterhin). Wenn t max > 0 ist, ist ˆx für t ∈ [0, t max ] optimal und daher 

W (t) = W (0) + t˜c Tˆx dort linear (insgesamt ist W (t) stückweise linear). Bei Vergrößerung 

von t über t max hinaus verliert ˆx seine Optimalität und im reduzierten Kostenvektor tauchen 

negative Komponenten auf. Ausgehend von der primal zulässigen Basis A J kann mit 

dem primalen Verfahren aus §2.4 nachoptimiert werden. 

• Änderung des (Resourcen-) Vektors b(t) = b + t˜b, wieder parametrisiert mit t ≥ 0. Also sei 

W (t) := min{c T x : Ax = b + t˜b, x ≥ 0}. 

Dann löst x(t) mit den Nichtbasisvariablen x K (t) = 0 und der Basislösung 

x J (t) = A −1 

J (b + t˜b) = ˆx J + tξ J , ξ J := A −1˜b, 

J


immer noch das Gleichungssystem Ax = b + t˜b. Dabei ist x(t) primal zulässig, solange 

ˆx J + tξ J ≥ 0 ⇐⇒ t ≤ min{ ˆx i 

−ξ i 

: ξ i < 0, i ∈ J} =: t max . 

Wenn ˆx nicht ausgeartet ist, ist t max > 0 und die Zielfunktion W (t) = W (0) + tc T J ξ J = 

W (0)+ty T˜b (y = Schattenpreise!) im Intervall [0, tmax ] also wieder linear. Der Kostenvektor 

γ ist hier unabhängig von t, da er nur von c und A abhängt. Wenn jetzt also t über t max 

hinaus vergrößert wird, bleibt x(t) immer noch dual zulässig, verliert aber seine primale 

Zulässigkeit. Ausgehend von der dual zulässigen Basis A J 

Simplexverfahren aus §5.1 nachoptimiert werden. 

kann jetzt mit dem dualen 

• Einführung zusätzlicher Ungleichungen, etwa a (m+1)T x ≥ b m+1 . Das Programm (LP3) wird 

also erweitert um die Gleichung a (m+1)T x − x n+1 = b m+1 , x n+1 ≥ 0, in der Zielfunktion 

ist c n+1 = 0. Mit der entsprechend erweiterten Matrix Ã und J ′ := J ∪ {n + 1} ist 

( ) 

( 

) 

AJ 0 

A −1 

Ã J ′ = 

a (m+1) T ⇒ (ÃJ ′)−1 J 

0 

= 

J −1 a (m+1) T . (5.2.1) 

J A 

−1 

J 

−1 

Wegen c n+1 = 0 liefert die letzte Zeile keinen Beitrag zum erweiterten Kostenvektor 

(c T , 0) − c T J A−1 J 

(A, 0) = (γT , 0) ≥ 0 und der ergänzte Vektor (ˆx T , ¯x n+1 ) T bleibt weiterhin 

dual zulässig, allerdings nicht mehr primal zulässig für 

¯x n+1 = a (m+1)Tˆx − b m+1 < 0. 

Dies ist also mit p = n + 1 wieder ein Fall für das duale Simplexverfahren aus §5.1. 

Dieser Fall hat eine große Bedeutung in der ganzzahligen und nichtlinearen Optimierung. 

Dort werden lineare (Hilfs-) Programme gelöst und schrittweise unerwünschte Lösungen 

durch Schnittebenen, d.h. zusätzliche Ungleichungen eliminiert. 

Beispiel 5.2.1 Im Einführungsbeispiel 1.2.1 zur Produktionsplanung 

min −4x 1 − 3x 2 

A : x 1 + x 2 +x 3 = 15, 

L : x 2 +x 4 = 12, 

E : 3x 1 + x 2 +x 5 = 36, x i ≥ 0, 

wurde die Schranke für Resource A auf b 1 = 15 

geändert, mit J = {1, 2, 4} lautet die Lösung 

dann ˆx T J 

= (10.5, 4.5, 7.5), W = −55.5. Wenn 

nur ganze Einheiten produziert werden, ist diese 

Lösung unbrauchbar. Eine Rundung dieser 

Werte ist auch keine Hilfe, da die Zulässigkeit 

dann nicht gesichert ist. Mit Hilfe der zusätzlichen 

Ungleichung 2x 1 +x 2 ≤ 25 kann diese Ecke 

des zulässigen Bereichs abgeschnitten werden. 

x 2 

❵ ✻❵ 

❅ 

❵ ❵ ❵ ❵ ❵ ❵ ❇ 

❇ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ L❵ 

❵ 

❵ ❵ ❵ ❵ ❅ ❵ ❵ ❵ ❵ ❵ 

❵ ❅ 

❇ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ 

❇ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ E❵ 

❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❅❵ 

❵ ❵ ❇❵ 

❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❅❵ 

❵ ❵ ❇ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❅ ❇ 

c 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❅ ❇ ✚ ✚✚❃ 

❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❅❇ 

❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ 

❇ 

❵ 

❵ 

❅ 

❵ ❵ ❵ 

❵ ❵ ❵ 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❇ ❵ ❅❵ 

❵ A 

❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❵ ❇❵ 

❵ ❅❵ 

✲ 

❇ ❅ x1


Die Konstruktion solcher Ungleichungen wird in der ganzzahligen Optimierung behandelt. 

Im erweiterten Problem ist jetzt ˆx 6 = 25 − 2ˆx 1 − ˆx 2 = −1/2 < 0, J ′ = {1, 2, 4, 6}. Mit 

⎛ ⎞ 

A −1 

J 

= 1 −1 0 1 

⎜ ⎟ 

⎝ 3 0 −1⎠ 

2 

−3 2 1 

wird u p zu p = 6 aus der letzten Zeile von (5.2.1) berechnet, wegen des Schlupfes +x 6 aber 

mit anderem Vorzeiechen u T p = ( − a (4) T 

J A 

−1 

J , 1) Ã = (− 1 2 , 0, − 1 2 , 1)Ã = (0, 0, − 1 2 , 0, − 1 2 , 1). 

Der (alte) Kostenvektor ist γ T = (0, 0, 5 2 , 0, 1 2 ) und führt auf λ 6 = 1 bei l = 5. Zu den 

neuen Basisindizes J ′′ = {1, 2, 4, 5} gehört die ganzzahlige Lösung x T = (10, 5, 0, 7, 1, 0) 

mit W = −55. 

• Einführung einer zusätzlichen Variablen x n+1 . Es sei Ã = (A, a n+1 ), ˜c T = (c T , c n+1 ). 

Der Vektor (ˆx T , 0) ist dann auch primal zulässig beim erweiterten Problem. In Bezug auf 

Optimalität ist mit der dualen Lösung y T = c T J A−1 J 

γ n+1 ≥ 0 bleibt der erweiterte Punkt opimal. Für 

γ n+1 = c n+1 − y T a n+1 < 0 

nur der Wert γ n+1 zu prüfen. Für 

kann wieder das primale Verfahren aus §2.4 mit der primal zulässigen Basis ÃJ = A J 

angewendet werden. 

Beispiel 5.2.2 Das Einführungsbeispiel 1.2.1 zur Produktionsplanung hatte die Form 

min −4x 1 − 3x 2 

A : x 1 + x 2 +x 3 = 16, 

L : x 2 +x 4 = 12, 

E : 3x 1 + x 2 +x 5 = 36, x i ≥ 0, 

und die Lösung ˆx T = (10, 6, 0, 6, 0) zu J = {1, 2, 4} mit c Tˆx = −58. Die Ungleichungen 

zu Arbeitsaufwand (ˆx 3 = 0) und Energiebedarf (ˆx 5 = 0) sind straff, die Schattenpreise 

der dualen Lösung y T = (− 5 2 , 0, − 1 2 

) zeigen, dass der Wert verringert werden kann, wenn 

eine Erhöhung von Arbeitsleistung nicht mehr als −y 1 = 5 2 

bzw. der Energiekosten um 

mehr als −y 3 = 1 2 

pro Einheit kostet. Nun werde angenommen, dass zusätzliche Energie zu 

einem Preis von c 6 > 0 erhältlich ist. Am besten kauft man zusätzliche Energie nicht blind, 

sondern erweitert das Problem um den zusätzlichen Energieanteil x 6 ≥ 0. Die geänderte 

Bedingung E: 3x 1 + x 2 ≤ 36 + x 6 führt zur Restriktion 

E : 3x 1 + x 2 + x 5 − x 6 = 36, sowie c T x = −4x 1 − 3x 2 + c 6 x 6 . 

Also ist a 6 = −e 3 und γ 6 = c 6 − y T a 6 = c 6 − 1 2 . Für c 6 < 1 2 

sind die Kosten γ 6 negativ. 

Die inverse Basismatrix ist die aus Beisp. 5.2.1. Ein Austauschschritt mit l = 6, 

w (J) 

l 

= A −1 

J 

a 6 = −A −1 

J 

e 3 = 1 2 (−1, 1, −1)T ergibt p = j 2 = 2 und führt zur neuen Lösung 

(16, 0, 0, 12, 0, 12) T mit J ′ = {1, 5, 6} und Zielfunktionswert −64+12c 6 (< −58 für c 6 < 1 2 ).


Praktischer Ausblick 

Professionelle Computerprogramme (”Dynamische Simplex-Verfahren”) bringen beim allgemeinen 

Problem (LP) beide Varianten des Simplexverfahrens adaptiv zum Einsatz, teilweise auch 

als Ersatz für eine Anlaufrechnung. Ansatzweise sei das am Programm (LP) ohne freie Variable 

erläutert, d.h. bei 

min{c T x : Ax = b, Mx ≥ d, x ≥ 0}. 

(LP) 

Dabei seien A ∈ R m×n und M ∈ R µ×n sehr große Matrizen. Um dennoch mit annehmbaren 

Aufwand arbeiten zu können, betrachtet man Teilprobleme, in denen nur ein Teil der Variablen 

und ein Teil der Ungleichungen aktiviert ist ([Padberg]). Mit P ⊆ {1, . . . , n}, L ⊆ {1, . . . , µ} 

sind das Probleme der Form 

min{c T P x P : A P x P = b, M (L) 

P x P ≥ d L , x P ≥ 0}, (LP L P ) 

nur die Gleichungsrestriktionen werden also alle berücksichtigt. Schrittweise werden nun solche 

Teilprobleme gelöst und danach durch Suche nach negativen Kosten γ j < 0 neue Variable mit 

Index j /∈ P , oder verletzte Ungleichungen /∈ L aktiviert. Für die Einheitsvektoren zu den 

Schlupfvariablen der Ungleichungen M (L) 

P 

x P ≥ d L wird natürlich kein Speicherplatz reserviert, 

sie werden bei Bedarf erzeugt. Die Anpassung der Lösung der neuen Teilprobleme kann, wie 

gerade besprochen, mit dem primalen bzw. dualen Verfahren durchgeführt werden. Umgekehrt 

können Variable zu j ∈ P (für γ j ≫ 0) bzw. Ungleichungen aus L auch wieder deaktiviert werden, 

wenn Kosten oder Schlupfvariable bestimmte Schwellenwerte unter- bzw. überschreiten. Sehr 

große Probleme können insbesondere dann so gelöst werden, wenn die Suche zur Aktivierung 

algorithmisch erfolgen kann. Dies ist z.B. bei Schnittebenenverfahren der Fall. 

Ähnliches gilt beim TSP, wo die ∼ = 2 n Ungleichungen (1.2.2) sicherstellen, dass die Tour 

zusammenhängend ist. Für eine vorliegende Näherungslösung x kann eine verletzte Ungleichung 

(1.2.2) graphentheoretisch durch Bestimmung eines sogenannten minimalen Schnitts generiert 

werden, was mit einem polynomiellen Aufwand geschehen kann. Oft sind Lösungen des relaxierten 

Problems (1.2.3) ganzzahlig, andernfalls müssen zusätzlich Schnittebenen eingeführt werden. 

Beispiel 5.2.3 Anwendung der Verfahren auf das (TSP), Start mit den Gleichheitsrestriktionen 

(1.2.1). Diese Tour besteht i.d.R. aus vielen kleinen Schleifen. Anschließend wird jeweils 

eine kurze Schleife gesucht (kein minimaler Schnitt!) und eine Ungleichung (1.2.2), welche diese 

ausschließt, in (LP L P 

) aufgenommen. In einigen Fällen führt dies zum Erfolg, etwa im gezeigten 

Beispiel. Das Problem mit 31 Orten hat 465 Wege (d.h. n = 465 Variable, m = 31 Gleichungen). 

Anschließend werden 16 zusätzliche Ungleichungen (von ∼ = 2 31 ∼ = 10 10 möglichen) generiert, bis 

eine zusammenhängende (und sogar ganzzahlige) Lösung erreicht ist. Das Bild zeigt die Tour 

und in der Mitte oben die Struktur der Matrix im Ungleichungssystem.

5 DUALITÄT BEIM SIMPLEXVERFAHREN 63

6 INNERE-PUNKT-METHODEN 64 

6 Innere-Punkt-Methoden 

Das Simplex-Verfahren startet mit einer Ecke des zulässigen Polyeders X und wandert dann zu 

Nachbar-Ecken mit fallender Zielfunktion. Insbesondere 

bewegt sich das Verfahren ausschließlich auf dem Rand des 

Polyeders. Obwohl das Verfahren in einer endlichen Zahl von 

Schritten endet, kann dies in einigen (Ausnahme-?) Fällen 

bei hohen Dimensionen wegen der großen Eckenzahl zu sehr 

langen Laufzeiten des Verfahrens führen. Ein alternativer 

Zugang sind neuere Verfahren, die eine Iterationsfolge konstruieren, 

welche sich durch das Innere des Polyeders auf die 

optimale Ecke zu bewegt. 

6.1 Der zentrale Pfad 

Betrachtet man mit dem primalen Programm, A ∈ R m×n , b ∈ R m , 

(LP 3) min c T x : Ax = b, x ≥ 0 

gleichzeitig dessen duales max{y T b : A T y ≤ c} und führt dabei Schlupfvariablen z ein, 

(LP 3 ∗ ) max y T b : A T y + z = c, z ≥ 0, 

dann kann man deren Lösung wegen des Komplementaritäts-Satzes 4.2.1, 

(c T − y T A) 

} {{ } }{{} x 

≥0 ≥0 

= z T x = 0 

(”komplementärer Schlupf”) auch als ein reines Un-Gleichungssystem schreiben, 

Ax = b, x ≥ 0, 

A T y + z = c, z ≥ 0, 

z T x = 0. 

(6.1.1) 

Man beachte, dass dabei (nur) die letzte Bedingung nichtlinear ist und tatsächlich wegen der 

Nichtnegativität eine strukturelle Orthogonalität darstellt, x j z j = 0, j = 1, . . . , n. Dies läßt sich 

mit Hilfe der Diagonalmatrizen 

⎛ ⎞ 

⎛ 

⎞ 

z 1 x 1 Z = diag(z j ) = ⎜ . .. ⎟ 

⎝ ⎠ , X = diag(x j) = ⎜ . .. ⎟ 

⎝ 

⎠ 

z n x n 

besser in der Form Zx = Xz = 0 zum Ausdruck bringen. Wenn man zwei beliebige zulässige 

Punkte x (0) von (LP 3) und y (0) von (LP 3 ∗ ) hat, gilt 0 ≤ z (0)T x (0) =: nµ 0 . Für x (0) > 0 und 

z (0) > 0 (komponentenweise) ist sogar z (0)T x (0) = nµ 0 > 0.


Formuliert man die Bedingung x T z = nµ > 0 für jede Komponente einheitlich zu x T j z j = 

µ, j = 1, . . . , n, bzw Xz = µ1l mit 1l = (1, . . . , 1) T bekommt man folgendes Problem, das den 

Innere-Punkte-Verfahren zugrunde liegt: 

⎛ 

⎞ 

Ax − b 

⎜ 

F µ (x, y, z) := ⎝ A T ⎟ 

y + z − c ⎠ = ! 0, x > 0, z > 0. (6.1.2) 

Xz − µ1l 

Da unter geeigneten Voraussetzungen zu jedem µ > 0 eine 

Lösung existiert, bildet die Menge dieser Punkte einen stetigen(!) 

zentralen Pfad ( x(µ), y(µ), z(µ) ) , der bei Variation des 

Parameters µ durchlaufen wird. Mit zulässigen Lösungen x (0) , 

wie oben kennt man insbesondere einen (Start-) Punkt 

( 

x(µ0 ), y(µ 0 ), z(µ 0 ) ) mit µ 0 > 0 und kann versuchen, diesen 

y (0) 

bis zum Ziel, der Lösung ( x(0), y(0), z(0) ) zu verfolgen. 

x 2 

✻ 

 

zentraler 

Pfad 

✁ ✁✁ 

 

 

✲ 

x 1 

Das Problem (6.1.2) läßt sich durch folgende Umformungen anders interpretieren. Aus den 

beiden letzen Gleichungen A T y + z − c = 0, x j z j = µ∀j eliminiert man z und x, 

z j = c j − a T j y, x j = µ µ 

= 

z j c j − a T , j = 1, . . . , n, (6.1.3) 

j 

y 

und reduziert das Problem (6.1.2) dadurch auf einen Satz von nichtlinearen Gleichungen 

g i (y) := b i − µ 

n∑ 

j=1 

a ij 

c j − a T j y ! 

= 0, i = 1, . . . , m. (6.1.4) 

Diese Umformung ist sehr hilfreich, denn g ist der Gradient der folgenden Funktion. 

Definition 6.1.1 Die Menge der dual strikt zulässigen Punkte 

Ŷ := {y ∈ R m : A T y < c} 

sei nicht leer. Für µ > 0 wird dort die (duale) Barrierefunktion b µ : Ŷ ↦→ R m definiert durch 

n∑ 

b µ (y) := b T y + µ log(c j − a T j y). 

j=1 

Der Name Barrierefunktion veranschaulicht die Gestalt von b µ . Wenn sich y dem Rand von Ŷ 

nähert, also 0 < c j −a T j y → 0 geht für ein j, geht der Summand µ log(c j −a T j y) → −∞ und baut 

eine unüberwindliche Barriere (Graben) am Rand auf. Im Inneren von Ŷ ist b µ aber beliebig oft 

differenzierbar. Zum Zusammenhang mit g gilt tatsächlich 

∂b µ 

∂y i 

= b i − µ 

n∑ 

j=1 

a ij 

c j − a T j y = g i(y), i = 1, . . . , m.


Die zweiten Ableitungen sind 

∂ 2 b µ 

∂y i ∂y k 

= −µ 

n∑ 

j=1 

a ij a kj 

(a T j y − c , 1 ≤ i, k ≤ m. 

2 

j) 

Durch Einführung der nicht-negativen Diagonalmatrix N := diag((a T j y − c j) 2 ) ≥ 0 läßt sich die 

Hesse-Matrix dieser 2. Ableitungen einfach darstellen als 

H µ (y) = −µAN −1 A T . (6.1.5) 

Für y ∈ Ŷ ist (c j − a T j y)2 > 0, j = 1, . . . , m und daher N positiv definit, also ist −µAN −1 A T 

negativ definit, wenn A vollen Rang besitzt. Daher ist die Funktion b µ überall in Ŷ streng 

konkav. 

Satz 6.1.2 Es gelte Rang(A) = m, die Menge Ŷ sei nichtleer und beschränkt. Dann besitzt das 

Problem 

max b µ (y) : y ∈ Ŷ 

für jedes µ > 0 genau eine Lösung y(µ), die mit (6.1.3) Komponente einer Lösung von (6.1.2), 

F µ = 0, ist. Diese vollständige Lösung (x(µ), y(µ), z(µ)) heißt zentraler Pfad des primal-dualen 

Problems (6.1.1). 

Beweis Nach Voraussetzung existiert ein y (0) ∈ Ŷ . Da Ŷ beschränkt ist n.V., ist die Niveaumenge 

M := {y ∈ Ŷ : b µ(y) ≥ b µ (y (0) )} kompakt und b µ dort stetig. Also existiert eine Maximalstelle 

ŷ ∈ Ŷ . In dieser verschwindet der Gradient, g(ŷ) = 0. Nach dem Satz von Taylor gibt es daher 

zu jedem y ≠ ŷ, y ∈ Ŷ eine Zwischenstelle η ∈ Ŷ so, dass 

b µ (y) = b µ (ŷ) + g(ŷ) T (y − ŷ) + (y − ŷ) T H 

} {{ } 

µ (η)(y − ŷ) 

} {{ } 

=0

Skript

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?