Wahrscheinlichkeitstheorie und Statistik für ... - next-internet.com
Wahrscheinlichkeitstheorie und Statistik für ... - next-internet.com
Wahrscheinlichkeitstheorie und Statistik für ... - next-internet.com
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
INSTITUT FÜR MATHEMATISCHE STOCHASTIK WS 2003/04<br />
UNIVERSITÄT KARLSRUHE<br />
Dr. B. Klar<br />
Aufgabe B1<br />
Klausur<br />
<strong>Wahrscheinlichkeitstheorie</strong> <strong>und</strong> <strong>Statistik</strong><br />
<strong>für</strong> Informatiker<br />
vom 26.2.2004<br />
Musterlösungen<br />
B<br />
Gegeben sei eine Urliste mit den Paaren (x1, y1), . . . , (x10, y10)<br />
j 1 2 3 4 5 6 7 8 9 10<br />
xj 1.1 1.6 2.9 3.9 5.2 6.1 7.1 7.6 8.9 9.8<br />
yj 14.2 14.3 1.2 7.4 5.6 3.9 −0.9 1 −8.9 −7.5<br />
a) Berechnen Sie die Stichprobenmittel ¯x, ¯y, die Stichproben-Standardabweichungen sx,<br />
sy <strong>und</strong> den empirischen Korrelationskoeffizienten rxy.<br />
Lösung: Direkt aus den Daten ergibt sich gemäß Definition 1.8 <strong>und</strong> Paragraph 1.5<br />
unter Ausnützung der Beziehung<br />
n<br />
(xj − ¯x) · (yj − ¯y) =<br />
j=1<br />
n<br />
xj · yj − n · ¯x · ¯y<br />
j=1<br />
¯x = 5.42 sx = 3.005<br />
¯y = 3.03 sy = 7.848<br />
rxy = − 0.9043<br />
b) Bestimmen Sie die zugehörige Regressionsgerade y = a∗ + b∗ · x von y auf x.<br />
Lösung: Nach Paragraph 1.5 ist b ∗ = rxy · sy<br />
<strong>und</strong> a<br />
sx<br />
∗ = ¯y − b∗ · ¯x, also<br />
b ∗ = −2.361<br />
a ∗ = 15.83<br />
<strong>und</strong> die Regressionsgerade y = 15.83 − 2.361 · x.
y<br />
−5 0 5 10 15<br />
2 4 6 8 10<br />
Punkte <strong>und</strong> Regressionsgerade y = a ∗ + b ∗ · x<br />
Für die Lösung der nächsten drei Aufgabenteile benötigen wir die aufsteigend sortierten<br />
y-Werte. Es ist<br />
y() = (−8.9, −7.5, −0.9, 1, 1.2, 3.9, 5.6, 7.4, 14.2, 14.3)<br />
c) Berechnen Sie das 0.15-getrimmte Stichprobenmittel ¯y0.15 von (y1, . . . , y10).<br />
Lösung: Mit k = [10 · 0.15] = 1 ergibt sich<br />
¯y0.15 =<br />
1<br />
10 − 2 · 1 · (y(2) + . . . + y(9)) = 3.112<br />
d) Berechnen Sie den Quartilsabstand von (y1, . . . , y10).<br />
Lösung: Da 0.25 · 10 = 2.5 <strong>und</strong> 0.75 · 10 = 7.5 beide nicht ganzzahlig sind, ergibt sich<br />
mit k1 = [2.5] = 2 <strong>und</strong> k2 = [7.5] = 7<br />
˜y0.25 = y(k1+1) = y(3) = −0.9<br />
˜y0.75 = y(k2+1) = y(8) = 7.4<br />
<strong>und</strong> damit der Quartilsabstand zu ˜y0.75 − ˜y0.25 = 8.3.<br />
x
Aufgabe B2<br />
X, Y seien zwei Zufallsvariablen mit Werten in {0, 1, c}, c ∈ {2, 3, 4, . . .}, bzw. {0, 1, 2}. Die<br />
folgende Tabelle gibt die gemeinsame Verteilung IP(X = i, Y = j) des Zufallsvektors (X, Y )<br />
<strong>für</strong> die Werte (i, j) ∈ {0, 1, c} × {0, 1, 2} an.<br />
Y<br />
X<br />
j = 0<br />
j = 1<br />
j = 2<br />
i = 0 i = 1 i = c<br />
1<br />
12<br />
1<br />
12<br />
1<br />
12<br />
a) Berechnen Sie die Randverteilung von X <strong>und</strong> den Erwartungswert IEX. Für welche c<br />
gilt IEX = 5<br />
4 ?<br />
Lösung:<br />
IP(X = 0) = 1<br />
4<br />
IEX = 0 · 1<br />
4<br />
Für c = 3 ist IEX = 5/4.<br />
1<br />
4<br />
1<br />
6<br />
1<br />
12<br />
1<br />
12<br />
1<br />
12<br />
1<br />
12<br />
1<br />
1<br />
, IP(X = 1) = , IP(X = c) =<br />
2 4<br />
1 1<br />
+ 1 · + c ·<br />
2 4<br />
b) Berechnen Sie die Wahrscheinlichkeit IP(X > 0, Y = 1).<br />
Lösung:<br />
1 1<br />
= c +<br />
4 2<br />
IP(X > 0, Y = 1) = IP(X = 1, Y = 1) + IP(X = c, Y = 1) = 1 1<br />
+<br />
6 12<br />
c) Berechnen Sie die bedingte Wahrscheinlichkeit IP(Y = 1|X > 0).<br />
Lösung:<br />
IP(Y = 1|X > 0) =<br />
=<br />
IP(X > 0, Y = 1)<br />
IP(X > 0)<br />
1 1 + 6 12<br />
1 1 + 2 4<br />
= 1<br />
3<br />
= IP(X = 1, Y = 1) + IP(X = c, Y = 1)<br />
= 1<br />
4<br />
IP(X = 1) + IP(X = c)<br />
d) Es sei c = 3 sowie Z := X · Y . Berechnen Sie den Erwartungswert IEZ, das zweite<br />
Moment IEZ 2 <strong>und</strong> die Varianz V (Z).<br />
Lösung:<br />
Es sei f(i, j) := IP(X = i, Y = j). Dann gilt<br />
IEZ = IE[X · Y ] = <br />
i,j: f(i,j)>0<br />
IEZ 2 = IE[X 2 · Y 2 ] = <br />
= 17<br />
4 ,<br />
i,j: f(i,j)>0<br />
V (Z) = IEZ 2 − (IEZ) 2 = 17<br />
4<br />
i · j · f(i, j) = 1 · 1 1 1 1<br />
+ 2 · + 3 · + 6 ·<br />
6 12 12 12<br />
= 13<br />
12 ,<br />
i 2 · j 2 · f(i, j) = 1 · 1 1 1 1<br />
+ 4 · + 9 · + 36 ·<br />
6 12 12 12<br />
− 169<br />
144<br />
= 443<br />
144 .
Aufgabe B3<br />
Es sei X eine standardnormal-verteilte Zufallsvariable, kurz X ∼ N (0, 1). Weiter sei Y :=<br />
3X − 1.<br />
a) Berechnen Sie den Erwartungswert IEY <strong>und</strong> die Varianz V (Y ).<br />
Lösung: Mit IEX = 0 <strong>und</strong> V (X) = 1 folgt<br />
IEY = 3IEX − 1 = −1,<br />
V (Y ) = 9V (X) = 9.<br />
b) Bestimmen Sie die Wahrscheinlichkeit IP(−1 < Y ≤ 2).<br />
Lösung: Mit der Definition von Y <strong>und</strong> 8.11 Satz folgt<br />
IP(−1 < Y ≤ 2) = IP(−1 < 3X − 1 ≤ 2) = IP(0 < X ≤ 1) = Φ(1) − Φ(0).<br />
Dabei ist Φ die Verteilungsfunktion von X. Wegen Φ(2) = 0.8413 <strong>und</strong> Φ(0) = 0.5 (aus<br />
Tabelle A.1) folgt<br />
IP(−1 < Y ≤ 2) = 0.3413.<br />
c) Bestimmen Sie das 0.975-Quantil q0.975 der Zufallsvariablen Y .<br />
Lösung: Die Verteilungsfunktion von Y sei mit FY bezeichnet. Dann ist q0.975 die Lösung<br />
q der Gleichung<br />
<br />
q − (−1)<br />
FY (q) = Φ<br />
= 0.975.<br />
3<br />
Wegen Φ(1.96) = 0.975 (aus Tabelle A.1) gilt also<br />
<strong>und</strong> damit<br />
q + 1<br />
3<br />
= 1.96<br />
q0.975 = q = 3 · 1.96 − 1 = 4.88. (1)<br />
Der Zusammenhang (1) kann auch direkt aus Bemerkung 12.20 c) abgelesen werden.<br />
d) Bestimmen Sie die Kovarianz C(X, Y ).<br />
Lösung: Wegen IEX = 0 <strong>und</strong> IEX 2 (= V (X) + (IEX) 2 ) = 1 gilt<br />
C(X, Y ) = IE[X · Y ] − IEX · IEY = IE[X · (3X − 1)] − 0 · (−1) = IE[3X 2 − X]<br />
= 3IEX 2 − IEX = 3.
Aufgabe B4<br />
Zwischen 3 Punkten P1, P2 <strong>und</strong> P3 verläuft folgendes Leitungsnetz:<br />
P1<br />
S1<br />
¡<br />
P2<br />
¢<br />
S2<br />
S3<br />
£ ¤<br />
Dabei sind S1, S2, S3 störanfällige Stellen. Die Zufallsvariablen Xi seien definiert als<br />
<br />
0,<br />
Xi =<br />
1,<br />
Si ist unterbrochen,<br />
Si ist nicht unterbrochen,<br />
i = 1, 2, 3.<br />
Ferner seien X1, X2, X3 stochastisch unabhängig mit IP(Xi = 1) = p, i = 1, 2, 3, <strong>für</strong> ein<br />
0 < p < 1.<br />
a) Stellen Sie das Ereignis A := { ” P2 ist mit P3 verb<strong>und</strong>en“} mit Hilfe der Zufallsvariablen<br />
X2 <strong>und</strong> X3 dar.<br />
Lösung:<br />
A = {X2 = 1} ∪ {X3 = 1} = {max{X2, X3} = 1} = {X2 + X3 ≥ 1}<br />
b) Stellen Sie das Ereignis B := { ” P1 ist mit P3 verb<strong>und</strong>en“} mit Hilfe der Zufallsvariablen<br />
X1 <strong>und</strong> des Ereignisses A dar.<br />
Lösung: B = {X1 = 1} ∩ A<br />
c) Bestimmen Sie die Wahrscheinlichkeit IP(B).<br />
Lösung: Zunächst erhält man mit dem Additionssatz <strong>und</strong> der Unabhängigkeit von X2<br />
<strong>und</strong> X3<br />
IP(A) = IP({X2 = 1} ∪ {X3 = 1})<br />
= IP(X2 = 1) + IP(X3 = 1) − IP({X2 = 1} ∩ {X3 = 1})<br />
= p + p − IP(X2 = 1) · IP(X3 = 1) = 2p − p 2 = p(2 − p).<br />
Wegen der Unabhängigkeit von {X1 = 1} <strong>und</strong> A (Blockungslemma) gilt<br />
IP(B) = IP(X1 = 1) · IP(A) = p · p(2 − p) = p 2 (2 − p).<br />
d) Die Zufallsvariable Y := X1 + X2 besitzt die Binomial-Verteilung Bin(n, q). Bestimmen<br />
Sie die Parameter n <strong>und</strong> q.<br />
Lösung: Die Zufallsvariable Y ist die Faltung zweier Bin(1, p)-verteilten Zufallsvariablen.<br />
Mit Tabelle S.114 erhält man damit n = 2 <strong>und</strong> q = p.<br />
P3
e) Bestimmen Sie die erzeugende Funktion gY (s), |s| ≤ 1, von Y .<br />
Lösung: Nach 13.1 Definition gilt<br />
gX1(s) =<br />
1<br />
k=0<br />
IP(X1 = k)s k = IP(X1 = 0)s 0 + IP(X1 = 1)s 1<br />
= (1 − p) + p · s<br />
<strong>für</strong> |s| ≤ 1. Weiter ist gX1 = gX2. Nach 13.3c) folgt<br />
gY (s) = gX1(s) · gX2(s) = ((1 − p) + p · s) 2<br />
<strong>für</strong> |s| ≤ 1.<br />
Da Y ∼ Bin(2, p) ist, siehe auch 13.2 Beispiel a).<br />
Aufgabe B5<br />
Ein Merkmal habe die Dichte<br />
⎧<br />
⎨<br />
t ↦→ fϑ(t) :=<br />
⎩<br />
1<br />
√ π t exp −(log(t) − ϑ) 2 , falls t > 0,<br />
0 , falls t ≤ 0,<br />
wobei ϑ ∈ IR ein unbekannter Parameter ist. Der Parameter ϑ soll aufgr<strong>und</strong> einer unabhängigen<br />
Stichprobe x = (x1, . . . , xn) geschätzt werden, wobei x1 > 0, . . . , xn > 0 sind.<br />
Der Maximum-Likelihood-Schätzer ˆ ϑ(x1, . . . , xn) <strong>für</strong> ϑ ist von der Form<br />
ˆϑ(x1, . . . , xn) = c1 ·<br />
n<br />
log(c2 · xj − c3)<br />
mit gewissen Konstanten c1, c2, c3. Bestimmen Sie die Konstanten c1, c2 <strong>und</strong> c3.<br />
Lösung: Es ist<br />
also<br />
Wegen<br />
Mx(ϑ) =<br />
j=1<br />
log(fϑ(t)) = − log( √ π) − log(t) − (log(t) − ϑ) 2 , t > 0,<br />
M ′ x(ϑ) = 2<br />
n<br />
log(fϑ(xj)) =<br />
j=1<br />
= −n log( √ π) −<br />
n √<br />
− log( π) − log(xj) − (log(xj) − ϑ) 2<br />
j=1<br />
n<br />
log(xj) −<br />
j=1<br />
n<br />
(log(xj) − ϑ) = 2<br />
j=1<br />
M ′′<br />
x (ϑ) = −2n < 0.<br />
n<br />
(log(xj) − ϑ) 2 ,<br />
j=1<br />
n<br />
log(xj) − 2nϑ,<br />
j=1<br />
M ′ x(ϑ) = 0 ⇐⇒ ϑ = 1<br />
n<br />
n<br />
log(xj)<br />
j=1
ist<br />
(x1, . . . , xn) ↦→ ˆ ϑ(x) := 1<br />
n<br />
der gesuchte Maximum-Likelihood-Schätzer <strong>für</strong> ϑ.<br />
Aufgabe B6<br />
n<br />
log(xj)<br />
Eine Münze mit den Symbolen ” Zahl“ <strong>und</strong> ” Wappen“ soll auf ihre Echtheit überprüft werden,<br />
d.h es soll überprüft werden ob,<br />
IP({ ” Zahl“ geworfen}) = IP({ ” Wappen“ geworfen}) = 1<br />
2<br />
gilt. Dem folgenden Zufallsexperiment werden die Zufallsvariablen<br />
Xi =<br />
<br />
1,<br />
0,<br />
falls Zahl“ geworfen,<br />
”<br />
falls Wappen“ geworfen,<br />
”<br />
i = 1, . . . , n,<br />
zugr<strong>und</strong>e gelegt. Dabei seien X1, X2, . . . , Xn stochastisch unabhängig <strong>und</strong> jeweils Bin(1, ϑ)verteilt.<br />
Der Parameter 0 < ϑ < 1 sei unbekannt. Nun wird die Münze n = 1000 Mal<br />
geworfen <strong>und</strong> 487 Mal das Symbol ” Zahl“ beobachtet.<br />
a) Bestimmen Sie das Stichproben-Mittel ¯ Xn = 1<br />
n<br />
Xi.<br />
n<br />
i=1<br />
Lösung: Mit n i=1 Xi = 487 erhält man ¯ Xn = 487 = 0.487.<br />
1000<br />
b) Ein asymptotisches Konfidenzintervall C = [l ∗ n, L ∗ n] <strong>für</strong> ϑ zum (Konfidenz-)Niveau 1 − α,<br />
0 < α < 1, ist durch<br />
l ∗ n = l ∗ n(X1, . . . , Xn) = ¯ Xn<br />
L ∗ n = L ∗ n(X1, . . . , Xn) = ¯ Xn<br />
j=1<br />
<br />
h<br />
√ ¯Xn(1 −<br />
n<br />
¯ Xn) ,<br />
<br />
h<br />
√ ¯Xn(1 −<br />
n<br />
¯ Xn)<br />
gegeben, wobei h = ist. Vervollständigen Sie die fehlenden Angaben<br />
in den Formel <strong>für</strong> l∗ n, L∗ n <strong>und</strong> h. Berechnen Sie C <strong>für</strong> α = 0.05.<br />
Lösung: Mit 18.10 Beispiel <strong>und</strong> 18.11 Bemerkung 1. folgt<br />
l ∗ n = l ∗ n(X1, . . . , Xn) = ¯ Xn − h<br />
<br />
√ ¯Xn(1 −<br />
n<br />
¯ Xn) ,<br />
L ∗ n = L ∗ n(X1, . . . , Xn) = ¯ Xn + h<br />
<br />
√ ¯Xn(1 −<br />
n<br />
¯ Xn) ,<br />
wobei h = u1−α/2 = Φ −1 (1 − α/2) ist. Für α = 0.05 ist h = u0.975 = 1.96 (aus Tabelle<br />
A.1). Mit n = 1000 <strong>und</strong> ¯ Xn = 0.487 erhält man l ∗ n = 0.456 <strong>und</strong> L ∗ n = 0.518.