wykład3-statystyka, Matematyka, Statystyka matematyczna

[ Pobierz całość w formacie PDF ]
Wykład 3
Estymacja przedziałowa
Warto±ci estymatorów, tzn. oceny punktowe nieznanych parametrów, nie daj¡ informacji o
tym, jaka jest dokładno±¢ uzyskanej oceny.
Sposobem estymacji, daj¡cym mo»liwo±¢ oceny dokładno±ci szacowania jest metoda prze-
działowa, polegaj¡ca na podaniu tzw. przedziałów ufno±ci dla nieznanych parametrów (lub
funkcji) danego rozkładu.
Definicja 1 Przedziałem ufno±ci dla parametru
napoziomieufno±ci
1

(
0
< <
1
)
nazywamyprzedział
(
1
,
2
)
spełniaj¡cywarunki:
ko«ceprzedziału
1
=
1
(
X
1
,...,X
n
)
,
2
=
2
(
X
1
,...,X
n
)
s¡funkcjamipróbylosowej
X
1
,...,X
n
iniezale»¡odszacowanegoparametru
;
prawdopodobie«stwopokryciaprzeztenprzedziałnieznanegoparametrujestrówne
1

,
tzn.
P
(
1
(
X
1
,...,X
n
)
< <
2
(
X
1
,...,X
n
)) = 1

.
Liczb¦
1

nazywamy
współczynnikiem ufno±ci
.
Przykład
Kontroluj¡c pewn¡ hurtowni¦ zwa»ono 10 torebek cukru, otrzymuj¡c nast¦puj¡ce wyniki (w
gramach): 1002, 1003, 997, 997, 994, 995, 998, 997, 993, 999.
Jaka jest ±rednia waga torebki cukru w tej hurtowni?
Zakładaj¡c, »e waga torebki cukru ma rozkład normalny, mo»na na przykład u»y¢ metody
najwi¦kszej wiarygodno±ci i obliczy¢ estymator:
x
10
= 997
.
5
.
Jednak nas interesuje co± wi¦cej – od czego jest mniejsza ±rednia waga torebki cukru, przy
czym nie musimy (i nie potrafimy) mie¢ absolutnie pewnego wyniku. Mówi¡c inaczej, szukamy
liczby
b
takiej, »e:
P
(
m
¬
b
) = 0
.
9
,
gdzie
m
oznacza warto±¢ oczekiwan¡ wagi torebki cukru w hurtowni.
W tym przypadku wynik wynosi:
b
= 999
.
716 (został otrzymany przy zało»eniu, »e dokład-
no±¢ wagi wynosi 3 g).
U»ywaj¡c j¦zyka potocznego mo»emy wi¦c powiedzie¢, »e mamy 90% pewno±ci, »e ±rednia
waga torebki cukru jest mniejsza ni» 999
.
716
g.
Przedział:
(
−1
,
999
.
716)
nazywamy 90% przedziałem ufno±ci dla warto±ci oczekiwanej. Mo»na mówi¢ tak»e o innych prze-
działach ufno±ci, np. 95%
,
99%
.
W naszym przypadku 95% przedział ufno±ci to (
−1
,
1000
.
060)
,
za± 99% przedział ufno±ci to (
−1
,
1000
.
707)
.
Tak wi¦c nie mo»emy ju» twierdzi¢, »e na 95%
,
ani tym bardziej na 99%
,
waga jednej torebki cukru jest mniejsza od 1 kg.
Problem w postaci ogólnej
Podstaw¡ konstrukcji ka»dego przedziału jest statystyka o znanym rozkładzie.
1
Załó»my, »e dana jest próbka prosta
X
1
,...,X
n
z rozkładu
N
(
m,
), przy czym zakładamy
najpierw, »e znamy odchylenie standardowe
(w przypadku wa»enia cukru mo»e ono odpowia-
da¢ znanej dokładno±ci wagi, któr¡ dysponujemy).
Dla ustalonej liczby
2
(0
,
1) szukamy takich liczb
u
1
,
u
2
»e:
P
(
u
1
< U < u
2
) = 1

.
Wiadomo, »e estymator:
X

m
p
n
U
=
ma rozkład
N
(0
,
1). Zatem:
P
(
u
1
< U < u
2
) =
F
(
u
2
)

F
(
u
1
) = 1

.
Dla danego
mo»na dobra¢ na ró»ne sposoby liczby
1
,
2
aby
1
+
2
=
,
oraz 0
<
1
,
2
<
, a tak»e przyj¡¢, za
u
1
tak¡ warto±¢ zmiennej o rozkładzie
N
(0
,
1), »e
P
(
U < u
1
) =
1
i za
u
2
warto±¢ spełniaj¡c¡ warunek
P
(
U < u
2
) = 1

2
.
Liczby
u
1
,
u
2
s¡ kwantylami rz¦du odpowiednio
1
i 1

2
zmiennej u i oznaczamy je
u
1
,
u
1

2
.
!
X

m
p
n < u
1

2
P
u
1
<
= 1

.
St¡d
X

u
1

2
p
n
< m < X

u
1
p
n
P
= 1

.
W praktyce przyjmuje si¦, »e
1
=
2
=
/
2. W takim przypadku otrzymujemy przedział:
p
n
< m < X

u
2
p
n
X

u
1

2
P
= 1

.
Poniewa» dla rozkładu
N
(0
,
1) mamy
u
2
=

u
1

2
, wi¦c
p
n
< m < X
+
u
1

2
p
n
X

u
1

2
P
= 1

,
gdzie
u
1

2
spełnia warunek
P
|
U
|
< u
1

2
= 1

.
Własno±ci
Długo±¢ przedziału zale»y od współczynnika ufno±ci 1

. Im wi¦kszy współczynnik, tym
dłu»szy przedział i na odwrót.
2
 Długo±¢ przedziału zale»y od liczebno±ci próby
n
. Im wi¦ksza liczebno±¢, tym krótszy
przedział i na odwrót.
Przy danym współczynniku ufno±ci 1

i ustalonej liczebno±ci próby
n
przedział syme-
tryczny wzgl¦dem ±redniej jest przedziałem ufno±ci o najkrótszej długo±ci.
Przykład c.d.
n
= 10
= 3 (dokładno±¢ wagi)
Poniewa» obserwujemy próbk¦, wi¦c w otrzymanym wy»ej wzorze w miejsce estymatora ±red-
niej podstawiamy warto±¢ odpowiadajacej mu statystyki (obliczonej na podstawie tej próbki),
czyli:
¯
10
=
x
10
= 998
.
5
.
Teraz przyjmuj¡c za
kolejno liczby 0
.
1
,
0
.
05, oraz 0
.
01
,
mo»na wyznaczy¢ odpowiednie prze-
działy ufno±ci.
Opisane powy»ej zagadnienie mo»na modyfikowa¢ na ró»ne sposoby. Po pierwsze, mo»e
nas interesowa¢ przedział ufno±ci innego typu, na przykład postaci: (
,
1
). Po drugie, nie
zawsze mo»na zało»y¢, »e znamy odchylenie standardowe
.
Po trzecie, zało»enie, »e rozkład jest
normalny, cz¦sto nie jest spełnione. Mo»emy tak»e by¢ zainteresowani znalezieniem przedziału
ufno±ci dla innego, ni» warto±¢ oczekiwana, parametru rozkładu.
Istniej¡ ró»ne metody radzenia sobie w wymienionych przypadkach, ale wi¦kszo±¢ z nich
polega na zastosowaniu podobnego do poprzedniego schematu post¦powania, który polega na
wykorzystaniu pewnej zmiennej losowej o znanym rozkładzie, b¦d¡cej funkcj¡ estymatora inte-
resuj¡cego nas parametru, a nast¦pnie na obliczeniu na jej podstawie (oraz na podstawie za-
obserwowanej próbki) ko«ców przedziału ufno±ci na okre±lonym z góry poziomie ufno±ci 1

.
W naszych wcze±niejszych rozwa»aniach t¡ zmienn¡ losow¡ była zmienna
U,
za± jej rozkład był
znany na podstawie odpowiedniego twierdzenia granicznego (patrz: rachunek prawdopodob.),
przy czym uwzgl¦dnili±my zało»on¡ wcze±niej znajomo±¢
.
1.
Przedziały ufno±ci dla ±redniej w populacji
Model I Cecha ma w populacji rozkład normalny
N
(
m,
), przy czym
odchyleniestandardowe
jestznane
. Przedział postaci:
x

u
1

p
n
,
+
1
nazywamy
prawostronnymprzedziałemufno±ci
p
n
> u
(
X

m
) :
P
= 1

.
3
Przedział postaci
−1
, x

u
p
n
−1
, x
+
u
1

p
n
=
nazywamy
lewostronnymprzedziałemufno±ci
p
n
< u
1

(
X

m
) :
P
= 1

.
Przy danej liczno±ci
n
próby i danym współczynniku ufno±ci 1

najkrótszym
przedziałem ufno±ci jest przedział:
p
n
, x
+
u
1

2
p
n
x

u
1

2
p
n
< u
1

2
|
X

m
|
:
P
= 1

.
Ma on długo±¢ 2
u
1

2
p
n
.
Nie zale»y ona od warto±ci
x
i
,
ale od obranego współczyn-
nika ufno±ci 1

(im wi¦kszy współczynnik, tym dłu»szy przedział) i od liczno±ci
próby
n
(im wi¦ksza liczno±¢, tym krótszy przedział).
Model II Cecha ma w populacji rozkład normalny
N
(
m,
)
,
przy czym
odchyleniestandardowe
,
±redniaiwariancja
s¡nieznane
, próba jest mała (
n
¬
30). Przedział ufno±ci dla
parametru
m
tego rozkładu ma posta¢:
s
p
n

1
, x
+
t
1

2
,n

1
s
p
n

1
x

t
1

2
,n

1
,
gdzie
s
2
=
P
i
=1
(
x
i

x
)
2
,
t
1

2
,n

1
– ma rozkład t-Studenta z
n

1 stopniami swobody (odczytujemy z tablic
rozkładu).
1
n
4
 Model III
Próbadu»a
(
n >
30),
nieznaneodchyleniestandardowe,±redniaiwariancja
. Prze-
dział ufno±ci dla parametru
m
tego rozkładu ma posta¢:
p
n
, x
+
u
1

2
p
n
x

u
1

2
gdzie
u
1

2
odczytujemy z tablic rozkładu normalnego.
Ze wzgl¦du na du»¡ liczebno±¢, wyniki próby grupuje si¦ zwykle w szereg rozdzielczy
i ±redni¡ oraz odchylenie standardowe liczymy bior¡c pod uwag¦ ±rodki przedziałów
klasowych. Gdy liczba przedziałów klasowych jest mała, tzn. gdy długo±¢ ka»dego
przedziału klasowego jest du»a, przy wyliczaniu odchylenia standardowego nale»y
zastosowa¢ poprawk¦ na grupowanie, tj. odj¡¢ od
s
2
12
b
2
.
2.
Przedziały ufno±ci dla wariancji i odchylenia standardowego
1
liczb¦
Model I Cecha ma rozkład
N
(
m,
)
.
Próba mała o liczno±ci
n
¬
50
.
Konstrukcja przedziału opiera si¦ na statystyce:
2
=
ns
2
2
=
i
=1
(
X
i

X
)
2
,
2
która ma rozkład
2
o
n

1 stopniach swobody.
2
2
,n

1
,
1

2
,n

1
oznaczaj¡ kwantyle tego rozkładu.
Przedział ufno±ci dla
2
:
ns
2
ns
2
2
2
,n

1
,
1

2
,n

1
<
2
<
dla odchylenia standardowego
:
s
s
n
1

2
,n

1
n
2
2
,n

1
s < <
s.
5
  [ Pobierz całość w formacie PDF ]

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • telefongry.keep.pl






  • Formularz

    POst

    Post*

    **Add some explanations if needed