zadania1,
[ Pobierz całość w formacie PDF ]
WNIOSKOWANIE STATYSTYCZNE
ESTYMACJA
ZADANIA PRZYKŁADOWE
1. Instytut Bada« Marketingowych chciał uzyska¢ od m¦»czyzn, na podstawie próby 400-osobo-
wej, informacje na temat przyzwyczaje« dotycz¡cych golenia. 240 ankietowanych odpo-
wiedziało, »e regularnie u»ywa elektrycznej maszynki do golenia. Wyznacz 99% przedział
ufno±ci dla frakcji m¦»czyzn gol¡cych si¦ za pomoc¡ maszynki elektrycznej.
2. Spo±ród pracowników pewnego przedsi¦biorstwa wylosowano niezale»nie 240 pracowników
i okazało si¦, »e połowa z nich ma wykształcenie ±rednie, z czego wykształcenie techniczne
ma 50%, wykształcenie ekonomiczne – 20%, wykształcenie ogólne – 20% i inne – 10%.
Przyjmij współczynnik ufno±ci na poziomie 0
,
99 i oszacuj punktowo oraz przedziałowo od-
setek pracowników o wykształceniu:
a) ±rednim ekonomicznym,
b) innym ni» ±rednie.
3. Z ksi¡»ki adresowej pewnego domu wysyłkowego wybrano prób¦ losow¡ o liczebno±ci
n
=
900, aby oszacowa¢ udział gospody« domowych w±ród wszystkich klientów. W próbie na-
liczono 360 gospody« domowych. Wyznacz 95% przedział ufno±ci dla udziału gospody«
domowych w ogólnej liczbie klientów.
4. Aby oceni¢ jako±¢ partii towaru wybrano losowo 140 sztuk i okazało si¦, »e 6 sztuk miało
pewne braki. Na poziomie ufno±ci 0
,
9 oce«, jaki procent całej populacji stanowi¡ produkty
uszkodzone. Dokonaj tak»e estymacji punktowej odsetka produktów uszkodzonych.
5. Spo±ród gmin wiejskich województwa zachodniopomorskiego wylosowano 14 gmin, w któ-
rych liczba mieszka« oddanych do u»ytku w 2003 roku kształtowała si¦ nast¦puj¡co:
29
,
5
,
19
,
25
,
5
,
3
,
37
,
6
,
8
,
3
,
22
,
9
,
3
,
26.
Oszacuj przedziałowo:
a) przeci¦tn¡ liczb¦ mieszka« oddanych do u»ytku w gminach wiejskich województwa Za-
chodniopomorskiego (współczynnik ufno±ci 0
,
95),
b) odchylenie standardowe liczby mieszka« oddanych do u»ytku w gminach wiejskich (współ-
czynnik ufno±ci 0
,
90).
6. Dla 180 czteroosobowych rodzin wylosowanych niezale»nie w pewnym mie±cie otrzymano
nast¦puj¡cy rozkład ich dochodów:
Dochód rodziny [zł] 0
−
800 800
−
1200 1200
−
1600 1600
−
2000 2000
−
2400
Liczba rodzin
50
40
35
30
Przy zało»eniu, »e dochód czteroosobowych rodzin ma rozkład normalny, oszacuj punktowo
i przedziałowo przeci¦tny dochód oraz odchylenie standardowe dochodu rodzin w badanym
mie±cie (współczynnik ufno±ci 0
,
9).
7. W styczniu 1996 roku w pewnym przedsi¦biorstwie dla 300 wylosowanych niezale»nie pra-
cowników obliczono współczynnik korelacji mi¦dzy liczb¡ zwolnie« a liczb¡ nadgodzin w
1
25
ci¡gu 1995 roku, który wyniósł 0
,
2. Oszacuj punktowo i przedziałowo (1
−
= 0
,
9) współ-
czynnik korelacji liniowej mi¦dzy liczb¡ zwolnie« a liczb¡ nadgodzin w ci¡gu 1995 roku
w populacji pracowników badanego przedsi¦biorstwa. Sprawd¹ precyzj¦ oszacowania. Jakie
zało»enie nale»y przyj¡¢ na wst¦pie, aby estymacja współczynnika korelacji była przepro-
wadzona prawidłowo?
8. Spo±ród usługowych firm informatycznych działaj¡cych w Polsce wylosowano niezale»nie
27 firm i otrzymano dla tej próby nast¦puj¡ce dane dotycz¡ce przychodów z usług w 1998
roku (
y
i
– w mln zł) oraz stanu zatrudnienia na dzie« 31.12.1998 roku (
x
i
– w osobach):
2
X
x
i
= 1342;
2
X
x
i
= 129156;
2
X
y
i
= 123;
2
X
y
i
= 1756
,
54;
2
X
x
i
·
y
i
= 9793.
i
=1
i
=1
i
=1
i
=1
i
=1
Na podstawie tych informacji zbuduj przedział ufno±ci dla współczynnika korelacji liniowej
mi¦dzy przychodami z usług a stanem zatrudnienia w populacji usługowych firm informa-
tycznych.
ROZWIZANIA I ODPOWIEDZI
1. Stosujemy wzór na estymator z tablic (s. 18):
P
8
<
m
n
−
u
·
t
n
·
1
−
n
¬
p
¬
m
n
+
u
·
t
n
·
1
−
n
9
=
= 1
−
:
n
n
;
W naszej próbie
m
= 240 a
n
= 400. Współczynnik ufno±ci wynosi 1
−
= 0
,
99, potrzebna
nam jest warto±¢
u
, któr¡ odczytamy z tablic dystrybuanty rozkładu normalnego (tablice,
s. 30) dla warto±ci 1
−
2
(pami¦tamy, »e w przypadku rozkładu normalnego sami musimy
zadba¢ o usuni¦cie obu ogonów rozkładu). W naszym przypadku szukan¡ warto±ci¡
u
jest
2
,
58. Po podstawieniu do wzoru otrzymujemy
P
{
0
,
5368
¬
p
¬
0
,
6632
}
= 0
,
99
,
zatem przedział o ko«cach w 53
,
68% i 66
,
32% jest jednym z przedziałów, które z prawdopo-
dobie«stwem 0
,
99 pokrywaj¡ nieznan¡ prawdziw¡ warto±¢ odsetka m¦»czyzn, u»ywaj¡cych
elektrycznej maszynki do golenia w populacji generalnej.
2. Punktowo odsetek szacujemy z wzoru
p
=
m
n
±
t
m
n
·
1
−
n
n
zatem po podstawieniu
m
= 24 i
n
= 240 otrzymujemy odsetek pracowników badanej firmy,
którzy maj¡ wykształcenie ±rednie ekonomiczne dany jako
p
= 0
,
1
±
0
,
01936, tzn. mylimy
si¦ ±rednio o 1
,
94 punktu procentowego twierdz¡c, »e odsetek ten wynosi 10%.
Przedziałowo szacujemy podobnie jak w zadaniu poprzednim, zatem po podstawieniu do
wzoru stwierdzimy, »e przedział o ko«cach w 5
,
0% i 15
,
0% jest jednym z przedziałów, które
z prawdopodobie«stwem 99% pokrywaj¡ nieznan¡ warto±¢ odsetka pracowników badanej
firmy, którzy maj¡ wykształcenie ±rednie ekonomiczne.
2
900
. Poniewa» 1
−
= 0
,
95, wi¦c 1
−
2
= 0
,
975 i
u
= 1
,
96, zatem 0
,
3680
¬
p
¬
0
,
4320 tzn. przedział o ko«cach w 36
,
8% i 43
,
2% jest jednym z przedziałów, które
z prawdopodobie«stwem 0
,
95 pokrywaj¡ nieznan¡ prawdziw¡ warto±¢ odsetka gospody«
domowych w ogólnej liczbie klientów owego domu wysyłkowego.
4.
u
= 1
,
65, zatem przedział o ko«cach w 1
,
46% i 7
,
11% jest jednym z przedziałów„ które z
prawdopodobie«stwem 0
,
9 pokrywaj¡ nieznan¡ warto±¢ odsetka uszkodzonych produktów
w badanej partii.
360
Szacuj¡c punktowo odsetek uszkodzonych produktów, mylimy si¦ ±rednio o 1
,
71 punktu
procentowego twierdz¡c, »e wynosi on 4
,
29%.
5. W tym zadaniu podane s¡ surowe dane, dlatego musimy samodzielnie obliczy¢ warto±ci
x
,
S
2
(
x
) i
S
(
x
). redni¡ obliczamy, korzystaj¡c z wzoru
X
x
i
x
=
i
=1
,
n
zatem
x
=
29 + 5 + 19 + 25 + 5 + 3 + 37 + 6 + 8 + 3 + 22 + 9 + 3 + 26
14
=
200
14
= 14
,
2857
.
Wariancj¦ obliczamy jako
X
(
x
i
−
x
)
2
S
2
(
x
) =
i
=1
,
n
a odchylenie standardowe – jako pierwiastek kwadratowy z wariancji. Odpowiednie oblicze-
nia – w poni»szej tabeli.
P
x
i
x
i
−
x
(
x
i
−
x
)
2
29 14,7143 216,5102
5 -9,2857 86,2245
19 4,7143 22,2245
25 10,7143 114,7959
5 -9,2857 86,2245
3 -11,2857 127,3673
37 22,7143 515,9388
6 -8,2857 68,6531
8 -6,2857 39,5102
3 -11,2857 127,3673
22 7,7143 59,5102
9 -5,2857 27,9388
3 -11,2857 127,3673
26 11,7143 137,2245
200
1756,8571
a) Wariancja wynosi
1756
,
8571
27
S
2
(
x
) =
= 125
,
4898
3
Analogiczne obliczenia w przypadku drugiego podpunktu daj¡ wyniki
p
= 0
,
5
±
0
,
03227
oraz 0
,
4167
¬
p
¬
0
,
5833.
3. Mamy
n
=
natomiast odchylenie standardowe jest równe
q
S
(
x
) =
S
2
(
x
) = 11
,
2022
Przeci¦tn¡ liczb¦ mieszka« oddanych do u»ytku szacujemy, korzystaj¡c z wzoru z tablic (s.
17, ±rodek strony),
(
x
−
t
S
(
x
)
p
n
−
1
¬
µ
¬
x
+
t
S
(
x
)
)
P
p
n
−
1
= 1
−
,
1
−
= 0
,
95, wi¦c szukamy w tablicy kwantyli rozkładu t-Studenta (s. 31) warto±ci w
kolumnie dla
= 0
,
05 i w wierszu dla
k
=
n
−
1 = 13 (uwaga – tu ju» szukamy warto±ci
t
wewn¡trz tabeli i nie dzielimy
przez dwa). Szukana warto±¢
t
to 2,16.
Po podstawieniu do wzoru otrzymujemy przedział 7
,
5747
¬
µ
¬
20
,
9967, zatem przedział
o ko«cach w 7,57 i 21,0 jest jednym z przedziałów, które z prawdopodobie«stwem 0,95
pokrywaj¡ nieznan¡ warto±¢ przeci¦tnej liczby mieszka« oddawanych do u»ytku w gminach
wiejskich badanego województwa.
b) Próba jest mała (
n
−
1
¬
30), wi¦c odchylenie standardowe szacujemy po±rednio, ko-
rzystaj¡c z wzoru dla wariancji, a nast¦pnie pierwiastkuj¡c ko«ce otrzymanego przedziału
ufno±ci. Wzór (s. 18, u góry) jest postaci
P
8
<
2
2
;
n
−
1
¬
2
¬
n
·
S
2
(
x
)
9
=
;
= 1
−
.
:
1
−
2
;
n
−
1
Szukamy teraz dwóch ró»nych warto±ci w tablicy kwantyli rozkładu
2
(s. 32), dla ka»dego
ko«ca przedziału osobno: w wierszu z
k
=
n
−
1 = 13 i w kolumnach z
2
= 0
,
05 (prawa strona
tabeli) dla lewego ko«ca przedziału oraz z 1
−
2
= 0
,
95 (lewa strona tabeli) dla prawego ko«ca
przedziału. Mamy
1
−
2
;
n
−
1
= 5
,
892 i
2
2
;
n
−
1
= 22
,
362, co po podstawieniu do wzoru daje
przedział dla wariancji 78
,
5644
¬
2
¬
298
,
1767, a po spierwiastkowaniu ko«ców przedziału
otrzymujemy 8
,
8637
¬
¬
17
,
2678. Przedział o ko«cach 8,86 i 17,27 jest zatem jednym
z przedziałów, które z prawdopodobie«stwem 0,9 pokrywaj¡ nieznan¡ warto±¢ odchylenia
standardowego liczby mieszka« oddawanych do u»ytku w gminach wiejskich województwa
Zachodniopomorskiego.
6. W zadaniu tym mamy dane w postaci szeregu przedziałowego. redni¡ oraz odchylenie
standardowe liczymy zatem według wzorów (tablice, s. 6 i s. 7):
k
X
x
i
·
n
i
x
=
i
=1
n
i
t
k
X
(
x
i
−
x
)
2
·
n
i
S
(
x
) =
i
=1
,
n
gdzie
x
i
to ±rodki przedziałów klasowych, a
k
to ich liczba (w zadaniu
k
= 5). Odpowiednie
obliczenia zawiera poni»sza tabela.
4
n
·
S
2
(
x
)
Dochód
x n
i
x
i
·
n
i
x
i
−
x
(
x
i
−
x
)
2
(
x
i
−
x
)
2
·
n
i
0
−
800 400 25 10000
−
961
,
11 923734,57 23093364,20
800
−
1200 1000 50 50000
−
361
,
11 130401,23
6520061,73
1200
−
1600 1400 40 56000
38,89
1512,35
60493,83
1600
−
2000 1800 35 63000
438,89 192623,46
6741820,99
2000
−
2400 2200 30 66000
838,89 703734,57 21112037,04
245000
−
5
,
55
57527777,78
180
=
p
319598
,
77 = 565
,
3307.
Próba jest du»a, wi¦c punktowo szacujemy warto±¢ przeci¦tn¡ jako (tablice, s. 17)
245000
180
= 1361
,
1111 i
S
(
x
) =
q
57527777
,
78
µ
=
x
±
S
(
x
)
p
n
,
co daje
µ
= 1361
,
11
±
42
,
14 – a wi¦c mylimy si¦ ±rednio o 42,14 zł twierdz¡c, »e przeci¦tny
dochód czteroosobowych rodzin w badanym mie±cie wynosi 1361,11 zł.
Przedziałowo szacujemy t¦ wielko±¢ korzystaj¡c z wzoru dla du»ej próby,
(
p
n
¬
µ
¬
x
+
u
S
(
x
)
)
P
p
n
= 1
−
,
dla 1
−
2
= 0
,
95 odczytana z tablic warto±¢
u
= 1
,
65. Po podstawieniu otrzymujemy prze-
dział 1291
,
59
¬
µ
¬
1430
,
64. Jest to jeden z przedziałów, które z prawdopodobie«stwem 0,9
pokrywaj¡ nieznan¡ warto±¢ ±redniego dochodu w rodzinach czteroosobowych w badanym
mie±cie.
7. Kolejne zadanie dotyczy estymacji współczynnika korelacji liniowej (miary zale»no±ci mi¦dzy
dwiema zmiennymi losowymi). Podobnie jak w poprzednich przykładach, korzystamy z
odpowiednich wzorów (dla du»ej próby) z tablic (s. 24):
yx
=
r
yx
±
1
−
r
yx
p
n
oraz
(
r
yx
−
u
·
1
−
r
yx
p
n
¬
yx
¬
r
yx
+
u
·
1
−
r
yx
)
P
p
n
= 1
−
.
W tablicy z warto±ciami dystrybuanty rozkładu normalnego znajdujemy 1
−
2
= 0
,
95 i
odczytujemy
u
= 1
,
65.
Podstawiamy współczynnik korelacji liniowej Pearsona z próby
r
yx
= 0
,
2, liczb¦ obserwacji
n
= 300 i
u
do wzorów i otrzymujemy
yx
= 0
,
2
±
0
,
0554 oraz
P
{
0
,
1085
¬
yx
¬
0
,
2915
}
=
0
,
9
.
Mylimy si¦ ±rednio o 0
,
0554 twierdz¡c, »e współczynnik korelacji liniowej mi¦dzy liczb¡
zwolnie« a liczb¡ nadgodzin w roku 1995 w populacji generalnej (tj. w±ród wszystkich
pracowników badanego przedsi¦biorstwa) wynosi 0,2.
Przedział o ko«cach w 0,1085 i 0,2915 jest jednym z przedziałów, które z prawdopodobie«-
stwem 0,9 pokrywaj¡ nieznan¡ warto±¢ współczynnika korelacji liniowej Pearsona mi¦dzy
liczb¡ zwolnie« a liczb¡ nadgodzin w±ród pracowników badanego przedsi¦biorstwa w 1995
roku.
5
P
Mamy zatem
x
=
x
−
u
S
(
x
)
[ Pobierz całość w formacie PDF ]