wykład 7 jakościowe zmienne objaśniające, Informatyka i Ekonometria SGGW, Semestr 5, Ekonometria
[ Pobierz całość w formacie PDF ]
//-->Uwzględnianie zmiennych jakościowych w charakterze zmiennych objaśniającychW badaniach ekonomicznych wymaga się niekiedy, aby zbiór zmiennych objaśniającychoprócz zmiennych ilościowych obejmował także zmienne jakościowe. Zmiennymijakościowymi są na przykład: płeć, wykształcenie, stan cywilny. Aby zmienne jakościowemogły być uwzględnione w modelu ekonometrycznym, należy dokonać ich kwantyfikacji zapomocą zmiennych zerojedynkowych (ang.dummy variables).Dla uproszczenia, na wstępie rozważa się model, gdzie zmienna objaśniana zależy odjednej zmiennej ilościowej oraz od jednej zmiennej jakościowej.Jeśli zmienna jakościowa odnosi się do 2 możliwych wariantów A i B, to możnazdefiniować odpowiadającą jej zmienne zero-jedynkowe jako:1, gdyi-ta obserwacja reprezentuje wariant A,z1i�½ 0, gdyi-ta obserwacja reprezentuje wariant B.1, gdyi-ta obserwacja reprezentuje wariant B,z2i�½ 0, gdyi-ta obserwacja reprezentuje wariant A.Gdyby uwzględnić zmienneZ1iZ2, to wówczas macierzXmiałaby postać:111X�½1111 00 11 00 11 00 1x1x2xjxj1xj2xnWtedy pierwsza kolumna byłaby sumą drugiej i trzeciej kolumny – zachodziłaby zatemdokładnawspółliniowość.1WkonsekwencjimacierzXTXbyłabyosobliwa,couniemożliwiałoby wyznaczenie w sposób jednoznaczny ocen parametrów ze wzorub�½XTXXTY.Dlatego też w modelach ze stałą wykorzystuje się tylko jedną ze zmiennychZ1iZ2.Załóżmy,że uwzględnimy tylko zmiennąZ1.Jaką interpretację mają wtedy parametry poniższegomodelu?ˆyi�½ca1x1ic1z1iPonieważz2i�½1z1i, toˆˆyi�½ba1x1ib1z1ib2z2i=yi�½ba1x1ib1z1ib2(1z1i)�½bb2a1x1i(b1b2)z1iStądc�½bb2¸c1�½(b1b2), czyli w modelu:ˆyi�½ca1x1ic1z1ic1mierzy średni wpływ na zmienną objaśnianą wariantu A w odniesieniu do wariantu B (przytakim samym poziomie zmiennej ilościowejX1).Interpretacja wynika także z następującego faktu:ˆdlaZ1=1 mamy:Y(1)�½ca1X1c11�½ca1X1c1,ˆdlaZ1=0 mamy:Y(0)�½ca1X1c1�½ca1X1,ˆˆróżnicaY(1)Y(0)�½c1(przy takim samymX1)W sytuacji rozważania populacji mamy:Y�½1X11Z1(tzn. cjest oceną parametru,a1-1orazc1-1)dlaZ1=1 mamy:Y(1)�½1X111(1),dlaZ1=0 mamy:Y(0)�½1X11(0),PonieważE((1))�½E((0))�½, toE(Y(1))E(Y(0))�½1, stąd wynika, że1jest różnicą między wartością oczekiwaną zmiennejobjaśnianej dla sytuacji, gdy wystąpiła wariant A a wartością oczekiwaną zmiennejobjaśnianej dla sytuacji, gdy wystąpiła wariant B, przy takim samym poziomieX1.PrzykładW celu zbadania spożycia owoców w pewnym regionie rozważono następujące dane pochodzące od 12 losowowybranych osób.Tabela Miesięczne spożycie owoców, miesięczne dochody i płeć 12 losowo wybranych osób.NrSpożycieDochodyowoców w kg w tys. zł22,11,82,733,5PłećmężczyznakobietakobietakobietamężczyznamężczyznaNr13,824,734,44554,163,7Źródło: Dane umowne.789101112Spożycieowoców wkg4,95,45,24,64,03,6Dochodyw tys. zł54,54,23,82,41,4PłećkobietamężczyznakobietamężczyznamężczyznamężczyznaJeśli przezyoznaczymy miesięczne spożycie owoców,x1– miesięczne dochody, a przezz1zmienną zerojedynkową, .przyjmującą wartość 1, jeśli badana osoba jest kobietą oraz wartość0, w przypadku, gdy badaną osobą jest mężczyzna, to dane możemy zapisać w postaci:TabelaNr123456yi3,84,74,454,13,7x1i22,11,82,733,5z1i111Nr789101112yi4,95,45,24,64,03,6x1i54,54,23,82,41,4z1i11Oszacowany model ma postać:ˆyi�½3,270,31x1i0,60z1i[0,34] [0,10] [0,23](w nawiasach podano standardowe błędy szacunku).Można zatem wnioskować, że (po wyeliminowaniu wpływu płci) wzrost miesięcznychdochodów o 1 tysiąc złotych powoduje wzrost miesięcznego spożycia owoców średnio o 0,31kg. Z kolei przy takich samych dochodach kobiety spożywają miesięcznie średnio o 0,6 kgowoców więcej od mężczyzn.W przypadku, gdy zmienna jakościowa odnosi się do 3 możliwych wariantów A, B i C,to zmienne zero-jedynkowe określa się jako:1,gdyi- ta obserwacja reprezentuje wariant A,z1i�½ hh,,w przeciwnyc przypadkacoraz1,gdyi- ta obserwacja reprezentuje wariant B,z2i�½ hh.,w przeciwnyc przypadkac1,gdyi- ta obserwacja reprezentuje wariant C,z3i�½ hh,,w przeciwnyc przypadkacwówczas między stałą i zmiennymiz1,z2,z3, zachodziłaby zależność liniowa, zatem niemożliwe byłoby jednoznaczne oszacowanie parametrów modelu.PrzykładNa podstawie 6 obserwacji ustalono, że zmienna jakościowa kolejno odpowiada wariantom C,C, B, A, A, B. MacierzXjest wówczas następująca:111X�½111x11x12x13x14x15x160 0 10 0 10 1 01 0 01 0 00 1 0gdziex1i– wartościi-tejobserwacji zmiennej ilościowejx1,i=1,2,...,6, pierwsza kolumnaodpowiada stałej, trzecia kolumna zmiennejz1, czwarta –z2, piąta –z3. Gdy zsumuje siękolumny trzecią, czwartą i piątą, otrzyma się kolumnę pierwszą. Pomiędzy kolumnamimacierzyXzachodzi więc liniowa zależność. W konsekwencji macierzXTXjest osobliwa,nie można zatem jednoznacznie oszacować parametrów modeluyi�½1x1i1z1i2z2i3z3iigdyż oceny parametrów wyznacza się ze wzoru:b�½XTXXTY.1Aby móc oszacować parametry modelu należy usunąć dowolną kolumnę, która jest związanaz innymi kolumnami zależnością liniową. Załóżmy, że pominiemy zmienną Z3.Jaką interpretację mają wtedy parametry poniższego modelu?ˆyi�½ca1x1ic1z1ic2z2iPonieważz3i�½1z1iz2i, toˆyi�½ba1x1ib1z1ib2z2ib3z3i=ˆyi�½ba1x1ib1z1ib2z2ib3(1z1iz2i)�½bb3a1x1i(b1b3)z1i(b2b3)z2iStądc�½bb3¸c1�½ (b1b3),c2�½ (b2b3)czyli w modelu:ˆyi�½ca1x1ic1z1ic2z2ic1mierzy średni wpływ na zmienną objaśnianą wariantu A w odniesieniu do wariantu C(przy takim samym poziomie zmiennej ilościowejx1),c2mierzy średni wpływ na zmienną objaśnianą wariantu B w odniesieniu do wariantu C(przy takim samym poziomie zmiennej ilościowejx1).Ogólnie, w modelu ze stałą, liczba zmiennych reprezentujących zmiennąjakościową musi być o jeden mniejsza od liczby wariantów.Ocena parametru występująca w modelu przy zmiennej reprezentującej dany wariant mierzyśredni wpływ na zmienną objaśnianą tego wariantu odniesiony do wpływu wariantupominiętego.UwagaW modelach ze zmienną jakościową uwzględniającąk>2wariantów mamy:ˆyi�½ba1x1ib1z1ib2z2ibk1zk1.izasadność wprowadzanej zmiennej jakościowejweryfikujemy częściowym testem F.Modele z interakcjamiWe wcześniejszych modelach tylko stała a nie parametr nachylenia może różnić się dlaposzczególnych wariantów jakościowej zmiennej objaśniającej.ˆyi�½ 3, 27 0,31x1i 0,60z1iOszacowaną zależność spożycia owoców od dochodów można także zapisać oddzielnie dla obu rozważanychgrup:ˆyi�½ 3,87 0,31x1idla kobiet (różowa linia)ˆyi�½ 3, 27 0,31x1idla mężczyzn (przerywana granatowa linia).Graficznie, modelom tym odpowiadają dwie proste równoległe.
[ Pobierz całość w formacie PDF ]