wykład 9 wprowadzenie do modeli dla zero-jedynkowych zmi ennych objasnianych, Informatyka i Ekonometria SGGW, ...
[ Pobierz całość w formacie PDF ]
//-->MODELE ZMIENNYCH JAKOŚCIOWYCHModele dwumianowe (dychotomiczne) są najprostszymi i najpopularniejszymimodelami, w których zmienna objaśniana jest zmienną jakościową. W modelach tychzmienna objaśniana jest kwantyfikowana za pomocą zmiennej zerojedynkowej. Niechyioznaczai-tąrealizację zmiennej zerojedynkowejY.Zmiennayima rozkład Bernoulliego.Przyjmuje wartość 1 z prawdopodobieństwemPioraz wartość 0 z prawdopodobieństwem1-Pi.Wartość oczekiwana zmiennejyiwynosi:E(yi)�½1P(1P)�½PiiiW modelach dwumianowych zakłada się, żePijest funkcją wektora wartości zmiennychobjaśniającychxidlai-tegoobiektu oraz wektora parametrów:P�½P(yi�½1)�½F(xTβ)iiW zależności od typu funkcjiFwyróżnia się różne rodzaje modeli. Do najbardziej znanychnależą:liniowy model prawdopodobieństwa, którymPi�½F(xTβ)�½xTβ,iimodel logitowy, dla któregoPi�½F(xTβ)�½imodel probitowy, gdziePi�½F(x β)�½TixTβi1,1expxTβit2exp dt.221LINIOWY MODEL PRAWDOPODOBIEŃSTWA (LMP)W liniowym modelu prawdopodobieństwa:P(yi�½1)�½P�½F(xTβ)�½xiTβ, stądP(yi�½0)�½1P�½1F(xTβ)�½1xTβ,iiiiiczyli wartość oczekiwana dla zmiennej zerojedynkowejYjest następująca:E(yi)�½1P(1P)�½P�½xTβiiiiWychodząc z tożsamościyi�½E(yi)yiE(yi)oraz definiująci�½yiE(yi), otrzymujesię, żeyi�½E(yi)i�½xTβ i, ostatecznie więc, liniowy model prawdopodobieństwaimożna przedstawić jako:yi�½xTβiiW LMP parametrjprzy zmiennejXjinterpretujemy jako wzrost prawdopodobieństwazdarzeniaP(yi�½1)w wyniku wzrostu zmiennejXjo jednostkę (przy założeniuceterisparibus).W LMPdlayi�½1z prawdopodobieństwemPimamy:1�½xTβi, czylii�½1xTβ�½1P,iiidlayi�½z prawdopodobieństwem 1-Pimamy:�½xTβ i, czylii�½ xTβ �½ P,iiiVar(i)�½P(1P)2(1P)(P)2�½P(1P)iiiiiiWariancje składników losowych w liniowym modelu prawdopodobieństwa są różne. Doestymacji wektoranie należy wykorzystywać zwykłej MNK. Można za to zastosowaćuogólnioną metodą najmniejszych kwadratów, w której wektor ocen parametrów wyraża sięwzorem:b�½XTΩ1XXTΩ1Y1(&)gdzie:-macierz kowariancji i wariancji składników losowych określona wzorem:P1P11P21P2Ω�½..................Pn1Pn...(*)Na przekątnej macierzyznajdują się wariancje składników losowychi(i=1, 2,… n).Pozaprzekątną znajdują się kowariancje składników losowych. Zakładając, że składniki losowe sąnieskorelowane ze sobą, otrzymuje się kowariancje równe zero.Do wyznaczenia wektora ocen parametrówbniezbędna jest macierz(macierzXorazwektorYsąznane).DooszacowaniaelementówmacierzyniezbędnesąprawdopodobieństwaPi. W niektórych sytuacjachPisą znane, w pozostałych trzeba jeoszacować. PrawdopodobieństwoPimożna określić w następujący sposób1:1. Należy oszacować parametry liniowego modelu prawdopodobieństwa:W tym przypadku ocena wektora parametrów wyraża się wzorem:bMNK�½XTXXTY1(**)2. Przyjmuje się, że wektor teoretycznych wartości prawdopodobieństwa jest równy:ˆpMNK�½XbMNKTeoretyczneczęstościpMNKi(i=1,2…n)możnaprzyjąćzaoszacowaniaprawdopodobieństwPi:Oszacowania wariancji i kowariancji składników losowych mają postać:1Procedurę tę zaproponował Goldberger (1964)p11p1p�½ ...............p21p2......pn1pn()Ponieważ rozważana macierzokreślona wzorem jest diagonalna, to stosuje się wersjęuogólnionej MNK zwaną ważoną MNK.Zamiast wykonywać mnożenie macierzy można zastosować transformacje zmiennych:yi*�½yix,xi*�½i, gdziewi– wagi,wi�½wiwipi1pidlaY*iX*stosujemy zwykłą MNKUwaga: aby móc zastosować wzórwi�½pi1pi,pipowinno być:pi1.Dla dużych prób zwyklepi1. Czasami w sytuacji, gdypiproponuje się przyjąćpi�½0,001(lub 0,005), gdy zaśpi1, topi�½0,999(lub 0,995) (por. Baltagi 2008).Jeśli relatywnie dużo obserwacji nie spełnia warunkupi1, to należałobyrespecyfikować model.Uwaga: Oprócz UMNK do estymacji parametrów LMP można wykorzystać metodęnajwiększej wiarygodności.PRZYKŁADOszacowano model LMP dla wiarygodności klientów banku następującej postaci:ˆyi�½0,660,005xigdzie:yi=1 dla osób regularnie płacących raty orazyi=0 dla pozostałych kredytobiorców,xi- wysokość zarobków (w tys. PLN rocznie).Należy zinterpretować wartość teoretyczną dla klienta, dla którego zarobki wynoszą 40 PLN.p�½0,660,00540�½0,86- czyli prawdopodobieństwo regularnej spłaty rat wynosi 0,86.Jaka jest interpretacja oceny parametru wynoszącej 0,005?Ocenę parametru 0.005 interpretujemy jako średni wzrost prawdopodobieństwa, że klient będzieregularnie spłacał raty w wyniku wzrostu rocznych zarobków o 1 tys. PLN.Liniowy model prawdopodobieństwa był szeroko stosowany w latach 60-tych i 70-tych XXw.Zalety LMP:łatwość estymacji,bezpośrednia interpretacja oszacowań.Zastosowanie najprostszego z przedstawionych modeli - liniowego modeluprawdopodobieństwa ma wiele negatywnych konsekwencji.1. Składnik losowy modeluyi�½xTβijest heteroskedastyczny, gdyżVar(i)�½Pi(1Pi).i2. Składnik losowy modeluyi�½xTβinie ma rozkładu normalnego, co powodujeitrudności w zastosowaniu testów istotności.ˆ3. Wartościyi�½ xTbmogą wykraczać poza przedział [0, 1] (przezboznaczono wektor oceniwektora parametrów).4. Współczynnik determinacji R2w modelu LMP przyjmuje zwykle bardzo niskie wartości.Ponadto, fundamentalny problem w stosowaniu LMP polega na przyjęciu założenia, żeprawdopodobieństwo w sposób liniowy zależy od zmiennych objaśniających, co jestrównoznaczne z założeniem, że krańcowy efekt jest stały. W większości problemówpraktycznych zależność prawdopodobieństwa od zmiennych objaśniających jest nieliniowa.
[ Pobierz całość w formacie PDF ]