wykład 4, Studia, Stopień 2 Semestr I, Statystyczne systemy informatyczne w AD, Wykłady

[ Pobierz całość w formacie PDF ]
wzrost = read.csv2("Wzrost.csv", header = F)[,1]?t.test?chisq.testapropos("test")#testuje, czy przecietny wzrost jest równy 170, przeciwko zaprzeczeniut.test(wzrost, mu = 170)#No dobrze, ale czy wzrost ma rozkład normalny?#test chi^2 - zgodnościmi = mean(wzrost)sigma = sd(wzrost)ile = length(wzrost)#15 klas, potem 20k = 15w = 0:k#1 podejscie - jednakowe p-stwapodzial = qnorm(w/k, mi, sigma)podzialpodzial[1] = min(wzrost)-5podzial[length(podzial)] = max(wzrost)+5szereg = table(cut(wzrost, podzial))szereg(t=chisq.test(szereg))#jak sie dobrać do wyników?names(t)#ale estymowałem parametry (dwa) rozkładu normalnego#poprawiona p-wartość1-pchisq(t$statistic, k-3)print(hist(wzrost, podzial, col = "yellow"))szereg#oczywiscie moge sam policzyć:teor=ile/k(chi2=sum((szereg-teor)^2/teor))#jak wiec sobie poradzić?#może jednak podzial od strony danych, 20 klask = 20dl = (max(wzrost)-min(wzrost))/(k-1)podzial2 = dl*(0:k) - dl/2 + min(wzrost)szereg2 = table(cut(wzrost, podzial2))szereg2hist(wzrost, podzial2, col = "lightblue")pstwa = pnorm(podzial2[2:(k+1)], mi, sigma) -pnorm(podzial2[1:k], mi, sigma)pstwa(t = chisq.test(szereg2, p = pstwa))#ups, zle!sum(pstwa)#faktycznie, poprawimy takpodzial2b = podzial2podzial2b[1] = -Infpodzial2b[length(podzial2b)] = Infpstwa = pnorm(podzial2b[2:(k+1)], mi, sigma) -pnorm(podzial2b[1:k], mi, sigma)sum(pstwa)(t = chisq.test(szereg2, p = pstwa))#poprawiona p-wartość1-pchisq(t$statistic, k-3)#czegos jeszcze nie mamy - klasy po 5 elementowszereg2#uwaga to dziala dla k = 20,podzial3 = podzial2b[c(1, 3:17, 21)](szereg3 = table(cut(wzrost, podzial3)))k3 = length(szereg3)pstwa3 = pnorm(podzial3[2:(k3+1)], mi, sigma) -pnorm(podzial3[1:k3], mi, sigma)(t = chisq.test(szereg3, p = pstwa3))#poprawiona p-wartość1-pchisq(t$statistic, k3-3)#to może prościej (i zarazem lepiej)? - test normalnosci Shapiro-Wilkashapiro.test(wzrost)#to jeszcze test niezależności chi^2dane = read.csv2("Zakupy.csv")attach(dane)#najprostszy test chi2, niezaleznoscichisq.test(table(WYKSZTALCENIE, cut(WYDATEK, 7)))#ale ostrzega (mało liczne klasy przy dużym wydatku)#pierwsza poprawkapodzial = seq(min(WYDATEK), max(WYDATEK), length = 10)table(cut(WYDATEK, podzial))#no to tak:podzial2 = podzial[c(1:7, 10)]#OK:table(cut(WYDATEK, podzial2))#to jeszcze towyk = factor(WYKSZTALCENIE, levels = c("P", "Z", "S", "W"))table(wyk, cut(WYDATEK, podzial2))chisq.test(table(wyk, cut(WYDATEK, podzial2)))detach(dane) [ Pobierz całość w formacie PDF ]

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • telefongry.keep.pl






  • Formularz

    POst

    Post*

    **Add some explanations if needed