Cvičení 10 Opakování probraných testů 1 Příklad z-test V souvislosti s rozsáhlou rekonstrukci tramvajových tratí dopravní podnik provádí průzkum, zda neklesl počet cestujících autobusovou linkou č.87689 před 8 hodinou ranní v porovnání s předchozími lety, kdy v průměru do autobusové linky nastupovalo 36 osob se směrodatnou odchylkou 13,2. V březnu 2018 každé ráno byl zaznamenán počet cestujících a jejich průměr činil 29. Testujte na hladině významnosti 0,05 za předpokladu normality. známý rozptyl to je z-test H 0 : µ = 36 nebo > H A : µ < 36 levostranný test phz= z_test(36,29,13.2^2,31, l,0.05)//0.0015755 2 Příklad t-test [ ph=0.0015755] Zeptali jsme se 10 osob, kolik minut provolají měsíčně s rodinou a jejich odpovědi jsme zaznamenali do tabulky: 108 112 117 130 111 131 113 113 105 128 Na hladině významnosti 0,05 testujte tvrzení, že v průměru provolají víc než 115 minut. test normality pp=shapiro(x);//1 je normalni neznámý rozptyl to je t-test H 0 : µ = 115 nebo > H A : µ < 115 levostranný test ph= t_test(115,mean(x),variance(x),length(x), l,0.05)//0.7191069 3 Příklad var-test [ ph=0.7191069] Skupina studentů píše malé testy na cvičení ze statistiky. Vyučující tvrdí, že skupina píše testy spolehlivě dobře se směrodatnou odchylkou 9.1. Výsledky máme v tabulce. Testujte tvrzení vyučujícího na hladině 0.05. skupina=[92.225131 93.415151 81.472027 74.092019 100 95.5885 74.694837 81.316226 83.512062 91.086324 74.55084 89.241498 84.858615]; 1
ověříme předpoklad normality psha=shapiro(skupina)// 1 je normalni H 0 : σ 2 = 9.1 2 H A :σ 2 9.1 2 oboustranný test psku= var_test(9.1^2,variance(skupina),length(skupina), o,0.05)//0.8532759 4 Příklad na rozdělení - KS [ ph=0.8532759 ] Na magistrále v úseku s doporučenou rychlostí 80 km/h jsme kontrolovali rychlost vozidel. Naměřili jsme rychlosti 72.176767 70.842996 72.631428 73.496572 71.54517 71.066234 71.54454 72.652169 73.105504 72.704641 Na hladine významnosti 0.05 testujte, zda výběr pochází z normálního rozdělení se střední hodnotou 70 km/h a směrodatnou odchylkou 2. rych=[72.176767 70.842996 72.631428 73.496572 71.54517 71.066234 71.54454 72.652169 73.105504 72.704641]; F=distfun_normcdf(rych,70,2); pks=ks_test_spojity(f,0.05)//0.0005194 5 Příklad Wilcoxon 1 výběr [ ph=0.0005194 ] Cukrárna nabízí 4 druhy zmrzliny: vanilkovou, čokoladovou, jahodovou a pistáciovou. Pozorovali jsme v průběhu 12 dní, kolik lidí si koupili vanilkovou zmrzlinu. Zaznamenané údaje jsou v tabulce: vanilková 5 29 10 31 27 24 27 29 30 32 20 25 Otestujte tvrzení, že v průměru si každý den koupili vanilkovou zmrzlinu 24 lidí. test normality vanil=[5 29 10 31 27 24 27 29 30 32 20 25]; pvanil=shapiro(vanil) // 0 - neni normalni použijeme Wilcoxona pwvanil=wilcoxon_test(vanil,24)//0.4769066 6 Příklad z-test-2 [ pval=0.4769066] Pobočky knihovny KNI a ČTE soutěží v denním počtu návštěvníků v březnu. Ředitel pobočky KNI tvrdí, že jeho pobočka má vyšší návštěvnost. Z dlouhodobého pozorování je známo, že návštěvnost pobočky KNI se mění se směrodatnou odchylkou 12,56 a na pobočce ČTE proměnlivost denního počtu návštěvníků je 19,37. Navštěvovali jsme obě pobočky během 14 dnů a zaznamenali jsme v průměru 156 navštěvníků denně na pobočce KNI a 171 na pobočce ČTE. Ověřte tvrzení ředitele pobočky KNI na hladině významnosti 0.05 za předpokladu normality. 2
Předpoklad normality - jsme v normálních testech. 2 výběry a známé souborové rozptyly to je z-test-2. H 0 : µ kni = µ cte nebo > H A : µ kni < µ cte levostranný test p = z_test_2(156,12.56^2,14,171,19.37^2,14, l,0.05)//0.0075255 [ ph=0.0075255] 7 Příklad t-test-2n Firma DRINK a firma DRUNK provádí průzkum oblíbenosti jejich energetických napojů. Firma DRUNK tvrdí, že jejich napoje se prodávají líp. Zeptali jsme se 79 náhodně vybraných zákazníků a zjistili jsme, že zákazníci koupili průměrně 13 balení nápojů DRINK po 4 plechovkách. Dále jsme se zeptali 63 náhodně vybraných zákazníků a ti koupili v průměru 9 balení nápojů DRUNK po 6 plechovkách. Spočítali jsme směrodatnou odchylku v obou případech a vyšlo nám 3,7 plechovek DRINK a 4.2 plechovek DRUNK. Za předpokladu normality testuje tvrzení firmy DRUNK na hladině významnosti 95%. Předpoklad normality - jsme v normálních testech. 2 nezávislé výběry různý počet. Výběrová směrodatná odchylka to je t-test-2n H 0 : µ drink = µ drunk nebo menší µ drink < µ drunk H A : µ drink > µ drunk pravostranný test ph=t_test_2n(13*4,3.7^2,79,9*6,4.2^2,63, p,0.05)//0.9982174 8 Příklad t-test-2n [ ph=0.9982174] Na magistrále v úseku s doporučenou rychlostí 80 km/h jsme kontrolovali rychlost vozidel směrem do Prahy a ven z Prahy. Naměřili jsme rychlosti doprahy=[72.176767 70.842996 72.631428 73.496572 71.54517 71.066234 71.54454 72.652169 73.105504 72.704641]; zprahy = [74.011043 76.500697 76.942708 75.71017 76.026983 75.781981 77.230308 77.688567 75.529214 75.622745 76.737023 76.35508]; Na hladině 99% testujte hypotézu: do Prahy jezdí auta rychleji. 3
Ověříme normalitu - jsme v normálních testech. dp=[72.176767 70.842996 72.631428 73.496572 71.54517 71.066234 71.54454 72.652169 73.105504 72.704641]; zp = [74.011043 76.500697 76.942708 75.71017 76.026983 75.781981 77.230308 77.688567 75.529214 75.622745 76.737023 76.35508]; pp=shapiro(dp) // 1 - je normalni pp=shapiro(zp)// 1 - je normalni 2 nezávislé výběry různý počet. neznámý rozptyl to je t-test-2n H 0 : µ dp = µ zp nebo > H A : µ dp < µ zp levostranný test ph=t_test_2n(mean(dp),variance(dp),length(dp),mean(zp),variance(zp),length(zp), l,0.01)//0.0000149 9 Příklad t-test-2p [ ph=0.0000149] Byla provedena namátková kontrola seřízení předních světel automobilů. U každého automobilu byla kontrolována obě světla s výsledky v centimetrech (+ nad a pod optimální úrovní). Získané hodnoty jsou prave = [7.5616319 9.0658765 7.9643471 7.778244 7.2177689 7.7381958 8.1425772 8.6734893 8.6820418 6.8523752] ; leve = [10.697382 2.2129532 6.9484303 8.2902027 7.1917039 5.0476241 4.967236 9.4129006 9.2356875 7.0088975]; Na hladině 0,05 testujte tvrzení, že jednotlivé automobily mají oba reflektory seřízeny stejně. Ověříme ormality - jsme v normálních testech. prave = [7.5616319 9.0658765 7.9643471 7.778244 7.2177689 7.7381958 8.1425772 8.6734893 8.6820418 6.8523752] ; leve = [10.697382 2.2129532 6.9484303 8.2902027 7.1917039 5.0476241 4.967236 9.4129006 9.2356875 7.0088975]; pp=shapiro(prave)//1 je normalni pp=shapiro(leve)//1 je normalni 2 párové výběry stejný počet to je t-test-2p H 0 : µ prava = µ leva H A : µ prava µ leva oboustranný test pt=t_test_2p(prave,leve, o,0.05)//0.347582 [ ph=0.347582 ] 4
10 Příklad var-test-2 Dvě skupiny studentů píšou malé testy na cvičení ze statistiky. Zajímá nás, jestli obě skupiny podavají stejně stabilní výsledky. Vyučující tvrdí, že skupina A jednou test napíše dobře a podruhé huř, ale skupina B píše testy spolehlivě dobře. Výsledky máme v tabulce. Testujte tvrzení vyučujícího na hladině 0.05. A=[61.799041 32.372924 98.01828 64.960927 75.473715 80.223837 90.471208 58.274296 83.824728 57.990856 84.09489 82.74738 53.188432]; B=[92.225131 93.415151 81.472027 74.092019 103.70774 95.5885 74.694837 81.316226 83.512062 91.086324 74.55084 89.241498 84.858615]; ověříme předpoklad normality A=[61.799041 32.372924 98.01828 64.960927 75.473715 80.223837 90.471208 58.274296 83.824728 57.990856 84.09489 82.74738 53.188432]; B=[92.225131 93.415151 81.472027 74.092019 103.70774 95.5885 74.694837 81.316226 83.512062 91.086324 74.55084 89.241498 84.858615]; p=shapiro(a); //1 normalni p=shapiro(b); // 1 normalni H 0 : σ 2 A = σ2 B nebo menší σ2 A > σ2 B H A :σ 2 A < σ2 B levostranný test ph_var = var_test_2(variance(a),size(a,2),variance(b),size(b,2), l,0.05)//0.9884133 11 Příklad Mann-Whitneyův [ ph=0.9884133 ] Máme výsledky bodového hodnocení z olympiády cizích jazyků. Z naší školy se zúčastnily 2 týmy, které se příhlasily na soutěž v angličtině a francouzštině. Jejich výsledky jsou tady: AJ: 9 8 54 56 63 78 63 53 64 15 52 59 67 20 56 FJ: 70 67 64 59 82 10 68 26 73 57 Na hladině významnosti 0.05 testujte, zda výsledky obou týmů jsou v průměru stejně úspěšné. Řešení 2 nezávislé výběry, zkusíme test normality: aj=[ 9 8 54 56 63 78 63 53 64 15 52 59 67 20 56]; fj=[70 67 64 59 82 10 68 26 73 57]; p=shapiro(aj) //0 neni normalni p=shapiro(fj) // 0 neni normalni H 0 : jsou stejné H A : nejsou stejné pv=mannwhit_test(aj,fj) // 0 zamitame, 1 - nezamitame [ 1 ] 5
12 Příklad Wilcoxon Obchodní centrum zpoplatnilo parkování zákazníků, kteří se v obchodním centru zdržují déle než 6 hodin. V tabulce jsou zaznamenány počty zákazníků během otevírací doby OC od 9 do 20h před zpoplatněním parkování a po. Je po zpoplatnění meně zákazníků v OC? Testujte toto tvrzení na hladině 0,05. 9h 10h 11h 12h 13h 14h 15h 16h 17h 18h 19h 20h před zpoplatněním parkování 15 39 35 20 41 37 34 37 39 40 42 40 po zpoplatnění parkování 17 40 42 46 40 42 36 43 42 42 40 42 Řešení 2 párové výběry, test normality: pred=[15 39 35 20 41 37 34 37 39 40 42 40]; po= [17 40 42 46 40 42 36 43 42 42 40 42]; pp=shapiro(pred)// 0 - neni normalni ppo=shapiro(po)// 0 - neni normalni použijeme Wilcoxonův test H 0 : před = po (je stejný) nebo před>po H A : před <po levostranný test ptr = wilcoxon_test(pred,po, l,0.05)//0.0053937 13 Příklad ANOVA 1 [ ph=0.0053937 ] Národní nadace pro osteoporózu doporučuje denní příjem vápníku 1000-1200 mg / den pro dospělé muže a ženy. Studie je zaměřena na testování toho, zda existuje rozdíl v průměrném denním příjmu vápníku u dospělých s normální hustotou kostí, dospělých s osteopenií (nízkou hustotou kostí, která může vést k osteoporóze) a dospělými s osteoporózou. Dospělí ve věku 60 let s normální hustotou kostí, osteopenií a osteoporózou jsou náhodně vybráni z nemocničních záznamů a pozváni k účasti ve studii. Denní příjem vápníku každého účastníka se měří na základě hlášeného příjmu potravy a doplňků stravy. Data jsou uvedena níže. normální hustota kostí osteopenia osteoporóza 1200 1000 890 1000 1100 650 980 700 1100 900 800 900 750 500 400 800 700 350 Existuje statisticky významný rozdíl v průměrném příjmu vápníku u pacientů s normální kostní hustotou ve srovnání s pacienty s osteopenií a osteoporózou? Testujte za předpokladu normality [Prof. Lisa Sullivan, PhD, Boston University School of Public Health] předpoklad normality - nemusíme testovat Ověríme předpoklad stejných rozptylů, H 0: všechny rozptyly jsou stejné, H A: minimálně jeden se liší data=[1200 1000 890; 1000 1100 650; 980 700 1100; 900 800 900; 6
750 500 400; 800 700 350]; pv=bartlett_test(data) //0.4237624 Můžeme použit ANOVA, H 0: všechny střední hodnoty jsou stejné, H A: minimálně jedna se liší p_h=anova_1(data)//0.278229 14 Příklad ANOVA 2 [ ph=0.278229 ] Tři kamarádi: Tomáš, Petr a Martin, se domluvili, že budou pravidelně navštěvovat posilovnu. Své návštěvy zapisovali a jejich počet za jednotlivá roční období je v tabulce. Tomáš Petr Martin zima 31 25 22 jaro 32 31 16 leto 35 28 19 podzim 52 38 29 Testujte, zda průměrná návštěvnost posilovny je u všech kamarádů stejná během jednotlivých ročních období. Pokud ne, určete na hladině 0.05, který/která se liší. máme 2 faktory - kamarádi a roční období test normality. kam=[31 25 22; 32 31 16; 35 28 19; 52 38 29]; shapiro(kam(:,1)) shapiro(kam(:,2)) shapiro(kam(:,3)) shapiro(kam(1,:)) shapiro(kam(2,:)) shapiro(kam(3,:)) // všude 1 - normalni ověříme stejné rozptyly p_bartlett=bartlett_test(kam)//0.5465059 Můžeme tedy použit dvoufaktorovou anovu [P_s,P_r]=anova_2(kam)//0.0117954, 0.0028768 psh=scheffe_test(kam,0.05)// jeden se lisi 15 Příklad Kruskal-Wallisův [ 0.0117954, 0.0028768, 1 ] Měřili jsme rychost projíždějících automobilů na úseku silnice během ranní špicky, v poledne a odpoledne. Na hladině významnosti 0,05 testujte tvrzení, že průměrná rychost ráno, v poledne a odpoledne je stejná. Naměřená data jsou zde: rano=[30.4834 63.4877 20.7434 28.1982 49.8767 56.2619 29.9069 73.6699 34.6485 29.9427 34.2275 21.1434 25.8146 29.5934 48.8192 80.1514]; 7
poledne=[ 47.3175 22.8674 31.1133 69.3771 22.4231 21.6306 25.9636 33.3998 25.5375 34.6751 24.6569 34.6760 43.6113 29.7569 31.2188 51.6666 22.0202 45.6881]; odpoledne=[29.9069 73.6699 34.6485 29.9427 34.2275 21.1434 25.8146 29.5934 48.8192]; test normality p=shapiro(rano);//0 neni normalni p=shapiro(poledne);//0 neni normalni p=shapiro(odpoledne);//0 neni normalni KW L=lstcat(rano, poledne, odpoledne ); p_kw=kruskal_test(l) //0.7014451 [ph=0.7014451 ] 16 Příklad Friedman 5 náhodně vybraných lidí byli dotázaní na názor o 4 kandidátech na prezidenta a hodnotili je od 1 do 5 jako ve škole. Získané hodnoty jsou v tabulce: respondenti\kandidáti kandidát A kandidát B kandidát C kandidát D 1 3 1 1 5 2 2 2 4 3 3 2 2 4 5 4 5 1 2 3 5 4 5 3 1 Mají všichni kandidáti stejné preference? Testujte hypotézu za předpokladu normality. test normality nemusíme d=[3. 1. 1. 5; 2. 2. 4. 3; 2. 2. 4. 5; 5. 1. 2. 3; 4. 5. 3. 1.]; pf = friedman_test(d)//0.6019661 [ph=0.6019661 ] 8