ST2 - Cvi ení 1 STATISTICKÁ INDUKCE P íklad 1.1 Po et závad jistého typu elektrospot ebi e b hem záru ní doby má Poissonovo rozd lení s parametrem λ = 0,2. Jaká je pravd podobnost, ºe po prodeji 75 spot ebi bude více neº 15 reklamací b hem záru ní doby? [P (X > 15) = 0,432] P íklad 1.2 Plastová ta²ka ur itého typu má nosnost s normálním rozd lení N(5, 1). 1. Jaký podíl t chto ta²ek praskne p i nákupu do 4,75 kg? 2. Stanovte pravd podobnost, ºe p i testování 16 náhodn vybraných ta²ek bude pr m rná nosnost men²í neº 4,5 kg. [P (X 4, 75) = 0,401, P (X < 4, 5) = 0,023] P íklad 1.3 Stanovte pravd podobnost, ºe pr m rný v k ve skupin 50 ºák auto²koly bude v intervalu od 20 do 23 let, pokládáme-li v k ºák za náhodnou veli inu se st ední hodnotou 22 let a sm rodatnou odchylkou 6 let. [P (20 X 23) = 0,8807-0,0092 = 0,8715] 1
ST2 - Cvi ení 2 ODHADY PARAMETR P íklad 2.1 Zváºením 11 náhodn vybraných balí k mandarinek byly získány tyto odchylky (v gramech) od normy udávané prodejcem (ta je 1 kg): -24, 16, -43, 58, -3, -38, -52, 62, -15, 40, 62. Odchylku od normy povaºujeme na náhodnou veli inu z normálního rozd lení. Stanovte oboustranný interval spolehlivosti pro: 1. její st ední hodnotu, 2. její rozptyl. [µ [5,72727 +/- 29,5552 g] = [-23,828; 35,283 g], σ 2 [944,88; 5960,67 g 2 ] P íklad 2.2 B hem dne byla u 60 náhodn vybraných zákazník supermarketu zaznamenána cena nákupu. Výb rový pr m r potom inil: X = 326 K, s X = 81 K. V jakém intervalu m ºeme s 95% pravd podobností o ekávat celkovou trºbu, kdyº do tohoto obchodu p ijde za den 2400 zákazník? P edpokládáme, ºe trºba jednoho zákazníka má normální rozd lení. [X [774 623, 790 177 K ]] 2
ST2 - Cvi ení 3 TESTOVÁNÍ HYPOTÉZ - Jednovýb rové testy P íklad 3 Výrobce nealko nápoje udává objem nápoje v láhvi 2 litry se sm rodatnou odchylkou 0,05 l. U 49 náhodn vybraných láhví byl zji²t n výb rový pr m r objemu nápoje 1,99 l. Lze íci, ºe objem odpovídá norm? P edpokládáme, ºe objem nápoje je NV X N(2; 0, 05 2 ). e²ení: test hypotézy o st ední hodnot normálního rozd lení µ, kde µ = 2 l, σ = 0, 05 l, n = 49, X = 1, 99 l. Testování hypotézy probíhá v 5 krocích: 1. FORMULOVAT TESTOVANOU HYPOTÉZU H 0 a ALTERNATIVNÍ HYPOTÉZU H 1. H 0 : µ = 2 l H 1 : µ 2 l 2. VYBRAT VHODNÉ!! TESTOVÉ KRITÉRIUM (dále jako T.K.), TESTOVOU STATIS- TIKU Testujeme st ední hodnotu normálního rozd lení µ p i známém rozptylu 1 σ a velkém rozsahu výb ru. Testové kritérium je v tomto p ípad náhodná veli ina U: U = X µ n N(0, 1). (1) σ 3. ZVOLIT HLADINU VÝZNAMNOSTI α a STANOVIT KRITICKÝ OBOR W V mých úlohách bude VšDY α = 0, 05!! Kritický obor W U oboustranné alternativní hypotézy je kritický obor na hladin významnosti α mnoºina takových hodnot T.K. U, pro které platí nerovnosti uvedené v závorkách Konkrétn W = { U : U u α 2 U u 1 α 2 } = {U : U u 0,025 U u 0,975 }. W = {U : U 1, 96 U 1, 96}. 4. SPOƒÍTAT HODNOTU TESTOVÉHO KRITÉRIA U = 1, 99 2, 00 7 49 = = 1, 40. 0, 05 5 5. VYSLOVIT ZÁV R a NAPSAT ODPOV. Pokud hodnota testového kritéria U nenáleºí W (U / W ), potom na hladin významnosti α nulovou hypotézu H 0 nezamítneme. 1 Pokud bychom rozptyl odhadovali z dat, je kritérium jiné!! Jaké? 3
Pokud hodnota testového kritéria U náleºí W (U W ), potom na hladin významnostiα nulovou hypotézu H 0 zamítneme ve prosp ch alternativní hypotézy H 1. Zde platí, ºe U / W, takºe H 0 na hladin významnosti α nezamítneme. ODPOV : M ºeme íci, ºe objem nápoje v láhvích jsou dva litry. P íklad 4 2 Zástupci ekologického sdruºení vystupují proti výstavb nové továrny v oblasti poznamenané pr myslovou inností. Jedním z argument je i nízká porodní váha novorozenc. U 40 náhodn vybraných novorozenc nam ili pr m rnou porodní váhu 3010 g. Má smysl argumentovat tímto stylem, kdyº celostátní pr m r je µ = 3300 g a sm r. odchylka σ = 476 g? P edpokládáme, ºe hmotnost novorozence je NV X N(3300 g, 476 2 g 2 ). 1. FORMULOVAT TESTOVANOU HYPOTÉZU H 0 a ALTERNATIVNÍ HYPOTÉZU H 1. 4 2. VYBRAT VHODNÉ!! TESTOVÉ KRITÉRIUM 3. STANOVIT HLADINU VÝZNAMNOSTI a URƒIT KRITICKÝ OBOR 4. SPOƒÍTAT TESTOVÉ KRITÉRIUM U = 3, 85 5. ZÁV R a ODPOV. Zde je U W, takºe H 0 na hladin významnosti α zamítneme ve prosp ch alternativní hypotézy H 1. ODPOV : M ºeme íci, ºe má smysl argumentovat proti výstavb továrny niº²í porodní váhou novorozenc. Pro? Protoºe se zde statisticky významn li²í od celostátního pr m ru. P íklad 5 (rozptyl normálního rozd lení) Pevnost vlákna bavln né p íze lze pokládat za NV s normálním rozd lením. Je-li rozptyl pevnosti vlákna σ 2 > 0, 36 kg 2, potom vznikají potíºe p i tkaní. P i zkou²ce 11 náhodn vybraných vláken byly zji²t ny hodnoty jejich pevnosti, které jsou na listu HypTest, prom nná P05_vlakno 3. Je t eba zjistit, zda je p íze vyhovující pro tkaní. [P íze nevyhovuje, protoºe rozptyl pevnosti vlákna je vy²²í neº daná mez. K.O.: W = {χ : χ 18, 31}, T.K.: χ = 10 0,92 0,36 = 25, 56] P íklad 6 - pokra ování P íkladu 5 M ºeme íci, ºe st ední hodnota pevnosti vlákna µ je men²í neº 4 kg? Nejprve vy e²it z popisných statistik za pomoci statistických tabulek. Potom pomocí testování hypotéz v SGP. [W = {T : T t α (n 1)} = {T : T 1, 812}, T = 0, 69. M ºeme íct, ºe pevnost vlákna se rovná 4 kg, neboli není niº²í neº 4 kg.] 2 V p íkladech na procvi ení bude obvykle uvád na pro kontrolu pouze hodnota testového kritéria a záv r s odpov dí. 3 Dále se takto budeme odkazovat na prom nné v souborech programu Statgraphics, které jsou ve ejn p ístupné na webu http://eduro.webzdarma.cz/sta2.html v sekci DATA KE CVIƒENÍM nebo na adrese http://multiedu.tul.cz/~jiri.rozkovec v adresá i p íslu²ného p edm tu (ST2, ST2_P, STA, STA1).
ST2 - Cvi ení 4 TESTOVÁNÍ HYPOTÉZ - Jednovýb rové testy P íklad 7 (jednovýb rový t-test) Automat plní krabice pracím prá²kem. Hmotnost prá²ku v krabici má být p esn 2 kg. Náhodn bylo vybráno 6 krabic, obsah prá²ku v nich byl p esn zváºen a byly zaznamenány odchylky hmotnosti prá²ku od normy (v dkg): -5-8 1 7-6 -1 viz prom nná P07_Praci_prasek, list HypTest. Ov te, zdali nedo²lo k systematické chyb se ízení automatu. [T = 0, 889. M ºeme íct, ºe automat pracuje p esn.] 5
P íklad 9 Podle p edb ºných výsledk s ítání obyvatelstva ze dne 3.3.1991 se v eských zemích hlásilo k ímskokatolickému náboºenskému vyznání 39,2% obyvatelstva. Ze 62 náhodn vybraných vysoko²kolských u itel se k tomuto vyznání hlásilo 30. Máme zjistit, zdali tento podíl V u itel hlásících se k ímskokatolickému vyznání odpovídá podílu v²eho obyvatelstva eských zemí. [TK=1,483; pvalue=0,1784. Podíl odpovídá hodnot v eských zemích.] 6
P íklad 10 (test parametru λ Poissonova rozd lení) Výstupní kontrola v podniku, který vyrábí koberce, eviduje u ur itého typu koberce statistiku po tu závad u kaºdého vyrobeného koberce - viz prom nné P10_pocet_zavad, P10_cetnost_zavad, list HypTest. Po et závad je povaºován za náhodnou veli inu z Poissonova rozd lení s parametrem λ. Otestujte hypotézu, ºe tento parametr je roven ty em! Nápov da: Víme, ºe v Poissonov rozd lení je EX = λ, takºe je to hra ka :-) V tomto p ípad vyjíme n pouze formulujte hypotézy a potom pouºijte formulá Hypothesis tests. Vynechte testové kritérium i kritický obor. [pvalue = 0,955. Ano, parametr je roven ty em.] 7
ST2 - Cvi ení 5 TESTOVÁNÍ HYPOTÉZ - Dvouvýb rové testy P íklad 12 U dvou stroj vyráb jících ²rouby byla sledována odchylka skute né délky ²roubu od normy v mm (prom nné P14_stroj1, P14_stroj2). Otestujte, zdali rozptyl odchylky ²roub od normy u prvního stroje je 1,2-krát v t²í neº u druhého stroje. Odchylky povaºujeme za normáln rozd lené veli iny. P íklad 14.1 Na tomtéº automobilovém okruhu byla stejným idi em testována dv závodní auta (dosaºené asy p i jednotlivých jízdách - viz prom nné P13_Auto1, P13_Auto2). Otestujte, zdali první auto (Auto1) je na jednotlivé jízd alespo o 0,2 sekundy rychlej²í neº druhé auto (Auto2). ƒasy povaºujeme za normáln rozd lené veli iny. 8
9 P íklad 14 U dvou stroj vyráb jících ²rouby byla sledována odchylka skute né délky ²roubu od normy v mm (prom nné P14_stroj1, P14_stroj2). Otestujte: 1. zdali kaºdý stroj pracuje s nulovou odchylkou od normy, 2. zdali oba stroje pracují se stejnou odchylkou od normy.
ST2 - Cvi ení 6 TESTOVÁNÍ HYPOTÉZ - Testy dobré shody - Goodness-of-Fit Tests P íklad 15 Je homogenní kostka, výsledky jejíchº 60 hod jsou ve sloupcích P15_vysledek a P15_cetnost, list HypTest? [K.O. W = { χ : χ χ 2 0,95 (5) = 11, 07}, T.K. χ = 10, 2. Ano, kostku lze pokládat za homogenní.] P íklad 16 Na kostce z P íkladu 15 otestujte, zdali je homogenní z hlediska výskytu sudých a lichých ísel. Dále zkuste zjistit, p i jaké proporci výskytu sudých a lichých ísel ze 60 hod uº hypotézu homogenity zamítneme. [K.O. W = { χ : χ χ 2 0,95 (1) = 3, 84}, T.K. χ = 1, 67. Ano, kostku lze pokládat za homogenní.] 10
P íklad 16a - lehce bonusový :-) Byla sledována etnost ²estek p i 4096 hodech 12 kostkami - viz prom nné P17_... Po et ²estek v jednom hodu lze povaºovat za NV s binomickým rozd lením Bi(12, 1 6 ). Otestujte hypotézu, ºe kostky jsou pravidelné. 11 Po et ²estek r 0 1 2 3 4 5 6 7 a více P (X = r) = π i,0 Empir. po et n i Empir. etnost p i P íklad 20 Na datech z P íkladu 9 otestujte, zdali daná náhodná veli ina (t.j. zdali se náhodn vybraný V u itel hlásí k ímskokatolickému vyznání) je náhodnou veli inou z binomického rozd lení s parametrem π = 0,60.
ST2 - Cvi ení 7 Analýza rozptylu - Analysis of Variance (ANOVA) P íklad 22 Ov te hypotézu, ºe st ední hodnota prodejní ceny bytu je stejná bez ohledu na po et místností, které byt má - prom nné P22_..., list Anova. [T.K. F = 399, 26, K.H. F 0,95 (4, 19) = 2, 895. Není pravda, ºe cena bytu nezávisí na po tu jeho místností.] 12
P íklad 25a Ov te hypotézu, ºe uvedení pracovníci pracují v²ichni stejn rychle - prom nné P25_obsluha, P25_VYROBENO_2, list Anova. 13 [T.K. F = 1, 18, K.H. F 0,95 (4, 10) = 3, 478. Pracovníci jsou stejn rychlí.]
ST2 - Cvi ení 8 Kontingen ní a korela ní tabulky - Contingency tables P íklad 8.1 V prom nných ZU_vzdelani, ZU_lepsi, ZU_stejna, ZU_horsi jsou výsledky pr zkumu, kde byly respondenti dotazováni, jak hodnotí svoji ºivotní úrove za poslední rok. Sou asn bylo zaznamenáno, jaké mají nejvy²²í dosaºené vzd lání. Jsou tyto dva znaky nezávislé? [T.K. G = 20, 430, K.H. χ 2 0,95 (6) = 12, 59. Není pravda, ºe hodnocení ºivotní úrovn nezávisí na vzd lání dotázaných.] 14
ST2 - Cvi ení 9 Regresní analýza P íklad 30 V prom nných P30_vloni, P30_letos jsou objemy poptávky po ur itém zboºí u ²esti obchodník. Odhadn te parametry regresní p ímky, která bude vyjad ovat závislost leto²ní poptávky na lo ské. [P30_Letos = 0,6868 + 1,2665*P30_vloni. Testy parametr : kvocient není statisticky významný, sm rnice je.] P íklad 31 V prom nných P31_stari, P31_naklady jsou uvedeny náklady na opravy ur itých stroj a jejich stá í. Odhadn te parametry regresní funkce Y = α + β lnx, která bude vyjad ovat závislost náklad na opravu na stá í stroje. [P31_naklady = 44,6457 + 40,4913*ln(P31_stari). Testy parametr : oba jsou statisticky významné.] 15
P íklad 33 V prom nných P33_spotreba, P33_rychlost jsou uvedeny: spot eba paliva osobního automobilu na dané trase a jeho pr m rná rychlost p i pr jezdu touto trasou. Odhadn te parametry t chto regresních funkcí: 1. Y = α + γx 2 Y = 4, 52576 + 0, 00026X 2 I 2 A = 73% 16 2. Y = α + βx + γx 2 Y = 9, 7518 0, 1505X + 0, 0012X 2 I 2 A = 95% které vyjad ují závislost spot eby na rychlosti, a rozhodn te, která je v tomto p ípad vhodn j²í pro popis závislosti. [Lep²í je druhý model.] P íklad 32.2 V prom nných P32_cena, P32_poptavka je uvedena cena a poptávka po ur itém druhu zboºí. Odhadn te parametry t chto regresních funkcí: 1. Y = β/x Y = 5530, 55/X, I 2 A = 91% 2. Y = exp (α + βx) Y = exp (5, 384 + 0, 007X), I 2 A = 93% které vyjad ují závislost poptávky po zboºí na jeho cen. Rozhodn te, která je v tomto p ípad vhodn j²í pro popis závislosti. [Lep²í je druhý model.]
ST2 - Cvi ení 10 Korela ní analýza P íklad 10.1 V prom nných Objem2009, Objem2010 jsou objemy hypoték v ƒr v uvedených letech od ledna do íjna v mld. K. Jsou tyto veli iny nezávislé? [r XY = 0, 5355, pvalue = 0,11. Objemy hypoték v roce 2009 a v roce 2010 jsou nezávislé.] P íklad 34 V prom nných P34_... jsou údaje deseti d lník : v k, praxe v oboru a výkon. Které dvojice t chto veli in jsou nezávislé? [Nezávislé jsou dvojice veli in V K-VÝKON (r XY = 0, 43, pvalue = 0,21) a PRAXE-VÝKON (r XY = 0, 62, pvalue = 0,056). Veli iny PRAXE-V K nejsou nezávislé (r XY = 0, 847, pvalue = 0,002).] 17