ST2 - Cvi ení 1 STATISTICKÁ INDUKCE P íklad 1.1 Po et závad jistého typu elektrospot ebi e b hem záru ní doby má Poissonovo rozd lení s parametrem λ = 0,2. Jaká je pravd podobnost, ºe po prodeji 75 spot ebi bude více neº 15 reklamací b hem záru ní doby? P íklad 1.2 Plastová ta²ka ur itého typu má nosnost s normálním rozd lení N(5, 1). 1. Jaký podíl t chto ta²ek praskne p i nákupu do 4,75 kg? 2. Stanovte pravd podobnost, ºe p i testování 16 nhodn vybraných ta²ek bude pr m rná nosnost men²í neº 4,5 kg. P íklad 1.3 Stanovte pravd podobnost, ºe pr m rný v k ve skupin 50 ºák auto²koly bude v intervalu od 20 do 23 let, pokládáme-li v k ºák za náhodnou veli inu se st ední hodnotou 22 let a sm rodatnou odchylkou 6 let. 1
ST2 - Cvi ení 2 ODHADY PARAMETR P íklad 2.1 Zváºením 11 náhodn vybraných balí k mandarinek byly získány tyto odchylky (v gramech) od normy udávané prodejcem (ta je 1 kg): -24, 16, -43, 58, -3, -38, -52, 62, -15, 40, 62. Odchylku od normy povaºujeme na náhodnou veli inu z normálního rozd lení. Stanovte oboustranný interval spolehlivosti pro: 1. její st ední hodnotu, 2. její rozptyl. 2
P íklad 2.2 B hem dne byla u 60 náhodn vybraných zákazník supermarketu zaznamenána cena nákupu. Výb rový pr m r potom inil: X = 326 K, s X = 81 K. V jakém intervalu m ºeme s 95% pravd podobností o ekávat celkovou trºbu, kdyº do tohoto obchodu p ijde za den 2400 zákazník? 3
ST2 - Cvi ení 3 TESTOVÁNÍ HYPOTÉZ - Jednovýb rové testy P íklad 3 Výrobce nealko nápoje udává objem nápoje v láhvi 2 litry se sm rodatnou odchylkou 0,05 l. U 49 náhodn vybraných láhví byl zji²t n výb rový pr m r objemu nápoje 1,99 l. Lze íci, ºe objem odpovídá norm? P edpokládáme, ºe objem nápoje je NV X N(2; 0, 05 2 ). e²ení: test hypotézy o st ední hodnot normálního rozd lení µ, kde µ = 2 l, σ = 0, 05 l, n = 49, X = 1, 99 l. Testování hypotézy probíhá v 5 krocích: 1. FORMULOVAT TESTOVANOU HYPOTÉZU H 0 a ALTERNATIVNÍ HYPOTÉZU H 1. H 0 : µ = 2 l H 1 : µ 2 l 2. VYBRAT VHODNÉ!! TESTOVÉ KRITÉRIUM (dále jako T.K.), TESTOVOU STATIS- TIKU Testujeme st ední hodnotu normálního rozd lení µ p i známém rozptylu 1 σ. Testové kritérium je v tomto p ípad náhodná veli ina U vypo tená podle vztahu U = X µ n N(0, 1). (1) σ 3. ZVOLIT HLADINU VÝZNAMNOSTI α a STANOVIT KRITICKÝ OBOR W V mých úlohách bude VšDY α = 0, 05!! Kritický obor W U oboustranné alternativní hypotézy je kritický obor na hladin významnosti α mnoºina takových hodnot T.K. U, pro které platí nerovnosti uvedené v závorkách W = { U : U u α 2 U u 1 α 2 } = {U : U u 0,025 U u 0,975 }. Konkrétn W = {U : U 1, 96 U 1, 96}. 4. SPOƒÍTAT HODNOTU TESTOVÉHO KRITÉRIA U = 1, 99 2, 00 7 49 = = 1, 40. 0, 05 5 5. VYSLOVIT ZÁV R a NAPSAT ODPOV. Pokud hodnota testového kritéria U nenáleºí W (U / W ), potom na hladin významnosti 1 Pokud bychom rozptyl odhadovali z dat, je kritérium jiné!! 4
α nulovou hypotézu H 0 nezamítneme. Pokud hodnota testového kritéria U náleºí W (U W ), potom na hladin významnosti α nulovou hypotézu H 0 zamítneme ve prosp ch alternativní hypotézy H 1. Zde platí, ºe U / W, takºe H 0 na hladin významnosti α nezamítneme. ODPOV : M ºeme íci, ºe objem nápoje v láhvích jsou dva litry. P íklad 4 2 Zástupci ekologického sdruºení vystupují proti výstavb nové továrny v oblasti poznamenané pr myslovou inností. Jedním z argument je i nízká porodní váha novorozenc. U 40 náhodn vybraných novorozenc nam ili pr m rnou porodní váhu 3010 g. Má smysl argumentovat tímto stylem, kdyº celostátní pr m r je µ = 3300 g a sm r. odchylka σ = 476 g? P edpokládáme, ºe hmotnost novorozence je NV X N(3300 g, 476 2 g 2 ). 1. FORMULOVAT TESTOVANOU HYPOTÉZU H 0 a ALTERNATIVNÍ HYPOTÉZU H 1. 5 2. VYBRAT VHODNÉ!! TESTOVÉ KRITÉRIUM 3. STANOVIT HLADINU VÝZNAMNOSTI a URƒIT KRITICKÝ OBOR 4. SPOƒÍTAT TESTOVÉ KRITÉRIUM U = 3, 85 5. ZÁV R a ODPOV. Zde je U W, takºe H 0 na hladin významnosti α zamítneme ve prosp ch alternativní hypotézy H 1. ODPOV : M ºeme íci, ºe má smysl argumentovat proti výstavb továrny niº²í porodní váhou novorozenc. Pro? Protoºe se zde statisticky významn li²í od celostátního pr m ru. P íklad 5 (rozptyl normálního rozd lení) vypo ten na cvi ení P íklad 6 - pokra ování P íkladu 5 M ºeme íci, ºe st ední hodnota pevnosti vlákna µ je men²í neº 4 kg? Nejprve vy e²it z popisných statistik za pomoci statistických tabulek. Potom pomocí testování hypotéz v SGP. 2 V p íkladech na procvi ení bude obvykle uvád na pro kontrolu pouze hodnota testového kritéria a záv r s odpov dí.
ST2 - Cvi ení 4 TESTOVÁNÍ HYPOTÉZ - Jednovýb rové testy P íklad 7 (jednovýb rový t-test) Automat plní krabice pracím prá²kem. Hmotnost prá²ku v krabici má být p esn 2 kg. Náhodn bylo vybráno 6 krabic, obsah prá²ku v nich byl p esn zváºen a byly zaznamenány odchylky hmotnosti prá²ku od normy (v dkg): -5-8 1 7-6 -1. Ov te, zdali nedo²lo k systematické chyb se ízení automatu. 1. H 0 : H 1 : 2. TK: 3. W = 4. TK: hodnota testového kritéria vyjde -0,889 5. ZÁV R: ODPOV : 6
P íklad 9 Podle p edb ºných výsledk s ítání obyvatelstva ze dne 3.3.1991 se v eských zemích hlásilo k ímskokatolickému náboºenskému vyznání 39,2% obyvatelstva. Ze 62 náhodn vybraných vysoko²kolských u itel se k tomuto vyznání hlásilo 30. Máme zjistit, zdali tento podíl V u itel hlásících se k ímskokatolickému vyznání odpovídá podílu v²eho obyvatelstva eských zemí. [Kontrola: TK=1,483] 7
P íklad 10 (test parametru λ Poissonova rozd lení) Výstupní kontrola v podniku, který vyrábí koberce, eviduje u ur itého typu koberce statistiku po tu závad u kaºdého vyrobeného koberce - viz prom nné P10_pocet_zavad, P10_cetnost_zavad 3. Po et závad je povaºován za náhodnou veli inu z Poissonova rozd lení s parametrem λ. Otestujte hypotézu, ºe tento parametr je roven ty em! Nápov da: z dat je t eba bodov odhadnout hodnotu parametru λ. P itom víme, ºe v Poissonov rozd lení je EX = λ, takºe je to hra ka :-) V tomto p ípad vyjíme n pouze formulujte hypotézy a potom pouºijte formulá Hypothesis tests. Vynechte testové kritérium i kritický obor. [Kontrola: pvalue=0,955]. 8 3 Data k p íklad m jsou na http://eduro.webzdarma.cz/sta2.html. Jedná se o soubory s p íponami *.SGP, *.SGD nebo *.SF6.
ST2 - Cvi ení 5 TESTOVÁNÍ HYPOTÉZ - Dvouvýb rové testy P íklad 12 U dvou stroj vyráb jících ²rouby byla sledována odchylka skute né délky ²roubu od normy v mm (prom nné P14_stroj1, P14_stroj2). Otestujte, zdali rozptyl odchylky ²roub od normy u prvního stroje je 1,2-krát v t²í neº u druhého stroje. Odchylky povaºujeme za normáln rozd lené veli iny. P íklad 14.1 Na tomtéº automobilovém okruhu byla stejným idi em testována dv závodní auta (dosaºené asy p i jednotlivých jízdách - viz prom nné P13_Auto1, P13_Auto2). Otestujte, zdali první auto (Auto1) je na jednotlivé jízd alespo o 0,2 sekundy rychlej²í neº druhé auto (Auto2). ƒasy povaºujeme za normáln rozd lené veli iny. 9
10 P íklad 14 U dvou stroj vyráb jících ²rouby byla sledována odchylka skute né délky ²roubu od normy v mm (prom nné P14_stroj1, P14_stroj2). Otestujte: 1. zdali kaºdý stroj pracuje s nulovou odchylkou od normy, 2. zdali oba stroje pracují se stejnou odchylkou od normy.
ST2 - Cvi ení 6 TESTOVÁNÍ HYPOTÉZ - Testy dobré shody - Goodness-of-Fit Tests P íklad 16 Na kostce z P íkladu 15 otestujte, zdali je homogenní z hlediska výskytu sudých a lichých ísel. Dále zkuste zjistit, p i jaké proporci výskytu sudých a lichých ísel ze 60 hod uº hypotézu homogenity zamítneme. 11
P íklad 16a - lehce bonusový :-) Byla sledována etnost ²estek p i 4096 hodech 12 kostkami - viz prom nné P17_... Po et ²estek v jednom hodu lze povaºovat za NV s binomickým rozd lením Bi(12, 1 6 ). Otestujte hypotézu, ºe kostky jsou pravidelné. 12 Po et ²estek r 0 1 2 3 4 5 6 7 a více P (X = r) = π i,0 Empir. po et n i Empir. etnost p i P íklad 20 Na datech z P íkladu 9 otestujte, zdali daná náhodná veli ina (t.j. zdali se náhodn vybraný V u itel hlásí k ímskokatolickému vyznání) je náhodnou veli inou z binomického rozd lení s parametrem π = 0,60.
ST2 - Cvi ení 7 Analýza rozptylu - Analysis of Variance (ANOVA) P íklad 22 Ov te hypotézu, ºe st ední hodnota prodejní ceny bytu je stejná bez ohledu na po et místností, které byt má - prom nné P22_... P íklad 25a Ov te hypotézu, ºe uvedení pracovníci pracují v²ichni stejn rychle - prom nné P25_obsluha, P25_VYROBENO_2. 13
ST2 - Cvi ení 8 Kontingen ní a korela ní tabulky - Contingency tables P íklad 8.1 V prom nných ZU_vzdelani, ZU_lepsi, ZU_stejna, ZU_horsi jsou výsledky pr zkumu, kde byly respondenti dotazováni, jak hodnotí svoji ºivotní úrove za poslední rok. Sou asn bylo zaznamenáno, jaké mají nejvy²²í dosaºené vzd lání. Jsou tyto dva znaky nezávislé? 14
ST2 - Cvi ení 9 Regresní analýza P íklad 30 V prom nných P30_vloni, P30_letos jsou objemy poptávky po ur itém zboºí u ²esti obchodník. Odhadn te parametry regresní p ímky, která bude vyjad ovat závislost leto²ní poptávky na lo ské. P íklad 31 V prom nných P31_stari, P31_naklady jsou uvedeny náklady na opravy ur itých stroj a jejich stá í. Odhadn te parametry regresní funkce Y = α + β lnx, která bude vyjad ovat závislost náklad na opravu na stá í stroje. 15
P íklad 33 V prom nných P33_spotreba, P33_rychlost jsou uvedeny: spot eba paliva osobního automobilu na dané trase a jeho pr m rná rychlost p i pr jezdu touto trasou. Odhadn te parametry t chto regresních funkcí: 1. Y = α + γx 2 16 2. Y = α + βx + γx 2 které vyjad ují závislost spot eby na rychlosti, a rozhodn te, která je v tomto p ípad vhodn j²í pro popis závislosti. P íklad 32.2 V prom nných P32_cena, P32_poptavka je uvedena cena a poptávka po ur itém druhu zboºí. Odhadn te parametry t chto regresních funkcí: 1. Y = β/x 2. Y = exp (α + βx) které vyjad ují závislost poptávky po zboºí na jeho cen. Rozhodn te, která je v tomto p ípad vhodn j²í pro popis závislosti.
ST2 - Cvi ení 10 Korela ní analýza P íklad 10.1 V prom nných Objem2009, Objem2010 jsou objemy hypoték v ƒr v uvedených letech od ledna do íjna v mld. K. Jsou tyto veli iny nezávislé? P íklad 34 V prom nných P34_... jsou údaje deseti d lník : v k, praxe v oboru a výkon. Které dvojice t chto veli in jsou nezávislé? 17