Doporučené příklady k procvičení k 2. Průběžnému testu



Podobné dokumenty
Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Tomáš Karel LS 2012/2013

= = 2368

Příklad 81b. Předpokládejme, že výška chlapců ve věku 9,5 až 10 roků má normální rozdělení N(mi;sig2)

Pravděpodobnost a matematická statistika

se bude objevovat jen v 5% pokusů. Výsledky měření jsou: 0,31; 0,30; 0,29; 0,32.

1. Příklad U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti:

Cvičení ze statistiky - 9. Filip Děchtěrenko

Analýza rozptylu. ANOVA cvičení

4ST201 STATISTIKA CVIČENÍ Č. 7

Tomáš Karel LS 2012/2013

Pracovní list č. 3 Charakteristiky variability

Korelace. Komentované řešení pomocí MS Excel

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Bodové a intervalové odhady parametrů v regresním modelu

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Korelační a regresní analýza

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

MATEMATIKA III V PŘÍKLADECH

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

otec syn

4EK211 Základy ekonometrie

Regresní analýza 1. Regresní analýza

Regresní a korelační analýza

Metodický list pro 3. soustředění kombinovaného Bc. studia předmětu B_St_2 STATISTIKA 2

Statistika (KMI/PSTAT)

Testování statistických hypotéz

MATEMATIKA III V PŘÍKLADECH

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

INDUKTIVNÍ STATISTIKA

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Normální (Gaussovo) rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Jednostranné intervaly spolehlivosti

Bodové a intervalové odhady parametrů v regresním modelu

Lineární regrese. Komentované řešení pomocí MS Excel

6. Lineární regresní modely

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Regresní a korelační analýza

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Biostatistika Cvičení 7

Regresní analýza. Eva Jarošová

Příklady ze Statistiky

Testování statistických hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

LINEÁRNÍ REGRESE. Lineární regresní model

PRAVDĚPODOBNOST A STATISTIKA

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Vybraná rozdělení náhodné veličiny

Testování statistických hypotéz

Testování hypotéz. 4. přednáška

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Příklady na testy hypotéz o parametrech normálního rozdělení

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Cvičení ze statistiky - 8. Filip Děchtěrenko

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

Regresní a korelační analýza

Regresní a korelační analýza

Inovace bakalářského studijního oboru Aplikovaná chemie

Zápočtové úkoly Statistika II PAEK, LS

STATISTICKÉ ODHADY Odhady populačních charakteristik

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Regresní a korelační analýza

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

4ST201 STATISTIKA CVIČENÍ Č. 10

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testy. Pavel Provinský. 19. listopadu 2013

4EK211 Základy ekonometrie

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Testování statistických hypotéz. Obecný postup

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

KORELACE. Komentované řešení pomocí programu Statistica

Ing. Michael Rost, Ph.D.

Charakteristika datového souboru

TECHNICKÁ UNIVERZITA V LIBERCI

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Transkript:

Doporučené příklady k procvičení k 2. Průběžnému testu - Statistika v příkladech Marek a kol. (2013) - kapitola 2.3, 9 řešené příklady 2.52-2.53, 2.58a,b - kapitola 3.1 o řešené příklady: 3.1, 3.2, 3.4 o neřešené příklady: 1, 3, 4a,b(jen E(X)) - kapitola 3.2 o řešené příklady: 3.7, 3.8, 3.10, 3.14, 3.15 o neřešené příklady: 5a,b, 8(bez p-hodnoty), 11 - kapitola 3.2 o neřešené příklady: 12 - kapitola 4 o řešené příklady: 4.1, 4.3 o neřešené příklady: 1-3 - kapitola 5 o řešené příklady: 5.1 (bez Bartlettova testu) o neřešené příklady: 1-3 - kapitola 6 o 6.1. Jednoduchá regrese řešené příklady: 6.1 (bez IS pro parametry a střední hodnotu) neřešení příklady: 1, 2 (pouze přímka) o 6.2 Regresní parabola řešené příklady: 6.6 neřešené příklady: 1 o 6.3 Vícenásobná regrese řešené příklady: 6.7 neřešené příklady: 1 o 6.4. Korelační analýza řešené příklady: 6.8, 6.9 neřešené příklady: 1, 3

1. Jaká je pravděpodobnost, že náhodně vybraný muž bude mít výšku v rozmezí 170 až 185 cm? Předpokládejme přitom, že výška mužů má normální rozdělení s parametry: μ = 180; σ 2 =49. 2. IQ studentů jedné vysoké školy má normální rozdělení se střední hodnotou 125 a rozptylem 100. Určete pravděpodobnost, že náhodně vybraný student bude mít a) IQ vyšší než 155, b) IQ menší než 100, c) IQ přesně 125,00, d) IQ v intervalu 120 až 130. 3. Hmotnost boxerů v nejvyšší váhové kategorii (open weight) má normální rozdělení se směrodatnou odchylkou 10 kg a střední hodnotou 115 kg. Jestliže vážím 109 kg, určete, pravděpodobnost, že můj soupeř bude a) těžší než já, b) lehčí než já, c) nejvýše o pět kilogramů těžší než já, d) o více než 10 kg těžší než já. e) Kolik kg musím přibrat, abych si byl na 90% jistý, že budu mít soupeře s nižší hmotností. 4. Jaká je pravděpodobnost, že náhodně vybraná žena bude mít výšku v rozmezí 160 a 175 cm? Předpokládejme přitom, že výška žen má normální rozdělení s parametry μ = 170 a σ 2 = 36. 5. Náhodná veličina X má normální rozdělení s parametry μ = 10 a σ 2 = 25. Určete následující pravděpodobnosti a kvantily: a) P(X < 5) b) P(8<X<12) c) P(X >18) d) P(X = 5) e) X 0,975 f) X 0,05 6. Bylo zjištěno, že pevnost v tahu určitého druhu výrobku má normální rozdělení se střední hodnotou 200 jednotek a směrodatnou odchylkou 40 jednotek. Každý výrobek je před expedicí testován a ty výrobky, jejichž pevnost v tahu je větší než 220 jednotek, jsou označovány za velmi kvalitní. Jaká je pravděpodobnost vyrobení velmi kvalitního výrobku?

7. Rychlost řidičů na měřeném úseku na okraji Prahy směrem na Brno má normální rozdělení se střední hodnotou 52 km/h a směrodatnou odchylkou 10 km/h. Policejní radar je nastaven na zaznamenávání řidičů překračujících rychlost o 7 km/h. a) Určete kolik procent řidičů dostane krásnou obálku s modrým pruhem, jestliže je v daném místě povolená rychlost 50 km/h. b) Určete kolik řidičů za týden překročí maximální povolenou rychlost o více než 30 km/h, jestliže každý den projede kolem radaru (ve směru měření) 5 500 automobilů. 8. Odchylka rozměru výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 0 mm a se směrodatnou odchylkou 5mm. Jaká musí být šířka intervalu normy (symetrického kolem požadované hodnoty) pro velikost výrobku, aby rozměr výrobku nepřekročil interval s pravděpodobností 0,95? 9. Byla změřena výška 6 žen s následujícími výsledky 163 cm, 175 cm, 177 cm, 165 cm, 171 cm, 174 cm a) Nalezněte bodový odhad průměrné výšky žen v celé republice. b) Sestrojte 95% oboustranný interval spolehlivosti pro odhad průměrné výšky žen v celé republice. c) Výšku kolika žen bychom museli změřit, abychom přiíustnou chybu intervalového odhadu průměrné výšky žen v celé republice snížili pod 1 cm. Předpokládejte, že výška jedné náhodně vybrané ženy má normální rozdělení s neznámou střední hodnotou (tu právě odhadujeme) a s rozptylem 49. 10. Z velké zásilky balení brambůrků Bohemia Chips bylo vybráno 5 balení a byla zjištěna jejich hmotnost. Výsledky jsou: 163 g, 159 g, 161 g, 157 g, 158 g a) nalezněte bodový odhad pro průměrnou hmotnost jednoho balení v celé zásilce b) sestrojte 99% oboustranný interval spolehlivosti pro průměrnou hmotnost jednoho balení v celé zásilce c) odhadněte, kolik váží celá zásilka, pokud víte, že obsahuje 90 balení. Předpokládejme, že rozdělení hmotnosti balení v zásilce je normální, se známým rozptylem 25.

11. Z velké zásilky balení s kukuřičnými vločkami jsme vybrali celkem 5 balení a zjistili jsme jejich hmotnost. Zde jsou výsledky: 460 gramů, 520 gramů, 490 gramů, 560 gramů, 510 gramů. a) Nalezněte bodový odhad pro průměrnou hmotnost jednoho balení v celé zásilce. b) Sestrojte 99% oboustranný interval spolehlivosti pro průměrnou hmotnost jednoho balení v celé zásilce. c) Odhadněte, kolik váží celá zásilka pokud víte, že obsahuje celkem 2400 balení. Předpokládejme přitom, že rozdělení hmotností balení v zásilce je normální. 12. Dne 25. a 26. ledna 2013 se v České republice konalo druhé kolo prezidentské volby. V závěrečném duelu se utkal Karel Schwarzenberg se pozdějším vítězem volby Milošem Zemanem. Představme si hypotetickou situaci. 200 náhodně vybraných voličů, po té co vhodilo svůj hlas do urny, bylo dotázáno, koho volilo. 110 z nich odpovědělo, že Miloše Zemana. Předpokládejme, že odpovědi jsou pravdivé, že vybraný vzorek dotázaných voličů je reprezentativním vzorkem voličů ČR a že k dispozici nejsou žádné jiné dodatečné průzkumy nebo indicie nasvědčující vítězství M. Zemana případně K. Schwarzenberga v daném místě. a.) Bodově odhadněte podíl voličů Miloše Zemana v daném kraji. b.) Nalezněte 95% oboustranný interval spolehlivosti pro podíl voličů Miloše Zemana v daném kraji. c.) Určete pravděpodobnost, že v daném kraji vyhraje volby Miloš Zeman. d.) Určete pravděpodobnost, že Karel Schwarzenberg získá více než 50% hlasů. 13. Mediálně známý ředitel velkého podniku tvrdí, že průměrná mzda v jeho zaměstnanců je 25000 korun. Chceme ověřit toto ředitelovo tvrzení, neboť ho podezíráme, že průměrnou mzdu nadhodnocuje. Zjistili jsme tedy mzdy 49 náhodně vybraných zaměstnanců podniku, a napočetli průměr těchto 49 mezd: 23500 korun, a výběrovou směrodatnou odchylku těchto 49 mezd: 5500 korun. a. Na 5 % hladině významnosti ověřte, zda je možné na základě těchto údajů zamítnout hypotézu o průměrně mzdě 25000 korun v celém podniku (tj. řečeno neformálně: vyvrátit tvrzení ředitele.) b. Na 1% hladině významnosti ověřte, zda je možné na základě těchto údajů zamítnout hypotézu o průměrně mzdě 25000 korun v celém podniku (tj. řečeno neformálně: vyvrátit tvrzení ředitele.) c. Sestavte 95% interval spolehlivosti pro průměrnou mzdu ze zjištěných dat.

14. Bylo vybráno 73 polí stejné kvality. Na 38 z nich se zkoušel nový způsob hnojení, zbývajících 35 bylo ošetřeno běžným způsobem. Průměrné výnosy pšenice při novém způsobu hnojení (tzn. průměrné výnosy napočtené z 38 polí pohnojených novým hnojivem) byly 5,3875 tun na hektar a výběrový rozptyl (výnosů napočtený z 38 polí pohnojených novým hnojivem) byl 0,2698. Průměrné výnosy pšenice při běžném způsobu hnojení (tzn. průměrné výnosy napočtené z 35 polí pohnojených běžným hnojivem) byly 4,7 tun na hektar a výběrový rozptyl (výnosů napočtený z 35 polí pohnojených běžným hnojivem) byl 0,24. Je třeba zjistit, zda nový způsob hnojení má vliv na výnosy pšenice. 15. Při sledování životnosti nových baterií VTEC 3000 bylo ze souboru 50000 baterií vybráno 30 a u nich byl vypočten průměr 195 dnů. Směrodatná odchylka v základním souboru je známá a její hodnota je 20. Předpokládáme, že životnost baterií se řídí normálním rozdělením. a. sestrojte 95% oboustranný interval spolehlivosti (IS) b. Vypočtěte, jak se změní IS, pokud zvýšíme rozsah výběru na 100 baterií c. Jak se změní IS, pokud nebudeme požadovat spolehlivost 95 %, ale 99 %? d. Kolik baterií bychom museli vybrat, aby se přípustná chyba změnila na hodnotu 10. Při zachování spolehlivosti 99%. 16. Prodejna potravin odebírá uzenářské výrobky od dvou dodavatelů a za důležitou považuje dobu, která uplyne od předání objednávky dodavatelům do okamžiku dodání objednaného zboží. První dodavatel byl testován ve 14 případech, průměrná doba čekání na objednané zboží byla 58 hodin při rozptylu 8,5. U druhého dodavatele uzenin bylo provedeno 11 pozorování, s průměrnou dobou 56 hodin s rozptylem 5. Na hladině významnosti 5 % ověřte hypotézu, zda mezi oběma dodavateli existuje takový rozdíl v rychlosti dodávek uzenin, který by byl pro vedení prodejny potravin podstatný. 17. Předpokládá se, že v České republice má: 41 % obyvatel krevní skupinu A 14 % obyvatel krevní skupinu B 7 % obyvatel krevní skupinu AB 38 % obyvatel krevní skupinu 0 V jistém týdnu darovalo krev celkem 215 dárců, kteří měli následující krevní skupiny: 82 mělo krevní skupinu A 38 mělo krevní skupinu B 26 mělo krevní skupinu AB 69 mělo krevní skupinu 0

a) Na 1% hladině významnosti rozhodněte, zda tyto zjištěné údaje jsou v souladu s předpokladem o poměrném zastoupení krevních skupin v České republice. b) Na 5% hladině významnosti rozhodněte, zda tyto zjištěné údaje jsou v souladu s předpokladem o poměrném zastoupení krevních skupin v České republice. 18. U 6 800 osob byla zjišťována barva očí a vlasů. Výsledky jsou zaneseny v tabulce. Rozhodněte, zda barva očí a barva vlasů jsou závislé znaky. 19. Z provedeného průzkumu máme informace o pohlaví a preferenci bydliště. Na základě těchto údajů rozhodněte, zda závisí preference trvalého bydlení na pohlaví. 20. Je třeba rozhodnout, zda varianty testu (označíme je jako A, B, C) jsou stejně náročné. Každou variantu si napsali 4 náhodně vybraní studenti. Jejich výsledky jsou zaneseny v tabulce. Rozhodněte, zda se průměrný počet bodů získaný za různé varianty testu významně liší. (Řešte ručně a v Excelu) 21. V tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tisících dolarů):

a) modelujte závislost nákladů na údržbu na ceně regresní přímkou b) zhodnoťte kvalitu modelu pomocí koeficientu determinace c) interpretujte věcně hodnotu regresního koeficientu b1 d) odhadněte střední hodnotu nákladů u domů za 80. tisíc dolarů e) ověřte pomocí testu, zda se jedná o významnou závislost 22. V následující tabulce jsou uvedeny roky výroby a cena automobilu Mercedes Benz S- Class 350 w221. a) Najděte regresní přímku, která nejlépe vystihuje hledanou závislost. b) Určete koeficient determinace a c) korelační koeficient. d) Kolik procent variability vysvětluje zvolená regresní přímka? e) Proveďte bodový odhad ceny automobilu vyrobeného v roce 2011. f) Určete hodnotu residua v roce 2008 (vyrovnaná hodnota empirická hodnota). Rok výroby X 2006 2007 2008 2009 2010 2012 2013 Cena (tis) Y 564 658 762 855 970 1 280 1 400 23. U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti. Údaje jsou uvedeny v následující tabulce: (příklad se pokuste řešit za pomoci excelu i ručně) a) vyrovnejte data regresní parabolou b) charakterizujte těsnost závislosti c) ověřte význam kvadratického členu v modelu d) proveďte bodový odhad spotřeby při rychlosti 80 km/h e) interpretujte hodnotu regresního koeficientu 24. V následující tabulce jsou data získaná ze stránek nejmenovaného autobazaru v České republice. Data se týkají automobilu Škoda Fabia ve srovnatelné kvalitě a se stejným rokem výroby. Cena (tis Kč) 135 115 110 101 95 85 75 69 65 Počet najetých 5 15 32 45 82 100 125 155 168 kilometrů (tis) a) Vyberte vhodnou regresní funkci, b) vyrovnejte data zvolenou regresní funkcí, c) charakterizujte těsnost závislosti d) kolik procent variability vysvětluje zvolená regresní přímka e) proveďte bodový odhad ceny fabie, která má najeto 58 tis km f) proveďte celkový F-test parametrů g) proveďte t-testy jednotlivých parametrů

25. Tabulka obsahuje údaje o stáří, počtu najetých km a ceně 20 ojetých aut značky Octavia Combi. a) zkonstruujte regresní model závislosti ceny auta na jeho stáří a počtu najetých km b) posuďte jeho kvalitu c) a použijte jej k odhadu ceny auta starého 6 let, které má najeto 60 tis.km