4EK211 Základy ekonometrie

Podobné dokumenty
AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

12. cvičení z PST. 20. prosince 2017

Testování statistických hypotéz

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování statistických hypotéz

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Stručný úvod do testování statistických hypotéz

Testy statistických hypotéz

= = 2368

12. prosince n pro n = n = 30 = S X

STATISTICKÉ HYPOTÉZY

Aproximace binomického rozdělení normálním

Testy. Pavel Provinský. 19. listopadu 2013

4EK211 Základy ekonometrie

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Normální (Gaussovo) rozdělení

Intervalové Odhady Parametrů II Testování Hypotéz

Ing. Michael Rost, Ph.D.

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

4EK211 Základy ekonometrie

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Normální rozložení a odvozená rozložení

PRAVDĚPODOBNOST A STATISTIKA

Příklady na testy hypotéz o parametrech normálního rozdělení

Tomáš Karel LS 2012/2013

Pravděpodobnost a matematická statistika

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Charakteristika datového souboru

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Pravděpodobnost a aplikovaná statistika

4EK211 Základy ekonometrie

Zápočtová práce STATISTIKA I

5. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Jednofaktorová analýza rozptylu

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

15. T e s t o v á n í h y p o t é z

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování hypotéz o parametrech regresního modelu

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testování hypotéz o parametrech regresního modelu

Testování statistických hypotéz. Obecný postup

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Statistická analýza jednorozměrných dat

Inovace bakalářského studijního oboru Aplikovaná chemie

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Tomáš Karel LS 2012/2013

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

You created this PDF from an application that is not licensed to print to novapdf printer (

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

4EK211 Základy ekonometrie

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Tomáš Karel LS 2012/2013

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Poznámky k předmětu Aplikovaná statistika, 4. téma

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Testování hypotéz. 4. přednáška

Cvičení ze statistiky - 9. Filip Děchtěrenko

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

4EK211 Základy ekonometrie

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

4EK211 Základy ekonometrie

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Jednofaktorová analýza rozptylu

Náhodné vektory a matice

Kontingenční tabulky, korelační koeficienty

Poznámky k předmětu Aplikovaná statistika, 4. téma

Regresní a korelační analýza

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

4ST201 STATISTIKA CVIČENÍ Č. 7

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE

Z čeho studovat 1) Z KNIHY Krkošková, Š., Ráčková, A., Zouhar, J.: Základy ekonometrie v příkladech, 2. vydání, VŠE, 2010 Hušek, R.: Ekonometrická analýza, Oeconomica, 2007 Hušek, R.: Aplikovaná ekonometrie: teorie a praxe, Oeconomica, 2009 2) Z WEBU: http://jakplavejak.cz/node/1 prezentace ze cvičení 3) PŘIJÍT NA KH: středa 14:30-16:00, čtvrtek 12:45-14:15 PRŮBĚŽNÝ TEST: 30 BODŮ, 25.11. CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 2

1.1 Charakteristiky polohy 1. Střední hodnota 2. Medián 3. Modus A) Nejčastěji se vyskytující hodnota v populaci. B) Dlouhodobý průměr výsledků při opakovaném náhodném výběru z populace. c) Hodnota oddělující horní polovinu populace od spodní. CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 3

1.1 Charakteristiky polohy 1. Střední hodnota 2. Medián 3. Modus A) Nejčastěji se vyskytující hodnota v populaci. B) Dlouhodobý průměr výsledků při opakovaném náhodném výběru z populace. c) Hodnota oddělující horní polovinu populace od spodní. CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 4

1.1 Charakteristiky polohy 1. Ve 2. čtvrtletí 2014 činila mzda 25 500 Kč. a) průměrná b) mediánová 2. mzda činila 21 385 Kč. a) Průměrná b) Mediánová 3. Přibližně zaměstnanců má podprůměrnou mzdu. a) 33 % b) 66 % http://www.czso.cz/csu/csu.nsf/informace/cpmz090514.docx http://www.platy.cz/partner/region/ceska-republika CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 5

1.1 Charakteristiky polohy 1. Ve 2. čtvrtletí 2014 činila mzda 25 500 Kč. a) průměrná b) mediánová 2. mzda činila 21 385 Kč. a) Průměrná b) Mediánová 3. Přibližně zaměstnanců má podprůměrnou mzdu. a) 33 % b) 66 % http://www.czso.cz/csu/csu.nsf/informace/cpmz090514.docx http://www.platy.cz/partner/region/ceska-republika CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 6

1.1 Charakteristiky polohy Následující data představují hodinovou mzdu deseti studentů. 60 90 90 90 100 110 110 120 130 600 Určete: 1. průměr 2. medián 3. modus CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 7

1.1 Charakteristiky polohy Následující data představují hodinovou mzdu deseti studentů. 60 90 90 90 100 110 110 120 130 600 Určete: 1. průměr 150 Kč 2. medián 105 Kč 3. modus 90 Kč Jak na to: http://jakplavejak.cz/node/29 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 8

1.2 Normální rozdělení Co je to hustota pravděpodobnosti? Co je to distribuční funkce? Co z toho je na obrázku? dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4-4 -2 0 2 4 μ = 0, xσ = 1 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 9

1.2 Normální rozdělení Která veličina má vyšší střední hodnotu? Která veličina má větší rozptyl? μ = 0, σ = 1 μ = 0,5, σ = 1 μ = 0, σ = 1 μ = 0, σ = 2 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 10

1.3 Normální rozdělení Co je to rozptyl? Co je to směrodatná odchylka? Jak byste tyto pojmy vysvětlili někomu, kdo o statistice nic neví? Uvažujme náhodnou veličinu se střední hodnotou 5 a rozptylem 0. Co můžeme říct o této náhodné veličině? http://commons.wikimedia.org/wiki/file:standard_deviation_diagram.svg CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 11

1.3 Normální rozdělení Příklad: Jaká je střední hodnota IQ v populaci? Jaká je směrodatná odchylka? http://www.aceintelligence.com/iq_test/iq_test_graph.gif CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 12

1.4 Další důležitá rozdělení a) Chí-kvadrát rozdělení b) Studentovo t-rozdělení C) Fisherovo rozdělení Jak tato rozdělení vypadají? Platí: Pokud mají nezávislé, stejně rozdělené veličiny X 1, X 2,, X n rozdělení N(0; 1), má součet jejich druhých mocnin chí-kvadrát rozdělení s n stupni volnosti. Jsou-li veličiny U ~ N(0; 1), Z ~ χ 2 (n) nezávislé, má veličina U Z n t-rozdělení s n stupni volnosti. Má-li veličina K 1 chí-kvadrát rozdělení s n 1 stupni volnosti a veličina K 2 chí-kvadrát rozdělení s n 2 stupni volnosti, pak má veličina K 1/n 1 K 2 /n 2 Fisherovo rozdělení s n 1, n 2 stupni volnosti. CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 13

1.4 Počítání se stř. hodnotami a rozptyly Jsou dány nezávislé náhodné veličiny X a Y, kde: Ex = 10, varx = 1 Ey = 5, vary = 2 Spočítejte: a) E[4x] e) var[4x] b) E[x + 5] f) var[x + 5] c) E[x + y] g) var[x + y] d) E[4x + 3y] h) var[4x + 3y] http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 14

1.4 Počítání se stř. hodnotami a rozptyly Jsou dány nezávislé náhodné veličiny X a Y, kde: Ex = 10, varx = 1 Ey = 5, vary = 2 Spočítejte: a) E[4x] = 40 e) var[4x] = 16 b) E[x + 5] = 15 f) var[x + 5] = 1 c) E[x + y] = 15 g) var[x + y] = 3 d) E[4x + 3y] = 55 h) var[4x + 3y] = 34 http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 15

1.5 Náhodný výběr Náhodné veličiny x 1, x 2,, x 10 jsou nezávislé a pochází z rozdělení N(μ, σ 2 ). Výběrový průměr: x = 1 10 i=1 10 x i Výběrový rozptyl: s 2 = 1 9 i=1 10 (x i x) 2 Jaké rozdělení má: a) x http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 16

1.5 Náhodný výběr Náhodné veličiny x 1, x 2,, x 10 jsou nezávislé a pochází z rozdělení N(μ, σ 2 ). Výběrový průměr: x = 1 10 i=1 10 x i Výběrový rozptyl: s 2 = 1 9 i=1 10 (x i x) 2 Jaké rozdělení má: a) x ~ N(μ ; σ2 10 ) protože E( x) = 1 10 i=1 10 E(x i ) = 1 10 i=1 10 μ = μ var( x) = ( 1 10 )2 10 i=1 var(x i ) = ( 1 10 )2 10 i=1 σ 2 = σ2 10 Co by se stalo se střední hodnotou x, kdybychom měli nikoli 10, ale 1 000 náhodných veličin? A kdyby jich bylo nekonečno? http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 17

1.5 Náhodný výběr Náhodné veličiny x 1, x 2,, x 10 jsou nezávislé a pochází z rozdělení N(μ, σ 2 ). Výběrový průměr: x = 1 10 i=1 10 x i Výběrový rozptyl: s 2 = 1 9 i=1 10 (x i x) 2 Jaké rozdělení má: b) U = x μ σ 2 10 http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 18

1.5 Náhodný výběr Náhodné veličiny x 1, x 2,, x 10 jsou nezávislé a pochází z rozdělení N(μ, σ 2 ). Výběrový průměr: x = 1 10 i=1 10 x i Výběrový rozptyl: s 2 = 1 9 i=1 10 (x i x) 2 Jaké rozdělení má: b) U = x μ σ 2 10 ~ N(0; 1) Jak se nazývá toto rozdělení? Obecně, jak transformujeme libovolné normální rozdělení na toto rozdělení? http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 19

1.5 Testování hypotéz Ve firmě je 100 zaměstnanců a my si myslíme, že jejich průměrná výška je 175 cm. Je to ale opravdu tak? Mohli bychom všechny změřit a spočítat průměr. Nebo bychom mohli změřit jen některé, abychom sobě i jim ulehčili čas, a pomoci si svými poznatky ze statistiky. Vybereme tedy náhodně 20 zaměstnanců (viz tabulka). Předpokládáme, že výška zaměstnanců má normální rozdělení. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 20

1.5 Testování hypotéz Co je v tomto případě populací? Co je v tomto případě výběrem? 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 Spočítejte výběrový průměr. Spočítejte výběrový rozptyl a směrodatnou odchylku. 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 21

1.5 Testování hypotéz Co je v tomto případě populací? Co je v tomto případě výběrem? 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 Spočítejte výběrový průměr. Spočítejte výběrový rozptyl a směrodatnou odchylku. x = 173,75 s 2 = 52,51 s = 7,2 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 22

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 4. Učiňte nějaký závěr. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 23

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 4. Učiňte nějaký závěr. H 0 : μ = 175 cm H 1 : μ 175 cm Je to jednostranný nebo oboustranný test? 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 24

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 3. Učiňte nějaký závěr. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 t = 173,75 175 7,2 20 = 0,78 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 Jaké má tato statistika rozdělení? 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 25

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 4. Učiňte nějaký závěr. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161-2,093 2,093 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 26

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 4. Učiňte nějaký závěr. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161-2,093 0,78 2,093 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 27

1.5 Testování hypotéz 1. Zapište nulovou a alternativní hypotézu. 2. Spočítejte testovou statistiku. 3. Najděte kritickou hodnotu. 4. Učiňte nějaký závěr. Nezamítli jsme tedy nulovou hypotézu, a to na pětiprocentní hladině významnosti. Co to znamená? 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 28

1.5 Testování hypotéz Nyní se podívejme, jak vypadá skutečnost (většinou ji ale neznáme!) Průměrná výška je 175 cm. Směrodatná odchylka je 10,5 cm. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 Učinili jsme při testu hypotézy správný závěr? 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 29

1.5 Testování hypotéz Uvažujme následující situaci. Místo prvních dvou řádků jsme náhodně vybrali tyto zaměstnance. 180 180 175 165 172 172 179 167 182 185 170 175 175 169 183 167 172 183 166 158 181 176 180 156 164 186 193 179 161 150 Testová statistika je t = 165 175 9,6 20 = 4,2 183 179 162 186 175 183 187 176 158 189 190 163 165 177 192 174 185 196 183 161 190 179 190 173 168 175 183 167 177 184 Může taková situace nastat? Zamítneme v tomto případě nulovou hypotézu? Pokud ano, jaké chyby se přitom dopustíme? 198 164 165 167 183 188 178 174 187 156 173 184 177 174 179 171 176 167 180 191 188 187 180 169 177 177 190 159 172 168 154 175 160 164 163 167 176 151 158 170 CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 30

1.5 Testování hypotéz Chyba I. druhu: Chyba II. druhu: zamítneme nulovou hypotézu, přestože platí nezamítneme nulovou hypotézu, přestože platí alternativní hypotéza p-hodnota: nejnižší hladina významnosti, při které můžeme zamítnout nulovou hypotézu. V předchozím případě je (při oboustranném testu) p-hodnota rovna 0,000485. Co to znamená? Obecně: je-li p-hodnota 0,05, pak na 5% hladině významnosti zamítáme nulovou hypotézu. CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 31

1.6 Kovariance a korelace 1. Vymyslete nějaký příklad pozitivně korelovaných, negativně korelovaných a nekorelovaných veličin. 2. Jaký je vztah mezi kovariancí a korelací? 3. Jakých hodnot může nabývat kovariance a jakých korelační koeficient? 4. Pokud je korelační koeficient roven nule, jsou veličiny určitě nezávislé? 5. Pokud jsou veličiny korelované, znamená to, že jedna je příčinou druhé? CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 32

1.6 Kovariance a korelace korelační koeficient https://en.wikipedia.org/wiki/correlation_and_dependence#mediaviewer/file:correlation_examples2.svg CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 33

1.6 Kovariance a korelace korelace a kauzalita: roční spotřeba čokolády versus počet nositelů Nobelovy ceny na 10 milion obyvatel http://i.stack.imgur.com/twqab.jpg CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 34

Otázky? Další opakování ze statistiky např. zde: http://nb.vse.cz/~zouharj/zek/repet_resene.pdf CVIČENÍ 1 OPAKOVÁNÍ ZE STATISTIKY 35