Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Podobné dokumenty
Statistika, Biostatistika pro kombinované studium. Jan Kracík

Ing. Michael Rost, Ph.D.

7. Analýza rozptylu.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Intervalové Odhady Parametrů II Testování Hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

PRAVDĚPODOBNOST A STATISTIKA

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

12. cvičení z PST. 20. prosince 2017

Jednofaktorová analýza rozptylu

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Obecný postup

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

15. T e s t o v á n í h y p o t é z

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

15. T e s t o v á n í h y p o t é z

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Příklady na testy hypotéz o parametrech normálního rozdělení

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testy. Pavel Provinský. 19. listopadu 2013

Jednostranné intervaly spolehlivosti

4EK211 Základy ekonometrie

Testování statistických hypotéz

Základy počtu pravděpodobnosti a metod matematické statistiky

5. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Normální (Gaussovo) rozdělení

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Intervalové Odhady Parametrů

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

= = 2368

Pravděpodobnost a aplikovaná statistika

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Vybrané partie z biostatistiky

12. prosince n pro n = n = 30 = S X

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

PRAVDĚPODOBNOST A STATISTIKA

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

STATISTICKÉ ODHADY Odhady populačních charakteristik

Testování hypotéz o parametrech regresního modelu

Normální (Gaussovo) rozdělení

Testování hypotéz o parametrech regresního modelu

Pravděpodobnost a matematická statistika

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Přednáška IX. Analýza rozptylu (ANOVA)

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

KGG/STG Statistika pro geografy

Náhodné veličiny, náhodné chyby

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

5 Parametrické testy hypotéz

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

STATISTICKÉ HYPOTÉZY

4ST201 STATISTIKA CVIČENÍ Č. 7

Testy statistických hypotéz

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Testování statistických hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Úvod do analýzy rozptylu

Testování hypotéz. 4. přednáška

Design Experimentu a Statistika - AGA46E

Aproximace binomického rozdělení normálním

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Stručný úvod do testování statistických hypotéz

Návod na vypracování semestrálního projektu

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Tomáš Karel LS 2012/2013

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Statistická analýza jednorozměrných dat

Transkript:

Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Obsah seminářů 5.11. Úvod do matematické statistiky: definice náhodné veličiny a jejich číselných charakteristik, základní rozdělení pravděpodobnosti, práce v R. 19.11. Parametrické testy hypotéz: odhady parametrů, princip testování hypotéz, testy střední hodnoty a rozptylu, ANOVA, kontingenční tabulky, práce v R. 3.12. Neparametrické testy: neparametrické alternativy testů polohy, Kruskal-Wallisův test, práce v R.

Náhodný výběr Experimentální data představují realizace náhodných veličin. Výsledky experimentu chceme zobecnit na celou populaci. Na základě realizací x 1,..., x n NV X chceme stanovit hodnotu parametru θ. Jsou-li pozorování realizacemi nezávislých, stejně rozdělených NV, mluvíme o tzv. náhodném výběru.

Bodový odhad = náhodná veličina T (X), od které očekáváme, že bude v průměru (ve smyslu opakování pokusu) odhadovat skutešnou hodnotu θ - nestranný, bude nejméně koĺısat kolem skutečné hodnoty - stejnomějně nejlepší, s rostoucím počtem pozorování se bĺıží skutečné hodnotě - konzistentní odhad. Např. a X = 1 n Xi S 2 = 1 (Xi n 1 X ) 2 jsou nejlepší nestranné odhady střední hodnoty µ a rozptylu σ 2.

Intervalový odhad (T 1 (X), T 2 (X)) Upřesňují informaci o skutečné hodnotě parametru. Platí P [θ (T 1 (X), T 2 (X))] 1 α, α (0, 1). Pro X N(µ, σ 2 ) mají intervalové odhady tvar [ ( )] σ P µ X u 1 α/2 n, X σ + u 1 α/2 n 1 α při známém rozptylu σ 2, [ ( P µ X t n 1 (1 α/2) n S, X + t n 1 (1 α/2) n S )] 1 α při neznámém rozptylu a [ ( )] P σ 2 S 2 (n 1) S 2 (n 1) χ 2 n 1 (1 α/2), χ 2 n 1 (α/2) 1 α).

Základní principy Předpokládejme, že parametr θ může nabývat hodnot z množiny Θ, a a) tvrzení H 0 : θ Θ 0 Θ nazveme nulovou hypotézou b) tvrzení H 1 : θ Θ 1, Θ 0 Θ 1 = 0, Θ 0 Θ 1 = Θ nazveme alternativní hypotézou. Na základě testu můžeme dospět ke dvěma závěrům: 1. Zamítáme H 0 ve prospěch alternativy. 2. Hypotézu H 0 nelze zamítnout. Hypotézy NIKDY nepřijímáme!

Základní principy Při rozhodování o hypotéze H 0 se můžeme dopustit dvou chyb: H 0 zamítneme H 0 nezamítneme H 0 je správná chyba 1. druhu H 0 není správná chyba 2. druhu Minimalizace pravděpodobnosti obou chyb naráz není možná. Požadujeme aby pr. chyby 1. druhu byla nejvýše α - hladina testu. Hladinu testu voĺıme většinou 0.05 nebo 0.01. Přílišná přísnost na chybu 1. druhu vede nárůstu pr. chyby 2. druhu.

Postup 1. Stanovení nulové a alternativní hypotézy. 2. Stanovení hladiny testu α. 3. Volba testové statistiky T a výpočet její realizace. 4. Stanovení kritického oboru. 5. Rozhodnutí. Pokud T (x) leží v kritickém oboru, pak H 0 zamítáme, v opačném případě ji zamítnout nelze.

P-value = nejmenší hladina, při které bychom hypotézu ještě zamítli. Udává míru naší jistoty při rozhodování o nulové hypotéze. Čím bĺıže je p-value 0 nebo 1, tím jsme si jistější. Je-li p-value α, hypotézu zamítáme. Je-li p-value > α, hypotézu zamítnout nelze.

Jednovýběrový t-test H 0 : µ = µ 0. H 1 : µ µ 0. Předpoklady: X N(µ, σ 2 ), kdy µ ani σ 2 neznáme. Testová statistika: Kritický obor: Funkce v R: t.test() T (X) = X µ n tn 1. S (, t n 1 (1 α/2) t n 1 (1 α/2), )

Test rozptylu H 0 : σ 2 = σ0 2. H 1 : σ 2 σ0 2. Předpoklady: X N(µ, σ 2 ), kdy µ ani σ 2 neznáme. Testová statistika: (n 1)S 2 T (X) = χ 2 n 1. Kritický obor: ( 0, χ 2 n 1 (α/2) χ 2 n 1(1 α/2), ) Funkce v R: onesample.var.test() σ 2

F-test shody rozptylu H 0 : σ 2 1 = σ2 2. H 1 : σ 2 1 σ2 2. Předpoklady: X N(µ 1, σ 2 1 ), Y N(µ 2, σ 2 2 ) a X a Y jsou nezávislé. Testová statistika: Kritický obor: Funkce v R: var.test() T = S n 2 σ2 2 Sm 2 σ1 2 F n 1,m 1. (0, F n 1,m 1 (α/2) F n 1,m 1 (1 α/2), )

Dvouvýběrový t-test H 0 : µ 1 = µ 2. H 1 : µ 1 µ 2. Předpoklady: X N(µ 1, σ 2 ), Y N(µ 2, σ 2 ), rozptyly σ 2 neznáme, ale jsou shodné a X a Y jsou nezávislé. Testová statistika: Kritický obor: T = Funkce v R: t.test() X Ȳ (µ 1 µ 2 ) nm(n + m 2) t n+m 2 (n 1)S 2 n + (m 1)Sm 2 n + m (, t n+m 2 (1 α/2) t n+m 2 (1 α/2), )

Kontingenční tabulky X \Y 1 2... J 1 n 11 n 12... n 1J n 1. 2 n 21 n 22... n 2J n 2...... I n I 1 n I 2... n IJ n I. n.1 n.2... n.j n

Kontingenční tabulky H 0 : NV X a Y jsou nezávislé. H 1 : X a Y nejsou nezávislé. Předpoklady: n ij jsou realizace multinomického rozdělení s parametry n a p ij a n i.n.j n 5. Testová statistika: T = I i=1 j=1 ( J nij n i.n.j n i. n.j n n ) 2 χ 2 (I 1)(J 1). Kritický obor: Funkce v R: chisq.test() χ 2 (I 1)(J 1) (1 α), )

ANOVA H 0 : Sledovaný faktor nemá vliv (µ 1 = = µ k ). H 1 : Sledovaný faktor má vliv. Předpoklady: X 1 N(µ 1, σ 2 ),..., X k N(µ k, σ 2 ) vyžadujeme normální rozdělení (shapiro.test()) a shodu rozptylů (bartlett.test()). Testová statistika: S e = k n i ( ) 2, Yij Ȳ i. SA = i=1 j=1 k ) 2, n i (Ȳi. Ȳ.. i=1 Kritický obor: Funkce v R: aov(), anova() F A = S A S e n k k 1 F k 1,n k. F k 1,n k (1 α), )

ANOVA V případě zamítnutí nulové hypotézy chceme zjistit, mezi kterými úrovněmi faktoru je významný rozdíl. K tomuto účelu využijeme mnohonásobné porovnávání. Scheffeho metoda - nevyvážené třídění, Tukeyho metoda - vyvážené třídění. V R použijeme funkci TukeyHSV() - úprava Tukeyho metody na nevyvážené třídění.

PRÁCE V R

Literatura Anděl J (2011) Základy matematické statistiky. MatFyz Press, Praha. Hron K, Kunderová P (2015) Základy počtu pravděpodobnosti a metod matematické statistiky. VUP, Olomouc.