Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina



Podobné dokumenty
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

= = 2368

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Ing. Michael Rost, Ph.D.

Pravděpodobnost a aplikovaná statistika

Statistika, Biostatistika pro kombinované studium. Jan Kracík

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Aproximace binomického rozdělení normálním

ADDS cviceni. Pavlina Kuranova

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

STATISTICKÉ HYPOTÉZY

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Jednostranné intervaly spolehlivosti

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Cvičení ze statistiky - 8. Filip Děchtěrenko

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Testování hypotéz. 4. přednáška

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování statistických hypotéz

5 Parametrické testy hypotéz

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Náhodné veličiny, náhodné chyby

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Charakteristika datového souboru

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Vzorová prezentace do předmětu Statistika

Testování statistických hypotéz. Obecný postup

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Opakování: Nominální proměnná více hodnotová odpověď.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testy statistických hypotéz

Jana Vránová, 3. lékařská fakulta UK

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

TECHNICKÁ UNIVERZITA V LIBERCI

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

STATISTICKÉ TESTY VÝZNAMNOSTI

Normální (Gaussovo) rozdělení

STATISTICKÉ TESTY VÝZNAMNOSTI

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Zápočtová práce STATISTIKA I

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Cvičení ze statistiky - 9. Filip Děchtěrenko

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Testy o proporci a testy v multinomickém rozdělení

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Jednofaktorová analýza rozptylu

7.1. Podstata testu statistické hypotézy

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Tomáš Karel LS 2012/2013

4EK211 Základy ekonometrie

Normální (Gaussovo) rozdělení

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Přednáška X. Testování hypotéz o kvantitativních proměnných

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistické testování hypotéz II

Stručný úvod do testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

KORELACE. Komentované řešení pomocí programu Statistica

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Korelační a regresní analýza

Vysoká škola ekonomická v Praze

15. T e s t o v á n í h y p o t é z

Ranní úvahy o statistice

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Technická univerzita v Liberci

2 ) 4, Φ 1 (1 0,005)

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Transkript:

Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina

Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi parametry náhodných veličin Např. průměrné výsledky srovnávacích testů závisí na typu absolvované střední školy Statistická hypotéza = předpoklad (tvrzení) o základním souboru (populaci) Zakládá se na předchozí zkušenosti, na rozboru dosavadních znalostí nebo na pouhé domněnce

Typy statistických hypotéz Parametrické hypotézy hypotézy o parametrech rozdělení populace (nejčastěji normálního rozdělení) Hypotézy o parametru jedné populace (srovnávací testy) Hypotézy o parametrech dvou populaci (srovnávací testy) Hypotézy o parametrech více než dvou populací (Anova) Neparametrické hypotézy hypotézy o jiných vlastnostech populace (typ rozdělení, závislost proměnných.)

Hypotézy Nulová hypotéza ozn. H 0 Takové tvrzení o populaci, které je bráno jako předpoklad při testování Představuje rovnovážný stav a bývá vyjádřena rovností = mezi sledovaným jevem a parametrem θ a jeho očekávanou hodnotou θ 0 Alternativní hypotéza H A (H 1 ) : Představuje porušení rovnovážného stavu a zapisujeme ji tedy jedním ze tří možných zápisů nerovnosti (, <, > ) H 0 : θ = θ 0 ; H A : θ θ 0 oboustranná alternativa případně existují jen levostranná H A : θ < θ 0 a pravostranná H A : θ > θ 0 alternativa Cílem testování nulové hypotézy je dospět k úsudku, zda můžeme tuto hypotézu zamítnout vzhledem ke stanovené hypotéze alternativní.

Testování statistických hypotéz Rozhodovací proces, kdy proti sobě stoí dvě tvrzení nulová a alternativní hypotéza Nulovou hypotézu považujeme za pravidlo až do okamžiku, kdy nás informace získané z výběrového souboru přesvědčí o opaku (analogie s presumpcí neviny v soudnictví). Možné závěry testu statistické hypotézy: Zamítáme H 0 ve prospěch hypotézy H A Nezamítáme H 0

Testování pomocí intervalových odhadů Lze použít pouze pro testování parametrických hypotéz (umíme nalézt pouze intervalové odhady normálního rozdělení) Postup: 1. Formulace nulové a alternativní hypotézy 2. nalezení příslušného intervalového odhadu 3. Ověření toho, zda testovaná hodnota parametru leží v nalezeném intervalovém odhadu 4. Formulace závěru testu

Čistý test významnosti Postup: 1. Formulace nulové a alternativní hypotézy 2. Volba testové statistiky (testového kritéria) T(X) musíme znát rozdělení při platnosti nulové hypotézy (nulové rozdělení) 3. Ověření předpokladů testu. 4. Výpočet pozorované hodnoty x OBS testové statistiky T(X) 5. Výpočet p_value 6. Rozhodnutí na základě p_value

T test test hypotézy o střední hodnotě (neznáme rozptyl σ 2 Předpoklad testu: parametrický test (normalita) Testová statistika: T X = T n 1 = X μ s n t n 1 Předpoklad, že oba výběry pocházejí z normálního rozdělení, nemusí být za každou cenu dodržen. T-test totiž pracuje s průměry obou výběrů, a ty již při rozsahu výběru v řádu desítek mají přibližně normální rozdělení díky centrální limitní větě.

T test - příklad Inteligenční kvocient (IQ) popisuje inteligenci jednotlivce v poměru k ostatní populaci, přičemž za střední hodnotu se považuje IQ 100 bodů. Je známo, že IQ má normální rozdělení. Při testu inteligence, kterého se zúčastnilo 10 náhodných vybraných studentů posledního ročníku výběrové školy ASNEM, byly naměřeny následující hodnoty IQ: 65 98 103 77 93 102 102 113 80 94 Ověřte čistým testem významnosti hypotézu, že na škole ASNEM je střední hodnota IQ studentů závěrečného ročníku podprůměrná.

T test - příklad Řešení: 1. formulace nulové a alternativní hypotézy: H 0 : μ = 100 Průměrné IQ 10-ti testovaných studentů je: X = 10 i=1 X i n = 65+98+ +94 10 2. Volba testové statistiky: 92,7 H A : μ < 10 Hypotéza o střední hodnotě, neznáme rozptyl: T X = X μ s n t 9 3. výpočet pozorované hodnoty testové statistiky T (X) x OBS s = 10 i=1 n 1 x i x 2 = 65 92,7 2 + + 94 92,7 2 10 1 14,5

T test - příklad Řešení: x OBS = T (X) H 0 = 92,7 100 14,5 10=-1,59 4. Výpočet p-value: Z tvaru alternativní hypotézy => p-value = F (x OBS ), kde F 0 (X) je distribuční funkce studentova rozdělení s 9 stupni volnosti p value = F 0 1,59 = 1 F 0 1,59 = 0,073 5. Rozhodnutí na základě p-value p-value je větší než 0,05. Na hladině významnosti 0,05 nezamítáme nulovou hypotézu. Nelze tedy tvrdit, že střední hodnota IQ studentů závěrečného ročníku školy ASNEM je podprůměrná. Jinak řečeno, rozdíl mezi předpokládanou střední hodnotou IQ a pozorovaným průměrem IQ je statisticky nevýznamný.

Exaktní Binomický test Pro (n 1 +n 2 ) 25 V případě, že (n 1 +n 2 ) > 25, lze dle dokumentace SPSS použít aproximaci normálním rozdělením. Je-li π 1,0 = 0,5(relativní četnost), pak můžeme nulovou hypotézu napsat jako H 0 : π 1 = π 2 a alternativní jako H A : π 1 π 2. Pro n 1 < n 2 a p 1 < π 1,0 je alternativní hypotéza stanovena jako H A : π 1 < π 1,0. Pro n 1 < n 2 a p 1 > π 1,0 je alternativní hypotéza stanovena jako H A : π 1 > π 1,0. Při exaktním restu se spočte minimální hladina významnosti α, která se porovnává se zvolenou hladinou významnosti α (pokud α α, pak H 0 zamítneme, platí-li, že α > α H 0 nezamítáme).