Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Podobné dokumenty
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Tomáš Karel LS 2012/2013

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

INDUKTIVNÍ STATISTIKA

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Kurz Biostatistiky pro zaměstnance FNO

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Statistické metody uţívané při ověřování platnosti hypotéz

ANALÝZA ZÁVISLOSTI. Martina Litschmannová

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Přednáška 10. Analýza závislosti

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Kontingenční tabulky, korelační koeficienty

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Korelační a regresní analýza

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

4ST201 STATISTIKA CVIČENÍ Č. 7

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Kontingenční tabulky, korelační koeficienty

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Pravděpodobnost a aplikovaná statistika

Přednáška X. Testování hypotéz o kvantitativních proměnných

Cvičení 12: Binární logistická regrese

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Tomáš Karel LS 2012/2013

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Vzorová prezentace do předmětu Statistika

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Návod na vypracování semestrálního projektu

MATEMATIKA III V PŘÍKLADECH

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

You created this PDF from an application that is not licensed to print to novapdf printer (

KGG/STG Statistika pro geografy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Příklad: Test nezávislosti kategoriálních znaků

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Analýza dat z dotazníkových šetření

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Jana Vránová, 3. lékařská fakulta UK

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Testy. Pavel Provinský. 19. listopadu 2013

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

PRAVDĚPODOBNOST A STATISTIKA

ADDS cvičení 7. Pavlína Kuráňová

Cvičení ze statistiky - 9. Filip Děchtěrenko

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Technická univerzita v Liberci

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

KGG/STG Statistika pro geografy

Biostatistika Cvičení 7

Příloha č. 3. Kombinační třídění

4EK211 Základy ekonometrie

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Tomáš Karel LS 2012/2013

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Testování hypotéz a měření asociace mezi proměnnými

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Porovnání dvou výběrů

Poznámky k předmětu Aplikovaná statistika, 11. téma

= = 2368

Výběrové charakteristiky a jejich rozdělení

12. cvičení z PST. 20. prosince 2017

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

TECHNICKÁ UNIVERZITA V LIBERCI

Ilustrační příklad odhadu LRM v SW Gretl

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

ADDS cviceni. Pavlina Kuranova

Jana Vránová, 3. lékařská fakulta, UK Praha

Transkript:

VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p počet odhadovaných parametrů) ANALÝZA ZÁVISLOSTI Analýza závislosti v kontingenční tabulce Název testu Předpoklady testu Testová statistika Analýza závislosti v kontingenční tabulce Očekávané četnosti, alespoň 80% očekávaných četností >5 Nulové rozdělení ( ) ( )( ) koeficient kontingence (pro čtvercové kontingenční tabulky), korigovaný koeficient kontingence, kde ( ) ( ), Cramerův koeficient ( ( ) ). (pro obdélníkové kontingenční tabulky) Tyto koeficienty se mohou vyskytovat v intervalu ( těsnější. ). Čím jsou blíže 1, tím je závislost mezi X a Y Analýza závislosti v asociační tabulce Odhad poměru šancí:. Intervalový odhad : Odhad relativního rizika: ( ) ( ) Intervalový odhad : ( ) ( ) ( ) ( )

Test z teorie 1. Lze Kolmogorovův-Smirnovův test použít pro testování normality? (ANO, NE) 2. Použijeme-li 2 test dobré shody pro ověření toho, zda je klasická šestistěnná hrací kostka férová, pak má v případě platnosti nulové hypotézy testová statistika 2 rozdělení s a) 4 stupni volnosti, b) 5 stupni volnosti, c) 6 stupni volnosti. 3. Jak postupujeme v případě, kdy při použití 2 testu dobré shody vyšlo po rozdělení dat do dvaceti tříd 7 očekávaných třídních četností rovných 1? a) V tomto případě nelze 2 testem dobré shody rozhodnout, b) Prohlásíme předpoklady testu za splněné, c) Sloučíme příslušné sousední třídy. 4. Empirická distribuční funkce je funkce a) diskrétní, b) spojitá, c) zleva spojitá, d) zprava spojitá. 5. Čím je mozaikový graf členitější, tím je pozorovaná závislost mezi veličinami v kontingenční tabulce a) slabší, b) silnější. 6. Analyzujeme-li závislost v kontingenční tabulce, která má 4 řádky a 5 sloupců, pak 2 test nezávislosti můžeme použít, pokud alespoň a) 4 b) 10 c) 16 d) 20 očekávaných četností je větších než 5 a ostatní jsou rovny alespoň a) 0, b) 1, c) 2. 7. Koeficient kontingence a) nabývá hodnot z intervalu (0; 1), b) nabývá hodnot z intervalu 0; 1, c) může nabývat hodnot větších než 1. 8. (Kontingenční, Asociační)tabulka je speciálním případem (kontingenční, asociační) tabulky. 9. Je-li odhad relativního rizika, pak a) mezi znaky v asociační tabulce existuje závislost, b) mezi znaky v asociační tabulce neexistuje závislost, c) o závislosti znaků v asociační tabulce musí rozhodnout test. Martina Litschmannová 2

10. Je-li odhad poměru šancí, pak je u exponované populace a) nižší šance výskytu nemoci než u neexponované populace, b) vyšší šance výskytu nemoci než u neexponované populace, c) stejná šance výskytu nemoci jako u neexponované populace. 11. Odhadujeme-li se spolehlivostí 0,95, že relativní riziko ( ), pak na hladině významnosti 0,05 (tj. se spolehlivostí 0,95) a) nezamítáme hypotézu o nezávislosti znaků X a Y, b) zamítáme hypotézu o nezávislosti znaků X a Y, c) nelze o nezávislosti znaků X a Y rozhodnout. Martina Litschmannová 3

Příklady 1) Hodilo se 6000 krát hrací kostkou a zaznamenaly se počty padlých ok. x i (číslo které padlo) 1 2 3 4 5 6 n i (četnost jeho výskytu) 979 1002 1015 980 1040 984 Je možné na základě příslušného testu na hladině významnosti 5% spolehlivě tvrdit, že kostka je "falešná", tj. že pravděpodobnosti všech čísel na kostce nejsou stejné? x i (číslo které padlo) 1 2 3 4 5 6 Celkem Pozorované četnosti 979 1002 1015 980 1040 984 Očekávané pravděpodobnosti Očekávané četnosti --- Počet stupňů volnosti: 2) Výrobní firma odhaduje počet poruch určitého zařízení během 100 hodin pomocí Poissonova rozdělení s parametrem 1,2. Zaměstnanci zaznamenali pro kontrolu skutečné počty poruch celkem ve 150-ti 100 hodinových intervalech (výsledky jsou uvedeny v tabulce). Ověřte čistým testem významnosti, zda má počet poruch daného zařízení během 100 hodin skutečně Poissonovo rozdělení s parametrem λt=1,2. x i počet poruch během 100 hodin provozu 0 1 2 3 4 n i - počet pozorování 52 48 36 10 4 Martina Litschmannová 4

x i počet poruch během 100 hodin provozu 0 1 2 3 4 Celkem Pozorované četnosti 52 48 36 10 4 Očekávané pravděpodobnosti Očekávané četnosti --- Počet stupňů volnosti: 3) Výrobní firma odhaduje počet poruch určitého zařízení během 100 hodin pomocí Poissonova rozdělení s parametrem 1,2. Zaměstnanci zaznamenali pro kontrolu skutečné počty poruch celkem ve 150-ti 100 hodinových intervalech (výsledky jsou uvedeny v tabulce). Ověřte čistým testem významnosti, zda má počet poruch daného zařízení během 100 hodin skutečně Poissonovo rozdělení. x i počet poruch během 100 hodin provozu 0 1 2 3 4 n i - počet pozorování 52 48 36 10 4 Odhad parametru Poissonova rozdělení: x i počet poruch během 100 hodin provozu 0 1 2 3 4 Celkem Pozorované četnosti 52 48 36 10 4 Očekávané pravděpodobnosti Očekávané četnosti --- Počet stupňů volnosti: Martina Litschmannová 5

4) Na dálnici byly v průběhu několika minut měřeny časové odstupy [s] mezi průjezdy jednotlivých vozidel. Zjištěné hodnoty těchto odstupů jsou v další tabulce: 2,5 6,8 5,0 9,8 4,0 2,3 4,2 1,9 8,7 7,7 5,9 5,3 8,4 3,6 9,2 4,3 2,6 13,0 5,4 8,6 4,2 2,9 1,5 1,8 1,6 5,9 8,3 5,2 6,9 5,1 1,3 6,4 6,5 5,7 3,6 4,8 4,0 7,3 24,9 10,6 15,0 5,3 4,0 3,3 6,0 4,6 1,6 1,9 1,5 11,1 4,3 5,5 2,1 2,9 3,0 3,8 1,0 1,5 8,6 4,4 6,8 5,2 3,0 8,0 4,0 4,7 7,3 2,3 1,9 1,9 4,6 6,4 5,3 3,9 2,4 1,2 6,2 4,3 2,6 2,7 2,0 0,8 3,7 6,9 2,8 4,3 4,9 4,1 4,5 4,4 11,9 9,0 5,6 4,8 2,8 2,1 4,3 1,0 1,6 2,5 2,2 1,3 1,8 1,6 3,8 3,1 1,6 4,9 1,8 3,9 3,4 1,6 4,5 5,8 6,9 1,8 2,6 6,8 2,5 1,9 3,1 10,8 1,6 2,0 4,9 11,2 1,6 2,2 3,8 1,1 1,8 1,4 Otestujte čistým testem významnosti, zda lze časové odstupy mezi vozidly považovat za náhodnou veličinu s normálním rozdělením. (viz prezentace z přednášky http://homel.vsb.cz/~lit40/sta1/materialy/testy_dobre_shody.pdf) Odhad parametrů normálního rozdělení: Počet stupňů volnosti: Martina Litschmannová 6

5) Na základě datového souboru experimentovani-s-telem.xls (Dudová, J. Experimentování s tělem (výsledky průzkumu), 2013. Dostupné online na http://experimentovani-stelem.vyplnto.cz) rozhodněte, zda existuje souvislost mezi pohlavím respondentů a tím, zda mají tetování. Pro posouzení míry kontingence použijte Cramerovo V. Populace: Předpoklad pro použití metod statistické indukce: Vizuální posouzení: Míra kontingence: 6) Pro diferencovaný přístup v personální politice potřebuje vedení podniku vědět, zda spokojenost v práci závisí na tom, jedná-li se o pražský závod či závody mimopražské. Výsledky šetření jsou v následující tabulce. Zobrazte data pomocí mozaikového grafu a na základě testu nezávislosti v kombinační tabulce rozhodněte o závislosti spokojenosti v zaměstnání na umístnění podniku. Pro posouzení míry kontingence použijte Cramerovo V. Stupeň spokojenosti Místo Praha Venkov Velmi spokojen 15 40 Spíše spokojen 50 130 Spíše nespokojen 25 10 Velmi nespokojen 10 20 Martina Litschmannová 7

Vizuální posouzení (pozor na způsob zadání dat do Statgraphicsu nezávisle proměnná (příčina) řádková, závisle proměnná varianty jsou identifikátory sloupců + seřazení ordinální proměnné je nutno provést ručně při zadávání analýzy) : Míra kontingence: 7) V letech 1965 až 1968 bylo v kohortové studii kardiovaskulárních onemocnění v rámci "Honolulu Heart Program" zahájeno sledování 8006 mužů, z nichž 7872 nemělo při zahájení studie v anamnéze mrtvici (apoplexii). Z tohoto počtu bylo 3435 kuřáků a 4437 nekuřáků. Při jejich sledování po dobu 12 let dostalo mrtvici 171 mužů ve skupině kuřáků a 117 mužů ve skupině nekuřáků. (Zdroj: Malý, M., Zvárová, M.,Statistické metody v epidemiologii, Praha, 2003, ISBN: 8024607654) a) Zapište zjištěné výsledky do asociační tabulky. b) Na základě vizuálního posouzení odhadněte vliv kouření na výskyt kardiovaskulárních onemocnění. c) Určete absolutní riziko vzniku kardiovaskulárních onemocnění u kuřáků a nekuřáků. Martina Litschmannová 8

d) Určete relativní riziko (včetně 95% intervalového odhadu) vzniku kardiovaskulárních onemocnění u kuřáků a nekuřáků. Vysvětlete praktický význam zjištěných výsledků. e) Určete absolutní šance vzniku kardiovaskulárních onemocnění u kuřáků a nekuřáků. f) Určete relativní šanci (včetně 95% intervalového odhadu) vzniku kardiovaskulárních onemocnění u kuřáků a nekuřáků. Vysvětlete praktický význam zjištěných výsledků. g) Rozhodněte na hladině významnosti 0,05 o závislosti výskytu kardiovaskulárních chorob na kouření. Martina Litschmannová 9