McNemarův test, Stuartův test, Test symetrie

Podobné dokumenty
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

12. cvičení z PST. 20. prosince 2017

Přednáška X. Testování hypotéz o kvantitativních proměnných

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Poznámky k předmětu Aplikovaná statistika, 11. téma

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testy. Pavel Provinský. 19. listopadu 2013

Základy biostatistiky (MD710P09) ak. rok 2008/2009

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Základy biostatistiky (MD710P09) ak. rok 2007/2008

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Testování hypotéz o kvalitativních proměnných

Jana Vránová, 3. lékařská fakulta UK

Fisherův exaktní test

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

4ST201 STATISTIKA CVIČENÍ Č. 7

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

15. T e s t o v á n í h y p o t é z

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

2 ) 4, Φ 1 (1 0,005)

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

15. T e s t o v á n í h y p o t é z

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

5. T e s t o v á n í h y p o t é z

= = 2368

Jednofaktorová analýza rozptylu

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Statistické metody uţívané při ověřování platnosti hypotéz

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

1.1 Úvod Data Statistická analýza dotazníkových dat 8. Literatura 10

Statistické testování hypotéz II

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

You created this PDF from an application that is not licensed to print to novapdf printer (

KGG/STG Statistika pro geografy

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Příklady na testy hypotéz o parametrech normálního rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Tomáš Karel LS 2012/2013

Testy dobré shody TESTY DOBRÉ SHODY (angl. goodness-of-fit tests), : veličiny X, Y jsou nezávislé nij eij

ANALÝZA A KLASIFIKACE DAT

Testování statistických hypotéz

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

ANALÝZA ZÁVISLOSTI. Martina Litschmannová

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Kontingenční tabulky, korelační koeficienty

Testování hypotéz. 4. přednáška

Aproximace binomického rozdělení normálním

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Kontingenční tabulky. (Analýza kategoriálních dat)

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

1 Rozptyl a kovariance

PRAVDĚPODOBNOST A STATISTIKA

Cvičení ze statistiky - 8. Filip Děchtěrenko

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Kontingenční tabulky a testy shody

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

NMAI059 Pravděpodobnost a statistika

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Přijímací zkouška na navazující magisterské studium 2017

Úvod do analýzy rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Normální (Gaussovo) rozdělení

Tomáš Karel LS 2012/2013

KGG/STG Statistika pro geografy

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Výběrové charakteristiky a jejich rozdělení

Příklad: Test nezávislosti kategoriálních znaků

Pravděpodobnost a aplikovaná statistika

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Transkript:

Tereza Burgetová McNemarův test, Stuartův test, Test symetrie 11. prosince 2017

McNemarův test - motivace Analýza kontingenčních tabulek, kdy není cílem provést klasický test nezávislosti. Příklad: Před CT vyšetřením musí být pacienti ze zákona obeznámeni s riziky vyšetření (např. možné komplikace po vpichu kontrastní látky) a podepsat informovaný souhlas. Pacienti byli před vyšetřením dotázáni, na obavy z účinků vyšetření (VFN Praha, 2017). Po podepsání informovaného souhlasu a krátkého pohovoru s vyšetřujícím lékařem byli dotázáni znovu. Obavy po Obavy před Ano Ne Celkem Ano 45 18 63 Ne 148 52 200 Celkem 79 184 263 Tabulka: Obavy pacientů z účinků CT vyšetření 2 McNemarův test, Stuartův test, Test symetrie

McNemarův test - motivace Obavy po Obavy před Ano Ne Celkem Ano 45 18 63 Ne 148 52 200 Celkem 79 184 263 Tabulka: Obavy pacientů z účinků CT vyšetření Změnilo podepisování informovaného souhlasu míru obav z vyšetření u pacientů? Obdoba párového t-testu u veličiny s diskrétním rozdělením. 3 McNemarův test, Stuartův test, Test symetrie

McNemarův test Na souboru n náhodně vybraných objektů se sleduje přítomnost či nepřítomnost nějakého znaku. U celého souboru se poté provede nějaký zákrok a znovu se u každého objektu vyšetří přítomnost či nepřítomnost sledovaného znaku. před po zásahu zásahem 1 0 celkem 1 n 11 n 12 n 1+ 0 n 21 n 22 n 2+ celkem n +1 n +2 n Změnil zákrok pravděpodobnost výskytu znaku? 4 McNemarův test, Stuartův test, Test symetrie

McNemarův test test tzv. shody marginálních pravděpodobností po zásahu před zásahem 1 0 celkem 1 p 11 p 12 p 1+ 0 p 21 p 22 p 2+ celkem p +1 p +2 1 Tabulka: Pravděpodobnosti pro McNemarův test H 0 : p 1+ = p +1 (změna výskytu znaku je náhodná) H A : p 1+ p +1 5 McNemarův test, Stuartův test, Test symetrie

McNemarův test H 0 : p 1+ = p +1 je ekvivalentní hypotéze H 0 : p 12 = p 21 Testová statistika (za platnosti H 0 ): χ 2 = (n 12 n 21 ) 2 n 12 + n 21 as. χ 2 1 Dá se použít již při n 12 + n 21 8. Při malých četnostech použijeme, že je za H 0 podmíněné rozdělení n 12 při daných n 11 a n 22 binomické: Bi(n 12 + n 21, 1 2 ). 6 McNemarův test, Stuartův test, Test symetrie

Příklad Obavy po Obavy před Ano Ne Celkem Ano 45 18 63 Ne 148 52 200 Celkem 79 184 263 Tabulka: Obavy pacientů z účinků CT vyšetření H 0 : Podepisování informovaného souhlasu nemá vliv na obavy z vyšetření u pacientů Testová statistika je rovna χ 2 = (n 12 n 21 ) 2 (18 148)2 = n 12 + n 21 18 + 148 = 101,81. Hodnota je větší než χ 2 1 (0,05) = 3,84. Zamítáme hypotézu, že podepisovásní souhlasu nemá vliv na míru obav pacientů před vyšetřením. 7 McNemarův test, Stuartův test, Test symetrie

Stuartův test také Test homogenity marginálních pravděpodobností zobecnění McNemarova testu pro více než 2 kategorie testujeme hypotézu H 0 : p 1+ = p +1,, p c+ = p +c Definujme d i = n i+ n +i, pro i = 1,..., c, d = (d 1,..., d c 1 ) T. Potom platí Ed i = n(p i+ p +i ) vard i = n[p i+ + p +i 2p ii (p i+ p +i ) 2 ] cov(d i, d j ) = n[p ij + p ji + (p i+ p +i )(p j+ p +j )] i j 8 McNemarův test, Stuartův test, Test symetrie

Stuartův test Dále definujme matici V = (V ij ) (c 1) (c 1) : V ii = n i+ + n +i 2n ii, V ij = (n ij + n ji ), i j Věta (Stuart, 1955) Platí-li H 0, pak má veličina Q = d T V 1 d asymptoticky χ 2 c 1 rozdělení. 9 McNemarův test, Stuartův test, Test symetrie

Stuartův test - příklad Agresti & Winner (1997) Evaluating agreement and disagreement among movie reviewers. Data jsou z období od dubna 1995 do září 1996 a představují hodnocení dvou filmových kritiků celkem 160 různých filmů. Ebert Siskel - 0 + Celkem - 24 8 13 45 0 8 13 11 32 + 10 9 64 83 Celkem 42 30 88 160 Tabulka: Hodnocení dvou filmových kritiků 10 McNemarův test, Stuartův test, Test symetrie

Stuartův test - příklad Veličina Q = d T V 1 d je rovna 0,59. Hodnota je nižší než χ 2 2 (0,05) = 7,81 = nezamítáme hypotézu shody marginálních pravděpodobností Pravděpodobnostní rozdělení hodnocení filmů je stejné u obou kritiků. 11 McNemarův test, Stuartův test, Test symetrie

Test symetrie Mějme kontingenční tabulku c c. Testujeme hypotézu symetrie H 0 : p ij = p ji pro všechny dvojice (i, j). Pokud c = 2, jedná se o McNemarův test. Pokud platí H 0, musí platit i p +i = p i+, což je nulová hypotéza u Stuartova testu shody marginálních pravděpodobností. 12 McNemarův test, Stuartův test, Test symetrie

Test symetrie Analogicky jako u McNemarova testu, testová statistika je: χ 2 = i<j (n ij n ji ) 2 n ij + n ji as. χ 2 c(c 1)/2 Neznáme parametry v matici pravděpodobností za platnosti H 0 : prvky ležící na diagonále a nad ní (kromě p cc ), t.j. neznámých parametrů je 2 + 3 + + c = c(c + 1)/2 1 = c 2 1 c(c + 1)/2 + 1 = c(c 1)/2 stupňů volnosti 13 McNemarův test, Stuartův test, Test symetrie

Test symetrie - příklad F. Galton zjistil v 1000 případech barvy očí otce a jeho syna 1 - světle modrá 2 - modrozelená nebo šedá 3 - tmavě šedá nebo světle hnědá 4 - tmavě hnědá Barva očí otce Barva očí syna 1 2 3 4 Celkem 1 194 70 41 30 335 2 83 124 41 36 284 3 25 34 55 23 137 4 6 36 43 109 244 Celkem 358 264 180 198 1000 Tabulka: Barva očí otců a synů (Yule a Kendall 1950) 14 McNemarův test, Stuartův test, Test symetrie

Test symetrie - příklad výpočtem podle vzorce dostaneme χ 2 = 19,56 χ 2 = i<j (n ij n ji ) 2 n ij + n ji χ 2 6 (0,05) = 12,59 = zamítáme hypotézu symetrie alespoň pro jednu dvojici (i, j) platí P(otec má barvu očí i,syn má barvu očí j ) P(otec má barvu očí j,syn má barvu očí i) 15 McNemarův test, Stuartův test, Test symetrie

Stuartův test - stejný příklad Barva očí otce Barva očí syna 1 2 3 4 Celkem 1 194 70 41 30 335 2 83 124 41 36 284 3 25 34 55 23 137 4 6 36 43 109 244 Celkem 358 264 180 198 1000 Tabulka: Barva očí otců a synů (Yule a Kendall 1950) Veličina Q = d T V 1 d = 15,77 překračuje kritickou hodnotu χ 2 3 (0,05) = 7,81 = zamítneme hypotézu homogenity marginálních pravděpodobností synové mají jiné pravděpodobnostní rozdělení barvy očí než otcové 16 McNemarův test, Stuartův test, Test symetrie

Zdroje Agresti & Winner (1997) Evaluating agreement and disagreement among movie reviewers. Chance, 10, 10 14. Anděl, J.: Statistické metody. Matfyzpress, Praha, 2007. Bowker, A. H. (1948). A test for symmetry in contingency tables. Journal of the American Statistical Association, 43(244), 572 574. Stuart, A. (1955). A test for homogeneity of the marginal distributions in a two-way classification. Biometrika, 42(3/4), 412 416. 17 McNemarův test, Stuartův test, Test symetrie