Testy pro více veli in

Podobné dokumenty
1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Vektor náhodných veli in - práce s více prom nnými

P íklad 1 (Náhodná veli ina)

na za átku se denuje náhodná veli ina

T i hlavní v ty pravd podobnosti

P íklady k prvnímu testu - Pravd podobnost

e²ení systém lineárních rovnic pomocí s ítací, dosazovací a srovnávací metody

Jevy, nezávislost, Bayesova v ta

Pravd podobnost a statistika - cvi ení. Simona Domesová místnost: RA310 (budova CPIT) web:

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Integrování jako opak derivování

Vektory. Vektorové veli iny

Limity funkcí v nevlastních bodech. Obsah

Skalární sou in. Úvod. Denice skalárního sou inu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Regrese a nelineární regrese

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

DUM 07 téma: P edepisování tolerancí

Binární operace. Úvod. Pomocný text

Pr b h funkce I. Obsah. Maxima a minima funkce

Cvi ení 7. Docházka a testík - 15 min. Distfun 10 min. Úloha 1

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Seminá e. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, sem. 1-13

Jednofaktorová analýza rozptylu

Statistika pro geografy. Rozd lení etností DEPARTMENT OF GEOGRAPHY

ST2 - Cvi ení 1 STATISTICKÁ INDUKCE

Výzva pro předložení nabídek k veřejné zakázce malého rozsahu s názvem Výměna lina

Jednostranné intervaly spolehlivosti

Práce s daty. 2. února Do tohoto adresá e stáhn te ze stránek soubory data.dat a Nacti_data.sci.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Věc: Výzva pro předložení nabídek k veřejné zakázce s názvem: VÚ a ŠJ PŠOV, Nákup nového osmimístného vozidla

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Novinky verzí SKLADNÍK 4.24 a 4.25

Cvičení 9: Neparametrické úlohy o mediánech

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

3 D leºitá rozd lení náhodné veli iny

BOZP - akcepta ní testy

ST2 - Cvi ení 1 STATISTICKÁ INDUKCE

Ergodické Markovské et zce

Statistika ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ. Jiří Volf, Adam Kratochvíl, Kateřina Žáková. Semestrální práce - 0 -

Rovnice a nerovnice. Posloupnosti.

Konceptuální modelování

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Návod na vypracování semestrálního projektu

Vydání občanského průkazu

Úvod do analýzy rozptylu

6 TESTY HYPOTÉZ NEPARAMETRICKÉ TESTY

2. Ur íme sudost/lichost funkce a pr se íky s osami. 6. Na záv r na rtneme graf vy²et ované funkce. 8x. x 2 +4

SOUTĚŽNÍ ŘÁD soutěží ČSOB v orientačním běhu

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

VÝZVA. Česká republika-ministerstvo školství, mládeže a tělovýchovy (dále jen zadavatel) se sídlem Karmelitská 7, Praha 1, IČ

Státní maturita 2010 Maturitní generálka 2010 Matematika: didaktický test - základní úrove obtíºnosti MAGZD10C0T01 e²ené p íklady


I. Objemové tíhy, vlastní tíha a užitná zatížení pozemních staveb

Přednáška X. Testování hypotéz o kvantitativních proměnných

Základní prvky a všeobecná lyžařská průprava

KGG/STG Statistika pro geografy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ízení Tvorba kritéria 2. prosince 2014

KGG/STG Statistika pro geografy

N á v r h VYHLÁŠKA. ze dne 2007, o zdokonalování odborné způsobilosti k řízení motorových vozidel

Zeptali jsme se 10 osob, kolik minut provolají měsíčně s rodinou a jejich odpovědi jsme zaznamenali do tabulky:

IP kamerový systém Catr - uºivatelský návod k obsluze

Zápo tová písemná práce. 1 z p edm tu 01MAB3 varianta A

15. T e s t o v á n í h y p o t é z

Mateřská škola, základní škola a střední škola pro sluchově postižené Valašské Meziříčí, Vsetínská 454

2.2.2 Zlomky I. Předpoklady:

Průzkum dopravy v ulicích Pod Vinohrady a Havlíčkova

ST1 - Úkol 1. [Minimáln 74 K /láhev]

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Text m ºe být postupn upravován a dopl ován. Datum poslední úpravy najdete u odkazu na staºení souboru. Veronika Sobotíková

1. DÁLNIČNÍ A SILNIČNÍ SÍŤ V OKRESECH ČR

Testy. Pavel Provinský. 19. listopadu 2013

POKYNY. k vyplnění přiznání k dani z příjmů fyzických osob za zdaňovací období (kalendářní rok) 2012

Příprava na 1. čtvrtletní písemku pro třídu 1EB

Domácí úkol 2. Obecné pokyny. Dbejte na formáln správný zápis výpo tu! Pro vy íslení výsledku pro binomické rozd lení pouºijte nap. Maple nebo Matlab.

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

MINISTERSTVO FINANCÍ. Odbor 45 Realizace ekologických závazků vzniklých při privatizaci Ing. Radmila Musilová vedoucí oddělení 4501

170/2010 Sb. VYHLÁŠKA. ze dne 21. května 2010

4.5.1 Magnety, magnetické pole

Slovní úlohy vedoucí na lineární rovnice I

KRAJSKÝ ÚŘAD JIHOMORAVSKÉHO KRAJE Odbor dopravy Žerotínovo náměstí 3/5, Brno

c sin Příklad 2 : v trojúhelníku ABC platí : a = 11,6 dm, c = 9 dm, α = Vypočtěte stranu b a zbývající úhly.

e²ení 1. série Úvodní gulá²

VYBRANÉ ASPEKTY PÉČE O SENIORY

Zadávací dokumentace

Jihočeský vodárenský svaz S. K. Neumanna 19, České Budějovice

vod slova statistika

STATISTICA Téma 7. Testy na základě více než 2 výběrů

(a + b)(a b) 0 mod N.

1 Spo jité náhodné veli iny

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz

Pro získání zápočtu je nutno mimo docházky (max. 3 absence) získat ze dvou napsaných písemek dohromady alespoň dva příklady.

Metodika kontroly naplněnosti pracovních míst

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Vyhláška č. 294/2015 Sb., kterou se provádějí pravidla provozu na pozemních komunikacích

Transkript:

Kapitola 8 Testy pro více veli in 8.1 Testy parametr s více výb ry s p edpokladem normality dat 8.1.1 Testy s dv ma výb ry. P edpoklady: Pro spojité rozd lení normalita nebo velký výb r. Pro diskrétní np a n (1 p) je v t²í nebo rovno 5. U dvou výb r se testuje shoda parametr nebo celých soubor. Shoda: µ 1 µ 2 = 0 µ 1 = µ 2. Pokud se p edpokládá shoda rozptyl, pak shoda st edních hodnot je totoºná se shodou celých soubor. test dvou st edních hodnot (nezávislý, párový) t-test P. V jazykové ²kole existuje dvouletý kurz angli tiny. kola tvrdí, (1) ºe první ro ník má lep²í výsledky v testech (nezávislé). (2) ºe studenti se v druhém ro níku zhor²í (párové). test podílu dvou rozptyl F rozd lení P. Dva sportovní oddíly testují spolehlivost výkonu svých len. Vedoucí st ediska íká, ºe oba oddíly jsou stejn spolehlivé (ve stabilit výkon ). Testujte. test rozdílu podíl (diskrétní alternativní 0, 1) z-test (approx.) P. (1) Policie tvrdí, ºe v jisté ulici jen 10% idi p ekra uje povolenou rychlost. (2) íká se, ºe na dálnicí p í výjezdu z Prahy je men²í podíl idi p ekra ujících povolenou rychlost neº na vjezdu. Postup testování 1. Rozhodneme, zda jde o IS nebo TH. 2. O jaký jde parametr - µ je pr m r, σ 2 - variabilita. Podíl π je ást z celku. 3. Kolik je výb r - tady dva nebo více. 1

KAPITOLA 8. TESTY PRO VÍCE VELIƒIN 2 4. Dv µ - nezávislý nebo párový test. 5. Sm r testu: levo, obou, pravo - obtíºné u levo, pravo pro 2 výb ry. 6. P-hodnota - pravd podobnost pro H0. 7. Interpretace: Co je H0? Podle p-hodnoty je záv r. Praktická interpretace!!! 8.2 Testy parametr s více výb ry bez p edpokladu normality dat 8.2.1 Testy s dv ma výb ry Alternativa k nezávislému t-testu o dvou st edních hodnotách Mann-Whitney v test P edpoklad: Dva nezávislé výb ry. Test shody medián dvou soubor (nebo shody soubor z nichº pocházejí výb ry). P. Dva léka i doporu ují lé it nastydnutí odli²nými metodami. Testujte, zda mají shodné výsledky. (výb ry mohou být r zn dlouhé) Metoda: Máme výb ry x a y, tak, ºe délka prvního n x je v t²í nebo rovna délce druhého n y. Výb ry spojíme [x, y] a vzestupn p i adíme po adí. Se teme hodnoty po adí pro x a y a ozna íme T x a T y. Vypo teme Statistika je U x = n x n y + n x (n x + 1) 2 a kritické hodnoty jsou ve speciální tabulce. T x a U y = n x n y + n y (n y + 1) 2 T = min {U x, U y } Pro výb ry del²í neº 30 lze pouºít normální aproximaci T = min {U x, U y } nxny 2 1 12 n xn y (n x + n y + 1) H0: mediány (soubory) jsou stejné. Test je oboustranný (=, ) T y Alternativa k párovému t-testu o st ední hodnot test mediánu (znaménkový test) P edpoklady: Jeden výb r nebo 2 párové výb ry. Testujeme hodnotu medián ze dvou výb r. Vezmeme diference odpovídajících si hodnot výb r a testujeme na nulu. P. Testujte, zda jeleni a my²i mají stejn dlouhé p ední nohy. Metoda: Spo teme diference hodnot výb r. Dále jako pro jeden výb r.

KAPITOLA 8. TESTY PRO VÍCE VELIƒIN 3 Wilcoxon v test P edpoklady: Bu jako jednovýb rový nebo pro dva párové výb ry, kde je alespo 5 nenulových diferencí kladných i záporných. Je to neparametrická paralela k dvou výb rovému párovému testu st edních hodnot. P. Ve sportovním klubu byl osmi sportovc m zm en výkon (délka hodu o²t pem). Poté byli sportovci podrobeni intenzivnímu tréningu a druhý den byli znovu testováni. Trenér je p esv d en, ºe jeden den odpo inku nesta í a ºe výkony budou po tréningu hor²í. Testujte. Metoda: Spo teme diference D = x1 x2 a zapamatujeme si znaménka s = sign (D). Dále jako pro jeden výb r. Porovnání hodnot výb ru p ed a po ur ité akci. McNemar v test P edpoklady: Párové výb ry. Binární (nominální) data. Testuje efekt ur itého zákroku. P. Testujeme vliv nového léku na výskyt ur itého symptomu. U vybraných pacient zjistíme p ítomnost symptomu, potom jim podáme lék a po ur ité dob znovu zji² ujeme p ítomnost symptomu znova. Metoda: Vstupem je kontingen ní tabulka p ed \ po 0 1 0 n 00 n 01 1 n 10 n 11 kde n ji jsou p íslu²ní etnosti pro situace (0, 0), (0, 1), (1, 0), (1, 1). Ve skute nosti nás zajímají jen prvky n 01 a n 10. Tyto prvky vypovídají o zm n nebyl-je a byl-není. Statistika T = (n 01 n 10 ) 2 n 01 + n 10 χ 2 (1). H0: ºádná zm na (n 01 = n 10 ). Test je pravostranný. 8.2.2 Testy s více výb ry (ANOVA) Jeden faktor Jednofaktorová anova P edpoklady: Normalita, nezávislé výb ry, stejné rozptyly v²ech t íd. Testuje, zda n kolik soubor ze kterých jsme po ídili výb ry jsou shodné. P. Testujeme výkon motorek p ti r zných zna ek. Kaºdá z nich projede n kolikrát testovací okruh a my m íme as. Zm ené asy se adíme do sloupc tabulky shodu testujeme pomocí testu Anova. Metoda: Ur íme pr m ry x i a rozptyly s 2 i v jednotlivých výb rech. Potom ur íme rozptyl s 2 mezi výb rovými pr m ry. Pr m r rozptyl s 2 i ur uje tzv. nevysv tlený rozptyl, protoºe

KAPITOLA 8. TESTY PRO VÍCE VELIƒIN 4 nevíme pro se ve výb rech hodnoty m ní. Rozptyl s 2 ur uje tzv. vysv tlený rozptyl - variabilitu výb rových pr m r m ºeme vysv tlit neshodou st edních hodnot v souborech. Statistika je F = vysv tlený r. F (po et t íd 1, po et dat 1) nevysv tlený r. H0: soubory jsou stejné. Test je pravostranný. Bartlett v test - testuje shodu rozptyl (pre-analýza) P edpoklady: Normalita dat. P. Chceme analyzovat data pomocí testu Anova, Kruskal-Wallis nebo Friedman. Tyto testy srovnávají rozd lení (st ední hodnotu, medián) n kolika soubor, ale vyºadují stejné rozptyly. Bartlett v test nám tuto informaci poskytne. Metoda: Máme k výb r o délkách n i a s výb rovými rozptyly Si 2. Statistika je χ 2 = (N k) ln ( ) Sp 2 k i=1 (n i 1) ln ( ) Si 2 ( k ) χ 2 (k 1) 1 + 1 1 3(k 1) i=1 n 1 i 1 N k kde N = n i a S 2 p = 1 N k k i=1 (n i 1) S 2 i. H0: rozptyly jsou stejné. Test je pravostranný. Scheého test testuje nezávislost po dvojicích (post-analýza) Pokud z anovy obdrºíme výsledek, ºe soubory nejsou shodné, asi nás bude zajímat, které soubory se konkretn odli²ují. To lze zjistit tak, ºe testujeme postupn shodu pro v²echny moºné dvojice soubor. To je moºno jednodu²e provést pomocí Scheého testu, který vyu- ºívá jiº spo tené charakteristiky z testu anova a porovnává shodu nebo rozdílnost medián jednotlivých soubor. Výsledkem je tabulka (soubory soubory) ve které jsou vyzna eny neshodné dvojice. Kruskal-Wallis v test P edpoklady: Nezávislé výb ry (mohou být r zn dlouhé) Testuje shodu více medián (soubor ). Je to neparametrická obdoba jednovýb rové anovy pro nenormální data a roz²í ení Mann-Whitneyova testu pro dva mediány. Nevyºaduje normalitu dat. P. Jako anova, ale bez poºadavku na normalitu. Metoda: Pracuje s tabulkou po adí, která se po ítají p es v²echna data. Statistika se po ítá z pr m r po adí t j sloupc tabulky (n je po et dat) p-hodnota T = 12 n (n + 1) H0: jsou stejné. Test je pravostranný. k t 2 j 3 (n + 1) χ 2 (k 1) j=1 pv = 1 F χ 2 (k 1) (T r )

KAPITOLA 8. TESTY PRO VÍCE VELIƒIN 5 Friedman v test P edpoklady: Závislé (blokové) výb ry 1, stejné rozptyly v²ech t íd. Testujeme shodu k soubor z blokového hodnocení, provád ného n hodnotiteli. Kaºdý hodnotitel se vyjád í postupn ke v²em soubor m (párové výb ry). P. T i kontrolo i hodnotí kvalitu p ti stánk s rychlým ob erstvením. Kaºdý kontrolor ohodnotí kaºdý stánek. Výsledkem je tabulka hodnocení, kde sloupce odpovídají soubor m a ádky (bloky) odpovídají hodnotitel m. Metoda. Z kaºdého souboru provedeme výb r o rozsahu n. Nap. máme p t pacient, kte í v lé ení postoupí n kolik zákrok. Po kaºdém zákroku zm íme hodnoty ur itého indikátoru. Zajímá nás, jestli lé ba probíhá u v²ech pacient stejn. Metoda: Vstupem je tabulka dat pacient\výb r 1 2 3 1 d 11 d 12 d 13 2 d 21 d 23 N d N1 d N,n Pro kaºdého pacienta (tj.- ádek tabulky) nahradíme hodnoty jejich po adím. Dostaneme tabulku po adí pacient\výb r V1 V2 V3 1 r 11 r 12 r 13 2 r 21 r 23 N r N1 r N,n R 1 R 2 R 3 kde R j = n i=1 r ij je sou et j-tého výb ru (tj. sloupce tabulky) Statistika (pro min {k, n} > 5) k T = 3n (k + 1) Rj 2 χ 2 (k 1) j=1 H0: Soubory jsou stejné. Test je pravostranný. Dva faktory Dvoufaktorová anova bez opakování P edpoklady: Normalita, stejné rozptyly v²ech t íd. P. Testujeme motorky pro jízdy provedené jednotlivými idi i. Testujeme shodu motorek a idi. Metoda: Jedná se o sou asn provedené dva testy anova se soubory v ve sloupcích a ádcích. Jak pro sloupce, tak i pro ádky se ur í vysv tlený rozptyl a nevysv tlený rozptyl je spole ný. Dostáváme dva samostatné výsledky testu, pro celkový záv r jsou ty i moºnosti: ano,ano, ano,ne, ne,ano, ne,ne. H0: ádky jsou stejné, sloupce jsou stejné. Statistika 2x F -test pravostranný. 1 Blok je faktor, mající vliv na data jehoº t íd ní nás nezajímá a jeho hodnoty jsou ve v²ech datových záznamech. Blíºe viz Dodatky.

KAPITOLA 8. TESTY PRO VÍCE VELIƒIN 6 Dvoufaktorová anova s opakováním Jako oby ejná dvouvýb rová, ale kaºdé polí ko tabulky obsahuje více m ení. P. Testujeme motorky a idi e a kaºdý idi jede n kolik jízd. Testuje se (1) shoda sloupc, (2) shoda ádk, (3) nezávislost ádk a sloupc. H0: jsou stejné, jsou nezávislé. Hlavní t íd ní test 1 výb r 2 výb ry více výb r S normalitou t-test t-test nez. Anova - nepárové t-test pár. - párové Bez normality Mann-Whitney Kruskal-Wallis - nepárové Wilcoxon Wilcoxon Friedman - párové