NEPARAMETRICKÉ METODY

Podobné dokumenty
ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Pravděpodobnost a aplikovaná statistika

8. cvičení 4ST201-řešení

Testování statistických hypotéz

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

8. Analýza rozptylu.

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Pravděpodobnost a aplikovaná statistika

3. Charakteristiky a parametry náhodných veličin

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

12. N á h o d n ý v ý b ě r

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

8. Odhady parametrů rozdělení pravděpodobnosti

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Národní informační středisko pro podporu kvality

Intervalové odhady parametrů některých rozdělení.

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Náhodný výběr 1. Náhodný výběr

V. Normální rozdělení

Kapitola 6. : Neparametrické testy o mediánech

Deskriptivní statistika 1

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Odhady parametrů 1. Odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Neparametrické metody

Pravděpodobnost a aplikovaná statistika

Kvantily. Problems on statistics.nb 1

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

STATISTIKA. Základní pojmy

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Testování statistických hypotéz

17. Statistické hypotézy parametrické testy

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

8.1.2 Vzorec pro n-tý člen

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

7. Odhady populačních průměrů a ostatních parametrů populace

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

Doc. Ing. Dagmar Blatná, CSc.

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Intervalové odhady parametrů

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Národní informační středisko pro podporu jakosti

SP2 Korelační analýza. Korelační analýza. Libor Žák

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

8.1.2 Vzorec pro n-tý člen

S k l á d á n í s i l

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

P2: Statistické zpracování dat

Číselné charakteristiky náhodných veličin

Neparametrické metody

Popisná statistika. Zdeněk Janák 9. prosince 2007

4. B o d o v é o d h a d y p a r a m e t r ů

Lineární regrese ( ) 2

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

a další charakteristikou je četnost výběrového souboru n.

PRAVDĚPODOBNOST A STATISTIKA

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Teorie chyb a vyrovnávací počet. Obsah:

2. Náhodná veličina. je konečná nebo spočetná množina;

Metody zkoumání závislosti numerických proměnných

vají statistické metody v biomedicíně

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

14. B o d o v é o d h a d y p a r a m e t r ů

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

12. Neparametrické hypotézy

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

13 Popisná statistika

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

VaR analýza citlivosti, korekce

Testování hypotéz. December 10, 2008

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Michaela Kurková. Katedra pravděpodobnosti a matematické statistiky

Přednáška č. 2 náhodné veličiny

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

5. Lineární diferenciální rovnice n-tého řádu

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

Statistické charakteristiky (míry)

7. cvičení 4ST201-řešení

MATICOVÉ HRY MATICOVÝCH HER

Transkript:

NEPARAMETRICKÉ METODY Jsou to metody, dy předmětem testu hypotézy eí tvrzeí o hodotě parametru ějaého orétího rozděleí, ale ulová hypotéza je formulováa obecěji, apř. jao shoda rozděleí ebo ezávislost veliči. Na rozdíl od parametricých metod, terými testujeme hypotézy o parametrech ormálího rozděleí a testovaé soubory musí splňovat přepolad ormality, eparametricé metody můžeme použít bez utosti splěí předpoladů ormality. Ta silý předpolad totiž při praticých apliacích ebývá často splě a proto je lepší zvolit ěterou eparametricou metodu, terá vycházejí z pořadí pozorovaých hodot v jejich vzestupém uspořádáí. Poud se ulová hypotéza týá mediáu rozděleí, eparametricé metody jsou velmi vhodé a dooce mají proti parametricým i řadu výhod.

Obecě vša platí, že tyto výhody jsou vyvážey evýhodou ve srováí s testy parametricými jsou eparametricé testy slabší, tz. že pravděpodobost zamítutí ulové hypotézy v situaci, dy eplatí, je meší. Proto by eparametricé testy měly být užíváy je tehdy, dyž předpolady pro parametricé testy splěy ejsou. Shrutí: Neparametricé testy můžeme použít i v případě, že ezáme rozložeí áhodé veličiy jsou uiverzálější. Ale mají meší statisticou účiost, tj. schopost rozpozat i malé odchyly od ulové hypotézy. Výpočetě jsou jedodušší a rychlejší. Obvyle vyžadují větší počet pozorováí ež parametricé.

JEDNOVÝBĚROVÝ ZNAMÉNKOVÝ (MEDIÁNOVÝ) TEST Nejjedodušším testem pro jede výběr je zaméový test:. uvažujme výběr ze spojitého rozděleí (emusí být symetricé). testujeme ulovou hypotézu, že mediá tohoto rozděleí x 0 proti jedostraé alterativě, že mediá tohoto rozděleí > x 0, de x 0 je předem daá hodota. Zaméový test je založe a pricipu sledováí proceta aměřeých hodot meších, ež hodota, se terou soubor porováváme. Test zjistí, zda se toto proceto statisticy výzamě liší od 50% - proto mediáový test. POSTUP:. Utvoříme rozdíly hodot veličiy X a daé hodoty x 0 : X x 0, X x 0,..., X x 0.. Náhodá veličia Z pa bude ozačovat počet těch rozdílů, teré mají ladé zaméo, tj. testovou statistiou Z je počet hodot, splňujících podmíu, že x i > x 0.

Tabula riticých hodot a pro zaméový test α 0,05 α 0,0 α 0,05 α 0,0 N N 6 0 6 - - 5 6 4 7 7 0 7 - - 5 7 4 8 8 0 8 0 8 3 6 7 4 9 9 8 0 9 4 6 8 5 9 0 9 0 0 5 7 8 5 0 9 0 6 7 9 6 0 0 7 7 0 6 3 8 8 0 6 4 3 9 8 7 5 3 3 30 9 7 3 6 3 3 4 3 9 7 4 7 4 3 5 3 9 3 8 4 8 4 4 3 5 33 0 3 8 5 9 4 5 3 6 34 0 4 9 5 0 5 5 3 7 35 4 9 6 V případě malého rozsahu výběru (tj. pro malá ) jsou tabelováa čísla, ta, že α P( Z ), P( Z ) α Kriticé hodoty, je možé alézt v tabulce. Hypotézu H 0 tedy zamítáme, jestliže zjistíme, že Y ebo Y. Přílad a Zaméový test alezete v souboru 6a_prilad_eparametrice_testy.xlsx

) ( p Z E Za předpoladu platosti hypotézy H 0 má áhodá velicia Z biomicé rozděleí, Z ~ Bi(, p), de hodota parametru p 0,5 (z defiice mediáu), je rozsah výběru. Při oboustraém testu tvoří riticý obor jeda příliš malé hodoty Z (tj. hodoty ležící blízo ule), jeda příliš velé hodoty Z (tj. hodoty blízé ). Pravděpodobost P(Z z) α lze spočítat jao z z z Z P ) ( Z vlastostí biomicého rozděleí můžeme určit za platosti ulové hypotézy středí hodotu a rozptyl testové statistiy 4 ) ( ) var( p p Z

Pro větší rozsahy výběru je možo použít aproximaci rozložeí testovací statistiy pomocí ormálího rozložeí. Náhodá veličia pa má přibližě ormovaé ormálí rozděleí N (0, ) Z Z U Platí to přibližě pro větší ež 0. 4 Zaméový test bývá velmi často užívá jao test párový, dy máme dva závislé výběry ze spojitých dat, tz. dvě pozorováí pro aždý objet a testujeme hypotézu, že mediáy obou veliči jsou shodé, většiou proti hypotéze, že mediá druhého výběru (měřeí) je větší (meší) ež prvího výběru (měřeí). Jedá se apř. o posouzeí, zda došlo e změě v čase apod. (sížeí váhy ebo jiých uazatelů po úpravě stravy, cvičeí, zlepšeí výou).

JEDNOVÝBĚROVÝ WILCOXONŮV TEST Wicoxoův test je silější ež zaméové (sáz odhalí statisticy výzamé rozdíly). Použijeme ho především v případech, dy rozsah výběru je malý a veličia emá ormálí rozděleí. Teto test pracuje s pořadím aměřeých hodot. Seřadíme bez ohledu a zaméo odchyly od "ormy" a budeme se ptát, zda se statisticy výzamě liší průměré pořadí odchyle v ladém a záporém smyslu. Postup:. vypočteme absolutí odchyly d i x i µ. seřadíme tyto odchyly podle veliosti a ozačíme r i pořadí hodot d i 3. R + R ozačíme součet všech hodot, pro terá je + r i a R - součet všech hodot, pro terá je R x i r i < µ x i µ

4. meší z obou hodot porováme s riticou hodotou Wilcoxoova testu 5. H0 zamítáme, poud je Z < tabelovaá riticá hodota Wilcoxoova testu Pro větší eí toto rozděleí tabelováo, proto vypočteme testovací statistiu W R 4 + ( + ) 4 ( + )( + ) a použijeme aproximaci rozložeí testovací statistiy ormálím rozložeím. Přílad a Wicoxoův test alezete v souboru prilady_eparametrice_testy.xlsx

DVOUVÝBĚROVÝ ZNAMÉNKOVÝ TEST eboli MEDIÁNOVÝ TEST Nejprve vypočteme mediá pozorováí z obou supi spojeých dohromady. Testovací statistia S je pa počet pozorováí z prvího výběru, terá jsou větší, ež společý mediá. Pro test využijeme to, že statistia S má hypergeometricé rozložeí. DVOUVÝBĚROVÝ WILCOXONŮV TEST Opět spojíme oba soubory a e aždému pozorováí vypočteme pořadí v tomto společém souboru. Sečteme všechy pořadová čísla pozorováí, terá byla v prvím souboru a ozačíme je R +.

Pro meší rozsahy výběrů porováme R + s riticými hodotami dvouvýběrového Wicoxoova testu Pro větší rozsahy použijeme aproximaci pomocí ormálího rozložeí ta, že vypočteme testovací statistiu W x R + y ( x x + y y + ), terá má ormálí rozděleí a pa stačí zjistit, zda W < u α Většia programů, teré v abízí teto test, vypočte i dosažeou hladiu výzamosti (p-hodotu).