8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

Podobné dokumenty
8. cvičení 4ST201-řešení

NEPARAMETRICKÉ METODY

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Pravděpodobnost a aplikovaná statistika

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

3. Charakteristiky a parametry náhodných veličin

ZÁKLADY POPISNÉ STATISTIKY

Doc. Ing. Dagmar Blatná, CSc.

7. cvičení 4ST201-řešení

Národní informační středisko pro podporu kvality

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

8. Analýza rozptylu.

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

3. cvičení 4ST201. Míry variability

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

SP2 Korelační analýza. Korelační analýza. Libor Žák

n 3 lim 3 1 = lim Je vidět, že posloupnost je neklesající, tedy z Leibnize řada konverguje, ( 1) k 1 k=1

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Závislost slovních znaků

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

3. cvičení 4ST201 - řešení

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Statistika Statistická jednotka, statistický soubor a statistické znaky Poznámka. (Rozd lení etností jednoho kvantitativního statistického znaku)

Testování statistických hypotéz

Pravděpodobnostní model doby setrvání ministra školství ve funkci

7. Odhady populačních průměrů a ostatních parametrů populace

Testování hypotéz. December 10, 2008

Odhady parametrů 1. Odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Náhodný výběr 1. Náhodný výběr

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

V. Normální rozdělení

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

PRAVDĚPODOBNOST A STATISTIKA

Příklad: Test nezávislosti kategoriálních znaků

Neparametrické metody

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

PRAVDĚPODOBNOST A STATISTIKA

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

17. Statistické hypotézy parametrické testy

Pravděpodobnost a aplikovaná statistika

Přednáška č. 2 náhodné veličiny

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Intervalové odhady parametrů některých rozdělení.

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

8.2.1 Aritmetická posloupnost

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Statistická rozdělení

1. Základy počtu pravděpodobnosti:

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Neparametrické metody

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika


Test hypotézy o parametru π alternativního rozdělení příklad

0. 4b) 4) Je dán úhel Urči jeho základní velikost a převeď ji na radiány. 2b) Jasný Q Q ZK T D ZNÁMKA. 1. pololetí

Číselné charakteristiky náhodných veličin

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

14. B o d o v é o d h a d y p a r a m e t r ů

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

7 VYUŽITÍ METOD OPERAČNÍ ANALÝZY V TECHNOLOGII DOPRAVY

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

8.2.1 Aritmetická posloupnost I

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

vají statistické metody v biomedicíně

STATISTIKA. Základní pojmy

stavební obzor 1 2/

4. B o d o v é o d h a d y p a r a m e t r ů

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Lineární regrese ( ) 2

S k l á d á n í s i l

Mendelova univerzita v Brně Statistika projekt

8.1.2 Vzorec pro n-tý člen

ij m, velikosti n je tvořen (n m) rozměr-ným polem dat x x x 22 x n1 ... x n2 7.1 Druhy korelačních koeficientů

Statistika, Biostatistika pro kombinované studium. Jan Kracík

3.4.7 Můžeme ušetřit práci?

ANALÝZA SÍLY VYBRANÝCH KLASICKÝCH A ROBUSTNÍCH TESTŮ NORMALITY PROTI BIMODÁLNÍMU ROZDĚLENÍ

PRACOVNÍ SEŠIT KOMBINATORIKA, PRAVDĚPODOBNOST A STATISTIKA. 9. tematický okruh:

n-rozměrné normální rozdělení pravděpodobnosti

Transkript:

cvičící 8. cvičeí 4ST1 Obsah: Neparametricé testy Chí-vadrát test dobréshody Kotigečí tabuly Aalýza rozptylu (ANOVA) Vysoá šola eoomicá 1 VŠE urz 4ST1 Neparametricé testy Neparametricétesty využíváme, poud ezámerozděleízáladího souboru a přesto chceme porovávat(testovat) úrověhodot v souboru, testovat ezávislostsledovaých zaůči ověřit předpolado určitém typu rozděleí. Často se testue předpolad ormality záladího souboru. Nepoužívaěšítest ověřeípředpoladu o určitém typu rozděleí: Chí-vadrát test dobré schody. Nepoužívaěšítest o ezávislosti veliči v otigečítabulce: Chí-vadrát test ezávislosti Typ záladího souboru volíme a záladězušeostíči z grafu. Tato volba emusí být správá, proto testueme.

VŠE urz 4ST1 1. Chí-vadrát test dobré schody Ověřueme shodu předpoládaého (teoreticého) rozděleís apozorovaým rozděleím. Testueme hypotézu: oproti alterativě, že alespoň eda pravděpodobost e odlišá. Testovým ritérieme: H π π :, de _ 1,,... ( - * π ) * π 1,, terépři platosti H mározděleíx (-1). H zamítáme při hodotách X větších ež(1-α)*1% vatil rozděleíx (-1). Předpoladem správého použitítestu e, aby všechy teoreticéčetosti *π, byly většíež5. 3 VŠE urz 4ST1 Přílad 8.1.: Chí-vadrát test dobré shody Bylo sledováo5 áhoděvybraých mužůz ČR a byla sledováa eich tělesá výša. Posuďte a 5% hladiě výzamosti, zda výša mužů má ormálírozděleí. V íže uvedeétabulce sou sledovaéčetosti výšy mužů. Ve sledovaém souboru byla průměrávýša rova 17,1 cm a výběrovásměrodatáodchyla 8,7. Méěa 15 cm 15 cm 16 cm 55 16 cm 17 cm 194 17 cm 18 cm 143 18 cm 19 cm 68 Více ež19 cm V souboru 4st1_cv8_pomocy.xls adete pomůcu, a přílad řešit. 4

VŠE urz 4ST1. Kotigečí tabuly Chceme-li zistit zda mezi dvěmi valitativími (ategoriálími) proměýmiexistue závislost (vztah), uspořádáme si sdružeéčetosti do otigečí tabuly: ProměéB 1, B B S Jeich součet e Σ i, ao e Σ,* ProměéA 1, A A r Jeich součet e Σ i ao 367 84 651 e 168 181 349 Σ 535 465 1 *, 5 VŠE urz 4ST1 Kotigečí tabuly Poud máme za cíl zistit, zda mezi dvěmi valitativími (ategoriálími) proměými existue ěaý vztah, závislost, souvislost, můžeme použít chí-vadrát test ezávislosti. Testové ritérium: ' ( - ) r s de i * * i, o, i o, i ' i 1 1 o, i r -1 s Proázaá souvislost edoazue auzálí závislost. Sílu závislosti dvou ategoriálích proměých lze vyádřit pomocí * [( )( -1)] Pearsoova oeficietu: C + či Cramérova oeficietu: V ( m -1) de mmi(r,s) Pro zcela ezávisléveličiy e C a V rovo ule, poud e eda ategorie edozačě dáa ategoriídruhéproměée V1 a C ( -1)/ 6

VŠE urz 4ST1 Kotigečí tabula Přílad 8..: Chceme zistit, zda existue ěaásouvislost mezi tím, a lidéposlouchaírádio a tím, zda ezdílidév autě. Poud proážeme závislost, vyádříme eísílu pomocípearsoova otigečího oeficietu a Cramérova V. (pomůcu adete opět v souboru 4st1_cv8_pomocy.xls) Posloucháte před de rádio? ao e Σ Jezdíte autem? ao 367 84 651 e 168 181 349 Σ 535 465 1 7 VŠE urz 4ST1 Přílad 8.. - Nápověda i 11 367 i, 651 *535 1 348 ( i o, i ) ( ) - o, i 367-348 348 1,1 8

VŠE urz 4ST1 Přílad 8. v SASu 1. Data v souboru: data_cv8_t.sas7bdat. Describe Table Aalysis 3. Tas Role: 1. Table variable: ízda autem, rádio. Frequecy Cout: počet 4. Tables: Vytvořit tabulu: Rádio sloupce, ízda autem řády 5. Cell statistics 1. Cell frequecies, Expected cell frequecy, Cell cotributio to Pearso chi-square 6. Associatio: chi-square test 9 VŠE urz 4ST1 3. Aalýza rozptylu Poud chceme zistit souvislost mezi ěaou ategoriálía umericou proměou, používáme metodu ozačovaou aalýza rozptylu. Metoda vycházíz rozladu rozptylu(součtu čtvercových odchyle) a vitrosupiovou a mezisupiovou variabilitu. Je-li uvažovaá umericá proměá ezávislá a zmíěé ategoriálí proměé, tedy: H µ µ... : 1 má poměr těchto zdroů variability rozděleí F(-1,-). F 1 1 * ( x - x ) -1 * s - Při hodotách F, terépřeročípříslušý vatil F rozděleí, zamítáme testovaou hypotézu o tom, že ve všech supiách e steý průměr, eboť podíl mezisupiovévariability e přílišveliý. µ 1

VŠE urz 4ST1 Přílad 8.3.: Aalýza rozptylu Vrátíme se příladu ze začátu 3.cvičeí(přílad a rozlad rozptylu). Neboťužvíte, a teto přílad iterpretovat, sami si umíte spočítat mezisupiovou a vitrosupiovou variabilitu, bude se vám přílad dobře řešit. Zoumáme váhu že ve čtyřech věových ategoriích. Budeme chtít posoudit, zda váha že závisía věu či zda rozdíl mezi vahami v edotlivých ategoriích e bezvýzamý. Potřebá data sou v ásleduící tabulce (či v materiálech 3.cvičeí): Pomůcu adete opět v souboru 4st1_cv8_pomocy.xls 11 VŠE urz 4ST1 Přílad 8.3.- Nápověda F 1 * 1 ( x -x ) -1 * s - 1

VŠE urz 4ST1 Přílad 8.3. v SASu Na přílad emáme data. Je třeba mít soubor všecha pozorováí. Postup v SASu: Aalyze Oe Way ANOVA Depedet variable: umericá proměá Idepedet variable: ategoriálí proměá SAS počítátabulu ANOVA, ve teréademe výpočet testového ritéria a rozlad variability dle zdroe. Nalezeme zde i Idex Determiace (R-square), terý udává, oli variability sme vysvětlili vlivem variaty V Apliacích postup a straě6 i s daty. 13 VŠE urz 4ST1 Děui za pozorost! Poud budete mít aéoliv dotazy či připomíy, pište mi a mail aa.feclova@vse.cz ebo přiďte do ozultačích hodi aždý páte 9:-11: JM317. 14