8. cvičení 4ST201-řešení



Podobné dokumenty
8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

NEPARAMETRICKÉ METODY

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Pravděpodobnost a aplikovaná statistika

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Doc. Ing. Dagmar Blatná, CSc.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Závislost slovních znaků

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

7. cvičení 4ST201-řešení

Národní informační středisko pro podporu kvality

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

8. Analýza rozptylu.

3. Charakteristiky a parametry náhodných veličin

V. Normální rozdělení

Neparametrické metody

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

3. cvičení 4ST201. Míry variability

3. cvičení 4ST201 - řešení

Odhady parametrů 1. Odhady parametrů

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

17. Statistické hypotézy parametrické testy

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Náhodný výběr 1. Náhodný výběr

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Příklad: Test nezávislosti kategoriálních znaků

SP2 Korelační analýza. Korelační analýza. Libor Žák

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Testování statistických hypotéz

Pravděpodobnost a aplikovaná statistika

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

ZÁKLADY POPISNÉ STATISTIKY

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

vají statistické metody v biomedicíně

Analýza dat z dotazníkových šetření

12. N á h o d n ý v ý b ě r

PRAVDĚPODOBNOST A STATISTIKA

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Mendelova univerzita v Brně Statistika projekt

Test hypotézy o parametru π alternativního rozdělení příklad

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Intervalové odhady parametrů některých rozdělení.

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

2 EXPLORATORNÍ ANALÝZA

ij m, velikosti n je tvořen (n m) rozměr-ným polem dat x x x 22 x n1 ... x n2 7.1 Druhy korelačních koeficientů

Deskriptivní statistika 1

Intervalové odhady parametrů

Metody zkoumání závislosti numerických proměnných

STATISTIKA. Základní pojmy

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

1. Základy počtu pravděpodobnosti:

7. Odhady populačních průměrů a ostatních parametrů populace

Přednáška č. 2 náhodné veličiny

Testování hypotéz. December 10, 2008

Pravděpodobnostní modely

Neparametrické metody

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

SPOTŘEBITELSKÝ ÚVĚR. Na začátku provedeme inicializaci proměnných jejich vynulováním příkazem "restart". To oceníme při opakovaném použití dokumentu.

n 3 lim 3 1 = lim Je vidět, že posloupnost je neklesající, tedy z Leibnize řada konverguje, ( 1) k 1 k=1

Pravděpodobnostní model doby setrvání ministra školství ve funkci

PRAVDĚPODOBNOST A STATISTIKA

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test, varianta C)

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

Kapitola 6. : Neparametrické testy o mediánech

P2: Statistické zpracování dat

PRAVDĚPODOBNOST A STATISTIKA

Statistika Statistická jednotka, statistický soubor a statistické znaky Poznámka. (Rozd lení etností jednoho kvantitativního statistického znaku)

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

10.2 VÁŽENÝ ARITMETICKÝ PRŮMĚR


4. B o d o v é o d h a d y p a r a m e t r ů

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test, varianta B)

stavební obzor 1 2/

Lineární regrese ( ) 2

Číselné charakteristiky náhodných veličin

Kvantily. Problems on statistics.nb 1

Národní informační středisko pro podporu kvality

Transkript:

cvičící 8. cvičeí 4ST01-řešeí Obsah: Neparametricé testy Chí-vadrát test dobréshody Kotigečí tabuly Aalýza rozptylu (ANOVA) Vysoá šola eoomicá 1 VŠE urz 4ST01 Neparametricé testy Neparametricétesty využíváme, poud ezámerozděleízáladího souboru a přesto chceme porovávat(testovat) úrověhodot v souboru, testovat ezávislostsledovaých zaůči ověřit předpolado určitém typu rozděleí. Často se testue předpolad ormality záladího souboru. Nepoužívaěšítest ověřeípředpoladu o určitém typu rozděleí: Chí-vadrát test dobré schody. Nepoužívaěšítest o ezávislosti veliči v otigečítabulce: Chí-vadrát test ezávislosti Typ záladího souboru volíme a záladězušeostíči z grafu. Tato volba emusí být správá, proto testueme.

VŠE urz 4ST01 1. Chí-vadrát test dobré schody Ověřueme shodu předpoládaého (teoreticého) rozděleís apozorovaým rozděleím. Testueme hypotézu: oproti alterativě, že alespoň eda pravděpodobost e odlišá. Testovým ritérieme: H π π 0 : 0, de _ 1,,... ( - * π ) * π 1 0, 0, terépři platosti H 0 mározděleíx (-1). H 0 zamítáme při hodotách X větších ež(1-α)*100% vatil rozděleíx (-1). Předpoladem správého použitítestu e, aby všechy teoreticéčetosti *π 0, byly většíež5. 3 VŠE urz 4ST01 Přílad 8.1.: Chí-vadrát test dobré shody Bylo sledováo500 áhoděvybraých mužůz ČR a byla sledováa eich tělesá výša. Posuďte a 5% hladiě výzamosti, zda výša mužů má ormálírozděleí. V íže uvedeétabulce sou sledovaéčetosti výšy mužů. Ve sledovaém souboru byla průměrávýša rova 170,1 cm a výběrovásměrodatáodchyla 8,7. Méěa 150 cm 0 150 cm 160 cm 55 160 cm 170 cm 194 170 cm 180 cm 143 180 cm 190 cm 68 Více ež190 cm 0 V souboru 4st01_cv8_pomocy.xls adete pomůcu, a přílad řešit. 4

VŠE urz 4ST01 Řešeí příladu 8.1 95% vatil X (6-1)11,1 Na 5% hladiěvýzamosti sme proázali, že hodoty epocházeíz ormálího rozděleí. 5 VŠE urz 4ST01. Kotigečí tabuly Chceme-li zistit zda mezi dvěmi valitativími (ategoriálími) proměýmiexistue závislost (vztah), uspořádáme si sdružeéčetosti do otigečí tabuly: ProměéB 1, B B S Jeich součet e Σ i, ao e Σ,* ProměéA 1, A A r Jeich součet e Σ i ao 367 84 651 e 168 181 349 Σ 535 465 100 0 *, 6

VŠE urz 4ST01 Kotigečí tabuly Poud máme za cíl zistit, zda mezi dvěmi valitativími (ategoriálími) proměými existue ěaý vztah, závislost, souvislost, můžeme použít chí-vadrát test ezávislosti. Testové ritérium: ' ( - ) r s de i * * i, o, i o, i ' i 1 1 o, i r -1 s Proázaá souvislost edoazue auzálí závislost. Sílu závislosti dvou ategoriálích proměých lze vyádřit pomocí * [( )( -1)] Pearsoova oeficietu: C + či Cramérova oeficietu: V ( m -1) de mmi(r,s) Pro zcela ezávisléveličiy e C a V rovo ule, poud e eda ategorie edozačě dáa ategoriídruhéproměée V1 a C ( -1)/ 7 VŠE urz 4ST01 Kotigečí tabula Přílad 8..: Chceme zistit, zda existue ěaásouvislost mezi tím, a lidéposlouchaírádio a tím, zda ezdílidév autě. Poud proážeme závislost, vyádříme eísílu pomocípearsoova otigečího oeficietu a Cramérova V. (pomůcu adete opět v souboru 4st01_cv8_pomocy.xls) Posloucháte před de rádio? ao e Σ Jezdíte autem? ao 367 84 651 e 168 181 349 Σ 535 465 100 0 8

VŠE urz 4ST01 Přílad 8.. - Nápověda i 11 367 0i, 651 *535 1000 348 ( i o, i ) ( ) - o, i 367-348 348 1,01 9 VŠE urz 4ST01 Řešeípříladu 8.. 6, 0,95 (1) 3,84 Testové ritérium e větší ež vypočítaý vatil, proázali sme souvislost mezi sledovaými proměými. C V 6, 6,+1000 6, 1000(-1) 0,078 0,079 Tato závislost e ovšem slabá. 10

VŠE urz 4ST01 Přílad 8. v SASu 1. Data v souboru: data_cv8_t.sas7bdat. Describe Table Aalysis 3. Tas Role: 1. Table variable: ízda autem, rádio. Frequecy Cout: počet 4. Tables: Vytvořit tabulu: Rádio sloupce, ízda autem řády 5. Cell statistics 1. Cell frequecies, Expected cell frequecy, Cell cotributio to Pearso chi-square 6. Associatio: chi-square test 11 VŠE urz 4ST01 Přílad 8..-test ezávislosti ategoriálích proměých v SASu Table of ízda autem by rádio Statistic DF Value Prob ízda autem ao ao 367 348.9 1.0056 68.60 e 168 186.7 1.8759 31.40 rádio e 84 30.7 1.157 61.08 181 16.9.158 38.9 Total 651 349 Chi-Square 1 6.1968 0.018 Lielihood Ratio Chi-Square 1 6.1914 0.018 Cotiuity Ad. Chi-Square 1 5.8701 0.0154 Matel-Haeszel Chi-Square 1 6.1906 0.018 Phi Coefficiet 0.0787 Cotigecy Coefficiet 0.0785 Cramer's V 0.0787 Total 535 465 1000 Teoreticé četosti Výsledy testu ezávislosti Pearsoův otigečí oeficiet Cramérovo V 1

VŠE urz 4ST01 3. Aalýza rozptylu Poud chceme zistit souvislost mezi ěaou ategoriálía umericou proměou, používáme metodu ozačovaou aalýza rozptylu. Metoda vycházíz rozladu rozptylu(součtu čtvercových odchyle) a vitrosupiovou a mezisupiovou variabilitu. Je-li uvažovaá umericá proměá ezávislá a zmíěé ategoriálí proměé, tedy: H µ µ... 0 : 1 má poměr těchto zdroů variability rozděleí F(-1,-). F 1 1 * ( x - x ) -1 * s - Při hodotách F, terépřeročípříslušý vatil F rozděleí, zamítáme testovaou hypotézu o tom, že ve všech supiách e steý průměr, eboť podíl mezisupiovévariability e přílišveliý. µ 13 VŠE urz 4ST01 Přílad 8.3.: Aalýza rozptylu Vrátíme se příladu ze začátu 3.cvičeí(přílad a rozlad rozptylu). Neboťužvíte, a teto přílad iterpretovat, sami si umíte spočítat mezisupiovou a vitrosupiovou variabilitu, bude se vám přílad dobře řešit. Zoumáme váhu že ve čtyřech věových ategoriích. Budeme chtít posoudit, zda váha že závisía věu či zda rozdíl mezi vahami v edotlivých ategoriích e bezvýzamý. Potřebá data sou v ásleduící tabulce (či v materiálech 3.cvičeí): Pomůcu adete opět v souboru 4st01_cv8_pomocy.xls 14

VŠE urz 4ST01 Přílad 8.3.- Nápověda F 1 * 1 ( x -x ) -1 * s - 15 VŠE urz 4ST01 Řešeí příladu 8.3. Testové ritérium: F 0,43 Kvatil F 0,95 (3,680),605 F * 1 ( x -x ) -1 * s 1-45,8 3 470,57 680 15,093 0,43 6,163 16

VŠE urz 4ST01 Přílad 8.3. v SASu Na přílad emáme data. Je třeba mít soubor všecha pozorováí. Postup v SASu: Aalyze Oe Way ANOVA Depedet variable: umericá proměá Idepedet variable: ategoriálí proměá SAS počítátabulu ANOVA, ve teréademe výpočet testového ritéria a rozlad variability dle zdroe. Nalezeme zde i Idex Determiace (R-square), terý udává, oli variability sme vysvětlili vlivem variaty V Apliacích postup a straě06 i s daty. 17 VŠE urz 4ST01 Děui za pozorost! Poud budete mít aéoliv dotazy či připomíy, pište mi a mail aa.feclova@vse.cz ebo přiďte do ozultačích hodi aždý páte 9:00-11:00 JM317. 18