Po prostudování tohoto odstavce budete umt porozumt konstrukci F-pomru rozhodovat se pomocí testu zvaného analýza rozptylu

Podobné dokumenty
Po prostudování tohoto odstavce budete umt porozumt konstrukci F-pomru rozhodovat se pomocí testu zvaného analýza rozptylu

Pro orientaci v této problematice jsme se seznámili s nkolika novými pojmy:

NEPARAMETRICKÉ METODY

Testování statistických hypotéz

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

7 LIMITNÍ VTY. as ke studiu kapitoly: 70 minut. Cíl:

2. Vícekriteriální a cílové programování

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

3. cvičení 4ST201 - řešení

SP2 Korelační analýza. Korelační analýza. Libor Žák

Metody zkoumání závislosti numerických proměnných

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

STATISTICKÁ ANALÝZA. Doc. RNDr. Zden k Karpíšek, CSc. P ehledový u ební text pro doktorské studium. Vysoké u ení technické v Brn

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Doc. Ing. Dagmar Blatná, CSc.

2. TEORIE PRAVDĚPODOBNOSTI

PRAVDĚPODOBNOST A STATISTIKA

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

3. cvičení 4ST201. Míry variability

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Lineární regrese ( ) 2

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

12. Neparametrické hypotézy

Přednáška č. 2 náhodné veličiny

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Národní informační středisko pro podporu kvality

5. Lineární diferenciální rovnice n-tého řádu

a další charakteristikou je četnost výběrového souboru n.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

17. Statistické hypotézy parametrické testy

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

Statistické charakteristiky (míry)

Analýza rozptylu (ANOVA)

Úvod do korelační a regresní analýzy

Digitální učební materiál

Odhady parametrů 1. Odhady parametrů

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Markovovy řetězce s diskrétním časem (Discrete Time Markov Chain)

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

a) Hypotézy o parametru jedné populace (o stední hodnot, mediánu, rozptylu, relativní

PRAVDĚPODOBNOST A STATISTIKA

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Intervalové odhady parametrů některých rozdělení.

, jsou naměřené a vypočtené hodnoty závisle

PRAVDĚPODOBNOST A STATISTIKA

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

8.1.2 Vzorec pro n-tý člen

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

8.1.2 Vzorec pro n-tý člen

Testy statistických hypotéz

3. Charakteristiky a parametry náhodných veličin

Náhodný výběr 1. Náhodný výběr

Mendelova univerzita v Brně Statistika projekt

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Generování dvojrozměrných rozdělení pomocí copulí

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Náhoda. Pravděpodobnost výhry při sázce na barvu: p = 18/37 = 0,486 Průměrný zisk při n sázkách částky č: - n.č + 2.č.n.p = n.č.

PRAVDĚPODOBNOST A STATISTIKA

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Karlova v Praze Pedagogická fakulta

n 3 lim 3 1 = lim Je vidět, že posloupnost je neklesající, tedy z Leibnize řada konverguje, ( 1) k 1 k=1

Úvod do teorie měření

8. Analýza rozptylu.

Kapitola 5.: Analýza rozptylu jednoduchého třídění

Testování statistických hypotéz

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

8. Zákony velkých čísel

S k l á d á n í s i l

Metodika: Goniometrický tvar komplexního ísla, binomická rovnice

PRAVDĚPODOBNOST A STATISTIKA

6. Posloupnosti a jejich limity, řady

VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI

Spolehlivost a diagnostika

12. N á h o d n ý v ý b ě r

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

STATISTIKA. Základní pojmy

TECHNICKÁ UNIVERZITA V LIBERCI

Kapitola 6. : Neparametrické testy o mediánech

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

MATICOVÉ HRY MATICOVÝCH HER

Pravděpodobnost a aplikovaná statistika

Deskriptivní statistika 1

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

6. KOMBINATORIKA Základní pojmy Počítání s faktoriály a kombinačními čísly Variace

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

PRAVDĚPODOBNOST A STATISTIKA. Testy hypotéz

APLIKOVANÁ STATISTIKA

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

8. cvičení 4ST201-řešení

je hustota pravdpodobnosti nebo pravdpodobnostní funkce náhodného výbru X (X 1, X 2,, X n ). , jako odhad. Nech f ( x;θ)

Transkript:

0. AOVA Aalýza rozptylu as e studu aptoly: 60 mut Cíl Po prostudováí tohoto odstavce budete umt porozumt ostruc F-pomru rozhodovat se pomocí testu zvaého aalýza rozptylu zostruovat tabulu AOVA provést post hoc aalýzu VÝKLAD 0.. Úvod V pedcházejících aptolách jsme se voval mmo jé taé jedovýbrovým a dvouvýbrovým testm stedí hodoty. Rozšíeím tchto test je aalýza rozptylu ebol AOVA, terá ám umožuje srovávat ol stedích hodot ezávslých áhodých výbr. a tomto míst je pa teba zmít požadavy parametrcého testu, terý budeme dále užívat tabula AOVA. Aalýza rozptylu ve své parametrcé podob pedpoládá ormaltu rozdlí a tzv. homosedastctu detcé rozptyly. Poud tyto podmíy ejsou sply, je teba použít eparametrcý Krusal-allsv test, terý je obdobou jedofatorového tídí v aalýze rozptylu v závru této lece bude uvede je v ázau. a rozdíl od parametrcého testu vša epedpoládá ormaltu rozdleí, jeho evýhodou je pa meší ctlvost. Aalýza rozptylu ta pedstavuje rozšíeí možostí procedury zvaé testováí hypotéz. 0.. Kostruce F-statsty ech máme -áhodých výbr tj. výbry z populací, teré jsou a sob ezávslé. ech tyto áhodé výbry pochází z ormálích rozdleí se stejým rozptylem: - 30 -

...,,,,...,,...,,..., µ, µ, µ, Formulace problému: Je teba testovat hypotézu H 0 : µ µ... µ µ v alteratv : H A : eplatí H 0, ech poet pozorováí v -tém áhodém výbru Chceme rozhodout o H 0 a zálad jedoho testu. Proto se pousíme alézt taovou testovou statstu, terá eje umoží mplemetac H 0, ale je ctlvá a platost H 0. Defujme totálí souet tverc ebo totálí varabltu jao TOTAL j, de je výbrový prmr ze všech pozorovaých hodot. j Teto totálí souet tverc mžeme sado rozložt a složy: de TOTAL j +, j TOTAL... vtí varablta j j pemž je výbrová smrodatá odchyla -tého áhodého výbru: a dále j... meztídí varablta j ; je výbrový prmr v -tém áhodém výbru. j j Zavedeme ásledující výbrové rozptyly: vtí výbrový rozptyl meztídí výbrový rozptyl Vlastost tchto výbrových rozptyl: - 3 -

- 3 -. E E E ebo E. Tedy vtí výbrový rozptyl je estraým odhadem rozptylu, ezávsle a H 0.. Podob bychom mohl doázat, že + E E E, z ehož bezprosted vyplývá ásledující evvalece: E dyž platí H 0 Položíme F Defce: Tuto statstu F azveme F-pomr. Pro je výhodé použít F-pomr jao testovou statstu? Z výše uvedeého je zejmé, že poud platí H 0, F-pomr je jaé áhodé íslo blízé jedce... F. Dále, poud eplatí H 0, je toto íslo výraz vtší ež, ja uazuje vlastost výpoet stedí hodoty meztídího výbrového rozptylu. tatsta F-pomr je tedy ctlvá a platost hypotézy H 0. Abychom j mohl v dalším prbhu testu použít jao testovou statstu a tím ulové rozdleí, musíme determovat její statstcé chováí, tedy urt její rozdleí pravdpodobost. Víme, že w χ, protože χ, a dále je zámo, že souet áhodých vel χ je opt áhodou velou stejého typu, s potem stup volost daým soutem stup volost sítacových vel. Podobou úvahou lze proázat, že poud platí H 0, potom: χ Poud tedy platí H 0, potom víme ze zalostí o Fsherov-edecorov rozdleí, že ásledující podíl: w F, musí mít ut F rozdleí o - a - stupích volost.

Poud záme statstcé chováí F-pomru, lze to využít pro úely posouzeí a rozhodutí výše uvedeého problému v podob H 0. ásledující obráze lustruje použtí F-pomru pro úely rozhodováí o platost hypotézy H 0. Oblast platost H 0 pozorovaá hodota statsty F-pomr 0.3. Tabula AOVA Jedotlvé mezvýsledy, provádé v prbhu aalýzy rozptylu, jsou prbž a systematcy zazameáváy v tabulce AOVA: Zdroj promlvost Varablta tup volost totálí TOTAL j j Odpovídající druh rozptylu Testová stat. F-pomr P-value meztídí vtí j j F vz. defce Tabula aalýzy rozptylu - AOVA Velé hodoty F-pomru budou mít za áslede malé hodoty p value, což zameá zamítutí H 0. F-pomru bude velý, poud vtí varablta tvoí zaedbatelou ást totálí varablty a evvalet, poud meztídí varablta tvoí výzamou ást totálí varablty. 0.4. ešeé pílady Pro lustrac statstcého chováí F-pomru uvažujme t datové soubory. Ve všech jsou stejé výbrové prmry v rámc -té populace, avša rozptyly se lší. Poud vtí výbrový rozptyl je malý, F-pomr je velý, poud je aopa velý, F-pomr je malý. oubory lustrují t pípady: malý vtí výbrový rozptyl, ormálí a velý. - 33 -

Pílad : Malý vtí výbrový rozptyl Populace I II III IV 4 7.5 68.5 38 34.5 7 44 3.5 6 53 5 Data 40 5 64 50 46.5 0.5 57 43.5 8 3 56 4 37 5 54.5 4 35.5 6.5 46 63.5 37.5 60 36 66 55 Rozsah výbru 8 7 0 Výbrové prmry 37 7 6 43 Výbrové odchyly smrodaté Tabula AOVA Poet stup 5.78 3.7 6.06 5.7 Varablta Odpovídající F-pomr volost výb. rozptyl totálí 36 987.707 meztídí 3 890.707 967.57 00.96 vtí 33 970 9.39 P-value 0.0000 80 70 60 50 40 30 0 0 I II III IV - 34 -

Pílad : ormálí vtí výbrový rozptyl Populace I II III IV 47 8 76 33 3 7 83 45 8 5 45 6 Data 43 3 67 57 56 4 53 44 9 9 5 39 37 3 48 4 34 64 49 66 3 59 9 7 49 Rozsah výbru 8 7 0 Výbrové prmry 37 7 6 43 Výbrové odchyly smrodaté Tabula AOVA Poet stup.56 7.4. 0.53 Varablta Odpovídající F-pomr volost výb. rozptyl totálí 36 78.707 meztídí 3 890.707 967.57 5.4 vtí 33 3880 7.58 P-value 0.0000 90 80 70 60 50 40 30 0 0 0 I II III IV - 35 -

Pílad 3: Velý vtí výbrový rozptyl Populace I II III IV 67 0 06 3-3 7 49 0 3 97 Data 55 5 79 85 94 38 37 46-7 53 3 3 37 5 37 8 70 6 76 0 55 9 5 Rozsah výbru 8 7 0 Výbrové prmry 37 7 6 43 Výbrové odchyly smrodaté Tabula AOVA Poet stup 34.69.5 36.36 3.59 Varablta Odpovídající F-pomr volost výb. rozptyl totálí 36 438.707 meztídí 3 890.707 967.57.804 vtí 33 3490 058.8 P-value 0.0549 40 0 00 80 60 40 0 0-0 I II III IV - 36 -

0.5. Post Hoc aalýza Pedchozí aalýza pouázala a to, že velý F-pomr duje exstec výzamých zm mez populaím výbrovým prmry. aše aalýza by ale byla eompletí, poud bychom edetfoval, teré z populací sgalzují výzamou odchylu výbrového prmru. Teto další proces se azývá post hoc aalýza a spoívá v porováváí výbrových prmr všech dvojc populací. Pro tato víceásobá porováváí exstuje ol metod. V rámc tohoto výladu se omezíme je a tu ejjedodušší z ch, tzv. LD-metodu zameá zratu výrazu Lest gfcat Dfferece. Tato metoda spoívá v aplac dvouvýbrového t-testu pro aždý pár výbrových prmr. Místo stadardího dvouvýbrového tudetova t-testu vša použjeme poud upraveý t-test, založeý a LD statstce: Pro -tý a j-tý výbr defujeme ásledující testovou statstu LD,j : LD, j j t + j de. ado lze zdvodt, že tato statsta má tudetovo rozdleí s - stup volost. LD metoda je lustrováa pro t pedchozí pílady: Pílad : Malý vtí výbrový rozptyl Provedeme výpoet statsty LD,j pro všechy uvažovaé dvojce daých ty populací a hodoty zazameáme do ásledující tabuly: Rozsahy 8 7 0 výbru I II III IV 8 I 0-7.8 9.698.333 7 II 7.8 0 7.064 9.73 III -9.698-7.064 0-7.754 0 IV -.333-9.73 7.754 0 V tomto pípad exstuje velm slá emprcá výpov o rozdílech mez všem populacem, pouze p porováí populací I a IV výpov eí ta slá. - 37 -

Pílad : ormálí vtí výbrový rozptyl Rozsahy 8 7 0 výbr I II III IV 8 I 0-3.564 4.849.67 7 II 3.564 0 8.53 4.8656 III -4.849-8.53 0-3.877 0 IV -.67-4.866 3.877 0 dv homogeí populace: I a IV V tomto pípad, aolv výbrové prmry jsou stejé, eexstuje emprcá výpov o rozdílu mez výbrovým prmry populací I a IV. Taže mžeme v podstat exstující 4 populace rozdlt a 3 supy: prví sdružuje populace I a IV, druhou tvoí populace II a tetí populace III. Výbrové prmry Pílad 3: Velý vtí výbrový rozptyl Jelož F-pomr je v tomto pílad velm malý, za ormálích oolostí bychom teto pílad uzavel tím, že ezamítáme ulovou hypotézu o rovost stedích hodot populací, ímž by aalýza sola, ebo všechy populace jsou homogeí, co do rovost stedích hodot. Poud pesto provedeme výpoet hodot tabuly LD,j, dostaeme: Rozsahy 8 7 0 výbr I II III IV 8 I 0 -.88.66 0.389 7 II.88 0.844.6 III -.66 -.844 0 -.9 0 IV -0.389 -.6.9 0-38 -

V tomto hypotetcém pípad vdíme výzamý rozdíl, terý sgalzuje malé P-value a tedy zamítutí testu o rovost výbrových prmr, mez populacem II a III. Jelož vša celový F-pomr byl pílš malý, teto rozdíl by byl za ormálích oolostí pehlédut a my bychom uzavel test tím, že eexstují žádé výzamé rozdíly mez daým tym populacem. Za tchto oolostí mžeme teto rozdíl považovat za faleš výzamý. Pozáma: Exstují jé testy, ežl LD metoda, teré umožují podobá víceásobá porováváí, l post hoc aalýzu. yly vyvuty flexbljší metody, teré jsou dostupé prostedctvím vysplého softwaru. Patí sem apílad Ducav test, Tueyv test pro výzamé rozdíly, cheffé test a ofero test. Detaly m zde ebudou probíráy, ale všechy jsou založey a podobé rozhodovací strateg, založeé a staoveí rtcého rozdílu požadovaého pro ureí toho, zda dva výbrové prmry z ola populací se lší. V moha pípadech jsou tyto testy mohem efetvjší, ež LD metoda, pro úely alezeí podsup pvodích populací, teré jsou homogeí co do rovost výbrových prmr. 0.6. Krusal-allsv test Pedchozí postup AOVA, využívající pro rozhodováí popsaý F-pomr je velm ctlvý a pedpolad o ormalt rozdleí pvodích áhodých výbr. Pro pípady, dy tomuto pedpoladu elze úpl vyhovt, exstuje Krusal allsv poadový test. euvádím zde detaly tohoto testu, je záladí myšleový postup. Teto test je založe a poadí pvodích datových hodot a provádí aalýzu rozptylu tato uspoádaých hodot. Pro výše uvedeý pílad 3 páší ásledující tabula poadí všech zazameaých hodot: Populace I II III IV 8 36 9.5 Poadí.5 37 3 pvodích 6.5 8 9.5 35 hodot 5.5 4.5 3 3 34 9 4 6.5 6.5 9 4.5.5 9 5 9 7 30 6.5 5.5 3 33 4 Rozsah výbru 8 7 0 Prmré poadí 7.6875 0.743 4.467 9.35 mrodatá odch..674 8.599 9.6668 0.6538-39 -

Testová statsta je modfací díve uvedeého F-pomru pro tato uspoádaé hodoty. Pozorovaá hodota této, tzv. K- testové statsty a píslušá hodota p-value jsou v daém pípad ásledující: K- testová statsta 7.435 p-value 0.0645 P-value pro tuto K- testovou statstu je o co vtší, ež dává F-pomr, ale závry jsou v obou pípadech stejé. ulová hypotéza eí zamítuta. hrutí pojm Rozšíeím dvouvýbrových test pro stedí hodoty je aalýza rozptylu ebol AOVA, terá umožuje srovávat ol stedích hodot ezávslých áhodých výbr. Testovou statstou je p aalýze rozptylu F-pomr, terý byl odvoze a zálad aalýzy varablty vstupích datových soubor. tatsta F-pomr je ctlvá a platost hypotézy H 0, terá je formulováa jao rovost stedích hodot zoumaých áhodých výbr. Jedotlvé mezvýsledy, provádé v prbhu aalýzy rozptylu, jsou prbž a systematcy zazameáváy v tabulce AOVA. Druhým roem p aalýze rozptylu je post hoc aalýza, terá spoívá v porováváí výbrových prmr všech dvojc populací s cílem vybrat homogeí srovatelé populace. Krtérem pro zaazeí do homogeích sup mže být apílad LD-statsta. Popsaý postup AOVA, využívající pro rozhodováí F-pomr, je ctlvý a pedpolad o ormalt rozdleí pvodích áhodých výbr. Pro pípady, dy tomuto pedpoladu elze úpl vyhovt, exstuje Krusal allsv poadový test. Otázy. Popšte ostruc a stochastcé chováí statsty F-pomr. Co je to vtí a meztídí výbrový rozptyl? 3. Jaý je obvylý výstup z aalýzy rozptylu? 4. Co je to post hoc aalýza a LD-statsta? - 30 -

Úlohy ešeí P. : yl provede przum závslost píjmu a vzdláí ldí. V tabulce jsou uvedey píjmy v tsících K u áhod vybraých sedm muž a aždé úrov vzdláí. Z - záladí, - stedošolsé, V - vysoošolsé. Z V 0.9 8.9. 9.8 0.3 9.7 3 6.4 7.5 5.8 4 4.3 6.9 8.9 5 7.5 4.. 6.3 9.3 7.5 7 5..5 0. Provete jedoduché tídí a rozhodte, zda vzdláí má vlv a píjem. {p-value 0.057} P. : Z velého souboru domácost bylo áhod vybráo 5 jedoleých domácost, 8 dvouleých, 0 tíleých, 0 tyleých a 7 ptleých domácost, dohromady tedy 40 domácost a byly sledováy jejch msíí výdaje za potravy a ápoje ppadající a jedoho lea domácost v K. Ovte pomocí aalýzy rozptylu, zda se msíí výdaje za potravy a osobu lší podle potu le domácost. {Použjte vhodý programový balí} Poet domácost l. Výdaje a jedoho lea domácost v K 3 4 5 3.440.350.59.37.06 4.044 3.03.35.0.39 4.04.43.73.786.448 3.776.36.33.3.37 3.67.800.303.3.03.90.565.433.0.656.777.4..878.899.763.755.3 3.54.66 P. 3: P rozboru efetvost bytové výstavby byly u áhod vybraých dooeých mmopražsých byt tech typ,y a Z zazameáy álady a m bytové plochy. Výsledy šeteí: - 3 -

Typ K 6 85 7 00 7 555 6 890 7 75 7 300 6 905 Typ Y K 6 405 6 570 6 35 6 895 6 905 6 550 6 750 6 965 Typ Z K 7 050 7 355 6 80 6 90 6 700 Pouste se proázat exstec rozdíl v áladech mez jedotlvým typy byt. - 3 -