Design Experimentu a Statistika - AGA46E

Podobné dokumenty
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Design Experimentu a Statistika - AGA46E

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Design Experimentu a Statistika - AGA46E

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Design Experimentu a Statistika - AGA46E

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Design Experimentu a Statistika - AGA46E

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Plánovací diář a Google Calendar

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Fisherův exaktní test

Statistická analýza dat

Seminář 6 statistické testy

Testování uživatelského rozhraní

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistická analýza jednorozměrných dat

Uni- and multi-dimensional parametric tests for comparison of sample results

Příklady na testy hypotéz o parametrech normálního rozdělení

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

A7B39TUR Úloha B Kvantitativní testování ZS 2013/2014 Software MS Office Word a Open Office Writer

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Národní informační středisko pro podporu jakosti

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

12. cvičení z PST. 20. prosince 2017

Inovace bakalářského studijního oboru Aplikovaná chemie

Intervalové Odhady Parametrů

7. Analýza rozptylu.

Uloha B - Kvantitativní test. Radek Kubica A7B39TUR. B1 Radek Kubica Kvantitativní testování Stránka 1

Seminář 6 statistické testy

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

ADDS cviceni. Pavlina Kuranova

PRAVDĚPODOBNOST A STATISTIKA

4ST201 STATISTIKA CVIČENÍ Č. 10

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

PRAVDĚPODOBNOST A STATISTIKA

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Regresní analýza. Eva Jarošová

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

LINEÁRNÍ MODELY. Zdeňka Veselá

Testování hypotéz o parametrech regresního modelu

VÝUKA: Biostatistika základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ

Testování hypotéz o parametrech regresního modelu

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

odpovídá jedna a jen jedna hodnota jiných

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Kvantitativní testování porovnání Alza.cz a Mall.cz

ANOVA PSY252 Statistická analýza dat II

Testy nezávislosti kardinálních veličin

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

AVDAT Klasický lineární model, metoda nejmenších

4EK211 Základy ekonometrie

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Způsoby chození do schodů

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Kvantitativní testování virtuálních klávesnic na desktopu

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Jednofaktorová analýza rozptylu

ANOVA analýza rozptylu

Karta předmětu prezenční studium

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Základní statistické metody v rizikovém inženýrství

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

LINEÁRNÍ REGRESE. Lineární regresní model

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Cvičení ze statistiky - 8. Filip Děchtěrenko

4EK211 Základy ekonometrie

Plánování experimentu

Přednáška IX. Analýza rozptylu (ANOVA)

Testování statistických hypotéz

Intervalové Odhady Parametrů II Testování Hypotéz

Transkript:

Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment 1 / 21

Strucne opakovani Zakladne problemy ve statistice Jednovyberove problemy bodovy odhad neznameho parametru; (nejcasteji neznamy parametr stredne hodnoty, nebo rozptylu) intervalovy odhad (interval spolehlivosti) pro neznamy parametr; (pro neznamy parametr stredne hodnoty, nebo parametr rozptylu) test hypotezy o neznamem parametru; (opet pro parametr stredne hodnoty nebo rozptylu) Dvouvyberove problemy srovnani dvou strednich hodnot (neznamych parametru µ 1 a µ 2 ); (pomoci bodoveho nebo intervaloveho odhadu, nebo statistickeho testu) srovnani dvou parametru rozptylu (neznamych parametru σ 2 1 a σ2 2 ); (pomoci bodoveho nebo intervaloveho odhadu, nebo statistickeho testu) 2 / 21

Strucne opakovani Uzitecne vzorce pro inferenci pro neznamy parametr stredne hodnoty (resp. srovnani dvou parametru) se znamym rozptylem: n X n µ σ N(0, 1) pro neznamy parametr stredne hodnoty (resp. srovnani dvou parametru) s neznamym rozptylem: X n µ n t n 1 s n pro neznamy parametr rozptylu σ 2 : (n 1)s 2 n σ 2 χ 2 n 1 pro srovnani rozptylu dvou nahodnych vyberu (σ 2 1 vs. σ 2 2): s n 2 1 /σ 2 1 s n 2 2 /σ 2 2 F n1,n 2 3 / 21

Strucne opakovani Tabulky kritickych hodnot N 4 / 21

Strucne opakovani Dvouvyberove problemy: rozptyl Je dulezite rozlisovat homoskedasticitny a heteroskedasticitny pripad. Avsak je mozne odhadovat rozptyl pouze pro heteroskedasticitny pripad a pouzit jej i pro homoskedasticitny pripad, avsak takovy rozptyl je hodne konzervativny. Opacny postup ale nelze aplikovat. pro pripad homoskedasticity (σ 2 1 = σ 2 2): σ 2 XY = (n1 1)s2 n 1 + (n 2 1)s 2 n 2 n 1 + n 2 2 ( 1 + 1 ) n 1 n 2 pro pripad heteroskedasticity (σ 2 1 σ 2 2): σ 2 XY = s2 n 1 n 1 + s2 n 2 n 2 5 / 21

Strucne opakovani Dvouvyberove problemy: df Stupne volnosti (df ) specifikuji prislusne rozdeleni, tudiz je potrebne tyhle stupne volnosti porad korektne spocitat. Stejne tak ale existuji konzervativne pristupy. pro parove nahodne vybery = df = n 1; pro nezavisle nahodne vybery (homoskedasticita) = df = n + m 2; pro nezavisle nahodne vybery (heteroskedasticita) = ( ) snn 2 2 + s2 mm df sn 4 + s4 n 2 m (n 1) m 2 (m 1) 6 / 21

Strucne opakovani Jednovyberove problemy v R t.test() - zakladny prikaz pro interenci o neznamem parametru stredne hodnoty - parametr µ R; > t.test(sample1, mu = 178) 7 / 21

Strucne opakovani Jednovyberove problemy v R t.test() - zakladny prikaz pro interenci o neznamem parametru stredne hodnoty - parametr µ R; > t.test(sample1, mu = 178) automaticky spocte odhad pro neznamy parametr µ R; automaticky spocte testovu statistiku t; automaticky spocte prislusne stupne volnosti; automaticky spocte prislusnu p-hodnotu testu; automaticky spocte prislusny 95 % interval spolehlivosti; 7 / 21

Strucne opakovani Jednovyberove problemy v R t.test() - zakladny prikaz pro interenci o neznamem parametru stredne hodnoty - parametr µ R; > t.test(sample1, mu = 178) One Sample t-test data: sample t = 1.6317, df = 49, p-value = 0.1091 alternative hypothesis: true mean is not equal to 178 95 percent confidence interval: 175.8414 198.8022 sample estimates: mean of x 187.3218 8 / 21

Strucne opakovani Dvouvyberove problemy v R t.test() - stejny prikaz take pro dvouvyberove problemy - pro vsechny diskutovane pripady; > t.test(sample1, sample2, paired = F, equal.var = F) 9 / 21

Strucne opakovani Dvouvyberove problemy v R t.test() - stejny prikaz take pro dvouvyberove problemy - pro vsechny diskutovane pripady; > t.test(sample1, sample2, paired = F, equal.var = F) automaticky spocte odhady pro nezname parametry µ 1, µ 2 R; automaticky spocte testovu statistiku t; automaticky spocte prislusne stupne volnosti; automaticky spocte prislusnu p-hodnotu testu; automaticky spocte prislusny 95 % interval spolehlivosti; 9 / 21

Strucne opakovani Dvouvyberove problemy v R t.test() - stejny prikaz take pro dvouvyberove problemy - pro vsechny diskutovane pripady; > t.test(sample1, sample2, paired = F, equal.var = F) Two Sample t-test data: sample1 and sample2 t = 0.2237, df = 38, p-value = 0.8242 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.658464 0.822080 sample estimates: mean of x mean of y 0.3453624 0.2635544 10 / 21

Strucne opakovani Srovnani dvou rozptylu v R var.test() - zakladny prikaz pro porovnani dvou rozptylu v R; > var.test(sample1, sample2) 11 / 21

Strucne opakovani Srovnani dvou rozptylu v R var.test() - zakladny prikaz pro porovnani dvou rozptylu v R; > var.test(sample1, sample2) automaticky spocte odhady pro nezname parametry σ1, 2 σ2 2 > 0; automaticky spocte testovu statistiku F ; automaticky spocte prislusne stupne volnosti; automaticky spocte prislusnu p-hodnotu testu; automaticky spocte prislusny 95 % interval spolehlivosti; 11 / 21

Strucne opakovani Srovnani dvou rozptylu v R var.test() - zakladny prikaz pro porovnani dvou rozptylu v R; > var.test(sample1, sample2) F test to compare two variances data: sample and sample2 F = 0.4293, num df = 49, denom df = 49, p-value = 0.003706 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2436446 0.7565916 sample estimates: ratio of variances 0.4293477 12 / 21

Vice-vyberove problemy (dva a vice vyberu z normalneho rozdeleni) 13 / 21

One-way ANOVA v obecnem pripade muzeme mit nekolik ruznych nahodnych vyberu (napr. J N nezavislych nahodnych vyberu): X 1,1, X 1,2,..., X 1,n1 N(µ 1, σ 2 ) X 2,1, X 2,2,..., X 2,n2 N(µ 2, σ 2 )... X J,1, X J,2,..., X J,nJ N(µ J, σ 2 ) technicky muzeme kazde pozorovani zapsat ekvivalentnym zpusobem jako X ij = µ j + ε ij = µ + α j + ε ij, pro ε ij N(0, σ 2 ) a j = 1,..., J, i = 1,..., n j; 14 / 21

One-way ANOVA v obecnem pripade muzeme mit nekolik ruznych nahodnych vyberu (napr. J N nezavislych nahodnych vyberu): X 1,1, X 1,2,..., X 1,n1 N(µ 1, σ 2 ) X 2,1, X 2,2,..., X 2,n2 N(µ 2, σ 2 )... X J,1, X J,2,..., X J,nJ N(µ J, σ 2 ) technicky muzeme kazde pozorovani zapsat ekvivalentnym zpusobem jako X ij = µ j + ε ij = µ + α j + ε ij, pro ε ij N(0, σ 2 ) a j = 1,..., J, i = 1,..., n j; opet nas zajima srovnani nahodnych vyberu vzhledem k jejich strednim hodnotam - parametrum µ 1,..., µ J, pro j = 1,..., J; 14 / 21

One-way ANOVA v obecnem pripade muzeme mit nekolik ruznych nahodnych vyberu (napr. J N nezavislych nahodnych vyberu): X 1,1, X 1,2,..., X 1,n1 N(µ 1, σ 2 ) X 2,1, X 2,2,..., X 2,n2 N(µ 2, σ 2 )... X J,1, X J,2,..., X J,nJ N(µ J, σ 2 ) technicky muzeme kazde pozorovani zapsat ekvivalentnym zpusobem jako X ij = µ j + ε ij = µ + α j + ε ij, pro ε ij N(0, σ 2 ) a j = 1,..., J, i = 1,..., n j; opet nas zajima srovnani nahodnych vyberu vzhledem k jejich strednim hodnotam - parametrum µ 1,..., µ J, pro j = 1,..., J; Muzeme vyuzit klasicky t-test a testovat jednotlive dvojice samostatne? Co se stane s pravdepodobnosti chyby prvniho druhu? 14 / 21

Mnohonasobne testovani V nekterych pripadech je mozne vyuzit ruzne korekce pro mnohonasobne testovani (nekolik nezavislych testu) za ucelem dodrzeni predem stanovene hladiny testu - hodnoty α (0, 1) - teda pravdepodobnosti chyby prvniho druhu. 15 / 21

Mnohonasobne testovani V nekterych pripadech je mozne vyuzit ruzne korekce pro mnohonasobne testovani (nekolik nezavislych testu) za ucelem dodrzeni predem stanovene hladiny testu - hodnoty α (0, 1) - teda pravdepodobnosti chyby prvniho druhu. Bonferroniho korekce - nejjednoduchsi a take nejkonzervativnejsi metoda pro kontrolu stanovene hladiny testu pri opakovanem testovani; (pro α (0, 1) a m nezavislych testu individualna hladina α = α m ) Benjamini Hochberg korekce Holm Bonferroni korekce Dunn Šidákova korekce 15 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... 16 / 21

Srovnani vzhledem k rozptylum namisto porovnavani jednotlivych prumeru (vyberovych prumeru), porovnavame pouze rozptyly a srovnavame je; parametr rozptylu σ 2 > 0 (uvazujeme pouze homoskedasticitny pripad) je samozrejme neznamy... Jak muzeme odhadnout tento parametr na zaklade pozorovani? Total Sum of Squares: Within Group Sum of Squares: SST = J j=1 nj i=1 (X ij X n) 2 J SSW = j=1 nj i=1 (X ij X nj ) 2 J Between Group Sum of Squares: SSB = j=1 n i (X nj X n) 2 soucty ctvercu se take nazyvaji jako "total", "error" a "treatment"; prislusne stupne volnosti jsou n 1, n J a J 1, pro n = n 1 + + n J ; Prumerny soucet ctvercu: soucet ctvercu podeleny poctem df ; k rozhodnute se pak pouziva = Fisher-Snedecor Distribution; 16 / 21

ANOVA pomoci softwaru R v programu R implementovana funkce anova(), ktera kompletne pocita analyzu rozptylu; 17 / 21

ANOVA pomoci softwaru R v programu R implementovana funkce anova(), ktera kompletne pocita analyzu rozptylu; > anova(lm(c(sample1,sample2) ~ c(rep(1, 20), rep(2,20)))) Analysis of Variance Table Response: c(sample1, sample2) Df Sum Sq Mean Sq F value Pr(>F) c(rep(1, 20), rep(2, 20)) 1 1.0763 1.07625 1.3749 0.2483 Residuals 38 29.7455 0.78278 17 / 21

ANOVA pomoci softwaru R v programu R implementovana funkce anova(), ktera kompletne pocita analyzu rozptylu; > anova(lm(c(sample1,sample2) ~ c(rep(1, 20), rep(2,20)))) Analysis of Variance Table Response: c(sample1, sample2) Df Sum Sq Mean Sq F value Pr(>F) c(rep(1, 20), rep(2, 20)) 1 1.0763 1.07625 1.3749 0.2483 Residuals 38 29.7455 0.78278 > sum((c(sample1, sample2) - mean(c(sample1, sample2)))^2) [1] 30.82175 > sum((mean(sample1) - mean(c(sample1, sample2)))^2) * 20 + sum((mean(sample2) - mean(c(sample1, sample2)))^2) * 20 [1] 1.076252 > sum((sample1 - mean(sample1))^2) + sum((sample2 - mean(sample2))^2) [1] 29.7455 17 / 21

F-test versus t test > t.test(sample1, sample2, var.equal = T, paired = F) Two Sample t-test data: sample1 and sample2 t = 1.1726, df = 38, p-value = 0.2483 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.2383250 0.8944507 sample estimates: mean of x mean of y 0.39579636 0.06773353 18 / 21

Two way ANOVA uvazujeme o neco komplexnejsi situaci, opet pro nekolik nahodnych vyberu z normalneho rozdeleni se stejnym rozptylem (homoskedasticita); X i,,jk = µ + α i + β j + ε i,j,k pro i = 1,..., I, j = 1,..., J a k = 1,..., n i,j; a pro nahodne chyby opet predpokladame nasledujci: ε ijk N(0, σ 2 ) a vzajemne jsou chyby nezavisle; 19 / 21

Two way ANOVA - Ctverce Total Sum of Squares: I J nij (X i=1 j=1 k=1 ijk X n) 2 Group α Sum of Squares: I i=1 J ni(x n i X n) 2 Group β Sum of Squares: J I nj(x j=1 n j X n) 2 J nij Error Sum of Squares: (X j=1 k=1 ijk X nij ) 2 i i=1 20 / 21

Pokracovani nabuduce... Klasicka linearni regrese; Nektere dalsi regresne modely; Uzitecne statisticke testy; Celkovy prehled a opakovani; 21 / 21