Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Rozměr: px
Začít zobrazení ze stránky:

Download "Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel"

Transkript

1 Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30

2 Analýza rozptylu je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými. Vysvětlované proměnné jsou vždy kvantitativní, u vysvětlujících proměnných (označují se jako faktory) na typu nezáleží. Faktory nabývají pouze malého počtu obměn (úrovní), podle nichž lze hodnoty vysvětlovaných proměnných třídit do skupin. jednofaktorová ANOVA vliv jednoho faktoru na vysvětlovanou proměnnou vícefaktorová ANOVA vliv více faktorů (dvojné, trojné třídění, atd.) vícerozměrná analýza rozptylu MANOVA vliv jednoho či více faktorů na několik vysvětlovaných proměnných současně Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 2 / 30

3 Prokázat závislost vysvětlované proměnné Y (kvantitativní proměnná) na vysvětlujících proměnných (faktorech), znamená prokázat rozdílné úrovně proměnné Y v jednotlivých podsouborech skupinách, vzniklých tříděním podle faktoru A. Předpokládejme, že máme k nezávislých náhodných výběrů z normálních rozdělení N(µ 1, σ 2 ), N(µ 2, σ 2 ),..., N(µ k, σ 2 ), kde µ 1, µ 2,..., µ k jsou střední hodnoty veličiny Y v jednotlivých skupinách. Testujeme hypotézu H : µ 1 = µ 2 = = µ k proti alternativě A : µ i µ j, pro alespoň jednu dvojici i j, i = 1, 2,..., k, j = 1, 2,..., k, která znamená, že alespoň některá rovnost mezi středními hodnotami neplatí. Východiskem jsou naměřené hodnoty proměnné Y roztříděné do k skupin podle úrovní (variant) faktoru A. Náhodný výběr z rozdělení N(µ i, σ 2 ) označíme Y i1, Y i2,..., Y i,ni, kde n i je jeho rozsah. Všechny výběry potom mají rozsah n = n 1 + n n k = k n i. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 3 / 30

4 V jednotlivých skupinách určíme tzv. podmíněné charakteristiky Označme podmíněný průměr v i-té skupině Ȳ i. = 1 n i ni podmíněný rozptyl v i-té skupině S 2 i. = 1 n i 1 celkový průměr Ȳ.. = 1 n k ni celkový rozptyl S 2.. = 1 n 1 k Dále definujme j=1 Y ij j=1 Y ij ni j=1 (Y ij Ȳ..) 2 ni j=1 (Y ij Ȳ i. ) 2 rozptyl podmíněných průměrů S 2 Ȳ i. = 1 k n 1 (Ȳi. Ȳ..)2 n i průměr podmíněných rozptylů S i. 2 = 1 k n S i.n 2 i Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 4 / 30

5 Příklad: U 42 zákrsku jabloní bylo zaznamenáno stáří stromu v letech (faktor A) a roční sklizeň (znak Y ). x i y j n i Ȳ i. Si. 2 (n i 1)Si ,200 1,200 4, ,143 1,810 10, ,333 1,467 7, ,500 0,700 3, ,667 1,067 5, ,667 1,867 9, ,000 2,000 10, ,157 Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 5 / 30

6 Podstatou analýzy rozptylu je rozklad celkového rozptylu na složku objasněnou známý zdroj variability, a na složku neobjasněnou reziduální, chybovou, o níž se předpokládá, že je náhodná. Zřejmě platí Y ij Ȳ.. = (Y ij Ȳi.) + (Ȳi. Ȳ..). Umocněním a sumací přes i a j dostáváme n k i n k i n k i n k i (Y ij Ȳ..)2 = (Y ij Ȳi.) 2 +2 (Y ij Ȳi.)(Ȳi. Ȳ..)+ j=1 Lze ukázat, že člen 2 k n k i j=1 (Y ij Ȳ..)2 j=1 ni j=1 j=1 j=1 (Y ij Ȳi.)(Ȳi. Ȳ..) je roven nule. Potom platí n k i n k = (Y ij Ȳi.) i 2 + (Ȳi. Ȳ..)2. j=1 }{{}}{{}}{{} S c = S e + S A S c značí celkovou variabilitu, S c = k ni j=1 (Y ij Ȳ..) 2 = (n 1)S.., 2 S A je variabilita vysvětlená faktorem A, S A = k ni j=1 (Ȳi. Ȳ..)2 = k n i(ȳi. Ȳ..)2 = (n 1)S 2 Ȳ i., S e je variabilita reziduální (vnitřní), S e = k j=1 (Ȳi. Ȳ..)2. ni j=1 (Y ij Ȳi.) 2 = k (n i 1)S 2 i.. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 6 / 30

7 Z analyzovaného datového souboru dostáváme: S A = 77,248 S e = 51,157 S c = 128,405 Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 7 / 30

8 Důležitým předpokladem použití analýzy rozptylu je, že každý z k nezávislých výběrů (což odpovídá k řádkům v korelační tabulce) proměnné Y pochází z normálního rozdělení N(µ i, σ 2 ) se stejným rozptylem σ 2. Předpoklad normality lze ověřit testy normality, avšak s přihlédnutím k rozsahům výběrů se v praxi se od toho často upouští a posuzuje se pouze, zda se ve skupinách hodnot proměnné Y, zjištěných na jednotlivých úrovních faktoru X, nevyskytují výslovně extrémní hodnoty a zda se hodnoty blízké podmíněným průměrům vyskytují častěji než hodnoty, jejichž vzdálenost od podmíněných průměrů je větší. K ověření hypotézy o stejných rozptylech k normálních rozdělení lze použít Bartlettův test (je velmi citlivý na porušení předpokladu normality), lze použít i jiné testy, např. Hartleyův nebo Cochranův test (předp. se stejné četnosti ve třídách) případně Fligner-Killeenův test. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 8 / 30

9 Jestliže k nezávislých výběrů pochází z normálních rozdělení se stejnými rozptyly, lze kolísání - variabilitu podmíněných průměrů interpretovat jako závislost proměnné Y na faktoru X, zatím co kolísání hodnot proměnné Y uvnitř jednotlivých skupin budeme vnímat jako závislosti proměnné Y na dalších činitelích (v analýze nesledovaných). Koeficient determinace p 2 je definován vztahem p 2 = S A S c. p 2 0, 1, udává, jaké % rozptylu závisle proměnné Y lze vysvětlit vlivem faktoru A, neshoda mezi středními hodnotami µ i, i = 1,..., k se považuje za tím silnější, čím více se p 2 blíží k 1 a naopak Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 9 / 30

10 Test o shodě podmíněných středních hodnot: H : µ 1 = µ 2 = = µ k A : µ i µ j pro nějaké i, j = 1,..., k, i j Testové kritérium je statistika F = S A k 1 S e n k = (n k) S A (k 1) S e, které má při platnosti hypotézy H Fisherovo-Snedecorovo rozdělení F (k 1, n k). Kritický obor je dán W α : F F 1 α(k 1, n k). Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 10 / 30

11 Z analyzovaných dat (velikost sklizně v závislosti na stáří stromu) jsme získali následující údaje: n = 42, počet skupin (hodnot faktorů) k = 7, S A = 77,248, S e = 51,157 a S c = 128, 405. Koeficient determinace má hodnotu p 2 = S A S c = 0,602. Budeme testovat hypotézu (na hladině významnosti 0,05) H : µ 1 = µ 2 = = µ 7 A : µ i µ j pro nějaké i, j = 1,..., 7, i j F = S A k 1 S e n k = (n k) S A (42 7) 77,248 = (k 1) S e (7 1) 51,157 = 8,808. Kritický obor je W α : 8,808 F 0,95(6, 35) = 2,372, na hladině významnosti 0,05 zamítáme nulovou hypotézu o rovnosti středních hodnot. S pravděpodobností 95 % můžeme tvrdit, že stáří stromu ovlivňuje velikost sklizně. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 11 / 30

12 Možnosti výpočtu: Excel Analýza dat Anova: jeden faktor R funkce aov, (Bartlettův test bartltett.test, Fligner-Killeenův test fligner.test) Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 12 / 30

13 v Excelu Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 13 / 30

14 v R Datový soubor anova sklizen.txt obsahuje 2 sloupce se záhlavím stari a sklizen > data<-read.table("anova sklizen.txt",header=t) > attach(data) > names(data) > stari<-factor(stari) > summary(aov(sklizen stari)) Df Sum Sq Mean Sq F value Pr(>F) stari e-06 *** Residuals Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 14 / 30

15 v R Obrázek: Bodový diagram Obrázek: Krabicové diagramy boxplot Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 15 / 30

16 v R Ověření předpokladu homoskedasticity (stejné rozptyly ve všech skupinách) je možné provést pomocí Bartlettova nebo Fligner-Killeenůvova testu. > bartlett.test(sklizen stari) Bartlett test of homogeneity of variances data: sklizen by stari Bartlett s K-squared = , df = 6, p-value = > fligner.test(sklizen stari) Fligner-Killeen test of homogeneity of variances data: sklizen by stari Fligner-Killeen:med chi-squared = , df = 6, p-value = Předpoklad homoskedasticity je přijatelný. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 16 / 30

17 Mnohonásobné porovnávání v R Tukeyho metoda Jedná se v podstatě o řadu dvouvýběrových t-testů, u nichž je upravena hladina významnosti > TukeyHSD(aov(sklizen stari)) > plot(tukeyhsd(aov(sklizen stari))) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = sklizen stari) diff lwr upr p adj Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 17 / 30

18 Mnohonásobné porovnávání v R Tukeyho metoda Obrázek: Mnohonásobné porovnávání Tukeyho metoda Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 18 / 30

19 Dvoufaktorová ANOVA Dvoufaktorová ANOVA Často je třeba zkoumat závislost kvantitativní proměnné na více faktorech. omezíme se na případ dvou faktorů. Možnosti výpočtu: Excel Analýza dat Anova: dva faktory s opakováním, dva faktory bez opakování R funkce aov Příklad: Cílem experimentu je zkoumat vliv dvou typů benzínu a tří různých aditiv na spotřebu automobilu. Výsledky jsou uvedeny v tabulce. Aditivum A1 A2 A3 Typ B1 B2 8,58 7,06 8,22 6,82 7,13 6,61 7,35 6,84 7,02 7,04 7,28 7,11 Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 19 / 30

20 Dvoufaktorová ANOVA Dvoufaktorová ANOVA Budeme se zabývat vlivem dvou vysvětlujících proměnných (faktorů A, B) na proměnnou vysvětlovanou Y. Označme a počet úrovní faktoru A, podobně b bude označovat počet úrovní faktoru B. Předpokládejme, že pro každou dvojici hodnot faktorů máme r 2 pozorování. Pro pozorování s i-tou hodnotou faktoru A a j-tou hodnotou faktoru B platí Y ij1,..., Y ijr N(µ ij, σ 2 ). Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 20 / 30

21 Dvoufaktorová ANOVA Dvoufaktorová ANOVA bez interakcí Označme: Ȳ ij. = 1 r r k=1 Y ijk, Ȳ i.. = 1 br b j=1 r k=1 Y ijk, Ȳ.j. = 1 ar a r k=1 Y ijk, Ȳ... = 1 abr a b j=1 r k=1 Y ijk Pro celkovou variabilitu lze psát S c = S A + S B + S e. S c = a b j=1 r k=1 (Y ijk Ȳ...)2 celková variabilita S A = br a (Ȳi.. Ȳ...)2 variabilita vysvětlenou faktorem A S B = ar b j=1 (Ȳ.j. Ȳ...)2 variabilita vysvětlenou faktorem B S e = a b j=1 r k=1 (Y ijk Ȳij.) 2 variabilita reziduální Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 21 / 30

22 Dvoufaktorová ANOVA Dvoufaktorová ANOVA bez interakcí Při dvoufaktorové analýze rozptylu bez interakcí nás bude zajímat vlivu faktorů A a B na vysvětlovanou proměnnou Y viz tabulka. Zdroj variability Součet čtverců Stupně volnosti Testová statistika Faktor A S A f A = a 1 F A = S A/f A S e /f e Faktor B S B f B = b 1 F B = S B /f B S e /f e Reziduální S e f e = n a b + 1 Celkový S c f c = n 1 Kritické hodnoty jednotlivých testů jsou kvantily rozdělení F. Vliv faktoru A je statisticky významný, je-li F A F 1 α(f A, f e), podobně vliv faktoru B je významný, pokud F B F 1 α(f B, f e). Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 22 / 30

23 Dvoufaktorová ANOVA Dvoufaktorová ANOVA s interakcemi Označme: Ȳ ij. = 1 r r k=1 Y ijk, Ȳ i.. = 1 br b j=1 r k=1 Y ijk, Ȳ.j. = 1 ar a r k=1 Y ijk, Ȳ... = 1 abr a b j=1 r k=1 Y ijk Pro celkovou variabilitu lze psát S c = S A + S B + S AB + S e. S c = a b j=1 r k=1 (Y ijk Ȳ...)2 celková variabilita S A = br a (Ȳi.. Ȳ...)2 variabilita vysvětlenou faktorem A S B = ar b j=1 (Ȳ.j. Ȳ...)2 variabilita vysvětlenou faktorem B S AB = r a b j=1 (Ȳij. Ȳi.. Ȳ.j. + Ȳ...)2 variabilita příslušející interakci S e = a b j=1 r k=1 (Y ijk Ȳij.) 2 = S c S A S B S AB variabilita reziduální Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 23 / 30

24 Dvoufaktorová ANOVA Dvoufaktorová ANOVA s interakcemi Při dvoufaktorové analýze rozptylu s interakcemi nás bude zajímat kromě vlivu faktorů A a B na vysvětlovanou proměnnou Y, také vliv interakce obou faktorů viz tabulka. Zdroj variability Součet čtverců Stupně volnosti Testová statistika Faktor A S A f A = a 1 F A = S A/f A S e /f e Faktor B S B f B = b 1 F B = S B /f B S e /f e Interakce S AB f AB = (a 1)(b 1) F AB = S AB /f AB S e /f e Reziduální S e f e = n ab Celkový S c f c = n 1 Kritické hodnoty jednotlivých testů jsou kvantily rozdělení F. Vliv faktoru A je statisticky významný, je-li F A F 1 α(f A, f e), podobně vliv faktoru B je významný, pokud F B F 1 α(f B, f e). Mezi faktory A a B je významná interakce když F AB F 1 α(f AB, f e). Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 24 / 30

25 Dvoufaktorová ANOVA Dvoufaktorová ANOVA s interakcemi Pro data z příkladu dostaneme (a = 3, b = 2, r = 2) S c = a b r j=1 k=1 (y ijk y... ) 2 = 3,650, S A = br a (y i.. y... ) 2 = 1,067, S B = ar b j=1 (y.j. y... ) 2 = 1,401, S AB = r a b j=1 (y ij. y i.. y.j. + y... )2 = 1,002, S e = a b r j=1 k=1 (y ijk y ij. ) 2 = S c S A S B S AB = 0,181. Testovací statistiky: F A = 17,737, F B = 46, 565, F AB = 16,647. Kritické hodnoty pro hladinu významnosti 0,05 jsou postupně: F 0,95(2, 6) = 5,143, F 0,95(1, 6) = 5,987, F 0,95(2, 6) = 5,143. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 25 / 30

26 Dvoufaktorová ANOVA Dvoufaktorová ANOVA v Excelu Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 26 / 30

27 Dvoufaktorová ANOVA Dvoufaktorová ANOVA v R Datový soubor anova2 spotreba.txt obsahuje 3 sloupce se záhlavím typ, aditivum a spotreba > data<-read.table("anova2 spotreba.txt",header=t) > attach(data) > names(data) > tapply(spotreba,list(aditivum,spotreba),mean) B1 B2 A A A Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 27 / 30

28 Dvoufaktorová ANOVA Dvoufaktorová ANOVA v R Obrázek: Průměrná spotřeba benzínu v závislosti na typ benzínu a aditivu Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 28 / 30

29 Dvoufaktorová ANOVA Dvoufaktorová ANOVA v R > data<-read.table("anova2 spotreba.txt",header=t) > model <-aov(spotreba aditivum*typ) > summary(model) Df Sum Sq Mean Sq F value Pr(>F) aditivum ** typ *** aditivum:typ ** Residuals Na základě vypočtených p-hodnot můžeme tvrdit, že vliv typu benzínu i aditiva na spotřebu byl prokázán. Vliv interakce byl také prokázán. Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 29 / 30

30 Dvoufaktorová ANOVA Dvoufaktorová ANOVA v R Obrázek: Interakce dvou faktorů Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 30 / 30

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.

Více

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006

Competitivness in the EU Challenge for the V4 countries Nitra, May 17-18, 2006 ANALÝZA ROZPTYLU JAKO ZÁKLADNÍ METODA MNOHONÁSOBNÉHO POROVNÁVÁNÍ STŘEDNÍCH HODNOT V RŮZNÝCH SOFTWAROVÝCH PRODUKTECH ANALYSIS OF VARIANCE AS A PRIMARY METHOD OF MULTIPLE COMPARISON OF EXPECTED VALUES IN

Více

3 ANALÝZA ROZPTYLU ANOVA

3 ANALÝZA ROZPTYLU ANOVA 3 Analýza rozptlu ANOVA 3 ANALÝZA ROZPTYLU ANOVA RYCHLÝ NÁHLED KAPITOLY Analýza rozptlu je statistickým nástrojem, který nám umožňuje zkoumat závislost kvantitativního znaku na kvalitativním znaku. Základní

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová Masarykova univerzita v Brně Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Analýza rozptylu Vypracovala: Marika Dienová Vedoucí bakalářské práce: Mgr. Jan Koláček, Ph.D. Brno 2006/2007 Prohlášení Prohlašuji,

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

Národní informační středisko pro podporu jakosti

Národní informační středisko pro podporu jakosti Národní informační středisko pro podporu jakosti 1 ANALÝZA ROZPTYLU a její využití při vyhodnocování experimentálních dat Eva Jarošová, VŠE Praha 2 Obsah Podstata metody, jednofaktorová ANOVA F-test Mnohonásobná

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

Vybrané partie z biostatistiky

Vybrané partie z biostatistiky 1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu 1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

ANALÝZA ROZPTYLU (ANOVA)

ANALÝZA ROZPTYLU (ANOVA) ANALÝZA ROZPTYLU (ANOVA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více