Statistické metody v ekonomii: Teoretická východiska, Jednofaktorová a dvoufaktorová analýza rozptlylu. Ing. Michael Rost, Ph.D.
|
|
- Emilie Bártová
- před 8 lety
- Počet zobrazení:
Transkript
1 Statistické metody v ekonomii: Teoretická východiska, Jednofaktorová a dvoufaktorová analýza rozptlylu Ing. Michael Rost, Ph.D.
2 Co je vlastně cílem? Cílem statistického zpracování dat je podání informace o vlastnostech, povaze a zákonitostech projevujících se na pozorovaných datech. Statistika zahrnuje získávání, analýzu a objektivní interpretaci získaných dat. Tj. začíná již před samotným provedením experimentu!
3 Několik doporučení: Definujte svůj problém, který hodláte řešit (a to co možná nejjednodušeji), a vytvořte si své pracovní hypotézy. Určete, co budete měřit a jak to budete měřit. Věnujte dostatečnou přípravu vašemu experimentu. Je důležitá. Randomizujte, tj. znáhodňujte. Můžete se tak vyhnout systematickým chybám (například při odečítání hodnot z přístroje).
4 Několik doporučení: Při analýze dat je nutno rozlišovat s jakými typy dat pracujeme. Mějte na paměti, že ne všechny metody jsou vhodné pro všechny typy dat. Pokud využíváte deskriptivní statistiky k popisu analyzovaného souboru, uvědomte si, že aritmetický průměr nemusí být vždy tou pravou charakteristikou polohy. Udávejte i další statistiky. Vizualizujte! Pokud to jde, používejte spolu s čísly i grafickou reprezentaci, může pomoci (používejte však vhodné grafické vyjádření).
5 Statistické zhodnocení ve 3 úrovních V průběhu statistické analýzy dat postupujte v několika úrovních: Explorativní úroveň (EDA). Popisné statistiky a grafické zhodnocení. Formální statistický přístup. Testy a testování hypotéz či různé statistické metody. Diagnostika. Zhodnocení, zda byly dodrženy předpoklady pro použití vámi vybraných statistických metod. Případně proved te různá nápravná opatření transformace atd...
6 Úvod do problému V ekonomické praxi se můžeme setkat se situací, ve které potřebujete simultánně otestovat shodu k středních hodnot, kde k je větší než 2. Jak to provést, to bude náplní této přednášky ; )
7 Příklad Klinickou studíı byla sledována závislost mezi dietou a dobou, za kterou dojde ke koagulaci krve. Byly naměřeny tyto hodnoty: Typ diety A B C D y ij Mají různé diety vliv na dobu, za kterou dojde ke koagulaci krve?
8 Příklad
9 Výchozí situace Situaci které čeĺıme, lze obecně popsat následujícím způsobem (předpokládáme, že máme k souborů): číslo počet zjištěné hodnoty průměr rozptyl výběru prvků sledovaného znaku 1 n 1 y 11, y 12,, y 1j,, y 1n1 ȳ 1 s n 2 y 21, y 22,, y 2j,, y 2n2 ȳ 2 s i. n i. y i1, y i2,, y ij,, y ini. ȳ i. s 2 i. k n k y k1, y k2,, y kj,, y knk ȳ k s 2 k
10 Obecný postup 1. Zformulovat hypotézy: H 0 vs. H A. 2. Ověření předpokladů Poznámka : Uvědomte si, že pokud provádíte formální analýzu či statistické testování, při kterém využíváte p-value, vycházíte zároveň z jistých předpokladů. Ty však nemusí být splněny. Stupeň validity získaného p-value záleží na tom jakou shodu vykazují naše data s teoretickými rozděleními. Proto každopádně ověřujte předpoklady vašich modelů!
11 Ověření předpokladů Před vlastní analýzou rozptylu je nutno odpovědět na několik otázek: Pochází jednotlivé výběry z normálního rozdělení? Jsou jednotlivé výběry nezávislé? Lze se domnívat, že výběry mají shodné rozptyly? První a třetí požadavek lze ověřit prostřednictvím různých testů.
12 Obecný postup pokračování 2. Stanovit hodnotu α, nejčastěji voĺıme α = 0, 05 nebo α = 0, Zvolit adekvátní testové kritérium a stanovit hodnotu testového kritéria 4. Zjistit zda F K nebo zda p-value α 5. Závěr
13 Specifikace nulové a alternativní hypotézy V případě že potřebujeme simultánně otestovat shodu k středních hodnot, je nulová a alternativní hypotéza specifikována jako: H 0 : µ 1 = µ 2 =... = µ k 1 = µ k H A : non H 0. Zároveň však testujeme ještě homoskedasiticitu: H 0 : σ 2 1 = σ2 2 =... = σ2 k 1 = σ2 k H A : non H 0, a tu testujeme zpravidla jako první!!!
14 Testování homoskedasticity
15 Testy homoskedasticity Předpoklad homoskedasticity (shody rozptylů) je možno otestovat například prostřednictvím tzv. Bartlettova testu. Bartlettův test je univerzálním testem v tom smyslu, že jej lze využít k hodnocení homoskedasticity u vyvážených i nevyvážených souborů. Testujeme hypotézu: H 0 : σ 2 1 = σ2 2 = = σ2 k, H A : non H 0. Testovým kritériem Bartlettova testu je veličina B, která je definována jako B = [(n k)ln s 2 k (n i 1)ln s 2 i ]/C. i=1
16 Testy homoskedasticity Platí-li H 0 a je-li n i 6, pak přibližně platí B χ 2 (k 1). Testovanou hypotézu zamítáme pokud platí B χ 2 1 α (k 1). Jednotlivé symboly využité při výpočtu testové statistiky lze definovat takto: s 2 i = 1 n i 1 celkový rozptyl s jako a konstantu C C = 1 + n i j=1 s = 1 n 1 k i=1 (y ij ȳ i ) 2 i = 1,, k, k n i i=1 j=1 (y ij ȳ i ) 2, 1 n i 1 1 /3(k 1). n k
17 Hartleyův test Dalším testem je tzv. Hartleyův test homoskedasticity. Testovací statistika má v případě Hartleyova testu tvar: Fmax = max s2 i min s 2. i Ke stanovení kritického oboru je nutno využít speciálně sestrojených tabulek, nebot testovaná dvojice rozptylů není náhodně zvolena. Nulovou hypotézu o shodě rozptylů zamítáme na hladině významnosti α, pokud testovací statistika Fmax překročí jistou kritickou hodnotu.
18 Cochranův test Dalším testem pro ověření homoskedasticity je tzv. Cochranův test. V případě jeho použití zamítáme H 0, hypotézu pokud hodnota testového kritéria s 2 max C = s s s2 k překročí kritickou hodnotu Cochranovy statistiky. Jinými slovy, pokud hodnota C bude náležet do kritického oboru, který je definován jako K = {C C 1 α (k, n 1)}, pak zamítáme hypotézu o shodě rozptylů.
19 Levenův test homogenity rozptylů Levenův test v podstatě provádí analýzu rozptylu na reziduích. Využívá přitom proměnnou z ij = y ij ȳ i pro i = 1, 2,, k a j = 1, 2,, n i. Výsledná hodnota testové statistiky F je porovnávána s kritickou hodnotou F -rozdělení s k 1 a n k stupni volnosti. Pro jisté případy jsou navrženy i modifikace Levenova testu. V případě šikmosti souboru lze využít místo ȳ i. mediánu. V případě výrazné špičatosti souboru je pak místo ȳ i. doporučován 10 % ořezaný průměr.
20 Analýza rozptylu - ANOVA jednofaktorová Necht Y ij je náhodnou veličinou označující j-té pozorování v rámci i-té skupiny. Symbol y ij pak bude představovat pozorovanou hodnotu veličiny Y ij získanou provedením experimentu. Symbolem n i označíme počet pozorování v i-té skupině. Průměry v jednotlivých skupinách tj. ȳ 1, ȳ 2,, ȳ k získáme jako ȳ i = 1 n i n i j=1 y ij.
21 Analýza rozptylu - ANOVA jednofaktorová Rozptyly uvnitř jednotlivých skupin označíme jako s 2 i, kde i = 1, 2,, k. Je zřejmé, že: s 2 i = 1 n i 1 n i j=1 (y ij ȳ i ) 2 Vnitroskupinová tzv. průměrná reziduální suma čtverců: MSS r = 1 n k k n i i=1 j=1 (y ij ȳ i ) 2
22 Analýza rozptylu - ANOVA jednofaktorová Celkový průměr označíme jako ȳ kde ȳ = 1 n k n i i=1 j=1 y ij n = k i=1 n i. Průměrná suma čtverců vlivem různých úrovní faktorů (skripta: Rozptyl mezi třídami): MSS A = 1 k 1 k i=1 n i (ȳ i ȳ) 2
23 Testové kritérium Testové kritérium F = MSS A MSS r. Kde pro testové kritérium F za platnosti nulové hypotézy platí: F F (v 1 = k 1; v 2 = n k) Pokud symbolem F označíme hodnotu testového kritéria F určenou na základě provedeného experimentu, pak lze p-value definovat takto: P (F(k 1; n k) > F )
24 Tabulka analýzy rozptylu V podstatě je tato testovací statistika založena na poměru průměrných meziskupinových a vnitroskupinových součtů čtverců. Výsledky analýzy rozptylu se zapisují do tzv. tabulky analýzy rozptylu. Ta měla v minulosti svůj význam z hlediska výpočtů. V nejjednodušším případě má následující podobu: Zdroj Součet Počet stupňů Průměrný F Dosažená variability čtverců volnosti čtverec hladina p Faktor SS A k 1 MSS A = SS A k 1 Reziduální SS r n k MSS r = SS r n k Celkový SS T n 1 F = MSS A MSS r p
25 Jak na to v R Pokračujme v řešení motivačního příkladu. Nejprve data načteme a znázorníme. data<-read.table("dieta.txt",header=true) data names(data) plot(koagulace~dieta,data,ylab="cas koagulace krve",col="red") with(data,stripchart(koagulace~dieta,vertical=true,method="stack", xlab="dieta",ylab="cas koagulace krve"))
26 Vytvořené grafy Cas koagulace krve Cas koagulace krve A B C D dieta A B C D Dieta
27 Pokračování práce v R - Tabulka analýzy rozptylu Výsledná tabulka analýzy rozptylu model<-lm(koagulace~dieta,data) anova(model) Analysis of Variance Table Response: koagulace Df Sum Sq Mean Sq F value Pr(>F) dieta * Residuals Signif. codes: 0 *** ** 0.01 * Lze říci, že se doba koagulace krve liší v závislosti na podávané dietě.
28 pokračování práce v R Model y ij = µ + α i + ɛ ij, kde α 1 = 0 - referenční hladina model<-lm(koagulace~dieta,data) summary(model) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** dietab dietac ** dietad Signif. codes: 0 *** ** 0.01 * Residual standard error: on 28 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 3 and 28 DF, p-value:
29 ... R Pro správné pochopení kódování jednotlivých úrovní můžeme použít příkaz model.matrix() (Intercept) dietab dietac dietad
30 Ověření předpokladů homoskedasticity K ověření předpokladu homoskedasticity můžeme využít například Bartlettův test. bartlett.test(koagulace~dieta,data) Bartlett test of homogeneity of variances data: koagulace by dieta Bartlett s K-squared = , df = 3, p-value =
31 Další diagnostika Lze využít rezidua k posouzení normality qqnorm(residuals(model)) plot(jitter(fitted(model)), residuals(model), xlab="teoretické získané modelem", ylab="residua")
32 Diagnostické grafy Normal Q Q Plot Sample Quantiles Residua Theoretical Quantiles Teoretické získané modelem
33 Dvoufaktorová analýza rozptylu
34 Dvoufaktorová analýza rozptylu V některých případech je nutné uvažovat vliv současného působení dvou faktorů. Situace se tak mírně komplikuje. Hovoříme pak o tzv. analýze rozptylu při dovojném třídění, neboli o dvoufaktorové analýze rozptylu. Uvažujme dva faktory: Faktor A necht má I úrovní i = 1, 2,, I). Faktor B necht má J úrovní j = 1, 2,, J). Dále uvažujme pouze případy, kdy máme tzv. vyvážené třídění, tj. kdy všechny četnosti n ij jsou stejné a jsou rovny nějakému číslu.
35 Šedá teorie Matematický model lze (obecně pro tento typ úloh) formulovat takto: Y ijp = µ + α i + β j + ɛ ijp Potřebné výpočty: I i α i = 0 J j β j = 0 S A = 1 JP I i=1 Y 2 i 1 n Y 2 S B = 1 IP J j=1 Y 2 j 1 n Y 2 S T = I i J j P p Y 2 ijp 1 n Y 2
36 Šedá teorie S e = S T S A S B
37 Trošku to uspořádáme Výpočty lze opět uspořádat do přehledné tabulky analýzy rozptylu: Zdroj Součet Stupně Průměrný Testová p-value variability čtverců volnosti součet statistika čtverců Faktor A S A df A = I 1 MS A = S A df A Faktor B S B df B = J 1 MS B = S B df B F A = MS A MS e 1 F(F A df A ; df e ) F B = MS B MS e 1 F(F B df B ; df e ) Residuum S e df e = IJP I J + 1 MS e = S e df e Celkový S T df T = IP J 1
38 Příklad Bylo sledováno, zda čas potřebný k výrobě určité součástky závisí na denní době a na hlučnosti v okoĺı. Experimentem, jemuž se podrobilo dvanáct pracovníků firmy byly zjištěny následující hodnoty [v min]: Ticho Hudba Rozhlas Hluk Ráno V poledne Večer Je doba výroby závislá na denní době a na hlučnosti okoĺı? Testované hypotézy: H 0A : α 1 = α 2 = α 3 = 0 H 0B : β 1 = β 2 = β 3 = β 4 = 0
39 Jak to spácháme v R cas<-c("rano","poledne","vecer") prostredi<-c("ticho","hudba","hra","hluk") odezva<-c(6,8,7,7,5,6,8,10,12,6,5,7) mat<-expand.grid(cas=cas,prostredi=prostredi) data<-data.frame(odezva,mat) data odezva cas prostredi 1 6 rano ticho 2 8 poledne ticho 3 7 vecer ticho 4 7 rano hudba 5 5 poledne hudba 6 6 vecer hudba 7 8 rano hra 8 10 poledne hra 9 12 vecer hra 10 6 rano hluk 11 5 poledne hluk 12 7 vecer hluk
40 pokračování v R model<-lm(odezva~cas+prostredi,data=data) anova(model) Analysis of Variance Table Response: odezva Df Sum Sq Mean Sq F value Pr(>F) cas prostredi * Residuals Signif. codes: 0 *** ** 0.01 * Z výsledků je zřejmé, že vliv denní doby na čas potřebný k vyrobení součástky nebyl na hladině α = 0,05 na základě pozorovaných dat prokázán. Naopak lze zamítnout hypotézu, že hlučnost v okoĺı neovlivňuje dobu potřebnou k výrobě.
41 Odhad efektů
42 Odhad efektů summary(model) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) *** caspoledne casvecer prostredihudba prostredihra * prostredihluk Signif. codes: 0 *** ** 0.01 * Residual standard error: on 6 degrees of freedom Multiple R-Squared: 0.773, Adjusted R-squared: F-statistic: on 5 and 6 DF, p-value:
43 Motivační příklad - dvoufaktorová ANOVA s interakcemi Byl proveden pokus, při němž byly sledovány výnosy jisté zemědělské plodiny v t.ha 1 v závislosti na typu půdy (kyselá půda, normální půda) a typu hnojení (kontrola bez hnojení, chlévská mrva, Ca hnojivo). Každá kombinace byla realizována dvakrát. Data: Typ Kontrola Mrva Hnojení Ca Normální půda 2,9 3,1 3,6 3,9 3,2 3,5 Kyselá půda 2,7 3,0 3,5 3,4 3,8 4,2 Má druh půdy či typ hnojení vliv na výnos?
44 Náš model Matematický model lze (obecně pro tento typ úloh) formulovat takto: Y ijp = µ + α i + β j + (αβ) ij + ɛ ijp Naše pracovní (testovaná - nulová) hypotézy předpokládají, že sledované faktory, případně jejich interakce, nemají na tvorbu výnosu vliv, tj.: H 0A : α 1 = α 2 = = α I ; H 0B : β 1 = β 2 = = β J ; H 0AB : (αβ) 11 = (αβ) 12 = = (αβ) IJ. Pozn.: Při samotném řešení využity reparametrizační podmínky: I α i = 0; J β j = 0; I (αβ) ij = 0 i; J (αβ) ij = 0 j i j i j
45 Jak to zadání dostaneme do Erka? #Nejprve vytvoříme sledované úrovně obou faktorů a uspořádáme je. #Uspořádání není nezbytně nutné, ale pro jistotu. puda<-rep(c("normalni","kysela"),6) puda<-factor(puda,levels=c("normalni","kysela")) osetreni<-rep(c("kontrola","mrva","ca"),c(4,4,4)) osetreni<-factor(osetreni,levels=c("kontrola","mrva","ca")) #Vytvoříme vektor obsahujíci jednotlivé hodnoty výnosů #pro dané úrovně y<-c(2.9,2.7,3.1,3.0,3.6,3.5,3.9,3.4,3.2,3.8,3.5,4.2) #Vše to uložíme do objektu data data<-data.frame(puda,osetreni,y) #Koukneme se na to, co jsme vytvořili data
46 Naše data data puda osetreni y 1 normalni kontrola kysela kontrola normalni kontrola kysela kontrola normalni mrva kysela mrva normalni mrva kysela mrva normalni Ca kysela Ca normalni Ca kysela Ca 4.2 trellis.device(theme="col.whitebg") xyplot(y~osetreni puda,data=data,ylab="vynos v t/ha",pch=20,cex=1.2) xyplot(y~puda osetreni,data=data,ylab="vynos v t/ha",pch=20,cex=1.2)
47 Vizualizujme? Ano! kontrola mrva Ca normalni kysela Ca vynos v t/ha 3.5 vynos v t/ha 4.0 kontrola mrva kontrola mrva Ca normalni kysela osetreni puda
48 Ted trochu vážně - malinko to zamlžíme - šedá, šedá je teorie Y = I J P Y ijp Y i = J P Y ijp Y ij = P Y ijp i j p j p p S A = 1 JP I i=1 Y 2 i 1 n Y 2 S B = 1 IP J j=1 Y 2 j 1 n Y 2 S e = I i J j P p Y 2 ijp 1 P I i J j Y 2 ij S T = I i J j P p Y 2 ijp 1 n Y 2 S AB = S T S A S B S e
49 Trošku to uspořádáme Výpočty lze uspořádat do přehledné tabulky analýzy rozptylu: Zdroj Součet Stupně Průměrný Testová p-value variability čtverců volnosti součet statistika čtverců Faktor A S A df A = I 1 MS A = S A df A Faktor B S B df B = J 1 MS B = S B df B Interakce S AB df AB = IJ I J + 1 MS AB = S AB df AB F A = MS A MS e 1 F(F A df A ; df e ) F B = MS B MS e 1 F(F B df B ; df e ) F AB = MS AB MS e 1 F(F AB df AB ; df e ) Residuum S e df e = IJP IJ MS e = S e df e Celkový S T df T = IP J 1
50 Katarze přichází aneb zlatá praxe ;-) Výpočet provedeme v Erku. Syntaxe je velmi jednoduchá: model<-aov(y~puda*osetreni,data=data) summary(model) Df Sum Sq Mean Sq F value Pr(>F) puda osetreni ** puda:osetreni * Residuals Signif. codes: 0 *** ** 0.01 * Výsledky lze stručně shrnout. Vzhledem k hodnotám p-value lze říci, že se na základě analyzovaných dat nepodařil prokázat vliv půdního typu na výnos hospodářské plodiny (p-value 0, 5847). Naopak vliv ošetření je statisticky významný p-value 0, Totéž platí i pro interakci mezi půdním typem a ošetřením p-value 0, Podívejme se ještě na graf interakcí. Může pomoci při interpretaci.
51 Opět graf - interakce výnos v t/ha osetreni Ca mrva kontrola normalni kysela Pùdni typ
52 Zjistíme ještě statisticky významné rozdíly mezi úrovněmi faktorů Pro faktor ošetření (kontrola, chlévská mrva, vápnění): TukeyHSD(model,which="osetreni") Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = y ~ puda * osetreni, data = data) $osetreni diff lwr upr mrva-kontrola Ca-kontrola Ca-mrva
53 Tukey HSD test - grafy Graficky to můžeme znázornit například takto: 95% family wise confidence level 95% family wise confidence level kysela:kontrola normalni:kontrola normalni:mrva normalni:kontrola kysela normalni kysela:mrva normalni:kontrola normalni:ca normalni:kontrola kysela:ca normalni:kontrola normalni:mrva kysela:kontrola Differences in mean levels of puda 95% family wise confidence level kysela:mrva kysela:kontrola normalni:ca kysela:kontrola kysela:ca kysela:kontrola mrva kontrola kysela:mrva normalni:mrva normalni:ca normalni:mrva kysela:ca normalni:mrva Ca kontrola normalni:ca kysela:mrva kysela:ca kysela:mrva Ca mrva kysela:ca normalni:ca Differences in mean levels of osetreni Differences in mean levels of puda:osetreni
54 Metoda znáhodněných bloků Jedná se o dosti častý případ v polních pokusech. Princip metody je následující: Pozemek rozděĺıme na tolik bloků, kolik máme opakování. Uvnitř bloku provedeme následně dělení do tolika parcel, kolik má sledovaný faktor úrovní. Na takto vzniklé parcely přiřadíme v rámci bloků náhodně jednotlivé úrovně faktoru. Výhodou metody je to, že umožňuje eliminovat vliv rozdílností mezi jednotlivými bloky. Mějme 8 odrůd ovsa a každou z odrůd budeme chtít vysít na 5 pokusných pozemcích stejné velikosti. Jak provedeme znáhodnění? Označme jednotlivé odrůdy jako: a1; b2; c3; d4; e5; f6; g7; h8.
55 Bašta pro Erko odrudy<-c("a1","b2","c3","d4","e5","f6","g7","h8") poradi<-c(sample(odrudy,rep=f),sample(odrudy,rep=f),sample(odrudy,rep=f), sample(odrudy,rep=f),sample(odrudy,rep=f)) barvy<-factor(poradi) barvy<-as.numeric(barvy) barva<-matrix(barvy,byrow=true,5,8) plan<-matrix(poradi,byrow=true,5,8) x<-1:5 y<-1:8 sit<-expand.grid(x,y) sit plot(sit$var1,sit$var2,type="n",xlab="bloky - opakovani", ylab="parcely - odrudy") text(sit$var1,sit$var2,plan,col=barva,cex=1.52) plan
56 Jak to tedy vlastně vypadá? parcely odrudy e5 c3 c3 e5 h8 g7 a1 a1 c3 g7 h8 b2 e5 f6 a1 b2 d4 b2 a1 f6 f6 e5 f6 d4 e5 a1 h8 g7 g7 b2 d4 g7 h8 h8 c3 c3 f6 d4 b2 d bloky opakovani Máme plán pokusů. Ted už zbývá jen provést samotný pokus...
57 Data získané provedením pokusu - již uspořádané Údaje jsou v gramech. Bloky Odrůda a b c d e f g h Načteme data do Erka a provedeme ANOVU. V případě metody znáhodněných bloků postupujeme jako v případě dvoufaktorové analýzy rozptylu bez interakcí.
58 Šedá teorie Matematický model lze (obecně pro tento typ úloh) formulovat takto: Y ijp = µ + α i + β j + ɛ ijp Potřebné výpočty: S A = 1 JP I i=1 I α i = 0 i J β j = 0 Y 2 i 1 n Y 2 S B = 1 IP j J j=1 Y 2 j 1 n Y 2 S T = I i J j P p Y 2 ijp 1 n Y 2 S e = S T S A S B
59 Trošku to uspořádáme Výpočty lze opět uspořádat do přehledné tabulky analýzy rozptylu: Zdroj Součet Stupně Průměrný Testová p-value variability čtverců volnosti součet statistika čtverců Řádky S A df A = I 1 MS A = S A df A Sloupce S B df B = J 1 MS B = S B df B F A = MS A MS e 1 F(F A df A ; df e ) F B = MS B MS e 1 F(F B df B ; df e ) Residuum S e df e = IJP I J + 1 MS e = S e df e Celkový S T df T = IP J 1
60 Kanonenfutter... bloky<-factor(1:5) odrudy<-c("a1","b2","c3","d4","e5","f6","g7","h8") odr<-odrudy dat<-expand.grid(blok=bloky,odruda=odr) y<-c(296, 357, 340, 331, 348, 202, 390, 431, 340, 320, 437, 334, 426, 320, 296, 303, 319, 310, 260, 242, 469, 405, 442, 487, 394, 345, 342, 358, 300, 308, 324, 339, 357, 352, 220, 488, 374, 401, 338, 320) data<-data.frame(blok=dat$blok,odruda=dat$odruda,y) model2<-aov(y~odruda+blok,data=dat) summary(model2)
61 Výsledek provedené analýzy Získáme výslednou tabulku analýzy rozptylu. Df Sum Sq Mean Sq F value Pr(>F) odruda ** blok Residuals Signif. codes: 0 *** ** 0.01 * Nulovou hypotézu o shodě středních hodnot pro jednotlivé odrůdy můžeme tedy zamítnout, nebot p-value = 0, Ověřme ještě hypotézu o shodě rozptylů mezi jednotlivými odrůdami. Využijme pro tento účel Bartlettův test. bartlett.test(y,dat$odruda) Bartlett test for homogeneity of variances data: y and dat$odruda Bartlett s K-squared = , df = 7, p-value =
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VíceAnalýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer
ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími
VíceAnalýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.
ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
VíceStatistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup
Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom
VíceÚvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
Vícet-test, Studentův párový test Ing. Michael Rost, Ph.D.
Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.
VícePokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.
Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Proč neparametrické testy? Pokud provádíte formální analýzu či testování hypotéz (zejména provádíte-li
VíceStav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
VíceSEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
VíceSTATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
VíceOpravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese
- základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data
VíceUniverzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.
Více1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření
1.4 ANOVA Úloha 1 Jednofaktorová ANOVA Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření Bylo měřeno množství DNA hub Fusarium culmorum
VíceS E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
VíceJednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek
VíceÚstav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze
Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".
Více3 ANALÝZA ROZPTYLU ANOVA
3 Analýza rozptlu ANOVA 3 ANALÝZA ROZPTYLU ANOVA RYCHLÝ NÁHLED KAPITOLY Analýza rozptlu je statistickým nástrojem, který nám umožňuje zkoumat závislost kvantitativního znaku na kvalitativním znaku. Základní
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
VíceTestování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceAnalýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání
Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání 1. Analýzu variance (ANOVu) používáme při studiu problémů, kdy máme závislou proměnou spojitého typu a nezávislé proměnné
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
VíceADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceStatistická analýza dat
Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte
VíceZ mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
Více05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")
Zobecněné lineární modely Úloha 5: Vzdělání a zájem o politiku cv5.dat
VíceA 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21
Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8
VíceDesign Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
VíceNárodní informační středisko pro podporu jakosti
Národní informační středisko pro podporu jakosti 1 ANALÝZA ROZPTYLU a její využití při vyhodnocování experimentálních dat Eva Jarošová, VŠE Praha 2 Obsah Podstata metody, jednofaktorová ANOVA F-test Mnohonásobná
VíceAplikovaná statistika v R - cvičení 2
Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových
VícePlánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
VícePřednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
VícePrůzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
VíceMasarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová
Masarykova univerzita v Brně Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Analýza rozptylu Vypracovala: Marika Dienová Vedoucí bakalářské práce: Mgr. Jan Koláček, Ph.D. Brno 2006/2007 Prohlášení Prohlašuji,
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých
VíceTestování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
VíceNavrhování experimentů a jejich analýza. Eva Jarošová
Navrhování experimentů a jejich analýza Eva Jarošová Obsah Základní techniky Vyhodnocení výsledků Experimenty s jedním zkoumaným faktorem Faktoriální experimenty úplné 2 N dílčí 2 N-p Experimenty pro studium
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceANALÝZA ROZPTYLU (ANOVA)
ANALÝZA ROZPTYLU (ANOVA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,
VíceANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
VíceZpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05
VíceProblém 1: Ceny nemovitostí Poznámkykřešení 1
Problém 1: Ceny nemovitostí Poznámkykřešení 1 Zadání 1.Majínemovitostiurčenékbydlenívyššícenutam,kdeječistšíovzduší?Pokudano,okolik? 2. Lze vztah mezi znečištěním a cenou, pokud existuje, vysvětlit tím,
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceParametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
VíceMatematická statistika Zimní semestr
Analýza rozptylu (jednoduché třídění) 11.1.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Med.txt. Otevřete si program R Studio a načtěte si výše
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VíceLEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ
1 LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ STATISTICKÉ HYPOTÉZY neboli formální výroky o: neznámých parametrech základního souboru, o tvaru rozložení četností, o statistických vztazích mezi soubory či proměnnými
VícePřednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
VíceJednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
VíceVysoká škola ekonomická v Praze
Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické metody v ekonomii Autor bakalářské práce: Jakub Zajíček Vedoucí
VíceTechnická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Více