05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")
|
|
- Monika Soukupová
- před 8 lety
- Počet zobrazení:
Transkript
1 Zobecněné lineární modely Úloha 5: Vzdělání a zájem o politiku cv5.dat <- read.csv("cvic5.csv") Jména veličin a rozměry datové tabulky names(cv5.dat) [1] "n" "polit" "vzdel" "stat" dim(cv5.dat) [1] 30 4 Vypišme soubor cv5.dat n polit vzdel stat 1 94 Ano Zakladni SSSR 2 84 Ne Zakladni SSSR Ano Zakladni USA Ne Zakladni USA Ano Zakladni Britanie Ne Zakladni Britanie Ano Zakladni Italie Ne Zakladni Italie Ano Zakladni Mexiko Ne Zakladni Mexiko Ano Stredni SSSR Ne Stredni SSSR Ano Stredni USA Ne Stredni USA Ano Stredni Britanie Ne Stredni Britanie Ano Stredni Italie Ne Stredni Italie Ano Stredni Mexiko Ne Stredni Mexiko Ano Vysok. SSSR Ne Vysok. SSSR Ano Vysok. USA 24 8 Ne Vysok. USA Ano Vysok. Britanie 26 2 Ne Vysok. Britanie Ano Vysok. Italie 28 7 Ne Vysok. Italie Ano Vysok. Mexiko 30 2 Ne Vysok. Mexiko Jaký typ má polit class(cv5.dat$polit) [1] "character" Mám vypnutou automatickou konverzi znaků na faktory Využiju toho k tomu, abych si pořadí úrovní faktorů zadával podle potřeby cv5.dat$pol.f <- factor(cv5.dat$polit,levels=c("ne","ano")) cv5.dat$vzd.f <- factor(cv5.dat$vzdel, levels=c("zakladni","stredni","vysok.")) cv5.dat$stat.f <- factor(cv5.dat$stat, levels=c("usa","britanie","italie","mexiko","sssr")) Model nezávislosti: (P,V,S) Page 1
2 fit1 <- glm(n~pol.f+vzd.f+stat.f,family=poisson,data=cv5.dat) summary(fit1) Call: glm(formula = n ~ pol.f + vzd.f + stat.f, family = poisson, data = cv5.dat) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** pol.fano < 2e-16 *** vzd.fstredni < 2e-16 *** vzd.fvysok < 2e-16 *** stat.fbritanie ** stat.fitalie stat.fmexiko stat.fsssr e-05 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for poisson family taken to be 1) Null deviance: on 29 degrees of freedom Residual deviance: on 22 degrees of freedom AIC: Interpretace parametru pol.fano = : Odhad šance na zájem o politiku mezi všemi účastníky studie je exp( ) = 1.80 Odhad pravděpodobnosti zájmu o politiku je 1.80/(1+1.80) = 0.64 Test kvality modelu: Pokud model platí, (residuální) deviance má chí-kvadrát rozdělení s 22 stupni volnosti (lze, neboť všechny regresory jsou diskrétní) Testová statistika: , model jasně zamítáme. Veličiny P, V, S nejsou vzájemně nezávislé. Model (PV,PS,VS) fit2 <- glm(n~(pol.f+vzd.f+stat.f)^2,family=poisson,data=cv5.dat) summary(fit2) Call: glm(formula = n ~ (pol.f + vzd.f + stat.f)^2, family = poisson, data = cv5.dat) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** pol.fano e-15 *** vzd.fstredni e-07 *** vzd.fvysok < 2e-16 *** stat.fbritanie e-05 *** stat.fitalie < 2e-16 *** stat.fmexiko < 2e-16 *** stat.fsssr pol.fano:vzd.fstredni < 2e-16 *** pol.fano:vzd.fvysok < 2e-16 *** Page 2
3 pol.fano:stat.fbritanie pol.fano:stat.fitalie < 2e-16 *** pol.fano:stat.fmexiko e-09 *** pol.fano:stat.fsssr e-11 *** vzd.fstredni:stat.fbritanie e-11 *** vzd.fvysok.:stat.fbritanie < 2e-16 *** vzd.fstredni:stat.fitalie < 2e-16 *** vzd.fvysok.:stat.fitalie e-13 *** vzd.fstredni:stat.fmexiko < 2e-16 *** vzd.fvysok.:stat.fmexiko < 2e-16 *** vzd.fstredni:stat.fsssr e-11 *** vzd.fvysok.:stat.fsssr < 2e-16 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for poisson family taken to be 1) Null deviance: on 29 degrees of freedom Residual deviance: on 8 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 V tomto modelu jsou všechny veličiny vzájemně závislé. Podmíněné poměry šancí dvou veličin však nezávisí na hodnotách třetí veličiny. Interpretace parametru pol.fano:vzd.fvysok. = Odhad poměru šancí na zájem o politiku mezi vysokoškoláky a lidmi se základním vzděláním je exp( ) = 7.91 Mezi vysokoškoláky je téměř 8-krát větší šance na zájem o politiku než mezi lidmi se základním vzděláním. anova(fit1,fit2,test="chisq") Analysis of Deviance Table Model 1: n ~ pol.f + vzd.f + stat.f Model 2: n ~ (pol.f + vzd.f + stat.f)^2 Resid. Df Resid. Dev Df Deviance P(> Chi ) Model s interakcemi je výrazně lepší. drop1(fit2,test="chisq") Single term deletions Model: n ~ (pol.f + vzd.f + stat.f)^2 Df Deviance AIC LRT Pr(Chi) <none> pol.f:vzd.f < 2.2e-16 *** pol.f:stat.f < 2.2e-16 *** vzd.f:stat.f < 2.2e-16 *** Žádnou z interakcí nelze z modelu vypustit. Test kvality modelu: Pokud model platí, (residuální) deviance má chí-kvadrát rozdělení s 8 stupni volnosti Testová statistika: 35.09, model jasně zamítáme. Musíme přejít k saturovanému modelu. Page 3
4 fit.s <- glm(n~(pol.f+vzd.f+stat.f)^3,family=poisson,data=cv5.dat) summary(fit.s) Call: glm(formula = n ~ (pol.f + vzd.f + stat.f)^3, family = poisson, data = cv5.dat) Deviance Residuals: [1] [26] Coefficients: Estimate Std. Err. z value Pr(> z ) (Intercept) < 2e-16 pol.fano e-10 vzd.fstredni vzd.fvysok e-13 stat.fbritanie stat.fitalie < 2e-16 stat.fmexiko < 2e-16 stat.fsssr pol.fano:vzd.fstredni e-08 pol.fano:vzd.fvysok e-10 pol.fano:stat.fbritanie pol.fano:stat.fitalie < 2e-16 pol.fano:stat.fmexiko e-07 pol.fano:stat.fsssr vzd.fstredni:stat.fbritanie vzd.fvysok.:stat.fbritanie vzd.fstredni:stat.fitalie e-10 vzd.fvysok.:stat.fitalie vzd.fstredni:stat.fmexiko < 2e-16 vzd.fvysok.:stat.fmexiko vzd.fstredni:stat.fsssr e-05 vzd.fvysok.:stat.fsssr e-10 pol.fano:vzd.fstredni:stat.fbritanie pol.fano:vzd.fvysok.:stat.fbritanie pol.fano:vzd.fstredni:stat.fitalie pol.fano:vzd.fvysok.:stat.fitalie pol.fano:vzd.fstredni:stat.fmexiko pol.fano:vzd.fvysok.:stat.fmexiko pol.fano:vzd.fstredni:stat.fsssr pol.fano:vzd.fvysok.:stat.fsssr Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for poisson family taken to be 1) Null deviance: e+03 on 29 degrees of freedom Residual deviance: e-13 on 0 degrees of freedom AIC: Saturovaný model je lepší než kterýkoli jiný model. Znamená to, že vztah kterýchkoli dvou studovaných veličin závisí na hodnotě třetí veličiny. Odpovědi na otázky bodu 5: (a) Je ve všech zemích stejná souvislost vzdělání se zájmem o politiku? Ne. Kdyby byla, data by byla v souladu s předchozím modelem. (b) Ve které zemi mají lidé se základním vzděláním nejmenší zájem o politiku? Základní vzdělání je referenční úroveň, takže se stačí podívat na interakce státu se zájmem o politiku. Jejich parametry porovnávají zájem o politiku mezi lidmi se základním vzděláním v jednotlivých zemích se Page 4
5 Spojenými státy. Nejvyšší hodnotu má Británie, nejnižší Itálie. (c) Na které úrovni vzdělání jsou nejmarkantnější rozdíly mezi zeměmi v zájmu o politiku? Je to mezi lidmi se základním, středním, nebo vysokoškolským vzděláním? Pro základní vzdělání už víme, že největší rozdíl je mezi Itálií a Británií. Poměr šancí na zájem o politiku mezi těmito dvěma zeměmi je exp( ( )) = 7.8. Pro střední vzdělání musíme vzít v úvahu i trojné interakce a správně je přičíst ke dvojným. pol.fano:stat.fbritanie pol.fano:vzd.fstredni:stat.fbritanie pol.fano:stat.fitalie pol.fano:vzd.fstredni:stat.fitalie pol.fano:stat.fmexiko pol.fano:vzd.fstredni:stat.fmexiko pol.fano:stat.fsssr pol.fano:vzd.fstredni:stat.fsssr Znaménka všech součtů jsou záporná, takže nejvyšší zájem o politiku mezi středoškoláky je v USA. Nejmenší součet má stále Itálie, Poměr šancí na zájem o politiku mezi těmito dvěma zeměmi je exp(-(-1.332)) = 3.8. Podobně u vysokoškoláků: pol.fano:stat.fbritanie pol.fano:vzd.fvysok.:stat.fbritanie pol.fano:stat.fitalie pol.fano:vzd.fvysok.:stat.fitalie pol.fano:stat.fmexiko pol.fano:vzd.fvysok.:stat.fmexiko pol.fano:stat.fsssr pol.fano:vzd.fvysok.:stat.fsssr Tentokrát je to USA vs. SSSR (i když Itálie je těsně za ním), poměr šancí exp(-( )) = 3.4. Největší rozdíly mezi zeměmi v zájmu o politiku jsou u lidí se základním vzděláním. (d) Ve které zemi je největší rozdíl v zájmu o politiku mezi lidmi se základním a vysokoškolským vzděláním? Nyní budeme brát parametry pro interakce politiky se vzděláním podle zemí. pol.fano:vzd.fvysok pol.fano:vzd.fvysok.:stat.fbritanie pol.fano:vzd.fvysok.:stat.fitalie pol.fano:vzd.fvysok.:stat.fmexiko pol.fano:vzd.fvysok.:stat.fsssr Najdeme odhad poměru šancí mezi vysokoškoláky a lidmi se základním vzděláním pro každou zemi zvlášť: USA: OR = exp( ) = 11.1 Británie: OR = exp( ) = 4.45 Itálie: OR = exp( ) = 21.3 Mexiko: OR = exp( ) = 10.6 SSSR: OR = exp( ) = 5.9 Největší rozdíl je v Itálii, nejmenší v Británii. Page 5
M cvičení : GLM04b (Vztah mezi Poissonovým a
RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04b (Vztah mezi Poissonovým a binomických rozdělením) Připomeňme, že pomocí Poissonova rozdělení P o(λ) lze dobře aproximovat binomické rozdělení Bi(n,
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,
VíceFrekvenční analýza, čtyřpolní tabulky
Frekvenční analýza, čtyřpolní tabulky V následujícím příkladě nás zajímá, zda sekání má pozitivní vliv na reprodukci studovaného druhu. V experimentu tedy máme dva druhy ošetření (sekané, nesekané) a pro
VíceM cvičení : GLM03a (The Working Activities of Bees)
RNDr. Marie Forbelská, Ph.D. 1 M7222 3. cvičení : GLM03a (The Working Activities of Bees) Popis dat je v souboru bees.txt, samotná data jsou uložena v souboru bees.dat. Nejprve načteme popisný soubor pomocí
VíceTabulární data, pozorované vs očekávané četnosti
Tabulární data, pozorované vs očekávané četnosti Máme data o počtech např. samců a samic v populaci a zajímá nás, zda naše pozorované (observed) četnosti se liší od předpokládaného (expected). Příklad
VíceM cvičení : GLM05b (Trojrozměrné kontingenční tabulky)
RNDr. Marie Forbelská, Ph.D. 1 M7222 5. cvičení : GLM05b (Trojrozměrné kontingenční tabulky) Příklad: Průzkum na školách V roce 1992 byl uskutečněn průzkum na školách Wright State University School of
Vícevelkou variabilitou: underdispersion, overdispersion)
RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04a (Problémy s příliš malou či příliš velkou variabilitou: underdispersion, overdispersion) Mějme náhodný výběry n =(Y 1,...,Y n ) T z rozdělení exponenciálního
VíceM cvičení : GLM01a (Toxic Chemical Production Data)
RNDr. Marie Forbelská, Ph.D. 1 M7222 1. cvičení : GLM01a (Toxic Chemical Production Data) Popis dat je v souboru toxic.txt, samotná data jsou uložena v souboru toxic.dat. Nejprve načteme popisný soubor
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých
VíceOpravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese
- základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní
VíceProblém 1: Ceny nemovitostí Poznámkykřešení 1
Problém 1: Ceny nemovitostí Poznámkykřešení 1 Zadání 1.Majínemovitostiurčenékbydlenívyššícenutam,kdeječistšíovzduší?Pokudano,okolik? 2. Lze vztah mezi znečištěním a cenou, pokud existuje, vysvětlit tím,
VíceModerní regresní metody. Petr Šmilauer Biologická fakulta JU České Budějovice (c) 1998-2007
Moderní regresní metody Petr Šmilauer Biologická fakulta JU České Budějovice (c) 1998-2007 Obsah Úvod... 5 1 Klasický lineární model a analýza variance... 7 Motivační příklad... 7 Fitování klasického lineárního
VíceVliv odlehlých hodnot, korelační koeficient, mnohonásobná regrese
Vliv odlehlých hodnot, korelační koeficient, mnohonásobná regrese 1. Vliv odlehlých hodnot Na následujících dvou příkladech ukážeme jak odlehlé hodnoty (outliers) ovlivňují výsledek analýzy a jak je identifikovat.
VícePokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.
Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena
VíceM cvičení : GLM01b (Porodní hmotnost novorozenců)
RNDr. Marie Forbelská, Ph.D. 1 M7222 1. cvičení : GLM01b (Porodní hmotnost novorozenců) V této části cvičení budeme pracovat s reálnými daty. Popis jednotlivých proměnných vstupních dat je v souboru novorozenci.txt,
VíceFisherův exaktní test
Katedra pravděpodobnosti a matematické statistiky Karel Kozmík Fisherův exaktní test 4. prosince 2017 Motivace Máme kontingenční tabulku 2x2 a předpokládáme, že četnosti vznikly z pozorování s multinomickým
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Pojem závislosti Je nutné rozlišit mezi závislostí nepodstatnou a mezi příčinnou čili kauzální závislostí.ta
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VícePSY117/454 Statistická analýza dat v psychologii Přednáška 10
PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
Více4ST201 STATISTIKA CVIČENÍ Č. 10
4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte
VíceUniverzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie
Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální
VíceANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII
ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno ÚVOD DO LOGLINEÁRNÍHO MODELOVÁNÍ historie - až do 60. let se k analýze kontingenčních tabulek
Vícepravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.
3.1 Základy teorie pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. Co se dozvíte Náhodný pokus a náhodný jev. Pravděpodobnost, počítání s pravděpodobnostmi.
VíceADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VíceSeminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VíceANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PRINCIPY STATISTICKÉ INFERENCE identifikace závisle proměnné
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VícePSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
VíceStav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceLineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
VíceSeminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná
VíceTECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD
TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VíceSemestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat
Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor
VíceCvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
VícePřednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
VíceANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII
ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno SOCIOLOGIE A STATISTIKA nadindividuální společenské struktury podmiňují lidské chování (Durkheim)
VíceDesign Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
VíceAnalýza reziduí gyroskopu umístěného na kyvadle p.1
Analýza reziduí gyroskopu umístěného na kyvadle Petr Šimeček Analýza reziduí gyroskopu umístěného na kyvadle p.1 Data z gyroskopu na kyvadle Data: 2 vzorky: RFILE, SIM frekvence 0.1s 30000 pozorování Proměnné:
VícePříklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VíceNáhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VíceAnalýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání
Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání 1. Analýzu variance (ANOVu) používáme při studiu problémů, kdy máme závislou proměnou spojitého typu a nezávislé proměnné
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceStatistická analýza dat
Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte
VíceSEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07
SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 Nesezónní časová řada - Základní údaje o časové řadě Časová řada příjmy z daní z příjmu v Austrálii ( http://www.economagic.com/emcgi/data.exe/tmp/213-220-208-205!20061203093308
VíceNáhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristik často potřebujeme všetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
VíceAVDAT Výběr regresorů v mnohorozměrné regresi
AVDAT Výběr regresorů v mnohorozměrné regresi Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Výběr správného lineárního modelu y = Xβ + ε, ale v matici X typu n (p + 1) je
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceMatematika pro geometrickou morfometrii (5)
Ján Dupej (jdupej@cgg.mff.cuni.cz) Laboratoř 3D zobrazovacích a analytických metod Katedra antropologie a genetiky člověka Přírodovědecká fakulta UK v Praze Cíle GM 1. Popsat tvar čísly 2. Čísla statisticky
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
VíceTestování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceStatistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
VíceStřední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
VíceČVUT FAKULTA DOPRAVNÍ
ČVUT FAKULTA DOPRAVNÍ 2011-2012 STATISTICKÝ PROJEKT STATISTICKÉ ZPRACOVÁNÍ DOTAZNÍKU 2 40 ROMAN VOKÁČ VALERIYA SIMBAEVA Obsah 1. Úvod...1 2. Plány studentů po maturitě...2 3. Volba vysoké školy...3 4.
VíceNárodní informační středisko pro podporu jakosti
Národní informační středisko pro podporu jakosti 1 ANALÝZA ROZPTYLU a její využití při vyhodnocování experimentálních dat Eva Jarošová, VŠE Praha 2 Obsah Podstata metody, jednofaktorová ANOVA F-test Mnohonásobná
VíceMatematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.
Opakování Opakování: y o střední hodnotě normálního 1 jednovýběrový t-test 2 párový t-test 3 výběrový t-test Šárka Hudecová Katedra a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VícePřednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceTechnická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
VíceNázev testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
VíceRNDr. Marie Forbelská, Ph.D. 1
RNDr. Marie Forbelská, Ph.D. 1 M6120 7. cvičení : M6120cv07 (Klasický lineární regresní model) A. Klasický lineární regresní model, modely neúplné hodnosti, rozšířený lineární regresní model a vážená metoda
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceZ mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
VíceTESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
VíceTestování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VíceRegrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceAplikovaná statistika v R - cvičení 2
Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceNávod na statistický software PSPP část 2. Kontingenční tabulky
Návod na statistický software PSPP část 2. Kontingenční tabulky Jiří Šafr FHS UK poslední revize 31. srpna 2010 Logika kontingenčních tabulek... 2 Postup vytváření kontingenčních tabulek v PSPP (SPSS)....
VíceROZDĚLENÍ NÁHODNÝCH VELIČIN
ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
VíceJak pracovat s daty TALIS v R
Jak pracovat s daty TALIS v R Jan Hučín (honza@hucin.cz), červenec 2014 Co je to R? R je svobodný software umožňující statistické zpracování dat pomocí velkého množství metod, a to od základních až po
VíceJana Vránová, 3. lékařská fakulta, UK Praha
Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně
Více