Základní popisné statistiky a grafy
|
|
- Ladislava Macháčková
- před 6 lety
- Počet zobrazení:
Transkript
1 Základní popisné statistiky a grafy Úvodní nastavení. Ve svém domovském adresáři si založte speciální adresář nmsa331 na toto cvičení. Z internetové stránky si stáhněte datový soubor Hosi.txt a uložte si jej do adresáře nmsa331. Můžete si také stáhnout zdrojový kód k dnešnímu cvičení cviceni8.r. Otevřete si program R Studio. Změňte si pracovní adresář pomocí Session Set working directory Choose directory na Váš právě založený adresář nmsa331 nebo napište přímo setwd("h:/nmsa331") Pomocí File Open.. si otevřete soubor cviceni8.r. Během dnešního cvičení můžete bud jen postupně spouštět řádky tohoto souboru nebo pracovat samostatněji a psát si vlastní zdrojový kód na základě tohoto pdf. Nechejte si vypsat seznam objektů, které jsou aktivní: ls() a případně proved te před další prací vyčištění rm(list=ls()) Základní operace v programu R 1. R používáme bud tak, že píšeme příkazy přímo do okna Console nebo (což je preferováno) si příkazy píšeme do zvláštního souboru a odtud je spouštíme. 2. Použijte R jako kalkulačku a spočítejte následující výrazy: 1 + 1, 2 3, 34, 3, log(10), exp(10), sin ( π 2 ). Nechte si vypsat nápovědu k funkci log tak, že zadáte?log. Stejným způsobem si lze zavolat nápovědu ke každé funkci v R. 3. Posloupnost čísel můžeme v R zadat různými způsoby. Vyzkoušejte následující: c(5,6,7,8,9,10) 5:10 (5:10)/5 seq(1,2,by=0.2) seq(1,2,length=10) rep(1,5) 4. Do vektoru nazvaného x si uložíme počty bodů ze zápočtové písemky u chlapců a do y počty bodů u dívek. x=c(55, 60, 63, 64, 67, 68, 75, 75, 84, 86, 87, 95) y=c(20, 63, 64, 70, 75, 82, 87) 1
2 Pomocí funkcí min, max, mean si spočítejte minimální, maximální a průměrné počty bodů. Kolik máme na cvičení chlapců a kolik dívek? (Použijte funkci length). Procentuální úspěšnost u chlapců a dívek zvlášt bychom spočítali jako mean(x>=60) mean(y>=60) Spočtěte si podobným způsobem, kolik procent studentů dosáhlo lepšího výsledku než Vy. (Společný vektor všech bodů bez rozlišení pohlaví získáte jako z=c(x,y).) Práce s daty popisné statistiky 4. Načtěte si data Hosi.txt. Bud naklikáním pomocí Import data set nebo pomocí příkazu Hosi=read.table("Hosi.txt",header=TRUE) 5. Základní prohlídka dat: Na data můžeme nahlédnout kliknutím na jejich název v seznamu proměnných vpravo nahoře. Užitečné příkazy jsou head(hosi) dim(hosi) summary(hosi) Můžeme vidět, že v datech máme následující proměnné: porodní hmotnost v g, porodní délku v cm, věk matky, věk otce, hmotnost dítěte v 1 roce v g, délku v 1 roce a pořadové číslo dítěte. 6. Dále nás bude zajímat pouze porodní hmotnost. Můžeme předpokládat, že data odpovídají realizaci náhodného výběru. Pro jednoduchost si je uložíme do vektoru hmot a do n si uložíme rozsah výběru. hmot= Hosi$por.hmot (n=length(hmot)) 7. Spočítejte si základní charakteristiky polohy: minimum, maximum, průměr. 8. Spočtěte si medián pomocí funkce median. Pozor ale, R počítá výběrový medián trochu jinak než bylo zavedeno na přednášce (viz dále u kvantilů). 9. Spočítejte si základní charakteristiky variability pomocí funkcí var, sd. Uvědomte si, v jakých jednotkách jsou tyto kvantity a která z nich je tedy vhodnější pro prezentaci v případném výstupu. Variabilitu můžeme ještě charakterizovat rozpětím, které získáme jako rozdíl minima a maxima. 10. Budeme počítat výběrové kvantily porodní hmotnosti. Jak je známo z přednášky, existuje více definic výběrových kvantilů. Zjistíme si, jak je počítá R?quantile 2
3 Připomeňme si, že na přednášce byly výběrové kvantily definované tak, že pro α (0, 1) je û n (α) = X (kα), kde k α = αn, pokud αn je celé číslo, a k α = nα + 1 pokud αn není celé číslo. Odtud vyčteme, že defaultně je nastaven jiný postup, než jaký byl na přednášce. Pro naše případy tedy budeme používat nastavení type=1. Spočteme si tedy několik výběrových kvantilů (kvant <- quantile(hmot, prob = c(0.1, 0.25, 0.5, 0.75, 0.9), type=1)) Pro α = 0.25 ověříme, že to opravdu odpovídá definici z přednášky: quantile(hmot,prob=0.25,type=1) sort(hmot)[floor(n*0.25)+1] Pro α = 0.99 vyzkoušejte zadat různé typy ve funkci quantile (1 až 9) a porovnejte výsledky. 11. Můžeme si nechat vykreslit obrázek empirické distribuční funkce a její souvislost s výběrovými kvantily: plot.stepfun(ecdf(hmot), verticals=true, do.points=false, ylab=expression(f[n](x)), main="empiricka distribucni funkce") abline(h=0.1, col="blue") abline(h=0.25, col="blue") abline(h=0.5, col="blue") abline(h=0.75, col="blue") abline(h=0.9, col="blue") lines(rep(kvant[1], 2), c(-1,0.1), col="red") lines(rep(kvant[2], 2), c(-1,0.25), col="red") lines(rep(kvant[3], 2), c(-1,0.5), col="red") lines(rep(kvant[4], 2), c(-1,0.75), col="red") lines(rep(kvant[5], 2), c(-1,0.9), col="red") text(rep(2000,5), c(0.1,0.25,0.5,0.75,0.9)+0.02, labels=c(0.1,0.25,0.5,0.75,0.9), col="blue") Funkce ecdf počítá empirickou distribuční funkci. Tu si pak můžeme vykreslit (funkce plot nebo plot.stepfun porovnejte výsledky) nebo můžeme chtít její hodnotu v nějakém bodě. Např. pro 4000 zjistíme výsledek ecdf(hmot)(4000). Připomeňte si, co touto kvantitou odhadujeme. 12. Další charakteristikou variability, založenou na kvantilech, je mezikvartilové rozpětí, které je rozdílem třetího a prvního kvartilu. Můžeme si ho spočítat pomocí funkce IQR. Toto číslo je pro popis dat někdy užitečnější než směrodatná odchylka. Uložte si ho do proměnné iqr a vyzkoušejte, že funkce IQR skutečně počítá to, co má. Popisné grafy 14. Tzv. krabicový graf nám graficky znázorňuje některé popisné statistiky a také nám dává určitou představu o tvaru zkoumaného rozdělení boxplot(hmot, ylab="porodni hmotnost [g]") 3
4 Pomocí porovnání s popisnými statistikami hmotnosti summary(hmot) zkuste přijít na to, co je na grafu znázorněno. Příkaz abline(h=3140) nám např. vykreslí horizontální čáru s y souřadnicí Ověřte tímto způsobem, že v tomto našem případě horní a dolní fousy odpovídají hodnotám Q IQR a Q1 1.5IQR. Proč právě 1.5 násobek? V případě výběru z N(0, 1) by mezi fousy měla ležet následující proporce dat: pnorm(qnorm(0.75)+1.5*(qnorm(0.75)-qnorm(0.25))) - pnorm(qnorm(0.25)-1.5*(qnorm(0.75)-qnorm(0.25))) V případě jiných rozdělení už to však neplatí! 15. Kdybychom chtěli vědět, které hodnoty leží mimo fousy a jaká je jejich relativní četnost: bobj = boxplot(hmot) sort(bobj$out) length(bobj$out)/n Proměnná bobj je typu list. Pomocí funkce names(bobj) se můžeme nechat vypsat její složky. Vyzkoušejte a nechte si vypsat bobj$stat 16. Samostatně si vykreslete boxploty počtů bodů z písemky. Co jsou zde fousy boxplotu? Jak tedy obecně popíšeme vzhled boxplotu? 17. Nyní se budeme zabývat histogramem, který nám slouží jako odhad hustoty rozdělení. hist(hmot) hist(hmot, prob = TRUE, xlab = "Porodni hmotnost [g]", main = "Histogram") Jaký je rozdíl mezi výše uvedenými dvěma obrázky? 18. U histogramu je poměrně zásadní počet uvažovaných intervalů. Porovnejte: par(mfrow=c(1,2)); hist(hmot, prob = TRUE, breaks=seq(1750, 5100, by=10), main = "Delka intervalu 10"); hist(hmot, prob = TRUE, breaks=seq(1500, 5500, by=1000), main = "Delka intervalu 1000"); par(mfrow=c(1,1)); 19. Funkce hist používá následující výpočet intervalů histogramu: Nejprve se použije tzv. Sturgesovo pravidlo, které říká, že optimální počet intervalů je roven horní celé části z log 2 (n) plus jedna. Pak se použije funkce, která vytvoří hezké intervaly (k <- ceiling(1+log2(length(hmot)))) pretty(hmot, k) 4
5 Srovnáme tento výsledek s tím, co dělá funkce hist. Opět si uložíme celý objekt (typu list) do proměnné hobj a podíváme se na jeho složky. hobj <- hist(hmot, prob = TRUE) hobj$breaks hobj$counts Spočtěte si pomocí funkce length kolik tedy máme v histogramu sloupců. 20. Porovnáme histogram našich dat s hustotou normálního rozdělení, které by mělo střední hodnotu rovnou průměru našich dat a směrodatnou odchylku rovnou výběrové směrodatné odchylce. xbar <- mean(hmot) smodch <- sd(hmot) xgrid <- seq(xbar - 3.5*smodch, xbar + 3.5*smodch, length = 500) fxgrid <- dnorm(xgrid, mean = xbar, sd = smodch) hist(hmot, prob = TRUE, xlab = "Porodni hmotnost [g]", main = "") lines(xgrid, fxgrid, col = "red", lwd = 2) Nebo to lze provést následovně: hist(hmot,prob=true, xlab = "Porodni hmotnost [g]", main = "") curve(dnorm(x,mean=mean(hmot),sd=sd(hmot)),from=min(hmot),to=max(hmot), add=t,col="red",lwd=2) 21. V budoucnu nás bude často zajímat, zda můžeme data považovat za náhodný výběr z normálního rozdělení. Z grafických metod můžeme použít výše uvedené srovnání histogramu s hustotou, ale z něho někdy nevidíme velmi dobře, jak nám normální rozdělení sedí v krajích. Proto je vhodnější se podívat se na tzv. Q-Q graf. qqnorm(hmot, cex=0.2) qqline(hmot) Q-Q graf obecně srovnává výběrové kvantily spočtené z dat (osa y) s teoretickými kvantily nějakého rozdělení. Zde v případě normálního Q-Q grafu odpovídají y souřadnice přímo uspořádaným datům a x-ové souřadnice kvantilům standardizovaného normálního rozdělení. V případě, že data pocházejí z normálního rozdělení, tak by body měly ležet na přímce. Umíte to teoreticky zdůvodnit? 22. Vykreslíme si Q-Q graf počtu bodů z písemky (bez rozlišení) a necháme si vypsat souřadnice bodů z=c(x,y) qqnorm(z) qqline(z) Pro n > 10 jsou kvantily na ose x počítané na hladině i 1/2 n ppoints. pro i = 1,..., n. Viz také funkce 5
6 Samostatná práce 1. Spočítejte si základní popisné statistiky (charakteristiky polohy i variability) pro počet bodů z písemky (bez rozlišení, zda jde o chlapce nebo dívku). 2. Spočítejte výběrový 90% kvantil podle definice z přednášky. Kolik studentů má více bodů než je hodnota tohoto kvantilu? 3. Spočítejte si výběrový 95% kvantil pomocí funkce quantile i přímo podle definice z přednášky. Máte shodný výsledek? 4. Vykreslete si empirickou distribuční funkci počtu bodů. Vyznačte v ní 90% kvantil. 5. Nakreslete si histogram počtu bodů. Přidejte do obrázku hustotu normálního rozdělení s vhodnými parametry. 6. Vykreslete si vedle sebe do jednoho obrázku boxplot počtu bodů chlapců a dívek. 7. Vyrobte ručně Q-Q graf počtu bodů z písemky, tj. bez použití funkcí qqnorm a qqline. 8. Generování pseudonáhodných čísel: Podíváme se na to, že i data generovaná přímo z normálního rozdělení nemusí pro malé n vypadat ideálně : n=50 data=rnorm(n,mean=20,sd=1) hist(data,prob=t) curve(dnorm(x,mean=mean(data),sd=sd(data)),from=min(data),to=max(data), add=true,col="red") qqnorm(data) qqline(data) Zkuste zvyšovat n a dívat se, jaké obrázky dostáváte. 9. Proved te podobný postup jako v 8. pro exponenciální rozdělení. Použijte funkci rexp(n,rate=1). 6
Základní popisné statistiky a grafy
Základní popisné statistiky a grafy 3.11.017 Úvodní nastavení. Ve svém domovském adresáři si založte speciální adresář nmsa331 na toto cvičení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test 30.11.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq.txt a můžete si stáhnout i zdrojový
Pracovní text a úkoly ke cvičením MF002
Pracovní text a úkoly ke cvičením MF002 Ondřej Pokora, PřF MU, Brno 11. března 2013 1 Brownův pohyb (Wienerův proces) Základním stavebním kamenem simulací náhodných procesů popsaných pomocí stochastických
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test 27.11.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq.txt a můžete si stáhnout i zdrojový
Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.
Dvouvýběrové testy 11.12.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq2.txt a zdrojové kódy cviceni11.r a figks.r. Otevřete si program R Studio,
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
Testy o proporci a testy v multinomickém rozdělení
Testy o proporci a testy v multinomickém rozdělení 18.12.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si můžete stáhnout zdrojový kód cviceni12.r. Otevřete si
Y n = I[X i > m 0 ],
Neparametrické jednovýběrové testy a párové testy 4.12.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si můžete si stáhnout zdrojový kód k dnešnímu cvičení cviceni10.r.
Popisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Matematická statistika Zimní semestr
Dvouvýběrové testy 11.12.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq2.txt a zdrojové kódy cviceni11.r a figks.r, případně i cviceni11-obrazky.r.
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
Matematická statistika Zimní semestr
Neparametrické jednovýběrové testy a párové testy 4.12.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si můžete si stáhnout zdrojový kód k dnešnímu cvičení cviceni10.r.
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Matematická statistika Zimní semestr
Analýza rozptylu (jednoduché třídění) 11.1.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Med.txt. Otevřete si program R Studio a načtěte si výše
Popisná statistika. Komentované řešení pomocí programu R. Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze
Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Máme k dispozici data o počtech bodů z 1. a 2. zápočtového
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Nejčastější chyby v explorační analýze
Nejčastější chyby v explorační analýze Obecně doporučuju přečíst přednášku 5: Výběrová šetření, Exploratorní analýza http://homel.vsb.cz/~lit40/sta1/materialy/io.pptx Použití nesprávných charakteristik
Cvičení z biostatistiky 06
Cvičení z biostatistiky 06 Poslední úprava dokumentu: 16. března 2017. Opakování na větším datovém souboru 1 Úvod Datový soubor Kojeni.csv obsahuje údaje (hodnoty oddělené středníky) o 99 matkách a jejich
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára
Odhady parametrů základního souboru Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára Motivační příklad Mám průměrné roční teploty vzduchu z 8 stanic
Aplikovaná statistika v R
Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15 Co bude náplní našich
Základy pravděpodobnosti a statistiky. Popisná statistika
Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
Metodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
Matematická statistika Zimní semestr Testy o proporci
Testy o proporci 18.12.2018 Jednovýběrový problém pro binární data. V roce 2008 se v České republice živě narodilo 119 570 dětí, z toho 58 244 dívek a 61 326 chlapců (zdroj ČSÚ). Zajímá nás, zda je pravděpodobnost
Popisná statistika. Jaroslav MAREK. Univerzita Palackého
Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí
mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.
Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.
Cvičení z NSTP097 14. 12. 2009
Cvičení z NSTP097 14. 12. 2009 Empirická distribuční funkce, intervalové odhady Úvodní nastavení. Ze stránky www.karlin.mff.cuni.cz/~omelka/vyuka_stp097.php si stáhněte soubor cviceni2.rdata. Otevřete
Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)
Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA) 8.1.2018 Testy dobré shody se známými parametry. Mezi 891 studenty pražských vysokých škol byl na podzim 2017 proveden průzkum týkající
Testy nezávislosti kardinálních veličin
Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Číselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
Přijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Př. : Stanovte jednotlivé četnosti a číselné charakteristiky zadaného statistického souboru a nakreslete krabicový graf:, 8, 7, 43, 9, 47, 4, 34, 34, 4, 35. Statistický soubor seřadíme vzestupně podle
Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
Renáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
Základy popisné statistiky
Základy popisné statistiky V této kapitole se seznámíme se základy popisné statistiky, představíme si základní pojmy a budeme si je ilustrovat na praktických příkladech. Kapitola je psána formou volného
z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
Praktická statistika. Petr Ponížil Eva Kutálková
Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
marek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry
Červenou barvou jsou poznámky, věci na které máte při vypracovávání úkolu myslet. Úkol 1 a) Pomocí nástrojů explorační analýzy analyzujte kapacity akumulátorů výrobce A po 5 a po 100 nabíjecích cyklech.
Porovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
Číselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
M praktikum : M0130pr03
RNDr. Marie Forbelská, Ph.D. 1 M0130 3. praktikum : M0130pr03 (Úvodní analýza časových řad) A. Roční data: Příklad 1 Máme k dispozici historická roční data, která se týkají minimálních (dolních) hladin
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.
Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Výpočet pravděpodobností
Výpočet pravděpodobností Pravděpodobnostní kalkulátor v programu STATISTICA Cvičení 5 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen 2016 Ambrožová Klára Trocha teorie Náhodné jevy mají
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
Simulace. Simulace dat. Parametry
Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,
Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu
Metoda Monte Carlo a její aplikace v problematice oceňování technologií Manuál k programu This software was created under the state subsidy of the Czech Republic within the research and development project
přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.
3 Grafické zpracování dat Grafické znázorňování je velmi účinný způsob, jak prezentovat statistické údaje. Grafy nejsou tak přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých
Informační technologie a statistika 1
Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek
Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese
- základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data
Vzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze
Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".
Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2
Semestrální projekt do předmětu Statistika Vypracoval: Adam Mlejnek 2-36 Oponenti: Patrik Novotný 2-36 Jakub Nováček 2-36 Úvod Pro vypracování projektu do předmětu statistika jsem si zvolil průzkum kvality
KORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
StatSoft Jak se pozná normalita pomocí grafů?
StatSoft Jak se pozná normalita pomocí grafů? Dnes se podíváme na zoubek speciální třídě grafů, podle názvu článku a případně i ilustračního obrázku vpravo jste jistě již odhadli, že půjde o třídu pravděpodobnostních
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Kontingenční tabulky a testy shody
Kontingenční tabulky a testy shody 4.1.2018 Kontingenční tabulky 1. Tabulka 1 shrnuje osudy pasažérů lodě Titanic, která tragicky ztroskotala v roce 1912. Zajímá nás, zda existuje nějaká souvislost mezi
MATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
SEMESTRÁLNÍ PRÁCE Z X37SAS Zadání č. 7
SEMESTRÁLNÍ PRÁCE Z X37SAS Zadání č. 7 Daniel Tureček St-lichý týden, 9:15 Zadání Určete periodu signálu s(k), určete stejnosměrnou složku, výkon, autokorelační funkci. Záznam signálu je v souboru persig2.
Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?
Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Vzorová písemka č. 1 (rok 2015/2016) - řešení
Vzorová písemka č. rok /6 - řešení Pavla Pecherková. května 6 VARIANTA A. Náhodná veličina X je určena hustotou pravděpodobností: máme hustotu { pravděpodobnosti C x pro x ; na intervalu f x jinde jedná
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
23. Matematická statistika
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
4.2.15 Funkce kotangens
4..5 Funkce kotangens Předpoklady: 44 Pedagogická poznámka: Pokud nemáte čas, doporučuji nechat tuto hodinu studentům na domácí práci. Nedá se na tom nic zkazit a v budoucnu to není nikde příliš potřeba.
Náhodná veličina a rozdělení pravděpodobnosti
3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro