Cvičení z biostatistiky 06
|
|
- Renata Bartošová
- před 5 lety
- Počet zobrazení:
Transkript
1 Cvičení z biostatistiky 06 Poslední úprava dokumentu: 16. března Opakování na větším datovém souboru 1 Úvod Datový soubor Kojeni.csv obsahuje údaje (hodnoty oddělené středníky) o 99 matkách a jejich dětech (data získala Mgr. P. Hajná při přípravě své diplomové práce). Najdeme zde následující proměnné: trvani pocet.deti Vzdelani por.hmotnost por.delka Prs hmotnost delka vyska.m vyska.o Otec vek.m vek.o Dudlik Plan Porodnice Koj24 HochL hoch Hoch délka kojení v prvních 24 týdnech po porodu (týdny); o kolikáté dítě matky jde; vzdělání matky (základní/maturita/vš); porodní hmotnost dítěte (g); porodní délka dítětete (cm); dítě bylo do půl hodiny po porodu přiloženo k prsu (0=ne, 1=ano); hmotnost dítěte ve 24. týdnu po porodu (g); délka dítěte ve 24. týdnu po porodu (cm); výška matky (cm); výška otce (cm); otec u porodu (0=ne, 1=ano); věk matky (roky); věk otce (roky); dítě mělo dudlík (0=ne, 1=ano); dítě bylo podle matky plánované (0=ne, 1=ano); rozlišení dvou porodnic, v nichž byla pořizována data (1=Praha, 2=okresní město); matka kojila ještě ve 24. týdnu po porodu (0=ne, 1=ano); dítě je hoch (FALSE=ne, TRUE=ano); dítě je hoch (0=ne, 1=ano); pohlaví dítěte (dívka/hoch). 1) Načtěte data do R, datovou tabulku nazvěte Kojeni. Menu RStudia: File y Import Dataset y from CSV y Browse... y Name Kojeni Delimiter Semicolon (středník) First Row as Names Nebo příkazem: Kojeni <- read.csv2("./data/kojeni.csv", header=true) 2) Zatím si nezajišt ujte přímý přístup k jednotlivým proměnným v datech, tj. nespouštějte příkaz attach(kojeni). 1
2 2 Základní popisná statistika 1) Udělejme si představu o charakteristikách jednotlivých proměnných tím, že pro ně spočítáte základní popisné statistiky. Popisné statistiky pro všechny proměnné datového souboru spočteme pomocí příkazu: summary(kojeni) 3 Úprava dat 1) Zjistěme četnosti jednotlivých stupňů vzdělání matky: table(kojeni$vzdelani) 2) Jak vidíme, ve výstupu jsou nevhodně srovnané skupiny (maturita, VŠ, základní). Změňme uspořádání skupin ve vnitřním uložení dat. Kojeni <- transform(kojeni, Vzdelani = factor(vzdelani, levels=c("zakladni", "maturita", "VS"))) Anebo: Kojeni$Vzdelani <- factor(kojeni$vzdelani, levels=c("zakladni", "maturita", "VS")) 3) Znovu spočtěte četnosti jednotlivých stupňů vzdělání matky. 4) K nula-jedničkovým proměnným Prs, Otec, Dudlik, Plan, Koj24 vytvořme factorové protějšky nazvané fprs, fotec, fdudlik, fplan, fkoj24 nabývající hodnot ne, ano. Kojeni$fPrs <- factor(kojeni$prs, labels=c("ne", "ano")) Kojeni$fOtec <- factor(kojeni$otec, labels=c("ne", "ano")) Kojeni$fDudlik <- factor(kojeni$dudlik, labels=c("ne", "ano")) Kojeni$fPlan <- factor(kojeni$plan, labels=c("ne", "ano")) Kojeni$fKoj24 <- factor(kojeni$koj24, labels=c("ne", "ano")) Nebo pomocí příkazu transform: Kojeni <- transform(kojeni, fprs=factor(kojeni$prs, labels=c("ne", "ano"))) a ostatní proměnné analogicky. 5) K proměnné Porodnice vytvořte faktorovou proměnnou fporodnice, jež bude nabývat hodnot Praha, okres. 6) Pro kontrolu znovu spočtěte základní popisné statistiky pro všechny proměnné datového souboru Kojeni. 6 Mají hodnoty ve sloupci Plan rozumnou interpretovatelnost? Pokud ano, jakou? 6 Mají hodnoty ve sloupci Porodnice rozumnou interpretovatelnost? Pokud ano, jakou? 6 Nabývá-li nějaká proměnná pouze dvou hodnot, je lepší ji v datech kódovat jako 0, 1 nebo spíše jako 1, 2? Nebo ještě jinak? 7) Pro pozdější použití si uložme datovou tabulku Kojeni (včetně všech dnes vytvořených proměnných) v R-kovém datového formátu (přípona RData). save(kojeni, file = "./data/kojeni.rdata") 2
3 4 Tvar rozdělení kvantitativního znaku 1) Umožněme přímý přístup k jednotlivým proměnným datové tabulky Kojeni. Spust te ze skriptového okna příkaz attach(kojeni) 2) Nakresleme normální QQ graf pro věk matek (vek.m) qqnorm(vek.m, pch=16, col="red", xlab="teoreticke kvantily N(0, 1)", ylab="kvantily veku matek", main="normalni QQ graf (vek matek)") qqline(vek.m, lty=6, col="darkblue") 6 Co si myslíte o rozdělení věku matek. Lze předpokládat normalitu? 3) Nakresleme histogram věku matek (přeškálovaný tak, aby odhadoval hustotu). hist(vek.m, prob=true, col="slateblue", xlab="vek matky", ylab="hustota", main="histogram (vek matek)") Pro porovnání lze pak do histogramu přidat hustotu normálního rozdělení, jehož parametry odhadneme z dat curve(dnorm(x,mean(vek.m),sd(vek.m)), col="red", add=true) 4) Spočtěme výběrovou šikmost a špičatost pro věk matek. Pro připomenutí: a 3 = 1 n a 4 = 1 n n i=1 n i=1 ( xi x ) 3 (výběrová šikmost), ( xi x ) 4 3 (výběrová špičatost). 6 Veličiny z i = x i x (i = 1,..., n) se někdy nazývají z-skóry a v R je lze získat pomocí funkce scale. Výběrovou šikmost a špičatost proto snadno spočteme pomocí následujících příkazů: mean(scale(vek.m)^3) mean(scale(vek.m)^4) - 3 ## sikmost ## spicatost 6 Jakých hodnot (přibližně) by výběrová šikmost a špičatost měla nabývat, jestliže bychom mohli předpokládat normalitu rozdělení věku matek? 6 Co lze usuzovat z kladné a co ze záporné šikmosti? 5) Nakreslete normální QQ graf a histogram a spočtěte výběrovou šikmost a špičatost pro hmotnost ve 24. týdnu (hmotnost). 6 Co lze soudit o tvaru rozdělení hmotnosti ve 24. týdnu? 6) Nakreslete normální QQ graf a histogram a spočtěte výběrovou šikmost a špičatost pro výšku otců (vyska.o). 6 Co lze soudit o tvaru rozdělení výšky otců? 3
4 5 Popisná statistika: kvantitativní a kvalitativní znak 1) Spočtěme základní popisné statistiky pro věk matek (vek.m) v závislosti na místu porodu (fporodnice). tapply(vek.m, fporodnice, summary) tapply(vek.m, fporodnice, sd) tapply(vek.m, fporodnice, var) tapply(vek.m, fporodnice, length) ### smer. odchylky ### rozptyly ### pocty pozorovani 2) Nakresleme krabičkové grafy pro věk matek, ze kterých půjdou snadno porovnat základní charakteristiky rozdělení věku matek v Praze a v okresním městě. plot(vek.m ~ fporodnice, col=c("brown4", "palegreen"), xlab="misto porodu", ylab="vek matek") 6 Domníváte se, že se věková struktura rodících matek liší mezi Prahou a okresem? 6 Později budeme zkoumat odlišnost populačních průměrů věku matek mezi Prahou a okresem pomocí dvouvýběrových testů (t-test, Wilcoxonův test). 3) Spočtěte základní popisné statistiky pro věk matek (vek.m) v závislosti na vzdělání (Vzdelani). 4) Nakreslete krabičkové grafy pro věk matek, ze kterých půjdou snadno porovnat základní charakteristiky rozdělení věku matek v závislosti na vzdělání. 6 Domníváte se, že věk rodící matky závisí na vzdělání? 6 Později budeme zkoumat závislost věku matky na vzdělání pomocí vícevýběrových testů (analýza rozptylu, Kruskalův-Wallisův test). 5) Spočtěte základní popisné statistiky pro věk otců (vek.o) v závislosti na vzdělání matky (Vzdelani) 6) Nakreslete krabičkové grafy pro věk otců, z kterých půjdou snadno porovnat základní charakteristiky rozdělení věku otců v závislosti na vzdělání matky. 6 Domníváte se, že věk otce závisí na vzdělání matky? 6 Popisná statistika: dva kvalitativní znaky 1) Spočtěme kontingenční tabulku pro vzdělání matky (Vzdelani) a plánování dítěte (fplan) a s ní související podmíněné relativní četnosti (podmiňujme vzděláním). table(vzdelani, fplan) prop.table(table(vzdelani, fplan), margin=1) * 100 2) Zobrazme spočtené podmíněné relativní četnosti ve formě sloupcového grafu. plot(fplan ~ Vzdelani, col=c("red", "darkgreen"), xlab="vzdelani matky", ylab="planovane dite") 6 Domníváte se, že pravděpodobnost jevu, že dítě je plánované, závisí na vzdělání matky? 6 Později budeme zkoumat závislost pravděpodobnosti plánovaného rodičovství na vzdělání matky pomocí χ 2 (chí kvadrát) testu nezávislosti. 3) Spočtěte kontingenční tabulku pro vzdělání matky (Vzdelani) a pohlaví dítěte (Hoch) a s ní související podmíněné relativní četnosti (podmiňujte vzděláním). 4) Zobrazte spočtené podmíněné relativní četnosti ve formě sloupcového grafu. 6 Domníváte se, že pohlaví dítěte závisí na vzdělání matky? 4
5 7 Popisná statistika: dva kvantitativní znaky 1) Spočtěme korelační koeficient mezi hmotností a délkou dítěte ve 24. týdnu (hmotnost a delka). cor(hmotnost, delka) 2) Nakresleme bodový graf závislosti hmotnosti na délce. plot(hmotnost ~ delka, col="red", pch=16, xlab="delka (cm)", ylab="hmotnost (kg)") 3) Nakresleme bodový graf závislosti hmotnosti na délce, ve kterém dále odlišíme chlapce a dívky. divky <- which(hoch=="divka") # kde jsou v datech dívky hosi <- which(hoch=="hoch") # kde jsou v datech hoši plot(delka[divky], hmotnost[divky], col="violet", pch=6, xlab="delka (cm)", ylab="hmotnost (kg)") points(delka[hosi], hmotnost[hosi], col="darkblue", pch=17) Do grafu přidáme legendu legend("bottomright", legend=c("divka", "Chlapec"), col=c("violet","darkblue"), pch=c(6,17)) 6 Domníváte se, že hmotnost nějakým způsobem závisí na délce? 6 Domníváte se, že případná závislost hmotnosti na délce je jiná pro chlapce a jiná pro dívky? 6 Později budeme zkoumat závislost hmotnosti na délce a případné odlišnosti v této závislosti s ohledem na pohlaví pomocí lineární regrese. 4) Uložte si skript a zavřete RStudio. 5
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
VíceCvičení z biostatistiky 03
Cvičení z biostatistiky 03 Poslední úprava dokumentu: 14. března 2017. Popisná statistika pro dvě kvantitativní proměnné 1 Úvod 1) Nemáte-li z minula uložen datový soubor Deti23 v R formátu (soubor Deti23.RData),
VíceCvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
VíceVŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Více(Poslední změna: 14. dubna 2018)
R tahák (Poslední změna: 14. dubna 2018) 1 Zahájení práce setwd("popis_cesty_k_adresari") rm(list=ls()) # nastavení adresáře # úklid Dále se může hodit: getwd() ls() # zjištění pracovního adresáře # výpis
VícePracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem
Pracovní adresář getwd() # výpis pracovního adresáře setwd("c:/moje/pracovni") # nastavení pracovního adresáře setwd("c:\\moje\\pracovni") # nastavení pracovního adresáře Nápověda?funkce # nápověda pro
VíceAnalýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
VíceVzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
VíceCvičení z biostatistiky 01
Cvičení z biostatistiky 01 Poslední úprava dokumentu: 16. února 2017. Seznámení s R 1 Úvod 1) Postup prací pro cvičení se bude postupně objevovat na webu cvičícího: http://www.karlin.mff.cuni.cz/~turcic
VíceVŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Více4. Zpracování číselných dat
4. Zpracování číselných dat 4.1 Jednoduché hodnocení dat 4.2 Začlenění dat do písemné práce Zásady zpracování vědecké práce pro obory BOZO, PÚPN, LS 2011 4.1 Hodnocení číselných dat Popisná data: střední
VíceZáklady pravděpodobnosti a statistiky. Popisná statistika
Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,
VícePopisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Více5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
VíceSTATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
VíceStatistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceObsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceProgram Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VíceMgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VíceADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
VíceZákladní popisné statistiky a grafy
Základní popisné statistiky a grafy 3.11.017 Úvodní nastavení. Ve svém domovském adresáři si založte speciální adresář nmsa331 na toto cvičení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/
VíceJarqueův a Beryho test normality (Jarque-Bera Test, JB test)
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceTřídění statistických dat
2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.
VíceVYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceTEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT
EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka
VícePopisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
VíceMATEMATICKÁ STATISTIKA 1 ( )
MATEMATICKÁ STATISTIKA 1 (2014 15) Zápočtové domácí úkoly (společné pro obě paralelky) Obecné pokyny q q Úlohy se odevzdávají vždy na začátku Vašeho cvičení (Vašemu cvičícímu, případně jeho záskoku). Úlohy
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
VíceMatematická statistika Zimní semestr
Analýza rozptylu (jednoduché třídění) 11.1.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Med.txt. Otevřete si program R Studio a načtěte si výše
VíceÚkol 12. Přemysl Bejda. 22. března SAS slouží pro statistiky, jeho využití není příliš flexibilní, protože v něm nelze psát vlastní procedury.
Úkol 12 Přemysl Bejda 22. března 2008 1 Něco málo k SAS SAS slouží pro statistiky, jeho využití není příliš flexibilní, protože v něm nelze psát vlastní procedury. Komentáře v programu píšeme pomocí symbolu
VíceANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PRINCIPY STATISTICKÉ INFERENCE identifikace závisle proměnné
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VícePřednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
VíceVybrané partie z biostatistiky
1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceZákladní popisné statistiky a grafy
Základní popisné statistiky a grafy 20.11.2018 Úvodní nastavení. Ve svém domovském adresáři si založte speciální adresář nmsa331 na toto cvičení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/
VíceStatistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceVŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
Vícepříklad: předvolební průzkum Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 příklad: souvisí plánované těhotenství se vzděláním?
Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara (naposledy upraveno 17. prosince 2007) 1(249) závislost kvalitativních znaků
VíceZpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceNávod na vypracování semestrálního projektu
Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování
VíceMatematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
VíceMatematická statistika Zimní semestr
Dvouvýběrové testy 11.12.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq2.txt a zdrojové kódy cviceni11.r a figks.r, případně i cviceni11-obrazky.r.
VíceMěření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceMnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
VíceBodové odhady parametrů a výstupů
Bodové odhady parametrů a výstupů 26. listopadu 2013 Máme rozdělení s neznámými parametry a chceme odhadnout jeden nebo několik příštích výstupů. Již víme, že úplnou informaci v této situaci nese sdružené
VíceČíselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
VíceInformační technologie a statistika 1
Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceMetodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VícePOPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceMnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Vícemarek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceTématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"
Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceJednovýběrové testy. Komentované řešení pomocí MS Excel
Jednovýběrové testy Komentované řešení pomocí MS Excel Vstupní data V dalším budeme předpokládat, že tabulka se vstupními daty je umístěna v oblasti A1:C23 (viz. obrázek) Základní statistiky vložíme vzorce
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Více3.4 Určení vnitřní struktury analýzou vícerozměrných dat
3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková
VíceČíselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
VíceSTATISTICKÉ PROGRAMY
Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná
VíceStatistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.
Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,
VícePearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
VíceÚloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
VícePlánování experimentu
SEMESTRÁLNÍ PRÁCE Plánování experimentu 05/06 Ing. Petr Eliáš 1. NÁVRH NOVÉHO VALIVÉHO LOŽISKA 1.1 Zadání Při návrhu nového valivého ložiska se v prvotní fázi uvažovalo pouze o změně designu věnečku (parametr
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Více