literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 cvičení, zápočet, zkouška přehled témat

Rozměr: px
Začít zobrazení ze stránky:

Download "literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 cvičení, zápočet, zkouška přehled témat"

Transkript

1 1(254) úvod základní pojmy příklady variační řada charakteristiky polohy 2(254) Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára zvara (naposledy upraveno 7. ledna 2008) literatura K. Zvára: Biostatistika, Karolinum Praha, 1998, 2000, 2001, 2003, 2006 Z. Pavlík, K. Kühnl: Úvod do kvantitativních metod pro geografy, SPN Praha, 1981 T.H.Wonnacot,R.J.Wonnacot:Statistikaproobchoda hospodářství, Victoria Publishing Praha, 1992 slajdy přednášky na adrese zvara(celý semestr, může dojít k úpravám postupně doplňované slajdy uskutečněných přednášek Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod základní pojmy příklady variační řada charakteristiky polohy 3(254) cvičení, zápočet, zkouška cvičení v počítačových učebnách PUA(suterénAlbertov6) Z3(Albertov6,uschodůdosuterénu) B5(Viničná7,1.patro) MSExcel volně šiřitelný program R( (aktivní účast na cvičení, maximálně dvě absence)&(napsání zápočtového testu) zápočet obsah cvičení více přizpůsoben studovanému oboru přednášky formulovány obecněji zkouška nejspíš písemná, kombinovaná s ústní, zápočet musí zkoušce předcházet; přihlašování ke zkoušce přes SIS úvod základní pojmy příklady variační řada charakteristiky polohy 4(254) přehled témat popisná statistika(měřítka, charakteristiky polohy, variability, souvislost znaků) statistika v geografických/demografických/sociálních vědách pravděpodobnost(základní kombinatorické pojmy, klasická definice, podmíněná pravděpodobnost, nezávislost) náhodná veličina(rozdělení, střední hodnota, rozptyl, hustota, distribuční funkce) důležitá rozdělení(normální, binomické, Poissonovo) statistické usuzování(populace a výběr, parametry a jejich odhady, interval spolehlivosti, volba rozsahu výběru) testování hypotéz(chyba 1. druhu, 2. druhu, hladina testu, síla testu, p-hodnota) testy(o populačním průměru, populačním podílu či podílech, nezávislosti, regresních koeficientech) regrese, kontingenční(čtyřpolní) tabulky

2 úvod základní pojmy příklady variační řada charakteristiky polohy 5(254) příklad statistického zjišťování I úvod základní pojmy příklady variační řada charakteristiky polohy 6(254) příklad statistického zjišťování II zjišťování se týká 200 mužů středního věku vsouboruje80kuřákůa120nekuřáků 85mužůmáočimodré,25hnědé,90jinébarvy 27mužůmájenzákladnívzdělání,44neúplnéstřední,65 maturitu, 64 vysokoškolské 22sejichnarodilovroce1942,19vroce1943,25vroce 1944,...,18vroce1951 hmotnostijednotlivýchmužůjsou83,92,...,63kg výškajednotlivýchmužůjsou172,176,...,178cm zjišťování se týká příjmů obyvatel hodnotíme hrubý příjem za rok přihlížíme k místu trvalého bydliště(velikost obce, který kraj) přihlížíme k vzdělání(druh, doba školní docházky) přihlížímekvěkuapohlaví Comajítytoúdajespolečného?Čímseúdajeliší? Comajítytoúdajespolečného?Čímseúdajevjednotlivých podskupinách liší? Souvisí kouření a vzdělání? Souvisí příjem se vzděláním? Je tato souvislost stejná, jako v zemi XY? úvod základní pojmy příklady variační řada charakteristiky polohy 7(254) co a jak měříme(zjišťujeme) úvod základní pojmy příklady variační řada charakteristiky polohy 8(254) měřítka měříme na mnoha statistických jednotkách(osoba, domácnost,obec,okres,stát,pokusnépole...) měříme(zjišťujeme) hodnoty znaků zjištěnou hodnotu vyjadřujeme ve zvoleném měřítku (stupnici) na jedné jednotce můžeme měřit několik znaků(závislost) měříme na skupinách jednotek souborech zajímají nás hromadné vlastnosti ve velkých souborech můžeme porovnávat vlastnosti znaku mezi soubory nula-jedničkové(muž/žena, kuřák/nekuřák) nominální(země původu, barva očí) jednoznačně dané hodnoty ordinální(dosažené vzdělání, stupeň bolesti) jednoznačně dané hodnoty, možné hodnoty jsou uspořádané intervalové(teplota v Celsiově stupnici, rok narození) konstantní vzdálenosti mezi sousedními hodnotami, nula jen konvence;okolikstupňůjejednestepleji,nežbylovloni? poměrové(hmotnost, výška, HDP, počet obyvatel, věk) násobek zvolené jednotky, nula = neexistence měřené vlastnostikolikrátjeastarší(vyšší...)nežb

3 úvod základní pojmy příklady variační řada charakteristiky polohy 9(254) měřítka(stručnější dělení) úvod základní pojmy příklady variační řada charakteristiky polohy 10(254) veličina kvalitativní: nula-jedničkové, nominální, často i ordinální u kvalitativních se zpravidla udávají četnosti jednotlivých hodnot(kolikrát která hodnota nastala) kvantitativní(spojité): intervalové, poměrové, někdy ordinální(není spojité) hodnoty kvantitativních čísla zařazení znaku k určitému měřítku může záviset na účelu šetření číselně vyjádřený výsledek měření hodnoty znaků v intervalovém, poměrovém měřítku jsou husté spojitá veličina četnosti hodnot znaků v nula-jedničkovém, nominálním(či ordinálním) měřítku diskrétní veličina pro veličiny máme charakteristiky některých jejich hromadných vlastností(charakteristiky polohy, variability, tvaru rozdělení) popisné charakteristiky(statistiky) mají jedním číslem vyjádřit danou vlastnost úvod základní pojmy příklady variační řada charakteristiky polohy 11(254) příklad: 100 hodů kostkou úvod základní pojmy příklady variační řada charakteristiky polohy 12(254) hody kostkou jako hromadný jev počty puntíků coby různé obrázky nominální znak kostka A kostka B chceme 100 zjištěných hodnot(počtů puntíků) vyjádřit názorně, aby vypovídaly o vlastnostech kostky n j (absolutní)četnost[frequency]hodnoty kolikrátnastala f j = n j n relativníčetnosthodnoty(lzevyjádřitv%) vjakémdíluměřenínastala(nutněplatí n=n 1 n 2...n k = k j=1 n j) tabulka četností(absolutních, relativních) grafické vyjádření četností histogram[histogram](velikost plochy je úměrná četnosti) rozhodování o kvalitě kostky(zda je symetrická) je úlohou statistické indukce[inference] později

4 úvod základní pojmy příklady variační řada charakteristiky polohy 13(254) zpracování četností(kostka A) úvod základní pojmy příklady variační řada charakteristiky polohy 14(254) zpracování četností(kostka B) j n j f j =n j /n 12 0, , , , , ,17 n= , j n j f j =n j /n 15 0, ,16 7 0,07 6 0, , ,41 n= úvod základní pojmy příklady variační řada charakteristiky polohy 15(254) příklad: věk 99 matek 99 zjištěných hodnot soubor naměřených hodnot úvod základní pojmy příklady variační řada charakteristiky polohy 16(254) variační řada, pořadí Jdi k variační řadě x 1,x 2,...,x n původní(neuspořádaná)data hodnotyznaku v měřítku aspoň ordinálním uvedené v původním pořadí, bez ohledu na případná opakování variačnířadax (1) x (2)... x (n) [sort(x)] data uspořádána tak, aby hodnoty neklesaly protozávorkyuindexů pořadí[rank] umístění pozorování ve variační řadě; shodným hodnotám dáváme průměrné pořadí [rank(x)] x j pořadír j 7 2,5 4 2,

5 úvod základní pojmy příklady variační řada charakteristiky polohy 17(254) příklad: věk 99 matek variační řada uspořádaný soubor hodnot variační řada úvod základní pojmy příklady variační řada charakteristiky polohy 18(254) třídění, třídní četnosti Jdi k původním pozorováním spojitá veličina s velkým počtem naměřených hodnot obor hodnot rozdělíme na nepřekrývající se třídy(intervaly), nejlépe stejné délky(ne vždy je to praktické či možné) všechna pozorování z daného intervalu nahradíme zástupnou hodnotou(zpravidlastředemintervalu)x j zjistíme(absolutní)četnostin 1,...,n k jednotlivýchtříd kumulativní četnosti udávají počet hodnot v dané třídě a třídách předcházejících(1 j k) [cumsum()] N j =n 1 n 2...n j = j i=1 n i úvod základní pojmy příklady variační řada charakteristiky polohy 19(254) věk matek třídní četnosti k=7 úvod základní pojmy příklady variační řada charakteristiky polohy 20(254) grafické znázornění třídních četností interval x j n j f j =n j /n N j N j /n do , ,051 21až , ,324 24až , ,646 27až , ,838 30až , ,919 33až , ,980 36avíce , ,000 Jdi k histogramu věku matek Jdi k mírám polohy věku matek histogram je založen na třídění do intervalů, výjimečně zobrazuje přímo četnosti jednotlivých hodnot(barplot)[hist()] každé třídě odpovídá obdélník o ploše úměrné četnosti (absolutní nebo relativní) při stejných šířkách intervalů h odpovídají četnostem výšky obdélníků(protože základny jsou stejně dlouhé) početintervalůk:volíse5 15tak,abystředybylyokrouhlé pomůckou Sturgesovo pravidlo k 13,3 log 10 n=1log 2 n příkladvěkmatek:k 13,3 log ,6

6 úvod základní pojmy příklady variační řada charakteristiky polohy 21(254) příklad(věk matek): histogram, h =3(k =7) úvod základní pojmy příklady variační řada charakteristiky polohy 22(254) příklad(věk matek): kumulativní relativní četnosti [hist(vek.m,seq(17,38,by=3),col= yellow )] Jdi k četnostem věku matek úvod základní pojmy příklady variační řada charakteristiky polohy 23(254) třídění při nestejně dlouhých intervalech úvod základní pojmy příklady variační řada charakteristiky polohy 24(254) příklad: tolary měsíční příjmy 99 osob v tolarech někdy jsou data nepravidelně rozmístěna zpravidla jsou soustředěna u levého okraje intervalu hodnot (věkové či příjmové složení obyvatelstva) pak vhodné zvolit nestejně dlouhé intervaly je vhodné zvolit délky intervalů tak, aby delší byly násobkem kratších při nestejně dlouhých intervalech musí zjištěné četnosti odpovídat plocha, nikoliv výška; pak se na svislou osu nanáší relativní četnosti četnosti x j n j x j n j třídní četnosti třída celkem x j ,5 18,5 25,5 40,5 n j hustota ,4 0,4 Jdi k hodnocení tolarů

7 úvod základní pojmy příklady variační řada charakteristiky polohy 25(254) příklad(tolary): histogram úvod základní pojmy příklady variační řada charakteristiky polohy 26(254) výběrové charakteristiky polohy: medián snaha charakterizovat úroveň jediným číslem mediánječíslo,kterédělídatanadvěstejněvelkéčásti (větších hodnot a menších hodnot) Density income medián[median](prostřední hodnota) x x=x ( n1 2 ) pronliché x= 1 ( ) x 2 ( n 2) x ( n 1) pronsudé 2 [median(x)] závorky u indexů jsou nutné: znamenají, že hodnoty byly předem uspořádány do variační řady 5,3,4,7,6 x=5 (3 <4<5<6<7)) úvod základní pojmy příklady variační řada charakteristiky polohy 27(254) kvartily, percentily dolní(horní)kvartilq 1 (Q 3 )[lower(upper)quartile] vyděluje čtvrtinu nejmenších(největších) hodnot kvartil speciální případ percentilu percentil[percentile]x p vyděluje100p%nejmenšíchhodnot od ostatních výpočet percentilů mnoho vzorečků mediánjetaképercentilem,totižx 0,5 podobněq 1 =x 1/4 =x 0,25,Q 3 =x 3/4 =x 0,75 [quantile(x,probs=c(1/4,3/4))] úvod základní pojmy příklady variační řada charakteristiky polohy 28(254) výpočet percentilů(jako v R), jen pro ilustraci jedna z možných definic Gumbel(1939) najdeseceléčísloksplňující k 1 n 1 p < k n 1 tedyk= 1(n 1) p ( x ]znamenáceloučástzx) provedeselineárníinterpolacemezix (k) ax (k1) ({x} znamená zlomkovou část x, o kolik přesahuje celé číslo) q= {1(n 1) p}=(1(n 1) p) k x p =(1 q) x (k) q x (k1) např.pron=99,p=0,25bude k= 1(99 1) 0,25 = 25,5 =25 Q 1 =x 0,25 =0,5 x (25) 0,5 x (26)

8 úvod základní pojmy příklady variační řada charakteristiky polohy 29(254) příklad: věk 99 matek variační řada úvod základní pojmy příklady variační řada charakteristiky polohy 30(254) krabicový diagram variační řada, medián x =25 kvartilyq 1 =(2323)/2=23,Q 3 =(2828)/2= Návrat míry var. věku matek krabicový diagram[box-plot] zobrazuje kvartily, medián, minimum, maximum, případně odlehlá pozorování: od bližšího kvartiludálnež3/2 (Q 3 Q 1 ) [boxplot(x)] příklad:věkmatek(q 1 =23, x=25,q 3 =28,dvěodlehlá pozorování) úvod základní pojmy příklady variační řada charakteristiky polohy 31(254) příklad:tolary( x=14,q 1 =12,Q 3 =19,5) úvod základní pojmy příklady variační řada charakteristiky polohy 32(254) průměr průměr[mean](kdyby bylo všech n hodnot stejných) [mean(x)] x= 1 n (x 1x 2...x n )= 1 n n i=1 vážený průměr:[weighted mean] založen na četnostech x= 1 n (n 1x 1...n k x k )=1 n k n j xj = j=1 k j=1 x i k n j n x j j=1 = n jxj k j=1 n j obecnějisvahamiw 1,...,w k hodnotx1,...,x k k j=1 w jxj k j=1 w váhymusíbýtnezáporné(w j 0) j

9 úvod základní pojmy příklady variační řada charakteristiky polohy 33(254) příklad: vážený průměr známek úvod základní pojmy příklady variační řada charakteristiky polohy 34(254) průměr pro nula-jedničkovou veličinu předmět známka kredity součin A B C D celkem průměr(nevážený): x=7/4=1,75 váženýprůměr(vahamikredity): x=32/20=1,6 u nula-jedničkového měřítka: průměr = relativní četnost jedniček počet jedniček/počet všech hodnot(nul i jedniček) procento jedniček mezi všemi hodnotami(nulami a jedničkami) procento jedinců s danou vlastností pozor, nejde o pravděpodobnost, nanejvýš jde o její odhad! úvod základní pojmy příklady variační řada charakteristiky polohy 35(254) modus úvod základní pojmy příklady variační řada charakteristiky polohy 36(254) příklad věk matek modus ˆx[mode] nejčastější hodnota(lze počítat také pro nominální či ordinální měřítko) modus nemusí být určen jednoznačně, např. věk matek: x j n j x j n j jižznáme x=25,q 1 =23,Q 3 =28 modusneníurčenjednoznačně:ˆx=21,ˆx=25 průměr x= 1 ( )= vážený průměr založený na třídění. =25, x= = =25,7 99 Třídění: věk matek

10 úvod základní pojmy příklady variační řada charakteristiky polohy 37(254) příklad tolary průměr x= 1 99 ( )= =17,04 vážený průměr založený na četnostech jednotlivých hodnot x= = vážený průměr založený na třídních četnostech(obr. 24). =17, ,5 8 40,5 x= = =17,42 99 modus:ˆx=12 úvod základní pojmy příklady variační řada charakteristiky polohy 38(254) useknutý průměr také míra polohy alfa-useknutý průměr[trimmed mean]: nejprve se oddělí (usekne) 100α% nejmenších a 100α% největších hodnot, ze zbytku se spočítá průměr je robustní(necitlivý) vůči odlehlým hodnotám volísezpravidla α=0,1(0,15) příklad: věk matek [mean(vek.m,trim=0.1)] 1 ( ) x(10) x (11)...x (89) x (90) =25,3 Jdi k četnostem tolarů úvod základní pojmy příklady variační řada charakteristiky polohy 39(254) příklad(věk matek):useknutý průměr (průměr počítán pouze z černých čísel) vyloučíse 0,1 99 = 9,9 =9( x znamenáceloučástzx) nejmenších a 9 největších hodnot úvod základní pojmy příklady variační řada charakteristiky polohy 40(254) vlastnosti charakteristik polohy změníme-livšechnyhodnotyx i tak,žepřidámekekaždé stejnou konstantu a, změní se o tutéž konstantu také charakteristika polohy(posunutí) změníme-livšechnyhodnotyx i tak,žejevynásobímekladnou konstantou b, toutéž konstantou musíme vynásobit původní charakteristiku polohy, abychom dostali charakteristiku polohy pro upravená data(změna měřítka) obecněpromírupolohym(x) m(ax)=am(x), m(b x)=b m(x), b >0 v obou případech míra polohy reaguje

11 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 41(254) charakteristiky variability měří nestejnost(variabilitu) hodnot spojité veličiny obecně pro míru variability s(x) s(ax)=s(x), s(b x)=b s(x), b >0 přičtením stejné konstanty a(posunutím) se charakteristika variability nezmění(nezávisí na poloze) vynásobení kladnou konstantou znamená, že stejnou konstantou nutno vynásobit charakteristiku variability rozpětí[range] R=x (n) x (1) kvartilovérozpětí[quartilerange] R Q =Q 3 Q 1 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 42(254) rozptyl(variance) (výběrový) rozptyl(variance)[variance][var.výběr][var(x)] (nevyhovujedruhémupožadavku,místotoho:s 2 ab x =b2 s 2 x) sx= 2 1 ( (x1 x) 2 (x 2 x) 2...(x n x) 2) n 1 ( = 1 n n ) (x i x) 2 = 1 xi 2 n x 2 n 1 n 1 i=1 i=1 = 1 n 1 k j=1 n j (x j x) 2 = 1 n 1 nechťx 1 =1,x 2 =3,x 3 =8,pakje x=(138)/3=12/3=4 k n j xj 2 n x 2 sx= 2 1 ( (1 4) 2 (3 4) 2 (8 4) 2) = =13 =3,6. 2 j=1 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 43(254) směrodatná odchylka rozptyl měří průměrný čtverec vzdálenosti od průměru směrodatná odchylka[std. deviation]: odmocnina z rozptylu [SMODCH.VÝBĚR][sd(x)] s x = sx 2 zcela vyhovuje požadavkům na míry variability výhoda směrodatné odchylky: stejný fyzikální rozměr jako původní data výběrový rozptyl z třídních četností: Sheppardova korekce(jsou-li všechny intervaly délky h): odečti h2 12 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 44(254) příklad věk matek rozpětí: R=38 18=20 kvartilovérozpětí: R Q =28 23=5 rozptyl ( s 2 = 1 ( ) =16,97. =4,12 2 směrodatná odchylka je 4,12 Var. řada věku matek ( ) ) přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

12 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 45(254) příklad věkmatek2 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 46(254) střední odchylka pomocí třídních četností s 2 = 1 98 ( ( ) 99 =16,36=(4,05) 2 navíc Sheppardova korekce s 2 =16, =(3,95)2 ( ) ) střední odchylka[mean deviation]: průměr odchylek od mediánu(někdy od průměru) [mean(abs(x-median(x)))] d= 1 n n x i x střednídiference:průměrvzájemnýchvzdálenostívšechn 2 dvojic = 1 n 2 n i=1 i=1j=1 n x i x j = 2 ( ) x(j) n 2 x (i) j>i 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 47(254) normované charakteristiky rozptýlenosti dosud zavedené charakteristiky variability závisejí na volbě měřítka(např.délkavmnebovkm) hledáme charakteristiky nezávislé na měřítku, nutně poměrové měřítko, kladné hodnoty umožní porovnání z různých souborů variační koeficient [sd(x)/mean(x)] v= s x x (Giniho) koeficient koncentrace G= (= 2 n i=1 i x (i) 2 x n n i=1 x n1 ) i n například měří nerovnoměrnost příjmů, velikostí územních jednotek, souvisí s plochou u Lorenzovy křivky 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 48(254) z-skór, standardizace variačníkoeficientv,ginihokoeficientg příklady bezrozměrných veličin(zásluhou průměru ve jmenovateli závisí Givnaposunutí!) z-skóry [STANDARDIZE(x;průměr(x);smodch.výběr(x))] *[(x-mean(x))/sd(x)]nebo[c(scale(x))] z i = x i x s x, i=1,2,...,n dostanemenulovýprůměr( z=0),jednotkovýrozptyl(s z =1) z-skóry jsou bezrozměrné umožní hodnotit vlastnosti nezávislé na poloze a variabilitě, např. tvar rozdělení x 1 =1,x 2 =2,x 3 =3 x=2,s x =1 z 1 = = 1,z 2 = =0,z 3 = =1 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

13 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 49(254) charakteristiky tvaru: šikmost charakteristiky variability charakteristiky tvaru závislost dvojice znaků 50(254) charakteristiky tvaru: špičatost invariantní vůči posunutí i změně měřítka: γ(ax)=γ(x) γ(b x)=γ(x) b >0 šikmost b 1 průměrz3.mocninz-skórů [SKEW()] [mean(scale(x)ˆ3)] b1 = 1 n n ( xi x i=1 prosymetrickýhistogram b 1 blízkénule s x ) 3 dopravaprotaženýhistogrampro b 1 >>0 dolevaprotaženýhistogrampro b 1 <<0 špičatostb 2 průměrze4.mocninz-skórů (někdy se odečítá 3)[KURT()] [mean(scale(x)ˆ4)] b 2 = 1 n n ( xi x i=1 někdy se počítají odhady populační šikmosti a špičatosti jinak (Excel:s x jinak,fisherovog 1,g 2 prozajímavost) n(n 1) g 1 = b1, g 2 = n 2 s x ) 4 ( (n1)(n 1) b 2 (n 2)(n 3) šikmost a špičatost slouží k hodnocení, zda lze předpokládat normální rozdělení(bude zavedeno později) ) 3(n 1) n1 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 51(254) přehled závislostí charakteristiky variability charakteristiky tvaru závislost dvojice znaků 52(254) kvalitativní kvalitativní abychom mohli vyšetřovat závislost, musíme na jedné statistické jednotce měřit aspoň dva znaky postupy(i grafické) závisí na měřítcích obou znaků kvalitativní kvalitativní (vzdělání pracovní zařazení) kvalitativní kvantitativní (vzdělání roční příjem) kvantitativní kvantitativní (věk roční příjem) zatím popisné charakteristiky a grafy, prokazování závislosti později kvalitativní data znak v nominálním(ordinálním) měřítku hodnoty vyjadřujeme pomocí četností dvaznaky četnostimožnýchdvojichodnotn ij (sdružené četnosti) zapisujeme do kontingenční tabulky[contingency table] [table(x,y)] nebo[xtabs( xy)] doplňujeme marginální četnosti[marginal frequencies] součtypořádcíchaposloupcích četnostijednotlivýchhodnotkaždéhozeznakůzvlášť oba znaky nula-jedničkové kontingenční tabulka 2 2, čtyřpolní tabulka[fourfold table] 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

14 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 53(254) příklad vzdělání matek (pozor na orientaci grafu!) charakteristiky variability charakteristiky tvaru závislost dvojice znaků 54(254) příklad vzdělání matek (pozor na orientaci) porodnice vzdělání Praha venkov celkem základní střední VŠ celkem porodnice vzdělání Praha venkov celkem základní 32,9% 37,9% 34,3% střední 42,8% 58,6% 47,5% VŠ 24,3% 3,5% 18,2% celkem 100% 100% 100% Praha venkov porodnice vzdělání Praha venkov celkem základní střední VŠ celkem porodnice vzdělání Praha venkov celkem základní 67,6% 32,4% 100% střední 63,8% 36,2% 100% VŠ 94,4% 6,6% 100% celkem 70,7% 29,3% 100% zákl. str. V 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 55(254) kvalitativní kvantitativní charakteristiky variability charakteristiky tvaru závislost dvojice znaků 56(254) příklad: platy u tří skupin zaměstnanců podle kvalitativní proměnné rozdělíme hodnoty kvantitativní proměnné do dílčích souborů porovnáme charakteristiky dílčích souborů(zejména charakteristiky polohy) mezi sebou, pokud se hodně liší, svědčí to pro závislost celkový průměr = vážený průměr dílčích souborů. celkový rozptyl = vážený průměr rozptylů vážený rozptyl průměrů(přesně jen pro populační rozptyly s n ve jmenovateli) snáze jako rozklad součtu čtverců skup. příjem n j x j s j sj 2 žlutí ,00 35,4 1250,0 modří ,50 9,6 91,7 černí ,75 4,0 16,2 celkem ,29 57,7 3334,4 x= 2 175,04 67,508 15,75 =53, s 2 =3334,4 > ,04 91,78 16,2 =214,0 248 nevážený(nesmyslný) průměr by byl 86,08! rozptyl celkem je mnohem větší, než jsou rozptyly ve skupinách příčina: nestejné průměry 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

15 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 57(254) rozklad součtu čtverců velikost kolísání všech platů(celková variabilita): SST=(200 53,29) 2 (150 53,29) 2 (80 53,29) 2... (10 53,29) 2 =43346,86 velikost kolísání uvnitř skupin: charakteristiky variability charakteristiky tvaru závislost dvojice znaků 58(254) rozklad součtu čtverců obecně x ij j-táhodnotavi-téskupině(platj-téosobyvi-téskupině) n i počethodnotvi-téskupině,kpočetskupin x i průměrvi-téskupině(průměrnýplatvi-téskupině) x celkovýprůměr(průměrvšechplatů) SSE=( ) 2 ( ) 2 (80 67,5) 2... (10 15,75) 2 =1638,5 kolísání průměrů(mezi skupinami): SSA=2 (175 53,29) 2 4 (67,5 53,29) 2 8 (15,75 53,29) 2 =41708,36 SST= = k n i (x ij x ) 2 i=1j=1 k k n i n i ( x i x ) 2 (x ij x i ) 2 i=1 i=1j=1 =SSASSE kontrola: 1 638, ,36=43 346,86 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 59(254) kvantitativní kvantitativní [plot(iq zn7,data=iq,col=1divka,pch= )] záporná korelace kladná korelace charakteristiky variability charakteristiky tvaru závislost dvojice znaků 60(254) popis závislosti spojitých veličin (výběrová) kovariance[covariance] [cov(vek.o,vek.m)] IQ známky delka hmotnost s xy = 1 n 1 n (x i x)(y i ȳ) zřejmějes xx = 1 n 1 n i=1 (x i x)(x i x)=s 2 x,s yy =s 2 y (Pearsonův, momentový) korelační koeficient [(Pearson, product-moment) correlation coefficient] lze zapsat pomocí z-skórů r= s xy s x s y = 1 n 1 i=1 n i=1 ( ) xi x ȳ yi s x s y [cor(vek.o,vek.m)] r= 0,69 r=0,45 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

16 charakteristiky variability charakteristiky tvaru závislost dvojice znaků 61(254) příklad: hmotnost a délka dětí(24. týden věku) charakteristiky variability charakteristiky tvaru závislost dvojice znaků 62(254) vlastnosti Pearsonova korelačního koeficient délka[cm]: x=68,5 s x =3,28 hmotnost[g]:ȳ=7690, s y =845 kovariance[cm g]:s xy =1257 korelačníkoeficient:r= , =0,45 hmotnost[kg]:ȳ=7,69 s y =0,845 kovariance[cm kg]:s xy =1,257 korelačníkoeficient:r= 1,257 3,28 0,845 =0,45 které charakteristiky závisí na použitém měřítku? vypovídá o směru závislosti přir <0srostoucímxvprůměruyklesá(např.IQaznámky) přir >0srostoucímxvprůměruyroste(např.váhaavýška) platí 1 r 1 r =1jedinětehdy,kdyžbody[x;y]ležínapřímce vzájemné nezávislosti x, y odpovídají r blízká nule (upřesníme!) nemusí zachytit křivočarou(nelineární) závislost 2. přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 8. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 63(254) charakteristiky polohy v geografii/demografii často známe jen průměry v dílčích souborech a četnosti: průměrysepoužijíjakox j,četnostistandardně příklad: věk nových profesorů a docentů UK 2002: 41profesorů,průměrnývěk51,1(n 1 =41,x 1 =51,1) 77docentů,průměrnývěk47,8(n 2 =77,x 2 =47,8) celkový průměr(vážený průměr): [weighted.mean(c(51.1,47.8),c(41,77))] nikoliv 41 51,177 47, ,147,8 2 =49,4 =48,9 [mean(c(51.1,47.8))] char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 64(254) charakteristiky polohy v geografii/demografii(2) geografický střed bod průsečíkprůměrnézeměpisnéšířkyaprůměrnézeměpisné délky; průměry vážené velikostí sledovaného jevu geografický medián obdoba mediánu, čára,kterározdělujegeografickéobjektydodvoudisjunktních skupin hodnocenávlastnosturčíváhyobjektů uspořádáníhodnoceníznakůdánozvolenougeografickou vlastností(např. zeměpisnou délkou) 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

17 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 65(254) míry nerovnoměrnosti Giniho index charakterizuje nerovnoměrnost rozdělení bohatství(příjmů,...)jedinýmčíslem G= /(2 x) průměrný rozdíl v bohatství vztažený k dvojnásobku průměru mají-livšichnistejně(x (1) =...=x (n) >0),jenutně =0a tedyg=0 má-li jeden všechno, ostatní nic (0=x (1) =...=x (n 1) <x (n) =a),pakje x= a n 2(n 1)a n 1 G= n 2 =n 2a n Lorenzova křivka je jemnějším nástrojem = 2(n 1)a n 2 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 66(254) příklad: tolary(rozdělení příjmů) jaké procento nejchudších získá desetinu celkového bohatství? četnosti 99 osob(celkový měsíční příjem je 1687) x j n j x j n j sčítejme příjmy nejchudších, dokud nenasčítáme 10% z 1687 ( )/1687=158/1687=0,0937=9,37% ( )/1687=169/1687=0,1002=10,02% ujakéčástiz99osobjsmesčítalipříjmy? (78)/99=15/99=0,152=15,2% (79)/99=16/99=0,162=16,2% 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 67(254) příklad: tolary(rozdělení příjmů) jaké procento nejchudších získá polovinu celkového bohatství? četnosti(celkový měsíční příjem je 1687) x j n j x j n j sčítejme příjmy nejchudších, dokud nenasčítáme 50% z 1687 ( )/1687=836/1687=0,4956=49,56% ( )/1687=853/1687=0,5056=50,56% ujakéčástiz99osobjsmesčítalipříjmy? (7...91)/99=66/99=0,6667=66,67% (7...92)/99=67/99=0,6768=67,68% char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 68(254) příklad: tolary(rozdělení příjmů) jaké procento získají čtyři(tj. asi 4%) nejbohatší resp. nejchudší? četnosti(celkový měsíční příjem je 1687) x j n j x j n j sečteme příjmy oněch čtyř nejbohatších ( )/1687=175/1687=0,1037=10,37% čtyři nejbohatší tedy dostanou přes 10% bohatství, kdežto čtyři nejchudší dostanou (4 10)/1687=40/1687=0,0237=2,37% 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

18 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 69(254) Lorenzova křivka(tolary) char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 70(254) Lorenzova křivka Lorenzova křivka pro tolary (Gini=0.228) variačnířada:0 <x (1) x (2)... x (n) [sort(x)] kumulativnísoučtyproj=0,1,...,n [cumsum(sort(x))] (kolik patří celkem j nejchudším) X 0 =0 X j =x (1) x (2)...x (j) = úsečkamispojitbody[j/n;x j /X n ], 0 j n zajímá nás plocha nad touto lomenou čarou a pod úhlopříčkou jednotkového čtverce j i=1 plocha měří nerovnoměrnost rozdělení nějakého zdroje kdyby dostal každý stejně, bude velikost plochy nulová x (i) Giniho koeficient koncentrace je dvojnásobkem této plochy přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 71(254) umělý příklad char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 72(254) příklad- pokračování výpočet Giniho koeficientu(n = 5) x 1,...,x 5 :1,2,3,4,5 j j/n x (j) X j X j /X n 0 0,0 0 0, , , , , , , , , , , Lorenzova křivka pro 1:5 (Gini=0.267) = = =40/25=1,6 x=3 G= 1,6 2 3 =1,6 6 =0, přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

19 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 73(254) Lorenzova křivka počet hejtmanů v krajích ČR v každém kraji je stejně hejtmanů, proto postupné součty rovnoměrněrostou,totéžplatíprox j /X n lomená čára Lorenzovy křivky přejde v úsečku a plocha zmizí průměrnádiferencejenulová(všechnyrozdíly x i x j u počtu hejtmanů jsou nulové) Lorenzova křivka pro hejtmanu (Gini=0) přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 74(254) příklad:kraječrkekonciroku2006 kraj obyvatel rozloha[km 2 ] hustotanakm 2 i y i n i x i Hlavní město Praha , ,0 Středočeský kraj ,7 106,7 Jihočeský kraj ,9 62,6 Plzeňský kraj ,1 73,3 Karlovarský kraj ,6 91,9 Ústecký kraj ,5 154,3 Liberecký kraj ,0 136,2 Královéhradecký kraj ,4 115,5 Pardubický kraj ,6 112,4 Vysočina ,6 75,3 Jihomoravský kraj ,3 157,4 Olomoucký kraj ,8 121,5 Zlínský kraj ,5 148,8 Moravskoslezský kraj ,0 230,2 celkem ,0 130,4 Jdizpět Jdizpětkegrafu Jdizpětkteorii 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 75(254) Lorenzova křivka(obyvatelé kraje) char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 76(254) Lorenzova křivka pro tolary ještě jinak Lorenzova křivka pro obyvatel (Gini=0.227) spousta hodnot proměnné tolary se opakuje, mohli jsme použít četnosti hodnotax (j) sevyskytujen j krát o10*7=70tolarůserozdělilo7 nejchudších osob o11*14=154tolarůserozdělilo14druhých nejchudších... posledních47tolarůpřipadlojedinémunejbohatšímu Lorenzova křivka pro xj * nj(nj) (Gini=0.228) Lorenzova křivka pro tolary (Gini=0.228) přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

20 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 77(254) případ s vahami- příklad nerovnoměrnost rozmístění obyvatel v republice, ale údaje jen podle krajů potřebovalibychomprokaždýjednotlivýkm 2 znátpočet obyvatel zde žijících známejenpočtyobyvately i vkrajícharozlohukrajůn i předpokládáme rovnoměrné rozmístění uvnitř kraje, tedy x i =y i /n i obyvatelnakaždýkm 2 vi-témkraji každoutakovouhustotux i musímezapočítatn i krát celkováplochan=n 1...n 14 (=N 14 ) průměrnýpočetobyvatelnakm 2 x= in ix i i n i = i n i(y i /n i ) i = y i n n =ȳ char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 78(254) Lorenzova křivka: obyvatelé krajů, vztaženo k rozloze Lorenzova křivka pro obyvatel(rozloha) (Gini=0.29) Jdizpětktabulce 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Jdi ke grafu okresů Jdi zpět k tabulce 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 79(254) Lorenzova křivka: obyvatelé okresů, vztaženo k rozloze Lorenzova křivka pro obyvatel(rozloha) (Gini=0.334) char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 80(254) poznámky hrubší hodnocení(kraje, nikoliv okresy) znamená menší hodnotu Giniho indexu! nezáleží na zvolených jednotkách navodorovnéosejdeoumístěnívřaděodnejchudšíchk nejbohatším označmekumulativnísoučtyn i = k j=1 n j nasvisléosejdeopodílnabohatství označmekumulativnísoučtyodnejchudšíchy i = i j=1 y j prozajímavost:n k =n,rozdělujesebohatstvíy k vevšechpřípadechjepořadísčítancůdánopořadím hustot x i = y i n i (např.obyvatel/rozloha) Jdizpětkegrafukrajů 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

21 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 81(254) výpočet v případě vah kumulativnísoučtyn i = k j=1 n j, Y i = k j=1 Y j střednídiferenceprůměrnýchpočtůobyvatelnakm 2 (hustot) = 1 n 2 k = 1 n 2 k i=1j=1 i=1j=1 G= k 1 2ȳ = k n i n j x i x j = 1 ( n t ) 2 k k i=1j=1 n i n j y i n i y j k n j y i n i y j = 2 k 1 n 2 (N i Y i1 N i1 Y i ) i=1 i=1 ( Ni N k Y i1 Y k N i1 N k Y i Y k Lorenzova křivka spojuje body Jdizpětktabulcedat ) [ ] Ni N k ; Y i Y k n j char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 82(254) příklad Pavlík, Kühnl: str. 114(okresy středočeského kraje) Okres plocha[km 2 ] obyvatel hustotanakm 2 i n i y i x i BN ,2 RA ,7 PB ,2 KH ,4 MB ,9 NB ,1 BE ,5 KO ,4 PZ ,9 ME ,8 PH ,0 KL ,2 AB ,0 celkem ,3 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 char. polohy v geogr./demogr. Giniho index Lorenzova křivka Lorenzova křivka s vážením 83(254) příklad Pavlík, Kühnl: str. 114 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 84(254) možné příští úlohy statistické indukce Lorenzova křivka pro obyvatel(rozloha) (Gini=0.566) nahracíchkostkáchaabpadalašestkanestejněčasto: nakostcea v17ze100pokusů nakostceb v41ze100pokusů je pravděpodobnost šestky rovna 1/6? teoriepravděpodobnostiodvodíteoretickouhodnotu matematickástatistikaodhadne,prověřípředstavuteorie je kostka symetrická, tj. mají všechny stěny kostky stejnou pravděpodobnost? kolik potřebujeme nezávislých hodů, abychom s požadovanou spolehlivostí poznali, že je kostka nesymetrická? lišísemeziseboukostkyaab? vše založeno na modelu populace výběr[population, sample] 3. přednáška 15. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

22 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 85(254) populace a výběr úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 86(254) parametry odhady, statistiky model populace výběr umožňuje zobecnění na celou populaci z hodnot zjištěných na vybraných statistických jednotkách(výběr) populace(základní soubor) velký soubor, jehož je zpracovávaný soubor(výběr) reprezentativním vzorkem reprezentativnost frekvence výskytu důležitých doprovodných znaků ve výběru odpovídá jejich frekvenci vpopulaci reprezentativnosti nejlépe dosáhneme tak, že použijeme prostý náhodný výběr, kdy každá n-tice prvků populace má stejnou šanci(pravděpodobnost) do výběru se dostat na základě výběru tvrdíme něco o populaci podle toho, jakou roli hraje hodnocený soubor, rozlišujeme charakteristiky populační:vztaženékpopulaci,mnohdyjenideální,námi představované, jsou to parametry modelu výběrové:vztaženékvýběruznějaképopulace,jsouto statistiky spočítané z výběru statistika z výběru spočítaná hodnota(např. součet napozorovaných hodnot, průměr, Giniho index...) speciálním případem statistik jsou odhady odpovídajících populačních parametrů, příkladem dvojice odhad parametr je dvojice relativní četnost pravděpodobnost(např. 17/100 vers. 1/6) statistiky se používají při statistické indukci(statistickém rozhodování)[statistical inference(decisions)] 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 87(254) základní pojmy úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 88(254) klasická pravděpodobnost(laplace) pokus dobře definovaná situace(postup), která končí jedním z řady možných výsledků(vržená kostka spadne na zem) náhodnýpokus pokus,uněhožpředemnevíme,který výsledek nastane(která strana kostky padne příště?); předpokládá se stabilita relativních četností možných výsledků náhodný jev tvrzení o výsledku náhodného pokusu pravděpodobnost náhodného jevu A číselné vyjádření očekávání, že výsledkem náhodného pokusu bude právě A racionální představa: při velkém počtu opakování pokusu se relativní četnost jevu blíží k pravděpodobnosti tohoto jevu jistýjev(nastávávždy)lzerozdělitnamstejně pravděpodobných neslučitelných(disjunktních) elementárních jevů(symetrie) každý jev lze složit z těchto elementárních jevů jecelkemm A příznivýchjevua(jeznichsložen) klasická definice pravděpodobnosti(metoda výpočtu) P(A)= M A M klasickou pst lze použít jen někdy!(sportka, Sazka) 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

23 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 89(254) příklad: hrací kostka úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 90(254) faktoriál idealizovaná symetrická hrací kostka homogenní přesnákrychle těžištěuprostřed každástranamástejnoupravděpodobnost A padnešestka,b padnesudéčíslo M=6 M A =1,tedyP(A)=1/6 M B =3,tedyP(B)=3/6=1/2 [FAKTORIÁL(n)] [factorial(n)] faktoriál n!=n (n 1) 2 1 0!=1 kolika způsoby lze uspořádat za sebou n rozlišitelných prvků příklady: 5!= =120 1!=1 kolikazpůsobylzeuspořádatzasebou14krajůčr: 14!= = =8, přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 91(254) počet kombinací [KOMBINACE(n; k)] [choose(n, k)] kombinačníčíslo ( n k) (čti nnadk ) počet k-prvkových podmnožin množiny o n prvcích nezávisle na jejich pořadí ( ) n n! (n 1) (n k1) = =n k k!(n k)! k (k 1) 2 1 kolikazpůsobysimohuzpětiknížekvybratdvěnadovolenou: ( ) 5 = 5! 4 =5 2 2!3! 2 1 =10 kolikazpůsobysizoněchpětimohuvybrattřiknihy?(10) úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 92(254) příklad: losování otázek(1) studentneumí 5otázek,umí 10otázek losujesedvojiceotázekzoněch15otázek pravděpodobnost P(A), že student nezná ani jednu z vylosovaných: elementární jevy: první losovaná otázka 15 možností, druhá jen 14 možností, nezáleží na pořadí, tedy dělit 2 (tedy počet kombinací) ( ) ( ) M= = = 15! 14 = !13! 2 1 =105 příznivé elementární jevy: vylosuje obě z pěti, které neumí ( )( ) 5 10 M A = = =10 P(A)= =9,5% 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

24 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 93(254) příklad: losování otázek(2) úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 94(254) pravidla pro pravděpodobnost(1) pravděpodobnost P(B), že zná právě jednu otázku M B = ( ) 5 1 ( ) 10 =5 10=50 P(B)= =47,6% pravděpodobnostp(c),žeznáoběotázky(právědvě) ( ) ( ) M C = =1 10 =45 P(C)= =42,9% pravděpodobnost P(D), že zná aspoň jednu otázku M D =M B M C =5045=95 P(D)= =90,5% kontrola:m D M A =M sjednoceníjevůa B:platíAneboB(aspoňjedenzjevů A,B) průnika B:platíAasoučasněB(obajevyA,Bsoučasně) Vennův diagram A A B P(A B)=P(A)P(B) P(A B) B A B=celávybarvenáplocha P(A)=0,42=zelenášediváplocha P(B)=0,24=žlutášediváplocha P(A B)=0,16=šediváplocha P(A)P(B)=zelenážlutá 2 šediváplocha P(A B)=0,420,24 0,16=0,50 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 95(254) pravidla pro pravděpodobnost(2) neslučitelné jevy: nemohou nastat nikdy současně, navzájem se vylučují; pro neslučitelné jevy platí P(A B)=P(A)P(B) podmíněná pravděpodobnost pravděpodobnost jevu A, když užjevbnastal: P(A B) P(A B)= P(B) Vennův diagram A A B B P(B)=0,24=žlutášediváplocha P(A B)=0,16=šediváplocha P(A B) = šedivá vzhledem k(žlutá šedivá) P(A B)=0,16/0,24=0,67,aleP(A)=0,42 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 96(254) nezávislost náhodných jevů nezávislé jevy: výskyt jednoho jevu neovlivní pravděpodobnost výskytu druhého (definice nezávislosti náhodných jevů): P(A)=P(A B)= Vennův diagram A A B B P(A B) P(B) P(A B)=P(A)P(B) P(A)=0,60=zelenášedivá P(B)=0,40=žlutášediváplocha P(A B)=0,24=šediváplocha P(A B) = šedivá vzhledem k(žlutá šedivá) P(A B) = 0,24/0,40 = 0,60 P(A) P(B)=P(A B) AaBjsounezávislé 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

25 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 97(254) idealizovaný příklad A jedničkazestatistiky,p(a)=0,3 B jedničkazmatematiky,p(b)=0,2 A B jedničkazoboupředmětů,p(a B)=0,1 jsoujevya,bnezávislé?(jsoujedničkyzedvoupředmětů nezávislé?) NE, protože 0,3 0,2 0,1 jakájepstjedničkyzestatistiky,kdyžužjezmatematiky? P(A B)= P(A B) P(B) = 0,1 0,2 =0,5 pstjedničkyzmatematiky,kdyžužjezestatistiky: P(B A)=0,1/0,3=1/3 pravděpodobnost, že aspoň jedna jednička: P(A B)=P(A)P(B) P(A B)=0,30,2 0,1=0,4 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 98(254) rozdělení náhodné veličiny náhodná veličina číselně vyjádřený výsledek náhodného pokusu diskrétní rozdělení(pro četnosti) určeno seznamem možných hodnot a jejich pravděpodobnostmi: x 1,x 2,... P(X=x 1 ),P(X=x 2 ),... spojité rozdělení(pro spojité měřítko) určeno distribuční funkcí F X (x)=p(x x) nebo hustotou f X (x)= d dx F X(x), F X (x)= x f X (t)dt 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 99(254) úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 100(254) věk matek(n=4838) h= h= h= 1 velká populace, spojitá veličina intervaly pro třídění mohou být krátké, obálce histogramu relativních četností odpovídá hustotaf X (x)[density] podobně kumulativním relativním četnostem odpovídá distribuční funkce[distribution function] bezprostředním výběrovým protějškem distribuční funkce je empirická distribuční funkce F n (x)= #(x i x) n x 1 <x 2 <... <x mexistujícírůznéhodnoty n 1,n 2,...,n m jejichčetnosti(n= j n j) F n (x)jeschodovitáfunkce,vboděx j máskokn j /n přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

26 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 101(254) kumulativní distribuční funkce(tolary) skokyodpovídajíčetnostem,např.ve12jeskokz0,21na0,37o16/99=0,16 F n (x) tolary x j n j N j x j n j N j úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 102(254) příklad diskrétního rozdělení: známky u zkoušky X,Y známkyzedvoupředmětů známkak P(X=k) 0,3 0,4 0,2 0,1 P(Y=k) 0,3 0,3 0,2 0,2 ztabulkynicnepoznámeopřípadnézávislostix,y jak jedním číslem charakterizovat úroveň známek? obyčejnýprůměrmožnýchhodnotbyx,y nerozlišil použijme vážený průměr, kde vahami známek jsou pravděpodobnosti možných hodnot dostaneme tak střední hodnoty X a Y(populační průměry) µ X =1 0,32 0,43 0,24 0,1=2,1 µ Y =1 0,32 0,33 0,24 0,2=2,3 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 103(254) charakteristiky rozdělení náhodné veličiny(1) střední hodnota náhodné veličiny X(populační průměr) jetováženýprůměrmožnýchhodnot vahami jsou pravděpodobnosti hodnot úvod pravděpodobnost podmíněná pst náhodná veličina střední hodnota rozptyl závislost 104(254) středníhodnotafunkcey=g(x)náhodnéveličinyx vážený průměr funkčních hodnot EY=Eg(X)= k g(x k )P(X=x k ) µ X =EX=x 1 P(X=x 1 )x 2 P(X=x 2 )...= j x j P(X=x j ) resp. pro spojité rozdělení operátor E (expectation) aplikovaný na náhodnou veličinu X spočítá vážený průměr jejích hodnot, vahami jsou u diskrétního rozdělení pravděpodobnosti těchto hodnot pro spojité rozdělení µ X =EX= x f X (x)dx EY=Eg(X)= g(x)f(x)dx populační medián µ spojitého rozdělení F X ( µ)=p(x µ)=0,5 x číslo, které dělí možné hodnoty náhodné veličiny na dva stejně pravděpodobné intervaly hodnot větších a menších 4. přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/ přednáška 22. října 2007 Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

charakteristiky variability Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 směrodatná odchylka rozptyl(variance)

charakteristiky variability Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 směrodatná odchylka rozptyl(variance) Statistika MD360P03Z, MD360P03U) ak. rok 007/008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara 8. října 007 18) charakteristiky variability charakteristiky tvaru závislost dvojice

Více

1(173) Statistika. (MD360P03Z, MD360P03U) ak. rok 2007/2008. Karel Zvára. zvara. 16.

1(173) Statistika. (MD360P03Z, MD360P03U) ak. rok 2007/2008. Karel Zvára.  zvara. 16. 1(173) Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara 16. října 2007 Úvod 1. října 2007 Statistika (MD360P03Z, MD360P03U)ak.

Více

možné příští úlohy statistické indukce Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 parametry odhady, statistiky populace a výběr

možné příští úlohy statistické indukce Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 parametry odhady, statistiky populace a výběr Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara 23. října 2007 1(177) úvod pravděpodobnost podmíněná pst náhodná veličina střední

Více

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 přehled témat cvičení, zápočet, zkouška

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 přehled témat cvičení, zápočet, zkouška 1(82) úvod základní pojmy příklady variační řada charakteristiky polohy 2(82) Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara

Více

Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009

Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 1(258) Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara 12. ledna 2009 Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 úvod

Více

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 cvičení, zápočet, zkouška přehled témat

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 cvičení, zápočet, zkouška přehled témat 1(258) úvod základní pojmy příklady variační řada charakteristiky polohy 2(258) Statistika (MD360P03Z, MD360P03U) ak. rok 2008/2009 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara

Více

charakteristiky polohy v geografii/demografii Statistika míry nerovnoměrnosti charakteristiky polohy v geografii/demografii(2)

charakteristiky polohy v geografii/demografii Statistika míry nerovnoměrnosti charakteristiky polohy v geografii/demografii(2) Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara 16. října 2007 1(173) char. polohy v geogr./demogr. Giniho index Lorenzova křivka

Více

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2010/2011

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2010/2011 úvod základní pojmy příklady variační řada charakteristiky polohy Statistika (MD360P03Z, MD360P03U) ak. rok 2010/2011 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara (naposledy

Více

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2011/2012

literatura Statistika (MD360P03Z, MD360P03U) ak. rok 2011/2012 úvod základní pojmy příklady variační řada charakteristiky polohy Statistika (MD360P03Z, MD360P03U) ak. rok 2011/2012 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara (naposledy

Více

Statistika. (MD360P03Z, MD360P03U) ak. rok 2013/2014. Karel Zvára

Statistika. (MD360P03Z, MD360P03U) ak. rok 2013/2014. Karel Zvára úvod základní pojmy nominální znak histogram variační řada medián míry polohy Statistika (MD360P03Z, MD360P03U) ak. rok 2013/2014 Karel Zvára karel.zvara@natur.cuni.cz, karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9. Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

příklad: předvolební průzkum Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 příklad: souvisí plánované těhotenství se vzděláním?

příklad: předvolební průzkum Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 příklad: souvisí plánované těhotenství se vzděláním? Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara (naposledy upraveno 17. prosince 2007) 1(249) závislost kvalitativních znaků

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

Základy biostatistiky

Základy biostatistiky Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 2. POPISNÉ STATISTIKY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz CO SE SKRÝVÁ V DATECH data sbíráme proto, abychom porozuměli

Více

NÁHODNÁ VELIČINA. 3. cvičení

NÁHODNÁ VELIČINA. 3. cvičení NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. 3.1 Základy teorie pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. Co se dozvíte Náhodný pokus a náhodný jev. Pravděpodobnost, počítání s pravděpodobnostmi.

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Škály podle informace v datech:

Škály podle informace v datech: Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se? x 1 = x 2 Data ordinální Větší, menší? x 1 < x 2 Data intervalová O kolik?

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Cvičení ze statistiky - 3. Filip Děchtěrenko

Cvičení ze statistiky - 3. Filip Děchtěrenko Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf

Více

NÁHODNÝ VEKTOR. 4. cvičení

NÁHODNÝ VEKTOR. 4. cvičení NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Jevy a náhodná veličina

Jevy a náhodná veličina Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili

Více

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008 Statistika (MD30P03Z, MD30P03U) ak. rok 007/008 Karel Zvára karel.zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/ zvara (naposledy upraveno. listopadu 007) 1(4) Mann-Whitney párový Wilcoxon párový znaménkový

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,

Více

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu. Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky V této kapitole se seznámíme se základy popisné statistiky, představíme si základní pojmy a budeme si je ilustrovat na praktických příkladech. Kapitola je psána formou volného

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

Cvičení ze statistiky - 5. Filip Děchtěrenko

Cvičení ze statistiky - 5. Filip Děchtěrenko Cvičení ze statistiky - 5 Filip Děchtěrenko Minule bylo.. Začali jsme pravděpodobnost Klasická a statistická definice pravděpodobnosti Náhodný jev Doplněk, průnik, sjednocení Podmíněná pravděpodobnost

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis

Více

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Popisná statistika. Jaroslav MAREK. Univerzita Palackého Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí

Více