Tomáš Karel LS 2013/2014

Podobné dokumenty
Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Pravděpodobnost a statistika

tazatel Průměr ve Počet respondentů Rozptyl ve

Náhodná veličina a rozdělení pravděpodobnosti

Tomáš Karel LS 2012/2013

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Pravděpodobnost a aplikovaná statistika

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

KGG/STG Statistika pro geografy

NÁHODNÁ VELIČINA. 3. cvičení

Diskrétní náhodná veličina. November 12, 2008

Základy popisné statistiky

Diskrétní náhodná veličina

Praktická statistika. Petr Ponížil Eva Kutálková

Náhodné (statistické) chyby přímých měření

Číselné charakteristiky

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Cvičení ze statistiky - 5. Filip Děchtěrenko

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

4. cvičení 4ST201. Pravděpodobnost. Obsah: Pravděpodobnost Náhodná veličina. Co je třeba znát z přednášek

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

Inovace bakalářského studijního oboru Aplikovaná chemie

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Základy teorie pravděpodobnosti

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Charakterizace rozdělení

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Téma 22. Ondřej Nývlt

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Vybraná rozdělení náhodné veličiny

Pojem a úkoly statistiky

7. Rozdělení pravděpodobnosti ve statistice

PRAVDĚPODOBNOST A STATISTIKA

Mnohorozměrná statistická data

23. Matematická statistika

Náhodný jev a definice pravděpodobnosti

Statistika pro geografy

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Pravděpodobnost a její vlastnosti

Intuitivní pojem pravděpodobnosti

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

I. D i s k r é t n í r o z d ě l e n í

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Statistika I (KMI/PSTAT)

p(x) = P (X = x), x R,

Náhodné chyby přímých měření

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Základní statistické charakteristiky

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

22. Pravděpodobnost a statistika

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

8 Střední hodnota a rozptyl

(motto: Jestliže má jednotlivec rád čísla, pokládá se to za neurózu. Celá společnost se ale sklání před statistickými čísly. Alfred Paul Schmidt)

Mnohorozměrná statistická data

Popisná statistika. Statistika pro sociology

Jevy a náhodná veličina

Popisná statistika kvantitativní veličiny

Charakteristika datového souboru

2. přednáška - PRAVDĚPODOBNOST

Výběrové charakteristiky a jejich rozdělení

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Základy teorie pravděpodobnosti

PRAVDĚPODOBNOST A JEJÍ UŽITÍ

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Základy teorie pravděpodobnosti

Pravděpodobnost a statistika

TECHNICKÁ UNIVERZITA V LIBERCI

Teorie pravěpodobnosti 1

Metodologie pro ISK II

Rovnoměrné rozdělení

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Pravděpodobnost a aplikovaná statistika

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Statistika. zpracování statistického souboru

Renáta Bednárová STATISTIKA PRO EKONOMY

Transkript:

Tomáš Karel LS 2013/2014

Vypočítejte: 8 3 10 9?? 1.12.2014 Tomáš Karel - 4ST201 2

n n! 8! 87654321 40320 k (n k)! k! (8 3)! 3! (5 4321) 321 1206 56 n n! 10! 109 8 7 6 5 4 3 2 1 10 k (n k)! k! (10 9)! 9! (1) (9 8 7 6 5 4 3 2 1) Tomáš Karel - 4ST201 1.12.2014 3

Statistické znaky kvantitativní kvalitativní ordinální (pořadové) měřitelné alternativní (binomické) množné 1.12.2014 4 Tomáš Karel - 4ST201

Pomocí metody dotazování získáme údaje o 10 studentech v této třídě: pohlaví studenta (x 1 ) věk studenta (x 2 ) studovaná fakulta (x 3 ) semestr (x 4 ) založení facebook účtu (x 5 ) počet přátel na facebooku (x 6 ) 1.12.2014 5 Tomáš Karel - 4ST201

Získaná data uspořádáme do přehledné tabulky tzv. datové matice (viz soubor cviceni_1.xlsx) číslo pohlaví věk fakulta semestr facebook Fb přátelé 1 2 3 4 5 6 7 8 9 10 x 1 x 2 x 3 x 4 x 5 x 6 1.12.2014 6 Tomáš Karel - 4ST201

1) Určete typy proměnných x 1 x 6 dle výše uvedeného schématu na jednom z předchozích slidů x 1 pohlaví studenta x 2 věk studenta x 3 studovaná fakulta x 4 semestr ve kterém jste si zapsali tento předmět x 5 založení facebooku x 6 počet přátel na Vašem facebooku 2) Pro proměnnou x 2 věk studenta sestrojte tabulku rozdělení četností (absolutních, relativních, kumulativních absolutních a kumulativních relativních) 1.12.2014 7 Tomáš Karel - 4ST201

absolutní četnosti n i, i 1,2,..., k relativní četnosti p i ni n kumulativní absolutní četnosti platí: k i1 n i kumulativní relativní četnosti n n p 1n2 1 p2...... platí: k i1 p i 1 1.12.2014 Tomáš Karel - 4ST201 8

3) Sestrojte tabulku rozdělení četností pro proměnnou x 6 počet facebookových přátel proměnná x 4 nabývá mnoha obměn (tabulka četností i graf by nevypadaly dobře) vhodnější je intervalové rozdělení četností musíme zvolit vhodný počet a šířku intervalu 1.12.2014 9 Tomáš Karel - 4ST201

Sturgesovo pravidlo pro počet intervalů šířka jednoho intervalu: variační rozpětí: R x max x min 1.12.2014 Tomáš Karel - 4ST201 10

průměr (aritmetický, geometrický, harmonický, kvadratický) modus = hodnota s nejvyšší četností a%-ní kvantil = dělí soubor uspořádaný podle velikosti (od nejnižších hodnot po nejvyšší) na prvních a% hodnot a zbývajících (100-a)% medián = prostřední hodnota v souboru uspořádaném podle velikosti = 50% kvantil dolní kvartil = 25% kvantil horní kvartil = 75% kvantil 1.12.2014 11 Tomáš Karel - 4ST201

1.12.2014 12 Tomáš Karel - 4ST201

Jaký je průměrný počet věk vybraných spolužáků? (vypočtěte dvojím způsobem - nejdříve ze základní tabulky a poté z tabulky rozdělení četností) ze základní tabulky (prostý aritmetický průměr) x n i 1 n x i z tabulky rozdělení četností (vážený aritmetický průměr) x k i1 k i1 x i n n i i 1.12.2014 Tomáš Karel - 4ST201 13

Závodní okruh Sosnová má délku základní trasy 1,075 km. Testovací závodník projel tento okruh celkem třikrát. V prvním kole byla jeho průměrná rychlost 60 km/h, v druhém kole už 72 km/h a ve třetím kole dosáhl průměrné rychlosti 80 km/h. Vypočítejte průměrnou rychlost jezdce za celou dobu jízdy, definovanou jako podíl celkové dráhy za celkový čas www.autodrom.cz s = 1,075 km 1.12.2014 Tomáš Karel - 4ST201 14

t Celkový čas celé jízdy t celk. se skládá ze součtu času prvního okruhu t1, času druhého okruhu t2 a času třetího okruhu t3. Délka prvního okruhu (v km) s 1, 075 1 1 v1 60 Průměrná rychlost v prvním okruhu Čas v prvním okruhu 0, 0179h t t 2 s 1, 075 v 75 2 2 s 1, 075 3 3 v3 80 0, 0143h 0, 0134h Průměrná rychlost za celou jízdu (km/h) Celková ujetá vzdálenost (v km) s 3s 31, 075 celk. vp 70,588 tcelk. t1 t2 t3 0, 0179 0, 0143 0, 0134 Celkový čas celé jízdy (hod) Průměrná rychlost cyklisty za celou jízdu je dána prostým harmonickým průměrem průměrných rychlostí za jednotlivé okruhy. Tomáš Karel - 4ST201 1.12.2014 15

Pro proměnnou x 2 - věk určete následující kvantily: a) medián x 0,5 b) horní kvartil x 0,25 c) dolní kvartil x 0,75 1.12.2014 16 Tomáš Karel - 4ST201

hodnoty uspořádáme podle velikosti každá hodnota se musí vyskytovat tolikrát, kolik je její absolutní četnost výpočet kvantilů: p p dolní kvartil medián horní kvartil n z 100 p n 1 100 x (1);x (2);x(3);x(4);x(5);x(6);x(7);x(8);x(9);x(10) p 25 x x x0,25 n 10 100 100 2 p 50 x x x0,5 n 10 100 100 2 p 75 x x x0,75 n 10 100 100 2 (2) (3) (5) (6) (7) (8) 1.12.2014 Tomáš Karel - 4ST201 17

Kombinační čísla Četnosti Absolutní Relativní Kumulativní Charakteristiky úrovně Průměr Prostý aritmetický Vážený aritmetický Harmonický/vážený harmonický Medián Kvartily n k n i, i 1,2,..., k x n! ( n k)! k! n i 1 x n n x i1 i n 1 x i ni n k n n... p p... 1 2 -absolutní i1 n p i i n 1 2 -relativní x k i1 k i1 x n i n i i k i1 p i 1 medián 21; 21; 22; 22; 22; 23; 24 1. kvartil 2.kvartil

Prostý aritmetický průměr Při zpracování studie o průměrné výši měsíčních příjmů v České republice jsme získali data celkem od 5-ti tazatelů. Každý z těchto pěti souborů dat obsahoval údaje o deseti statistických jednotkách (respondentech - těch, kteří odpověděli). x n i 1 soubor 1. 2. 3. 4. 5. Počet respondentů 10 10 10 10 10 Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2 n x i Vypočítejte celkovou průměrnou hodnotu ze všech získaných dat.

soubor 1. 2. 3. 4. 5. Počet respondentů 10 10 10 10 10 Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2 Prostý aritmetický průměr n xi i1 18,5 21, 2 24, 2 19 26, 2 109,1 x 21,82 n 5 5

Vážený aritmetický průměr x k i1 k i1 x i n n i i Při zpracování studie o průměrné výši měsíčních příjmů v České republice jsme získali data celkem od 5-ti tazatelů. Každý z těchto pěti souborů dat obsahoval odlišný počet údajů o statistických jednotkách (respondentech - těch, kteří odpověděli). soubor 1. 2. 3. 4. 5. Počet respondentů 10 13 15 7 5 Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2 Vypočítejte celkovou průměrnou hodnotu ze všech získaných dat.

soubor 1. 2. 3. 4. 5. Počet respondentů - n i 10 13 15 7 5 Průměr v souboru x i (tis. Kč) 18,5 21,2 24,2 19 26,2 Vážený aritmetický průměr k xn i i i1 18,510 21, 213 24, 215 197 26, 25 1079,9 x 21, 75 k 1113 15 7 4 50 n i1 i

Jak je možné, že průměrná mzda v České republice je 24,5 tis Kč a více jak 60 % obyvatel ČR má plat nižší??? Datový soubor od prvního tazatele: respondent 1. 2. 3. 4. 5. 6. 7. 8. 9. 10 průměr příjem 10,5 11 9,5 11,5 15,5 16,5 16 15 16,5 63 18,5 n xi i1 10,5 11 9,5 11,5 15,5 16,5 16 15 16,5 63 x 18,5 n 10 Odkaz 1 Odkaz2

1) Seřadit podle velikosti respondent 3. 1. 2. 4. 8. 5. 7. 6. 9. 10 průměr příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63 18,5 medián průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 2) Určit prostřední hodnotu x x 15 15,5 2 2 (5) (6) x0,5 x 15, 25 90% hodnot menších než průměr!!!

1) Seřadit podle velikosti respondent 3. 1. 2. 4. 8. 5. 7. 6. 9. 10 průměr příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63,1 18,5 medián průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 2) Určit 1. kvartil x 0,25 3) Určit 3. kvartil x 0,75 p p n zp n 1 x0,25 x(3) 11 100 100 p p n zp n 1 x0,75 x(8) 16,5 100 100 90% hodnot menších než průměr!!!

Modus (modální hodnota) je taková hodnota, která je v souboru nejčastěji zastoupena (má největší četnost) modus medián průměr 63,0... 23,0 22,5 22,0 21,5 21,0 20,5 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 14,5 14,0 13,5 13,0 12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 Průměr 18,5 tis Kč průměrná hodnota Modus 16,5 tis Kč nejčastěji zastoupená hodnota Medián 15,25 tis Kč prostřední hodnota

Rozptyl směrodatná odchylka variační koeficient variační rozpětí Rozklad rozptylu vnitroskupinový rozptyl meziskupinový rozptyl Vlastnosti rozptylu

Sociální nůžky Představme si dvě městečka v Jihočeském kraji* Levicov a Pravicov V obou městech bylo provedeno šetření o průměrném měsíčním příjmu obyvatel. Z výzkumu vyšlo, že v obou městech je průměrný měsíční příjem stejný a to 20 tis. Kč. Zdá se, že se v průměru se daří obyvatelům obou měst stejně. Pokud se však podíváme na bodový graf podrobněji v něčem se tato města liší. Přestože průměrný příjem jejich obyvatel je stejný. Jak to ale číselně vyjádřit? průměr 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Pravicov 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 průměr x 20 tis Kč x 20 tis Kč Levicov

Na minulém cvičení jsme se zabývali měrami polohy (průměry, medián, modus), které charakterizovaly hodnotovou úroveň souboru, typickou hodnotu v souboru apod. Často je však zapotřebí kromě typické hodnotové úrovně poznat i to, jak moc se jednotlivé hodnoty souboru od sebe odlišují (tzv. variabilitu souboru Levicov vs. Pravicov). K tomuto účelu slouží právě míry variability. Abychom zachytili vzájemnou odlišnost hodnot souboru, můžeme studovat například to, jak se jednotlivé hodnoty liší od průměru. Abychom dokázali kvantifikovat (číselně vajádřit) tuto vlastnost (tj. odlišnost hodnot souboru od průměru) můžeme zvolit několik různých přístupů. Můžeme např. studovat průměrnou absolutní odchylku hodnot souboru od průměru, nebo průměrnou kvadratickou odchylku hodnot souboru od průměru apod. Právě průměrná kvadratická odchylka hodnot souboru od průměru je základem definice rozptylu jako jedné z nejvýznamnějších měr variability souboru. Existují však samozřejmě i jiné míry variability

Absolutní Rozptyl kvadratická odchylka od průměru (Klasický) rozptyl známe všechny hodnoty všech jednotek 1 s (x x) n 2 2 x i n i 1 (v každém městě je pouze 10 obyvatel) Výběrový rozptyl známe pouze některé hodnoty ze souboru (v každém městě je víc jak 10 obyvatel) n 2 1 2 s x (xi x) n1 i 1 x x Směrodatná odchylka je druhá odmocnina z rozptylu Variační rozpětí - nejvyšší hodnota mínus nejnižší s nebo s R x x max min Relativní Variační koeficient směrodatná odchylka dělená průměrem s s x x x V x,nebo V x x

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 1 1 s (x x) (9000 20000) (9000 20000)... n 2 2 2 2 x i n 1 i1 10 1 Pravicov 1... (36000 20000) (37000 20000) ( 11000) ( 11000)... 14000 13000 ) 19010 9 Směrodatná odchylka: Variační koeficient: Variační rozpětí: 2 6 s x 13784 s s 19010 13784 V 0, 689 x Rozptyl: x 2 2 2 2 2 2 6 R x x 37000 9000 28000 max min x x 20000 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Rozptyl: 1 1 s (x x) (18000 20000) (19000 20000)... n 2 2 2 2 x i n 1 i1 10 1 Levicov 2 2 1 2 2 2 2 6... (21000 20000) (22000 20000) ( 2000) ( 1000)... 1000 2000 ) 1,333 10 9 Směrodatná odchylka: Variační koeficient: s s 1,333 10 1154 Variační rozpětí: x 2 6 x R x x 22000 18000 4000 max min s 1154 x 20000 x V x 0, 058

Míra variability Pravicov Levicov Výběrový rozptyl 190x10 6 1,333x10 6 Výběrová směrodatná odchylka 13 784 1 154 Variační rozpětí 28 000 4 000 Variační koeficient 0,689 0,058 Míra úrovně (polohy) Pravicov Levicov Průměr 20 000 20 000 Medián 10 000 20 000 Modus 9 000 20 000

Co by se stalo s mírami variability v jednotlivých městech, pokud by Česká republika vstoupila do měnové unie se směným kurzem 26 Kč/EUR?

Míra variability Pravicov (CZK) Levicov (CZK) Pravicov (EUR) Levicov (EUR) absolutní Výběrový rozptyl 190x10 6 1,333x10 6 281 065 1 972 Výběrová směrodatná odchylka 13 784 1 154 530 44 Variační rozpětí 28 000 4 000 1 077 154 relativní Variační koeficient 0,689 0,058 0,689 0,058 Míra úrovně (polohy) Pravicov (CZK) Levicov (CZK) Pravicov (EUR) Levicov (EUR) Průměr 20 000 20 000 769 769 Medián 10 000 20 000 385 769 Modus 9 000 20 000 346 769

Vypočítejte míry variability (rozptyl, směrodatnou odchylku), jestliže jsou údaje z předešlého příkladu zadány v relativních četnostech a známy pro celé město (=základní rozptyl). Levicov 1/10 obyvatel má příjem 18 000 Kč 2/10 obyvatel má příjem 19 000 Kč 4/10 obyvatel má příjem 20 000 Kč 2/10 obyvatel má příjem 21 000 Kč zbytek obyvatel má příjem 22 000 Kč

Příjem 22 000 Kč má: 1 2 4 2 1 1 10 10 10 10 10 Průměr z relativních četností n 1 2 4 2 1 x xipi 18000 19000 20000 21000 22000 20000 10 10 10 10 10 i1 k k Rozptyl z relativních četností 2 2 2 2 sx x x xi pi xi pi i1 i1 2 1 2 2 2 4 2 2 2 1 2 6 18000 19000 20000 21000 22000 20000 1, 210 10 10 10 10 10 2 Směrodatná odchylka s s 1, 210 1095 x 2 6 x

Náhodný pokus pokus, jehož výsledek se i při dodržení podmínek mění, tj. jehož výsledek závisí na náhodě (např. hod kostkou). Náhodný jev výsledek náhodného pokusu (např. na kostce padla šestka). Náhodný jev budeme značit většinou velkými písmeny, např. A, B atd. Pravděpodobnost náhodného jevu A budeme označovat jako P(A). Jev jistý (označíme např. jako nebo E) Jev, jež nastane vždy, tj. při každém opakování náhod. pokusu (např. na kostce padne nějaké číslo z 1, 2, 3, 4, 5, 6), P( ) =1 Jev nemožný (označíme jako Ø) Jev, jež nikdy nenastane (např. na kostce padne číslo 7), P(Ø ) = 0 Elementární jev nelze vyjádřit jako sjednocení (viz. další slide) dvou jevů, jež jsou různé od tohoto jevu. Doplňkový (opačný) jev k jevu A (označíme A) Jev jež nastane právě, když nenastane jev A, P( A) = 1 - P( A )

Jednou hodíme klasickou hrací kostkou. Znázorněte pomocí Vennových diagramů následující jevy: a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček d) jev D spočívající v padnutí více než šesti teček (jev jistý značíme E a jev nemožný Ø)

a) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček b) jev A spočívající v padnutí šesti teček a jev B spočívající v padnutí sudého počtu teček dělitelných třemi

c) jev C spočívající v padnutí šesti teček, jestliže jev A znamená padnutí sudého počtu teček a jev B padnutí pěti nebo šesti teček d) jev D spočívající v padnutí více než šesti teček

KLASICKÁ DEFINICE PRAVDĚPODOBNOSTI říká, že pravděpodobnost nějakého jevu je rovna podílu počtu výsledků, jež jsou danému jevu příznivé, ku celkovému (konečnému) počtu výsledků, jež jsou apriori stejně pravděpodobné. STATISTICKÁ DEFINICE PRAVDĚPODOBNOSTI říká, že pravděpodobnost nějakého jevu je relativní četností výskytu tohoto jevu v souboru o velké velikosti (v limitě blížící se k nekonečnu).

Příklad nezávislých jevů při hodu dvěma kostkami: A = na první kostce padne 1, B = na druhé kostce padne 1. Příklad závislých jevů při hodu dvěma kostkami: A = na první kostce padne 1, B = součet na obou kostkách bude 10. Jev je jevem nemožným (nemůže na první kostce padnou 1 a zároveň být součet 10), proto: ) ( ) ( ) ( B P A P B A P 36 1 6 1 6 1 ) ( ) ( ) ( B P A P B A P 36 3 6 1 ) ( ) ( ) ( 0 B P A P B A P

plocha průniku je při součtu P(A)+P(B) započítána 2x, proto jí musíme 1x odečíst pokud jevy A a B nemají průnik, nazýváme je neslučitelné (disjunktní) pokud jevy A a B jsou neslučitelné, přechází pravidlo o sčítání PP. na: ) ( ) ( ) ( ) ( B A P B P A P B A P ) ( ) ( ) ( B P A P B A P

Příklad neslučitelných jevů při hodu jednou kostkou: A = padne liché číslo B = padne sudé číslo 3 3 P(A B) P(A) P(B) 1 6 6 Příklad jevů, které nejsou neslučitelné při hodu jednou kostkou: A = padne některé z čísel 1, 2, 3 nebo 4 B = padne 4, 5 nebo 6 4 3 1 P(A B) P(A) P(B) P(A B) 1 6 6 6

Jaká je pravděpodobnost, že při hodu dvěma kostkami padne: a) na obou kostkách šestka b) alespoň jedna šestka c) právě jedna šestka d) žádná šestka e) na obou kostkách sudé číslo Jev A... padla šestka na první kostce Jev B... padla šestka na druhé kostce Jev C... padlo sudé číslo na první kostce Jev D... padlo sudé číslo na druhé kostce

Z publikací Českého statistického úřadu byl převzat počet narozených chlapců a děvčat v letech 1990 1997. Vypočítejte přibližnou pravděpodobnost, že narozené dítě bude chlapec a přibližnou pravděpodobnost, že narozené dítě bude děvče. Absolutní četnosti Rok Chlapci Děvčata Celkem 1990 67 234 63 860 131 094 1991 66 895 62 955 129 850 1992 62 946 59 196 122 142 1993 62 362 59 108 121 470 1994 54 887 52 028 106 915 1995 49 570 46 827 96 397 1996 46 605 44 158 90 763 1997 46 705 44 225 90 930 Celkem 457 204 432 357 889 561

P(chlapec) 457 204 P(chlapec) 0,514 P(celkem) 889 561 P(dívka) 432 357 P(dívka) 0, 486 P(celkem) 889 561

- proměnná, která v závislosti na náhodě nabývá různých hodnot - její hodnota je jednoznačně určena výsledkem náhodného pokusu, před provedením náhodného pokusu nelze určit její konkrétní hodnotu - podle typu dělíme náhodné veličiny na DISKRÉTNÍ náhodné veličiny SPOJITÉ náhodné veličiny

!!! Prosím rozlišujte mezi velkým X pro označení náhodné veličiny a malým x pro označení hodnoty, které veličina X nabyla!!! X = počet koupených piv v El Magicu náhodně vybraným studentem za dnešní večer (středa) (program) x = 0, 1, 2, 3, 4, 5, 6... ; diskrétní náhodná veličina X = počet pivních tácků ve stojánku, x = 2, 3, 4,.. diskrétní náhodná veličina X = počet hostů v plackárně na Blanici, x = 1, 2, 3,... ; diskrétní náhodná veličina X = počet SMS obdržených v průběhu téhle hodiny statistiky, x = 0, 1, 2, 3,... ; diskrétní náhodná veličina

Je pravidlo, které každé hodnotě nebo množině hodnot z každého intervalu přiřazuje pravděpodobnost, že NV nabude této hodnoty nebo hodnoty z určitého intervalu Distribuční funkce F(x) Udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovné hodnotě x F( x) P( X x) Pravděpodobnostní funkce P(x) Udává pravděpodobnost, že veličina X nabude hodnoty x. P( x) P( X x)

Podávají souhrnnou informaci o náhodné veličině Střední hodnota E ( X ) x P( x) x Rozptyl 2 2 D(X) EX E(X) x P(x) xp(x) x x 2 příslušné vztahy pro střední hodnotu a rozptyl náhodné veličiny též ve vzorcích z webu porovnejte s výpočtem rozptylu a průměru ze souboru dat za pomoci relativních četností Průměr x i x i p i Rozptyl s 2 x 2 xi pi xi pi i i 2

Nejmenovaný klub umístěný pod studentskou kolejí Vltava očekává v příštím roce čtyři možné zisky (před zdaněním) s následujícími pravděpodobnostmi: -1 mil. Kč s pravděpodobností 0,1 1 mil. Kč s pravděpodobností 0,4 2 mil. Kč s pravděpodobností 0,3 3 mil. Kč s pravděpodobností 0,2 a) Sestrojte pravděpodobnostní a distribuční funkci pro náhodnou veličinu zisk. b) Sestavte graf distribuční funkce. c) Jaká je střední hodnota zisku podniku? Co tato hodnota představuje? d) Jak byste ohodnotili nejistotu, že tento očekávaný zisk bude realizován?

Náhodnou veličinu zisk podniku v následujícím roce označme jako X Pravděpodobnostní funkce (zadaná tabulkou) x -1 1 2 3 P(x) 0,1 0,4 0,3 0,2 F(x) 0,1 0,5 0,8 1 Distribuční funkce F(x) 0 x 1 F(x) 0,1 1 x 1 F(x) 0,5 1 x 2 F(x) 0,8 2 x 3 F(x) 1, 0 x 3

Distribuční funkce: Spojitá zprava Neklesající F(X) nabývá hodnot z intervalu <0;1>

Střední (očekávaná) hodnota zisku podniku E(X) x P(x) ( 1) 0,110, 4 20,3 30, 2 1,5 x Pokud by pravděpodobnosti jednotlivých zisků v zadání platily pro každý rok, a pokud bychom každý rok po mnoho let zaznamenávali zisky podniku, pak by se průměrný zisk za jeden rok blížil k hodnotě 1,5 mil. CZK. Neformálně řečeno: podnik je v průměru ziskový, v průměru očekáváme v dlouhodobém horizontu zisk 1,5 milion CZK za rok.

Nejistotu (riziko) spojené s podnikáním můžeme charakterizovat charakteristikami variability např. rozptylem D(X) náhodné veličiny X směrodatnou odchylkou s(x) náhodné veličiny X. Rozptyl D(X) můžeme počítat dvěma ekvivalentními tvary:

Po dosazení do druhého výpočetního tvaru získáváme 2 2 2 D(X) E(X ) E(X) x P(x) xp(x) x x 2 2 2 2 2 ( 1).0,1 (1).0, 4 (2).0,3 (3).0, 2 1,5 3,5 2, 25 1, 25 D(X) 1, 25 1,12 2 Pokud by pravděpodobnosti jednotlivých zisků v zadání platily pro každý rok, a pokud bychom každý rok po mnoho let zaznamenávali zisky podniku, a počítali směrodatnou odchylku těchto zisků, potom by se tato odchylka blížila 1,12 milionům CZK (s velmi velkou pravděpodobností). Řečeno jinak: očekávaná typická odchylka zisku od očekávaného zisku 1,5 milion CZK je 1,12 miliony CZK.

Výsledné známek z předmětu statistika byly v minulém semestru 2012/2013 popsány následující tabulkou. Výsledná známka 1 2 3 4 celkem Počet studentů 264 382 325 182 1 153 Určete přibližně pravděpodobnost, že náhodně vybraný student statistiky z minulého semestru získal výslednou známku: a) jedna b) lepší než tři c) prospěl d) neprospěl 400 300 200 100 0 1 264 382 2 325 3 182 4

Tabulka četností: Výsledná známka 1 2 3 4 celkem Počet studentů 264 382 325 182 1 153 => Tabulka rozdělení pravděpodobnosti Výsledná známka 1 2 3 4 celkem pravděpodobnost 0,23 0,33 0,28 0,16 1 A) B) C) D) P(1) P(X 1) 0, 23 P(X 3) 0, 23 0,33 0,56 P(X 3) 0, 23 0,33 0, 28 0,84 P(X 4) 1 P(X 3) 10,84 0,16

některé náhodné veličiny mají jistý specifický tvar pravděpodobnostní funkce, resp. pravděpodobnostního rozdělení. Mezi nejznámější modelová pravděpodobnostní rozdělení náhodné veličiny patří např.: diskrétní náhodné veličiny: Alternativní Binomické Poissonovo Hypergeometrické

Pokus: Házíme jednou kostkou a potřebujeme, aby padla šestka. Náš pokus má tedy pouze dva výsledky (v jednom náhodném pokusu může nabýt pouze dvou hodnot) x = 1 jev nastane P(X=1)=p16 x = 0 jev nenastane P(X=0)=1-p 56 Pravděpodobnostní funkce střední hodnota rozptyl x 1 x ( x) p (1 p ) zvláštní případ binomického rozdělení pro n=1 (viz. dále) P E(X) p 1/ 6 1 1 D(X) p(1 p) 1 0,139 6 6

Udává pravděpodobnost úspěchu v sérii n nezávislých pokusů, z nichž každý pokus má stejnou pravděpodobnost úspěchu п (např. jaká je pravděpodobnost, že v deseti hodech kostkou padne 3x šestka) pravděpodobnostní funkce střední hodnota n 10 x 3 3 x n x 10 3 P(x) p (1 p) 1/ 6 (1 1/ 6) 0,155 E(X) np 101/ 6 1,666 rozptyl 1 1 D(X) n p(1 p) 10 1 1,389 6 6

Příklady, kdy ho použít: Obecně: výběr s vracením (z malého osudí) nebo výběr bez vracením z velkého osudí Počet úspěchů v sérii n nezávislých pokusů, z nichž každý pokus má stejnou pravděpodobnost úspěchu p. Např. jaká je pravděpodobnost, že z 15 hodů kostkou padne pětkrát trojka.

V osudí jsou míčky bílé barvy a míčky černé barvy. Pravděpodobnost vytažení míčku bílé barvy je 1/7. Z osudí vytáhneme náhodně jeden míček, zapíšeme si jeho barvu a míček do osudí vrátíme! Poté taháme znovu, zapíšeme si opět barvu vytaženého míčku, a míček opět do osudí vrátíme atd. Celkem takto vytáhneme s vracením 4 míčky. Určete pravděpodobnost, že a) žádný, b) Jeden c) dva z těchto 4 míčků budou bílé barvy. Poté nalezněte obecný vzorec udávající pravděpodobnost, že při vytažení celkem n míčků s vracením jich x bude bílých, pokud pravděpodobnost vytažení bílého míčku v jednom tahu je p.

a) b) c)

d)

Pravděpodobnost, že se narodí chlapec je 0,515. Jaká je pravděpodobnost, že mezi 7 po sobě narozenými dětmi v porodnici budou: a) první 3 děvčata a další 4 chlapci b) právě 3 děvčata?

a) první 3 jsou děvčata a další 4 chlapci 3 x n x 7 3 P(x) p (1 p) 0, 485 (1 0, 485) 0,008 b) právě 3 děvčata n 7 x 3 3 x n x 7 3 P(x) p (1 p) 0, 485 (1 0, 485) 0, 281

Udává pravděpodobnost výskytu náhodného jevu v určitém časovém intervalu Mají ho například Veličiny, které představují výskyt x událostí v pevném časovém intervalu, přičemž události musejí nastávat nezávisle od okamžiku poslední události veličiny, které mají rozdělení binomické a zároveň počet pozorování velký (n>30) a п je malé (п<0,1) pravděpodobnostní funkce P( x) x x! e střední hodnota E(X) rozptyl D(X)

Poissonovo rozdělení mají např. následující 2 typy náhodných veličin: 1.) Veličiny, které mají rozdělení binomické a zároveň parametr n tohoto binomického rozdělení je velký (n>30) a parametr p tohoto binomického rozdělení je malý (p<0,1). Takováto binomická veličina má přibližně také Poissonovo rozdělení, přičemž pro parametr l tohoto Poissonova rozdělení platí = np. 2.) Veličiny, jež představují výskyt x událostí v pevném časovém (případně plošném, prostorovém) intervalu, pokud známe průměrný počet událostí l, které v tomto intervalu nastávají. Navíc události musejí nastávat nezávisle od okamžiku (případně místa výskytu) poslední události. P( x) x x! e E(X) D(X)

Při kontrole účetních dokladů v určitém velkém průmyslovém podniku auditor, že zkušenosti ví, že lze předpokládat formální chyby u 2 % účetních dokladů. Jestliže ze souboru účetních dokladů jich auditor vybere 100, jaká je pravděpodobnost, že a) mezi nimi budou právě 2 chybné? b) ani jeden chybný? c) maximálně dva chybné? Učebnice (2.6 / str. 102, neřešený)

Student ze zkušenosti ví, že v době od 15:00 do 19:00 obdrží v průměru 3 SMSky od svých kamarádů. Dnes měl v době od 16:00 do 18:00 rozbitý mobil. a.) Jaká je pravděpodobnost, že mu kamarádi během těchto dvou hodin neposlali žádnou SMS? b.) Jaká je střední hodnota a rozptyl počtu náhodné veličiny počet příchozích SMSek v době od 16:00 do 18:00? Modifikace příkladu z učebnice (2.7 / str. 103, neřešený)

Na povrchu skla se v průměru vyskytuje 5 kazů na metr čtvereční. Jaká je pravděpodobnost, že na skleněné desce o ploše 2 metry čtvereční bude přesně 7 kazů?

Pravděpodobnost, že na 2 m 2 bude přesně 7 kazů je 0,09.

máme-li soubor N jednotek, z nichž M má určitou vlastnost a ze souboru vybíráme bez vracení n jednotek ( x výběr s vracením binomické rozdělení) pravděpodobnostní funkce střední hodnota P ( x) M E(X) n N M x N M n x N n rozptyl M M N n D(X) n 1 N N N 1

V osudí je 30 míčků modrých a 20 červených. Náhodně vybereme 10 míčků. Jaká je pravděpodobnost, že mezi vybranými míčky bude právě 6 červených, jestliže: a) vybíráme s vracením b) vybíráme bez vracení?

a) vybíráme s vracením (-> binomické rozdělení) n 10 2 2 x 6 5 5 6 106 x nx P(x) p (1 p) 1 0,111 b) vybíráme bez vracení? (-> hypergeometrické rozdělení) Výběr bez vracení z malého (!!) osudí. V osudí je M prvků s danou vlastností a N M prvků bez této vlastnosti. Vybíráme celkem n objektů a ptáme se, jaká je pravděpodobnost, že prvků s danou vlastností jsme vybrali právě x. n = 10; N = 50; M = 20; x = 6 M N M 2050 20 x n x 6 10 6 P(x) 0,103 N 50 n 10

Určitý typ součástek je dodáván v sériích po 100 kusech. Při přejímací kontrole je z každé série náhodně vybráno 10 výrobků. Série je přijata, jestliže mezi kontrolovanými výrobky je maximálně 1 zmetek. Jaká je pravděpodobnost, že série bude přijata, jestliže obsahuje 8 zmetků. Kontrola je přitom prováděna tak, že kontrolovaný výrobek je podroben destrukční zkoušce. Jedná se o příklad typu výběr bez vracení z malého osudí => hypergeometrické rozdělení

Příklady spojitých náhodných veličin: X = výška náhodně vybraného studenta, 100 cm < x < 220 cm; X = čas, který náhodně vybraný student stráví denně na facebooku, 0 x 24 hodin; X = doba, kterou musíme čekat na obsluhu u baru v El magicu X = maximální rychlost automobilu, kterou automobil dosáhne na dálnici Jednotlivé náhodné veličiny mají různá pravděpodobnostní rozdělení Jak popsat rozdělení pravděpodobnosti pro spojitou náhodnou veličinu?

Distribuční funkce F(x) Distribuční funkce F(x) udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovné hodnotě x Hustota pravděpodobnosti f(x) b a f (x)dx P(a X b) F(b) F(a) Hustota pravděpodobnosti f(x) je taková funkce, že pro libovolné a < b platí:

Sumace byla u spojité NV zaměněna za integraci, pravděpodobnostní funkce za hustotu pravděpodobnosti Střední hodnota Rozptyl Kvantily (pouze pro spojité NV) 100p% kvantil pravd. rozdělení spojité NV je takové číslo xp pro které platí: p x p P(X x ) f (x)dx F(x ) p p

Normální rozdělení Normované normální rozdělení Logaritmicko normální rozdělení Chí-kvadrát Studentovo Fisherovo

významné rozdělení v teorii pravděpodobnosti a matematické statistiky, mnohé NV v ekonomii, technice a přírodních vědách mají přibližně normální rozdělení (zákon chyb) aproximují (nahrazují) se jím některá nespojitá rozdělení hustota pravděpodobnosti: střední hodnota: E(X ) f ( x) 1 2 2 ( x) e 2p 2 x rozptyl: kvantily: 2 D( X ) x p u p

Příklady využití: tělesná výška, teplota, hmotnost chyby měření velikost chodidla

Jaká je pravděpodobnost, že náhodně vybraný muž bude mít výšku v rozmezí 170 až 185 cm? Předpokládejme přitom, že výška mužů má normální rozdělení s parametry: μ = 180 σ 2 =49 => 2 49 7

Pro výpočet využijeme transformaci na normované normální rozdělení Takto transformovaná veličina se označuje jako U a má normální rozdělení s parametry μ = 0 a σ 2 =1. N(0;1) -> NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ

Jaká je pravděpodobnost, že náhodně vybraná žena bude mít výšku v rozmezí 160 a 175 cm? Předpokládejme přitom, že výška žen má normální rozdělení s parametry μ = 170 a σ 2 = 36.

Náhodná veličina X má normální rozdělení s parametry μ = 10 a σ 2 = 25. Určete následující pravděpodobnosti a kvantily: a) P(X < 5) b) P(8<X<12) c) P(X >18) d) P(X = 5) e) X 0,975 f) X 0,05

Bylo zjištěno, že pevnost v tahu určitého druhu výrobku má normální rozdělení se střední hodnotou 200 jednotek a směrodatnou odchylkou 40 jednotek. Každý výrobek je před expedicí testován a ty výrobky, jejichž pevnost v tahu je větší než 220 jednotek, jsou označovány za velmi kvalitní. Jaká je pravděpodobnost vyrobení velmi kvalitního výrobku?

Odchylka rozměru výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 0 mm a se směrodatnou odchylkou 5mm. Jaká musí být šířka intervalu normy (symetrického kolem požadované hodnoty) pro velikost výrobku, aby rozměr výrobku nepřekročil interval s pravděpodobností 0,95?