JAK MODELOVAT VÝSLEDKY

Podobné dokumenty
JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

NÁHODNÁ VELIČINA. 3. cvičení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Základy teorie pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti

Charakterizace rozdělení

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

PRAVDĚPODOBNOST A STATISTIKA

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Praktická statistika. Petr Ponížil Eva Kutálková

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Diskrétní náhodná veličina. November 12, 2008

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

Definice spojité náhodné veličiny zjednodušená verze

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Zápočtová práce STATISTIKA I

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Pravděpodobnost a aplikovaná statistika

Kurz Biostatistiky pro zaměstnance FNO

PRAVDĚPODOBNOST A STATISTIKA

MATEMATICKÁ STATISTIKA - XP01MST

Číselné charakteristiky

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Číselné charakteristiky a jejich výpočet

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Náhodný vektor a jeho charakteristiky

Metodologie pro ISK II

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Jevy a náhodná veličina

Statistika pro geografy

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Inovace bakalářského studijního oboru Aplikovaná chemie

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

Téma 22. Ondřej Nývlt

Chyby měření 210DPSM

7. Rozdělení pravděpodobnosti ve statistice

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Charakteristika datového souboru

8 Střední hodnota a rozptyl

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

NÁHODNÝ VEKTOR. 4. cvičení

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Normální rozložení a odvozená rozložení

Výběrové charakteristiky a jejich rozdělení

Metodologie pro Informační studia a knihovnictví 2

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

Náhodné (statistické) chyby přímých měření

Analýza dat na PC I.

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)

Rovnoměrné rozdělení

Pravděpodobnost a statistika

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

MATEMATICKÁ STATISTIKA

8. Normální rozdělení

NMAI059 Pravděpodobnost a statistika

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

STATISTICKÉ ODHADY Odhady populačních charakteristik

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Metodologie pro Informační studia a knihovnictví 2

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

STATISTICKÉ CHARAKTERISTIKY

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

KGG/STG Statistika pro geografy

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Přednáška IV. Náhodná veličina, rozdělení pravděpodobnosti a reálná data

Vybraná rozdělení náhodné veličiny

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Pravděpodobnost a statistika I KMA/K413

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Základy popisné statistiky

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

0.1 Funkce a její vlastnosti

Manuál pro zaokrouhlování

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Matematika (KMI/PMATE)

Náhodné chyby přímých měření

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Transkript:

JAK MODELOVAT VÝSLEDKY NÁHODNÝCH POKUSŮ? Martina Litschmannová

Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.

Jak modelovat výsledky náhodných pokusů? Definice: Náhodná veličina (NV) je funkce, která zobrazuje elementární jevy ω Ω na reálná čísla. NV obvykle značíme velkými písmeny X, Y, Z. NV přiřadí každému elementárnímu jevu ω reálné číslo (převádí elementární jevy (abstraktními objekty) na čísla). Hodnota X ω NV X závisí na tom, který elementární jev ω nastal. Víme-li, který elementární jev ω nastal, známe hodnotu X ω NV X. Náhodná veličina X Ω ω 1 0 x 1 R

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu Náhodný pokus: Hod kostkou X výsledek hodu kostkou Náhodný jev: Padne sudé číslo. X 2; 4; 6

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X počet dívek mezi 1 000 náhodně vybranými dětmi Náhodný pokus: Náhodný výběr 1 000 dětí a zjištění počtu dívek mezi nimi. Náhodný jev: Mezi 1 000 náhodně vybranými dětmi bude více než 500 dívek. X > 500

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X doba do remise onemocnění Náhodný pokus: Pozorování doby do remise onemocnění Náhodný jev: Doba do remise nepřekročí 60 měsíců. X 60

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X rychlost připojení k internetu (Mb/s) Náhodný pokus: Měření rychlosti připojení k internetu (download). Náhodný jev: Rychlost připojení k internetu je vyšší než 20 Mb/s. X > 20

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví muž (0), žena (1)).

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu P X M, kde M R. (tj. P X = a, P X < a, P X > a, P a < X < b,, kde a, b R) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností.

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu P X M, kde M R. (tj. P X = a, P X < a, P X > a, P a < X < b,, kde a, b R) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).

Distribuční funkce F(x) Distribuční funkce F t udává pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. F t = P X < t Distribuční funkce jednoznačně určuje rozdělení NV, tj. známe-li distribuční funkci, umíme určit pravděpodobnost P X M pro libovolnou M R. Někteří autoři definuji F t = P X t!!!

F(x) F(x) Distribuční funkce 1 5/6 4/6 3/6 2/6 1/6-0 -1 0 1 2 3 4 5 6 7 x 1 0,8 0,6 0,4 0,2 0-2 3 8 x Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny

Základní typy náhodných veličin Diskrétní NV mohou nabývat spočetně mnoha hodnot Příklady: počet dní hospitalizace, počet krvácivých epizod, počet dní nemocenské, počet zákazníků v lékárně během jednoho dne, Spojité NV mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba do remise onemocnění, výška, váha, BMI, IQ, vitální kapacita plic, chyba měření,

Základní typy náhodných veličin Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV X s distribuční funkcí F X t je charakterizována pravděpodobnostní funkcí P X = x i, tj. funkcí pro níž platí: F X t = σ xi <t P X = x i =σ xi <t P x i Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV X s distribuční funkcí F X t je charakterizována hustotou pravděpodobností f x, tj. funkcí pro níž platí: F X t = න t f x dx

Rozdělení pravděpodobnosti diskrétní náhodné veličiny

Diskrétní náhodná veličina Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: je diskrétní ), právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí

Pravděpodobnostní funkce P x i 0 σ i P X = x i = 1 Lze zadat: předpisem, x 0; 1; 2; 3 : P X = x = 3 x 0,1x 0,9 3 x tabulkou, x 0 1 2 3 P x 0,729 0,243 0,027 0,001 grafem. P(x) 0,8 0,6 0,4 0,2 0 0 1 2 3 4 x

1 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2 0,25 Vylučovatelství skupinově specifických substancí ABH Určete pravděpodobnostní a distribuční funkci počtu alel Se.

Vztah mezi pravděpodobnostní a distribuční funkcí P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. P X = a = lim F(x) F a x a+

Vztah mezi pravděpodobnosti a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4 x -0,05-1 0 1 2 3 4 x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. P X = a = lim F(x) F a, tj. velikost skoku distribuční funkce v bodech nespojitosti je rovna x a+ příslušným hodnotám pravděpodobnostní funkce.

Distribuční funkce F t = σ xi <t P x i Lze zadat: předpisem, tabulkou, grafem. F x = F(x) 0,95 0,75 0,55 0,35 0,15 0 x 0 0,729 0 < x 1 0,972 1 < x 2 0,999 2 < x 3 1 3 < x -0,05-1 0 1 2 3 4 x x F( x ) ۄ 0 ( ; 0 ۄ 1 (0; 0,729 ۄ 2 (1; 0,972 ۄ 3 (2; 0,999 3; 1

Distribuční funkce F(x) Distribuční funkce F t udává pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. Vlastnosti distribuční funkce: 0 F t 1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, F t 0 pro t ( začíná v 0), F t 1 pro t ( končí v 1). F t = P X < t Někteří autoři definuji F t = P X t!!!

Vztah mezi pravděpodobnosti a distribuční funkcí P X = a = lim F x F a x a+

Vztah mezi pravděpodobnosti a distribuční funkcí P X < a = F a = σ xi <a P(x i ) P X a = 1 P X < a = 1 F a = σ xi a P(x i ) P a X < b = P X < b P X < a = F a F b = σ a xi <b P(x i ) P X = a = lim F x F(a) x a+. Umíte určit distribuční funkci, znáte-li funkci pravděpodobnostní? Ověřit si to můžete ZDE.

2 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Počet alelol Se lze modelovat náhodnou veličinou s distribuční funkcí F x = 0,00, x ( ; 0 0,25, x (0; 1 0,75, x (1; 2 1,00, x 2;. Určete pravděpodobnostní funkci počtu alel Se.

Rozdělení pravděpodobnosti spojité náhodné veličiny

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: je spojitá ) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: je spojitá ) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: x R: P x = 0

Hustota pravděpodobnosti f(x) t F x = f x dx f x = df dx Pozorujte vztah mezi histogramem a grafem hustoty pravděpodobnosti (java applet: Přechod mezi histogramem a hustotou pravděpodobnosti) Vlastnosti hustoty pravděpodobnosti f x je reálná nezáporná funkce, f x = 1 (plocha pod křivkou hustoty je 1), lim f x = 0 ( začíná v 0 ), x lim f x = 0 ( končí v 0 ) x f(x) 2 1,5 1 0,5 f(x) může nabývat hodnot vyšších než 1!!! 0-1 -0,5 0 0,5 1 x

Distribuční funkce F t = න t f x dx

Vztah mezi pravděpodobností a distribuční funkcí P X a 0

Vztah mezi pravděpodobnosti, hustotou a distr. funkcí a = P X < a = F a f x dx a 1 = a P X a = 1 P X < a = 1 F P a X < b = P X < b P X < a = F a F b = b = a dx f x P X = a = lim F x F a = 0 x a+ f x dx = a b f x dx f x dx = a f x dx Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. P X < a = P X a apod. Jaká je souvislost mezi pravděpodobností, distr. funkcí a hustotou pravd.? Ověřit si, zda je Vaše geometrická představa správná, můžete ZDE.

3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. a) Určete konstantu c. b) Určete distribuční funkci F x. c, x 0; 10 f x = ቊ 0, x 0; 10 c) Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut, alespoň 3 minuty, právě 7 minut.

K čemu potřebujeme popisovat chování NV? NV převádějí abstraktní a většinou neznámý základní prostor Ω na čísla (s čísly se lépe pracuje). Ve složitějších situacích je těžké základní prostor Ω rozumně popsat stačí znát rozdělení příslušné NV a pracovat na reálných číslech. NV slouží jako model pro naše empirická pozorování (data). V teorii pravděpodobnosti s nimi pracujeme teoreticky jejich rozdělení považujeme za dané a zkoumáme jejich vlastnosti Ve statistice se snažíme cosi usoudit o jejich neznámém rozdělení na základě konkrétních realizací.

Číselné charakteristiky náhodných veličin

Proč potřebujeme číselné charakteristiky NV? Distribuční funkce (pravděpodobnostní funkce, hustota pravděpodobnosti) popisují rozdělení NV jednoznačně, do všech podrobností. Někdy nás zajímá pouze některý aspekt NV, který se dá popsat jedním číslem: očekávaná hodnota NV, variabilita možných hodnot, hodnota, pod níž leží pouze malé množství hodnot NV, šikmost rozdělení, koncentrace hodnot NV kolem očekávané hodnoty (špičatost rozdělení).

Číselné charakteristiky náhodných veličin Obecný moment r-tého řádu (značí se μ r nebo E X r pro diskrétní NV: μ r = σ i x i r P x i pro r = 1, 2, ) pro spojitou NV: μ r = x r f x dx Střední hodnota (angl. expected value, mean; značí se E X nebo µ) pro diskrétní NV: E X = μ = σ i x i P x i pro spojitou NV: E X = μ = x f x dx

Význam střední hodnoty Střední hodnotu E X náhodné veličiny X lze chápat jako: průměrnou (očekávanou) hodnotu NV X, kolem níž hodnoty NV kolísají, míru polohy, populační průměr, vážený průměr všech možných hodnot E X = σ i x i P x i, těžiště možných hodnot. f(x) 0,05 0,04 0,03 0,02 0,01 0 E(X) f(x) 0,1 0,05 0 0 50 100 x E(X) 0 10 20 30 40 50 x

Kvantily p-kvantil x p (také 100p%-ní kvantil je číslo, pro které platí: P X < x p = p. F x p = p x p = F 1 (p) (tj. kvantilová funkce F 1 (p) je funkcí inverzní k distribuční funkci F x p ) Kvantily obvykle určujeme pouze pro SNV.

Kvantily p-kvantil x p (také 100p%-ní kvantil je číslo, pro které platí: P X < x p = p. F x p = p x p = F 1 (p) x 0,5 50% kvantil x 0,8 80% kvantil

Význačné kvantily Kvartily Dolní kvartil x 0,25 Medián x 0,5 Horní kvartil x 0,75 Decily x 0,1 ; x 0,2 ;... ; x 0,9 Percentily x 0,01 ; x 0,02 ; ; x 0,03 Minimum x min a Maximum x max 45

Kde se setkáme s kvantily?

Modus Modus x typická hodnota náhodné veličiny pro diskrétní NV: x i : P X = x P X = x i (tzn. modus je taková hodnota DNV, v níž P x i nabývá svého maxima) pro spojitou NV: x: f x f x (tzn. modus je taková hodnota SNV, v níž f x nabývá svého maxima) Modus není těmito podmínkami určen jednoznačně, tzn. náhodná veličina může mít několik modů (např. výsledek hodu kostkou). Má-li NV právě jeden modus, mluvíme o unimodálním rozdělení NV. Má-li NV unimodální symetrické rozdělení, pak E X = x 0,5 = x.

4 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2 0,25 Vylučovatelství skupinově specifických substancí ABH Určete střední hodnotu a modus počtu alel Se.

5 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 0,1, x 0; 10 f x = ቊ 0, x 0; 10 Určete střední hodnotu náhodné veličiny X.

Číselné charakteristiky náhodných veličin Centrální moment r-tého řádu μ r (značíme μ r = E X EX r ) pro diskrétní NV: μ r = σ i x i EX r P x i pro spojitou NV: μ r = x EX r f x dx Rozptyl (angl. dispersion, variance; značí se μ 2 nebo DX nebo σ 2 ) pro diskrétní NV: D X = μ 2 = σ i pro spojitou NV: D X = μ 2 = x i EX 2 P x i x EX 2 f x dx Výpočetní vztah pro rozptyl: D(X) = E(X 2 ) EX 2

Význam rozptylu Míra variability dat kolem střední hodnoty. Střední kvadratická odchylka od střední hodnoty D X = E X E(X) 2. Malý rozptyl hodnoty NV se s vysokou pravděpodobností objevují blízko E X. Velký rozptyl hodnoty NV se často objevují ve velké vzdálenosti od E X. D X1 < D(X2) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!!

Směrodatná odchylka Směrodatná odchylka σ σ(y) = D(X) Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty μ a sm. odchylky σ? k > 0: P μ kσ < X < μ + kσ > 1 1 k 2 (Čebyševova nerovnost) k P μ kσ < X < μ + kσ 1 >0 2 >0,75 3 >0,89 Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách!

Variační koeficient Variační koeficient γ je definován pouze pro nezáporné náhodné veličiny. γ = σ, resp. σ 100 [%] μ μ Variační koeficient směrodatná odchylka v procentech střední hodnoty Čím nižší var. koeficient, tím homogennější soubor. V x > 50% značí silně rozptýlený soubor.

6 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2 0,25 Vylučovatelství skupinově specifických substancí ABH Určete rozptyl, směrodatnou odchylku a variační koeficient počtu alel Se.

7 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 0,1, x 0; 10 f x = ቊ 0, x 0; 10 Určete rozptyl, směrodatnou odchylku a variační koeficient náhodné veličiny X.

8 Modelujeme výšku chlapců ve věku 3,5 4 roky. Vysvětlete: 1) 2% kvantil modelované náhodné veličiny je 93 cm. 2) Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. V jakém rozpětí lze očekávat výšku chlapců ve věku 3,5 4 roky? Pro interpretaci využijte Čebyševovu nerovnost. 3) Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. Posuďte variabilitu modelované NV. (Není příliš vysoká? Pro posouzení použijte variační koeficient.) 4) Víme, že pro distribuční funkci modelované NV platí: F 111 = 0,98. Co jsme se dozvěděli?

Míry šikmosti a špičatosti

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.

Šikmost α 3 Míra symetrie rozdělení NV α 3 = μ 3 E X E(X) 3 σ3 = σ 3 f(x) f(x) f(x) α 3 < 0 negativně zešikmené rozdělení x α 3 = 0 symetrické rozdělení x α 3 > 0 pozitivně zešikmené rozdělení x E(X) < x 0,5 < x x = x 0,5 = E(X) x < x 0,5 < E(X) obvykle

Špičatost α 4 Míra koncentrace kolem průměru α 4 = μ 4 E X E(X) 4 = σ4 σ 4 f(x) f(x) f(x) α 4 < 3 špičatost menší než u norm. rozdělení (plošší rozdělení) x α 4 = 3 špičatost odpovídající normálnímu rozdělení x α 4 > 3 špičatost větší než u norm. rozdělení (špičatější rozdělení) x standardizovaná špičatost α 4 3

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g 1, angl. skewness) a špičatost (g 2, angl. kurtosis).

Transformace náhodné veličiny

Transformace náhodné veličiny Transformací NV X rozumíme aplikaci prosté reálné funkce g tak, že vznikne nová náhodná veličina Y = g X. NV Y může nabývat jiných hodnot než NV X, může mít také jiné rozdělení pravděpodobnosti, které chceme najít (tj. hledáme pravděpodobnostní f-ci, resp. hustotu pravděpodobnosti NV Y).

Transformace náhodné veličiny Y = g(x) y R: F Y y = P Y < y = P(g X < y) Pro diskrétní NV: P Y y = P Y = y = P g X = y = P X g 1 y = Pro spojitou NV: Je-li g rostoucí f-ce: y R: F Y y = P X < g 1 y = F X (g 1 (y)) Je-li g klesající f-ce: y R: F Y y = P X > g 1 y = 1 F X (g 1 (y)) Je-li g spojitě diferencovatelná f-ce: f Y y = f X (g 1 y ) dg 1 (y) dy x g 1 (y) P X (x)

Vyzkoušejte si popis transformovaných náhodných veličin a výpočet jejich základních číselných charakteristik v praxi. Řešené příklady naleznete ZDE (DNV) a ZDE (SNV).

DĚKUJI ZA POZORNOST!