JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Podobné dokumenty
JAK MODELOVAT VÝSLEDKY

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

NÁHODNÁ VELIČINA. 3. cvičení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Základy teorie pravděpodobnosti

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a rozdělení pravděpodobnosti

Charakterizace rozdělení

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

PRAVDĚPODOBNOST A STATISTIKA

Praktická statistika. Petr Ponížil Eva Kutálková

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Diskrétní náhodná veličina. November 12, 2008

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

MATEMATICKÁ STATISTIKA - XP01MST

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

Zápočtová práce STATISTIKA I

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Téma 22. Ondřej Nývlt

Definice spojité náhodné veličiny zjednodušená verze

PRAVDĚPODOBNOST A STATISTIKA

7. Rozdělení pravděpodobnosti ve statistice

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Číselné charakteristiky

Pravděpodobnost a aplikovaná statistika

Náhodný vektor a jeho charakteristiky

PRAVDĚPODOBNOST A STATISTIKA

Metodologie pro ISK II

Statistika pro geografy

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

Číselné charakteristiky a jejich výpočet

Jevy a náhodná veličina

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

NÁHODNÝ VEKTOR. 4. cvičení

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Chyby měření 210DPSM

Charakteristika datového souboru

Inovace bakalářského studijního oboru Aplikovaná chemie

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

8 Střední hodnota a rozptyl

Normální rozložení a odvozená rozložení

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

0.1 Funkce a její vlastnosti

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Matematika (KMI/PMATE)

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Výběrové charakteristiky a jejich rozdělení

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

0.1 Úvod do matematické analýzy

KGG/STG Statistika pro geografy

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Pravděpodobnost a statistika

Analýza dat na PC I.

Pravděpodobnost a statistika I KMA/K413

Rovnoměrné rozdělení

8. Normální rozdělení

Metodologie pro Informační studia a knihovnictví 2

Vybraná rozdělení náhodné veličiny

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Matematika I (KMI/PMATE)

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Náhodné (statistické) chyby přímých měření

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)

STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Základy popisné statistiky

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Metodologie pro Informační studia a knihovnictví 2

Poznámky k předmětu Aplikovaná statistika, 4. téma

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Normální (Gaussovo) rozdělení

NMAI059 Pravděpodobnost a statistika

Poznámky k předmětu Aplikovaná statistika, 4. téma

Transkript:

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.

Jak modelovat výsledky náhodných pokusů? Definice: Náhodná veličina je funkce, která zobrazuje elementární jevy ω Ω na reálná čísla. NV obvykle značíme velkými písmeny X, Y, Z. NV přiřadí každému elementárnímu jevu ω reálné číslo (převádí elementární jevy (abstraktními objekty) na čísla). Hodnota X ω náhodné veličiny X závisí na tom, který elementární jev ω nastal. Víme-li, který elementární jev ω nastal, známe hodnotu X ω náhodné veličiny X. Náhodná veličina X Ω ω 1 0 x 1 R

Zápis jevů pomocí náhodných veličin Zápisem X = a X ω = a, tj. rozumíme jev složený ze všech elementárních jevů ω Ω, pro které X = a = ω Ω: X ω = a. Podobně: X < a = ω Ω: X ω < a, X > a = ω Ω: X ω > a, a < X < b = ω Ω: a < X ω < b,

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X výsledek hodu kostkou Náhodný pokus: Hod kostkou Náhodný jev: Padne sudé číslo. X 2; 4; 6

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X počet dívek mezi 1 000 náhodně vybranými dětmi Náhodný pokus: Náhodný jev: Náhodný výběr 1 000 dětí a zjištění počtu dívek mezi nimi. Mezi 1 000 náhodně vybranými dětmi bude více než 500 dívek. X > 500

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X doba do remise onemocnění Náhodný pokus: Náhodný jev: Pozorování doby do remise onemocnění Doba do remise nepřekročí 60 měsíců. X 60

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu X rychlost připojení k internetu (Mb/s) Náhodný pokus: Náhodný jev: Měření rychlosti připojení k internetu (download). Rychlost připojení k internetu je vyšší než 20 Mb/s. X > 20

Náhodná veličina (NV) Náhodná veličina číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví muž (0), žena (1)).

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu P X M, kde M R. (tj. P X = a, P X < a, P X > a, P a < X < b,, kde a, b R) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností, graficky.

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu P X M, kde M R. (tj. P X = a, P X < a, P X > a, P a < X < b,, kde a, b R) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).

Distribuční funkce F(x) Distribuční funkce F t dané reálné číslo t. je pravděpodobnost, že náhodná veličina X bude menší než F t = P X < t F t udává pravděpodobnost, že náhodná veličina nabývá hodnot menších než t. Distribuční funkce jednoznačně určuje rozdělení NV, tj. známe-li distribuční funkci, umíme určit pravděpodobnost P X M pro libovolnou M R. Distribuční funkci náhodné veličiny X někdy značíme F X t. Někteří autoři definuji F t = P X t!!!

F(x) F(x) Distribuční funkce 1 5/6 4/6 3/6 2/6 1/6-0 -1 0 1 2 3 4 5 6 7 x 1 0,8 0,6 0,4 0,2 0-2 3 8 x Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny

Základní typy náhodných veličin Diskrétní NV mohou nabývat spočetně mnoha hodnot Příklady: počet průjezdů automobilů Klimkovickým tunelem mezi 13:00 14:00, počet kybernetických útoků na určitý web během dne, počet dní nemocenské, počet zákazníků v lékárně během jednoho dne, Spojité NV mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba do remise onemocnění, výška, váha, BMI, IQ, doba mezi dvěma následujícími kybernetickými útoky na web, chyba měření,

Základní typy náhodných veličin Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV X s distribuční funkcí F X t je charakterizována pravděpodobnostní funkcí P X = x i, tj. funkcí pro níž platí: F X t = σ xi <t P X = x i =σ xi <t P x i Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV X s distribuční funkcí F X t je charakterizována hustotou pravděpodobností f x, tj. funkcí pro níž platí: F X t = න t f x dx

Rozdělení pravděpodobnosti diskrétní náhodné veličiny

Diskrétní náhodná veličina Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: je diskrétní ), právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí

Pravděpodobnostní funkce P x i 0 σ i P X = x i = 1 Lze zadat: předpisem, x 0; 1; 2; 3 : P X = x = 3 x 0,1x 0,9 3 x tabulkou, x 0 1 2 3 P x 0,729 0,243 0,027 0,001 grafem. P(x) 0,8 0,6 0,4 0,2 0 0 2 4 x

1 Při ověřování kvality výroby jsou náhodně vybrány dva výrobky a je testována jejich kvalita. Počet vadných výrobků mezi vybranými modelujeme náhodnou veličino X. Z dlouhodobého pozorování jsou známy údaje uvedené v následující tabulce. Počet vadných výrobků Pravděpodobnost 0 0,25 1 0,50 2 0,25 Určete pravděpodobnostní a distribuční funkci počtu vadných výrobků v testovaném vzorku.

Vztah mezi pravděpodobnostní a distribuční funkcí P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. P X = a = lim F(x) F a x a+

Vztah mezi pravděpodobnosti a distribuční funkci P(x) 0,8 0,7 F(x) 0,95 0,6 0,5 0,4 0,75 0,55 0,3 0,2 0,1 0,35 0,15 0 0 1 2 3 4-0,05-1 0 1 2 3 4 x x Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. P X = a = lim F(x) F a, tj. velikost skoku distribuční funkce v bodech nespojitosti x a+ je rovna příslušným hodnotám pravděpodobnostní funkce.

Distribuční funkce F t = σ xi <t P x i Lze zadat: předpisem, tabulkou, grafem. F x = F(x) 0,95 0 x 0 0,729 0 < x 1 0,972 1 < x 2 0,999 2 < x 3 1 3 < x x F x ۄ 0 ( ; 0 ۄ 1 (0; 0,729 ۄ 2 (1; 0,972 ۄ 3 (2; 0,999 3; 1 0,45-0,05-1 0 1 2 3 4 x

Distribuční funkce F(x) Distribuční funkce F t reálné číslo t. je pravděpodobnost, že náhodná veličina X bude menší než dané F t = P X < t Vlastnosti distribuční funkce: 0 F t 1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, lim F t = 0 ( začíná v 0), t lim t F(t) = 1 ( končí v 1). Někteří autoři definuji F t = P X t!!!

Vztah mezi pravděpodobnosti a distribuční funkcí P X = a = lim F x F a x a+

Vztah mezi pravděpodobnosti a distribuční funkcí P X < a = F a = σ xi <a P(x i ) P X a = 1 P X < a = 1 F a = σ xi a P(x i ) P a X < b = P X < b P X < a = F a F b = σ a xi <b P(x i ) P X = a = lim F x F(a) x a+. Umíte určit distribuční funkci, znáte-li funkci pravděpodobnostní? Ověřit si to můžete ZDE.

2 Při ověřování kvality výroby jsou náhodně vybrány dva výrobky a je testována jejich kvalita. Počet vadných výrobků mezi vybranými modelujeme náhodnou veličino X, která má níže uvedenou distribuční funkci. F x = 0,00, x ( ; 0 0,25, x (0; 1 0,75, x (1; 2 1,00, x 2;. Určete pravděpodobnostní funkci počtu vadných výrobků v testovaném vzorku.

Rozdělení pravděpodobnosti spojité náhodné veličiny

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: je spojitá ) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: je spojitá ) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: x R: P x = 0

Hustota pravděpodobnosti f(x) t F t = f x dx f x = df dx Pozorujte vztah mezi histogramem a grafem hustoty pravděpodobnosti (java applet: Přechod mezi histogramem a hustotou pravděpodobnosti) Vlastnosti hustoty pravděpodobnosti f x je reálná nezáporná funkce, f x = 1 (plocha pod křivkou hustoty je 1), lim f x = 0 ( začíná v 0 ), x lim x f x = 0 ( končí v 0 ) f(x) může nabývat hodnot vyšších než 1!!! f(x) 2 1,5 1 0,5 0-1 -0,5 0 0,5 1 x

Distribuční funkce t F t = f x dx

Vztah mezi pravděpodobností a distribuční funkcí P X a 0

Vztah mezi pravděpodobnosti, hustotou a distr. funkcí a = P X < a = F a f x dx a 1 = a P X a = 1 P X < a = 1 F P a X < b = P X < b P X < a = F a F b = P X = a = lim F x F a = 0 x a+ b = f x dx = a f x dx a f x dx f x dx = a b f x dx Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. P X < a = P X a apod. Jaká je souvislost mezi pravděpodobností, distr. funkcí a hustotou pravd.? Ověřit si, zda je Vaše geometrická představa správná, můžete ZDE.

3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. a) Určete konstantu c. b) Určete distribuční funkci F x. c, x 0; 10 f x = ቊ 0, x 0; 10 c) Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut, alespoň 3 minuty, právě 7 minut.

K čemu potřebujeme popisovat chování náhodné veličiny? NV převádějí abstraktní základní prostor Ω na čísla (s čísly se lépe pracuje). NV slouží jako model pro naše empirická pozorování (data). V teorii pravděpodobnosti s nimi pracujeme teoreticky jejich rozdělení považujeme za dané a zkoumáme jejich vlastnosti. Ve statistice se snažíme cosi usoudit o jejich neznámém rozdělení na základě konkrétních realizací.

Číselné charakteristiky náhodných veličin

Proč potřebujeme číselné charakteristiky NV? Distribuční funkce (pravděpodobnostní funkce, hustota pravděpodobnosti) popisují rozdělení NV jednoznačně, do všech podrobností. Někdy nás zajímá pouze některý aspekt NV, který se dá popsat jedním číslem: očekávaná hodnota NV, variabilita možných hodnot, hodnota, pod níž leží pouze určité množství hodnot NV, šikmost rozdělení, koncentrace hodnot NV kolem očekávané hodnoty (špičatost rozdělení).

Číselné charakteristiky náhodných veličin Obecný moment r-tého řádu (značí se μ r nebo E X r pro r = 1, 2, ) pro diskrétní NV: pro spojitou NV: μ r = σ i x i r P x i μ r = x r f x dx Střední hodnota (angl. expected value, mean; značí se E X nebo µ) pro diskrétní NV: pro spojitou NV: E X = μ = σ i x i P x i E X = μ = x f x dx

Význam střední hodnoty Střední hodnotu E X náhodné veličiny X lze chápat jako: průměrnou (očekávanou) hodnotu NV X, kolem níž hodnoty NV kolísají, míru polohy, populační průměr, vážený průměr všech možných hodnot E X = σ i x i P x i, těžiště možných hodnot. f(x) 0,05 0,04 0,03 0,02 0,01 0 E(X) f(x) 0,1 0,05 0 0 50 100 x E(X) 0 10 20 30 40 50 x

Vlastnosti střední hodnoty a, b R: E ax + b = ae(x) + b, E σ i n X i = σ i n E(X i ), tj. střední hodnota součtu NV je rovna součtu jejich středních hodnot (vždy), X 1,, X n nezávislé E ς n i=1 X i = ς n i=1 E(X i ), tj. jsou-li NV nezávislé, pak střední hodnota součinu NV je rovna součinu jejich středních hodnot (obecně to neplatí).

Kvantily p-kvantil x p (také 100p%-ní kvantil) je číslo, pro které platí: P X < x p = p. F x p = p x p = F 1 (p) (tj. kvantilová funkce F 1 (p) je funkcí inverzní k distribuční funkci F x p ) Kvantily obvykle určujeme pouze pro SNV.

Kvantily p-kvantil x p (také 100p%-ní kvantil je číslo, pro které platí: P X < x p = p. F x p = p x p = F 1 (p) x 0,5 50% kvantil x 0,9 90% kvantil

Význačné kvantily Kvartily Dolní kvartil x 0,25 Medián x 0,5 Horní kvartil x 0,75 Decily x 0,1 ; x 0,2 ;... ; x 0,9 Percentily x 0,01 ; x 0,02 ; ; x 0,03 Minimum x min a Maximum x max 47

Kde se setkáme s kvantily?

Modus Modus x typická hodnota náhodné veličiny pro diskrétní NV: x i : P X = x P X = x i (tzn. modus je taková hodnota DNV, v níž P x i nabývá svého maxima) pro spojitou NV: x: f x f x (tzn. modus je taková hodnota SNV, v níž f x nabývá svého maxima) Modus není těmito podmínkami určen jednoznačně, tzn. náhodná veličina může mít několik modů (např. výsledek hodu kostkou). Má-li NV právě jeden modus, mluvíme o unimodálním rozdělení NV. Má-li NV unimodální symetrické rozdělení, pak E X = x 0,5 = x.

4 Při ověřování kvality výroby jsou náhodně vybrány dva výrobky a je testována jejich kvalita. Počet vadných výrobků mezi vybranými modelujeme náhodnou veličino X. Z dlouhodobého pozorování jsou známy údaje uvedené v následující tabulce. Počet vadných výrobků Pravděpodobnost 0 0,25 1 0,50 2 0,25 Určete střední hodnotu a modus počtu vadných výrobků v testovaném vzorku.

5 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 0,1, x 0; 10 f x = ቊ 0, x 0; 10 Určete střední hodnotu náhodné veličiny X.

Číselné charakteristiky náhodných veličin Centrální moment r-tého řádu μ r (značíme μ r = E X EX r ) pro diskrétní NV: μ r = σ i x i EX r P x i pro spojitou NV: μ r = x EX r f x dx Rozptyl (angl. dispersion, variance; značí se μ 2 nebo DX nebo σ 2 ) pro diskrétní NV: D X = μ 2 = σ i x i EX 2 P x i pro spojitou NV: D X = μ 2 = x EX 2 f x dx Výpočetní vztah pro rozptyl: D(X) = E(X 2 ) EX 2

Význam rozptylu Míra variability dat kolem střední hodnoty. Střední kvadratická odchylka od střední hodnoty D X = E X E(X) 2. Malý rozptyl hodnoty NV se s vysokou pravděpodobností objevují blízko E X. Velký rozptyl hodnoty NV se často objevují ve velké vzdálenosti od E X. D X1 < D(X2) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!!

Vlastnosti rozptylu a, b R: D ax + b = a 2 D(X), X 1,, X n nezávislé D σ i n X i = σ i n D(X i ), tj. jsou-li NV nezávislé, pak střední hodnota součtu NV je rovna součtu jejich středních hodnot (obecně to neplatí).

hustota pravděpodobnosti Směrodatná odchylka Směrodatná odchylka σ σ(x) = D(X) Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty μ a sm. odchylky σ? k > 0: P μ kσ < X < μ + kσ > 1 1 k 2 (Čebyševova nerovnost) k P μ kσ < X < μ + kσ 1 >0 2 >0,75 3 >0,89 nejméně 89 % nejméně 75 % Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách!

Variační koeficient Variační koeficient γ je definován pouze pro nezáporné náhodné veličiny. γ = σ μ, resp. σ μ 100 (%) Variační koeficient směrodatná odchylka v procentech střední hodnoty Čím nižší variační koeficient, tím homogennější soubor. γ X > 50% silně rozptýlený soubor.

6 Při ověřování kvality výroby jsou náhodně vybrány dva výrobky a je testována jejich kvalita. Počet vadných výrobků mezi vybranými modelujeme náhodnou veličino X. Z dlouhodobého pozorování jsou známy údaje uvedené v následující tabulce. Počet vadných výrobků Pravděpodobnost 0 0,25 1 0,50 2 0,25 Určete rozptyl, směrodatnou odchylku a variační koeficient počtu vadných výrobků v testovaném vzorku.

7 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina X představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 0,1, x 0; 10 f x = ቊ 0, x 0; 10 Určete rozptyl, směrodatnou odchylku a variační koeficient náhodné veličiny X.

8 Modelujeme výšku chlapců ve věku 3,5 4 roky. Vysvětlete: 1) 2% kvantil modelované náhodné veličiny je 93 cm. 2) Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. V jakém rozpětí lze očekávat výšku chlapců ve věku 3,5 4 roky? Pro interpretaci využijte Čebyševovu nerovnost. 3) Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. Posuďte variabilitu modelované NV. (Není příliš vysoká? Pro posouzení použijte variační koeficient.) 4) Víme, že pro distribuční funkci modelované NV platí: F 111 = 0,98. Co jsme se dozvěděli?

Míry šikmosti a špičatosti

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.

Šikmost α 3 Míra symetrie rozdělení NV α 3 = μ 3 E X E(X) 3 σ3 = σ 3 f(x) f(x) f(x) α 3 < 0 negativně zešikmené rozdělení E(X) < x 0,5 < x x α 3 = 0 symetrické rozdělení x = x 0,5 = E(X) x α 3 > 0 pozitivně zešikmené rozdělení x < x 0,5 < E(X) x obvykle

Špičatost α 4 míra koncentrace kolem průměru α 4 = μ 4 E X E(X) 4 = σ4 σ 4 f(x) f(x) f(x) α 4 < 3 špičatost menší než u norm. rozdělení (plošší rozdělení) standardizovaná špičatost α 4 3 x x α 4 = 3 špičatost odpovídající normálnímu rozdělení α 4 > 3 špičatost větší než u norm. rozdělení (špičatější rozdělení) x

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g 1, angl. skewness) a špičatost (g 2, angl. kurtosis).

Transformace náhodné veličiny

Transformace náhodné veličiny Transformací NV X rozumíme aplikaci prosté reálné funkce g tak, že vznikne nová náhodná veličina Y = g X. NV Y může nabývat jiných hodnot než NV X, může mít také jiné rozdělení pravděpodobnosti, které chceme najít (tj. hledáme pravděpodobnostní f-ci, resp. hustotu pravděpodobnosti NV Y).

Transformace náhodné veličiny Y = g(x) y R: F Y y = P Y < y = P(g X < y) Pro diskrétní NV: P Y y = P Y = y = P g X = y = P X g 1 y = x g 1 (y) P X (x) Pro spojitou NV: Je-li g rostoucí f-ce: y R: F Y y = P X < g 1 y = F X (g 1 (y)) Je-li g klesající f-ce: y R: F Y y = P X > g 1 y = 1 F X (g 1 (y)) Je-li g spojitě diferencovatelná f-ce: f Y y = f X (g 1 y ) dg 1 (y) dy

Vyzkoušejte si popis transformovaných náhodných veličin a výpočet jejich základních číselných charakteristik v praxi Řešené příklady naleznete ZDE (DNV) a ZDE (SNV).

DĚKUJI ZA POZORNOST!