a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Podobné dokumenty
Základy teorie pravděpodobnosti

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Teorie pravěpodobnosti 1

Základní pojmy a úvod do teorie pravděpodobnosti. Ing. Michael Rost, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

I. D i s k r é t n í r o z d ě l e n í

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

p(x) = P (X = x), x R,

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

PRAVDĚPODOBNOST A STATISTIKA

Náhodný vektor a jeho charakteristiky

Diskrétní náhodná veličina. November 12, 2008

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Téma 22. Ondřej Nývlt

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Pravděpodobnost a aplikovaná statistika

NÁHODNÁ VELIČINA. 3. cvičení

PRAVDĚPODOBNOST A STATISTIKA

Náhodná veličina a rozdělení pravděpodobnosti

MATEMATICKÁ STATISTIKA - XP01MST

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

NMAI059 Pravděpodobnost a statistika

Statistika II. Jiří Neubauer

NÁHODNÁ VELIČINA. Podle typu výběrového prostoru rozlišujeme dva základní druhy NV Diskrétní (nespojitou) náhodnou veličinu Spojitou náhodnou veličinu

JAK MODELOVAT VÝSLEDKY

8 Střední hodnota a rozptyl

Intuitivní pojem pravděpodobnosti

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a statistika

7. Rozdělení pravděpodobnosti ve statistice

Inovace bakalářského studijního oboru Aplikovaná chemie

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Definice spojité náhodné veličiny zjednodušená verze

MATEMATICKÁ STATISTIKA

Pravděpodobnost a statistika I KMA/K413

Pravděpodobnost a její vlastnosti

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Základy teorie pravděpodobnosti

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Praktická statistika. Petr Ponížil Eva Kutálková

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Poznámky k předmětu Aplikovaná statistika, 4. téma

PRAVDĚPODOBNOST A STATISTIKA

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Základy teorie množin

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

1 Rozptyl a kovariance

Chyby měření 210DPSM

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Distribuční funkce je funkcí neklesající, tj. pro všechna

2 Hlavní charakteristiky v analýze přežití

Poznámky k předmětu Aplikovaná statistika, 4. téma

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Jevy a náhodná veličina

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Charakterizace rozdělení

8. Normální rozdělení

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Tomáš Karel LS 2012/2013

Statistika (KMI/PSTAT)

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

NÁHODNÝ VEKTOR. 4. cvičení

1 Vektorové prostory.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Náhodné (statistické) chyby přímých měření

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Statistika I (KMI/PSTAT)

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Základy popisné statistiky

1 Pravděpodobnostní prostor

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

9. Vícerozměrná integrace

Vybraná rozdělení náhodné veličiny

10. N á h o d n ý v e k t o r

9. Vícerozměrná integrace

Cvičení ze statistiky - 5. Filip Děchtěrenko

Funkce. Limita a spojitost

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Transkript:

Podmíněná pravděpodobnost, náhodná veličina a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Podmíněná pravděpodobnost Pokud je jev A vázán na uskutečnění jevu B, pak tento jev nazýváme jevem podmíněným jevu B a značíme jej A B. Při určování podmíněné pravděpodobnosti se množina všech možných výsledků náhodného pokusu omezí pouze na ty výsledky, jež vyhovují dané podmínce. Pravděpodobnost podmíněného jevu pak definujeme takto: P (A B) = P (A B) P (B) kde P (B) > 0. Z výše uvedeného vztahu plyne následující rovnice: P (A B) = P (A B) P (B) Zaměníme-li pak formálně A a B P (B A) = P (B A) P (A)

Tyto vzorce slouží pro výpočet současného výskytu jevů A a B a bývají označovány jako věty o násobení pravděpodobností. Pokud se bude jednat o nezávislé jevy, pak se věta o násobení pravděpodobností zjednoduší, nebot platí: a tedy P (A B) = P (A) P (B A) = P (B) P (A B) = P (A) P (B). Obdobně pak pro n nezávislých jevů.

Příklad Ve sklepě máte 70 kompotů: 35 hruškových, 20 jablkových a 15 třešňových. Pošlete svého slabšího sourozence (stejně jako vždy) pro 3 kompoty. Pokud přinese všechny hruškové, budete maximálně spokojeni a sourozenec bude pochválen. Pokud přinese všechny třešňové, půjde znova. V jiném případě to,,kousnete. Sourozenc pochopitelně neví, na co máte chut. Jaká je pravděpodobnost, že: sourozenec bude pochválen, to kousneme, půjde znova chudák.

Bayesův vzorec Pokud mají náhodné jevy B 1, B 2, B 3,, B n nenulové pravděpodobnosti a zároveň tvoří úplný rozklad pravděpodobnostního prostoru Ω, tj. Ω = n i=1 B i, přičemž B i B j = pro i j, lze libovolný jev A vyjádřit pomocí jevů B j pro j = 1, 2,, n takto: A = (A B 1 ) (A B 2 ) (A B n ). Postupným užitím věty o sčítání pravděpodobností pro neslučitelné náhodné jevy a věty o násobení pravděpodobností získáme předpis pro výpočet pravděpodobnosti jevu A, někdy také nazývaný vzorec úplné pravděpodobnosti. P (A) = n j=1 P (A B j ) P (B j )

Bayesův vzorec Pokud je i P (A) > 0, pak pro každý index i {1, 2,, n} bude platit: P (B i A) = P (A B i) P (B i ) nj=1 P (A B j ) P (B j ) Tento vztah budeme nazývat Bayesovým vzorcem.

Praktický příklad Studiem odborných časopisů jsme zjistili relativní četnosti mozkových příhod a vysokého krevního tlaku u starých osob. Známe tyto informace: 1 Deset procent lidí ve veku 70 let utrpí mozkovou příhodu v následujících pěti letech. P (MP ) = 0, 1 a tedy P (MP c ) = 0, 9 2 Dále víme, že 40 procent lidí kteří utrpěli mozkovou příhodu v pěti letech po 70 trpí (trpělo) vysokým krevním tlakem. P (KT MP ) = 0, 4 3 Z lidí kteří neměli mozkovou příhodu do 75 let mělo pouze 20 procent lidí vysoký krevní tlak. P (KT MP c ) = 0, 2

Zajímají nás dvě otázky: 1 Jaká je pravděpodobnost, že 70 letý pacient má vysoký krevní tlak? P (KT ) =? 2 Jaká je pravděpodobnost, že 70 letý pacient s vysokým krevním tlakem utrpí mozkovou příhodu v následujících pěti letech? P (MP KT ) =? Řešení: P (KT ) = P (KT MP )P (MP ) + P (KT MP c )P (MP c ) = 0, 4 0, 1 + 0, 2 0, 9 = 0, 22 P (MP KT ) = P (MP KT ) P (KT ) = P (KT MP ).P (MP ) P (KT ) = 0, 4 0, 1 0, 22 = 0, 182

NÁHODNÁ VELIČINA

Náhodná veličina Základní paradigma: Představme si, že je každému prvku ω, ω Ω přiřazeno nějaké reálné číslo. Jinými slovy to znamená, že je dána určitá funkce, která nám,,pomáhá zobrazit Ω do R. X : Ω R Necht tedy X(ω) je číslo přiřazené funkcí X(.) elementárnímu jevu ω. Na funkci X(.) jsou kladeny určité požadavky: Vzorem množiny B R je X 1 (B) = {ω : X(ω) B} O funkci X(.) řekneme, že je měřitelná, platí-li X 1 (B) A pro každé B R. Takovouto měřitelnou funkci X(.) označíme za náhodnou veličinu X

Distribuční funkce F(.) Snahou je pochopit chování námi sledované náhodné veličiny. Pro každé x R se definuje funkce F(x) takto F(x) = P({ω : X(ω) x}) = P(X x) Funkci F(x) nazveme distribuční funkcí náhodné veličiny X. Umíme-li určit tyto pravděpodobnosti, pak známe tzv. rozdělení pravděpodobnosti náhodné veličiny X.

Vlastnosti distribuční funkce Distribuční funkce je definována na předem daném intervalu. Její základní vlastnosti jsou: 0 F(x) 1 F(x i ) F(x j ) pro každou dvojici čísel x i < x j lim F(x) = F( ) = 0 x lim F(x) = F(+ ) = 1 x + P (a < X b) = F(b) F(a) Distribuční funkce F(x) je zprava spojitá a má nejvýš spočetně bodů nespojitosti.

Diskrétní a spojitá náhodná veličina Diskrétní náhodná veličina Náhodná veličina X nabývá jen konečně nebo spočetně mnoha hodnot. Řekneme tedy, že X nabývá jen hodnot x 1, x 2,..., přičemž P({ω : X(ω) = x i }) = P(X = x i ) = p i i = 1, 2,... V takovém případě říkáme, že X má diskrétní rozdělení. Její distribuční funkce F() je skokovitá. Skoky jsou v bodech x 1, x 2,..., přičemž velikost skoku v bodě x i má velikost p i, i = 1, 2,... Distribuční funkce diskrétní náhodné veličiny je tedy nespojitá. Platí pro ni: F(x i ) = P (X x i ) = j i p j

Spojitá náhodná veličina Náhodná veličina X je spojitá, může-li nabývat všech hodnot z konečného nebo nekonečného intervalu. Předpokládejme že máme spojitou náhodnou veličinu X, nabývající všech hodnot z intervalu x ( ; ). Existuje-li taková funkce f(), že F(x i ) = xi f(t)dt, pak říkáme, že X má spojité rozdělení a že f() je její hustota, resp.hustota pravděpodobnosti

Hustota pravděpodobnosti f() Funkci definovanou vztahem f(x) = df(x) = F (x) (1) dx nazýváme tedy hustotou pravděpodobnosti, nebo v případě diskrétní náhodné veličiny frekvenční funkcí. Základní vlastnosti této funkce jsou: f(x) 0 lim x f(x)dx = 0 lim f(x)dx = 0 x + b a f(x)dx = 1 pro x [a; b] P (a < X b) = b a f(x)dx

Příklad Diskrétní náhodná veličina X je zadána řadou rozdělení (tabulkou rozdělení pravděpodobností): x i 3 4 7 10 p i 0,2 0,1 0,4 0,3 Určeme distribuční funkci této náhodné veličiny. S jakými pravděpodobnostmi nabývá X hodnot z intervalů: 5; 3, 1), 3, 5; 9) a 11; 15)? Nebot platí: F(x i ) = P (X x i ) = j i p j

Příklad Pak tedy: F(x) = 0 x < 3 0, 2 3 x < 4 0, 3 4 x < 7 0, 7 7 x < 10 1 x 10 např. F(7) = 0, 7 P(X 5; 3, 1)) = P( 5 X < 3, 1) = F(3, 1) F( 5) = 0, 2 0 = 0, 2 P(X 3, 5; 9)) = P(3, 5 X < 9) = F(9) F(3, 5) = 0, 7 0, 2 = 0, 5 P(X 11; 15)) = P(11 X < 15) = F(15) F(11) = 1 1 = 0

Graf distribuční funkce

Graf distribuční funkce F(x) 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 x

Ostatní způsoby popisu náhodných veličin Chování náhodné veličiny lze postihnout i prostřednictvím tabulky rozdělení pravděpodobností x i 3 4 7 10 p i 0,2 0,1 0,4 0,3 polygonu rozdělení pravděpodobností.

α100%ní kvantil Ve statistice je velmi důležitý je pojem kvantilu. α-kvantilem nebo α100%-ním kvantilem náhodné veličiny X, která má jisté spojité rozdělení náhodné veličiny s distribuční funkcí F(x) a hustotu pravděpodobnosti f(), je číslo x α pro které platí F(x α ) = P(X x α ) = x α f(x)dx = α

Príklad Předpokládejme že máme náhodnou veličinu X která má hustotu pravděpodobnosti definovanou takto: f(x) = 1 x (a, b) b a 0 x jinak Distribuční funkci získáme snadno jako F(x) = x f(t)dt = x 1 b a dt = 0 x a x a a x < b b a 1 x b Necht pro naší X platí a = 0 b = 2. Pak tedy:

Príklad a F(x) = x f(x) = f(t)dt = x 1 x (0, 2) 2 0 x jinak 1 2 dt = 0 x 0 x 2 0 x < 2 1 x 2

Střední hodnota náhodné veličiny Nejčastěji používanou číselnou charakteristikou polohy je první obecný moment, který se nazývá střední hodnota náhodné veličiny X. Budeme jej označovat symbolem E(X). Pro diskrétní náhodnou veličinu X, x [a; b] s pravděpodobnostní funkcí P(X = x) je E(X) definována jako: E(X) = n i=1 x i P(X = x i ) = n i=1 x i p i. Pro spojitou náhodnou veličinu X s hustotou pravděpodobnosti f(x) je E(X) definována jako: E(X = x) = b a xf(x)dx.

Rozptyl náhodné veličiny Popis polohy je třeba často doplnit o informaci, jak se rozptylují jednotlivé hodnoty náhodné veličiny kolem nějaké charakteristiky polohy (nejčastěji kolem střední hodnoty). Tuto informaci podávají charakteristiky variability. Mezi ně patří rozptyl D(X). Ten je stanoven jako druhý centrální moment: D(X) = E{[X E(X)] 2 } V případě diskrétní náhodné veličiny X je definován jako: D(X) = n i=1 [x i E(X)] 2 p i. V případě spojité náhodné veličiny X je definován jako: D(X) = b [x i E(X)] 2 f(x)dx. a

Příklad Předpokládejme, že náhodná veličina X popisující podíl jisté reklamní společnosti na tuzemském trhu, během jistého týdne, může být popsána následující hustotou pravděpodobnosti: f(x) = 3 2 (1 x2 ) 0 x 1 0 jinak Určeme: Distribuční funkci, střední hodnotu, medián, a rozptyl. Distribuční funkce F(x) = x 0 3 2 (1 y2 )dy = 3 [ [y] x y 2 0 3 ]x 0 = 3 2 [ x x3 3 ].

Příklad Medián získáme jednoduše: F(x α ) = F(x 0,5 ) = 1 2 = 3 2 [ x x3 3 získáme x 3 3x + 1 = 0. Kořeny této kubické rovnice jsou přibližně: 1, 879, 0,34729 a 1, 5320. ] Hodnota mediánu je tedy 0, 34729. Střední hodnota: E(X) = 1 0 x 3 2 (1 x2 )dx = 3 2 [ x 2 2 ]1 0 [ x 4 4 ]1 0 = 3 8.

Příklad Rozptyl: K výpočtu rozptylu naší náhodné veličiny X využijeme známého vzorce D(X) = E(X 2 ) [E(X)] 2. E(X 2 ) = 1 0 x 23 2 (1 x2 )dx = 3 2 [ x 3 3 ]1 0 [ x 5 5 ]1 0 = 1 5. Pak již jednoduše: D(X) = 1 [ ] 3 2 5 = 1 8 5 9 64 = 19 320 = 0, 05937.