Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017
Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti Pravděpodobnost je založena na porovnání délky, ploch či objemů geometrických útvarů. Pro 2D platí P A = ω S P n = n! čeho je to vzorec a uveďte příklad aplikace Permutace n prvků je každá uspořádaná n-tice vytvořená z těchto prvků. Každý z n prvků se v této n-tici vyskytuje právě jednou. Jednotlivé permutace se od sebe liší pouze pořadím prvků.
Přehled témat 1. Pravděpodobnost (definice, využití, výpočet pravděpodobností náhodných jevů) 2. Podmíněná pravděpodobnost 3. Náhodná veličina 4. Statistické charakteristiky (3. a 4. týden) 5. Slabý zákon velkých čísel 6. Centrální limitní věta (teorém) 7. Bodový a intervalový odhad 8. Testování hypotéz 9. Korelace a regrese
2. Základní pojmy teorie pravděpodobnosti Domácí úkol č. 1 (20 bodů) Definujte pojem Uveďte jeho využití Případně ukažte na jednoduchém příkladu Odešlete elektronicky do stanoveného termínu
2.1 Podmíněná pravděpodobnost Pravděpodobnost realizace jevu A, za předpokladu, že nastal jev B P B > 0 Definuje se vztahem P(A B) P A B = P(B) Pro nezávislé jevy A, B platí P A B = P(A), protože P(A B) P(A) P(B) P A B = = = P(A) P(B) P(B) Platí, že pokud P B > 0, pak P(A B) = P A A, B jsou nezávislé. Příklad: Dvakrát hodíme kostkou. Jaká je pravděpodobnost, že součet přesáhne 10, víme-li, že padla (aspoň jedna) šestka? Řešení: P[součet > 10 min 1 6] = 6,5, 6,6, 5,6 6 6 6+6 1 6 6 = 3 11 = 0,27
2.2 Statistická nezávislost Je-li P A B = P(A), pak můžeme říci, že jev A je nezávislý na jevu B. Tato nezávislost je oboustranná, tj. je-li jev A nezávislý na jevu B, pak i jev B je nezávislý na jevu A. Pro nezávislé jevy tedy platí: P A B = P(A) P B A = P B. Platí-li, že jevy A a B jsou nezávislé, pak P A B = P(A) P(B) Příklad: Jaká je pravděpodobnost, že při hodu dvěma kostkami padly pětky, víme-li, že součet hodnot je dělitelný pěti? Řešení: A padnou 2 pětky, B součet je dělitelný 5 P A B = 1, P B = 7 36 36 1 P(A B) P A B = 36 = = 1 P(B) 7 7 = 0,14 36
2.2 Statistická nezávislost A padnou 2 pětky B součet je dělitelný 5 {[1,4],[2,3],[3,2],[4,1],[4,6],[5,5],[6,4]} P A B = 1 36, P B = 7 36 P A B = Příklad: Jsou uvedené jevy závislé či nezávislé? 1 36 7 36 = 1 7 1,1 1,2 1,3 1,4 1,5 1,6 2,1 2,2 2,3 2,4 2,5 2,6 3,1 3,2 3,3 3,4 3,5 3,6 4,1 4,2 4,3 4,4 4,5 4,6 5,1 5,2 5,3 5,4 5,5 5,6 6,1 6,2 6,3 6,4 6,5 6,6 Řešení: P A = 1, P B = 7 7 P A P B = 1 = P A B 36 36 36 36 36 P A B = 1 1 = P A jevy jsou závislé 7 36 P B A = 1/36 = 1 7 = P B jevy jsou závislé tento krok je intuitivní 1/36 36
2.3 Míra statistické závislosti KOVARIANCE pro dvě náhodné veličiny X a Y Kovariance vyjadřuje souvislosti (závislosti) mezi jednotlivými veličinami σ X,Y = cov X, Y = E X X [Y Y] σ X,Y = cov X, Y = E XY E X E Y Pozn.: σ X,X = cov X, X = E X X X X = E X X 2 = var(x) Kovariance může nabývat jakýchkoliv reálných hodnot, ale pro dvě konkrétní veličiny musí platit cov 2 X, Y var(x) var(y) Pokud jsou X a Y nezávislé, pak cov X, Y = 0, neboť pro nezávislé veličiny platí, že E XY = E X E Y POZOR! Tvrzení neplatí opačně z nulové kovariance nelze nic usuzovat o nezávislosti
2.3 Míra statistické závislosti KOVARIANČNÍ MATICE Zobrazuje kovariance mezi n veličinami X 1,, X n = σ 11 σ 12 σ 1n σ 21 σ 22 σ 2n, σ ij jsou kovariance, σ ij = cov X i, X j = E X i X i [X j X j ] σ n1 σ n2 σ nn Pokud jsou X i a X j nezávislé, pak cov X i, X j = 0 Platí následující: 1) σ ii = cov X i, X i = var(x i ) a diagonální prvky matice představují rozptyly veličin 2) σ ij = σ ji (z definice) a kovarianční matice je tedy symetrická 3) pokud X i i X j vykazují často nadprůměrné hodnoty => cov X i, X j > 0 4) pokud X i i X j vykazuje často podprůměrné (malé) hodnoty => cov X i, X j > 0 5) pokud jedna z veličin vykazuje malé a druhá velké hodnoty => cov X i, X j < 0
2.3 Míra statistické závislosti KORELAČNÍ MATICE (matice korelačních koeficientů) Vzniká normováním kovariancí směrodatnými odchylkami σ i = var(x i ) a σ j = var(x j ) ρ = corr X i, X j = cov X i,x j var(x i ) var(x j ) = σ ij σ i σ j na rozdíl od kovariance nezávisí korelace na jednotkách a měřítku jeho hodnota se nezmění lineární transformací, tj. když místo X 1 použijeme Y 1 = a + b X 1 a místo X 2 použijeme Y 2 = c + d X 2 => corr X 1, X 2 = corr Y 1, Y 2 corr X i, X j 1,1
2.4 Bayesův vzorec Bayesův teorém či Bayesova věta Ukazuje, jak podmíněná pravděpodobnost jevu A souvisí s opačnou podmíněnou pravděpodobností Vzorec tedy slouží k výpočtu podmíněné pravděpodobnosti P(B A). Předpokládá, že známe opačnou pravděpodobnost, tedy P(A B). P(A B) P(B) P B A = P(A) Poprvé Thomas Bayes (1763 vydáno 2 roky po jeho smrti) Nezávisle na něm Pierre-Simon Laplace (1774)
2.4 Bayesův vzorec Celou teorii lze rozšířit a odvodit tak tzv. Bayesův vzorec Bayesův vzorec slouží k výpočtu podmíněné pravděpodobnosti P(B i A). Předpokládá, že známe opačnou pravděpodobnost, tedy P(A B i ). Je založen na větě o násobení pravděpodobností a úplné pravděpodobnosti. P B i A = P(A B i) P(B i ) n P(A B j ) P(B j ) j=1, i = 1,2,, n. P B A = P(A B) P(B) P(A)
2.4 Bayesův vzorec Příklad: Víme, že 90 % výrobků odpovídá požadovanému standardu. Byla zavedena zjednodušená kontrolní zkouška, která u standardního výrobku dá kladný výsledek s pravděpodobnosti 95 %, ale u nestandardního výrobku s pravděpodobností 20 %. Jaká je pravděpodobnost, že u výrobku, který kladně prošel zkouškou se jedná o standardní výrobek? Řešení: jev A zkouška výrobku dopadla kladně, jev B 1 výrobek je standardní: P B 1 = 0,9, jev B 2 výrobek není standardní P B 2 = 0,1 P A B 1 = 0,95 P A B 2 = 0,20 P B 1 A = P A B 1 P B 1 P A B 1 P B 1 + P A B 2 P B 2 = 0,95 0,9 0,95 0,9 + 0,20 0,1 = 0,977
3. Náhodná veličina Náhodná veličina je reálná funkce X(ω), která je definována na množině elementárních jevů Ω. Co to je elementární jev? Náhodný jev, který nelze vyjádřit jako sjednocení dvou možných jevů. Náhodný jev, který není možné dále rozložit. Elementární jevy představují jednotlivé základní (elementární) výsledky náhodného pokusu. Každému elementárnímu jevu ω z množiny elementárních jevů Ω přiřazuje právě jedno reálné číslo X ω = x. Obor hodnot veličiny X, je množina M = x; X ω = x.
3.1 Diskrétní náhodná veličina Náhodná veličina je reálná funkce X(ω), která je definována na množině elementárních jevů Ω. Každému elementárnímu jevu ω z množiny elementárních jevů Ω přiřazuje právě jedno reálné číslo X ω = x. Obor hodnot veličiny X, je množina M = x; X ω = x. Diskrétní (nespojitá) veličina M je konečná nebo spočetná množina Příklady: počet rozbitých lahví s zásilce 1000 ks, počet narozených dívek mezi 100 novorozeňaty,
3.1 Diskrétní náhodná veličina Náhodná veličina je reálná funkce X(ω), která je definována na množině elementárních jevů Ω. Každému elementárnímu jevu ω z množiny elementárních jevů Ω přiřazuje právě jedno reálné číslo X ω = x. Obor hodnot veličiny X, je množina M = x; X ω = x. Diskrétní (nespojitá) veličina M je konečná nebo spočetná množina Pravděpodobnostní chování náhodné veličiny X je popsáno rozdělením pravděpodobnosti náhodné veličiny X Toto rozdělení je v diskrétním případě dáno: Výčtem (seznamem) všech hodnot, kterých může veličina X nabývat (označme tyto hodnoty x i ) Pravděpodobnostmi, s jakými veličina těchto hodnot nabývá (označme P X = x i = p i )
3.2 Spojitá náhodná veličina Náhodná veličina je reálná funkce X(ω), která je definována na množině elementárních jevů Ω. Každému elementárnímu jevu ω z množiny elementárních jevů Ω přiřazuje právě jedno reálné číslo X ω = x. Obor hodnot veličiny X, je množina M = x; X ω = x. Spojitá veličina M je uzavřený nebo otevřený interval Příklady: doba čekání na vlak metra, který jezdí v 3 minutových intervalech; hodnota elektrického napětí v rozvodné síti;
3.3 Rozdělení náhodné veličiny Diskrétní Alternativní rozdělení (X nabývá pouze dvou hodnot 0 nebo 1) Binomické rozdělení (n pokusů se stejnou pravděpodobností) Negativně binomické rozdělení Pascalovo rozdělení (speciální případ negativně binomického rozdělení) Geometrické rozdělení (speciální případ Pascalova rozdělení) Hypergeometrické rozdělení Logaritmické rozdělení Poissonovo rozdělení Spojitá Rovnoměrné rozdělení Exponenciální rozdělení Laplaceovo rozdělení (nebo také dvojitě exponenciální rozdělení) Normální rozdělení (označované také jako Gaussovo rozdělení) Logaritmicko-normální rozdělení (také lognormální rozdělení) Studentovo rozdělení Fischerovo-Snedecorovo rozdělení χ 2 rozdělení (Chí kvadrát) Cauchyho rozdělení Gamma rozdělení Logistické rozdělení Maxwellovo-Boltzmannovo rozdělení
3.3 Rozdělení náhodné veličiny Rozdělení pravděpodobnosti náhodné veličiny X Toto rozdělení je v diskrétním případě dáno: Výčtem (seznamem) všech hodnot, kterých může veličina X nabývat (označme tyto hodnoty x i ) Pravděpodobnostmi, s jakými veličina těchto hodnot nabývá (označme P X = x i = p i ) Toto rozdělení je ve spojitém případě dáno: Popisem hustoty pravděpodobnosti f(x) (viz kap. 2.8) nebo Popisem distribuční funkce F(x) (viz kap. 2.9)
3.4 Hustota Hustota pravděpodobnosti spojité náhodné veličiny X je nezáporná funkce f(x) taková, že P X x = F x = Funkce f x má tyto vlastnosti: f x dx = M f x dx =1 f x = df(x) dx x = F x, kde existuje derivace f t dt, x R P x 1 X x 2 = P x 1 < X < x 2 = P x 1 < X x 2 = P x 1 X < x 2 = x F x 2 F x 1 = 2 x1 f x dx
3.5 Distribuční funkce Distribuční funkce F(x) náhodné veličiny X přiřazuje každému reálnému číslu x pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovné číslu x, tedy F x = P(X x) Důležité vlastnosti: Pro každé reálné číslo x platí 0 F x 1 F(x) je neklesající, zprava spojitá funkce Pro každou distribuční funkci platí: lim F x = 0, lim F x = 1 x x Pro každá reálná čísla x 1 a x 2 platí P x 1 < X x 2 = F x 2 F(x 1 )
3.6 Náhodný vektor Výsledkem náhodného pokusu není většinou jen jedno jediné číslo, ale n-tice reálných čísel (např. pohyb bodu v prostoru a záznam souřadnic x, y, z). Pozorováním tohoto pokusu dostáváme n-tici náhodných veličin X = (X 1, X 2,, X n ) T a tu nazýváme náhodným vektorem (pro uvedený příklad to je trojice souřadnic). Pokud v našem případě budou všechny složky diskrétní, pak můžeme říci, že vektor X = (X 1, X 2,, X n ) T má vícerozměrné (sdružené) diskrétní rozdělení.
3.7 Náhodný výběr Náhodný výběr o rozsahu n je posloupnost nezávislých náhodných veličin X 1, X 2,, X n se stejným rozdělením. Je možné ho chápat jako vektor X = (X 1, X 2,, X n ). Vlastní realizaci pak budeme značit jako x = x 1, x 2,, x n. Naměřené hodnoty, neboli pozorování či vstupní data, x 1, x 2,, x n. Protože jsou náhodné veličiny X 1, X 2,, X n nezávislé a mají stejné rozdělení, platí pro distribuční funkci F(x) náhodného výběru F x = F x 1 F x 2 F x n, x i R
3.8 Uspořádaný náhodný výběr Nechť X 1, X 2,, X n náhodný výběr (např. výšky mužů) Setřídíme hodnoty podle velikosti (např. od nejmenší po největší) X (1), X (2),, X (n) uspořádaný výběr, X (1) X (2), X (n), kde X (1) = min, X (n) = max, X (i) i-tá pořádková statistika (od slova pořadí) Pro uspořádaný výběr pak lze určit min, max, medián, modus, kvantil (percentil), kvartil apod.
3.9 Rozdělení náhodného vektoru Říkáme, že náhodný vektor x = (x 1,, x n ) T má vícerozměrné rozdělení Pro diskrétní rozdělení: Pravděpodobnostní funkce p(x) náhodného výběru (jednotlivé pokusy jsou nezávislé) v případě diskrétního rozdělení veličin X 1, X 2,, X n je p x = p x 1 p(x 2 ) p(x n ), x i R Vícerozměrné diskrétní rozdělení je dáno výčtem všech vektorů (x 1,, x n ) T a příslušnými pravděpodobnostmi P(X 1 = x 1,, X n = x n )
3.9 Rozdělení náhodného vektoru Říkáme, že náhodný vektor x = (x 1,, x n ) T má vícerozměrné rozdělení Pro spojité rozdělení: Náhodný vektor x = (x 1,, x n ) T má spojité rozdělení, pokud existuje nezáporná reálná funkce f = (x 1,, x n ) taková, že b 1 b n P X 1 (a 1, b 1, X 2 a 2, b 2, X n a n, b n ) = f(x 1,, x n ) dx 1,, dx n a 1 a n Funkci f = (x 1,, x n ) nazýváme sdružená hustota
3.10 Marginální rozdělení Zajímá-li nás rozdělení menšího počtu souřadnic (velmi často jde o případ jedné souřadnice), pak se takovému rozdělení říká marginální. Marginální rozdělení veličiny X i je dáno pravděpodobnostmi P(X i = x i ) pro všechny hodnoty x i, kterých může veličina X i nabývat. Pro diskrétní rozdělení: Pravděpodobnost P(X i = x i ) se získá vysčítáním pravděpodobností P(X 1 = x 1,, X i 1 = x i 1, X i = x i, X i+1 = x i+1,, X n = x n ) přes všechny možné hodnoty x 1,, x i 1, x i+1,, x n, tj. x 1 x i 1 x i+1 x n P(X 1 = x 1,, X i 1 = x i 1, X i = x i, X i+1 = x i+1,, X n = x n )
3.10 Marginální rozdělení Zajímá-li nás rozdělení menšího počtu souřadnic (velmi často jde o případ jedné souřadnice), pak se takovému rozdělení říká marginální. Marginální rozdělení veličiny X i je dáno pravděpodobnostmi P(X i = x i ) pro všechny hodnoty x i, kterých může veličina X i nabývat. Pro spojité rozdělení: Analogicky: hustota f i (x i ) pro jedinou složku se získá integrováním sdružené hustoty f x 1,, x i 1, x i, x i+1,, x n přes všechny ostatní proměnné x 1,, x i 1, x i+1,, x n, tj. b 1 b n f x 1,, x n f i x i = dx 1. dx i 1, dx i+1. dx n a 1 a n Uvedená hustota se nazývá marginální hustota.
3.11 Sdružená hustota Náhodný vektor X = (X 1, X 2,, X n ) T má rozdělení spojitého typu, existuje-li nezáporná reálná funkce f(x 1, x 2,, x n ) taková, že P X 1 a 1, b 1, X 2 a 2, b 2,, X n a n, b n b 1 b 2 b n = f x 1, x 2,, x n dx 1 dx 2 dx n a 1 a 2 Funkci f x 1, x 2,, x n Musí platit: a n pak nazýváme sdružená hustota. f x 1, x 2,, x n dx 1 dx 2 dx n = 1
3.11 Sdružená hustota
3.12 Marginální hustota Náhodný vektor X = (X 1, X 2,, X n ) T má rozdělení spojitého typu, existuje-li nezáporná reálná funkce f(x 1, x 2,, x n ) taková, že P X 1 a 1, b 1, X 2 a 2, b 2,, X n a n, b n = b 1 b 2 b n f x 1, x 2,, x n dx 1 dx 2 dx n a 1 a 2 a n Funkci f x 1, x 2,, x n pak nazýváme sdružená hustota. Musí platit: f x 1, x 2,, x n dx 1 dx 2 dx n = 1 Hustota f i (x i ) pouze jedné složky X i se získá ze sdružené hustoty: f i x i = f x 1, x 2,, x n dx 1 dx i 1 dx i+1 dx n Této hustotě se říká marginální hustota veličiny X i
3.13 Podmíněné rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,, X n ) T má rozdělení spojitého typu, existuje-li nezáporná reálná funkce f(x 1, x 2,, x n ) taková, že b 1 b 2 b n f x 1, x 2,, x n P X 1 a 1, b 1, X 2 a 2, b 2,, X n a n, b n = dx 1 dx 2 dx n Funkci f x 1, x 2,, x n pak nazýváme sdružená hustota. a 1 a 2 a n Marginální hustota veličiny X i : f i x i = f x1, x 2,, x n dx 1 dx i 1 dx i+1 dx n Pro dvě veličiny: X = (X 1, X 2 ) T P X 1 a 1, b 1, X 2 a 2, b 2 b = 1 b 2 a1 f x a 2 1, x 2 dx 1 dx 2 f 2 x 2 = f x1, x 2 dx 1
3.13 Podmíněné rozdělení náhodného vektoru Pro dvě veličiny: X = (X 1, X 2 ) T P X 1 a 1, b 1, X 2 a 2, b 2 b = 1 b 2 a1 f x a 2 1, x 2 dx 1 dx 2 f 2 x 2 = f x1, x 2 dx 1 Podmíněná hustota pravděpodobnosti f x 1 x 2 veličiny X 1 za podmínky X 2 = x 2 f x 1 x 2 = f x 1, x 2, f f 2 x 2 x 2 > 0 2 Podmíněná pravděpodobnost P X 1 A X 2 = x 2 = A f x 1 x 2 dx 1
3.14 Lineární kombinace náhodných veličin X a Y pro libovolné X a Y pro nezávislé náhodné veličiny X a Y E c = c E X + Y = E X + E Y E X Y = E X E Y E ax = ae X var ax + by = a 2 var X + b 2 var Y E a + bx = a + be X var X + Y = var X + var Y E ax + by = ae X + be Y var X Y = var X + var Y var c = 0 var ax = a 2 var X var a + bx = b 2 varx var ax + by = a 2 var X + 2ab cov X, Y + b 2 var Y
3.15 Absolutní a relativní četnost Úkolem mat. statistiky je zpracování dat, která vykazují náhodné kolísání Pozorování = naměřené hodnoty, vstupní data Absolutní četnost = počet pozorování, která nabývají daných hodnot (n i ) Rozsah souboru = počet všech pozorování n = i n i Relativní četnost = podíl absolutní četnosti na rozsahu souboru r i = n i n - platí i r i = i n i n = 1 n n i = 1 n n = 1 - často udávaná v % (podíl výsledků s danou hodnotou) absolutní či relativní četnost lze zobrazit v histogramu
3.15 Absolutní a relativní četnost z konstantního vzorku lze určit některé statistiky (průměrnou výšku, nejvyšší, nejnižší výšku ) = popisné statistiky k závěrům o populaci je třeba použít TEORII PRAVDĚPODOBNOSTI, neboť výsledky náhodných pokusů se chovají jako náhodné veličiny (tzn. relativní četnost odpovídá pravděpodobnosti, že náhodná veličina nabývá příslušných hodnot)