Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: M 14:00 15:30 W 15:30 17:00 (or by appointment) 1 / 29

Overview Teoreticke zaklady pravdepodobnosti Vyberovy prostor S: Mnozina vsech moznych vysledku, ktere dany nahodny mechanizmus muze vygenerovat (vsechny mozne vysledky, ktore lze ocekavat); S = {O 1, O 2,..., O k }; Elementarni jev O i S, pro nejake i {1,..., k}: Jeden konkretni prvek vyberoveho prostoru S; Nahodny jev A = {O i1,..., O il } S: Libovolna podmnozina vyberoveho prostoru S - muze to byt i prazdni mnozina { }, nebo cely vyberovy prostor {S}; Nahodna velicina X(A) R: Vhodne definovana funkce, ktora vysledky nahodniho mechanizmu interpretuje pomoci cisel, se kterymi pak muzeme v matematice lepe pocitat; 2 / 29

Overview Pravdepodobnost (pstni mira) je to funkce, ktera predepisuje pravdepodobnostne hodnoty jednotlivym elementarnim jevum z vyberoveho prostoru S (kvantifikuje jak casto se jednotlive elementarni jevy objevuji); Pravdepodobnost (pstni mira) splnuje nasledujici pozadavky: P(A) 0 pro kazdou A S; P(S) = 1 a P( ) = 0; P(A B) = P(A) + P(B) pro libovolne A, B S, takove, ze A B = ; 3 / 29

Overview Pravdepodobnost (pstni mira) je to funkce, ktera predepisuje pravdepodobnostne hodnoty jednotlivym elementarnim jevum z vyberoveho prostoru S (kvantifikuje jak casto se jednotlive elementarni jevy objevuji); Pravdepodobnost (pstni mira) splnuje nasledujici pozadavky: P(A) 0 pro kazdou A S; P(S) = 1 a P( ) = 0; P(A B) = P(A) + P(B) pro libovolne A, B S, takove, ze A B = ; Jak to funguje? neznamy nahodny mechanismus vyberovy prostor S; nahodny vyber pouze nektere realizace (hodnoty) vyberoveho prostoru; aplikace statistickych metod obecne platne zavery; kdyz je statistika korektni tyhle zavery lze zobecnit na celou populaci (i kdyz je tato populace celkove neznama); 3 / 29

Overview Pravdepodobnost a Statistika Zakladny princip statistiky je korektne zobecneni vysledku ziskanych z nahodneho vyberu a jejich uplatneni na celou (neznamou) populaci; 4 / 29

Overview Pocitani pravdepodobnosti Pravdepodobnost doplnkoveho jevu pro nejaky A S: P(A c ) = P(S \ A) = 1 P(A) Sjednoceni dvou jevu (nebo) A, B S: P(A B) = P(A) + P(B) P(A B) Prunik dvou jevu (a zaroven) A, B S: P(A B) = P(A B) P(B) = P(B A) P(A) Bayesova veta a Zakon celkove pravdepodobnosti: P(A j B) P(B A j) P(A j) n P(B Ai) P(Ai) i=1 pro disjunktni jevy A i (i = 1,..., n) takove, ze Ai = S; i 5 / 29

Zakladni Pravdepodobnostni Koncepty Klasicky vs. Geometricky Koncept Klasicka pravdepodobnost N 6 / 29

Zakladni Pravdepodobnostni Koncepty Klasicky vs. Geometricky Koncept Klasicka pravdepodobnost Geometricka pravdepodobnost N 6 / 29

Zakladni Pravdepodobnostni Koncepty Klasicky vs. Geometricky Koncept Klasicka pravdepodobnost Diskretne nahodne veliciny Geometricka pravdepodobnost Spojite nahodne veliciny N 6 / 29

Diskretni nahodne veliciny Co je to nahodna velicina? realni funkce, ktera transformuje jednotlive vysledky nahodniho experimentu do numerickych hodnot (cisel), s kterymi pak umime pocitat matematicke rovnice; 7 / 29

Diskretni nahodne veliciny Co je to nahodna velicina? realni funkce, ktera transformuje jednotlive vysledky nahodniho experimentu do numerickych hodnot (cisel), s kterymi pak umime pocitat matematicke rovnice; nahodni velicina vytvari "link" mezi abstraknimi pojmi a matematickymi (numerickymi) hodnotami; 7 / 29

Diskretni nahodne veliciny Charakterizace n. velicin existuje mnoho ruznych nahodnych mechanismu; (mince, hraci kostka, sledovani udalosti v case a pod.) ruzne nahodne mechanizmi "generuji" ruzne n. veliciny; (jine n. velicina popisuje kostku a jina n.v. popisuje minci, a pod..) ruzne nahodne veliciny potrebuje dostatecne popsat; (muzeme vyuzit ruzne charakteristiky, ktore nahodnou velicinu popisuji.) medzi klasicke charakteristiky patri napr. stredni hodnota, median,... (tyhle charakteristiky popisuji n. v. pouze castecne, z urciteho pohledu) existuje nejaky absolutni, dokonaly popis nahodne veliciny? (analogie otlacku prstu u lidi, neboli fotografie?) 8 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 1: symetricka hraci kostka generujici hodnoty {1, 2,..., 6}; Pravdepodobnostni funkce: P[X = k], pro k {1,..., 6}; Probability 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 6 7 Random Variable Values 9 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 1: symetricka hraci kostka generujici hodnoty {1, 2,..., 6}; Kumulativni distribucni funkce: P[X k], pro k {1,..., 6}; Cumulative Probability 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 6 7 Random Variable Values 10 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 2: strata $10 pro 1 a 2 zisk $10 pro 3 a vice; Pravdepodobnostni funkce: P[X = k], pro k { 10, 10}; Probability 0.0 0.2 0.4 0.6 0.8 1.0 20 10 0 10 20 Random Variable Values 11 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 2: strata $10 pro 1 a 2 zisk $10 pro 3 a vice; Kumulativni distribucni funkce: P[X k], pro k { 10, 10}; Cumulative Probability 0.0 0.2 0.4 0.6 0.8 1.0 20 10 0 10 20 Random Variable Values 12 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 3: kolik ze 6 experimentu se nezdarilo? Pravdepodobnostni funkce: P[X = k], pro k {0, 1,..., 6}; Probability 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 Random Variable Values 13 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 3: kolik ze 6 experimentu se nezdarilo? Kumulativni distribucni funkce: P[X k], pro6 k {0, 1,..., 6}; Cumulative Probability 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 Random Variable Values 14 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 4: nahodni experiment generujici 50 ruznych vysledku; Pravdepodobnostni funkce: P[X = k], prok {0, 1,..., 50}; Probability 0.00 0.02 0.04 1.0 0.5 0.0 0.5 1.0 1.5 2.0 Random Variable Values 15 / 29

Distribucni Funkce Nahodne Veliciny Diskretne nahodne veliciny Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 4: nahodni experiment generujici 50 ruznych vysledku; Kumulativni distribucni funkce: P[X k], pro k {0, 1,..., 54}; Cumulative Probability 0.0 0.2 0.4 0.6 0.8 1.0 1.0 0.5 0.0 0.5 1.0 1.5 2.0 Random Variable Values 16 / 29

Distribucni Funkce Nahodne Veliciny Od diskretnich ke spojitym Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 5: experiment s 200 ruznymi vysledky... Pravdepodobnostni funkce: P[X = k], pro k {0, 1,..., 6}; Probability 0.000 0.004 0.008 1.0 0.5 0.0 0.5 1.0 1.5 2.0 Random Variable Values 17 / 29

Distribucni Funkce Nahodne Veliciny Od diskretnich ke spojitym Dve ruzne funkce jako "otlacek", resp. fotografie nahodne veliciny: Priklad 5: experiment s 200 ruznymi vysledky... Kumulativni distribucni funkce: P[X k], pro k {0, 1,..., 6}; Cumulative Probability 0.0 0.2 0.4 0.6 0.8 1.0 1.0 0.5 0.0 0.5 1.0 1.5 2.0 Random Variable Values 18 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] Kumulativna distribucni funkce F (x) = P[X x] 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; Kumulativna distribucni funkce F (x) = P[X x] 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; vyska (velikost) sloupce je rovna pravdepodobnosti vyskytu; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; vyska (velikost) sloupce je rovna pravdepodobnosti vyskytu; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; velikost skoku vzdy zodpoveda pravdepodobnosti vyskytu; 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; vyska (velikost) sloupce je rovna pravdepodobnosti vyskytu; soucet vsech sloupcu dohromady dava vzdy hodnotu 1; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; velikost skoku vzdy zodpoveda pravdepodobnosti vyskytu; 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; vyska (velikost) sloupce je rovna pravdepodobnosti vyskytu; soucet vsech sloupcu dohromady dava vzdy hodnotu 1; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; velikost skoku vzdy zodpoveda pravdepodobnosti vyskytu; je vzdy nulova vlevo a rovna hodnote jedna napravo (F ( ) = 0, F ( ) = 1); 19 / 29

Distribucni Funkce Nahodne Veliciny Nektere dulezite vlastnosti Pravdepodobnostni funkce P[X = x] nezaporna funkce s hodnotami v mistech, kde jsou generovany vysledky; vyska (velikost) sloupce je rovna pravdepodobnosti vyskytu; soucet vsech sloupcu dohromady dava vzdy hodnotu 1; Kumulativna distribucni funkce F (x) = P[X x] nezaporna, neklesajici a po castech konstantni funkce; velikost skoku vzdy zodpoveda pravdepodobnosti vyskytu; je vzdy nulova vlevo a rovna hodnote jedna napravo (F ( ) = 0, F ( ) = 1); Vzajemny vztah (c.p.f.) lze vyjadrit jako: F (x) = P[X x] = P[X = x i] i; x i x 19 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; Pravdepodobnost neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; Pravdepodobnost neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; Pravdepodobnost neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; Populace S = {x 1,..., x N } 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika Pravdepodobnost nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; Vyberovy prumer (Prumer): X n = 1 n n X i i=1 Populace S = {x 1,..., x N } 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika Pravdepodobnost nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; Vyberovy prumer (Prumer): X n = 1 n n X i i=1 Populace S = {x 1,..., x N } Stredni hodnota (Mean): N E(X) = x i P[X = x i] i=1 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; Pravdepodobnost neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; Vyberovy prumer (Prumer): X n = 1 n n X i i=1 Populace S = {x 1,..., x N } Stredni hodnota (Mean): N E(X) = x i P[X = x i] i=1 Vyberovy rozptyl: s 2 n = 1 n 1 n (X i X n) 2 i=1 20 / 29

Nektere vlastnosti nahodnych velicin Zakladni charakteristiky Statistika nasbirane data, ktere tvori nahodny vyber z nejakeho neznameho nahodneho mechanismu; Pravdepodobnost neznamy nahodny mechanismus, o kterem se chceme neco dozvedet z dat; Nahodny vyber X 1,..., X n; Vyberovy prumer (Prumer): X n = 1 n n X i i=1 Populace S = {x 1,..., x N } Stredni hodnota (Mean): N E(X) = x i P[X = x i] i=1 Vyberovy rozptyl: s 2 n = 1 n 1 n (X i X n) 2 i=1 Rozptyl: Var(X) = N P[X = x i] (x i E(X)) 2 i=1 20 / 29

Dulezite Diskretni Rozdeleni Dulezite diskretni rozdeleni Zakladne diskretni rozdeleni... Alternativne (Bernoulliho) rozdelenie pravdepodobnosti; Binomicke rozdelenie pravdepodobnosti; Poissonovo rozdelenie pravdepodobnosti; 21 / 29

Dulezite Diskretni Rozdeleni Bernoulliho nahodna velicina Jakob Bernoulli (1655 1705) jeden z mnohych prominentnych matematiku v Bernoulliho rodine v Baseleji, Svycarsko; autor prvni verze Zakona velkych cisel v teorii pravdepodobnosti; objevil a definoval jednu zo zakladnych matematickych konstant ( 1 + 1 ) n n 22 / 29

Dulezite Diskretni Rozdeleni Bernoulliho nahodna velicina Jakob Bernoulli (1655 1705) jeden z mnohych prominentnych matematiku v Bernoulliho rodine v Baseleji, Svycarsko; autor prvni verze Zakona velkych cisel v teorii pravdepodobnosti; objevil a definoval jednu zo zakladnych matematickych konstant ( 1 + 1 ) n e n n 22 / 29

Dulezite Diskretni Rozdeleni Bernoulliho nahodna velicina najjednoduchsi nahodny mechanismus, najjednoduchsi rozdeleni... existuji pouze dva mozne vysledky mechanismu; (true nebo false, uspech nebo fail, 0 nebo 1, a pod.) 23 / 29

Dulezite Diskretni Rozdeleni Bernoulliho nahodna velicina najjednoduchsi nahodny mechanismus, najjednoduchsi rozdeleni... existuji pouze dva mozne vysledky mechanismu; (true nebo false, uspech nebo fail, 0 nebo 1, a pod.) Pro nahodnou velicinu X, ktora se ridi Alternativnym (Bernoulliho) rozdelenim pravdepodobnosti plati: Znaceni: X Alt(p) Stredni hodnota: E(X) = p Rozptyl: Var(X) = p(1 p) 23 / 29

Dulezite Diskretni Rozdeleni Od Bernoulliho k dalsim... najjednoduchsi konstrukce nahodniho mechanismu: mnoho dalsich je ale primocare odvozenych od Alternativniho; 24 / 29

Dulezite Diskretni Rozdeleni Od Bernoulliho k dalsim... najjednoduchsi konstrukce nahodniho mechanismu: mnoho dalsich je ale primocare odvozenych od Alternativniho; opakovani Bernoulliho pokusu n-krat Binomicke rozdeleni X Bi(n, p), stredni hodnota E(X) = np a rozptyl Var(X) = np(1 p) 24 / 29

Dulezite Diskretni Rozdeleni Od Bernoulliho k dalsim... najjednoduchsi konstrukce nahodniho mechanismu: mnoho dalsich je ale primocare odvozenych od Alternativniho; opakovani Bernoulliho pokusu n-krat Binomicke rozdeleni X Bi(n, p), stredni hodnota E(X) = np a rozptyl Var(X) = np(1 p) limitni verze Binomickeho rozdeleni Poissonovo rozdeleni np λ > 0, X Poiss(λ), E(X) = λ a rozptyl Var(X) = λ; 24 / 29

Dulezite Diskretni Rozdeleni Od Bernoulliho k dalsim... najjednoduchsi konstrukce nahodniho mechanismu: mnoho dalsich je ale primocare odvozenych od Alternativniho; opakovani Bernoulliho pokusu n-krat Binomicke rozdeleni X Bi(n, p), stredni hodnota E(X) = np a rozptyl Var(X) = np(1 p) limitni verze Binomickeho rozdeleni Poissonovo rozdeleni np λ > 0, X Poiss(λ), E(X) = λ a rozptyl Var(X) = λ; pocet neuspechu pred prvnim uspechem Geometricke rozdeleni Znaceni X G(p), Stredni hodnota E(X) = 1/p, rozptyl Var(X) = 1 p p 2 24 / 29

Dulezite Diskretni Rozdeleni Binomicke Rozdeleni 25 / 29

Dulezite Diskretni Rozdeleni Geometricke Rozdeleni 26 / 29

Dulezite Diskretni Rozdeleni Poissonovo Rozdeleni 27 / 29

Dulezite Diskretni Rozdeleni Dalsi diskretne rozdeleni Negativne binomicke rozdelenie; Logaritmicke rozdelenie; Multinomicke rozdelenie; Hypergeometricke rozdelenie;... a mnoho dalsich (znamych i neznamych); 28 / 29

Dulezite Diskretni Rozdeleni Pokracovani priste... spojite nahodne rozdeleni; uvod do statisticke inference; inference vo vyberovych prumerech; dvouvyberovy prumer;... 29 / 29