Modifikace profilu absolventa biologických studijních oborů na PřF UP: rozšíření praktické výuky a molekulárních, evolučních a cytogenetických oborů

Podobné dokumenty
Univerzita Palackého v Olomouci

Modifikace profilu absolventa biologických studijních oborů na PřF UP: rozšíření praktické výuky a molekulárních, evolučních a cytogenetických oborů

KGG/STG Statistika pro geografy

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Výběrové charakteristiky a jejich rozdělení

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Náhodná veličina a rozdělení pravděpodobnosti

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Inovace bakalářského studijního oboru Aplikovaná chemie

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Vybraná rozdělení náhodné veličiny

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Základy teorie pravděpodobnosti

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Poznámky k předmětu Aplikovaná statistika, 5.téma

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

7. Rozdělení pravděpodobnosti ve statistice

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Počet pravděpodobnosti

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Téma 22. Ondřej Nývlt

Deskriptivní statistické metody II. Míry polohy Míry variability

pravděpodobnosti, popisné statistiky

Přednáška X. Testování hypotéz o kvantitativních proměnných

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Praktická statistika. Petr Ponížil Eva Kutálková

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Charakterizace rozdělení

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Základy teorie pravděpodobnosti

Diskrétní náhodná veličina. November 12, 2008

IB112 Základy matematiky

Definice spojité náhodné veličiny zjednodušená verze

Tomáš Karel LS 2012/2013

Intervalové Odhady Parametrů

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Normální rozložení a odvozená rozložení

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Náhodné (statistické) chyby přímých měření

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Rovnoměrné rozdělení

Cvičení ze statistiky - 5. Filip Děchtěrenko

Pravděpodobnost a matematická statistika

2. přednáška - PRAVDĚPODOBNOST

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

Pravděpodobnost a statistika I KMA/K413

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

JAK MODELOVAT VÝSLEDKY

NMAI059 Pravděpodobnost a statistika

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Tomáš Karel LS 2012/2013

Náhodné chyby přímých měření

STATISTICKÉ ODHADY Odhady populačních charakteristik

NÁHODNÁ VELIČINA. 3. cvičení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost, náhoda, kostky

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Design Experimentu a Statistika - AGA46E

Jednofaktorová analýza rozptylu

Intuitivní pojem pravděpodobnosti

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

I. D i s k r é t n í r o z d ě l e n í

Bayesovské metody. Mnohorozměrná analýza dat

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Chyby měření 210DPSM

Pravděpodobnost a aplikovaná statistika

KGG/STG Statistika pro geografy

Transkript:

Univerzita Palackého v Olomouci Modifikace profilu absolventa biologických studijních oborů na PřF UP: rozšíření praktické výuky a molekulárních, evolučních a cytogenetických oborů CZ.1.07/2.2.00/28.0158 Biostatistika II. Pravděpodobnost a pravděpodobnostní rozdělení Martin Duchoslav Katedra botaniky PřFUP Olomouc 2012

Náhoda, náhodné jevy Náhoda= = vyjadřujeme tím skutečnost, že v dané situaci nejsme schopni předpovědět jednoznačně výsledek určité situace Náhodný pokus = každá opakovaná činnost prováděná za stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě Prostor elementárních jevů (Ω)= soubor všech možných výsledků Elementární jev (ω) = každý možný výsledek Příklad: házení 2 kostkami Náhodný jev (A, B,...) = podmnožina Ω, jakékoliv tvrzení o výsledkupokusu, o kterém lze rozhodnout, zda-li je pravdivé Př.:Náhodný jev = podmnožina prostoru elementárních jevů pro součet = 5

Př.: Uvažujeme hod dvěma kostkami. Zajímá nás, s jakou pravděpodobností dostaneme jevy, že součet padlých ok bude 2, 3, 4,...,11, 12. (Deventhal et al. 2003, p. 642-643)

Pravděpodobnost (probability) I. Pravděpodobnostjevu [P(A) P(A)]je mírou očekávání toho, že daný náhodný jev nastane. Klasická (Laplaceova) teorie pravděpodobnosti problém s definicí kruhem omezující předpoklady všech možných výsledků je konečný počet stejné pravděpodobnosti jevů všechny výsledky se navzájem vylučují P(A) = m(a)/ (A)/m kde mje počet všech možných elem. jevů pokusu a m(a) je počet elem. jevů, při nichž nastává jev A pravděpodobnost jevu jsem schopen spočítat před pokusem Pravděpodobnostní strom pro elem. jev -házení mincí 2x

Pravděpodobnost (probability) II. Frekvenční teorie pravděpodobnosti založena na velkém počtu opakovaných pokusů a sledování četnosti daného jevu Relativní četnosti hodu kostkou pro různě velké výběry relativní četnost jevu A = n(a)/ (A)/n se s počtem pokusů nblíží stále těsněji k pravděpodobnosti P(A) výskytu náhodného jevu A v pokuse zvyšuji n odhadujeme tedy pravděpodobnost relativní četnos<, tj. empiricky pravděpodobnost = limitní rela>vní četnost Další čtení: Polák (1991), str. 301-313 Delventhal et al. (2004), str. 633-662 (Wonnacot a Wonnacot 1993) p = 1/6 = 0,167 n = počet hodů

Zákon velkých čísel Při opakované nezávislé realizaci téhož pokusu se počet výskytů daného jevu ustaluje kolem nějaké konstanty! Pravděpodobnost lim (f/n) pro n = popisuje relativní možnost, že jistý jev nastane nebo ne relativně vůči jiným jevům Příklad: Ilustrace ZVČ na příkladu konkrétních dat (Gotelli a Ellison 2004)

Od četnosti k pravděpodobnosti (Relativní četnost) Hustota relativních četností Hustota relativních četností (vyšší n) Zvýšení n a zmenšení intervalů (nse blíží k nekonečnu) Hustota pravděpodobností (density curve curve) a b (Wonnacot a Wonnacot 1993)

Pravděpodobnost (probability) III. Axiomatická teorie pravděpodobnosti pravděpodobnost jako základní, nedefinovaný pojem = stanovíme pravidla (axiomy; Kolmogorov 1930) 0 P(A) 1 P( P(Ω) = 1 P(A B) = P(A) + P(B) pro libovolné dvě disjunktní množiny A, B Subjektivní pravděpodobnost pokus o řešení jedinečných historických jevů, které se nemohou opakovat (nelze užít interpretace četností) Pravděpodobnost jako šance (odds) P šance d 0.9 9:1 9 0.8 4:1 4 0.6 1.5:1 1.5 0.5 1:1 1 0.4 0.67:1 0.67 0.2 0.25:1 0.25 0.1 0.11:1 0.11 d = P(A)/(1-P(A)) často se uvádí jako (celočíselný) zlomek, např. kurz Př.: mám šanci jedna ku dvěma (1:2; d=0,5), že udělám zkoušku znamená totéž jako je pravděpodobnost 0,33, že udělám zkoušku.

Náhodné veličiny a teoretické modely rozdělení pravděpodobností Statistik je ten, kdo s hlavou v rozpálené troubě a s nohama v nádobě s ledem na dotaz, jak se cítí, odpoví: V průměru se cítím dobře. Anonym Náhodná veličina(random variable) znak, který nabývá různých hodnot s určitou (většinou různou) pravděpodobností rozlišujeme diskrétní(nabývá pouze jistých hodnot z konečné množiny) a spojitou náhodnou veličinu (nabývá všech hodnot z nějakého intervalu) Známe-li pravděpodobnost výskytu hodnot veličiny X,, máme dáno tzv. rozdělení pravděpodobností (rozložení, distribuci, probability distribution) Soubor pravděpodobností P(x) (u diskrétní náh. vel.) Jak ho vyjádřit? Hustota pravděpodobnosti f(x) (u spojité náh. vel.)

Co je to distribuční funkce (cumulative probability)? F(x) = P (X x) Distribuční funkcev bodě xje rovna pravděpodobnosti jevu, že náhodná veličina Xnepřevýší hodnotu x. Diskrétní n.v. F(x) = x i x P x ) i Spojitá n.v. ( F(x) = x f ( x) dx P (x 1 < X < x 2 ) = P(X x 2 )- -P(X < x 1 ) = F(x 2 ) F( F(x 1 ) P(a X b) = F(b)-F(a) F(a) = b = a f ( x) dx

Grafické vyjádření f(x), P(x) a F(x) 1 1 f(x) Velikost vybarvené plochy odpovídá hodnotě distribuční funkce Fv bodě x k P(x) F(3)= P(x 1 )+P(x 2 )+P(x 3 ) 0 1 F(x) x X 0 k 1 x k=3 F(x) X 0 X 0 x k Spojitá náhodná veličina x 1 x 2 x k=3 X Diskrétní náhodná veličina

Střední hodnota a rozptyl (pro diskrétní n.v.) E(X) = Σ x i P(x i ) -budeme-li hodnoty x i proměnné chápat jako hmotné body s hmotností P(x i ), pak střední hodnota [E(X) E(X)]je těžiště této soustavy, tj. vážený průměr (očekávaná hodnota = expected value) D(X) = E(X-E(X)) 2 = n p x n i i i= 1 i= 1 x i p i 2 -měří variabilitu náhodné veličiny = střední kvadratická odchylka náhodné veličiny od E(X), tedy jak daleko jsou hodnoty náhodné proměnné od očekávané hodnoty [σ 2 (X)]

Teoretické jednorozměrné modely rozdělení náhodných veličin I. Diskrétní náhodné veličiny

Rovnoměrné a alternativní rozdělení Rovnoměrné (diskrétní) rozdělení (Uniform prob. distribution) 1 P( X = xi ) =, i = 1,2,..., k k 0 p x 1, E( X ) = k + 1, D( X ) 2 = -jev může nabývat jednoho z k-stavů, všechny stavy mají stejnou pravděpodobnost k 12 Alternativní (Bernouliho, nula-jedničkové) rozdělení(bernoulli distr.) -jev může nabývat jednoho ze dvou stavů (0 = neúspěch nebo 1 = úspěch) 2 P( X = xi ) = p( = π ), P( X = 0) = 1 0 p 1, E( X ) = p, D( X ) = p(1 p) 1 p

Binomické rozdělení (1) (Binomial distribution) -opakujeme-li pokus s alternativní náhodnou veličinou nezávisle na sobě vícekrát (n-krát), veličina X, jejímiž hodnotami je počet pokusů z oněch nprovedených, které skončily s výsledkem 1 (celkový počet úspěchů = success) ) má binomické rozdělení ; (neúspěch = failure) P( X n = x = x) = n! x!( n n x x)! p x x q n binomický koeficient ( = kombinační číslo) zvláštní případy: p+q=1 tato rovnice je x-tý člen rozkladu rovnice (p+q) n E(X)=np D(X)=np(1-p) n n = 1, n 0 = 1

Binomické rozdělení (2) Obecně se tedy můžeme ptát: pokud provedeme výběr o velikosti nz z binomické populace, s jakou pravděpodobností se vyskytne právě xindividuí dané kategorie v našem vzorku?

Binomické rozdělení (3) Binomické rozdělení pro n=5 a různé p Př. (Zar 1996)

Binomické rozdělení Cvičné příklady Příklad č. 1: Vzorek n=5 je odebrán náhodně z populace obsahující 50% samců a 50% samic. Jaká je pravděpodobnost, že náš vzorek bude obsahovat 1, 2, 3, 4, a 5 samců? (viz Obrázek a v předchozím snímku). Příklad č. 2: Pokud dva nositelé genu (rodiče) pro albinismus mají děti, pak každé z jejich dětí má pravděpodobnost ¼ (= 25%), že bude albín. Pokud mají rodiče dvě děti, jaká je pravděpodobnost, že žádné nebude albín, jedno dítě bude albín a obě děti budou albíni?

Multinomické rozdělení (Multinomial distribution) -uvažujeme situaci analogickou Binomickému rozdělení, kdy ALE v každém opakování pokusu musíme rozlišovat mezi více než dvěma možnými výsledky(jevy A 1, A 2,...,A d ) -ptáme se s jakou pravděpodobností nastanou jevy A 1, A 2,...,A d s četnostmi a 1, a 2,...,a d v nopakováních pokusu (n = a 1 +...+a d ). n a a P a a a p p d =! (,,..., ) 1 2 1 2 1 2 a! a!... a!... 1 2 d p d a d

Poissonovo rozdělení (Poisson distribution) - tzv. rozdělení vzácných jevů -popisuje náhodné rozdělení objektů (událostí) v jednotceprostoru či času,, tj. takové, že každý bod v prostoru (čase) má stejnou pravděpodobnost, že může obsahovat daný objekt a výskyt objektu v daném bodě nemá žádný vliv na výskyt jakéhokoliv jiného objektu ve stejném či jakémkoliv jiném bodě prostoru (času) distribuce je významná pro popis náhodných jevů s řídkým výskytem (tj. Př. -distribuce je významná pro popis kde operuje jen náhoda a jevy mají malou pravděpodobností výskytu) P( X e = x) = µ x µ = x! µ E( X ) = D( X ) µ = σ e µ x x! 2 Základní vlastnosti Poiss. rozdělení: 1. Nezávislost 2. Jednotlivost 3. Homogenita

Poissonovo rozdělení Příklady Příklad č. 1: Na louce jsme rozmístili náhodně 100 plošek o známě velikosti a v každé plošce jsme spočítali počet jedinců jitrocele. Chci vědět, zda-li jsou jedinci tohoto druhu rozmístěni na ploše náhodně = na sobě nezávisle, či ne. Příklad č. 2: Na základě předchozích údajů víme, že jistý typ genetické mutace se vyskytuje v populaci hmyzu s frekvencí 0,002. V pokusu vystavíme účinku jisté chemikálie velké množství jedinců a ptáme se, zda-li tato chemikálie zvyšuje výskyt této mutace. Příklad č. 3: Roztok obsahuje bakteriální virus v koncentraci 5x10 8 virových objektůna1ml.vestejnémroztokuje2x10 8 bakteriína1ml.zapředpokladu,že virus je náhodně distribuován mezi baktérie zjistěte, jaká část baktérií nebude infikována virem, jaká část baktérií bude obsahovat po 1 virové částici na baktérii atd.

Poissonovo rozdělení (2) Poissonovorozdělení pro různé hodnoty µ. (Zar 1996)

Poissonovo rozdělení cvičný příklad Příklad: Předpokládejme, že v určité populaci krys se vyskytuje albín s pravděpodobností p=0,001, ostatní krysy jsou normálně pigmentované. Ve vzorku 100 krys náhodně vybraných z této populace určete pravděpodobnost, že vzorek a) neobsahuje albína, b) obsahuje právě 1 albína.

Poissonovo rozdělení (3) Jak přibližně určit, pochází-li náš výběr z Poissonovy distribuce? Lze využít vztahu mezi předpokládanou rovností střední hodnoty a variance: Koeficient disperze: CD = >1 agregované uspořádání 2 (tzv. OVERDISPERSION) =1 náhodné uspořádání x <1 pravidelné uspořádání (tzv. UNDERDISPERSION) s x binomické r. negativně binomické r. Poissonovo r.

Test disperse Pocházejí data z populace s Poissonovým rodělením? Hypotézu možno otestovat tzv. testem disperse (Dispersion test): 2 χ =( n 1) s x 2, kde s 2 je odhad variance, x je výběrový průměr a nje velikost výběru; poměr má Pearsonovo rozdělení s (n-1) 1)DF Příklad: : Byl studován výskyt vnitřních parazitů u dvou druhů ptáků otevřením břišní dutiny post mortem.. Mají data Poissonovo rozdělení? Druh n průměr s A 119 2,126 1,232 2 A: χ 118 118*1,518 = = 84,3 P = 0,008*2 = 0,016 2,126 118*16,362 2,739 B 119 2,739 4,045 B: 2 118 = = 704,9 P << 0,001*2 =<< 0, 001 χ Postup: 1) vypočítám χ 2, 2) zjistím příslušnou P hodnotu (levá strana distribuce v případě underdispersion, pravá u overdispersion), 3) pozor, test je oboustranný, proto násobím P * 2 = výsledná hodnota P Výsledek: Data druhu A vykazují tendenci k pravidelnému uspořádání (= underdisperion), protože s 2 je signifikantně menší než průměr, data u B naopak vykazují shlukovité uspořádání (= overdispersion), protože s 2 je signifikantně větší než průměr (Grafen & Hails 2002, p. 260-265)

Teoretické jednorozměrné modely rozdělení náhodných veličin II. Spojité náhodné veličiny

Exponenciální rozdělení (Exponential distribution) -rozdělení vhodně popisuje přežití jedince za předpokladu, že rizika úmrtí se s věkem nemění Relative Frequency (%) Variable VAR1 ; distribution: Exponential Chi-Square: ------, df = 0, p = --- 90 f(x) 80 70 60 50 40 30 20 10 f x 1 ( x) = e Θ pro x 0 Θ pro f ( x) = 0 < x < 0 Má jediný parametr: Θ E(X)= Θ,, D(X)= Θ 2 Relative Frequency (%) 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 Expected Category (upper limits) Variable VAR1 ; distribution: Exponential Chi-Square: ------, df = 0, p = --- 110 100 90 80 70 60 50 40 30 20 10 F(x) 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 Expected Category (upper limits)

Normální rozdělení (Gaussovo r., r., normal distribution) * - je rozdělení spojité proměnné na intervalové a poměrné stupnici -značí se N (µ,σ 2 ) - hustota pravděpodobnosti je symetrická, zvonovitá - funkce obsahuje dvě konstanty (e, π) a má dva parametry: µ a σ 2 f ( x µ ) 1 i ( x) = e 2 2σ σ 2 π 2 < x < + E( X ) = µ D( X ) = σ 2 Příklad: Má-li populace lidí normální rozdělení výšky s průměrem 170 cm a standardní odchylkou 25 cm, jaká část populace je vyšší než 170 cm, vyššínež190cmajakáčástpopulacemávýškumezi150a170cm?

Normální rozdělení v praxi...

Normální rozdělení (2) F(x) Hustota pravděpodobnosti a distribuční funkce normálního rozdělení 68.27% 95,45% 99.73% f(x) (Zar 1996)

Normální rozdělení (3) Hustota pravděpodobnosti normálního rozdělení při (a) různém µ a stejném σ a (b) při různém σ a stejném µ (Zar 1996)

Normální rozdělení (4) Příklady (1) V komerční produkci vajec je jejich poškození rozbitím skořápky největší problém. V jedné studii byla sledována variabilita tloušťky skořápky chovaných hus. Zjistilo se, že tloušťka skořápek má přibližně normální rozdělení s µ= = 0.38 mm a σ= 0.03 mm. (2) U jistých typů nervových buněk u hmyzu bylo zjištěno, že se změny elektrického potenciálu dějí poměrně pravidelně ( clock-spikes ). Ačkoliv se délka periody (čas mezi dvěma vrcholy) jevila poměrně stejná, byla zaznamenána jistá variabilita. V jedné studii byla měřena délka intervalů mezi vrcholy (v ms) u jednoho jedince myši domácí, a bylo pozorováno, že délka intervalu má přibližně normální rozdělení s µ= = 15.6 msa σ= 0.4 ms. (3) Přístroj používaný pro počítání částic (např. počet krevních buněk) vykazuje při opakovaném měření stejného počtu buněk standardní odchylku 1.4% od skutečného počtu. Tak pokud by skutečný počet buněk byl 7000/mm 3, standardní odchylka bude 98 buněk/mm 3 = Measurement error chyba měření, populace těchto chyb mívá většinou normální rozdělení.

Normální rozdělení (5) Co je to normované (standardizované) normální rozdělenía k čemu je dobré? Chceme-li spočítat s jakou pravděpodobností se vyskytuje v populaci s normálním rozdělením nějaký interval hodnot, musíme buď umět integrovat (spočítat plochu pod křivkou) neboprovést standardizacia a pro odhad použít tabulované hodnoty pravděpodobnosti: Pokud má proměnná Xnormální rozdělení s parametry µaσ 2, pak po její, tzv. Z-transformaci, transformaci,má má proměnná Znormální rozdělení se střední hodnotou 0 a variancí jedna (1) = = standardizované normální rozdělení N (0;1) Z i x = i µ σ kvantily tohoto rozdělení jsou dostupné ve statistických tabulkách!!!

Normované normální rozdělení (6) Příklad: převod normálního normálního rozdělení na standardizované normální rozdělení reškálováním osy x (Samuels& Witmer2003, p. 122)

Standardizované normální rozdělení - animace Z-skóre Hustota pravděpodobnosti f(x) Distribuční funkce F(x) Pravděpodobnost

Statistická tabulka normovaného normálního rozdělení (tabulka uvádí proporci normály, která leží za hodnotou z i (tj. je více extrémní) (Zar 1996)

Od populace k výběru Výběrová distribuce (sampling sampling distribution) Co se stane, když provedu opakovaně výběr o velikosti n z normální populace, s průměry těchto vzorků? 1. Průměry budou méně variabilní než individuální pozorování. 2. Získané průměry budou kolísat jednotlivý výběrový průměr bude v průměru roven střední hodnotě populace. 3. Histogram (výběrová distribuce) těchto průměrů bude mít (téměř) normální rozdělení: Centrální limitní věta (central central limit theorem) (= Pravidlo normální aproximace): jestliže původní populace je normální nebo je-li rozsah výběru dostatečně velký, pak rozdělení výběrových průměrů je vždy (zhruba pokud není populace normální) normální!

Od populace k výběru (2) Populace Výběr o velikosti n Tvar rozdělení výběrových průměrů se zvětšujícím se n z populace (Wonnacot a Wonnacot 1993)

Centrální limitní věta - animace Sleduj Distribuce výběrových průměrů se zvětšující se velikostí výběrů (n)

Rozdělení výběrových průměrů (Výběrové rozdělení = sampling distribution of x) Střední chyba průměru (standard error, SE) σ = x σ n Rozdělení výběrových průměrů N (µ;σ/ n) (Moore 2007)

Od populace k výběru (3) ale jak kolísají tyto průměry, O KOLIK? Potřebujeme najít rozptyl průměru!!! Variance průměru 2 2 σ x σ = n Střední chyba σ σ x = průměru n (standard error, SE) Jak se ale ptát na řadu otázek týkajících se průměru výběru? Z i x = i µ σ Z = x µ σ x

Od populace k výběru (4) Je tu jeden velký problém: musíme znát parametry populace a většinou neznáme σ (!!!) Z i x = i µ σ Z = x µ σ x t = x µ s x s x = s n Známe pouze odhad standardní chyby střední hodnoty populace, tzv. střední chybu výběrového průměru Pak se už ale nejedná o normální rozdělení průměrů, ale o tzv. Studentovo t-rozdělení

-je podobné standardizovanému normálnímu rozdělení -je symetrické kolem střední hodnoty µ = 0 Studentovo t-rozdělení t(ν) - má pouze 1 parametr: stupně volnosti: ν = n-1 -modeluje rozdělení průměrů všech možných vzorků o velikosti n z populace Příklad: (Student t- distribution) t = x µ s x Hustota pravděpodobnosti t-rozdělení při různých stupních volnosti Příklad: Má-li náhodný výběr n= 25 lidí průměrnou výšku 170 cm se standardní odchylkou 25 cm, s jakou pravděpodobností mohu takový a vyšší průměr (nebo takový a nižší) dostat ze základního souboru s průměrnou výškou 160 cm? * (Zar 1996)

Co to jsou stupně volnosti? Stupně volnosti (degrees of freedom; ; značíme dfnebo DF): počet pozorování mínus počet parametrů zahrnutých ve vzorci pro výpočet daného parametru (např. variance) pro výpočet rozptylu proto df= n-1, protože ve vzorci je použit jeden parametr (počítaný z dat) = průměr

Tabulky Studentova rozdělení (Zar 1996,upraveno)

Tabulky Studentova rozdělení (Moore 2007)

Další teoretické modely spojitých náhodných veličin Pearsonovorozdělení rozdělení (Pearson= χ 2 distribution) χ 2 (v) Fisher Fisher-Snedecorovo Snedecorovorozdělení rozdělení (Fisher Fisher-Snedecor Snedecor= F -distribution distribution) F (v 1,v 2 ) Uniformní kontinuální rozdělení (Uniform continual distribution) f(x)= 1/(b-a), pro a<x<b

Doporučená literatura Delventhal K.M., KissnerA., Kulick M. (2004): Kompendium matematiky. - Universum. Grafen A., Hails R. (2002): Modern statistics for the life sciences. - Oxford. Hendl J. (2004): Přehled statistických metod zpracování dat.- Portál. Polák J. (1991): Přehled středoškolské matematiky.- Prometheus.