Rozdělení spojitých veličin Frekvenční distriuční funkce spojité náhodné veličiny (NV) Rovnoměrné spojité rozdělení Normální rozdělení (Gussovo, Guss-Lplceovo) Normální normovné rozdělení Logritmicko - normální rozdělení Eponenciální rozdělení χ - rozdělení (Personovo) Studentovo t - rozdělení Fischerovo - Snedecorovo F - rozdělení
FREKVENČNÍ FUNKCE spojité NV Pokud u spojité náhodné veličiny X vynášíme n osu y prvděpodonost, dostneme FREKVENČNÍ FUNKCI neoli HUSTOTU PRAVDĚPODOBNOSTI.
DISTRIBUČNÍ FUNKCE spojité NV Pokud u spojité náhodné veličiny vynášíme n osu y KUMULATIVNÍ prvděpodonost, dostneme DISTRIBUČNÍ FUNKCI.
DISTRIBUČNÍ FUNKCE spojité NV Distriuční funkce spojité NV má tvr esovité křivky je nezáporná neklesjící nejvýše 0 F( ) F ( ) f ( t) dt Pro zvolenou hodnotu p nlezneme n vodorovné ose hodnotu kvntilu (p).
Rovnoměrné spojité rozdělení U různých progrmových produktů (tulkové procesory, progrmovcí jzyky, sttistické simulční progrmy) je dostupný tzv. generátor náhodných čísel. Je to funkce, jejímž voláním lze získt hodnoty náhodné veličiny, které mjí rovnoměrné rozdělení prvděpodonosti. Běžně se setkáváme s tím, že tto funkce generuje hodnoty spojité veličiny U z intervlu [0,). Některé progrmové produkty dovolují i generování hodnot diskrétní náhodné veličiny s rovnoměrným rozdělením, jink tyto hodnoty můžeme získt vhodnou trnsformcí (zokrouhlením) spojité veličiny X. Je nutno mít n pměti, že tzv. generátory náhodných čísel jsou deterministické lgoritmy, tzn., že jednou vygenerovnou řdu hodnot jsme schopni při stejném počátečním zdání přesně zopkovt. Vygenerovné hodnoty tedy nejsou, přísně vzto, náhodné. Proto se někdy tkto vygenerovným hodnotám říká pseudonáhodná čísl.
Rovnoměrné spojité rozdělení - Frekvenční funkce Spojitá náhodná veličin X má rovnoměrné rozdělení, jestliže hustot prvděpodonosti je n intervlu hodnot (,) konstntní mimo tento intervl nulová. Ploch pod frekvenční křivkou (úsečkou) f ( ) f() 0 pro < < jink
Rovnoměrné spojité rozdělení - Distriuční funkce Distriuční funkce rovnoměrně rozdělené náhodné veličiny X je F() 0 pro pro < < F() pro ) ( ) ( ) ( ) ( dt t f X P F <
Rovnoměrné spojité rozdělení - střední hodnot rozptyl Mtemticky je střední hodnot NV s distriuční funkcí F() definovná pomocí integrálu je to vlstně součet všech možných hodnot vynásoený jejich prvděpodoností Rozptyl vypočteme doszením do vzorce: vr(x)e(x ) - [E(X)] ) ( d X E + ) vr( + d X ) df( µ d d d f X E ) ( ) (
Rovnoměrné spojité rozdělení odvození vzorce pro rozptyl Anlogicky: Zpsáno v jiném tvru: vr(x) E(X ) - [E(X)] ) vr( + d X + n i i i n i i n n X ) ( ) ( ) vr( + n i i n i i n n
Rovnoměrné spojité rozdělení odvození vzorce pro rozptyl ( ) + + 4 3 ) vr( 3 d X ( ) + + + + + 4 3 ) ( ) ( 4 3 3 3 ( ) 3 6 3 4 4 4 + + + + + ( ) ) vr( X
Normální rozdělení spojitých veličin Budeme zkoumt rozdělení četností (prvděpodonosti výskytu) různých hodnot u iologických i jiných veličin, npř.: tělesná výšk dospělých mužů váh novorozených dětí hodnoty cholesterolu pcientů z cévní pordny IQ školních dětí počet slov n potištěných stránkách životnost žárovek Tyto veličiny udeme povžovt z spojité rozdělení prvděpodonosti výskytu jejich hodnot nzývt NORMÁLNÍ krjní hodnoty (nízké vysoké) se vyskytují jen zřídk prostřední hodnoty jsou směrem ke střední hodnotě četnější mlá četnost mlá prvděpodonost výskytu velká četnost vysoká prvděpodonost výskytu
Prvděpodonostní funkce spojité náhodné veličiny Spojitou NV měříme s omezenou přesností: přesnost omezená měřicími přístroji neo nšimi schopnostmi zorzujeme ji Histogrmem četností (sloupcovým grfem) Frekvenční funkcí neoli Hustotou prvděpodonosti 3 34 36 38 40 4 44 46 48 inch
Prvděpodonostní funkce Normálního rozdělení 3 34 36 38 40 4 44 46 48 inch Histogrm četností je měření ovodu hrudi 5738 skotských vojáků (utorem je Belgičn Adolph Quételet). Křivk je Frekvenční funkce neoli Hustot prvděpodonosti O první uveřejnění spisku o této křivce se zsloužil v roce 733 frncouzský mtemtik Arhm de Moivre.
Prvděpodonostní funkce Normálního rozdělení ROZDĚLENÍ (ROZLOŽENÍ) NÁHODNÉ VELIČINY tedy znázorníme PRAVDĚPODOBNOSTNÍ neoli FREKVENČNÍ FUNKCÍ. Hldkou křivku můžeme tké nzvt HUSTOTA PRAVDĚPODOBNOSTI Př. Hmotnost nrozených dětí 500 000 500 3000 3500 4000 4500 5000
Normální rozdělení Normální rozdělení je myšlenkovým modelem. Normální křivk je jednoznčně určen dvěm prmetry: střední hodnotou rozptylem resp. směrodtnou odchylkou Střední hodnot je v tomto přípdě ritmetický průměr, medián i modus - určuje střed křivky n ose Rozptyl určuje plochost neo nopk špičtost křivky (čím je rozptyl větší, tím je křivk plošší )
Normální rozdělení (Gussovo, Guss-Lplceovo) Oecné normální rozdělení má ve sttistice dominntní postvení. Mnohé náhodné veličiny v přírodních vědách i ekonomice mjí toto rozdělení neo lze jejich rozdělení Normálním rozdělením doře proimovt. Proč? V BIOSTATISTICE je rozdělení hodnot dáno především BIOLOGICKOU VARIABILITOU SLEDOVANÉ VELIČINY měřenou proměnnou ovlivňuje součsně velký počet neptrných vzájemně nezávislých náhodných vlivů. Projevuje se to kolísáním kolem střední hodnoty tk, že n oě strny jsou výsledky stále méně čsté etrémní hodnoty se ojevují jen ojediněle.
Normální rozdělení (Gussovo, Guss-Lplceovo) Normální rozdělení N(μ; σ ) je popsáno mtemtickou funkcí: f ( ) e σ π ( µ ) µ σ e σ π σ Frekvenční funkce je symetrická zvonovitá funkce jejíž špičtost závisí nepřímo n velikosti rozptylu σ Normální rozdělení je stejně jko osttní rozdělení myšlenkovým modelem, nikoli ektním přírodním zákonem. I zde pltí, že se může vyskytnout nejméně prvděpodoná hodnot.
Normální rozdělení (Gussovo, Guss-Lplceovo) Normální rozdělení pltí pro (téměř) všechny výěry Npř. zkoumáme váhu stovky (tisíce, sttisíce) hvrnů. Všichni jsou černí, le jejich váhy se udou lišit nejen u jednotlivců, le u různých výěrů. Pokud jejich váhy jsou rozděleny normálně, součet vh výěrů je tké rozdělen normálně. Oecně pltí, že normálně ude rozdělen i veličin, která vznikne součtem výěrů, i kdyy původní veličin normální rozdělení neměl. Normální křivku mtemticky popsl poprvé v roce 733 Arhm de Moivre, frncouzský mtemtik, který utekl do Londýn. N zákldě inomického rozdělení uskutečnil myšlenkový skok od sloupečků k hldké křivce. Jenže křivk i rovnice updly v zpomnění.
Normální rozdělení (Gussovo, Guss-Lplceovo) Znovuojeven yl jko GAUSSOVA LAPLACEOVA KŘIVKA CHYB. Proč chy? N přelomu 8. 9. století získávli stronomové při svých měřením ve vesmíru kvůli nedokonlosti přístrojů stále odlišné hodnoty. Astronomové mezi nimi Guss Lplce - hledli cestu, jk ze spousty různých výsledků njít prvděpodoně správnou hodnotu. Nejprve chtěli vypočítt ritmetický průměr, le pk o došli k závěru, že velmi odlišné hodnoty vyloučí udou se zývt jen těmi podonějšími. Nejčetnější hodnoty yly prostřední odpovídl jim i ritmetický průměr. Pro práci s odchylkmi (npř. + -, +5-5) zvolil kždý jinou cestu: Lplce solutní hodnoty, Guss chyy umocnil n druhou tento postup se pk upltnil při výpočtu rozptylu směrodtné odchylky. Pro iometrii vědu o měření člověk ojevil normální rozdělení elgický vědec Adolphe-Lmert Quételet, jeden ze zkldtelů Královské sttistické společnosti v Londýně.
Normální rozdělení (Gussovo, Guss-Lplceovo) Quételet zvedl pojem homme moyen tvrdil, že přírod se snží vytvořit ideální typ člověk, le že různě chyuje. Měl odpůrce i stoupence, npř. Frncis Glton zvedl do iologie kvntittivní metody měrné stupnice pro všechny možné tělesné znky. Dlším odivovtelem normální křivky yl Krl Person, otec moderní mtemtické sttistiky. Stnovil, že i v přírodě jsou nenormálně rozdělené veličiny. Pokusil se vyprcovt specifická schémt rozdělení pro tyto přípdy po pečlivém rozoru skutečností zjistil, že se ovykle jedná o spletence dvou neo více normálních rozdělení. Výsledkem dohdů o normálním rozdělení je centrální limitní vět, která nám říká si toto: Jestliže je znk určen půsoením většího počtu nvzájem nezávislých vlivů, výsledkem je lespoň přiližně normální rozdělení, ť už je kždý z těchto fktorů rozdělen jkkoliv.
Pltí: Normální rozdělení (Gussovo, Guss-Lplceovo) - součet či rozdíl normálních veličin je normální - tedy i průměr normálně rozdělených veličin je normální - čím více nezávislých náhodných veličin sčítáme, tím je jejich součet líž normálnímu rozdělení to ez ohledu, jké měly původní veličiny rozdělení Povžujeme ho z rozdělení, které vystihuje rozložení SPOJITÝCH KVANTITATIVNÍCH VELIČIN. Můžeme ho popst pomocí dvou prmetrů μ σ. Tyto prmetry jsou mírou polohy měřítk jejich přirozeným odhdem je výěrový průměr výěrový rozptyl. Mtemticky lze dokázt, že pro dosttečně velké n je inomické rozdělení Bi(n; π) podoné normálnímu rozdělení N(nπ; nπ(-π))
Grfy hustoty prvděpodonosti Normálního rozložení
Grfy odpovídjících distriučních funkcí Normálního rozložení
Frekvenční funkce PRAVIDLO TŘÍ SIGMA -3δ -δ -δ 0 δ δ 3δ - odchylky n oě strny jsou stejně prvděpodoné (symetrie, šikmost 0) - v úseku δ +δ leží 68,6% přípdů, tj. o něco víc než /3 celkové plochy - v úseku δ +δ leží 95% přípdů - v úseku 3δ +3δ leží 99,7% přípdů Normální křivk se teoreticky rozkládá od - do +
Normovné normální rozdělení znčíme někdy místo N(0; ) symolem U neo Z Má střední hodnotu μ 0 směrodtnou odchylku σ Je popsáno mtemtickou funkcí: která vznikl zjednodušením rovnice doszením z μ 0 σ Normovné normální rozdělení N (0; ) ) ( e f π ) ( σ µ π σ e f
Normovné normální rozdělení N (0;) Normování je účelná konvence: vzorec pro přepočet hodnot normovného rozdělení je: Důvody: pro střední hodnotu 0 je rozložení symetrické (šikmost 0) pro směrodtnou odchylku je špičtost 0 z µ pro testování hypotéz potřeujeme mít k dispozici kritické hodnoty převod n Normovné rozdělení nám umožní použít sttistické tulky, v nichž jsou telovány hodnoty pouze pro μ 0 σ σ Poznámk: sttistické progrmy už umí prcovt i s oecným normálním rozdělením
Sttistická tulk rozdělení prvděpodoností N(0; )
Příkld O rozdělení IQ oyvtel je známo, že má normální rozdělení se střední hodnotou 00 směrodtnou odchylkou 0, tj. N(00; 00) Jká je prvděpodonost, že vše kmrádk má. IQ > 85. IQ > 5 3. IQ mezi 90 0 4. IQ 00 Vypočteme z - skóry pro N(0; ). 85:. 5: 85 00 z 0,5 500 z,5 0 3. 90: z 90 00 0,0 4. 0: z 0 00 0,0
Příkld - řešení. IQ > 85 -,5. IQ > 5,5 3. IQ mezi 90 0-4. IQ 00 Prvděpodonost:. 0,933. -0,994: 0,006 3. 0,84-0,59: 0,68 4. 0
LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ Příkldy: Koncentrce látek Hmotnost dospělého muže U normálního rozdělení se chyy sčítjí, zjímá nás o kolik se změní sledovná veličin (ditivní). U logritmicko-normálního se ptáme kolikrát se změní sledovná veličin (multipliktivní) vytváří násoek skutečné veličiny, tře lízký jedné. Tento násoek můžeme ještě názorněji vyjádřit procentuelně. zvýšení hmotnosti člověk s 50 kg o 5 kg je 0%, tj. násoek, zvýšení hmotnosti člověk se 00 kg o 5 kg je 5% tj. násoek,05 Proto je vhodnější počítt tyto veličiny v logritmicko normálním rozložení.
LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ Pokud si nkreslíme histogrm s rozdělením váhy v normálních hodnotách, histogrm není symetrický, le zešikmený kldně - v prvé části se ude ojevovt více odlehlých hodnot Pokud y průměrná hmotnost dospělého muže yl 80 kg, pk njdeme dleko víc mužů, kteří váží přes 00 kg než mužů, kteří váží méně než 60. Zároveň odchylk 50 kg se ve vyšších hodnotách ude zcel jistě vyskytovt (váh 30 kg), le v nižších hodnotách (30 kg) se skoro jistě nevyskytne vůec. Pokud stejné rozdělení zorzíme jko logritmy hodnot, rozdělení se ude jevit symetrické. Mjí-li tyto logritmy normální rozložení, mluvíme o logritmickonormálním rozdělení. Chrkteristikou polohy je geometrický průměr, který vypočteme odlogritmováním průměru logritmů. Testy výpočty intervlů počítáme tké z logritmů nměřených hodnot. Meze intervlů jsou nesymetrické.
LOGARITMICKO - NORMÁLNÍ ROZDĚLENÍ Vyznčuje se kldným zešikmením Příkldy: - koncentrce - hmotnost postvy 0 4 6 8 0
EXPONENCIÁLNÍ ROZDĚLENÍ Používá se nejčstěji pro nlýzu doy přežití v iologii neo ve fyzice pro modelování rychlosti rozpdu izotopů. Nejjednodušší model prvděpodonosti přežití je zložen n myšlence, že prvděpodonost úmrtí je v kždém okmžiku stejná, tj. prvděpodonost, že sledovná oso zemře v dném okmžiku z předpokldu, že se tohoto okmžiku dožil, je konstntní nezávisí n čse. Hustot eponenciálního rozdělení je popsán vzorcem: f ( ) e e Zákldní chrkteristiky jsou: E(X) vr(x)
Výěrová rozdělení veličin Mějme náhodnou veličinu o které předpokládáme, že má Normální rozdělení s prmetry μ σ. V pri čsto neznáme skutečné hodnoty těchto prmetrů musíme je nhrdit jejich odhdy. Tto trnsformce změní rozložení zkoumné veličiny. Proto yl odvozen jiná (výěrová) rozdělení, která slouží jko vzor pro porovnávání s výěrovým rozdělením. V kpitole o Sttistických testech udeme hledt způso, jk určit shodu mezi nší náhodnou veličinou teoretickým rozdělením, o kterém předpokládáme, že je modelem pro nše dt.
Výěrová rozdělení veličin Jinými slovy: Při testování veličiny vypočteme testovcí sttistiku, o které víme, že z pltnosti testovné hypotézy, má nějké výěrové rozdělení, npř.: χ rozdělení (používá se pro popis výěrového rozptylu) Studentovo t - rozdělení (nejčstěji se používá k porovnání průměrů) Fisherovo F rozdělení (použití pro porovnání rozptylů ve dvou souorech neo při porovnání rozptylů závislých veličin v lineární regresi)
χ rozdělení (Personovo) Mějme n nezávislých náhodných veličin s normovným normálním rozdělením N(0; ): U, U,, U n Potom náhodná veličin X má rozdělení s n-stupni volnosti. Je to rozdělení součtu n druhých mocnin normálně rozdělených veličin. Hodnot n je jediný prmetr tohoto rozdělení. Zákldní chrkteristiky: E(X) n, D(X) n Hustot rozdělení je pro hodnoty 0 nulová (viz orázek dále). χ n i U i
χ rozdělení (Personovo) S rostoucím n se rozdělení χ n i U i líží normálnímu rozdělení χ N(n, n) s prmetry μ n σ n
χ rozdělení (Personovo) Distriuční funkci, stejně jko hustotu rozdělení, nelze vyjádřit jednoduchým výrzem, proto je telován, podoně jko kvntily rozdělení chí kvdrát. Telovné hodnoty njdeme ve sttistických tulkách, kde jsou ovykle v levém sloupci stupně volnosti v horním řádku njdeme hldinu význmnosti α (vysvětlení njdete v kpitole o sttistických testech). χ V Ecelu pro určení kvntilů rozdělení můžeme použít funkci CHISQ.INV, jejíž prmetry jsou p, tj. levostrnná prvděpodonost počet stupňů volnosti, tkže npř. zdáním CHISQ.INV(0,95;0) dostneme hodnotu 0,95-kvntilu rozdělení χ pro 0 stupňů volnosti 8,307
χ rozdělení (Personovo) nlogická funkce CHISQ.INV.RT, počítá kvntily zprv, tj. CHISQ.INV.RT(0,05;0) vypočte stejnou hodnotu kvntilu jko CHISQ.INV(0,95;0). Tto funkce je inverzní k funkci distriuční, tj. pro CHISQ.DIST s prmetry (; n; ), kde je kvntil, n je počet stupňů volnosti určuje, že se jedná o distriuční funkci. Oecně má funkce CHISQ.DIST prmetry (; n; kumultivní), kde je kvntil, n je počet stupňů volnosti kumultivní je prvd () - distriuční funkce, neo neprvd (0) - frekvenční funkce (hustot prvděpodonosti). nlogicky funkce CHISQ.DIST.RT vrátí hodnotu distriuční funkce zprv. Třetí prmetr nemá.
χ rozdělení (Personovo) Používá se nejčstěji pro popis výěrového rozptylu. Tvr rozložení je závislý n počtu sčítnců n, le toto číslo musíme v přípdě, že pro výpočet použijeme odhd jednoho neo více prmetrů, zmenšit o příslušný počet odhdovných prmetrů. Příkld: pro výpočet odhdu ROZPTYLU, kdy použijeme odhd průměru, je počet stupňů volnosti (n ) místo n (odhdovli jsme prmetr). Ve složitějších přípdech ývá počet odhdovných prmetrů větší počet stupňů volnosti se tím zmenší.
Studentovo t - rozdělení Tké Studentovo t-rozdělení ptří mezi rozdělení odvozená od Normálního rozdělení můžeme ho popst funkcí: kde veličin U má stndrdizovné normální rozložení veličin t χ U χ n chí-kvdrát rozdělení o n - stupních volnosti Sttistické chrkteristiky: E(T) 0, D(T) n n
Studentovo t - rozdělení S rostoucím n se t-rozdělení líží normovnému normálnímu rozdělení pro n > 40 ho můžeme nhrdit normovným rozdělením N (0; ) Název získlo rozdělení podle pseudonymu chemik pivovru Guiness v Dulinu Willim Sely Gosset, jednoho ze zkldtelů plikcí induktivní sttistiky v olsti nesporně význmné - v zezpečení kvlity piv. Nejčstěji se používá k porovnání průměrů. Kvntily t-rozdělení jsou telovány neo je můžeme určit pomocí softwre.
Studentovo t - rozdělení V Ecelu eistují funkce T.INV T.INV.T s dvěm prmetry: prvděpodonost počet stupňů volnosti. Kždá z nich se chová jink: T.INV vrcí hodnotu p-kvntilu zlev, npř. T.INV(0,04; 40) -,796 T.INV.T počítá s ooustrnnou prvděpodoností, npř. T.INV.T(0,04; 40),3 - vrcí hodnotu kvntilu pro prvděpodonost 0,98 zprv, tzn., že n oou strnách křivky ukrojíme hodnoty s prvděpodoností < než 0,0. Je to proto, že n rozdíl od funkce chí-kvdrát Normálního rozdělení je pro Studentovo rozdělení definován hldin význmnosti α ooustrnně: P{ T t(α)} α
Studentovo t - rozdělení Co znmená hldin význmnosti α ude vysvětleno v kpitole u sttistických testů. Ztím n příkldu: řekli jsme, že Studentovo rozdělení pro n > 40 můžeme nhrdit Normálním normovným rozdělením. T.INV (0,4; 40) -0,55 T.INV.T (0,8; 40) 0,55... ooustrnná prvděpodonost NORM.S.INV (0,4) -0,53... prvděpodonost zprv NORM.S.INV (0,6) 0,53... zlev prvděpodonost 0,04
Studentovo t - rozdělení Anlogicky njdeme v Ecelu Distriuční funkci T.DIST s prmetry, volnost, kumultivní, kde je kvntil, volnost je počet stupňů volnosti kumultivní je prvd () - distriuční funkce, neo neprvd (0) - frekvenční funkce (hustot prvděpodonosti). Funkce T.DIST.RT poskytne hodnotu prvostrnného Studentov rozdělení funkce T.DIST.T poskytne hodnotu ooustrnného Studentov rozdělení
Studentovo t - rozdělení
Studentovo t - rozdělení Telování hodnot studentov rozdělení: P{ T t(α)} α Telování hodnot Normálního normovného rozdělení: P{X u(α)} α Asolutní hodnot u Studentov rozdělení zdvojnásoí hldinu význmnosti pro stejnou hodnotu nezávisle proměnné (testovcí sttistiky): Z(α) ~ t(α), npř. Z,576 pro α 0,005 t,576 pro α 0,0 (pro nekonečně velký počet stupňů volnosti) V Ecelu použijeme funkce: NORM.S.INV (-α) pro Normální normovné rozdělení T.INV.T (α; počet stupňů volnosti) pro Studentovo rozdělení
Fischerovo - Snedecorovo F-rozdělení Mějme dvě nezávislé náhodné veličiny s rozdělením Veličin χ n χ F m χ má Fischerovo - Snedecorovo rozdělení s n m stupni volnosti. N pořdí prmetrů záleží. n n Sttistické chrkteristiky: E(F) D(F) n ( m + n ) m( n ) ( n 4) Používá se především pro testování rozdílnosti rozptylů při porovnání rozptylů závislých veličin v lineární regresi
Fischerovo - Snedecorovo F-rozdělení
Fischerovo - Snedecorovo F-rozdělení V Ecelu kvntily počítá funkce F.INV s prmetry -p, n, m, npř. F.INV(0,05; 0; 0) vrátí hodnotu,3478, což je 0,95-kvntil Vzhledem k tomu, že náhodná veličin F je podílem veličin X Y, pro kvntily F-rozdělení pltí Fn, m( p) F ( p) F.INV(0,5;00;0),3 F.INV(0,75;0;00) 0,76 /0,76,3 m, n