Statistická rozdělení

Podobné dokumenty
PRAVDĚPODOBNOST A STATISTIKA

Doc. Ing. Dagmar Blatná, CSc.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Přednáška č. 2 náhodné veličiny

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

SP2 Korelační analýza. Korelační analýza. Libor Žák

PRAVDĚPODOBNOST A STATISTIKA

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Digitální učební materiál

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

PRAVDĚPODOBNOST A STATISTIKA

Náhodný výběr 1. Náhodný výběr

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Pro orientaci v této problematice jsme se seznámili s nkolika novými pojmy:

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

PRAVDĚPODOBNOST A STATISTIKA

Mendelova univerzita v Brně Statistika projekt

Odhady parametrů 1. Odhady parametrů

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

12. N á h o d n ý v ý b ě r

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika

Spolehlivost a diagnostika

Generování dvojrozměrných rozdělení pomocí copulí

Intervalové odhady parametrů

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

Intervalové odhady parametrů některých rozdělení.

PRAVDĚPODOBNOST A STATISTIKA

S1P Popisná statistika. Popisná statistika. Libor Žák

Testování statistických hypotéz

3. Charakteristiky a parametry náhodných veličin

V. Normální rozdělení

Lineární regrese ( ) 2

Testy statistických hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

3. Charakteristiky a parametry náhodných veličin

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Odhady a testy hypotéz o regresních přímkách

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

SP NV Normalita-vlastnosti

14. B o d o v é o d h a d y p a r a m e t r ů

4. B o d o v é o d h a d y p a r a m e t r ů

Pravděpodobnost a aplikovaná statistika

Popisná statistika. Zdeněk Janák 9. prosince 2007

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

1. Čím se zabývá 4PP? zabývá se určováním deformace a porušováním celistvých těles v závislosti na vnějším zatížení

Národní informační středisko pro podporu kvality

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

a další charakteristikou je četnost výběrového souboru n.

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

NEPARAMETRICKÉ METODY

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Pravděpodobnostní model doby setrvání ministra školství ve funkci

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA VZORCE PRO 4ST201

7 LIMITNÍ VTY. as ke studiu kapitoly: 70 minut. Cíl:

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Úvod do teorie měření

Statistika pro metrologii

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA. VZORCE PRO 4ST201 a 4ST210

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

2. TEORIE PRAVDĚPODOBNOSTI

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

8. cvičení 4ST201-řešení

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

8. Odhady parametrů rozdělení pravděpodobnosti

n-rozměrné normální rozdělení pravděpodobnosti

4.2 Elementární statistické zpracování Rozdělení četností

Závislost slovních znaků

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

11. Popisná statistika

Správnost vztahu plyne z věty o rovnosti úhlů s rameny na sebe kolmými (obr. 13).

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

2. Vícekriteriální a cílové programování

8.1.2 Vzorec pro n-tý člen

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

Základy teorie pravděpodobnosti a teorie grafů

2. Náhodná veličina. je konečná nebo spočetná množina;

1. Základy měření neelektrických veličin

12. Neparametrické hypotézy

Náhodné jevy, jevové pole, pravděpodobnost

Statistické charakteristiky (míry)

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

Transkript:

Úvod Statstcá rozděleí Václav Adamec vadamec@medelu.cz Náhodá proměá: matematcá velča, jejíž hodot osclují. Produt áhodého procesu lze charaterzovat fucí Hodot proměé v oboru přípustých hodot Rozděleí defují fučí vztah mez hodotam áhodé proměé a četostm jejch výstu Spojtá rozděleí: eoečý počet možých hodot, fuce pravděpodobostí hustot (p.d.f., f( Nespojtá rozděleí: oečý počet možých hodot, pravděpodobostí fuce (p.m.f., p( Kumulatví dstrbučí fuce (c.d.f., F( Tp proměých Fuce popsující rozděleí Náhodé proměé: umercé (vattatví omálí (valtatví: barva, pohlaví Numercé: ardálí (měřtelé ordálí (pořadové: tříd jaost, stup. lasface Kardálí: spojté (otuálí: hmotost, masá užtovost espojté (dsrétí: počt mláďat, defetů Pravděpodobostí fuce (p.m.f., p( vjadřuje pravděpost výstu dsrétí hodot v oboru možých hodot p( = p( Y = = F( F( Fuce pravděpodobostí hustot (p.d.f., f( spojté proměé df( / f ( = = F ( d Kumulatví dstrbučí fuce (c.d.f., F( vjadřuje pravděpod. výstu hodot meší ebo rové Y. F ( = P( Y = p( espojtý případ Y Y f F ( = P( Y = ( d spojtý případ p( =. 0

Středí hodota (Expectato Varace Expectato (E defujeme jao prví obecý momet. Pro spojtou áhodou proměou: Pro espojtou áhodou proměou: M = P ( + M = f ( d Y = + E ( Y = f ( d = P( Varac (Var defujeme jao druhý cetrálí momet Pro spojtou proměou: + [ ] Var ( = M = M f ( d Pro espojtou proměou: Var( = M = [ M ] P( Obecě platí: Var( Y = = ( Přílad Pravdla pro expectato Je dáo rozděleí pravděpodobostí dsrétí proměé Y: Jaá je středí hodota a varace? p( F( 0 0,5 0,5 0,5 0,40 0,5 0,65 3 0,35,00 = 0 * 0,5 + * 0,5 + * 0,5 +3 * 0,35 =,8 Var( = (0-,8 * 0,5 + (-,8 *0,5 + (-,8 *0,5 + (3-,8 * 0,35 = 0 + 0,6 + 0,0 + 0,504 =,6 E ( cy = c Y = cµ Y ± c = Y ± c = µ ± c E ( Y± X = Y ± X =µ ± µ g( Y = E ( c = c E ( = µ Y E ( µ µ µ + = + = = + g( P( E ( g ( Y = g ( f ( d x Y dsrétí Y spojtá

Pravdla pro varac Beroullho proměá Najděte Var Var Var( c = 0 Cov( Y, c = 0 ( cy = c Var ( Y = c σ ( Y ± c = Var( Y + Var( c ± cov( Y, c = σ + 0 ± 0 = σ Var( Y ± X = Var( Y + Var( X ± cov( Y, X = σ + σ ± σ = E Var = ( = σ x Var ( = Var = x Bárí espojtá proměá: pacet přežl ( = pacet epřežl ( = 0 Y ~ Beroull ( π de π je parametr rozděleí (pravděpodobost přežtí, = a - π je pravděpodobost epřežtí = 0 Pravděpodobostí f-ce: Jaé jsou hodot F(=0 a F(=? P = π Var( = π ( π ( = π ( π Bomcé rozděleí Beroullho expermet opaovaý - rát Y ~ B (, π Beroullho opaováí jsou vzájemě ezávslá Parametr π je stálý (Beroullho pous jsou detcé, s vraceím Pravděpodobostí fuce: P( = ( π ( π ; 0; > 0! ( =!(! E ( = π Var( = π ( π Bomcé rozděleí B( = 6, π = 0,5 c p( F( 0 0,0565 0,0565 6 0,093750 0,09375 5 0,34375 0,343750 3 0 0,3500 0,65650 4 5 0,34375 0,89065 5 6 0,093750 0,984375 6 0,0565,000000 Pravděpodobost ejvíce sů, ejméě sů? Pravděpodobost ejvíce dcer?? Var(?

Bomcá rozděleí pro růzá π Multomcé rozděleí Bomal p.m.f. 0.6 0.5 0. 0. 0 3 4 5 6 p=0.5 p=0.5 p=0.85 Rozšířeí bomcého opaováí a více (> možých výstupů Y, Y,..., Y ~ Multom(, π,..., π Opaováí jsou opět ezávslá Parametr π,..., π jsou stálé Pravděpodobostí fuce:! P(,,..., = π ;! = = E ( = p Var ( = π 0 Přílad: multomcé rozděleí Possoovo rozděleí Pravděpodobost jedáča π = 0,6; dvojčat π = 0,3; trojčat π 3 = 0, Jaá je pravděpodobost, že ve vrzích 3 mate bude 7x jedáče, 4x dvojče a x trojče? P( =7, =4, 3 = π = (3! /(7!4!! * 0,6 7 * 0,3 4 * 0, = 0,0584 Jaá je pravděpodobost, že ve vrzích 3 mate ebude a jedou vrh s trojčat? Výslede = 0,54 Proměá: Počt bez přrozeého jmeovatele Bomcé případ s a s malým π Dstrbučí parametr λ = π z Bomcého rozděleí Parametr λ je stálý Pravděpodobostí fuce: λ e λ P( = ; 0! Y ~ Posso ( λ = Var ( = λ Přílad: Na část chromozomu o daé délce se vstují reombace v průměru (=λ,05x za meoz. Jaé jsou pravděpodobost výstu = 0,,,...,9 crossoverů a úseu?

Possoovo rozděleí Posso(λ =,05 p( F( 0 0,349938 0,34994 0,367435 0,7737 0,9903 0,908 3 0,06756 0,97779 4 0,0773 0,9955 5 0,0037 0,9994 6 0,00065 0,99989 7 0,000098 0,99999 8 0,00003,00000 9 0,00000,00000 Přesvědčete se, že = Var( = λ.0 0.8 0.6 0. Possoovo rozděleí Posso p.m.f. a c.d.f. 0 3 4 5 6 7 8 9 Gaussovo rozděleí Gaussovo rozděleí Spojtá proměá Y geerovaá polfatorálí sumací Určujících fatorů je moho a jsou ezávslé Možé hodot Y v oboru reálých čísel od - do + Fuce pravděpodobostí hustot (p.d.f.: f Y ~ N ( µ, σ ( µ σ ( = e πσ Hodota f-ce pravděpodobostí hustot f( eí pravděpodobost! P( = Y = 0! E µ ( = Var ( = σ Atrbut: Normálích rozděleí je eoečě moho Parametr µ a σ defují aždé ormálí rozděleí Rozděleí je smetrcé podle os procházející průměrem Loačí mír průměr, medá a modus jsou totožé Plocha pod Gaussovou řvou odpovídá P =,0 Pravdlo 34 4 se týá pravděpodobost výstu hodot (% mez µ a σ, σ a σ, σ a +

Stadardzovaé Gaussovo rozděleí Proměá Z ~IID, N(0, Norm ovaa Gaussova rva Hodot z aždého ormálího rozděleí lze stadardzovat Stadardí ormálí proměá z: µ z = ~ N ( µ = 0, z σ z = σ P.d.f. Std. ormálího rozděleí se začí φ(z φ ( z = e π z C.d.f. Std. ormálího rozděleí se začí Φ(z Z f Φ( z = P( z Z = ( z dz 0. 0. % 4% 34% 34% 4% % -4-3 - - 0 3 4 Z Kalulace pravděpodobostí Kalulace pravděpodobostí Řěšíme tegrálem P Z ( z µ σ ( z Z = e πσ dz Levostraá pravdepodobost z =,645 P b ( z µ σ ( a z b = e a πσ Platí že: φ(z = φ(-z (důslede souměrost Φ(-z = - Φ(z z -p = - z p (vplývá z předchozího výrazu dz 0. 0. P ( Z z = 0.95 z =.645-3 - - 0 3 Z

Kumulatví dstrbučí fuce F(z Pravděpodobostí výraz.0 0.8 P = 0.95 Kumulatv dstrbuc fuce Prcp: Kvatl z lze převést a levostraou pravděpost P a obráceě př vužtí souměrost rozděleí Z ~ N(0, Pravdepodobost 0.6 0. P = 0.50 P = 0.6 z = -.0 z = z =.645-3 - - 0 3 Z Kol % dojc se achází v populac s průměrem 4500 l a směrodatou odchlou 650 l mez 3800 l až 5000 l? z = (3800-4500 / 650 = -,0769 z = (5000-4500 / 650 = 0,7693 - P( -,0769 ( - P(0,7693 0,40758 ( - 0,779 0,40758 0,0878 = 0,638364, ted 64 % Jaá je pravděpodobost výstu dojce s užtovostí ad 6000 l? z = (6000-4500 / 650 =,30769 - P(,30769 = - 0,98949 = 0,00508, ted,05 % Pravděpodobostí výraz Studetovo t - rozděleí Jaá je pravděpodobost výstu dojce s užtovostí pod 3300 l? z = (3300-4500 / 650 = -,8465 P(-,8465 = - P(,8465 = 0,03435, ted 3, % 5 % ejlepších dojc budou vužt v ET. Staovte selečí lmt užtovost. z(0,95 =,64485 4500 +,64485 * 650 = 5569,5 l, ted 5570 l 5 % ejhorších dojc ebudou zapoje do reproduce stáda. Staovte lmt užtovost pro vřazeí. z(0,5 = -,03643 4500 -,03643 * 650 = 386,3, ted 3830 l Gossettovo t - rozděleí Spojté rozděleí dervátů výběrových velč mající vztah výběrovému rozptlu s lmtovaým stup volost ν Možé hodot t v oboru reálých čísel od - do + Rozděleí je umodálí a souměré olem ul Platí, že t p;ν = t p;ν Tvar p.d.f. defová parametrem ν (stupě volost Vztah proměé Z dá výrazem z p t = p; ν = V pratcých případech, je-l přblžě ν > 0

Studetovo t - rozděleí Gaussova a Gossettova rva Rozděleí Chí-vadrát (Pearsoovo 0. 0. Z - rva t, - rva t,4 - rva -3 - - 0 3 t Chí - vadrát χ je spojté rozděleí (p.d.f. ezáporé velč Součet čtverců stadardích ormálích odchle má Chí-vadrát rozděleí s ν = stup volost z = z + z +... + z ~ χ = ( = ( s z = = ~ χ ν = = σ σ Parametr rozděleí: stupě volost ν dá počtem ezávslých odchle od průměru Počet stupňů volost ν určuje tvar řv p.d.f. Užtečé př testováí rozptlu a jeho dervátů (sum čtverců E ( χ ν = ν Var( χ ν = ν Rozděleí Chí-vadrát (Pearsoovo Fsherovo - Sedecorovo rozděleí Ch-vadrát desta a stupe volost 0.5 0. 0. χ χ 4 χ 6 χ 0 Je spojté rozděleí pro podíl dvou ezávslých ezáporých velč (rozptlů, součtu čtverců U aždé z velč se předpoládá Chí-vadrát rozděleí χ ν a χ ν Podíl těchto velč má F rozděleí se stup volost ν (proměá v čtatel a ν (proměá ve jmeovatel F-rozděleí je vžd asmetrcé Platí, že: F p; ν ; ν = F F = t p; ν ; ν p ; ; ν p / ; ν 0 5 0 5 F 0.95,3,7 = / F 5,7,3 = / 0053 = 4.34683 F 0.95,, 4 = t 0.975,4 =.77645 = 7.70865

F-rozděleí F - rozdele.0 0.8 0.6 0. 0 3 4 5 6