SP4 Přpomeutí pojmů PRAVDĚPODOBNOST A STATISTIKA
SP4 Přpomeutí pojmů
SP4 Přpomeutí pojmů Pravděpodobost Náhodý jev: - základí prostor - elemetárí áhodý jev A - áhodý jev, - emožý jev, jstý jev podjev opačý jev sjedoceí, průk, rozdíl Jevové pole: P, - jevové pole A A, A, B A B, A B, A B
SP4 Přpomeutí pojmů Klascká pravděpodobost Pravděpodobost: P : 0, P A, A Aj, P A PA,, P - pravděpodobostí prostor Klascká pravděpodobost: Předpoklady: je koečá moža P() pro každý elemetárí jev Pak P ( A) A m P( A) Rozšířeá pravděpodobost: P( ) je koečá ebo spočetá moža P( A) P() A
SP4 Přpomeutí pojmů Náhodá velča Zobrazeí : Ω R se azývá áhodá proměá, pokud pro lbovolé x R moža, ( ) x. V ěkteré lteratuře se uvádí, ( ) x Pravděpodobost tohoto áhodého jevu lze defovat fukc F:, ( x F( x) P x F( x) P ) Tato fukce se azývá dstrbučí fukce áhodé velčy. Obor hodot áhodé proměé azýváme základí soubor a ozačíme Z. Z x R; x (), Pokud moža Z je koečá, ebo spočetá, áhodá proměá se azývá dskrétí. Pokud moža Z je espočetá, áhodá proměá se azývá spojtá.
SP4 Přpomeutí pojmů Náhodá velča Nechť,, P je pravděpodobostí prostor. Řekeme, že áhodá velča je dskrétí (vzhledem k P), právě tehdy, když exstuje ejvýše spočetá moža Z R taková, že P( Z). Fukc p( x) P( x), xr azýváme pravděpodobostí fukcí dskrétí áhodé velčy. Pak dstrbučí fukc lze defovat: F ( x) p( t) Nechť,, P je pravděpodobostí prostor. Řekeme, že áhodá velča je spojtá (vzhledem k P), právě tehdy, když exstuje ezáporá, po částech spojtá fukce f(x), že pro všecha reálá čísla platí: f ( x) dx Fukc f(x) azýváme hustotou pravděpodobost áhodé velčy. tx x F ( x) f ( t) dt
SP4 Přpomeutí pojmů Náhodá velča - charakterstky Charakterstky áhodých proměých dělíme ejčastěj a charakterstky polohy a varablty. Mez charakterstky polohy se ejčastěj řadí: středí hodota, medá, modus. Mez charakterstky varablty se ejčastěj řadí: rozptyl, směrodatá odchylka, průměré odchylka. Další používaé charakterstky: škmost, špčatost. Středí hodota áhodé velčy je reálé číslo E() Pro dskrétí NP: Pro spojtou NP: E( ) x p( x) xz E( ) f ( x) dx x E( ) x df( x)
SP4 Přpomeutí pojmů Náhodá velča - vlastost Rozptyl áhodé velčy rozumíme reálé číslo D(), další ozačeí: σ (), σ, var() D( ) E ( E( )) Některé vlastost : E ( a) a E( E ) 0 E( a b ) a be( ) D( ) 0 D ( a) 0 D( a b ) b D( ) E E D( ) E E( ) Čebyševova erovost Nechť pro áhodou proměou exstují E() a D(). Pak D( ) P( E( ) ), 0
SP4 Přpomeutí pojmů Dskrétí áhodá velča - rozděleí Vybraá rozděleí dskrétího typu: Degeerovaé rozděleí D( ) Alteratví (Beroullovo) rozděleí A(p) Klascké rozděleí (dskrétí rovoměré rozděleí) C() Bomcké rozděleí B(,p) Multomcké rozděleí Mu(,p,,p k ) Geometrcké rozděleí Ge(p) Negatví bomcké (Pascalovo) rozděleí NB(k,p) Hypergeometrcké rozděleí H(N,M,) Possoovo rozděleí Po(λ)
SP4 Přpomeutí pojmů Spojtá áhodá velča - rozděleí Vybraá rozděleí spojtého typu: Rovoměré rozděleí R(a,b) Expoecálí rozděleí Exp(a, λ) Erlagovo rozděleí Er(k, λ) Normálí rozděleí N(μ, σ ) Normovaé ormálí rozděleí N(0, ) Webullovo rozděleí Wb(δ, β) Rayleghovo rozděleí R(δ) Logormálí rozděleí LN(ѳ, τ ) Gama rozděleí Γ(k, λ) Beta rozděleí B(α, β)
SP4 Přpomeutí pojmů Spojtá áhodá velča - vlastost Vybraá rozděleí spojtého typu: Pearsoovo χ rozděleí χ () Nechť U ~ N(0,),,, jsou stochastcky ezávslé velčy. Pak U ~ ( ) Studetovo t - rozděleí t() Nechť ~ N(0,), ~ ( ),, jsou stochastcky ezávslé.. Pak ~ t( ) Fscherovo-Sedecorovo rozděleí F(, ) Nechť ~ ( ), ~ ( ),, jsou stochastcky ezávslé.. Pak ~ F(, )
SP4 Přpomeutí pojmů Náhodá velča charakterstcká fukce Nechť je áhodá velča defovaá a pravděpodobostím prostoru,, P. Fukce ( t) E( e t ), t R azveme charakterstckou fukcí áhodé velčy. Pro dskrétí áhodou proměou s pravděpodobostí fukcí p(x): xz xz Pro spojtou áhodou proměou s hustotou pravděpodobost f(x): tx ( t ) e p( x) cos( tx) p( x) s( tx) p( x) xz ( t) e tx f ( x) dx cos( tx) f ( x) dx s( tx) f ( x) dx
SP4 Přpomeutí pojmů Náhodý vektor Nechť Ω je základí prostor a příslušé jevové pole. Zobrazeí : Ω R se azývá áhodý vektor, pokud pro lbovolé x R moža, ( ) x.. T Ozačeí: (,, ) Dstrbučí fukce F: R 0,. Dskrétí áhodý vektor - pravděpodobostí fukce Spojtý áhodý vektor - hustota pravděpodobost
SP4 Přpomeutí pojmů Náhodý vektor fukčí charakterstky smultáí sdružeé fukčí charakterstky dstrbučí fukce pravděpodobostí fukce hustota pravděpodobost margálí fukčí charakterstky dstrbučí fukce pravděpodobostí fukce hustota pravděpodobost podmíěé fukčí charakterstky dstrbučí fukce pravděpodobostí fukce hustota pravděpodobost
SP4 Přpomeutí pojmů Náhodý vektor číselé charakterstky Číselé charakterstky áhodého vektoru: T T (,, ),,, ) středí hodota áhodého vektoru: kovarace složek a j : varačí matce vektoru : kovaračí matce vektorů, korelace složek a j ( korelačí matce vektorů, m E ( ) ( E( ),, E( )) C(, j ) E( E )( j E j ) var( ) C(, j ), j cov(, ) (, j ) corr(, ) C( j C( S(, ), m, j )S( ( j ) j ), ), m T
SP4 Přpomeutí pojmů Náhodý vektor rozděleí Vybraá rozděleí áhodého vektoru: Multomcké rozděleí Mu(,p,,p k ) -rozměré ormálí rozděleí N(, ) -rozměré ormálí rozděleí N(,, σ, σ, ρ)
SP4 Přpomeutí pojmů Záko velkých čísel Posloupost áhodých proměých,, koverguje,, podle pravděpodobost k áhodé velčě, jestlže pro každé ε R, ε > 0 platí: lm P ebo lm P 0 Tato kovergece se také azývá slabá kovergece. Platí: (Chčova věta) Nechť posloupost áhodých proměých,,,, splňuje: a) jsou po dvou ezávslé b) mají stejé rozděleí c) mají koečé středí hodoty: : E Pak posloupost,,,, splňuje slabý záko velkých čísel. Tedy: lm P. Neí potřeba zát formace o rozptylu.
SP4 Přpomeutí pojmů Záko velkých čísel Posloupost áhodých proměých,,,, skoro jstě k áhodé velčě, jestlže platí: koverguje P : lm ( ) ( ) ebo symbolcky zapsaé P lm Tato kovergece se také azývá slá kovergece. Platí: (Kolmogorova věta) Nechť posloupost áhodých proměých,,,, splňuje: a) jsou po dvou ezávslé b) mají stejé rozděleí c) mají koečé středí hodoty: : E Pak posloupost,,,, splňuje slý záko velkých čísel. Tedy posloupost,,,, koverguje skoro jstě k číslu. P : lm ( )
SP4 Přpomeutí pojmů Záko velkých čísel Posloupost áhodých proměých s,, dstrbučím,, fukcem F ( x ) koverguje v dstrbuc áhodé velčě s dstrbučí fukcí F(x) jestlže platí: x C( F) : lm F ( x) F( x) * kde C( F) I je moža bodů spojtost dstrbučí fukce F(x) F Dstrbučí fukce F se azývá asymptotcká dstrbučí fukce. Cetrálí lmtí věta: Nechť posloupost áhodých proměých,,,, splňuje: a) jsou po dvou ezávslé b) mají stejé rozděleí c) mají koečé středí hodoty a rozptyly: : E : D Pak posloupost stadardzovaých průměrů koverguje v dstrbuc k ormovaému ormálímu rozděleí. y C( ) : lm F ( y) ( y)
SP4 Přpomeutí pojmů Náhodý výběr, statstky,, Nechť,, P je pravděpodobostí prostor, áhodé proměé, pro které platí: a) jsou ezávslé b) jejch dstrbučí fukce závsí a ezáme parametr ϑ: Pak, ~ F ( x, ), se azývá áhodý výběr rozsahu z rozděleí s dstrbučí fukcí, F, F Nechť je áhodý výběr z rozděleí s dstrbučí fukcí Fukce áhodého výběru T(,, ) se azývá výběrová charakterstka ebol statstka. Nechť x je výsledek -tého pokusu popsaého áhodou proměou. x se azývá realzací áhodé proměé. x,, x se azývá realzací áhodého výběru (je to statstcký soubor rozsahu ). Dosazeím hodot x,, x do statstky T(,, ) dostaeme pozorovaou hodotu statstky T. t T x,, x ) (
SP4 Přpomeutí pojmů Náhodý výběr, statstky odhady,, Nechť je áhodý výběr z rozděleí s dstrbučí fukcí. Statstka T(,, ) se azývá bodovým odhadem parametru ϑ, pokud abývá hodot blízkých parametru ϑ. bodovým leárím odhadem estraý (evychýleý) T T a, a R E(T) asymptotcky estraý ejlepším estraý T (,, ) lm E D( T) D( S) kozstetí T(,, ) lm P
Náhodý výběr - výběrové statstky Nechť je áhodý výběr. Pak lze defovat vybraé statstky: Výběrový průměr: Výběrový rozptyl: Výběrová směrodatá odchylka: Výběrový koefcet kovarace: Výběrový koefcet korelace:,, S S ) ( ) ( ), ( ), ( S S K R R ), ( S ) ( K ) )( ( ), ( SP4 Přpomeutí pojmů
SP4 Přpomeutí pojmů Náhodý výběr odhady Iterval spolehlvost (kofdečí terval) pro parametr ϑ se spolehlvostí - α (α 0, ) je dvojce statstk T, T pro které platí: P T T Itervalový odhad parametru ϑ se spolehlvostí - α (α 0, ) je terval, kde t ( t ) je realzací statstky T ( T ). t,t Bodové a tervalové odhady pro Bomcké rozděleí - pro parametr p Bodové a tervalové odhady pro Normálí rozděleí - pro parametr μ - pro parametr σ - u N (μ, μ, σ, σ, ρ) pro parametr ρ
SP4 Přpomeutí pojmů Odhady parametrů - Metoda mometů Vychází se z: -,, P - pravděpodobostí prostor - je áhodá proměá s hustotou f ( x, θ), ebo s pravděpodobostí fukcí - Θ a, b a, b r r eprázdá moža parametrů, θ p( x, θ),, Θ k - echť exstují obecé momety E( ), k,, r, které závsí a θ r
SP4 Přpomeutí pojmů Odhady parametrů - Metoda mometů Metoda: -,, P - pravděpodobostí prostor - Θ a, b a, b r r eprázdá moža parametrů, θ -,, áhodý výběr k - echť M k, k,, r jsou výběrové momety - parametry θ,, r hledáme pomocí r-rovc: ( ), k, r k M k,,, Θ r
SP3 Odhady parametrů Odhady parametrů - Metoda maxmálí věrohodost Vychází se z: -,, P - pravděpodobostí prostor - Θ a, b a, b r r eprázdá moža parametrů, θ -,, áhodý výběr T - (,, ) áhodý vektor s sdružeou hustotou ebo s sdružeou pravděpodobostí fukcí p( x, θ) - pro pevou hodotu x,fukc ( ) azveme věrohodostí fukcí,, Θ f ( x, θ) L( θ) f ( x, θ) L( θ) p( x, θ) r
SP4 Přpomeutí pojmů Odhady parametrů - Metoda maxmálí věrohodost Nechť r= - θ a, b - θˆ je maxmálě věrohodý odhad (MVO) parametru θ, platí-l L θ ˆ L θ, θ - ěkdy se využívá tvar l L θˆ l L θ, θ - ozačeí se používá, pokud chceme zdůrazt rozsah výběru θˆ
SP4 Přpomeutí pojmů Náhodý výběr testováí hypotéz Statstcká hypotéza H je tvrzeí o vlastostech rozděleí pravděpodobost pozorovaé áhodé velčy s dstrbučí fukcí F(x, ϑ) ebo áhodého vektoru (, ) se smultáí dstrbučí fukcí F(x,y, ϑ) apod. Postup, jímž ověřujeme daou hypotézu, se azývá test statstcké hypotézy. Prot testovaé hypotéze H, azývaé také ulová hypotéza - H 0, stavíme tzv. alteratví hypotézu - H A, kterou volíme dle požadavku úlohy. Jestlže H je hypotéza, že parametr ϑ má hodotu ϑ 0, píšeme H: ϑ = ϑ 0. Případ H A : ϑ ϑ 0 je dvoustraá alteratví hypotéza a H A : ϑ > ϑ 0, resp. H A : ϑ < ϑ 0, je jedostraá alteratví hypotéza. Př hledáí statstky T se vychází z požadavků a zamítutí hypotézy H. Moža hodot pro zamítutí se azývá krtcký obor a ozačuje se W α.. Pokud realzace zvoleé statstky T pade do krtckého oboru W α říkáme, že hypotézu zamítáme a hladě výzamost α.. U většy testů se místo krtckého oboru udává doplěk krtckého oboru: W.
SP4 Přpomeutí pojmů Náhodý výběr testováí hypotéz Hypotézy pro Bomcké rozděleí - hypotéza H: p = p 0 - hypotéza H: p = p Hypotézy pro Normálí rozděleí - hypotéza H: μ = μ 0 - hypotéza H: σ =σ 0 Hypotézy pro Normálí rozděleí N (μ, μ, σ, σ, ρ) - párové dvojce - hypotéza H: μ = μ - hypotéza H: ρ = ρ 0
SP4 Přpomeutí pojmů Náhodý výběr testováí hypotéz Hypotézy pro dva výběry z Normálí rozděleí N (μ, σ ), N (μ, σ ) - hypotéza H: σ = σ - hypotéza H: μ = μ za předpokladu : σ = σ - hypotéza H: μ = μ za předpokladu : σ σ Vícevýběrový testy z výběru Normálí rozděleí N (μ, σ ),, N (μ, σ ) - test hypotézy o rovost středích hodot - ANOVA - hypotéza H : k vzhledem k alteratví H A : l, j l j - předpoklad: - test hypotézy o rovost rozptylů - Bartlettuv test - hypotéza H vzhledem k alteratví H l, j : A : l j
SP4 Přpomeutí pojmů Náhodý výběr testováí hypotéz o rozděleí Nechť je áhodá proměá, která má dstrbučí fukc F(x, ϑ). Předpokládejme, že ezáme tvar dstrbučí fukce (evíme jaké má rozděleí) a ezáme parametr ϑ. Hypotéza je ve tvaru: H: F(x, ϑ), H A : F(x, ϑ). Test Chí-kvadrát (Pearsoův test) o rozděleí test dobré shody Testovací krtérum: m ˆ doplěk krtckého oboru: W t ( f j 0, j f fˆ j j ), k=m - q- stupě volost.
SP4 Přpomeutí pojmů Náhodý výběr testováí hypotéz o rozděleí Testováí hypotéz o rozděleí - Kolmogorov Smrovov srováí dstrbučí fukce a emprcké dstrbučí fukce:: Testy jsou založey a srováí kvatlů
SP4 Přpomeutí pojmů Náhodý výběr Kategorálí aalýza Test Chí-kvadrát (Pearsoův test) o rozděleí se používá u kotgečích tabulek př testech ezávslost. - jedá se o sdružeou hypotézu prot alteratví, j p p H :, j p, j p, p, j H A :, j, p, j - testovací krtérum: r s. j, j,, j, j W 0, - doplěk krtckého oboru:, k=(r-)(s-) stupě volost.
SP4 Přpomeutí pojmů Regresí aalýza Naměřeá data chceme proložt vhodou regresí fukcí. Regresí fukce leárí eleárí Leárí model leárí ormálí regresí model β ~ N(0, I) ~ N( β, kde je matce pláu:, k,, k a T j x, j,, x, j je vektor realzací j-tého měřeí, β je hledaý vektor koefcetů a ε jsou áhodé chyby. I )
SP4 Přpomeutí pojmů Regresí aalýza Leárí model výpočet Bodový odhad β spočítáme pomocí metody ejmeších čtverců (MNČ):. T b y Pak T yˆ y T Ozačme: H. Matce H se azývá projekčí matce. yˆ Hy Leárí model vhodost modelu T TSS ( y y) ( y y) T MSS ( yˆ y) ( yˆ y) T RSS ( y yˆ) ( y yˆ) MSS koefcet determace: R TSS RSS bodovým odhadem rozptylu: s k
SP4 Přpomeutí pojmů Regresí aalýza Leárí model tervalové odhady Itervalový odhad β j, j{,,k} Itervalový odhad středí hodoty y pro zvoleé x Itervalový odhad dvduálí hodoty y pro zvoleé x pásy spolehlvost Leárí model testováí hypotéz MSS Statstka F k ~ F k, k se využívá pro testováí hypotézy: RSS k H : y, 3 k 0 prot alteratví hypotéze: H : y, j,, k : A 0 j
SP4 Přpomeutí pojmů Regresí aalýza Leárí model testováí hypotéz Test hypotézy H: c T β = c T β 0 Test hypotézy H: β j = β j0, j{,,k} Leárí model dagostka rezduum: e y yˆ Ověřeí statblty - složky e emusí mít stejý rozptyl Ověřeí ezávslost - složky e mohou být závslé Ověřeí ormalty - složky e emusí mít ormálí rozděleí Detekce vlvých bodů
SP4 Přpomeutí pojmů Korelačí aalýza T T Nechť (,,, ) a (,,, m ) jsou áhodé vektory. Pak pod pojmem korelačí matce rozumíme matc: cor(, ) ( j, ), m Koefcet mohoásobé korelace Koefcet mohoásobé (víceásobé, celkové) korelace defuje míru leárí stochastcké závslost mez áhodou velčou a vhodou leárí kombací složek,,, áhodého vektoru., cor(, )cor( ) cor(, ) Koefcet parcálí korelace Koefcet parcálí korelace defuje míru leárí závslost mez áhodým velčam a Z př zkostatěí složek vektoru (př zrušeí vlvu změy složek vektoru ). cor(, Z) cor(, )cor( ) cor(, Z), Z. [ cor(, )cor( ) cor(, )][ cor( Z, )cor( ) cor(, Z)]
Nechť je áhodý výběr z dvojrozměrého rozděleí se středí hodotou, rozptylem kovarací a korelací. Výběrové statstky: Platí:,, Nestraé výběrové statstky T T ),,(, ), ( T ), (, S ) ( S ) ( S ) )( ( E E E S E S S E Korelačí aalýza SP4 Přpomeutí pojmů
Výběrový korelačí koefcet: ebol S S S R R Platí: Nechť je áhodý výběr z dvojrozměrého ormálího rozděleí s kladým rozptyly, a korelací, ( tedy ), pak pro áhodou velču T platí: tj. má Studetovo rozděleí s ( ) stup volost. T T ),,(, ), ( ) ( t R R T 0 3,0,,, ~ ), ( T N Korelačí aalýza SP4 Přpomeutí pojmů
SP4 Přpomeutí pojmů Korelačí aalýza Mějme áhodý výběr:,,,, kde áhodé vektory:,,, jsou p-rozměré Ozačme R matce výběrových korelačích koefcetů pro (, ) R matce korelace obsahující řádky a sloupce R matce korelace obsahující řádek a sloupce R matce korelace obsahující řádky a sloupce Předpoklad, že matce R je regulárí. výběrový koefcet mohoásobé korelace: R, R, R R R
SP4 Přpomeutí pojmů Korelačí aalýza Nechť je áhodý výběr z (p+) rozměrého ormálího rozděleí s kladým rozptyly, p a echť, 0, pak áhodá velča: p R, Z F p, p p R má Fscherova-Sedecorova rozděleí s p a -p- stup volost. realzace:,,, z p p r r, H 0 : vzhledem k alteratví hypotéze: H A : se ezamítá,, 0, 0 pokud z ; ( ) 0 F p, p,,
SP4 Přpomeutí pojmů Korelačí aalýza Mějme áhodý výběr:, kde áhodé vektory:,,, Z jsou p-rozměré, Z,, Z Ozačme R matce výběrových korelačích koefcetů pro (, Z, ) R matce korelace obsahující řádky a sloupce R matce korelace obsahující řádek a sloupce R Z matce korelace obsahující řádek Z a sloupce R_ Z matce korelace R kde byl odebrá řádek a sloupec Z Předpoklad, že matce R je regulárí. Výběrový koefcet parcálí korelace: R Z, R Z, R R R R R R R Z R R R Z Z Z
SP Korelačí aalýza Korelačí aalýza Nechť Z, Z,, Z je áhodý výběr z (p+) rozměrého ormálího rozděleí s kladým rozptyly, p a echť Z, 0, pak áhodá velča: RZ, T p t p R má Studetova rozděleí s -p- stup volost. Realzace: t r Z, r Z, Z, p H 0 : vzhledem k alteratví hypotéze: H A : se ezamítá, Z, 0 Z, 0 pokud t t ; t p p
SP4 Přpomeutí pojmů Neparametrcké testy hypotéz - úvod Neparametrcké testy statstckých hypotéz se používají v případech, kdy ezáme rozděleí pozorovaé áhodé velčy, resp. áhodého vektoru, aebo pro zámé rozděleí emáme potřebá testová krtéra. Omezeím eparametrckých metod je obvykle požadavek, že pozorovaé áhodé velčy mají spojtá rozděleí, avšak v ěkterých případech stačí zát pouze pořadí uspořádaých hodot daého statstckého souboru, tj. hodoty odpovídajícího ordálího statstckého zaku. Slabší předpoklady o rozděleí (a rozdíl od parametrckých testů testy u chž záme rozděleí) mají za ásledek, že eparametrcké metody ejsou tak slé, jako jejch parametrcké protějšky. Základím prcpem eparametrckých testů je ahrazeí původích pozorovaých hodot jejch pořadím co do velkost a proto se také v lteratuře hovoří o pořadových testech. Př pořadových testech se místo se středí hodotou (jak je tomu u parametrckých testech) pracuje s většou medáem.
SP4 Přpomeutí pojmů Neparametrcké testy hypotéz - Metody Zamíkový test - testujeme hypotézu: H : ~ x c prot alteratví: H A : ~ x c - vychází ze zamíka x c Wlcoxoův jedovýběrový test - testujeme hypotézu: H : ~ x c prot alteratví: H A : ~ x c - vychází z pořadí R, R,, realzace x, x,, x R Wlcoxoův dvouvýběrvý test - Maův-Whteyův test - testujeme hypotézu: H : F G prot alteratví: H A : F G - vychází ze společého pořadí realzace x, x,, a y, y,, y x m
SP4 Přpomeutí pojmů Neparametrcké testy hypotéz - Metody Kolmogorovův- Smrovův dvouvýběrvý test - testujeme hypotézu: H : F G prot alteratví: H A : F G - vychází z porováí emprckých dstrbučích fukcí Spearmeův korelačí koefcet - testujeme hypotézu H:R S = 0 prot alteratví H A : R S 0 - vychází ze korelace pořadí realzace x, x,, a y, y,, y x Kruskalruv-Walsruv test vícevýběrový test - testujeme hypotézu: H F F F k prot alteratví: - vychází ze společého pořadí : H A : l, j Fl Fj