1. Pravděpodobnost a statistika (MP leden 2010)



Podobné dokumenty
6. T e s t o v á n í h y p o t é z

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

Tématické celky { kontrolní otázky.

Přehled pravděpodobnostních rozdělení

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Regresní a korelační analýza

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

z možností, jak tuto veličinu charakterizovat, je určit součet

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA I

Drsná matematika IV 7. přednáška Jak na statistiku?

Cvičení ze statistiky - 4. Filip Děchtěrenko

Poznámky k předmětu Aplikovaná statistika, 9.téma

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

A NUMERICKÉ METODY. Matice derivací: ( ) ( ) Volím x 0 = 0, y 0 = -2.

NMAI059 Pravděpodobnost a statistika

Jazyk matematiky Matematická logika Množinové operace Zobrazení Rozšířená číslená osa

Statistika II. Jiří Neubauer

Pravděpodobnost a aplikovaná statistika

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

FAKULTA STAVEBNÍ MATEMATIKA II MODUL 2 STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

1 Rozptyl a kovariance

Pravděpodobnost a statistika

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Téma 22. Ondřej Nývlt

Teoretická rozdělení

Poznámky k předmětu Aplikovaná statistika, 4. téma

Biostatistika a matematické metody epidemiologie- stručné studijní texty

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Poznámky k předmětu Aplikovaná statistika, 4. téma

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Významná diskrétní rozdělení pravděpodobnosti

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

Cvičení ze statistiky - 5. Filip Děchtěrenko

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

alternativní rozdělení Statistika binomické rozdělení bi(n, π)(2)

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

ZÁKLADY PRAVDĚPODOBNOSTI. 1. Co je to pravděpodobnost Začneme matematickým modelem pro popis náhodných jevů a jejich

AVDAT Náhodný vektor, mnohorozměrné rozdělení

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Základní radiometrické veličiny

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Distribuční funkce je funkcí neklesající, tj. pro všechna

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Matematické symboly a značky

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ROTAČNÍ KVADRIKY. Definice, základní vlastnosti, tečné roviny a řezy, průsečíky přímky s rotační kvadrikou

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS )

I. D i s k r é t n í r o z d ě l e n í

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

10. N á h o d n ý v e k t o r

p(x) = P (X = x), x R,

Náhodné vektory a matice

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Náhodný vektor a jeho charakteristiky

KGG/STG Statistika pro geografy

TEORIE MATIC. Tomáš Vondra

Funkce zadané implicitně

15. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Řešené úlohy ze statistické fyziky a termodynamiky

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Inovace bakalářského studijního oboru Aplikovaná chemie

Jaroslav Michálek A STATISTIKA

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ. Matematika 3. RNDr. Břetislav Fajmon, PhD. Autoři textu:

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Značení 1.1 (posloupnost výsledků pokusu). Mějme posloupnost opakovaných (i závislých) pokusů,

15. T e s t o v á n í h y p o t é z

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

NÁHODNÁ VELIČINA. 3. cvičení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Masarykova univerzita. Základy konvexní analýzy a optimalizace v R n.

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Charakterizace rozdělení

Elektrotechnická fakulta

5. Maticová algebra, typy matic, inverzní matice, determinant.

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot

Kapitola 1. Tenzorový součin matic

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

Matematická analýza 1b. 9. Primitivní funkce

Balanční vlastnosti pevného bodu substituce

MATEMATICKÁ STATISTIKA - XP01MST

Transkript:

1. Pravděpodobnost a statistika (MP leden 2010) Pravděpodobnost pojmy 1. Diskrétní pravděpodobnostní prostor(definice, vlastnosti, příklad). Diskrétní pravděpodobnostní prostor je trojice(ω, A, P), kde Ω je množina všech elementárních jevů Ajemnožinamožnýchjevů(platíA 2 Ω ) Pjepravděpodobnost,nebolifunkceP:A [0,1] splňující následující axiomy(první 3 se nazývají σ-algebra): (1) A (2) A A Ω \ A A (3) A 1, A 2,..., A n A A i A (4)P(Ω)=1 (5) A 1, A 2,..., A n disjunktní P( A i )= P(A i ) 2. Elementární jev. Prvek množiny Ω. Každý elementární jev má stejnou pravděpodobnost, že nastane a každé dva elementární jevy jsou disjunktní. 3. Nezávislost jevů. Jevy AaBjsounezávislé,jestližeP(A B)=P(A) P(B). Sdružená nezávislost dvou jevů. Jevy A 1, A 2,..., A n jsousdruženě(vesměs)nezávislé, jestliže J {1,..., n}:p( j J A j )= j JP(A j ). Neslučitelnost(dvou) jevů. Dva jevy jsou neslučitelné, jestliže nemohou nastat zároveň. Neboli pravděpodobnost jejich průniku je nulová. Nezávislost po dvou. Jevy A 1, A 2,..., A n jsoupodvounezávislé,jestliže jsou každé dva z nich nezávislé. 1

4. Podmíněná pravděpodobnost + příklad použití. Podmíněná pravděpodobnost jevu A za předpokladu B je pravděpodobnost, že A nastal, za podmínky, že nastal B a definuje se P(A B) P(A B)=. P(B) Příklad házení kostkou. Jaká je pravděpodobnost, že padlo číslovyššínež3,zapodmínky,žehozenéčíslojesudé.jev A je padlovícenež3 ajev Bje padlosudéčíslo. P(A B)= P(A B) P(B) = P( padlo4nebo6 ) P( padlo2,4nebo6 ) =2 3. 5. Věta o úplné pravděpodobnosti + příklad použití. Mějmepravděpodobnostníprostor(Ω,A,P), jev A A a disjunktníjevy H i pokrývajícíceléa,neboli i I: H i A, i I H i=ω, i j: H i H j =.Pakplatí: P(A)= i IP(A H i ) P(H i ). Důkaz:Učiňmepozorování,žejelikož A A,tak A Ω=A. Proto platí první rovnost: P(A)=P(A Ω)=P(A ( i I H i ))=P( i I(A H i ))= = i I P(A H i )= i IP(A H i ) P(H i ). Druhárovnostjezdefinicejevů H i (pokrývajíceloumnožinu elementárních jevů). Třetí rovnost jsou de Morganova pravidla.čtvrtárovnostjepátýaxiom,neboťprorůzná ijsoujevy A H i disjunktní,neboli i j:(a H i ) (A H j )=. Poslendí rovnost je definice podmíněné pravděpodobnosti. Příklad cesta do školy. Pravděpodobnost, že mi ujede tramvaj, je 0.3. Pravděpodobnost, že stihnu hodinu, pokud mi ujede tramvaj, je 0.1(budu muset běžet). Pravděpodobnost, že stihnuhodinu,pokudtramvajstihnu,je0.8(můžeseještěněco stát na cestě od tramvaje). Jaká je pravděpodobnost, že stihnuhodinu?označme A= stihnuhodinu. H 1 = tramvaj miujede. H 1 = tramvajmineujede. P(A)=P(A H 1 ) P(H 1 )+P(A H 2 ) P(H 2 ) =0.1 0.3+0.8 0.7=0.59 2

6. Bayesova věta. Mějmepravděpodobnostníprostor(Ω,A,P), jev A A a disjunktníjevy H i pokrývajícíceléa,neboli i I: H i A, i I H i=ω, i j: H i H j =.Pakplatí: P(H i A)= P(A H i ) P(H i ) j I P(A H j) P(H j ). Důkaz: P(H i A)= P(H i A) P(A) = P(A H i ) P(H i ) j I P(A H j) P(H j ). První rovnost je definice podmíněné pravděpodobnosti. Druhá rovnost je též definice podmíněné pravděpodobnosti a věta o úplné pravděpodobnosti. Příklad střelciakanci.18střelcůstřílelonakance.5znich sestrefíspstí0.8,7spstí0.6,4spstí0.5a2spstí0.4. Náhodně vybraný střelec minul. Jaká je pravděpodobnost, že střelec patřil k první skupině? Označme A= střelecminul, H i = střelecbylzitéskupiny.pakznámepravděpodobnostip(a c H i ),kde A c je doplněkjevu A,tedyžesestřelecstrefil.Jevy H i jsoudisjunktníapokrývajíceléω.pakpravděpodobnostp(h i A) vypočteme pomocí Bayesovy věty P(H i A)= 0.2 5 18 0.2 5 18 +0.4 7 18 +0.5 4 18 +0.6 2 18 = 1 7 7. Náhodná veličina. Mějme(Ω,A,P).Náhodnáveličinajefunkce X:(Ω,A,P) (R 1, B),kde Bjetřídamnožin(typickyintervalů)vR 1.Nebo zjednodušeně X:Ω R. 8. Nezávislé náhodné veličiny. Náhodné veličiny jsou nezávislé, jestliže pro všechny hodnoty a, bplatíp(x= a&y = b)=p(x= a) P(Y = b). 3

9. Diskrétní náhodná veličina a její charakteristiky. Diskrétní náhodná veličina je náhodná veličina, která může nabývat pouze spočetně mnoha hodnot. Její charakteristiky jsou: Vektor hodnot a pravděpodobností. Vektorhodnot x i apravděpodobností p i,sekterými těchto hodnot nabývá. Někdy se tento vektor nazývá rozdělení pravděpodobnosti. Distribuční funkce. Distribuční funkce náhodné veličiny je funkce F(x)=P(X x), kde x R. Distribuční funkce je neklesající. Pro diskrétní náhodnou veličinu je po částech konstantní.platí F( )=0aF( )=1. Střední hodnota. Střední hodnota náhodné veličiny X dané vektoremhodnot { (xi p i ) },kde P(X= x i )=p i,je EX= ω Ω X(ω)P(ω)= i x i p i. Rozptyl. Rozptyl náhodné veličiny X je definován jako Směrodatná odchylka. varx= E(X EX) 2 = EX 2 (EX) 2. Směrodatná odchylka náhodné veličiny X je definovánajako varx. Kovariace. Korelace. Kovariancenáhodnýchveličin Xa Y je cov(x, Y)=E(X EX)(Y EY). Korelacenáhodnýchveličin Xa Y je cor(x, Y)= cov(x, Y) varx vary. 4

10. Vlastnosti střední hodnoty. Nechť Xjenáhodnáveličinaag(x)jefunkce.Pak Y = g(x) jetakénáhodnáveličinaajejístředníhodnotaje i g(x i)p i. Nechť Xa Y= a+bxjsounáhodnéveličiny,kdereálnáčísla a, bsenazývajípořaděposunazměnaměřítka.pak Důkaz: EY = E(a+bX)=a+bEX. E(a+bX)= ω (a+bx)(ω)p(ω)= ω (a+b X(ω))P(ω)= = ω a P(ω)+ ω (b X(ω))P(ω)=a+b ω X(ω)P(ω)=a+bEX. Tedy nutně platí: Ea=a, E(bX)=bEX a E(X+ Y)=EX+ EY. 11. Vlastnosti rozptylu. PlatívarX= EX 2 (EX) 2. Důkaz:varX= E(X EX) 2 = E(X 2 2XEX+(EX 2 )= EX 2 2EX EX+E(EX) 2 = EX 2 (EX) 2.Využilijsme,že EX je konstanta, tedy ji můžeme vytýkat a střední hodnota konstanty je konstanta. Platívar(a)=0. Důkaz: Ea 2 (Ea) 2 =0. Platívar(a+X)=varX. Důkaz: var(a+x)=e(a+x) 2 (E(a+X)) 2 = = E(a 2 +2aX+ X 2 ) (a 2 +2aEX+(EX 2 ))=EX 2 (EX) 2 =varx. Platívar(bX)= a 2 var(x). Důkaz: var(bx)=e(bx) 2 (E(bx)) 2 = b 2 EX 2 b 2 (EX) 2 = b 2 varx 5

12. Vlastnosti kovariance a korelace cov(x, X)= E(X EX)(X EX)=varX. 1 cor(x, Y) 1 Jsou-li X, Y nezávislé,pakcov(x, Y)=0acor(X, Y)=0. E(X EX)(Y EY)=EXY EX EY =0. cor(x, X)=1. cor(x, X)=1. 13. Spojitá náhodná veličina a její charakteristiky. Spojitá náhodná veličina je náhodná veličina, která může nabývat všech hodnot ze spojitého intervalu. Její charakteristiky jsou: Distribuční funkce. Distribuční funkce náhodné veličiny je funkce F(x)=P(X x), Hustota. kde x R. Distribuční funkce je neklesající. Pro diskrétní náhodnou veličinu je po částech konstantní. V má distribuční funkce nulovou hodnotu avnekonečnu1. Hustota spojité náhodné veličiny X je f(x)=f (x), kde F(x) je distribuční funkce této náhodné veličiny. Platí, že má pro všechny hodnoty x nezáporné funkčníhodnotya f(x)dx=1. Střední hodnota. Střední hodnota spojité náhodné veličiny X je EX= xf(x)dx. R 1 6

14. Čebyševova nerovnost(znění a důkaz). Nechť náhodná veličina X má konečný rozptyl varx. Pak Důkaz: varx= E(X EX) 2 = i 15. Čebyševova věta. ε >0 P[ X EX ε] varx ε 2. i ( (x i EX) ε) p i (x i EX) 2 i (x i EX) 2 ε 2 p i (x i EX) 2 p i ε 2 = ε 2 P[ X EX ε 2 ] Nechť X 1,..., X n jsounezávisléveličinyskonečnýmrozptylem σ 2 astředníhodnotou µ.potom 16. Centrální limitní věta. ε >0 P[ X n µ ε] 0pro n Nechť X 1, X 2,..., X n jsounezávisléstejněrozdělenénáhodné veličiny s konečnou střední hondotou. Potom [ n P X i E ] n X i n var X x Φ(x). i Nechť Y Bi(n, p).potom [ ] Y EY P x Φ(x). vary Přitomplatí,že 17. Zákon velkých čísel. Φ(x)= x 1 2π e t2 2 dt. Mějmenezávisléstejněrozdělenénáhodnéveličiny X 1,...,X n skonečnoustředníhodnotou EX n = µ.potom 1 n P ω Ω: lim X j (ω)=µ =1 n n j=1 7

Rozdělení diskrétní rozdělení 1. Rovnoměrné rozdělení R(M) Xnabýváhodnotzmnožiny {1,...,M}. P[X= k]= 1 M EX= M+1 2 Všechny hodnoty mají stejnou pravděpodobnost. Např. kolik padne na kostce při jednom hodu. 2. Alternativní rozdělení Alt(p) Xnabýváhodnotzmnožiny {0,1}. P[X=0]=0aP[X=1]=1 EX= p varx= p(1 p) Jsoujendvěhodnoty,kterémohounastat,jednamápst p, druhá(1 p).např.zdapadnepannaneboorelpřijednom hodu mincí. 3. Binomické rozdělení Bi(n, p) Xnabýváhodnotzmnožiny {0,1,..., n}. P[X= k]= ( ) n p k (1 p) k k EX= np varx= np(1 p) Součet alternativních rozdělení, neboli n nezávislých dichotomických pokusů. Např. n hodů mincí a počet orlů. 4. Geometrické rozdělení Ge(p) Xnabýváhodnotzmnožiny {1,2,...}. P[X= k]=p(1 p) k 1 EX= 1 p varx= 1 p (1 p 1) Geometrické rozdělení je jediné diskrétní rozdělení bez paměti. P[X > a+b X > a]=p[x > b] 8

Čekání na první zdar. Např. počet hodů mincí, dokud nepadne panna. Tedy první zdar v k-tém pokuse. Obdobněpočetnezdarůpředprvnímzdarem,cožmápst P[X= k]=p(1 p) k Středníhodnotaarozptyllzevypočítatjakoprvníadruhá derivace vytvořující funkce A(x)= pq i x i = p 1 qx i=0 5. Negativně geometrické rozdělení Před r-týmzdaremmáme inezdarů,resp. r-týzdarvi-tém pokusu. Prvnímápst ( ) r+ i 1 q i p r r 1 adruhémápst ( ) i 1 q i p r. r 1 6. Hypergeometrické rozdělení Hyp(N, M, n) Xnabýváhodnotzmnožiny {0,1,...,min n, M}. ( M )( N M ) k n k P[X= k]= ( N n) varx= nm N EX= nm N ( 1 M N ) N n N 1 Např. Nkoulí, Mznichbílých,tahám n. Xjepočetbílých vytažených koulí(tahy bez vracení). 7. Poissonovo rozdělení Pois(λ) Xnabýváhodnotzmnožiny {0,1,...}. P[X= k]=e λλk k! EX= λ varx= λ Počet událostí za jednotku času. 9

Rozdělení spojitá rozdělení 1. Rovnoměrné rozdělení R(a, b) Xnabýváhodnotzmnožiny {a,...,b}. f(x)= 1 b apro x [a, b],jinde0. 2. Normální rozdělení N(µ, σ 2 ) EX= µavarx= σ 2 3. Normované normální rozdělení N(0,1) EX= a+b 2 varx= (b a)3 12 f(x)= 1 σ (x µ) 2 2π e 2σ 2 f(x)= 1 2π e x2 2 EX=0avarX=1 f( x)=f(x)aφ( x)=1 Φ(x),kdeΦjedistribučnífunkce. Φ(u α )=αsenazývá α-kvantil. Všechny hodnoty mají stejnou pravděpodobnost. 4. Exponenciální rozdělení Exp(λ) Xnabýváhodnotzmnožiny {0,...}. f(x)=λe λx pro x >0,jinde0. EX= 1 λ varx= 1 λ 2 Exponenciální rozdělení je jediné spojité rozdělení bez paměti. P[X > a+b X > a]=p[x > b] Doba čekání na určitou událost. 10

Statistika pojmy 1. Bodový odhad. Mějme náhodný výběr rozsahu n(posloupnost n nezávislých stejněrozdělenýchveličin) X 1, X 2,..., X n zrozdělení,které závisí na parametru Θ. Najít bodový odhad znamená najít takovoufunkcináhodnýchveličin X 1, X 2,..., X n (téžstatistiku), která je v nějakém smyslu blízko určené hodnotě Θ. Označmetentoodhad T = T(X 1, X 2,..., X n ).Protožeje T funkce náhodných veličin, je také náhodnou veličinou. Zároveň se T nazývá bodovým odhadem. 2. Vychýlení. Vektorkonstatntb=ET Θsenazývávychýlení. 3. Nestranný odhad parametru Θ. Odhad T parametru Θ je nestranný(nevychýlený), jestliže je nulové vychýlení, neboli ET=Θ. 4. Konzistentní odhad. Odhad T = T n jekonzistentníodhadparametruθ,jestliže platí ε >0 lim n P[ T n Θ < ε]=1. Např.pokud lim n ET n =Θalim n vart n =0,pak T n je konzistentním odhadem Θ. Odhad může být konzistentní a zároveň nemusí být nestranný.např.náhodnývýběr X 1,..., X n z N(µ, σ 2 ).Proodhad rozptylu se používá statistika ˆσ 2 = 1 n n (X i X) 2. Tonenínestrannýodhad,neboť Eˆσ 2 = σ 2.Alejekonzistentní, neboť lim n varˆσ 2 =0. 1 5. Intervalový odhad, interval spolehlivosti. Platí-li pro statistiky T L = T L (X 1,..., X n ), T U = T U (X 1,...,X n ) 1 Tobychtělopodrobnějšíodvození. 11

vztah P[T L Θ T U ]=1 α, říkáme,že(t L, T U )tvoříintervalspolehlivosti(intervalovýodhad, konfidenční interval) pro parametr Θ s koeficientem spolehlivosti1 α. 6. Chyba prvního druhu. P[zamítneme H 0 H 0 platí],neboli,žezamítnemeplatnou hypotézu. Značí se α. 7. Chyba druhého druhu. P[nezamítneme H 0 H 0 neplatí],neboli,ženezamítnemeneplatnou hypotézu. Značí se β. 8. Síla testu. 1 β. Někdy při hledání opptimálního testu stanovíme hladinu významnosti α(omezíme pravděpodobnost chyby 1. druhu) a mezi α-testy hledáme ten s největší sílou(nejmenší chybou 2. druhu). 9. Hladina testu. Hladina testu je maximální dovolená chyba prvního druhu. 10. P-hodnota testu. Nejmenší hladina, při které bychom ještě hypotézu zamítli. Pravděpodobnost, s jakou testovací statistika nabývá horších hodnot (vícesvědčícíchprotihypotéze).hypotézu H 0 zamítámenahladině α,právěkdyž p-hodnotajemenšínež α. 11. Kritický obor Množina výsledků pokusu, při kterých budeme hypotézu zamítat.značíse W. 12. Na příkladu falšené mince popsat testování hypotéz. Viz papíry. 13. Rozdíl mezi párovým a dvouvýběrovým testem. Párový test je test hypotézy o hodnotě rozdílu středních hodnot µ 1 a µ 2 složeknáhodnýchvektorůvnáhodnémvýběru (X 1, Y 1 ),...,(X n, Y n )zdvourozměrnéhonormálníhorozdělení.(uvnitř každé dvojice nemusí jít o nezávislé veličiny.) H 0 : µ 1 µ 2 = d H 1 : µ 1 µ 2 d 12

Můžeme zavést náhodnou veličinu Z i = X i Y i pro i = 1,...,n.Pokudneznámerozptyl,můžemepoužít t-testpro T= Z d S Z / n, kde ZjevýběrovýprůměraS 2 Z jevýběrovýrozptyl(odhadnutý).hypotézu H 0 zamítnemenahladiněvýznamnosti α, pokud T W=(, t α (n 1)) (t 1 α (n 1)). 2 2 Kde t 1 α 2 (n 1)je(1 α 2 )-kvantilstudentovarozdělenís(n 1) stupni volnosti. Dvouvýběrový test je testem hypotézy o hodnotě rozdílu středních µ 1 a µ 2 vedvounezávislýchnáhodnýchvýběrech X 1,..., X n znormálníhorozdělení N(µ 1, σ 2 ) Y 1,..., Y m znormálníhorozdělení N(µ 2, σ 2 ) sestejným(ikdyžklidněneznámým)rozptylem σ 2. H 0 : µ 1 µ 2 = d H 1 : µ 1 µ 2 d K testování můžeme použít statistiku(opět t-test) T= X Y d nm(n+m 2) (n 1)S 2 X +(m 1)SY 2), n+m kde S 2 X a S2 Y jsoupříslušnévýběrovérozptyly(odhadnuté). Hypotézu H 0 zamítnemenahladiněvýznamnosti α,pokud T W=(, t α 2 (n+m 2)) (t 1 α 2 (n+m 2)). Kde t 1 α 2 (n+m 2)je(1 α 2 )-kvantilstudentovarozdělení s(n+m 2)stupnivolnosti. 14. Model lineární regrese. 15. Reziduum. Lineární regrese představuje aproximaci daných(naměřených) hodnot(x i, Y i )přímkou.mějmenezávislénáhodnéveličiny Y 1,..., Y n z N(β 0 + β 1 x i, σ 2 ),kde x i jsoudanénestejněvelkékonstanty.rozptyly Y i jsoutedystejné(σ 2 ),alestřední hodnotylzevyjádřitjakolineránífunkciznámýchkonstant x i (β 0 + β 1 x i )pomocíneznámýchparametrů β 0, β 1. Reziduumjehodnota r i = Y i β 0 β 1 x i. 13

Poznámkykestatistice výpiskyzvárastr.140 162 2 1. Test nezávislosti v normálním rozdělení. Protestovánínezávislostisložeknáhodnýchvektorů(X 1, Y 1 ),...,(X n, Y n ) v náhodném výběru z dvourozměrného normálního rozdělení vektoru(x, Y)ahypotézy H 0 : X, Y nezávislé H 1 : X, Y závislé se používá test založený na statistice T= r 1 r 2 n 2, kde rjevýběrovýkorelačníkoeficient.hypotézu H 0 zamítneme na hladině významnosti α, pokud T > t 1 α(n 2). 2 Kde t 1 α 2 (n 2)je(1 α 2 )-kvantilstudentovarozdělenís(n 2) stupni volnosti. 2.Výběrovýprůměrnaměřenýchhodnot x i jejejicharitmetickýprůměr x= 1 n n x i. Přičemžplatí,že(a+xb)=a+bx. 3. Medián je prostřední hodnota v setříděném souboru naměřených hodnot. Pokud jich je sudo, tak je to aritmetický průměr prostředních dvou. 4.(Výběrový) p-tý kvantil(percentil) je v uspořádaném souboru hodnot definovaný x p = x np +1 pro np np aaritemtickýprůměr1/2x np +x np+1 pro np= np. 5. Výběrový rozptyl je definován jako s 2 x= 1 n 1 n (x i x) 2 = 1 n 1 n (x 2 i x 2 ). 6.Směrodatnáodchylka s x jedefinovánajakoodmocninazrozptylu. 7. Krabicový diagram(box plot) znázorňuje medián, 25%ní a 75%ní kvantil ahorníměřeníadolníměření,resp.10%nía90%níkvantil. 2 Pravděpodobnostamatematickástatistika KarelZváraaJosefŠtěpán 14

8. Populace neboli základní soubor je statistický soubor, na kterém děláme všechna měření. Jeho velikost je N. Pokud měříme hodnotu zvoleného číselnéhoznaku X,taknaměřenéhodnotyoznačujeme x 1, x 2,..., x n.jejich průměr xznačíme µ.populačnírozptylznačíme σ 2. 9. Výběrový soubor(výběr) je výběr z populace, aby dobře reprezentoval populaci. Jeho velikost se značí n. 10. Abychom vybrali náhodný výběrový soubor, použijeme náhodný výběr bez vracení. Každý takový soubor má pravděpodobnost 1 ( N n). 11.Výběrovýprůměr nnáhodnýchveličin X 1,..., X n definujeme X= 1 n n X j. 12. Pro výběrový průměr spočítaný z prvků náhodného výběru z konečné populace lze dokázat j=1 EX= µ varx= N n N 1 σ2 n. Výraz N n N 1 senazývákonečnostnínásobitelapro n << NjevlivkonečnostníhonásobitelezanedbatelnýavarX= σ2 n.zřejměpro n=1platí EX= µavarx= σ 2. 13. V případě výběru z konečné populace je střední hodnota výběrového průměru X rovna populačnímu průměru µ, tedy odhadovanému parametru. Uvedenou vlastnost formulujeme, že X je nestranným odhadem parametru µ. 14. Nebo můžeme výběrový soubor vybírat s vracením. Naměřené hodnoty X 1,..., X n nataktonáhodněvybranýchprvcíchjsounezávislé náhodné veličiny. Při výběru bez vracení by obecně nezávislé nebyly, ale pro dostatečně velikou populaci(nekonečnou) ano. 15. Pro výběrový průměr spočítaný z náhodného výběru rozsahu n z rozdělení s konečnou střední hodnotou a konečným rozptylem platí: EX= µ varx= σ2 n. 16.Jakoodhadrozptylu σ 2 sepoužívávýběrovýrozptyl S 2 = 1 n 1 N (X i X) 2. 17.Pronáhodnývýběrrozsahu nplatí ES 2 = σ 2. 15

18.Je-li X 1,..., X n náhodnývýběrzrozdělení N(µ, σ 2 ),potom Xa S 2 jsou nezávislé veličiny a platí (N 1)S 2 σ 2 = 1 n σ 2 (X i X) 2 χ 2 (n 1). 19. Mějme náhodnou veličinu T dánu podílem nezávislých náhodných veličin T= Z. X n Kde Z N(0,1)aX χ 2 (n).potomhustotastudentova t-rozdělenís n stupnivolnostije F T (t)ajetonějakýhnusnývzorec. 20. Můžeme nahlédnout, že náhodná veličina mározdělení t(n 1). T= X µ n S Výběr z normálního rozdělení se známou střední hodnotou Předpokládejme,ženáhodnéveličiny X 1,..., X n tvořínáhodnývýběrrozsahu nznormálníhorozdělení N(µ, σ 2 ) (tedycelápopulaceseřídítímto normálním rozdělením).předpokládejmenavíc,žeznámerozptyl σ 2.Jakouinformaciohodnotě µ můžeme získat z tohoto náhodného výběru? Jižvíme,ževtomtopřípaděmávýběrovýprůměrnormálnírozdělení N(µ, σ2 n ). Je tedy nestranným odhadem parametru µ(neboť náš výběrový průměr má též střední hodnotu µ). Provedeme-li normování této náhodné veličiny, dostaneme náhodnou veličinu s normovaným náhodným rozdělením N(0, 1). Ta bude vypadat X µ. σ 2 n (Pomocí jednoduchých vztahů lze dokázat, že bude mít střední hodnotu nulovou a rozptylroven1).prolibovolné α (0,1)pakbudeplatit: 1 α = P( Z < z(α/2)) PlynezCLV. (1) = P( X µ < z(α/2)) Plynezpozorování. (2) σ 2 n = P(X σ n z(α/2) < µ < X+ σ n z(α/2)) (2) Našli jsme interval s náhodnými konci, který s předem danou pravděpodobností pokrývá neznámý parametr µ. Říkáme, že ( X σ z(α/2) < µ < X+ σ ) z(α/2) n n je interval spolehlivosti(neboli konfidenční interval) pro parametr µ s koeficientem spolehlivosti 1- α. 16