Statistika II. Jiří Neubauer

Podobné dokumenty
AVDAT Náhodný vektor, mnohorozměrné rozdělení

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma

Výběrové charakteristiky a jejich rozdělení

Náhodný vektor a jeho charakteristiky

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Téma 22. Ondřej Nývlt

10. N á h o d n ý v e k t o r

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

1 Rozptyl a kovariance

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Pravděpodobnost a aplikovaná statistika

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Charakterizace rozdělení

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Pravděpodobnost a statistika I KMA/K413

MATEMATICKÁ STATISTIKA - XP01MST

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

NÁHODNÝ VEKTOR. 4. cvičení

Kontingenční tabulky, korelační koeficienty

Náhodné vektory a matice

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

I. D i s k r é t n í r o z d ě l e n í

Testování hypotéz o parametrech regresního modelu

p(x) = P (X = x), x R,

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Zápočtová písemka z Matematiky III (BA04) skupina A

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Testování hypotéz o parametrech regresního modelu

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Základy teorie odhadu parametrů bodový odhad

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Vícerozměrná rozdělení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Příklady ke čtvrtému testu - Pravděpodobnost

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

NMAI059 Pravděpodobnost a statistika

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

PRAVDĚPODOBNOST A STATISTIKA

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a statistika

PRAVDĚPODOBNOST A STATISTIKA

Mnohorozměrná statistická data

NÁHODNÁ VELIČINA. 3. cvičení

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

ZÁklady teorie pravděpodobnosti

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

PRAVDĚPODOBNOST A STATISTIKA

Cvičení ze statistiky - 5. Filip Děchtěrenko

15. T e s t o v á n í h y p o t é z

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy teorie pravděpodobnosti

Časové řady, typy trendových funkcí a odhady trendů

Základní pojmy teorie množin Vektorové prostory

Časové řady, typy trendových funkcí a odhady trendů

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Analýza hlavních komponent

Normální rozložení a odvozená rozložení

MATEMATICKÁ STATISTIKA

Mnohorozměrná statistická data

Bayesovské metody. Mnohorozměrná analýza dat

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Definice spojité náhodné veličiny zjednodušená verze

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

PRAVDĚPODOBNOST A STATISTIKA

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

1. Přednáška. Ing. Miroslav Šulai, MBA

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Pravděpodobnost a statistika

Pravděpodobnost a matematická statistika

Matematika pro chemické inženýry

8.4. Shrnutí ke kapitolám 7 a 8

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

5. T e s t o v á n í h y p o t é z

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

1. Pravděpodobnost a statistika (MP leden 2010)

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

S1P Příklady 02. Náhodná proměnná (veličina) Mějme krabičku o rozměrech 1 x 2 x 3 cm. Na stranách jsou obrázky: :

Definice Řekneme, že funkce z = f(x,y) je v bodě A = [x 0,y 0 ] diferencovatelná, nebo. z f(x 0 + h,y 0 + k) f(x 0,y 0 ) = Ah + Bk + ρτ(h,k),

Diferenciál funkce dvou proměnných. Má-li funkce f = f(x, y) spojité parciální derivace v bodě a, pak lineární formu (funkci)

Transkript:

Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz

Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou náhodné veličiny, X = (X, Y ) se nazývá (dvourozměrný ) náhodný vektor. Definice náhodných veličin X a Y je definována jako F (x) = F (x, y) = P(X x, Y y) pro x, y R. Funkce F (x) je někdy označována jako distribuční funkce náhodného vektoru X = (X, Y ).

Věta Mají-li X a Y sdruženou distribuční funkci F (x, y), potom X a Y mají distribuční funkce F X (x) = F (x, ) a F (y) = F (, y). Distribuční funkce náhodných veličin X a Y se nazývají marginální distribuční funkce.

Definice Jsou-li X a Y diskrétní náhodné veličiny, potom X = (X, Y ) se nazývá diskrétní náhodný vektor. Definice Je-li (X, Y ) diskrétní náhodný vektor, pak funkce p(x, y) = P(X = x, Y = y), (x, y) R 2 se nazývá sdružená pravděpodobnostní funkce náhodných veličin X a Y. Funkce p(x, y) bývá též nazývána pravděpodobností funkce náhodného vektoru (X, Y ).

Věta Jestliže náhodný vektor (X, Y ) má pravděpodobnostní funkci p(x, y) a obor hodnot M = {(x, y); x M x, y M y }, pak marginální pravděpodobnostní funkce náhodných veličin X a Y jsou p X (x) = y M y p(x, y), x M x, p Y (y) = x M x p(x, y), y M y.

Příklad Budeme házet dvěma kostkami. Nechť X značí číslo, které padlo na první kostce a Y číslo na kostce druhé. Určete sdruženou pravděpodobnostní funkci. Obor hodnot je množina M = {(j, k); j = 1, 2,..., 6, k = 1, 2,..., 6}. Pro každou dvojici (j, k) dostáváme p(j, k) = P(X = j, Y = k) = P(X = j)p(y = k) = 1 36.

Příklad Obrázek: Hod 2 kostkami

Příklad Počet příchozích telefonátů v jedné společnosti za jednu minutu lze popsat jako náhodnou veličinu s Poissonovým rozdělení se střední hodnotou 4. Předpokládejme, že volající je žena s pravděpodobností 0,5 nezávisle na dalších volajících. Označme X náhodnou veličinu udávající počet volajících žen a Y celkový počet hovorů. Určete sdruženou pravděpodobnostní funkci vektoru (X, Y ). Veličiny X a Y nejsou nezávislé, protože X je vždy menší nebo rovno Y. Nicméně můžeme využít podmíněné pravděpodobnosti. Uvědomíme-li si, že pokud Y = k, pak počet volající žen má binomické rozdělení s parametry k a 0,5, dostáváme p(j, k) = P(X = j Y = k) P(Y = k) = = e 4 2 k, 0 j k, k = 0, 1, 2,.... j!(k j)! ( k j ) 0,5 j 0,5 k j e 4 4 k k! =

Příklad Obrázek: Telefonní hovory

Definice Existuje-li taková nezáporná funkce f (x, y), pro kterou platí F (x, y) = y x f (s, t)ds dt, potom se funkce f se nazývá sdružená hustota pravděpodobnosti náhodných veličin X a Y. Funkce f (x, y) bývá také nazývána hustota náhodného vektoru (X, Y ).

Věta Jsou-li X a Y spojité náhodné veličiny se sdruženou distribuční funkcí F a sdruženou hustotou f, potom f (x, y) = 2 F (x, y), x, y R. x y Sdružená funkce hustoty pravděpodobnosti musí mít následující vlastnosti: 1 f (x, y) 0 pro všechna x, y R, 2 f (x, y)dx dy = 1.

Příklad Náhodný vektor (X, Y ) má hustotu f (x, y) = c(x + 2y), 0 x 1, 0 y 1. Určete konstantu c a sdruženou distribuční funkci F (x, y). Pro určení konstanty c využijeme druhou vlastnost f (x, y). Dostáváme 1 1 1 ( 1 f (x, y)dx dy = c (x+2y)dx dy = c 2 + 2y 0 odkud c = 2. Pro sdruženou distribuční funkci potom platí 3 y x ( x 2 F (x, y) = 0 0 [ tx 2 = 3 + 4xt2 6 0 2 y (s + 2t)ds dt = 3 ] y t=0 0 0 3 + 4xt 3 ) dt = ) dy = 3c 2 = 1, = 1 3 (x 2 y + 2xy 2 ), 0 x 1, 0 y 1.

Věta Nechť X a Y spojité náhodné veličiny se sdruženou hustotou f (x, y), potom jejich marginální hustoty jsou f X (x) = f Y (y) = f (x, y)dy, x R, f (x, y)dx, y R.

Náhodný vektor Podobně, jako jsme definovali dvourozměrný náhodný vektor (X, Y ), lze zavést k-rozměrný náhodný vektor. Nechť X 1, X 2,..., X k jsou náhodné veličiny, vektor (X 1, X 2,..., X k ) nazýváme k-rozměrným náhodným vektorem. Sdruženou distribuční funkcí náhodných veličin X 1, X 2,..., X k, resp. distribuční funkcí náhodného vektoru (X 1, X 2,..., X k ) je funkce F (x 1, x 2,..., x k ) = P(X 1 x 1, X 2 x 2,..., X k x k ). Jsou-li náhodné veličiny X 1, X 2,..., X k diskrétní, je sdružená pravděpodobností funkce definována jako p(x 1, x 2,..., x k ) = P(X 1 = x 1, X 2 = x 2,..., X k = x k ). Předpokládejme nyní, že náhodné veličiny X 1, X 2,..., X k jsou spojité. Existuje-li taková nezáporná funkce f (x 1, x 2,... x k ), pro kterou platí F (x 1, x 2,... x k ) = x1... xk f (x 1, x 2,... x k )dx 1 dx 2... dx k, potom se funkce f se nazývá sdružená hustota náhodných veličin X 1, X 2,..., X k.

Podmíněné rozdělení Definice Nechť X a Y jsou diskrétní náhodné veličiny s obory hodnot M x a M y, nechť p(x, y) je jejich sdružená pravděpodobnostní funkce. Podmíněná pravděpodobnostní funkce Y za podmínky X = x je definována vztahem p Y (y x) = p(x, y) p X (x) pro y M y, p X (x) 0. Definice Nechť spojité náhodné veličiny X a Y mají sdruženou hustotu f (x, y). Podmíněná funkce hustoty pravděpodobnosti Y za podmínky X = x je definována vztahem f Y (y x) = f (x, y) f X (x) y R, f X (x) 0.

Nezávislost Definice Řekneme, že náhodné veličiny X a Y jsou nezávislé, jestliže mezi sdruženou distribuční funkcí F (x, y) náhodných veličin X a Y a jejich marginálními distribučními funkcemi F X (x) a F Y (y) platí vztah F (x, y) = F X (x) F Y (y) pro každé x, y R. Věta Diskrétní náhodné veličiny X a Y jsou nezávislé, právě když pro každé x, y R platí p(x, y) = p X (x) p Y (y), spojité náhodné veličiny X a Y jsou nezávislé právě tehdy, když f (x, y) = f X (x) f Y (y).

Nezávislost Definici nezávislosti lze zobecnit i na větší počet náhodných veličin. Řekneme, že náhodné veličiny X 1, X 2,..., X k jsou nezávislé, jestliže mezi sdruženou distribuční funkcí F (x 1, x 2,..., x k ) náhodných veličin X 1, X 2,..., X k a jejich marginálními distribučními funkcemi F X1 (x 1), F X2 (x 2),... F Xk (x k ) platí vztah F (x 1, x 2,..., x k ) = F X1 (x 1) F X2 (x 2) F Xk (x k ), pro každé x 1, x 2,... x k R. Jsou-li uvažované náhodné veličiny diskrétní, pak jsou nezávislé, právě když p(x 1, x 2,..., x k ) = p X1 (x 1) p X2 (x 2) p Xk (x k ), kde p Xi (x i), i = 1, 2,... k jsou marginální pravděpodobnostní funkce náhodných veličin X 1, X 2,..., X k. Jedná-li se o veličiny spojité, pak jsou nezávislé, právě když f (x 1, x 2,..., x k ) = f X1 (x 1) f X2 (x 2) f Xk (x k ), kde f Xi (x i), i = 1, 2,... k jsou marginální hustoty náhodných veličin X 1, X 2,..., X k.

Definice Existují-li střední hodnoty E(X ), E(Y ) náhodných veličin X a Y, pak střední hodnota náhodného vektoru X = (X, Y ) je vektor E(X) = (E(X ), E(Y )).

Definice Jestliže E(X 2 ) < a E(Y 2 ) <, definujeme kovarianci náhodných veličin vztahem C(X, Y ) = E {[X E(X )][Y E(Y )]}. Pro kovarianci platí: C(Y, X ) = C(X, Y ), C(X, X ) = D(X ), C(X, Y ) = E(XY ) E(X )E(Y ), C(a 1 + a 2X, b 1 + b 2Y ) = a 2b 2C(X, Y ), kde a 1, a 2, b 1, b 2 R.

Definice Korelační koeficient náhodných veličin X a Y je definován vztahem ρ(x, Y ) = C(X, Y ) D(X )D(Y ). Pro korelační koeficient platí: 1 ρ(x, Y ) 1, jestliže jsou X a Y nezávislé, pak ρ(x, Y ) = 0, ρ(x, Y ) = 1 právě když Y = ax + b, kde a > 0, ρ(x, Y ) = 1 právě když Y = ax + b, kde a < 0.

Definice Varianční maticí vektoru X = (X, Y ) rozumíme matici var X = E {[X E(X)][X E(X)]} = E(XX ) [E(X)][E(X)]. ( ) ( ) C(X, X ) C(X, Y ) D(X ) C(X, Y ) var X = =. C(Y, X ) C(Y, Y ) C(X, Y ) D(Y )

Definice Korelační maticí vektoru X = (X, Y ) rozumíme matici ( ) 1 ρ(x, Y ) cor X =. ρ(x, Y ) 1

Střední hodnota a rozptyl součtu Věta Nechť X a Y jsou náhodné veličiny, pak E(X + Y ) = E(X ) + E(Y ). Pro spojité veličiny platí E(X + Y ) = = = (x + y)f (x, y)dx dy xf (x, y)dx dy + xf X (x)dx + yf (x, y)dx dy yf Y (y)dy = E(X ) + E(Y )

Střední hodnota a rozptyl součtu Věta Nechť X a Y jsou náhodné veličiny, a, b R, pak E(aX + by ) = ae(x ) + be(y ).

Střední hodnota a rozptyl součtu Věta Nechť X a Y jsou náhodné veličiny, pak D(X + Y ) = D(X ) + D(Y ) + 2C(X, Y ). D(X + Y ) = E[(X + Y ) 2 ] [E(X + Y )] 2 = E(X 2 ) + 2E(XY ) + E(Y 2 ) E(X ) 2 2E(X )E(Y ) E(Y ) 2 = E(X 2 ) E(X 2 ) + E(Y ) E(Y 2 ) + 2(E(XY ) E(X )E(Y )) = D(X ) + D(Y ) + 2C(X, Y )

Střední hodnota a rozptyl součtu Věta Nechť X a Y jsou nezávislé náhodné veličiny, pak platí E(XY ) = E(X )E(Y ), D(X + Y ) = D(X ) + D(Y ). E(XY ) = = xyf (x, y)dx dy xf X (x)dx yf Y (y)dy = E(X )E(Y ) C(X, Y ) = E(XY ) E(X )E(Y ) = E(X )E(Y ) E(X )E(Y ) = 0

Střední hodnota a rozptyl součtu Věta Nechť X a Y jsou nezávislé náhodné veličiny, a, b R, pak D(aX + by ) = a 2 D(X ) + b 2 D(Y ).

Definice Má-li náhodný vektor X = (X, Y ) sdruženou hustotu pravděpodobnosti 1 f (x, y) = 2πσ 1 σ 2 1 ρ 2 { ( 1 (x µ1 ) 2 exp 2(1 ρ 2 ) σ1 2 + (y µ 2) 2 σ 2 2 2ρ(x µ )} 1)(y µ 2 ) σ 1 σ 2 pro x, y R, pak říkáme, že má dvourozměrné normální rozdělení s parametry µ 1, µ 2, σ 2 1, σ 2 2, ρ. Věta Nechť X = (X, Y ) má dvourozměrné normální rozdělení s parametry µ 1, µ 2, σ 2 1, σ 2 2, ρ, potom X N(µ 1, σ 2 1) a Y N(µ 2, σ 2 2), ρ je korelační koeficient X a Y.

Obrázek: Graf dvourozměrného normálního rozdělení

Věta Nechť X = (X, Y ) má dvourozměrné normální rozdělení. Pro pevné x R platí ( ) Y X = x N µ 2 + ρ σ2 (x µ 1), σ2(1 2 ρ 2 ) σ 1 Z uvedené věty plyne, že E(Y X ) = µ 2 + ρ σ2 σ 1 (x µ 1). Tato podmíněná střední hodnota se nazývá regresní přímka.