Poznámky k předmětu Aplikovaná statistika, 4. téma

Podobné dokumenty
Poznámky k předmětu Aplikovaná statistika, 4. téma

Statistika II. Jiří Neubauer

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

10. N á h o d n ý v e k t o r

1 Rozptyl a kovariance

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Náhodný vektor a jeho charakteristiky

Téma 22. Ondřej Nývlt

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

NÁHODNÝ VEKTOR. 4. cvičení

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Pravděpodobnost a aplikovaná statistika

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

MATEMATICKÁ STATISTIKA - XP01MST

Vícerozměrná rozdělení

Příklady ke čtvrtému testu - Pravděpodobnost

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

NMAI059 Pravděpodobnost a statistika

PRAVDĚPODOBNOST A STATISTIKA

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Základy teorie pravděpodobnosti

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

NÁHODNÁ VELIČINA. 3. cvičení

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Zápočtová písemka z Matematiky III (BA04) skupina A

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

I. D i s k r é t n í r o z d ě l e n í

PRAVDĚPODOBNOST A STATISTIKA

p(x) = P (X = x), x R,

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Diskrétní náhodná veličina. November 12, 2008

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

Charakterizace rozdělení

Výběrové charakteristiky a jejich rozdělení

Cvičení ze statistiky - 5. Filip Děchtěrenko

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

Pravděpodobnost a statistika

Kontingenční tabulky, korelační koeficienty

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Matematika pro chemické inženýry

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Poznámky k předmětu Aplikovaná statistika, 5.téma

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

Inovace bakalářského studijního oboru Aplikovaná chemie

1. Přednáška. Ing. Miroslav Šulai, MBA

8 Střední hodnota a rozptyl

Náhodné vektory a matice

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

4EK211 Základy ekonometrie

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

Malé statistické repetitorium Verze s řešením

Chyby měření 210DPSM

1. Pravděpodobnost a statistika (MP leden 2010)

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

Matematika I A ukázkový test 1 pro 2011/2012. x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a

7. Rozdělení pravděpodobnosti ve statistice

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Pravděpodobnost a statistika I KMA/K413

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

má spojité parciální derivace druhého řádu ve všech bodech této množiny. Výpočtem postupně dostaneme: y = 9xy2 + 2,

S1P Příklady 02. Náhodná proměnná (veličina) Mějme krabičku o rozměrech 1 x 2 x 3 cm. Na stranách jsou obrázky: :

Kontingenční tabulky, korelační koeficienty

8. Normální rozdělení

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Praktická statistika. Petr Ponížil Eva Kutálková

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Mnohorozměrná statistická data

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Příklad 1: Házíme dvěma kostkami. Stanovte pravděpodobnost jevu, že na kostkách padne součet menší než 5.

METRICKÉ A NORMOVANÉ PROSTORY

Náhodné (statistické) chyby přímých měření

PRAVDĚPODOBNOST A STATISTIKA

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

Pravděpodobnost a matematická statistika

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Transkript:

Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické reakce a množství katalyzátoru; či počet dnů přípravy na zkoušku, výsledek zkoušky a hodinová dotace zkoušeného předmětu. Takové situace lze modelovat n rozměrným náhodným vektorem, což je uspořádaná n tice náhodných veličin (X,..., X n ). V následujícím výkladu se (pro jednoduchost) omezíme na dvourozměrný náhodný vektor (X, Y ), a to diskrétní a spojitý. (D) Necht diskrétní náhodný vektor (X, Y ) nabývá hodnot z množiny M = {(x i, y j ) 2 ; i =, 2,..., j =, 2,...}. Pak lze jeho rozdělení popsat sdruženou pravděpodobnostní funkcí { p(xi, y p(x, y) = P (X = x, Y = y) = j ), (x, y) = (x i, y j ) M, 0, (x, y) / M. VLASTNOSTI SDUŽENÉ PAVDĚPODOBNOSTNÍ FUNKCE p(x i, y j ) 0, (x i, y j ) M, (x i,y j ) M p(x i, y j ) =, P (X x, Y y) = x i x,y j y,(x i,y j ) M p(x i, y j ). Často je užitečné znát rozdělení jednotlivých složek náhodného vektoru, např. náhodnou veličinu popisující rychlost chemické reakce z úvodního příkladu. Máme-li sdruženou pravděpodobnostní funkci p náhodného vektoru (X, Y ), lze marginální pravděpodobnostní funkci p X (x i ) náhodné veličiny X určit jako p X (x i ) = P (X = x i ) = p Y (y j ) náhodné veličiny Y spočítat jako p Y (y j ) = P (Y = y j ) = y j ;(x i,y j ) M x i ;(x i,y j ) M p(x i, y j ), p(x i, y j ). Příklad. Náhodný vektor (M, CH) popisuje výsledky maturity z matematiky a chemie studentů přijatých na VŠCHT v Praze. ozdělení (M, CH) je zadáno sdruženou pravděpodobnostní funkcí p(i, j) = P (M = i, CH = j), i, j =,..., 4, v tabulce

CH M 2 3 4 0, 38 0, 0, 05 0, 0 2 0, 08 0, 7 0, 03 0, 02 3 0, 02 0, 06 0, 03 0, 0 4 0 0, 0 0, 0 0, 0 (a) Určete marginální pravděpodobnostní funkce známek z maturity z matematiky a chemie. (b) Stanovte střední hodnotu a rozptyl M, CH a směrodatnou odchylku CH. (c) Zjistěte pravděpodobnost, že náhodně vybraný student VŠCHT maturoval z matematiky i chemie výborně, ani výborně, ani dostatečně. (S) ozdělení spojitého náhodného vektoru (X, Y ) lze popsat sdruženou hustotou pravděpodobnosti f(x, y), což je taková nezáporná funkce, že P ( X [a, b], Y [c, d] ) = b d a c f(x, y)dy dx, a, b, c, d, a b, c d. Tuto pravděpodobnost lze geometricky interpretovat jako objem tělesa pod grafem hustoty zúžené na množinu [a, b] [c, d]. VLASTNOSTI SDUŽENÉ HUSTOTY PAVDĚPODOBNOSTI f(x, y) 0, (x, y) 2, f(x, y)dx dy =, P (X x, Y y) = x y f(t, s)dt ds, (x, y) 2. Jako u diskrétního náhodného vektoru lze i v případě spojitého náhodného vektoru (X, Y ) definovat marginální rozdělení pravděpodobnosti hustotu f X (x) náhodné veličiny X jako f X (x) = f(x, y)dy, x, hustotu f Y (y) náhodné veličiny Y jako f Y (y) = f(x, y)dx, y. Příklad 2. Náhodný vektor (X, Y ) má sdružené rozdělení dané hustotou { (3x + y), x [0, ], y [0, 2], f(x, y) = 5 0, jinde. (a) Stanovte marginální hustoty náhodných veličin X, Y. 2

(b) Určete střední hodnotu, rozptyl a směrodatnou odchylku náhodných veličin X, Y. (c) Spočítejte P ( X [0, 5; ], Y [, 2] ). ozdělení pravděpodobnosti libovolného náhodného vektoru (X, Y ) je jednoznačně určeno sdruženou distribuční funkcí F (x, y) = P (X x, Y y), x, y, kde {X x, Y y} = {X x} {Y y} = {ω Ω; X(ω) x} {ω Ω; Y (ω) y}. Vlastnosti sdružené distribuční fuknce F (x, y) jsou obdobné jako vlastnosti distribuční funkce jedné náhodné veličiny: 0 F (x, y), F je neklesající a zprava spojitá v každé z proměnných x, y, lim x F (x, y) = lim y F (x, y) = 0 a lim x lim y F (x, y) =, lim x + F (x, y) = F Y (y) a lim y + F (x, y) = F X (x), kde F X (x) a F Y (y) jsou distribuční funkce náhodných veličin X a Y. Poznámka. ozdělení náhodných veličin X, Y nazýváme marginální rozdělení. Z definice distribuční funkce a z třetí vlastnosti sdružené (D) pravděpodobnostní funkce plyne F (x, y) = x i x,y j y,(x i,y j ) M p(x i, y j ), (x, y) 2, (S) hustoty plyne F (x, y) = x y f(t, s) dt ds, (x, y) 2. Nyní můžeme definovat nezávislost dvojice náhodných veličin. Definice. Náhodné veličiny X, Y jsou (vzájemně) nezávislé, jestliže (D) pro diskrétní náhodné veličiny platí (x i, y j ) M p(x i, y j ) = p X (x i )p Y (y j ), (S) pro spojité náhodné veličiny platí (x, y) 2 f(x, y) = f X (x)f Y (y). Poznámka 2. (i) V případě nezávislosti se o sdruženém rozdělení náhodného vektoru (X, Y ) říká, že je součinové. 3

(ii) Pojem nezávislosti dvojice diskrétních náhodných veličin lze vidět ve světle nezávislosti náhodných jevů následovně: P ( {X = x i } {Y = y j } ) = P (X = x i )P (Y = y j ), (x i, y j ) M. Příklad 3. Jsou výsledky maturity z matematiky a chemie z Příkladu nezávislé? Jsou náhodné veličiny X, Y z Příkladu 2 nezávislé? Nejsou-li náhodné veličiny X, Y nezávislé, zkoumáme míru jejich závislosti. MÍY STATISTICKÉ LINEÁNÍ ZÁVISLOSTI NÁHODNÝCH VELIČIN (např. výsledky maturity z matematiky vs. chemie) Bud te X, Y náhodné veličiny s vlastnostmi EX 2 < +, EY 2 < +. Pak kovariance náhodných veličin X, Y je definována vztahem (speciálně cov(x, X) = varx), kde cov(x, Y ) := E(X EX)(Y EY ) = EXY EXEY, pro diskrétní náhodné veličiny je cov(x, Y ) = (x i EX)(y j EY )p(x i, y j ) x i y j = x i y j p(x i, y j ) EXEY, x i y j pro spojité náhodné veličiny je cov(x, Y ) = = (x EX)(y EY )f(x, y)dxdy xyf(x, y)dxdy EXEY. Znormujeme-li vhodně kovarianci, dostaneme velmi užitečnou míru statistické lineární závislosti náhodných veličin X, Y, tzv. korelační koeficient ρ(x, Y ) := cov(x, Y ) varx vary za předpokladu, že 0 < varx < +, 0 < vary < +. VLASTNOSTI KOELAČNÍHO KOEFICIENTU Laskavý čtenář si může povšimnout, že pro normované náhodné veličiny X N = X EX varx a Y N = Y EY vary platí ρ(x N, Y N ) = cov(x N, Y N ). 4

ρ(x, Y ), ρ(x, X) =, ρ(x, Y ) = ρ(y, X), ρ(x, Y ) = právě tehdy, když Y = kx + q, kde k > 0, q, ρ(x, Y ) = právě tehdy, když Y = kx + q, kde k < 0, q, X, Y nezávislé, pak ρ(x, Y ) = 0, ρ(x, Y ) = 0 (tedy i cov(x, Y ) = 0), pak náhodné veličiny X, Y nazýváme nekorelované (tzn. X, Y nejsou statisticky lineárně závislé) s rostoucí ρ(x, Y ) roste i statistická lineární závislost X, Y. Na závěr si uved me některé důležité pojmy související s dvourozměrným náhodným vektorem (X, Y ): střední hodnota E(X, Y ) = (EX, EY ), kovarianční (varianční) matice var(x, Y ) = ( varx, cov(x, Y ) cov(x, Y ), vary ), což je obdoba rozptylu jedné náhodné veličiny, korelační matice pro a, b, c platí corr(x, Y ) = (, ρ(x, Y ) ρ(x, Y ), ), E(aX + by + c) = aex + bey + c, var(ax + by + c) = a 2 varx + b 2 vary + 2ab cov(x, Y ). Druhý vztah v případě nezávislosti X, Y přejde na tvar var(ax + by + c) = a 2 varx + b 2 vary. Příklad 4. Určete kovarianci, korelaci, kovarianční a korelační matici náhodného vektoru (X, Y ) z Příkladu a 2. Cvičení k tomuto tématu (i) Mějme dvě náhodné veličiny X, Y, pro které platí EX =, varx = 36, EY = 4, vary = 25 a ρ(x, Y ) = 0, 8. Definujme náhodné veličiny Určete EZ, varz, EU. Z := 2X 3Y 3, U := XY. 5

(ii) Mějme nezávislé náhodné veličiny X, Y s vlastnostmi EX = 2, varx = 6, EY = a vary = 4. Definujme náhodné veličiny U := 2X + 3, V := 2X 3Y + 2. Stanovte EU, varu, ρ(x, U), ρ(x, Y ), EV, varv. (dcv) Bud (X, Y ) náhodný vektor, jehož rozdělení je dané hustotou { 3 f(x, y) = 2 xy2, x [0, 2], y [0, ], 0, jinde. Udělejte úkoly (a), (b) z Příkladu 2, vyšetřete nezávislost náhodných veličin X, Y, spočtěte kovarianci, korelaci, kovarianční a korelační matici náhodného vektoru (X, Y ) a dále určete P ( < X < 2, ) ( 2 < Y <, P 0 < X <, 0 < Y < ). 2 (dcv2) ozdělení náhodného vektoru (X, Y ) je dáno sdruženou pravděpodobnostní funkcí p(x i, y j ) Y 0 8 X 0 2 4 8. Jsou náhodné veličiny X, Y nezávislé? Stanovte střední hodnotu náhodných veličin X, Y a dále určete var(x, Y ) a corr(x, Y ). 6