Poznámky k předmětu Aplikovaná statistika, 4. téma

Podobné dokumenty
Poznámky k předmětu Aplikovaná statistika, 4. téma

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Statistika II. Jiří Neubauer

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

10. N á h o d n ý v e k t o r

AVDAT Náhodný vektor, mnohorozměrné rozdělení

1 Rozptyl a kovariance

Náhodný vektor a jeho charakteristiky

Téma 22. Ondřej Nývlt

NÁHODNÝ VEKTOR. 4. cvičení

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Pravděpodobnost a aplikovaná statistika

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Vícerozměrná rozdělení

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

MATEMATICKÁ STATISTIKA - XP01MST

Příklady ke čtvrtému testu - Pravděpodobnost

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

NMAI059 Pravděpodobnost a statistika

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Zápočtová písemka z Matematiky III (BA04) skupina A

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Základy teorie pravděpodobnosti

NÁHODNÁ VELIČINA. 3. cvičení

I. D i s k r é t n í r o z d ě l e n í

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

p(x) = P (X = x), x R,

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Diskrétní náhodná veličina. November 12, 2008

Charakterizace rozdělení

PRAVDĚPODOBNOST A STATISTIKA

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Výběrové charakteristiky a jejich rozdělení

Cvičení ze statistiky - 5. Filip Děchtěrenko

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Kontingenční tabulky, korelační koeficienty

Matematika pro chemické inženýry

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pravděpodobnost a statistika

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Inovace bakalářského studijního oboru Aplikovaná chemie

1. Přednáška. Ing. Miroslav Šulai, MBA

Poznámky k předmětu Aplikovaná statistika, 5.téma

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Malé statistické repetitorium Verze s řešením

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Pravděpodobnost a statistika I KMA/K413

4EK211 Základy ekonometrie

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

1. Pravděpodobnost a statistika (MP leden 2010)

Chyby měření 210DPSM

8 Střední hodnota a rozptyl

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Náhodné vektory a matice

S1P Příklady 02. Náhodná proměnná (veličina) Mějme krabičku o rozměrech 1 x 2 x 3 cm. Na stranách jsou obrázky: :

má spojité parciální derivace druhého řádu ve všech bodech této množiny. Výpočtem postupně dostaneme: y = 9xy2 + 2,

7. Rozdělení pravděpodobnosti ve statistice

Kontingenční tabulky, korelační koeficienty

Matematika I A ukázkový test 1 pro 2011/2012. x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a

Praktická statistika. Petr Ponížil Eva Kutálková

Mnohorozměrná statistická data

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Příklad 1: Házíme dvěma kostkami. Stanovte pravděpodobnost jevu, že na kostkách padne součet menší než 5.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

8. Normální rozdělení

Mnohorozměrná statistická data

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

1 Pravděpodobnostní prostor

Aplikovaná numerická matematika

Náhodné (statistické) chyby přímých měření

Transkript:

Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické reakce a množství katalyzátoru; či počet dnů přípravy na zkoušku, výsledek zkoušky a hodinová dotace zkoušeného předmětu. Takové situace lze modelovat n rozměrným náhodným vektorem, což je uspořádaná n tice náhodných veličin (X,..., X n ). V následujícím výkladu se (pro jednoduchost) omezíme na dvourozměrný náhodný vektor (X, Y ). ozdělení pravděpodobnosti náhodného vektoru (X, Y ) je jednoznačně určeno sdruženou distribuční funkcí F (x, y) = P (X x, Y y), x, y, kde {X x, Y y} = {X x} {Y y} = {ω Ω; X(ω) x} {ω Ω; Y (ω) y}. Vlastnosti sdružené distribuční fuknce F (x, y) jsou obdobné jako vlastnosti distribuční funkce jedné náhodné veličiny: 0 F (x, y), F je neklesající a zprava spojitá v každé z proměnných x, y, lim x F (x, y) = lim y F (x, y) = 0 a lim x lim y F (x, y) =, lim x + F (x, y) = F Y (y) a lim y + F (x, y) = F X (x), kde F X (x) a F Y (y) jsou distribuční funkce náhodných veličin X a Y. Poznámka. ozdělení náhodných veličin X, Y nazýváme marginální rozdělení. (D) Necht diskrétní náhodný vektor (X, Y ) nabývá hodnot z množiny M = {(x i, y j ) ; i =,,..., j =,,...}. Pak jeho rozdělení lze popsat sdruženou pravděpodobnostní funkcí { p(xi, y p(x, y) = P (X = x, Y = y) = j ), (x, y) = (x i, y j ) M, 0, (x, y) / M. VLASTNOSTI SDUŽENÉ PAVDĚPODOBNOSTNÍ FUNKCE p(x i, y j ) 0, (x i, y j ) M, (x i,y j ) M p(x i, y j ) =, P (X x, Y y) = x i x,y j y,(x i,y j ) M p(x i, y j ).

Často je užitečné znát rozdělení jednotlivých složek náhodného vektoru, např. náhodnou veličinu popisující rychlost chemické reakce z úvodního příkladu. Máme-li sdruženou pravděpodobnostní funkci p náhodného vektoru (X, Y ), lze marginální pravděpodobnostní funkci p X (x i ) náhodné veličiny X určit jako p X (x i ) = P (X = x i ) = p Y (y j ) náhodné veličiny Y spočítat jako p Y (y j ) = P (Y = y j ) = y j ;(x i,y j ) M x i ;(x i,y j ) M p(x i, y j ), p(x i, y j ). Příklad. Náhodný vektor (M, CH) popisuje výsledky maturity z matematiky a chemie studentů přijatých na VŠCHT v Praze. ozdělení (M, CH) je zadáno sdruženou pravděpodobnostní funkcí p(i, j) = P (M = i, CH = j), i, j =,..., 4, v tabulce CH M 3 4 0, 38 0, 0, 05 0, 0 0, 08 0, 7 0, 03 0, 0 3 0, 0 0, 06 0, 03 0, 0 4 0 0, 0 0, 0 0, 0 (a) Určete marginální pravděpodobnostní funkce známek z maturity z matematiky a chemie. (b) Stanovte střední hodnotu a rozptyl M, CH a směrodatnou odchylku CH. (c) Zjistěte pravděpodobnost, že náhodně vybraný student VŠCHT maturoval z matematiky i chemie výborně, ani výborně, ani dostatečně. (S) ozdělení spojitého náhodného vektoru (X, Y ) lze popsat sdruženou hustotou pravděpodobnosti f(x, y), což je taková nezáporná funkce, že F (x, y) P (X x, Y y) = x y f(t, s)dt ds, (x, y). VLASTNOSTI SDUŽENÉ HUSTOTY PAVDĚPODOBNOSTI f(x, y) 0, (x, y), f(x, y)dx dy =, P ( X [a, b], Y [c, d] ) = b d f(x, y)dy dx. Tuto pravděpodobnost lze geometricky a c interpretovat jako objem tělesa pod grafem hustoty zúžené na množinu [a, b] [c, d]. Jako u diskrétního náhodného vektoru lze i v případě spojitého náhodného vektoru (X, Y ) definovat marginální rozdělení pravděpodobnosti

hustotu f X (x) náhodné veličiny X jako f X (x) = f(x, y)dy, x, hustotu f Y (y) náhodné veličiny Y jako f Y (y) = f(x, y)dx, y. Příklad. Náhodný vektor (X, Y ) má sdružené rozdělení dané hustotou { (3x + y), x [0, ], y [0, ], f(x, y) = 5 0, jinde. (a) Stanovte marginální hustoty náhodných veličin X, Y. (b) Určete střední hodnotu, rozptyl a směrodatnou odchylku náhodných veličin X, Y. (c) Spočítejte P ( X [0, 5; ], Y [, ] ). Nyní můžeme definovat nezávislost dvojice náhodných veličin. Definice. Náhodné veličiny X, Y jsou (vzájemně) nezávislé, jestliže (D) pro diskrétní náhodné veličiny platí (S) pro spojité náhodné veličiny platí (x i, y j ) M p(x i, y j ) = p X (x i )p Y (y j ), (x, y) f(x, y) = f X (x)f Y (y). Poznámka. (i) V případě nezávislosti se o sdruženém rozdělení náhodného vektoru (X, Y ) říká, že je součinové. (ii) Pojem nezávislosti dvojice diskrétních náhodných veličin lze vidět ve světle nezávislosti náhodných jevů následovně: P ( {X = x i } {Y = y j } ) = P (X = x i )P (Y = y j ), (x i, y j ) M. Příklad 3. Jsou výsledky maturity z matematiky a chemie z Příkladu nezávislé? Jsou náhodné veličiny X, Y z Příkladu nezávislé? Nejsou-li náhodné veličiny X, Y nezávislé, zkoumáme míru jejich závislosti. MÍY STATISTICKÉ LINEÁNÍ ZÁVISLOSTI NÁHODNÝCH VELIČIN (např. výsledky maturity z matematiky vs. chemie) Bud te X, Y náhodné veličiny s vlastnostmi EX < +, EY < +. Pak kovariance náhodných veličin X, Y je definována vztahem (speciálně cov(x, X) = varx), kde cov(x, Y ) := E(X EX)(Y EY ) = EXY EXEY, 3

pro diskrétní náhodné veličiny je cov(x, Y ) = (x i EX)(y j EY )p(x i, y j ) x i y j = x i y j p(x i, y j ) EXEY, x i y j pro spojité náhodné veličiny je cov(x, Y ) = = (x EX)(y EY )f(x, y)dxdy xyf(x, y)dxdy EXEY. Znormujeme-li vhodně kovarianci, dostaneme velmi užitečnou míru statistické lineární závislosti náhodných veličin X, Y, tzv. korelační koeficient ρ(x, Y ) := cov(x, Y ) varx vary za předpokladu, že 0 < varx < +, 0 < vary < +. VLASTNOSTI KOELAČNÍHO KOEFICIENTU ρ(x, Y ), ρ(x, X) =, ρ(x, Y ) = právě tehdy, když Y = kx + q, kde k > 0, q, ρ(x, Y ) = právě tehdy, když Y = kx + q, kde k < 0, q, X, Y nezávislé, pak ρ(x, Y ) = 0, ρ(x, Y ) = 0 (tedy i cov(x, Y ) = 0), pak náhodné veličiny X, Y nazýváme nekorelované (tzn. X, Y nejsou statisticky lineárně závislé) s rostoucí ρ(x, Y ) roste i statistická lineární závislost X, Y. Na závěr si uved me některé důležité pojmy související s dvourozměrným náhodným vektorem (X, Y ): střední hodnota E(X, Y ) = (EX, EY ), kovarianční (varianční) matice var(x, Y ) = což je obdoba rozptylu jedné náhodné veličiny, ( varx, cov(x, Y ) cov(x, Y ), vary ), Laskavý čtenář si může povšimnout, že pro normované náhodné veličiny X N = X EX varx a Y N = Y EY vary platí ρ(x N, Y N ) = cov(x N, Y N ). 4

korelační matice pro a, b, c platí corr(x, Y ) = (, ρ(x, Y ) ρ(x, Y ), ), E(aX + by + c) = aex + bey + c, var(ax + by + c) = a varx + b vary + ab cov(x, Y ). Druhý vztah v případě nezávislosti X, Y přejde na tvar var(ax + by + c) = a varx + b vary. Příklad 4. Určete kovarianci, korelaci, kovarianční a korelační matici náhodného vektoru (X, Y ) z Příkladu a. Cvičení k tomuto tématu (i) Mějme dvě náhodné veličiny X, Y, pro které platí EX =, varx = 36, EY = 4, vary = 5 a ρ(x, Y ) = 0, 8. Definujme náhodné veličiny Určete EZ, varz, EU. Z := X 3Y 3, U := XY. (ii) Mějme nezávislé náhodné veličiny X, Y s vlastnostmi EX =, varx = 6, EY = a vary = 4. Definujme náhodné veličiny U := X + 3, V := X 3Y +. Stanovte EU, varu, ρ(x, U), ρ(x, Y ), EV, varv. (dcv) Bud (X, Y ) náhodný vektor, jehož rozdělení je dané hustotou { 3 f(x, y) = xy, x [0, ], y [0, ], 0, jinde. Udělejte úkoly (a), (b) z Příkladu, vyšetřete nezávislost náhodných veličin X, Y, spočtěte kovarianci, korelaci, kovarianční a korelační matici náhodného vektoru (X, Y ) a dále určete P ( < X <, ) ( < Y <, P 0 < X <, 0 < Y < ). (dcv) ozdělení náhodného vektoru (X, Y ) je dáno sdruženou pravděpodobnostní funkcí p(x i, y j ) Y 0 8 X 0 4 8. Jsou náhodné veličiny X, Y nezávislé? Stanovte střední hodnotu náhodných veličin X, Y a dále určete var(x, Y ) a corr(x, Y ). 5