letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Podobné dokumenty
Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma

NÁHODNÝ VEKTOR. 4. cvičení

Náhodný vektor a jeho charakteristiky

Pravděpodobnost a aplikovaná statistika

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Statistika II. Jiří Neubauer

10. N á h o d n ý v e k t o r

1 Rozptyl a kovariance

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Téma 22. Ondřej Nývlt

NMAI059 Pravděpodobnost a statistika

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Vícerozměrná rozdělení

Pravděpodobnost a statistika

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Lineární algebra : Lineární (ne)závislost

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

MATEMATICKÁ STATISTIKA - XP01MST

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Základy matematiky pro FEK

I. D i s k r é t n í r o z d ě l e n í

Statistická analýza jednorozměrných dat

10. Vektorové podprostory

p(x) = P (X = x), x R,

Cvičení ze statistiky - 5. Filip Děchtěrenko

Pravděpodobnost a statistika I KMA/K413

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

3. Podmíněná pravděpodobnost a Bayesův vzorec

Kapitola 11: Vektory a matice:

Charakterizace rozdělení

Lineární algebra : Báze a dimenze

Vybrané kapitoly z matematiky

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

Malé statistické repetitorium Verze s řešením

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

DEFINICE Z LINEÁRNÍ ALGEBRY

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

1 Řešení soustav lineárních rovnic

Lineární algebra Operace s vektory a maticemi

Matematika B101MA1, B101MA2

Matematika. Kamila Hasilová. Matematika 1/34

Výběrové charakteristiky a jejich rozdělení

Základy matematiky pro FEK

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Náhodné vektory a matice

1. Přednáška. Ing. Miroslav Šulai, MBA

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

P 1 = P 1 1 = P 1, P 1 2 =

ANALYTICKÁ GEOMETRIE V ROVINĚ

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Základní pojmy teorie množin Vektorové prostory

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

1 Soustavy lineárních rovnic

7.2.1 Vektory. Předpoklady: 7104

1 Vektorové prostory.

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

0.1 Úvod do lineární algebry

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Lineární algebra : Lineární prostor

1. Pravděpodobnost a statistika (MP leden 2010)

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

KGG/STG Statistika pro geografy

0.1 Úvod do lineární algebry

Normální rozložení a odvozená rozložení

Kontingenční tabulky, korelační koeficienty

Úvodní informace. 17. února 2018

Příklady ke čtvrtému testu - Pravděpodobnost

Jana Vránová, 3. lékařská fakulta UK

Soustavy lineárních rovnic a determinanty

METRICKÉ A NORMOVANÉ PROSTORY

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Cvičení ze statistiky - 3. Filip Děchtěrenko

VEKTORY. Obrázek 1: Jediný vektor. Souřadnice vektoru jsou jeho průměty do souřadných os x a y u dvojrozměrného vektoru, AB = B A

1. Matice a maticové operace. 1. Matice a maticové operace p. 1/35

Transkript:

Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 202 Založeno na materiálech doc. Michala Kulicha

Náhodný vektor často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich chování společně příklad: vztah hmotnosti, tlaku a koncentrace určité látky v krvi u člověka apod. Definice Uspořádanou n-tici X náhodných veličin X,X 2,...,X n nazýváme náhodný vektor.

Náhodný vektor Náhodný vektor budeme značit velkým tlustým písmenem (např. X) anebo výčtem jeho složek, tj. X X =. X n nebo X = (X,...,X n ) T Většinou se omezíme na náhodné délky 2, tj. budeme uvažovat X = ( X X 2 ) anebo X = ( XY ).

Náhodný vektor: příklad Příklad (Děti) Uvažovali jsme rodinu, která má tři děti, a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y, která říká, kolik má nejmladší sourozenec starších bratrů. zajímá nás rozdělení náhodného vektoru X = ( X Y ) odtud lze počítat tzv. sdružené pravděpodobnosti typu P(X = 0,Y = ), P(X 2,Y = 0) apod. jaký je vztah mezi X a Y? souvisí hodnoty X s hodnotami Y?

Další příklady Příklady náhodných vektorů: výška a hmotnost náhodně vybraného člověka teplota, množství srážek a síla větru ve vybraný den HDP, míra inflace,...(jiné ekonomické ukazatele) náhodně vybrané evropské země pohlaví a plat náhodně vybraného člověka vzdělání a politický názor náhodně vybraného člověka porodní hmotnost dítěte a věk jeho matky...

Rozdělení náhodného vektoru Rozdělení náhodného vektoru X = ( X Y ) rozlišujeme náhodný vektor se spojitým a diskrétním rozdělením spojité rozdělení popíšeme hustotou je ted funkcí R 2 [0, ) hodnota f X (x,y) udává, jak často náhodný vektor padá kolem bodu (x,y) má vlastnosti analogické hustotě náhodné veličiny diskrétní rozdělení popíšeme tzv. sdruženými pravděpodobnostmi P(X = x i,y = y k ) pro všechna možná x i a y k

f Hustota náhodného vektoru Příklad hustoty spojitého dvourozměrného rozdělení: 0.20 0.5 0.0 0.05 0.00 3 2 0 y 3 2 0 x 2 2 3 3

Hustota náhodného vektoru Obrázek: Hustota z předchozího obrázku nakreslená pomocí vrstevnic. 3 2 0 2 3 3 2 0 2 3

Sdružené a marginální rozdělení Rozdělení náhodného vektoru X = ( X Y ) obsahuje něco navíc, než kdybychom znali jen rozdělení samotné náhodné veličiny X a samotné náhodné veličiny Y. To, co je tam navíc, je informace o vzájemném vztahu obou veličin. Terminologie Rozdělení náhodného vektoru X = ( X Y ) nazýváme sdružené rozdělení náhodných veličin X a Y. Rozdělení samotného X a samotného Y nazýváme marginální rozdělení náhodných veličin X a Y.

Sdružené a marginální rozdělení Interpretace: sdružené rozdělení nám říká, jak se chová (X,Y) společně (jakožto dvojice) marginální rozdělení popisuje chování jedné veličiny bez ohledu na hodnoty druhé Vztah sdruženého a marginálního rozdělení: ze sdruženého rozdělení lze vždy určit marginální opačně to obecně není možné, tj. z marginálního nelze jednoznačně určit rozdělení sdružené (k dané dvojici marginálních rozdělení dokonce existuje nekonečně mnoho odpovídajících sdružených rozdělení)

Diskrétní náhodný vektor: příklad Příklad (Děti viz dříve) Uvažovali jsme rodinu, která má tři děti a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y, která říká, kolik má nejmladší sourozenec starších bratrů. Dostali jsme diskrétní náhodný vektor X = ( X Y ) : ω X(ω) Y(ω) SSS 0 2 SSD 2 SDS DSS DDS 2 0 DSD 2 SDD 2 DDD 3 0

Příklad děti Již dříve jsme zkoumali rozdělení X a Y zvlášt, tj. marginální rozdělení: x 0 2 3 P(X = x) 3 3 y 0 2 P(Y = y) 4 Rozdělení X = ( X Y ) je dáno pravděpodobnostmi p ij = P[X = x i,y = y j ], které jsou v následující tabulce: 2 4 X\Y 0 2 0 0 0 0 2 4 4 0 3 0 0 Jak lze ze sdruženého rozdělení spočítat marginální?

Příklad děti Sdružené rozdělení: X\Y 0 2 0 0 0 0 2 3 4 4 0 0 0

Příklad děti Sdružené rozdělení: Odtud X\Y 0 2 0 0 0 0 2 3 4 4 0 0 0 P[X = 0] = P[X = 0,Y = 0]+P[X = 0,Y = ]+ +P[X = 0,Y = 2] = 0+0+ = P[X = ] = P[X =,Y = 0]+P[X =,Y = ]+ +P[X =,Y = 2] = 0+ 4 + = 3 a analogicky P(X = 2) = 3/ a P(X = 3) = /.

Sdružené a marginální rozdělení Věta Necht X = ( X Y ) je diskrétní náhodný vektor s rozdělením určeným pravděpodobnostmi p ij = P[X = x i,y = y j ]. Marginální rozdělení veličin X a Y pak jsou P[X = x i ] = P[Y = y j ] = j= i= ] P [X = x i,y = y j = ] P [X = x i,y = y j = p ij, j= p ij. i=

Sdružené a marginální rozdělení Pro spojité rozdělení platí analogie předchozího tvrzení: Věta Necht X = ( ) X Y je náhodný vektor se spojitým rozdělením se sdruženou hustotou f X (x,y). Marginální hustoty veličin X a Y pak jsou f X (x) = f Y (y) = f X (x,y)dy, f X (x,y)dx.

náhodných veličin Příklad v praxi nás často zajímá, zda je mezi veličinami X a Y nějaký vztah spec. se můžeme ptát, zda jsou nezávislé hodnoty jedné veličiny nezávisí na hodnotách druhé Necht X je známka z Matematické statistiky a Y je počet navštívených přednášek náhodně vybraného studenta. Jsou tyto dvě veličiny nezávislé? nezávislost známka nezávisí na počtu navštívených přednášek P(X = i Y = j) nezávisí na hodnotách j, tj. P(X = i Y = j) = P(X = i) už víme, že toto odpovídá podmínce P(X = i,y = j) = P(X = i,y = j) pro všechna i,j

náhodných veličin Definice veličiny X a Y nazveme nezávislé, pokud pro každé dvě množiny A,B R platí P[X A,Y B] = P[X A] P[Y B]. Nezávislé veličiny: P[X A Y B] = P[X A] tj. hodnoty jedné náhodné veličiny nejsou ovlivněny hodnotami druhé. ze znalosti hodnoty jedné veličiny nic nevíme o druhé veličině

Charakterizace nezávislosti Věta Diskrétní náhodné veličiny X a Y jsou nezávislé, právě když platí P[X = x i,y = y j ] = P[X = x i ] P[Y = y j ] pro každé x i,y j, kterých X a Y nabývají. 2 Spojité náhodné veličiny X a Y jsou nezávislé, právě když platí f X (x,y) = f X (x) f Y (y) pro každé x,y R.

Příklad děti Sdružené rozdělení: X\Y 0 2 0 0 0 0 2 3 4 4 0 0 0 Veličiny X a Y nejsou nezávislé. Zdůvodnění: např. P[X = 3,Y = 2] = 0 a P[X = 3] =, P[Y = 2] = 3. Takže 0 = P[X = 3,Y = 2] P[X = 3] P[Y = 2] = 3 64. Tudíž počet dcer a počet starších bratrů nejmladšího sourozence jsou závislé veličiny.

poznámka definici nezávislosti lze snadno rozšířit na více než dvě náhodné veličiny platí obdobné charakterizace nezávislosti (sdružená hustota je součinem marginálních hustot apod.)

Střední hodnota součtu a součinu Věta Necht X = ( ) X Y, kde X, Y jsou libovolné náhodné veličiny. Platí E(X +Y) = EX +EY. 2 Pokud jsou X a Y nezávislé, pak platí EXY = (EX)(EY). střední hodnota součtu dvou (nebo více) náhodných veličin je rovna součtu jejich středních hodnot pro nezávislé náhodné veličiny je střední hodnota jejich součinu je rovna součinu jejich středních hodnot pro závislé veličiny tomu tak může, ale nemusí být

Kovariance Definice Jsou-li veličiny X a Y závislé budeme chtít popsat jejich závislost Uvažujme náhodný vektor X = ( X Y ). Kovariancí náhodných veličin X a Y rozumíme hodnotu cov(x,y) = E[(X EX)(Y EY)] kovariance vyjadřuje vzájemný vztah X a Y evidentně platí cov(x,y) = cov(y,x) a cov(x,x) = varx.

Vlastnosti kovariance Věta Kovariance může nabývat jakýchkoli reálných hodnot, ale pro dvě konkrétní veličiny musí platit cov 2 (X,Y) varx vary. 2 Platí cov(x,y) = EXY EX EY. 3 Pokud jsou X a Y nezávislé, pak cov(x,y) = 0. pozor, tvrzení 3 neplatí opačně (tj. z nulové kovariance nelze obecně nic usuzovat o nezávislosti) 3 plyne z 2, nebot pro nezávislé veličiny EXY = EXEY.

Interpretace kovariance cov(x,y) > 0 náhodné veličiny X a Y jsou závislé v pozitivním smyslu vyšší hodnoty X jsou svázány s vyššími hodnotami Y (a nižší hodnoty X s nižšími hodnotami Y) příklad: výška a váha člověka. cov(x,y) < 0 náhodné veličiny X a Y jsou závislé v negativním smyslu vyšší hodnoty X jsou svázány s nižšími hodnotami Y (a nižší hodnoty X s vyššími hodnotami Y) příklad: hloubka dezénu pneumatiky a brzdná dráha cov(x,y) = 0 neznamená, že by mezi X a Y nebyl nutně žádný vztah (ještě se o tom zmíníme později)

Kovariance: příklad Příklad (Děti) Uvažovali jsme rodinu, která má tři děti, a zavedli náhodnou veličinu X, která určuje počet dcer, a náhodnou veličinu Y, která říká, kolik má nejmladší sourozenec starších bratrů. Dostali jsme náhodný vektor X = ( X Y ) s rozdělením X\Y 0 2 0 0 0 0 2 3 4 4 0 0 0 Spočítáme kovarianci náhodných veličin X a Y. K výpočtu použijeme vzorec cov(x,y) = EXY EXEY.

Příklad: Děti Víme: X nabývá hodnot 0,,2,3 s pstmi po řadě, 3, 3,, Y nabývá hodnot 0,,2 s pstmi po řadě 4, 2, 4. Z marginálních rozdělení máme EX = 0 + 3 +2 3 +3 = 3+6+3 =.5, EY = 0 4 + 2 +2 4 = 2+2 =. 4 Ze sdruženého rozdělení EXY = 0 P[X = 0 Y = 0]+ P[X =,Y = ]+ +2 (P[X =,Y = 2]+P[X = 2,Y = ]) = = 4 +2 3 = 4 + 3 4 =.

Příklad: Děti Odtud cov(x,y) = EXY (EX)(EY) =.5 = 0.5 Takže cov(x,y) = 0.5 < 0 tj. počet dcer a počet starších bratrů nejmladšího sourozence nejsou nezávislé. Čím více je dcer, tím méně je starších bratrů.

Korelace Definice hodnoty kovariance se špatně interpretují z hodnoty cov(x,y) 0 poznáme, že X a Y jsou závislé a jakým směrem, ale nepoznáme, jak silně jsou závislé Uvažujme náhodný vektor X = ( X Y ). Korelací náhodných veličin X a Y rozumíme hodnotu cor(x,y) = cov(x,y) varxvary. se někdy značí (X,Y) nebo ρ XY někdy mluvíme o korelačním koeficientu.

Vlastnosti Věta Korelace ρ XY vždy leží mezi a a ρ XY = 0 cov(x,y) = 0. 2 Pokud jsou X a Y nezávislé, pak cor(x,y) = 0. 3 Platí ρ XY = ρ XY = právě když Y = a+bx pro nějaké a R a b > 0. právě když Y = a+bx pro nějaké a R a b < 0.

Interpretace měří sílu lineární závislosti mezi X a Y znaménko udává směr závislosti jsou-li X a Y silně lineárně závislé (tj. hodnoty této dvojice padají nejčastěji někde kolem přímky v R 2 s nenulovou směrnicí), pak je bĺızko nebo. nezávislé veličiny mají vždy nulovou korelaci je-li nulová, neznamená to, že X a Y jsou nutně nezávislé ( je mírou pouze lineární závislosti)

Interpretace ρ = 0.2 ρ = 0.5 Y 2 0 2 2 0 2 Y 2 0 2 2 0 2 X Y ρ = 0.9 ρ = 0.7 Y 2 0 2 Y 2 0 2 2 0 2 2 0 2 Y Y

Interpretace Je-li nulová, neznamená to, že X a Y jsou nutně nezávislé: Y = X 2 0.0 0.2 0.4 0.6 0..0 0.5 0.0 0.5.0 X Příklad Má-li X rozdělení symetrické kolem 0, pak EX = 0 a EX 3 = 0. Vezmeme-li Y = X 2, pak Y a X nejsou nezávislé a zároveň cov(x,y) = 0 a tudíž i ρ XY = 0.

Hustota dvourozměrného rozdělení s různými mi Obrázek: Hustota dvourozměrného rozdělení, cor(x,y) = 0. 4 2 0 2 4 3 2 0 2 3 0.0 0.06 0.04 0.02 0.00

Hustota dvourozměrného rozdělení s různými mi Obrázek: Hustota dvourozměrného rozdělení, cor(x, Y) = 0.3. 4 2 0 2 4 3 2 0 2 3 0.0 0.0 0.06 0.04 0.02 0.00

Hustota dvourozměrného rozdělení s různými mi Obrázek: Hustota dvourozměrného rozdělení, cor(x, Y) = 0.6. 4 2 0.0 0.0 0 0.06 2 0.04 4 3 2 0 2 3 0.02 0.00

Hustota dvourozměrného rozdělení s různými mi Obrázek: Hustota dvourozměrného rozdělení, cor(x, Y) = 0.95. 4 2 0.30 0.25 0.20 0 2 0.5 0.0 0.05 4 0.00 3 2 0 2 3

Vlastnosti střední hodnoty a rozptylu Necht X,Y jsou náhodné veličiny, a,b R. Pak E(a+bX) = a+bex, 2 E(X +Y) = EX +EY, 3 var(a+bx) = b 2 varx, 4 var(x +Y) = varx +vary +2cov(X,Y) 5 pro nezávislé veličiny var(x +Y) = varx +vary

Vlastnosti kovariance Důkaz bodu 4: Máme var(x +Y) = E(X +Y) 2 [E(X +Y)] 2 = = E(X 2 +2XY +Y 2 ) [(EX) 2 +2EXEY +(EY) 2 ] = = EX 2 (EX) 2 +EY 2 (EY) 2 + +2[EXY EXEY] = = varx +vary +2cov(X,Y).