Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Podobné dokumenty
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

You created this PDF from an application that is not licensed to print to novapdf printer (

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

12. cvičení z PST. 20. prosince 2017

Téma 22. Ondřej Nývlt

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Regresní a korelační analýza

PRAVDĚPODOBNOST A STATISTIKA

NÁHODNÝ VEKTOR. 4. cvičení

= = 2368

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Testování hypotéz. 4. přednáška

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

INDUKTIVNÍ STATISTIKA

Poznámky k předmětu Aplikovaná statistika, 4. téma

Regresní analýza 1. Regresní analýza

Statistická analýza jednorozměrných dat

1 Rozptyl a kovariance

Poznámky k předmětu Aplikovaná statistika, 4. téma

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Kontingenční tabulky, korelační koeficienty

Malé statistické repetitorium Verze s řešením

Normální (Gaussovo) rozdělení

Regresní a korelační analýza

Vícerozměrná rozdělení

KGG/STG Statistika pro geografy

Kontingenční tabulky, korelační koeficienty

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

You created this PDF from an application that is not licensed to print to novapdf printer (

Kanonická korelační analýza

Náhodný vektor a jeho charakteristiky

Regresní a korelační analýza

1. Přednáška. Ing. Miroslav Šulai, MBA

Statistika II. Jiří Neubauer

4EK211 Základy ekonometrie

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

4ST201 STATISTIKA CVIČENÍ Č. 7

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Tomáš Karel LS 2012/2013

6. T e s t o v á n í h y p o t é z

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

12. prosince n pro n = n = 30 = S X

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pearsonův korelační koeficient

Korelační a regresní analýza

Pravděpodobnost a aplikovaná statistika

Testování statistických hypotéz

Příklady ke čtvrtému testu - Pravděpodobnost

Tomáš Karel LS 2012/2013

Cvičení ze statistiky - 9. Filip Děchtěrenko

Jana Vránová, 3. lékařská fakulta UK

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

7. Analýza rozptylu.

Jednofaktorová analýza rozptylu

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

10. N á h o d n ý v e k t o r

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Stavový model a Kalmanův filtr

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

I. D i s k r é t n í r o z d ě l e n í

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

Mnohorozměrná statistická data

p(x) = P (X = x), x R,

Zápočtová práce STATISTIKA I

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Regresní a korelační analýza

Příklady na testy hypotéz o parametrech normálního rozdělení

5. T e s t o v á n í h y p o t é z

Náhodné vektory a matice

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Neparametrické metody

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

0.1 Úvod do lineární algebry

ANALYTICKÁ GEOMETRIE V ROVINĚ

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

15. T e s t o v á n í h y p o t é z

Regresní a korelační analýza

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Univerzita Pardubice. Fakulta ekonomicko-správní

Transkript:

1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost, síla) jejich vzájemného ovlivňování. V praxi neznáme společné rozdělení pravděpodobností těchto znaků pro zkoumání těsnosti musíme využít metody matematické statistiky korelační analýzy. 1.1. Teoretické základy korelační analýzy Předpokládejme, že máme dvě náhodné veličiny X; Y, které mají nekonečné a nenulové rozptyly DX; DY. Pokud jsou X; Y závislé, musíme závislost číselně vyjádřit. K vyjádření míry závislosti se u lineárního typu závislosti používá korelační koeficient. Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. Náhodné veličiny X; Y jsou korelované, existuje mezi nimi korelační vztah. 1

Kovariance Uvažujeme případ, kdy: X = (X 1 ; X 2 ; ; X m ) Y = (Y 1 ; Y 2 ; ; Y m ) EX = (EX 1 ; EX 2 ; ; EX m ) je m-rozměrný náhodný vektor s vektorem středních hodnot a EY = (EY 1 ; EY 2 ; ; EY m ) s konečnými nenulovými rozptyly jednotlivých složek. Kovariance náhodných veličin X a Y vyjadřuje vzájemný vztah mezi těmito veličinami a je dána výrazem: cov (X;Y) = E [(X-EX) (Y-EY)] = EXY EXEY Náhodný vektor může být i více než dvojrozměrný. Proto musíme vyjádřit vztah mezi každou dvojicí X i a X j náhodných. Kovariance všech dvojic pak zapisujeme do matice. Kovariance Kovariance je střední hodnota součinu odchylek obou náhodných veličin X, Y od jejich středních hodnot. Máme-li dvourozměrný náhodný vektor, jehož složkami jsou náhodné veličiny X, Y, pak vztah mezi těmito veličinami lze vyjádřit pomocí kovariance C(X,Y), která je definována jako 2

2. Výběrový koeficient korelace Nechť je dán dvojrozměrný náhodný výběr [(X 1 ; Y 1 ); (X 2 ; Y 2 ); ; (X n ; Y n );]. Výběrový koeficient korelace r X; Y náhodných veličin X a Y definujeme jako podíl: Čitatel: výběrová kovariance. Jmenovatel: součin výběrových směrodatných odchylek. Pro praktické výpočty je výhodnější výpočtový tvar tohoto vztahu: Vlastnosti výběrového koeficientu korelace 1. 2. 3. 4. pro ac 5. pro ac 3

4

3. Test významnosti pro koeficient korelace Zjišťujeme, zda mezi dvěma náhodnými veličinami X; Y je korelační vztah. Pokud jsou korelované, je tam vztah.!!!!!! Veličiny jsou nekorelované veličiny jsou nezávislé!!!!!! Proto testujeme hypotézu: H 0 : q=0 (mezi náhodnými veličinami není korelační vztah) proti H 1 : q 0 (je korelační vztah) Předpoklady: Nechť je dán dvojrozměrný náhodný výběr (X 1 ; Y 1 ); (X 2 ; Y 2 ); ; (X n ; Y n ) ze základního souboru (X; Y), Základní soubor má dvojrozměrné normální rozložení pravděpodobností N(. Nechť r je výběrový koeficient korelace. ( 5

Testujeme hypotézu, že koeficient korelace základního souboru je roven nule: H 0 : q=0 proti H 1 : q 0 (není korelační vztah) (je korelační vztah) Testovací kritérium: Za předpokladu platnosti hypotézy má náhodná veličina T Studentovo rozdělení pravděpodobností s n 2 stupni volnosti. Kritická oblast: 6

Příklad: V následující tabulce jsou uvedeny hodnoty dvojrozměrného náhodného výběru. Na úrovni významnosti zjistěte, zda mezi náhodnými veličinami X a Y existuje korelační vztah. Předpokládejme normální rozložení pravděpodobností základního souboru (X; Y). xi 94 98 127 88 85 95 111 75 102 82 yi 2,1 1,9 3,5 1,5 3,2 1,6 1,9 2,5 2,6 1,9 7

Řešení: Testujeme hypotézu: H 0 : q=0 proti H 1 : q 0 i xi yi xi 2 xi * yi yi 2 1 94 2,1 8836 197,4 4,41 2 98 1,9 9604 186,2 3,61 3 127 3,5 16129 444,5 12,25 4 88 1,5 7744 132 2,25 5 85 3,2 7225 272 10,24 6 95 1,6 9025 152 2,56 7 111 1,9 12321 210,9 3,61 8 75 2,5 5625 187,5 6,25 9 102 2,6 10404 265,2 6,76 10 82 1,9 6724 155,8 3,61 součty 957 22,7 93637 2203,5 55,55 průměr 95,7 2,27 Testovací kritérium: Dopočítáme hodnotu výběrového koeficientu korelace ve výpočtovém tvaru: Kritická oblast Kritická hranice (tabulky Studentova t-rozdělení pravděpodobností pro n 2 st. vol.). Hodnota TK padla do OPH. H 0 nezamítáme. Mezi náhodnými veličinami není korelační vztah. 8

4. Spearmanův korelační koeficient Tento test používáme, když při hodnocení těsnosti vztahu náhodných veličin nelze použít obyčejný korelační koeficient: nejsou splněny předpoklady normality rozložení pravděpodobností základního souboru, nebo když v náhodném výběru nemůžeme hodnoty náhodných veličin přesně zjistit a máme k dispozici jen jejich pořadí veličin X 1 ; X 2 ; ; X n a Y 1 ; Y 2 ; ; Y n. Jsou-li tato pořadí podobná, svědčí to o vztahu veličin X i a Y i. Postup testu: 1. seřadíme prvky náhodného výběru X 1 ; X 2 ; ; X n do neklesající posloupnosti a zjistíme jejich pořadí R 1 ; R 2 ; ; R n 2. seřadíme prvky náhodného výběru Y 1 ; Y 2 ; ; Y n do neklesající posloupnosti a zjistíme jejich pořadí Q 1 ; Q 2 ; ; Q n Testovací kritérium (r s ): Kritická oblast: W = r s : r s r 9

Příklad: Zjistěte, zda existuje korelace mezi výkonností hokejistů NHL, vyjádřenou umístěním hokejistů v kanadském bodování po skončení základní části a jejich příjmem. Údaje jsou uvedeny v tabulce. Testujte na hladině významnosti 0,05. x i (pořadí) 1 2 3 4 5 6 7 8 y i (příjem) 3,75 2,5 1,9 3,3 2,15 2,0 3,0 2,85 10

Řešení: Qi 1 2 3 4 5 6 7 8 x Ri 8 4 1 7 3 2 6 5 x (Qi Ri) 2 49 4 4 9 4 16 1 9 96 Testovací kritérium Kritická hranice z tabulek (r ) r = r 0,05 = 0,6905 Vzorec kritické oblasti W = r s : r s r 0,143 0,6905 Hodnota testovacího kritéria padla do OPH. Nulovou hypotézu nezamítáme. Můžeme tedy tvrdit, že není korelační závislost mezi výkonností hráčů NHL a jejich příjmem. 11

5. Korelace u více náhodných veličin Korelační matice Nechť (X 1 ; X 2 ; ; Xn) je náhodný výběr z m-rozměrného základního souboru X = (X 1 ; X 2 ; ; Xm). Výběrovou korelační maticí budeme nazývat matici Diagonální prvky této matice jsou vždy rovny jedné, nediagonální prvky jsou výběrové korelační koeficienty odpovídajících složek. Matice je čtvercová a symetrická. 12

Příklad: U 7 studentů ekonomické školy byly zaznamenány výsledky zkoušek z předmětů matematická ekonomie, mikroekonomie, bankovnictví a finance. Vyjádřete vztah, který je mezi předměty. Student Jana Eva Petr Jan Martin Iva Lucie MME 1 4 2 1 2 4 1 MI 1 1 3 2 2 3 1 BA 2 1 4 3 2 2 2 FI 3 2 1 2 2 2 1 Řešení: Počítáme korelace mezi (X 1 ; X 2 ; X 3 ; X 4 ). Testujeme každý korelační koeficient, abychom mohli říci, zda je významný. Předmět MME MI BA FI MME 1 MI +0,295 1 BA -0,428 +0,61 1 FI +0,026-0,31-0,40 1 13