5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě své sedmnáctileté dcery. James Truslow Adams
Co se dozvíte o Asociace, kovariance a korelace, míry závislosti. o Modelování statistické závislosti. o Regresní přímka, metoda nejmenších čtverců. o Vybrané nelineární závislosti. o Měření kvality modelu. 2
Asociace míra závislosti mezi četnostmi výskytu hodnot dvou kvalitativních znaků X a Y v kontingenční tabulce hypotetické (očekávané) sdružené četnosti e ij pro nezávislé hodnoty x i a y j platí: e ij = n ij expected míra (ne)závislosti kvalitativních znaků G r počet řádků (obměn znaku X) s počet sloupců (obměn znaku Y) 3
Míry asociace [: chí kvadrát :] G jako Pearsonova χ 2 míra asociace znaků X a Y G = 0 G = n.h znaky X a Y jsou nezávislé znaky X a Y jsou maximálně závislé h = min (r - 1 ; s - 1) Cramerův kontingenční koeficient V V = 0 V = 1 znaky jsou nezávislé znaky jsou maximálně závislé 4
Příklad Je politická orientace závislá na vzdělání? n ij orientace levice střed pravice Σ e ij orientace levice střed pravice Σ vzdělání ZŠ 5 5 2 12 SŠ 3 13 8 24 VŠ 1 10 3 14 vzdělání ZŠ 2,16 6,72 3,12 12 SŠ 4,32 13,44 6,24 24 VŠ 2,52 7,84 3,64 14 Σ 9 28 13 50 Σ 9 28 13 50 G ( 5 2,16) ( 5 6, 72) ( 3 3, 64) 2 2 2 = + +... + = 7,11 2,16 6, 72 3, 64 Cramerův koeficient: 7,11 V = G n h = 50 2 = 0,27 slabá závislost 5
Kovariance kovariance s xy vyjadřuje vzájemný vztah proměnných X a Y pro populaci bude ve jmenovateli n vyjadřuje intenzitu lineární závislosti mezi X a Y s xy > 0 přímá (pozitivní) závislost X Y s xy < 0 nepřímá (negativní) závislost X Y s xy = 0 lineárně nezávislé veličiny 6
Korelace korelační koeficient r xy relativní vyjádření vztahu mezi X a Y 1 r xy + 1 vyjadřuje intenzitu lineární závislosti mezi X a Y r xy > 0 r xy < 0 r xy = 0 r xy = ±1 převažuje rostoucí závislost mezi x a y převažuje klesající závislost mezi x a y znaky x a y jsou lineárně nezávislé znaky x a y jsou lineárně závislé 7
Příklad korelační tabulka Lze dosažené známky z mikro (Mi) a Makro (Ma) ekonomie považovat za nezávislé veličiny? Mi \ Ma 1 2 3 Σ 1 16 4 2 22 2 8 3 4 15 3 3 5 5 13 Σ 27 12 11 50 X známka z Mi Y známka z Ma střední hodnoty a rozptyly: 22 1+ 15 2 + 13 3 x = = 1,82 50 27 1+ 12 2 + 11 3 y = = 1,68 50 s x 2 2 2 2 2 22 1 + 15 2 + 13 3 50 1,82 = = 0,681 49 2 2 2 2 2 27 1 + 12 2 + 11 3 50 1,68 = = 0,671 49 s y 8
Příklad kovariance s xy 16 1 1+ 4 1 2 +... + 5 3 3 50 1,82 1,68 = = 49 0,268 korelační koeficient 0,268 r xy = = 0,681 0,671 0,396 Mezi oběma předměty je slabá pozitivní závislost. 9
Regresní funkce korelace a regrese korelace vzájemný (lineární) vztah proměnných regrese matematické vyjádření vztahu mezi proměnnými regresní model: X 1... X k? Y Y = f(x 1, X 2,, X k ) + e deterministická složka lze vypočítat náhodná složka 10
Přečtěte si Matematické pojmy poskytují hlubší pohled na ekonomické koncepce a dodávají jim přesnost a jasnost. Mnoho ekonomických jevů může být bráno jako matematické proměnné, např. příjmy, výnosy, náklady, ceny, zásoby, atd. V ekonomii se snažíme určit vztahy mezi těmito proměnnými. Takovým speciálním případem vyjádření vztahů mezi proměnnými je regresní funkce. Doc. RNDr. Ing. Petr Fiala, CSc., MBA. Úvod do kvantitativní ekonomie 11
Jednoduchá lineární regrese 60 55 50 45 40 Lineární regrese lineární regresní model y 35 30 25 20 15 8 13 18 23 28 33 x rovnice regresní přímky [ x ; y ] i i [ ; ] x y ) i i body náležící souboru znaků X, Y body ležící na regresní přímce 12
Metoda nejmenších čtverců y i y ) i e i reziduum x i metoda nejmenších čtverců minimalizuje rozptyl hodnot kolem regresní přímky ) SSE = e = y y i ( ) 2 2 i i i i min! SSE Sum of Squared Errors 13
Koeficienty lineární regrese rovnice regresní přímky: regresní koeficient b 1 směrnice regresní přímky mezní přírůstek závisle proměnné Y X = 1 Y = b 1 koeficient b 0 průsečík regresní přímky s osou y přímka prochází těžištěm [ x ; y ] 14
Kvalita regresního modelu determinační koeficient R 2 rozptyl teoretických hodnot rozptyl empirických hodnot 0 R 2 1 jakou část variability závislé proměnné Y lze vysvětlit vlivem nezávislé proměnné X pro lineární modely je determinační koeficient druhou mocninou koeficientu korelace 15
Sdružené regresní přímky odhad proměnné Y pro X = x i odhad proměnné X pro Y = y i Regresní nůžky 12000 11500 11000 10500 10000 9500 9000 8500 8000 250 300 350 400 450 500 1 16
Příklad závislost známek ze zkoušek mikro (X) a makro (Y): 0, 268 y = f(x) b 1 = = 0,39 b 0 = 1, 68 0,39 1,82 = 0,96 0,681 x 1 2 3 y 1,35 1,74 2,13 0,268 x = g(y) a 1 = = 0, 40 a 0 = 1,82 0, 40 1, 68 = 1,15 0,671 y 1 2 3 x 1,55 1,95 2,35 makro je lehčí než mikro 17
y Nelineární regresní modely parabolická (kvadratická) regrese Y 90 85 80 75 70 65 60 55 50 45 Kvadratická regrese y = -0,0825x 2 + 4,423x + 19,415 R 2 = 0,919 hyperbolická regrese 40 10 15 20 25 30 35 40 45 50 X Hyperbolická závislost 80 70 Y - počet kontaktů / týden 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 X - vzdálenost v m exponenciální regrese 80 70 Exponenciální regrese 60 50 40 y = 2,0758.1,072 x R 2 = 0,9424 30 20 10 0 20 25 30 35 40 45 50 55 x 18
Parabolická regrese regresní funkce: řešíme soustavu rovnic: KDY? proměnná Y se mění rychleji než lineárně proměnná Y mění průběh 19
Hyperbolická regrese regresní funkce: rovnice lineární v parametrech (substitucí lze převést na lineární) KDY? modelování nepřímé úměrnosti proměnná Y konvexně klesá 20
Exponenciální regrese regresní funkce: rovnice linearizovatelná transformací (logaritmováním lze převést na lineární) KDY? proměnná Y roste rychleji než kvadraticky 21
Příklad nelineární regrese Tabulka uvádí závislost mezi vzdáleností pracovníků na pracovišti v metrech a četností jejich pracovních styků za týden: vzdálenost 3 8 9 12 20 32 52 počet styků 25 18 10 9 7 5 3 30 25 20 15 10 graf napovídá: použijeme hyperbolickou regresi 5 0 0 10 20 30 40 50 60 22
Příklad výpočtem dostaneme: kvalita modelu determinační koeficient: vypočteme rozptyly: 2 s y = 61 2 s Y = 54 R 2 2 sy = = 0,886 = 88, 6% 2 s y kvalita modelu je poměrně vysoká 23
Proč matematické modely? matematický model je abstraktní reprezentace ekonomických vztahů v reálném světě matematika zavádí přesnost do definic a vztahů matematika je jazyk, který usnadňuje sdělování ekonomických koncepcí matematické modely můžeme zkoumat nezávisle na realitě HMOTNOST = -77 + 0,83 VÝŠKA -6,78 POHLAVÍ + 0,27 VĚK 24
Co Vás čeká příště Analýza časových řad o Časové řady a jejich rozklad. o Elementární analýza časové řady. o Analýza trendu, typy trendů časových řad. o Analýza sezónnosti, sezónní odchylky a indexy. o Prognózování budoucího vývoje. 25