Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz
Úvod Předmětem této kapitoly bude zkoumání souvislosti (závislosti) mezi dvěma a více jevy (kauzální souvislosti). Kauzální (příčinnou) souvislostí mezi jevy se rozumí situace, kdy změny jednoho jevu (příčina) podmiňují změny druhého jevu. existence určitého jevu má za následek výskyt jiného jevu (párová závislost: X Y ) existence skupiny jevů má za následek výskyt jednoho jiného jevu (vícenásobná závislost: X 1, X 2,..., X p Y existence určitého jevu nebo skupiny jevů má za následek výskyt jiných jevů (X Y 1, Y 2..., Y r resp. X 1, X 2,..., X p Y 1, Y 2,..., Y r )
Úvod Z hlediska metod zkoumání kauzálních souvislostí je vhodné rozlišovat pevnou závislost (y = f (x), např. V = πr 2, I = U/R a pod.) volnou (stochastickou) (změna např. jednoho jevu vyvolá změnu druhého jevu s určitou pravděpodobností)
Úvod Při zkoumání závislosti např. mezi dvěma veličinami nás zajímá, jak se při změně hodnot jedné veličiny mění podmíněné pravděpodobnostní rozdělení druhé veličiny (jak se při změně hodnot jedné veličiny mění podmíněné střední hodnoty druhé veličiny např. prospěch v matematice a ve fyzice, tělesná váha a výška, výkon ve sprintu a skoku do dálky). Obvykle budeme značit X nezávislá (vysvětlující) proměnná Y závislá (vysvětlovaná) proměnná K poznání a matematickému popisu závislostí slouží metody regresní a korelační analýzy. Regresní analýza slouží především k nalezení popisu závislostí pomocí funkčního vztahu (např. regresní přímka), korelační analýza zkoumá intenzitu ( sílu ) vzájemného vztahu mezi zkoumanými proměnnými. Při řešení praktických úkolů dochází k prolínání těchto analýz.
Tabulkové vyjádření při malém počtu měření Příklad: Byla zjišťována výška (znak X ) otců a výška jejich nejstarších synů (znak Y ). x i 165 178 158 170 180 160 170 167 185 165 173 175 y i 162 184 163 170 189 165 177 170 187 176 171 183
Tabulkové vyjádření při velkém počtu měření sestrojíme tabulku hodnot kvantitativních znaků korelační tabulka 1. úplná korelační tabulka provedeme bodové nebo intervalové rozdělení četností hodnot znaku X a Y a dostaneme: x i jako varianty znaku X pro i = 1, 2,... k y j jako varianty znaku Y pro j = 1, 2,... s n ij sdružené četnosti, n celková četnost n i resp. n j marginální (okrajové) četnosti s k k s n i = n ij, n j = n ij, n i = n j = j=1 i=1 i=1 j=1 k i=1 j=1 s n ij = n
Příklad: U 42 zákrsků jabloní bylo zaznamenáno stáří stromu v letech (znak X ) a roční sklizeň (znak Y ). y j x i 4 5 6 7 8 9 10 n i 3 1 3 1 5 4 1 1 2 2 1 7 5 2 1 2 1 6 6 1 1 4 6 7 1 1 3 1 6 8 1 2 2 1 6 9 1 1 2 1 1 6 n j 2 5 4 9 8 7 7 42
2. neúplná korelační tabulka provedeme bodové nebo intervalové rozdělení četností hodnot znaku X (hodnoty y ij znaku Y necháme neroztříděné) a dostaneme: x i jako varianty znaku X pro i = 1, 2,..., k n i třídní četnost znaku X, n = k i=1 n i celková četnost
Příklad: U 42 zákrsků jabloní bylo zaznamenáno stáří stromu v letech (znak X ) a roční sklizeň (znak Y ). V tomto případě je u znaku X provedené bodové rozdělení četností, hodnoty znaku Y jsou netříděné. x i y j n i 3 4 7 5 5 5 5 4 9 5 7 6 8 7 8 7 5 9 8 9 10 7 7 6 6 10 8 10 10 10 9 6 7 9 7 8 9 10 9 6 8 8 7 7 8 6 10 6 9 5 4 6 7 6 8 6 42
Dvourozměrná tabulka kvalitativních znaků kontingenční tabulka Příklad: Při sociologickém průzkumu odpovídalo 100 náhodně vybraných osob na určitou otázku. Výsledky jsou v následující tabulce. Pohlaví Rozhodně Spíše Spíše Rozhodně Nevím ano ano ne ne Celkem Muž 2 20 10 15 8 55 Žena 4 15 15 8 3 45 Celkem 6 35 25 23 11 100
Grafické vyjádření bodový diagram zobrazení datových dvojic [x i, y j ] z jednoduché tabulky nebo [x i, y ij ] z korelační tabulky v rovině Obrázek: Bodový diagram
Grafické vyjádření trojrozměrný (prostorový) histogram zobrazení datových dvojic [x i, y j ] z úplné korelační tabulky v prostoru Obrázek: Graf dvourozměrného statistického souboru
Grafické vyjádření graf podmíněných průměrů zobrazení dvojic [x i, y i ] v rovině, vyjadřuje tendenci změn podmíněných průměrů závisle proměnné Y při změnách hodnot nezávisle proměnné X Obrázek: Graf podmíněných průměrů