Měření závislosti statistických dat



Podobné dokumenty
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

INDUKTIVNÍ STATISTIKA

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty

Statistická analýza jednorozměrných dat

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Analýza časových řad. John Watters: Jak se stát milionářem.

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Třídění statistických dat

Regresní analýza 1. Regresní analýza

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Regresní a korelační analýza

=10 =80 - =

6. Lineární regresní modely

odpovídá jedna a jen jedna hodnota jiných

You created this PDF from an application that is not licensed to print to novapdf printer (

Statistika (KMI/PSTAT)

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

LINEÁRNÍ REGRESE. Lineární regresní model

Regresní a korelační analýza

Požadavky k opravným zkouškám z matematiky školní rok

KGG/STG Statistika pro geografy

Regresní a korelační analýza

Regresní a korelační analýza

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Cvičení ze statistiky - 3. Filip Děchtěrenko

Tomáš Karel LS 2012/2013

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

4. Aplikace matematiky v ekonomii

Regresní a korelační analýza

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Poznámky pro žáky s poruchami učení z matematiky 2. ročník 2005/2006 str. 1. Funkce pro UO 1

AVDAT Nelineární regresní model

Inovace bakalářského studijního oboru Aplikovaná chemie

Úvodem Dříve les než stromy 3 Operace s maticemi

Požadavky k opravným zkouškám z matematiky školní rok

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika

Funkce - pro třídu 1EB

VY_32_INOVACE_M-Ar 8.,9.20 Lineární funkce graf, definiční obor a obor hodnot funkce

Funkce a lineární funkce pro studijní obory

Aplikovaná statistika v R - cvičení 3

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

STATISTIKA I Metodický list č. 1 Název tématického celku:

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

NÁHODNÝ VEKTOR. 4. cvičení

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Funkce jedné reálné proměnné. lineární kvadratická racionální exponenciální logaritmická s absolutní hodnotou

Přednáška č.7 Ing. Sylvie Riederová

PRAVDĚPODOBNOST A STATISTIKA

6. F U N K C E 6.1 F U N K C E. Sbírka úloh z matematiky pro SOU a SOŠ RNDr. Milada Hudcová, Mgr. Libuše Kubičíková 181/1 190/24 25

UNIVERZITA PARDUBICE

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Požadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

Korelační a regresní analýza

Funkce. Úkol: Uveďte příklady závislosti dvou veličin.

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

4EK201 Matematické modelování. 11. Ekonometrie

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Obecná rovnice kvadratické funkce : y = ax 2 + bx + c Pokud není uvedeno jinak, tak definičním oborem řešených funkcí je množina reálných čísel.

Matematika PRŮŘEZOVÁ TÉMATA

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Stavový model a Kalmanův filtr

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Pravděpodobnost a aplikovaná statistika

Aplikovaná matematika I

Poznámky k předmětu Aplikovaná statistika, 4. téma

Funkce pro studijní obory

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

KFC/SEM, KFC/SEMA Elementární funkce

Manažerská ekonomika KM IT

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Poznámky k předmětu Aplikovaná statistika, 4. téma

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií

Analýza dat na PC I.

4.1 Metoda horizontální a vertikální finanční analýzy

Transkript:

5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě své sedmnáctileté dcery. James Truslow Adams

Co se dozvíte o Asociace, kovariance a korelace, míry závislosti. o Modelování statistické závislosti. o Regresní přímka, metoda nejmenších čtverců. o Vybrané nelineární závislosti. o Měření kvality modelu. 2

Asociace míra závislosti mezi četnostmi výskytu hodnot dvou kvalitativních znaků X a Y v kontingenční tabulce hypotetické (očekávané) sdružené četnosti e ij pro nezávislé hodnoty x i a y j platí: e ij = n ij expected míra (ne)závislosti kvalitativních znaků G r počet řádků (obměn znaku X) s počet sloupců (obměn znaku Y) 3

Míry asociace [: chí kvadrát :] G jako Pearsonova χ 2 míra asociace znaků X a Y G = 0 G = n.h znaky X a Y jsou nezávislé znaky X a Y jsou maximálně závislé h = min (r - 1 ; s - 1) Cramerův kontingenční koeficient V V = 0 V = 1 znaky jsou nezávislé znaky jsou maximálně závislé 4

Příklad Je politická orientace závislá na vzdělání? n ij orientace levice střed pravice Σ e ij orientace levice střed pravice Σ vzdělání ZŠ 5 5 2 12 SŠ 3 13 8 24 VŠ 1 10 3 14 vzdělání ZŠ 2,16 6,72 3,12 12 SŠ 4,32 13,44 6,24 24 VŠ 2,52 7,84 3,64 14 Σ 9 28 13 50 Σ 9 28 13 50 G ( 5 2,16) ( 5 6, 72) ( 3 3, 64) 2 2 2 = + +... + = 7,11 2,16 6, 72 3, 64 Cramerův koeficient: 7,11 V = G n h = 50 2 = 0,27 slabá závislost 5

Kovariance kovariance s xy vyjadřuje vzájemný vztah proměnných X a Y pro populaci bude ve jmenovateli n vyjadřuje intenzitu lineární závislosti mezi X a Y s xy > 0 přímá (pozitivní) závislost X Y s xy < 0 nepřímá (negativní) závislost X Y s xy = 0 lineárně nezávislé veličiny 6

Korelace korelační koeficient r xy relativní vyjádření vztahu mezi X a Y 1 r xy + 1 vyjadřuje intenzitu lineární závislosti mezi X a Y r xy > 0 r xy < 0 r xy = 0 r xy = ±1 převažuje rostoucí závislost mezi x a y převažuje klesající závislost mezi x a y znaky x a y jsou lineárně nezávislé znaky x a y jsou lineárně závislé 7

Příklad korelační tabulka Lze dosažené známky z mikro (Mi) a Makro (Ma) ekonomie považovat za nezávislé veličiny? Mi \ Ma 1 2 3 Σ 1 16 4 2 22 2 8 3 4 15 3 3 5 5 13 Σ 27 12 11 50 X známka z Mi Y známka z Ma střední hodnoty a rozptyly: 22 1+ 15 2 + 13 3 x = = 1,82 50 27 1+ 12 2 + 11 3 y = = 1,68 50 s x 2 2 2 2 2 22 1 + 15 2 + 13 3 50 1,82 = = 0,681 49 2 2 2 2 2 27 1 + 12 2 + 11 3 50 1,68 = = 0,671 49 s y 8

Příklad kovariance s xy 16 1 1+ 4 1 2 +... + 5 3 3 50 1,82 1,68 = = 49 0,268 korelační koeficient 0,268 r xy = = 0,681 0,671 0,396 Mezi oběma předměty je slabá pozitivní závislost. 9

Regresní funkce korelace a regrese korelace vzájemný (lineární) vztah proměnných regrese matematické vyjádření vztahu mezi proměnnými regresní model: X 1... X k? Y Y = f(x 1, X 2,, X k ) + e deterministická složka lze vypočítat náhodná složka 10

Přečtěte si Matematické pojmy poskytují hlubší pohled na ekonomické koncepce a dodávají jim přesnost a jasnost. Mnoho ekonomických jevů může být bráno jako matematické proměnné, např. příjmy, výnosy, náklady, ceny, zásoby, atd. V ekonomii se snažíme určit vztahy mezi těmito proměnnými. Takovým speciálním případem vyjádření vztahů mezi proměnnými je regresní funkce. Doc. RNDr. Ing. Petr Fiala, CSc., MBA. Úvod do kvantitativní ekonomie 11

Jednoduchá lineární regrese 60 55 50 45 40 Lineární regrese lineární regresní model y 35 30 25 20 15 8 13 18 23 28 33 x rovnice regresní přímky [ x ; y ] i i [ ; ] x y ) i i body náležící souboru znaků X, Y body ležící na regresní přímce 12

Metoda nejmenších čtverců y i y ) i e i reziduum x i metoda nejmenších čtverců minimalizuje rozptyl hodnot kolem regresní přímky ) SSE = e = y y i ( ) 2 2 i i i i min! SSE Sum of Squared Errors 13

Koeficienty lineární regrese rovnice regresní přímky: regresní koeficient b 1 směrnice regresní přímky mezní přírůstek závisle proměnné Y X = 1 Y = b 1 koeficient b 0 průsečík regresní přímky s osou y přímka prochází těžištěm [ x ; y ] 14

Kvalita regresního modelu determinační koeficient R 2 rozptyl teoretických hodnot rozptyl empirických hodnot 0 R 2 1 jakou část variability závislé proměnné Y lze vysvětlit vlivem nezávislé proměnné X pro lineární modely je determinační koeficient druhou mocninou koeficientu korelace 15

Sdružené regresní přímky odhad proměnné Y pro X = x i odhad proměnné X pro Y = y i Regresní nůžky 12000 11500 11000 10500 10000 9500 9000 8500 8000 250 300 350 400 450 500 1 16

Příklad závislost známek ze zkoušek mikro (X) a makro (Y): 0, 268 y = f(x) b 1 = = 0,39 b 0 = 1, 68 0,39 1,82 = 0,96 0,681 x 1 2 3 y 1,35 1,74 2,13 0,268 x = g(y) a 1 = = 0, 40 a 0 = 1,82 0, 40 1, 68 = 1,15 0,671 y 1 2 3 x 1,55 1,95 2,35 makro je lehčí než mikro 17

y Nelineární regresní modely parabolická (kvadratická) regrese Y 90 85 80 75 70 65 60 55 50 45 Kvadratická regrese y = -0,0825x 2 + 4,423x + 19,415 R 2 = 0,919 hyperbolická regrese 40 10 15 20 25 30 35 40 45 50 X Hyperbolická závislost 80 70 Y - počet kontaktů / týden 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 X - vzdálenost v m exponenciální regrese 80 70 Exponenciální regrese 60 50 40 y = 2,0758.1,072 x R 2 = 0,9424 30 20 10 0 20 25 30 35 40 45 50 55 x 18

Parabolická regrese regresní funkce: řešíme soustavu rovnic: KDY? proměnná Y se mění rychleji než lineárně proměnná Y mění průběh 19

Hyperbolická regrese regresní funkce: rovnice lineární v parametrech (substitucí lze převést na lineární) KDY? modelování nepřímé úměrnosti proměnná Y konvexně klesá 20

Exponenciální regrese regresní funkce: rovnice linearizovatelná transformací (logaritmováním lze převést na lineární) KDY? proměnná Y roste rychleji než kvadraticky 21

Příklad nelineární regrese Tabulka uvádí závislost mezi vzdáleností pracovníků na pracovišti v metrech a četností jejich pracovních styků za týden: vzdálenost 3 8 9 12 20 32 52 počet styků 25 18 10 9 7 5 3 30 25 20 15 10 graf napovídá: použijeme hyperbolickou regresi 5 0 0 10 20 30 40 50 60 22

Příklad výpočtem dostaneme: kvalita modelu determinační koeficient: vypočteme rozptyly: 2 s y = 61 2 s Y = 54 R 2 2 sy = = 0,886 = 88, 6% 2 s y kvalita modelu je poměrně vysoká 23

Proč matematické modely? matematický model je abstraktní reprezentace ekonomických vztahů v reálném světě matematika zavádí přesnost do definic a vztahů matematika je jazyk, který usnadňuje sdělování ekonomických koncepcí matematické modely můžeme zkoumat nezávisle na realitě HMOTNOST = -77 + 0,83 VÝŠKA -6,78 POHLAVÍ + 0,27 VĚK 24

Co Vás čeká příště Analýza časových řad o Časové řady a jejich rozklad. o Elementární analýza časové řady. o Analýza trendu, typy trendů časových řad. o Analýza sezónnosti, sezónní odchylky a indexy. o Prognózování budoucího vývoje. 25