Dráha [m] 9. Měřeí závslostí ve statstce Měřeí závslostí ve statstce se zývá především zkoumáím vzájemé závslost statstckých zaků vícerozměrých souborů. Závslost přtom mohou být apříklad pevé, volé, jedostraé, oboustraé, příčé, zdálvé ad. 9.1. Pevá a volá závslost Pro pochopeí závslostí je potřebé pozat především pevou a volou závslost. 9.1.1. Závslost pevá Pevá závslost se obvykle vyskytuje u ěkterých přírodích jevů, kdy změa jedoho jevu způsobuje změu jevu druhého a to v přesě odpovídající teztě. Například délka kovové tyče je ve fukčím vztahu závslá a teplotě, v geometr plocha čtverce fukčě závsí a jeho straě a pod. Příklad: Pevá (fukčí, determstcká) závslost volý pád: 4000 3000 s 1 gt 000 1000 pozorovaé hodoty 0 10 0 30 Čas [s] Obr. 9.1 Pevá závslost dráhy a čase př volém pádu Pozorovaým hodotam lze přesě proložt spojtou křvku o zámé rovc. Případé odchylky od křvky jsou způsobey pouze chybam měřeí. Počet aměřeých hodot eovlvňuje přesost závěrů. Stuac lze kdykol přesě opakovat. 1
Poptávka po zboží [ks] 9.1.. Závslost volá Některé jevy mohou být a sobě závslé je volě, apř. závslost výosu plody a spotřebě hojv, závslost poptávky a ceě zboží apod. I zde se projeví závslost, avšak vztah je více č méě volý. Změa jedoho jevu podmňuje úroveň jého jevu je s určtou pravděpodobostí a rověž tezta změy druhého jevu může být růzá. Tuto závslost můžeme zkoumat je př větším možství jevů. Volá (stochastcká) závslost trží poptávka: 50 pozorovaé hodoty 40 30 10 0 30 40 Cea zboží [Kč] Obr. 9. Volá závslost poptávky a cey zboží Všem pozorovaým hodotam elze proložt křvku. Odchylky od deálího průběhu závslost jsou dáy dvduálím zvláštostm jedotlvých případů. Iformace o závslost se zpřesňují s přbývajícím počtem případů. Stuac se kdy epodaří zovu přesě reprodukovat. Předmětem zájmu statstky je volá závslost, která je typcká pro socálě ekoomcké mohé jé vysoce komplkovaé jevy.
9.. Klasfkace statstckých závslostí Statstka se zývá především zkoumáím volé závslost. V rámc tohoto zkoumáí ale můžeme odhalt závslost pevé Podle druhu statstckých zaků, můžeme závslost člet ásledově: korelačí závslost závslost mez kvattatvím zaky (apř. vztah mez spotřebou krmva a dosahovaým přírůstkem u zvířat, mez délkou klasu pšece a počtem zr v klasu, mez výosem plody a straě jedé a spotřebou hojv), asocačí závslost závslost mez kvaltatvím alteratvím zaky (apř. vztah mez postřkem stromů a červvostí ovoce,), kotgečí závslost závslost mez kvaltatvím zaky možým (apř. ctlvost růzých druhů zvířat a ěkteré stresové poděty, vlv růzých techologí a výos jedotlvých druhů obl) Veškeré závslost můžeme rozdělt a závslost příčé a závslost zdálvé. Smysl zkoumat mají pouze závslost příčé, kde vystupuje: jede jev jako příča ezávslá proměá (X), druhý jev jako úček závslá proměá (Y). Statstka zkoumá příčé volé závslost. 9..1. Klasfkace statstckých závslostí číselých zaků Každá závslost číselých zaků má dva vzájemě eodděltelé atrbuty (vlastost): teztu závslost - korelace. průběh závslost - regrese, Statstka měří průběh a teztu závslost číselých zaků. Příčé závslost číselých zaků klasfkujeme z růzých hledsek: a závslost jedostraé a závslost oboustraé (vždy však vzájemé), a závslost přímočaré a křvočaré, ěkteré (zejméa přímočaré) a závslost poztví a závslost egatví (toto hledsko má pouze okrajový výzam), podle matematckých fukcí použtých a zkoumáí průběhu závslost a závslost leárí a závslost eleárí, podle počtu příč (ezávslých proměých) a závslost párové (jedoduché, s jedou ezávslou proměou) a závslost mohoásobé (s ejméě dvěma současě působícím ezávslým proměým),atd. V prax se větša úloh omezuje je a párové a leárí ebo křvočaré závslost. 3
Druhy korelačí závslost: Podle počtu zaků: - jedoduchá (prostá) Y = f (X) - víceásobá Y = f (X 1, X,, X ) Podle typu regresí fukce: y leárí závslost y eleárí závslost x x Podle směru regresí fukce: kladá (přímá) závslost záporá (epřímá závslost křvočará závslost y y y x x x Podle stupě závslost (korelace) zaků: ezávslost volá závslost žší stupeň vyšší stupeň pevá závslost y y y y x x x x Obr. 9.4 Příklady korelačí závslost 4
9.3. Korelačí aalýza Korelačí aalýza zkoumá korelačí závslost mez kvattatvím (číselým) zaky. Př zkoumáí korelačí závslost rozezáváme dva základí pojmy: Korelace = stupeň (těsost) závslost. Regrese = průběh závslost prostředctvím matematcké fukce (zpravdla přímky), změa závslé proměé podle ezávsle proměé. Př malém počtu statstckých jedotek je základem pro zkoumáí závslostí základí - datová tulka, do které zazameáváme hodoty statstckých zaků pro všechy statstcké jedotky od = 1 až po =. Základí - datová tulka a zkoumáí závslost T. 9.1 Statstcká jedotka Hodoty statstckých zaků Zak x Zak y 1 x 1 y 1 x y... x y V této podobě jde je o zázam výsledků zjšťováí za čleý statstcký soubor. Př velkém rozsahu dat je pracoví tulka epraktcká a epřehledá. Výhodější je v této stuac tzv. korelačí tulka, v které jsou uvedey četost kombací obmě hodot obou zaků. Pokud jde o ezávslé proměé je možé vykoat tříděí podle proměé x podle proměé y. T. 9. Korelačí tulka a zkoumáí závslost Zak x Zak y y 1 y. y l x 1 11 1. 1l x1 x 1. l x x 3 13 3. 3l x3...... y1 y.. 5
Počet letokruhů Příklad: Za 10 rod máme údaje o počtu dětí v rodě (proměá x) a velkost bytu (proměá y) vyjádřeé počtem místostí. T. 9.3 Základí - datová tulka Statstcké zaky rody Roda 1 3 4 5 6 7 8 9 10 Počet dětí v rodě 1 1 0 0 1 0 3 (proměá x) Počet místostí (proměá y) 3 3 3 1 3 4 4 T. 9.4 Korelačí tulka Počet dětí (proměá x) Počet místostí (proměá y) Celkem 1 3 4 0 1 1 1-3 1-1 - 3 - - 1 3 3 - - - 1 1 Celkem 1 3 4 10 Prostředkem grafcké prezetace závslostí číselých zaků je korelačí bodový graf. Body v grafu představují jedotlvé statstcké jedotky, kterým odpovídají obměy příslušých statstckých zaků a osách x a y. Pozámka: Když se vyskyte více statstckých jedotek se stejým obměam statstckých zaků, body se v bodovém korelačím grafu překrývají. Pro lepší ázorost je možé v tomto případě použít pseudo-3d graf. Příklad: U ařezaých prke můžeme zkoumat závslost jejch tloušťky a počtu letokruhů. 1 10 8 6 4 0 1, 0 1, 1, 4 1, 6 1, 8, 0,, 4, 6 Tloušťka prka [cm] Obr. 9.3 Korelačí bodový graf a zkoumáí závslost tloušťky prke a počtu jejch letokruhů 6
Korelačí aalýza má dvě základí úlohy: regresí úloha, korelačí úloha. 9.4. Korelačí a regresí úloha 9.4.1. Korelačí úloha Aalytcký ástroj korelace se může použít k testováí závslost dvou číselých statstckých zaků. Korelačí úloha spočívá ve zkoumáí těsost korelačího vztahu. Závslost zameá, že hodoty jedoho zaku odpovídají přímo úměrě (kladá korelace) ebo eúměrě (záporá korelace) hodotám ve druhého zaku. Mírou korelace je koefcet, ebo dex korelace r. Má hodoty od -1 do 1, udávající, jak přesě odpovídají předpokládaé (očekávaé) hodoty, vyjádřeé regresí fukcí - spojcí tredu (tred, vývoj, směr, vyrováí měřeých velč), skutečým datům. Spojce tredu je ejspolehlvější v případě, že se hodota dexu (koefcetu) korelace - spolehlvost blíží ebo rová hodotě 1. Pokud jsou hodoty obou zaků ezávslé, bude korelace blízká ule. Idex (koefcet) korelace se vypočítá podle vztahu: r 1 1 1 ( y ( y y( x )) y ) y 1 y kde x je x-ová souřadce datového bodu y je y-ová souřadce datového bodu je počet datových bodů Podle hodoty Idexu (koefcetu) korelace určuje míru závslost. Když bude mít Idex (koefcet) korelace hodoty: r = 0,0 0, r = 0,3 0,4 r = 0,5 0,6 r = 0,7 0,8 r = 0,9 1,0 jedá se o žádou ebo velm slou závslost jedá se o slou jedá se o průměrou závslost jedá se o slou závslost jedá se o velm slou závslost 7
9.4.. Regresí úloha Regresí úloha korelačí aalýzy má za cíl popsat průběh zkoumaého vztahu statstckých zaků a použít její výsledky př progózách. Jde o to, y jsme vyjádřl průběh korelačí závslost t.j. změy závsle proměé a změách ezávsle proměé. Teto vztah azýváme regrese. Regres popsujeme regresí fukcí. R = regresí koefcet = koefcet spolehlvost případé předpovědě Přesost regresí fukce je přímo závslá a rozsahu souboru. Pomocí regresí aalýzy, prodloužeím spojce tredu, se dají staovt hodoty za, ebo před zobrazeým daty. Tím se dá provést matematcká předpověď. Přesost matematckého předvídáí je úměrá velkost korelačí závslost. K určeí parametrů (koefcetů) regresí fukce se používá metoda ejmeších čtverců. 8
9.4.3. Metoda mmálích čtverců Výzam metody mmálích čtverců Metoda mmálích čtverců je uverzálí metodou staoveí (odhadu) parametrů b 0, b 1,..., b m fukce ahrazující původí aměřeé hodoty y závsle proměé Y. Zameá to, že hledáme fukc, která má součet čtverců odchylek měřeých údajů od teoretckých co ejmeší. V geometrcké představě to zameá, že hledáme takovou křvku, která co ejtěsěj přléhá k jedotlvým bodům. Fukce této křvky by měla být co ejjedodušší, y se dala sado používat k výpočtu dalších potřebých hodot. Tuto fukc azýváme regresí fukcí. Původě ezámé koefcety b j jsou parametry regresí fukce. Výběr typu fukce (tj. apř. kvadratcká, lomeá apod.) je v kompetec řeštele úlohy. Metoda mmálích čtverců aleze pak parametry ejlepší fukce předem zvoleého typu. každé pozorovaé hodotě y odpovídá hodota vypočteá y čtverec odchylky pozorovaé a vypočteé hodoty závslé proměé hodoty zavslé promeé Y pozorovaé hodoty závslé proměé y regresí fukce y hodoty ezávslé proměé X Obr. 9.7 Grafcké zázorěí metody krtéra mmálích čtverců 9
Metoda mmálích čtverců mmalzuje součet čtverců odchylek pozorovaých (aměřeých) hodot závsle proměé a zvoleé regresí fukce. Spočívá tedy v hledáí takové regresí fukce pro kterou bude platt vztah y y m 1 Platí pro fukce leárí eleárí, jedoduché víceásobé. Je-l rozsah souboru rove, je krtérum mmálích čtverců m ( y y ) [ y b j f j ( x )] 1 1 j 0 m. Dá se ukázat, že vyhovuje-l určtá fukce krtéru mmálích čtverců, splňuje automatcky též ( y y ) 0 (součet kladých a záporých odchylek kolem 1 regresí fukce se kompezuje). Tato podmíka však regresí fukc eurčuje jedozačě. Exstuje jedá regresí fukce zvoleého typu, která pro kokrétí data vyhovuje podmíce mmálích čtverců. Y y y X Obr. 9.8 Grafcké zázorěí krtéra mmálích čtverců 10
Proceta 9.5. Základí typy regresích fukcí a jejch aplkace Regresí fukce - spojce tredů může mít růzý tvar. Nejčastěj se používají fukce: leárí, expoecálí, mocá, logartmcká, polyomcká, 9.5.1. Vyrováí leárí fukcí. Leárí spojce tredu je přzpůsobeá přímka používaá u jedoduchých leárích mož dat. Data jsou leárí, jestlže průběh jejch datových bodů přpomíá přímku. Leárí spojce tredu obvykle zobrazuje, že ěco roste ebo klesá kostatí měrou y a bx Příklad: Vyrováí vývoje výdajů a vědu z HDP leárí fukcí,5 Proceta z HDP a vědu a výzkum Slovesko EU 1,5 y = 0,03x - 44,115 R = 0,9653 1 y = -0,05x + 50,645 R = 0,899 0,5 0 1998 1999 000 001 00 003 004 005 006 007 Roky Obr. 9.9 Porováí vývoje podílu vědy z HDP SR a EU 11
Počet požárů 9.5.. Vyrováí mocou fukcí Mocá spojce tredu je křvka používaá u dat porovávajících stoupající hodoty aměřeé v určtých tervalech. Například zrychleí auta v tervalech po 1 sekudě. Mocou spojc tredu elze vytvořt, jestlže data obsahují ulové ebo záporé hodoty. b y ax 9.5.3. Vyrováí logartmckou fukcí Logartmcká spojce tredu je přzpůsobeá křvka používaá u dat, která rychle stoupají ebo klesají a postupě se vyrovávají. U logartmcké spojce tredu je možé použít kladé záporé hodoty. y al( x) b 9.5.4. Vyrováí polyomckou fukcí Polyomcká spojce tredu je křvka používaá u dat, která kolísají. a edají se tedy aproxmovat jedodušší fukcí. Stupeň polyomu může být urče počtem kolísáí v datech ebo počtem zakřveí (maxm a mm) v křvce. Stupeň má obvykle jede vrchol. Stupeň 3 má obvykle jede ebo dva vrcholy. Stupeň 4 má obvykle až tř vrcholy. y a b x 6 1 b x... b6 x Příklad: Vyrováí počtu požárů za roky 1996 006 polyomem 0 50 Počty požárů ve stavebctví v ČR 00 y = 1,48x - 5730x + 6E+06 R = 0,9673 150 100 50 0 1 994 1 996 1 998 000 00 004 006 008 Roky Obr. 9.9 Vývoj počtu požáru za roky 1996-006 1
Počet požárů Úrazy 9.5.5. Vyrováí expoecálí spojcí Expoecálí spojce tredu je křvka, která se používá v případě, že hodoty dat stoupají ebo klesají ve stále větších krocích. Tuto spojc elze vytvořt, jestlže data obsahují ulové ebo záporé hodoty. bx y ae Příklad Další graf udává statstcký soubor vytvořeý z reálě vysledovaých údajů v letecké dopravě. Počet smrtelých úrazů přpadajících a 1 mlo alétaých klometrů je vysledová v rocích 1950 až 005 Soubor byl vyrová expoecálí fukc. Koefcet spolehlvost R = 0.968 je dost vysoký, y se expoecálí fukce mohla použít pro statstcké předvídáí. 50 Graf smrtelých úrazů Počty požárů ve stavebctví v ČR y = 5E+7e -0,08443x R = 0,968 00 18 15 y = 1,48x - 5730x + 6E+06 R = 0,9673 150 1 100 9 6 3 50 0 1950 1960 1970 1980 1990 000 010 0 1 994 1 996 1 998 000 Roky 00 004 006 008 Roky Obr. 9.9 Vývoj smrtelých úrazů v letecké dopravě a 1 ml. alétaých klometrů za roky 1996-007 Předvídaé údaje jsou esmírě ceé formace pro strateg krzového pláováí. Tyto a obdobě vyhodoceé další vysledovaé formace se dají aplkovat a každé letště. To umožňuje přpravt odpovídající dmez místích záchraých sl a prostředků, přpravt potřebou kapactu zdravotckých a techckých zařízeí, orgazac záchraé hasčské lékařské služby, vytvořt s obraz o řídících pracích apod. 13
9.6. Asocačí závslost Asocačí závslost je závslost mez dvěma kvaltatvím alteratvím (dvojým) zaky: T. 9.5 Základí - datová tulka a zkoumáí asocačí závslost přítomost zaku epřítomost zaku zak A a zak B b Zak A Všeobecá asocačí tulka Zak B b β Celkem a aβ a α αb αβ α Celkem b β T. 9.6 Koefcet asocace Q a a b b Koefcet korelace Odchylka od ezávslost R a a a b b b Příklad: Soubor pracovíků podku B, rok 001, = 450 alteratví zaky: A očkováí, B oemocěí Oemocěí (B) Očkováí (A) ao b e ao a 1 33 335 e 53 6 115 65 385 450 Koefcet asocace Q a a 1 6 3353 0,9 1 6 3353 Koefcet asocace ukazuje vysoký stupeň účost očkováí. b b 14
9.7. Kotgečí závslost Kotgečí závslost mez kvaltatvím možým zaky Všeobecá kotgečí tulka T. 9.7 Zak A a a a a 1 k Celkem b 1 11 1 1 b Zak B b j b l 1 1 j j k1 k kj kl 1 j l j 1l l l Celkem 1 k Čtvercová kotgece k l j k 1 j1 j 1 j1 j l j j k l j 1 j1 j Čuprovův koefcet kotgece K k 1l 1 15
Příklad: U 350 zákazíků byla hodocea spokojeost s poskytovaým službam vybraé frmy. T. 9.7 Kotgečí tulka a zkoumáí závslost spokojeost a využíváí služeb zákazíky Zákazíc Využíváí služeb Spokojeost Celkem se službam frmy ao e zřídka 10 10 0 často 0 10 30 velm často 85 15 100 Celkem 115 35 350 10 10 0 10 350( 115 0 35 0 115 30 35 30 85 15 ) 350 187, 115100 35100 K 350 18, 7 ( 3 1)( 1) 0,44 Z výsledku vyplývá, že exstuje průměrý vztah (závslost) mez spokojeostí se službam frmy a frekvecí jejch využíváí. 16