9 REGRESE A KORELACE Slovo regrese oecě zmeá poh zpět ústup ávrt regresví = ustupující Opčým termíem je progrese pokrok postup šířeí růst Pojem regrese l do sttstk zvede kocem 9 století rtským učecem Frcsem Gltoem v rámc spojeí regrese k průměru Tím ozčl fkt že sové vsokých otců jsou ovkle žší ež jejch otcové ztímco sové mlých otců ývjí všší Z Gltoov výzkumu přeosu vlstostí mez geercem se pk teto ázev rozšířl jkékol zkoumáí souvslostí mez áhodým velčm vzkl sttstcká regresí lýz T des ptří k ejvýzmějším metodám mtemtcké sttstk smosttě č ve spojeí s jým metodm se používá prktck v kždé olst emprcké plkové věd Pod pojmem regrese ted udeme rozumět vstžeí chrkteru závslost mez dvěm eo více áhodým velčm v přípdě více ež dvou áhodých velč jde o víceásoou regres tou se všk v této kptole zývt eudeme Míru teztu tkovéto závslost pk určuje korelce V pr rozlšujeme dv tp závslostí mez kvtttvím velčm fukčí stochstckou volou Fukčí závslost jsme z mtemtk zvklí zpsovt ve tvru f kde proměá ývá ozčová jko ezávslá eo tk vsvětlující proměá jko závslá vsvětlová Jko příkld fukčí závslost můžeme uvést vzth mez poloměrem kruhu jeho oshem kde po doszeí kokrétí hodot ezávslé proměé poloměru do vzorečku který máme k dspozc dosteme přesou hodotu závslé proměé oshu Čstěj se všk setkáváme s jým tpem závslostí Víme příkld že spotře utomolu závsí mmo jé rchlost jkou utomol jede Nemáme všk vzoreček ze kterého chom po doszeí kokrétí rchlost př jk eměých podmíkách tuto spotřeu vpočetl Můžeme se pokust zákldě měřeých hodot tkovýto vzth jít kd všk eude pltt úplě přesě Tkovéto závslost se zývjí stochstcké právě o jsou předmětem zkoumáí regresí lýz 9 Apromce metodou ejmeších čtverců Předpokládejme že je dá souor dvojc předstvujících sttstcký souor se dvěm sttstckým zk jejchž vzájemou závslost zkoumáme Hodot s můžeme předstvt jko hodot jejchž závslost hodotách lze vjádřt vzthem v kde ozčuje determovou složku tz tu která je jedozčě určeá hodotou v áhodou složku kterou může ýt příkld ch měřeí eo méě podsttý vlv jých velč proměou Hodot ted můžeme povžovt z jedotlvé relzce áhodé velč v Úkolem regrese vrováí rgumetu je lézt vhodou regresí fukc f pro vjádřeí determové složk velč Kokrétí tp regresí fukce leárí kvdrtcká zvolíme zákldě grfckého zorzeí dvojrozměré áhodé velč tzv korelčího pole přípdých zkušeostí z pre koefcet zvoleé regresí fukce pk určíme metodou ejmeších čtverců odchlek kterou s í přlížíme Nechť zvoleý tp regresí fukce oshuje k koefcetů k Potom můžeme tuto fukc zpst ve tvru f Nšm cílem je určt koefcet k k
tk se původí vrové hodot zku lšl co ejméě přesěj l co ejmeší součet čtverců tz druhých moc odchlek v původích vrových hodot odtud ázev metod Velkost součtu čtverců odchlek závsí koefcetech k je ted jejch fukcí Ozčme tuto fukc : k v f k Tto fukce se zývá krterálí fukce ším cílem je jít její mmum Estece mm je zruče eoť fukce je ezáporá Př jeho hledáí postupujeme stdrdím způsoem Položíme prcálí dervce této fukce podle všech proměých rov ule čímž dostáváme soustvu k rovc o k ezámých k : 0 k 0 Tkovéto soustvě říkáme soustv ormálích rovc Jejím řešeím je stcoárí od fukce který je zároveň jejím mmem Toto řešeí předstvuje ejvhodější volu kostt pro zvoleý tp regresí fukce Pro posouzeí vhodost vpočteé regresí fukce můžeme použít uď součet čtverců v odchlek čím je meší tím je promující fukce lepší eo chrkterstku zvou de korelce defovou vzthem I Hodot deu korelce se pohují v tervlu 0 přčemž hodot lízké zmejí že dá regresí fukce vsthuje skutečou závslost mez oěm zk velce doře hodot lízké 0 opk zčují že regresí fukce eí vhodou promcí vzthu mez rgumet Jestlže z regresí fukc volíme fukc leárí potom I r kde r zčí koefcet korelce defový v Kptole 8 Druhé mocě deu korelce říkáme de determce Zčí se R udává kolk procet rozptlu vsvětlové proměé je vsvětleo regresím modelem číslo R udává jký podíl rozptlu má áhodá složk v Teto de rověž ývá hodot od ul do jedé přčemž hodot lízké ule zčí šptou kvltu regresího modelu hodot lízké jedé dorou 9 Leárí regrese O leárí regres hovoříme tehd je-l uvžová regresí fukce leárí vzhledem k prmetrům k Může se tk jedt o fukc leárí kvdrtckou hperolckou td pro ázorost uvedeme odvozeí soustv ormálích rovc u těch ejpoužívějších
Místo ozčeí 3 udeme pro koefcet leárí komce používt ěžější ozčeí c Leárí fukce Leárí fukce je velm čsto používou regresí fukcí Použjeme j v přípdě kd předpokládáme že přírůstek závslé proměé je přímo úměrý přírůstku ezávslé proměé jedotlvé od korelčího pole leží přlžě v přímce vz Or 9 Or 9: Těmto od se sžíme proložt přímku tk ze všech možých přímek tto od vrovávl co ejlépe ve smslu metod ejmeších čtverců to zmeá jí příslušel co ejmeší součet čtverců odchlek původích vrových hodot jk je zázorňuje Or 9 Or 9: Regresí fukc ted hledáme ve tvru Krterálí fukce má potom tvr: v soustvu ormálích rovc dostu jejím dervováím podle proměých : 0 0 Po úprvě dostáváme soustvu ormálích rovc ve tvru: 3
4 Do tohoto tvru dosdíme z zámé hodot vpočteme koefcet čímž získáme rovc hledé regresí přímk Kvdrtcká fukce Důvodem pro volu kvdrtcké fukce z regresí fukc ývá čsto estece etrému v ooru zkoumých hodot V tomto přípdě vpdjí regresí fukce krterálí fukce soustv ormálích rovc tkto: c c c v c ] [ 0 c 0 c 0 c c c c c 4 3 3 Hperolcká fukce Hperolckou fukc používáme jko regresí fukc tehd pozorujeme-l smptotcké přlžováí hodot k určté kosttě Pro regresí fukc krterálí fukc soustvu ormálích rovc zde pltí tto vzth: / v / / ] [ 0 / / / 0
5 / / / / Logrtmcká fukce Logrtmckou fukc volíme v přípdě že proměá s rostoucím stále pomlej le eustále roste př > 0 evetuálě klesá př < 0 Regresí fukce krterálí fukce soustv ormálích rovc zde vpdjí tkto: v ] [ 0 0 Příkld 9: Metodou ejmeších čtverců vpočt koefcet regresí přímk pro soustvu odů zdou tulkou: Řešeí: Jk jž víme soustv ormálích rovc pro výpočet koefcetů regresí přímk má teto tvr: Vpočteme-l všech potřeé sum z hodot dých tulkou dostáváme soustvu 375 45 57 45 7 404 s řešeím 056 0 809; 3 Hledá regresí fukce má ted rovc 056 0 809 3 Přímk s touto rovcí vrovává od zdé tulkou ejlépe ze všech možých přímek ve smslu metod ejmeších čtverců odchlek Teto příkld lze sdo vřešt v Ecelu pomocí ástroje Spojce tredu Nejprve ozčíme celou tulku s dt poté záložce Vložeí v sekc Grf vereme Bodový dosteme grfcké zorzeí odů zdých tulkou korelčí pole Or 5 5 5 35 45 55 65 35 5 55 6 59 64 78
93 Podle rozmístěí odů vdíme že leárí fukce l zvole pro jejch vrováí příhodě od leží přlžě v přímce Or 93: V dlším kroku vereme v sekc Nástroje grfu položku Rozložeí rozklkeme koku Spojce tredu Klkeme-l dále položku Dlší možost spojce tredu rozlí se dové oko ve kterém s vereme tp regresí fukce v šem přípdě volíme tp leárí zškrteme předposledí položku Zorzt rovc v grfu Po zvřeí tohoto ok se v grfu vpíše rovce regresí přímk Pokud zškrteme posledí položku Zorzt hodotu spolehlvost R ojeví se v grfu rověž hodot deu determce který ám umoží posoudt kvltu vpočteé regresí fukce Řešeí šeho příkldu získé v Ecelu zázorňuje Or 94 Ide determce je R 0 8635 de korelce I R 0 99 z čehož vplývá že vpočteá regresího fukce vsthuje závslost velce doře Or 94: V přípdě leárí regresí fukce máme v Ecelu ještě dlší možost jk vpočíst její koefcet de korelce u jých tpů regresích fukcí teto postup eí možý! Regresí koefcet leárí regresí fukce vpočteme pomocí fukce LINREGRESE která má čtř prmetr Prvím prmetrem je olst ve které leží hodot rgumetu jko druhý prmetr se zdává olst ve které leží hodot rgumetu z třetí prmetr volíme hodotu z čtvrtý 0 Pro dt zdá v Ecelu tk jk je vdíme Or 95 ted voláí fukce mělo tvr LINREGRESEC3:C9;B3:B9;;0 Je uté mít pmět že výsledkem této fukce udou dvě hodot proto musíme vzorec správě zdt Po jeho vložeí do jedé uňk vereme tuto uňku uňku která s í sousedí vprvo stskeme klávesu F poté komc kláves CTRL+SHIFT+ENTER 6
Ide korelce je v přípdě leárí regresí fukce rove solutí hodotě koefcetu korelce k jehož výpočtu slouží fukce CORREL Jejím prvím prmetrem je olst ve které leží hodot rgumetu druhým prmetr je olst ve které leží hodot rgumetu Pro áš příkld ted její voláí mělo tvr CORRELB3:B9;C3:C9 Or 95: 93 Neleárí regrese Metod ejmeších čtverců je vhodá pro fukce které jsou leárí v ezámých prmetrech Potíže vzkjí př řešeí soustv ormálích rovc u regresích fukcí které leárí ejsou Pokud chceme metodu ejmeších čtverců použít v těchto přípdech sžíme se regresí fukc lerzovt pomocí vhodé trsformce Postup s ukážeme regresí fukc tvru : rtmujeme l l použjeme zámá prvdl pro počítáí s rtm: l l l l l l zvedeme susttuc: Z l A l u l dostáváme: Z A u kde Z je fukce leárí v ezámých prmetrech A můžeme ted postupovt podle výše uvedeého postupu: tz řešíme soustvu: hledáme mmum fukce A z Z z A u 0 0 0 0 A z z u z A u z A u u A z A Au u u u 7
z u A u u Po ávrtu k původím proměým pk dostáváme soustvu ormálích rovc ve tvru: l A l l l A l l ze které vpočteme ezámé A regresí koefcet pk vpočteme ze vzthu A e Ide korelce v přípdě eleárí regrese musíme počítt pro trsformovou proměou Z l tz podle vzorce: l l I l l Příkld 93: Měřeím závslost součtele třeí f teplotě t l získá údje v tulce Vrovejte je epoecálou přímkou určete která z těchto regresích fukcí je lepší t 60 70 80 90 00 0 0 f 0048 004 000 00085 0007 00059 0005 Řešeí: V prvím přípdě hledáme regresí fukc ve tvru e rol ezávslé proměé má zde teplot t rol závslé proměé součtel třeí f Tto fukce eí leárí v ezámých prmetrech proto přstoupíme k rtmováí úprvám vedoucím k lerzc: l l e l l l e l l Dále zvedeme susttuc: Z l A l po které dostáváme Z A tz řešíme soustvu: hledáme mmum fukce A z A 0 0 A z A z A z A z A Po ávrtu k původím proměým dostáváme soustvu ormálích rovc: l A 8
9 A l která má po výpočtu potřeých sum teto tvr: 7A 630 3 33 630A 59500 8 3048 Řešeím soustv dosteme ezámé A : 080 0 38; 3 A koefcet pk vpočteme ze vzthu 0434 0 A e Rovce vpočteé regresí epoecál je ted e 0080 00434 Pro tuto fukc ještě vpočteme de korelce součet čtverců odchlek: 0999 l l l l I 8 4970 ] [ v Ve druhém přípdě hledáme regresí fukc ve tvru Jedá se o leárí regresí fukc se soustvou ormálích rovc: Po výpočtu všech potřeých sum má soustv tvr: 59500 630 5308 630 7 0064 řešeí -0000 ; 0037 Druhá regresí fukce má ted rovc 000 0 037 0 Dále vpočteme de korelce: 0985 I součet čtverců odchlek: 6 0 ] [ v Je vdět že oě fukce vsthují závslost velce doře de korelce je u oou fukcí lízký hodotě součet čtverců odchlek je v oou přípdech velm mlý epoecálí fukce se všk podle oou těchto krtérí jeví jko lepší Pro lustrc ještě uvádíme výps řešeí získého v Ecelu pomocí ástroje Spojce tredu regresí epoecálu Or 93 regresí přímku Or 93:
Or 93: Or 93: 0
Příkld k procvčeí: Chrkterzujte závslost proměé regresí fukcí tvru: / c u oou fukcí určete de korelce 3 4 6 0 4 5 5 Př seskoku pršutst l měře závslost mez rchlostí v tlkem p povrchu pdá- ku Výsledk vrovejte prolou p v vpočtěte de korelce v 4 35 5 689 0 p 004 008 0056 05 050 3 Chrkterzujte těsost zvoleé závslost ve tvru mez proměým Vpočtěte de korelce 3 3 5 6 7 7 70 04 6 0 00 50 40 60 4 Př zjšťováí závslost velč l měře hodot uvedeé v tulce Určete pro tto velč vhodou regresí fukc 55 55 55 65 65 65 75 75 75 85 85 95 95 95 3 36 4 8 4 3 8 4 3 8 4 8 4 3 5 Zjšťovlo se zd u souoru chlpců estuje závslost v počtu provedeých shů klků Výsledk jsou zzmeá v tulce Určete zd je mez počtem shů klků slá leárí závslost určete její míru Chlpec 3 4 5 6 7 8 9 0 3 4 5 Počet 3 0 5 6 4 3 5 6 8 shů Počet 0 5 5 0 40 5 7 3 30 35 4 0 4 9 64 klků