Pravděpodobot a tattka 9. REGRESNÍ A KORELAČNÍ ANALÝZA Průvodce tudem V předchozí kaptole jme uvedl způob, jak popat leárí závlot mez dvěma argumety a její míru. Užtím korelačích poměrů je možé zjtt, zda má myl hledat jý typ závlot mez proměým ež leárí. Předpokládaé zalot Pojmy z předchozích kaptol. Cíle Cílem této kaptoly je vyvětlt pojmy regree, korelace, regreí fukce, metoda ejmeších čtverců odchylek, de korelace. Výklad 9.. Leárí regree Grafcké zobrazeí dvojrozměré áhodé velčy, tattcký oubor dvěma tattckým zaky (,y ); =,,..., (korelačí pole): Hledejme vyjádřeí této "tattcké" závlot "ejlepším" fukčím předpem. A pro začátek předpokládejme teto předp leárí:
Pravděpodobot a tattka = a+ b Jako krtérum pro "ejlepší" fukčí předp vezměme z určtých důvodů (zámých už apř. Gauov v počtu pravděpodobot apř. proto, že e takový přítup úpěšě uplatňuje v jých tuacích vz. ukázka pouze a webu) mmalzac umy kvadrátů odchylek emprckých hodot y od teoretckých hodot zíkaých pomocí předpu y t : ( ) ( ) ( ) S a, b = y = a+ b y = m = = Hodota velčy S záví a voltelých hodotách a a b a je to tedy fukce dvou proměých. Její etrém e ajde ulováím parcálích dervací podle těchto proměých. S =. ( a + b y). = 0 a = S =. ( a + b y). = 0 b = Po úpravě dojdeme k outavě leárích rovc pro určeí a a b. (V dalším tetu budeme ěkdy zjedodušovat záp umačí ymbolky.) a. + b. = y. +. = a b y
Pravděpodobot a tattka Tuto outavu můžeme vyřešt moha způoby. Například pomocí determatu matce outavy, který lze upravt a vyjádřeí pomocí rozptylu:, D =. =. takže koefcety rovce přímky akoec jou: y y a =. y. y b =. Po poěkud pracějších úpravách ( využtím vyjádřeí cetrálích mometů pomocí mometů počátečích): y y. y y = +... y y y y...... = + y y...... y y. y = + +. y y.. = y +. y. ( ) ( ) y. = y+. y. ( ) dotáváme jou podobu rovce regreí přímky, z íž vyplývá, že tato přímka prochází
Pravděpodobot a tattka tzv. cetrálím bodem, y (, y jou tředí hodoty proměých, y) a že měrc přímky, tzv. koefcet regree, ovlvňuje jak kovarace, tak rozptyl té proměé, která byla prohlášea za ezávlou: ( ) cov y y y =. Tuto volbu můžeme pochoptelě změt a tak e dojde aalogckou cetou k jé regreí přímce: y ( ) cov y =. y y Vykrelíme-l obě takto zíkaé přímky do jedé ouřadcové outavy, dotaeme tzv. regreí ůžky: cov y cov y Směrce obou regreích přímek by = a b y = azýváme regreí koefcety př závlot y a, rep. a y a mají velm důležtou praktckou terpretac: udávají přírůtek závle proměé př jedotkové změě ezávle proměé. (Dokažte!) Zároveň umožňují vypočít koefcet leárí korelace, který jme výše defoval jako ormovaý míšeý momet druhého tupě, vypočít jým způobem: y.
Pravděpodobot a tattka ( cov y) by. by = = r. y Zaméko přdělíme podle zaméka kteréhokolv regreího koefcetu, apř.: ( ) r g b. b. b = y y y Dá e dokázat, že teto koefcet abývá hodoty z tervalu, a měří vhodot leárí fukce vyjádřt tattckou závlot mez velčam a y. Čím je hodota koefcetu blíže krajím hodotám, tím je áhrada těější. V případě, že teto koefcet abývá hodoty ebo -, leží všechy body a regreí přímce a závlot velč a y je přeě leárí. Staovt tupc oceňující závlot (závlot "labá", "tředí", "lá") eí úkol pro matematka, ale pro profeího odboríka. Podobé tupce bývají oučátí oborových orem. Leárí průběh emuí vždy vythovat vzájemé chováí obou ložek dvojrozměré áhodé velčy. Nc ale etojí v cetě přrozeému zobecěí předešlých úvah a potupů. Uvažujme jako výše korelačí pole (,y ); =,,..., a fukc (kterou volíme pouze jejím charakterem, ale kolv jejím parametry, které určují detalě průběh fukce) = f (, a0, a,, ak ), která by měla vyjádřt vztah mez ložkam a y. A hledejme možu koefcetů a tak, aby byl plě požadavek MNČ (metody ejmeších čtverců):
Pravděpodobot a tattka S(, a, a,, a ) = f (, a, a,, ak) y = m 0 k 0 = Řešeím outavy rovc: (,,,, ) S a a a 0 a j k = 0; j = 0,..., k, vzklé ulováím parcálích dervací fukce S podle jedotlvých hledaých koefcetů, dotaeme hledaou regreí fukc. Mohou však atat problémy algebrackého charakteru. Vzklá outava rovc může být velm eado řeštelá (zvlášť bez použtí výpočetí techky). Proto e zpravdla hledají vhodé regreí fukce pouze mez tzv. adčím fukcem: (,,,, ) = +. ( ) + +. ( ) f a a a a a f a f 0 k 0 k k Ty totž vedou k řešeí outavy leárích rovc, jak lze ado ukázat. Na případy adčích fukcí e čato převádějí fukce multplkatví, jako je apř. fukce mocá č epoecálí. Learzace logartmováím fukčího předpu však obecě dává pouze uboptmálí řešeí z hledka MNČ. Potup ukážeme a regreí fukc = a.e b Tuto fukc použjeme za předpokladu, že rychlot růtu závle proměé je přímo úměrá její velkot. Př určováí kotat a, b zlogartmujeme fukc: l = la + b Jetlže yí položíme Z = l, a = la, je fukce Z = a + b leárí v parametrech a můžeme použít jž zámého potupu. Hledáme tedy mmum fukce ( a ) + b z.
Pravděpodobot a tattka Po etaveí outavy rovc e můžeme vrátt k původím proměým. Soutava bude mít tedy tvar: N l a+ b = l y l a + b = l y Podobě potupujeme apř. pro fukc = a. b (kde b eí přrozeé čílo) ebo = a + b Φ (v tomto případě lze použít traformace ( ) Z = ). Pozámka Hledko umercké áročot regreí aalýzy e tává v oučaé době druhořadé, eboť tadardí počítačové programy abízejí automatzovaé řešeí této úlohy. Podtatější problém atává př měřeí vhodot regreí fukce. Koefcet leárí korelace tu ztrácí vůj výzam a je třeba ajít jou míru těot uvažovaého vztahu a daého korelačího pole. Zaveďme tato ozačeí pro pecálím způobem defovaé rozptyly: ( y ) y =. y ( ) =. y = ( y ), y. když je fukčí hodota regreí fukce přílušá -té -ové ložce. Všměme, jaký mez m etuje vztah:
Pravděpodobot a tattka ( ) ( ) ( ) ( ) (( y ) ( y) ( y ) ( y) ). ( ). ( ) y =. y y =. y + y =. + +.. = = y. + + y y Dá e dokázat (ukázka pouze a webu), že poledí výraz a pravé traě je rove ule. Pak = + y y a podíl = 0; bývá používá jako míra těot, vhodot y y y regreí fukce (koefcet determace). Udává vlatě, jaká čát dperze zaku y je způobea závlotí a. Doplěk koefcetu determace do jedé zameá podíl áhodé ložky a dperz. Odmoca I y = = (de korelace) má aalogckou y y y terpretac jako koefcet korelace (pro leárí regreí vztah jde o zcela totožý výledek). Pozámka K poouzeí míry vhodot regreí fukce může loužt také pouze hodota = y ( ) y. - rezduálí (zbytkový) oučet čtverců (rozptyl). Nejvhodější regreí fukcí je pak amozřejmě ta fukce, která má rezduálí oučet čtverců ejžší. Řešeé úlohy Příklad 9... Vyrovejte data v tabulce regreí přímkou 5 5 5 35 45 55 65 y 3,5 5, 5,5 6, 5,9 6,4 7,8 Řešeí: Ukážeme, jak by e tato úloha řešla v Ecelu: Nejdříve ozačíme data a klkeme a Vložt Graf..., přčemž vybereme typ grafu
Pravděpodobot a tattka X bodový: Máme-l aktví oko grafu, v abídce Ecelu přbude položka Graf, vybereme možot Přdat pojc tredu...:
Pravděpodobot a tattka Chceme-l daty proložt přímku, vybereme Typ tredu - leárí: Pro zobrazeí rovce regree a hodoty polehlvot R (druhá moca deu korelace) klkeme a kartu Možot a zaškrteme přílušé položky: Koečá podoba řešeí:
Pravděpodobot a tattka Z grafu vdíme, že rovce regree je: y = 0,056. + 3,8089, de korelace: I = 0,8635 = 0,99 y V tomto případě etuje další možot, jak vypočít koefcety a, b v rovc regree a de korelace. Rovc regree vypočteme pomocí v Ecelu předdefovaé fukce LINREGRESE, kterou ajdeme v kategor tattcké. Nuto mít a pamět, že výledkem budou dvě hodoty, proto před vyvoláím této fukce ozačíme dvě buňky vedle ebe a př použtí tkeme oučaě klávey CTRL+SHIFT+ENTER (matce a výtupu). V ašem příkladě by e tato fukce zadávala takto: LINREGRESE(C3:C9;B3:B9;). Ide korelace je v tomto případě hodý koefcetem korelace (vz. kaptola 8), tudíž použjeme předdefovaou fukc: CORREL(B3:B9;C3:C9) Předchozí úlohu můžete otevřít vyřešeou v Ecelu.
Pravděpodobot a tattka Pozámka Na druhém ltě řešeí předchozího příkladu v Ecelu je provedea regreí aalýzu pomocí doplňkového átroje Aalýza dat (použtí popáo v 7. kaptole, příkladu 7.3..), aalytcký átroj Regree. Pozámka Jak je patré z třetího obrázku v řešeí předchozího příkladu, obdobě bychom potupoval v případě, že bychom potřeboval daty proložt apř. logartmckou, epoecálí, mocou fukc, případě polyom.-6. tupě. Řešeé úlohy Příklad 9... Charakterzujte závlot proměé y a regreí fukcí ve tvaru hyperboly b y = a+ 55 55 55 65 65 65 75 75 75 85 85 95 95 95 y 3 3,6 4,,8,4 3,8,4 3,8,4,8,4 3 Řešeí: Úlohu vyřešíme opět v Ecelu, použjeme obdobě jako v předchozím příkladě předdefovaou fukc LINREGRESE, která počítá koefcety v leárí regreí fukc y = a. + b. Pouze míto proměé do této rovce doadíme proměou : Tato fukce je v tomto příkladě kokrétě zadáa LINREGRESE(C3:P3;C4:P4;) 55,45 Řešeím je tedy regreí křvka ve tvaru hyperboly: y = 0, 44 +
Pravděpodobot a tattka Podobým způobem vypočteme de korelace: CORREL(C3:P3;C4:P4). Ide korelace je tedy rove: I y = 0,608. Tuto úlohu můžete otevřít vyřešeou v Ecelu. Pozámka Podobě bychom mohl amozřejmě hledat koefcety v dalších regreích fukcích ve tvaru ve tvaru y = a.f() + b (apř. y = a. 3 + b). V rámc cvčeí e věujte áledujícím úlohám: alezeí regreí přímky př tadardím zadáí ouboru bodů (, y ) (potup př řešeí v Ecelu) alezeí regreí přímky př zadáí dvojrozměrého ouboru četotí tabulkou (dokočete řešeí příkladu z mulé kaptoly) alezeí eleárí regreí fukce podle abídky kalkulátoru Ecel alezeí eleárí regreí fukce podle MNČ bez předešlé learzace (užtím umerckého řešeí, které abízí řeštel Ecelu (epoecála, mocá fukce) hledáí zadáí úloh z odboré profee čteáře, které by vedly a regreí aalýzu
Pravděpodobot a tattka Úlohy k amotatému řešeí 9.. Charakterzujte závlot proměé y a regreí fukcí ve tvaru = a + b 5 5 5 35 45 55 65 y 3,5 5, 5,5 6, 5,9 6,4 7,8 9.. Charakterzujte závlot proměé y a regreí fukcí ve tvaru: b a) = a + b) = a + b + c Určete dey korelace 3 4 6 y 0 4 5 5 9.3. Př ekoku parašutty byla měřea závlot mez rychlotí v [m/] a tlakem p [0,mPa] a povrchu padáku. Výledky vyrovejte parabolou p = a + bv. Vypočtěte de korelace. v,4 3,5 5 6,89 0 p 0,04 0,08 0,056 0,5 0,5 9.4. Charakterzujte těot zvoleé závlot ve tvaru = a + b. log mez proměým a y. Vypočtěte de korelace. 3 3 5 6 7 7 y 70 04 6 0 00 50 40 60 9.5. Př zjšťováí závlot velč a y byly aměřey hodoty uvedeé v tabulce. Určete vhodou regreí fukc. 55 55 55 65 65 65 75 75 75 85 85 95 95 95 y 3 3,6 4,,8,4 3,8,4 3,8,4,8,4 3 9.6. Zjšťovalo e, zda u ouboru chlapců je závlot v počtu provedeých hybů a klků. Výledky jou zazameáy v tabulce: chlapec 3 4 5 6 7 8 9 0 3 4 5 počet hybů 3 0 5 6 4 3 5 6 8 počet klků 0 5 5 0 40 5 7 3 30 35 4 0 4 9 64 a) Určete, zda je mez počtem hybů a počtem klků lá leárí závlot, určete její míru. b) Najděte ejvhodější regreí fukc závlot mez počtem hybů a klků.
Pravděpodobot a tattka Výledky úloh k amotatému řešeí 9.. y = 0, 056 + 3, 809 5, 565 9.. a) = 6, 06 ; I = 0, 985 ; b) = 5, +, 94 0, 93 ; I = 0, 99 9.3. p = 0, 0044 + 0, 00506v ; I = 0, 9996 9.4. = 88, 3 + 954,. log ; I = 0, 96 9.5. 55, 43 = 0, 44 + 9.6. Leárí fukce: y = 6,6939 +,6463; I y = 0,97577 Kvadratcká fukce: y = 0,43 + 4,8667 + 3,7354; I y = 0,93043