9. REGRESNÍ A KORELAČNÍ ANALÝZA



Podobné dokumenty
} kvantitativní znaky

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Odhady a testy hypotéz o regresních přímkách

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Metody zkoumání závislosti numerických proměnných

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

Momenty a momentové charakteristiky

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Aktivita 1 Seminář základů statistiky a workshop (Prof. Ing. Milan Palát, CSc., Ing. Kristina Somerlíková, Ph.D.)

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Statistické charakteristiky (míry)

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

9. Měření závislostí ve statistice Pevná a volná závislost

PRAVDĚPODOBNOST A STATISTIKA

Charakteristiky úrovně

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

, jsou naměřené a vypočtené hodnoty závisle

Lineární regrese ( ) 2

Interval spolehlivosti pro podíl

8 NELINEÁRNÍ REGRESNÍ MODELY

Úvod do korelační a regresní analýzy

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Téma 4: Výběrová šetření

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

U. Jestliže lineární zobrazení Df x n n

Generování dvojrozměrných rozdělení pomocí copulí

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

7 VYUŽITÍ METOD OPERAČNÍ ANALÝZY V TECHNOLOGII DOPRAVY

Poznámky k tématu Korelace a jednoduchá lineární regrese (Téma není ve skriptech)

11. Časové řady Pojem a klasifikace časových řad

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

a další charakteristikou je četnost výběrového souboru n.

Odhady parametrů 1. Odhady parametrů

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

Přednáška č. 2 náhodné veličiny

KVALITA REGRESNÍHO MODELU Radek Fajfr

IV. MKP vynucené kmitání

[ jednotky ] Chyby měření

Téma 5: Analýza závislostí

,6 32, ,6 29,7 29,2 35,9 32,6 34,7 35,3

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

3. cvičení 4ST201 - řešení

Lekce Úroveň a její měření. aritmetický průměr; geometrický průměr; harmonický průměr; medián; mocninový

Posouzení vlivu vybraných makroekonomických veličin na vývoj systému sociálního zabezpečení

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

12. N á h o d n ý v ý b ě r

ARITMETICKÉ POSLOUPNOSTI s-tého STUPNĚ. Daniela Bittnerová

Univerzita Karlova v Praze Pedagogická fakulta

Téma 1: Pravděpodobnost

Popisná statistika. (Descriptive statistics)

P1: Úvod do experimentálních metod

v. Úkolem regrese (vyrovnání) argumentu y je nalézt vhodnou regresní funkci Y f (x)

Úvod do zpracování měření

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

8. Analýza rozptylu.

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

SP2 Korelační analýza. Korelační analýza. Libor Žák

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Analýza bodové množiny

Intervalové odhady parametrů některých rozdělení.

Chyby přímých měření. Úvod

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

ANALÝZA A KLASIFIKACE DAT

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

4.2 Elementární statistické zpracování Rozdělení četností

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Měření závislostí. Statistická závislost číselných znaků

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Spolehlivost a diagnostika

Obr. DI-1. K principu reverzibility (obrácení chodu paprsků).

Spojité (kontinuální) - nap. podle vykázaného zisku, tržeb, náklad Nespojité (diskrétní) - nap. podle potu len v rodin

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

Testování statistických hypotéz

Téma 11 Prostorová soustava sil

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

Spojitost a limita funkcí jedné reálné proměnné

Optimalizace portfolia

Matematika I, část II

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

8. STATISTICKÝ SOUBOR SE DVĚMA ARGUMENTY

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Univerzita Karlova v Praze Pedagogická fakulta

5 - Identifikace. Michael Šebek Automatické řízení

14. B o d o v é o d h a d y p a r a m e t r ů

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

III. METODY MĚŘENÍ A ZPRACOVÁNÍ MĚŘENÍ

3. cvičení 4ST201. Míry variability

V. Normální rozdělení

Transkript:

Pravděpodobot a tattka 9. REGRESNÍ A KORELAČNÍ ANALÝZA Průvodce tudem V předchozí kaptole jme uvedl způob, jak popat leárí závlot mez dvěma argumety a její míru. Užtím korelačích poměrů je možé zjtt, zda má myl hledat jý typ závlot mez proměým ež leárí. Předpokládaé zalot Pojmy z předchozích kaptol. Cíle Cílem této kaptoly je vyvětlt pojmy regree, korelace, regreí fukce, metoda ejmeších čtverců odchylek, de korelace. Výklad 9.. Leárí regree Grafcké zobrazeí dvojrozměré áhodé velčy, tattcký oubor dvěma tattckým zaky (,y ); =,,..., (korelačí pole): Hledejme vyjádřeí této "tattcké" závlot "ejlepším" fukčím předpem. A pro začátek předpokládejme teto předp leárí:

Pravděpodobot a tattka = a+ b Jako krtérum pro "ejlepší" fukčí předp vezměme z určtých důvodů (zámých už apř. Gauov v počtu pravděpodobot apř. proto, že e takový přítup úpěšě uplatňuje v jých tuacích vz. ukázka pouze a webu) mmalzac umy kvadrátů odchylek emprckých hodot y od teoretckých hodot zíkaých pomocí předpu y t : ( ) ( ) ( ) S a, b = y = a+ b y = m = = Hodota velčy S záví a voltelých hodotách a a b a je to tedy fukce dvou proměých. Její etrém e ajde ulováím parcálích dervací podle těchto proměých. S =. ( a + b y). = 0 a = S =. ( a + b y). = 0 b = Po úpravě dojdeme k outavě leárích rovc pro určeí a a b. (V dalším tetu budeme ěkdy zjedodušovat záp umačí ymbolky.) a. + b. = y. +. = a b y

Pravděpodobot a tattka Tuto outavu můžeme vyřešt moha způoby. Například pomocí determatu matce outavy, který lze upravt a vyjádřeí pomocí rozptylu:, D =. =. takže koefcety rovce přímky akoec jou: y y a =. y. y b =. Po poěkud pracějších úpravách ( využtím vyjádřeí cetrálích mometů pomocí mometů počátečích): y y. y y = +... y y y y...... = + y y...... y y. y = + +. y y.. = y +. y. ( ) ( ) y. = y+. y. ( ) dotáváme jou podobu rovce regreí přímky, z íž vyplývá, že tato přímka prochází

Pravděpodobot a tattka tzv. cetrálím bodem, y (, y jou tředí hodoty proměých, y) a že měrc přímky, tzv. koefcet regree, ovlvňuje jak kovarace, tak rozptyl té proměé, která byla prohlášea za ezávlou: ( ) cov y y y =. Tuto volbu můžeme pochoptelě změt a tak e dojde aalogckou cetou k jé regreí přímce: y ( ) cov y =. y y Vykrelíme-l obě takto zíkaé přímky do jedé ouřadcové outavy, dotaeme tzv. regreí ůžky: cov y cov y Směrce obou regreích přímek by = a b y = azýváme regreí koefcety př závlot y a, rep. a y a mají velm důležtou praktckou terpretac: udávají přírůtek závle proměé př jedotkové změě ezávle proměé. (Dokažte!) Zároveň umožňují vypočít koefcet leárí korelace, který jme výše defoval jako ormovaý míšeý momet druhého tupě, vypočít jým způobem: y.

Pravděpodobot a tattka ( cov y) by. by = = r. y Zaméko přdělíme podle zaméka kteréhokolv regreího koefcetu, apř.: ( ) r g b. b. b = y y y Dá e dokázat, že teto koefcet abývá hodoty z tervalu, a měří vhodot leárí fukce vyjádřt tattckou závlot mez velčam a y. Čím je hodota koefcetu blíže krajím hodotám, tím je áhrada těější. V případě, že teto koefcet abývá hodoty ebo -, leží všechy body a regreí přímce a závlot velč a y je přeě leárí. Staovt tupc oceňující závlot (závlot "labá", "tředí", "lá") eí úkol pro matematka, ale pro profeího odboríka. Podobé tupce bývají oučátí oborových orem. Leárí průběh emuí vždy vythovat vzájemé chováí obou ložek dvojrozměré áhodé velčy. Nc ale etojí v cetě přrozeému zobecěí předešlých úvah a potupů. Uvažujme jako výše korelačí pole (,y ); =,,..., a fukc (kterou volíme pouze jejím charakterem, ale kolv jejím parametry, které určují detalě průběh fukce) = f (, a0, a,, ak ), která by měla vyjádřt vztah mez ložkam a y. A hledejme možu koefcetů a tak, aby byl plě požadavek MNČ (metody ejmeších čtverců):

Pravděpodobot a tattka S(, a, a,, a ) = f (, a, a,, ak) y = m 0 k 0 = Řešeím outavy rovc: (,,,, ) S a a a 0 a j k = 0; j = 0,..., k, vzklé ulováím parcálích dervací fukce S podle jedotlvých hledaých koefcetů, dotaeme hledaou regreí fukc. Mohou však atat problémy algebrackého charakteru. Vzklá outava rovc může být velm eado řeštelá (zvlášť bez použtí výpočetí techky). Proto e zpravdla hledají vhodé regreí fukce pouze mez tzv. adčím fukcem: (,,,, ) = +. ( ) + +. ( ) f a a a a a f a f 0 k 0 k k Ty totž vedou k řešeí outavy leárích rovc, jak lze ado ukázat. Na případy adčích fukcí e čato převádějí fukce multplkatví, jako je apř. fukce mocá č epoecálí. Learzace logartmováím fukčího předpu však obecě dává pouze uboptmálí řešeí z hledka MNČ. Potup ukážeme a regreí fukc = a.e b Tuto fukc použjeme za předpokladu, že rychlot růtu závle proměé je přímo úměrá její velkot. Př určováí kotat a, b zlogartmujeme fukc: l = la + b Jetlže yí položíme Z = l, a = la, je fukce Z = a + b leárí v parametrech a můžeme použít jž zámého potupu. Hledáme tedy mmum fukce ( a ) + b z.

Pravděpodobot a tattka Po etaveí outavy rovc e můžeme vrátt k původím proměým. Soutava bude mít tedy tvar: N l a+ b = l y l a + b = l y Podobě potupujeme apř. pro fukc = a. b (kde b eí přrozeé čílo) ebo = a + b Φ (v tomto případě lze použít traformace ( ) Z = ). Pozámka Hledko umercké áročot regreí aalýzy e tává v oučaé době druhořadé, eboť tadardí počítačové programy abízejí automatzovaé řešeí této úlohy. Podtatější problém atává př měřeí vhodot regreí fukce. Koefcet leárí korelace tu ztrácí vůj výzam a je třeba ajít jou míru těot uvažovaého vztahu a daého korelačího pole. Zaveďme tato ozačeí pro pecálím způobem defovaé rozptyly: ( y ) y =. y ( ) =. y = ( y ), y. když je fukčí hodota regreí fukce přílušá -té -ové ložce. Všměme, jaký mez m etuje vztah:

Pravděpodobot a tattka ( ) ( ) ( ) ( ) (( y ) ( y) ( y ) ( y) ). ( ). ( ) y =. y y =. y + y =. + +.. = = y. + + y y Dá e dokázat (ukázka pouze a webu), že poledí výraz a pravé traě je rove ule. Pak = + y y a podíl = 0; bývá používá jako míra těot, vhodot y y y regreí fukce (koefcet determace). Udává vlatě, jaká čát dperze zaku y je způobea závlotí a. Doplěk koefcetu determace do jedé zameá podíl áhodé ložky a dperz. Odmoca I y = = (de korelace) má aalogckou y y y terpretac jako koefcet korelace (pro leárí regreí vztah jde o zcela totožý výledek). Pozámka K poouzeí míry vhodot regreí fukce může loužt také pouze hodota = y ( ) y. - rezduálí (zbytkový) oučet čtverců (rozptyl). Nejvhodější regreí fukcí je pak amozřejmě ta fukce, která má rezduálí oučet čtverců ejžší. Řešeé úlohy Příklad 9... Vyrovejte data v tabulce regreí přímkou 5 5 5 35 45 55 65 y 3,5 5, 5,5 6, 5,9 6,4 7,8 Řešeí: Ukážeme, jak by e tato úloha řešla v Ecelu: Nejdříve ozačíme data a klkeme a Vložt Graf..., přčemž vybereme typ grafu

Pravděpodobot a tattka X bodový: Máme-l aktví oko grafu, v abídce Ecelu přbude položka Graf, vybereme možot Přdat pojc tredu...:

Pravděpodobot a tattka Chceme-l daty proložt přímku, vybereme Typ tredu - leárí: Pro zobrazeí rovce regree a hodoty polehlvot R (druhá moca deu korelace) klkeme a kartu Možot a zaškrteme přílušé položky: Koečá podoba řešeí:

Pravděpodobot a tattka Z grafu vdíme, že rovce regree je: y = 0,056. + 3,8089, de korelace: I = 0,8635 = 0,99 y V tomto případě etuje další možot, jak vypočít koefcety a, b v rovc regree a de korelace. Rovc regree vypočteme pomocí v Ecelu předdefovaé fukce LINREGRESE, kterou ajdeme v kategor tattcké. Nuto mít a pamět, že výledkem budou dvě hodoty, proto před vyvoláím této fukce ozačíme dvě buňky vedle ebe a př použtí tkeme oučaě klávey CTRL+SHIFT+ENTER (matce a výtupu). V ašem příkladě by e tato fukce zadávala takto: LINREGRESE(C3:C9;B3:B9;). Ide korelace je v tomto případě hodý koefcetem korelace (vz. kaptola 8), tudíž použjeme předdefovaou fukc: CORREL(B3:B9;C3:C9) Předchozí úlohu můžete otevřít vyřešeou v Ecelu.

Pravděpodobot a tattka Pozámka Na druhém ltě řešeí předchozího příkladu v Ecelu je provedea regreí aalýzu pomocí doplňkového átroje Aalýza dat (použtí popáo v 7. kaptole, příkladu 7.3..), aalytcký átroj Regree. Pozámka Jak je patré z třetího obrázku v řešeí předchozího příkladu, obdobě bychom potupoval v případě, že bychom potřeboval daty proložt apř. logartmckou, epoecálí, mocou fukc, případě polyom.-6. tupě. Řešeé úlohy Příklad 9... Charakterzujte závlot proměé y a regreí fukcí ve tvaru hyperboly b y = a+ 55 55 55 65 65 65 75 75 75 85 85 95 95 95 y 3 3,6 4,,8,4 3,8,4 3,8,4,8,4 3 Řešeí: Úlohu vyřešíme opět v Ecelu, použjeme obdobě jako v předchozím příkladě předdefovaou fukc LINREGRESE, která počítá koefcety v leárí regreí fukc y = a. + b. Pouze míto proměé do této rovce doadíme proměou : Tato fukce je v tomto příkladě kokrétě zadáa LINREGRESE(C3:P3;C4:P4;) 55,45 Řešeím je tedy regreí křvka ve tvaru hyperboly: y = 0, 44 +

Pravděpodobot a tattka Podobým způobem vypočteme de korelace: CORREL(C3:P3;C4:P4). Ide korelace je tedy rove: I y = 0,608. Tuto úlohu můžete otevřít vyřešeou v Ecelu. Pozámka Podobě bychom mohl amozřejmě hledat koefcety v dalších regreích fukcích ve tvaru ve tvaru y = a.f() + b (apř. y = a. 3 + b). V rámc cvčeí e věujte áledujícím úlohám: alezeí regreí přímky př tadardím zadáí ouboru bodů (, y ) (potup př řešeí v Ecelu) alezeí regreí přímky př zadáí dvojrozměrého ouboru četotí tabulkou (dokočete řešeí příkladu z mulé kaptoly) alezeí eleárí regreí fukce podle abídky kalkulátoru Ecel alezeí eleárí regreí fukce podle MNČ bez předešlé learzace (užtím umerckého řešeí, které abízí řeštel Ecelu (epoecála, mocá fukce) hledáí zadáí úloh z odboré profee čteáře, které by vedly a regreí aalýzu

Pravděpodobot a tattka Úlohy k amotatému řešeí 9.. Charakterzujte závlot proměé y a regreí fukcí ve tvaru = a + b 5 5 5 35 45 55 65 y 3,5 5, 5,5 6, 5,9 6,4 7,8 9.. Charakterzujte závlot proměé y a regreí fukcí ve tvaru: b a) = a + b) = a + b + c Určete dey korelace 3 4 6 y 0 4 5 5 9.3. Př ekoku parašutty byla měřea závlot mez rychlotí v [m/] a tlakem p [0,mPa] a povrchu padáku. Výledky vyrovejte parabolou p = a + bv. Vypočtěte de korelace. v,4 3,5 5 6,89 0 p 0,04 0,08 0,056 0,5 0,5 9.4. Charakterzujte těot zvoleé závlot ve tvaru = a + b. log mez proměým a y. Vypočtěte de korelace. 3 3 5 6 7 7 y 70 04 6 0 00 50 40 60 9.5. Př zjšťováí závlot velč a y byly aměřey hodoty uvedeé v tabulce. Určete vhodou regreí fukc. 55 55 55 65 65 65 75 75 75 85 85 95 95 95 y 3 3,6 4,,8,4 3,8,4 3,8,4,8,4 3 9.6. Zjšťovalo e, zda u ouboru chlapců je závlot v počtu provedeých hybů a klků. Výledky jou zazameáy v tabulce: chlapec 3 4 5 6 7 8 9 0 3 4 5 počet hybů 3 0 5 6 4 3 5 6 8 počet klků 0 5 5 0 40 5 7 3 30 35 4 0 4 9 64 a) Určete, zda je mez počtem hybů a počtem klků lá leárí závlot, určete její míru. b) Najděte ejvhodější regreí fukc závlot mez počtem hybů a klků.

Pravděpodobot a tattka Výledky úloh k amotatému řešeí 9.. y = 0, 056 + 3, 809 5, 565 9.. a) = 6, 06 ; I = 0, 985 ; b) = 5, +, 94 0, 93 ; I = 0, 99 9.3. p = 0, 0044 + 0, 00506v ; I = 0, 9996 9.4. = 88, 3 + 954,. log ; I = 0, 96 9.5. 55, 43 = 0, 44 + 9.6. Leárí fukce: y = 6,6939 +,6463; I y = 0,97577 Kvadratcká fukce: y = 0,43 + 4,8667 + 3,7354; I y = 0,93043