4.1 Regresní úloha a regresní funkce

Podobné dokumenty
1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Měření závislostí. Statistická závislost číselných znaků

S1P Popisná statistika. Popisná statistika. Libor Žák

, jsou naměřené a vypočtené hodnoty závisle

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

7. Analytická geometrie

Nalezení výchozího základního řešení. Je řešení optimální? ne Změna řešení

Optimalizace portfolia

Generování dvojrozměrných rozdělení pomocí copulí

Nepředvídané události v rámci kvantifikace rizika

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Lineární regrese ( ) 2

Tento materiál vznikl díky Operačnímu programu Praha Adaptabilita CZ.2.17/3.1.00/33254

12. N á h o d n ý v ý b ě r

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Úvod do korelační a regresní analýzy

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Teorie chyb a vyrovnávací počet. Obsah:

1. Základy měření neelektrických veličin

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Algebraický výraz je číselný výraz s proměnou. V těchto výrazech se vyskytují vedle reálných čísel také proměnné. Například. 4a 4,5x + 6,78 7t.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Rekonstrukce vodovodních řadů ve vztahu ke spolehlivosti vodovodní sítě

a další charakteristikou je četnost výběrového souboru n.

Obr Lineární diskrétní systém

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

3. DIFERENCIÁLNÍ ROVNICE

Metody zkoumání závislosti numerických proměnných

Odhady a testy hypotéz o regresních přímkách

11. Časové řady Pojem a klasifikace časových řad

U. Jestliže lineární zobrazení Df x n n

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Nejistoty v mìøení III: nejistoty nepøímých mìøení

4.2 Elementární statistické zpracování Rozdělení četností

Matematika I, část II

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

Analytická geometrie

Téma 5: Analýza závislostí

9. Měření závislostí ve statistice Pevná a volná závislost

Analytická geometrie

14. B o d o v é o d h a d y p a r a m e t r ů

PRAVDĚPODOBNOST A STATISTIKA

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

9. Racionální lomená funkce

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Náhodný výběr 1. Náhodný výběr

v. Úkolem regrese (vyrovnání) argumentu y je nalézt vhodnou regresní funkci Y f (x)

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

8. Zákony velkých čísel

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

2. Matice a determinanty

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Deskriptivní statistika 1

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

Pravděpodobnostní model doby setrvání ministra školství ve funkci

8 NELINEÁRNÍ REGRESNÍ MODELY

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

Pravděpodobnost a aplikovaná statistika

VEKTOROVÁ ALGEBRA A ANALYTICKÁ GEOMETRIE V ROVINĚ

Odhady parametrů 1. Odhady parametrů

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

rovinná soustava sil (paprsky všech sil soustavy leží v jedné rovině) rovinný svazek sil rovinná soustava rovnoběžných sil

Komplexní čísla. Definice komplexních čísel

Spolehlivost a diagnostika

[ jednotky ] Chyby měření

Hartre-Fock method (HF)

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

1. Měření ve fyzice, soustava jednotek SI

4.KMITÁNÍ VOLNÉ. Rozlišujeme: 1. nepoddajné vazby - nedovolující pohyb 2. pružně poddajné vazby - dovolují pohyb

NEPARAMETRICKÉ METODY

Užití binomické věty

2.4. INVERZNÍ MATICE

Lineární programování

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

IV. MKP vynucené kmitání

ZPRACOVÁNÍ VÝSLEDKŮ MĚŘENÍ

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

Přednáška č. 2 náhodné veličiny

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

4. B o d o v é o d h a d y p a r a m e t r ů

VYHODNOCENÍ LABORATORNÍHO MĚŘENÍ DEFORMACÍ VLNOPLOCHY S UŽITÍM MATLABU

Přijímací řízení akademický rok 2013/2014 Bc. studium Kompletní znění testových otázek matematika

Úvod do teorie měření

Přijímací řízení akademický rok 2012/2013 Kompletní znění testových otázek matematické myšlení

DISTRIBUČNÍ ÚLOHY (Speciální úlohy LP)

VY_52_INOVACE_J 05 01

6. FUNKCE A POSLOUPNOSTI

Aplikace teorie neuronových sítí

TĚŽIŠTĚ A STABILITA. Těžiště tělesa = bod, kterým stále prochází výslednice tíhových sil všech jeho hmotných bodů, ať těleso natáčíme jakkoli

2. Vícekriteriální a cílové programování

1.3. POLYNOMY. V této kapitole se dozvíte:

Transkript:

Lekce 4 Metoda eeších čtverců Metoda eeších čtverců e další z výkladích skříí statstk M se sezáíe pouze s eí ezákladěší verzí, kd regresí ukce, ěřící průěh závslost, e ukcí edé proěé leárí v paraetrech, případě pro estue learzuící trasorace Budee poocí í řešt regresí úlohu, což e úloha, v íž vsvětluící proěá e řízeá velča a áhodou velčou e pouze vsvětlovaá proěá Součástí etod eeších čtverců e rověž rozklad součtu čtverců odchlek pozorovaých hodot vsvětlovaé proěé od ech průěru a složku vsvětleou regresí a evsvětleou rezduálí složku Rozklad součtu čtverců odchlek ás přvede k charakterstce tezt závslost deu korelace Čtverce deu korelace e de deterace, který vadřue zpravdla v %, akou část rozptlu pozorovaých hodot vsvětlovaé proěé se podařlo oast regresí adustace; ukce leárí v paraetrech; Gaussov orálí rovce; de deterace; de korelace; krtéru eeších čtverců; learzuící trasorace; atce regresorů; etoda eeších čtverců; regresí ukce; rezduálí součet čtverců; řízeá proěá; vsvětlovaá proěá; vsvětluící proěá 4 Regresí úloha a regresí ukce Datový souor e tvoře uspořádaý dvoce hodot [, ] Zatíco hodot sou realzace pozorovaé hodot áhodé velč Y, hodot sou hodot řízeé proěé, echž velkost e určea eperetátore Náhodá velča Y se azývá vsvětlovaá proěá, hodot představuí hodot vsvětluící proěé Cíle úloh e určt průěh závslost vsvětlovaé proěé a ěících se hodotách vsvětluící proěé poocí spoté regresí ukce a zěřt teztu této závslost Pokud de o regresí ukce, oezíe se a ukce edé proěé, které sou avíc leárí v paraetrech Takovouto ukc ůžee zapsat ako součet součů ezáých paraetrů a záých ukcí regresorů vsvětluící proěé Jede z paraetrů, ozačovaý, e asolutí čle regresí ukce Regresí ukc edé proěé leárí v paraetrech zapíšee ako, kde [ ] T e vektor paraetrů a ukce, pro,,,,, které eosahuí žádé další ezáé paraetr, sou regresor Regresor, další regresor sou zpravdla eleetárí ukce hodot, apř,,,log,, Mez tpcké regresí ukce patří apř polo stupě leárí ukce, příka, stupě kvadratcká ukce, paraola, stupě kucká paraola a ohé é Estue ovše oho ukcí, které cho potecálě chtěl použít př řešeí regresí úloh, které však esou leárí v paraetrech, apř ukce,,, + + Řadu těchto ukcí lze podrot learzuící trasorac apř všech uvedeé s výkou posledí Pro ěkteré však learzuící trasorace, ak se právě vděl, eestue

Příklad 4 Budee learzovat regresí ukce epoecálí ukce a + Logartcká trasorace epoecálí ukce: c c log +, kde log, log c c Loeou ukc trasoruee ako + Learzovaou ukc oecě ozačíe ϕ, kde ϕ e learzuící trasoračí ukce Po vzoru příkladu 4 learzuee ukce, + 4 Příklad 4 Neestece learzuící trasorace Např pro ukc + eestue trasorace, která uožla vádřt ve výše uvedeé tvaru Podoě e tou apř u ukce Případ ukcí, pro které eestue learzuící trasorace, se eudee zaývat 4 Metoda eeších čtverců Sestavíe vektor pozorovaých hodot závsle proěé [ ] T a atc regresorů prví sloupec souvsí s tí, že ukce á asolutí čle Vektor paraetrů regresí ukce určíe ako T T Příklad 4 Nalezeí vektoru paraetrů pro kvadratckou regresí ukc + + Matce regresorů, atce 4 T, a koečě vektor T

Vektor e ted řešeí soustav tzv Gaussových orálích rovc všech součt sou Po 4, eíž tá rovce e dáa ako vzoru příkladu 4 ukážee atc regresorů a sestavíe soustavu orálích rovc pro regresí ukc + 4 Lze ukázat, že títo způsoe získaé paraetr,,, po dosazeí do regresí ukce leárí v paraetrech vedou ke splěí dvou podíek z toho ple, Druhý z výrazů představue krtéru eeších čtverců, tzv rezduálí součet čtverců To, že výraz aývá své álí hodot právě pro paraetr,,,, vplývá z toho, že -tá orálí rovce vzke ako parcálí dervace krtéra podle paraetru, položeá rová ule Odtud ázev etoda eeších čtverců Zatíco estue ekoečě oho paraetrů,,,, pro které e splěa prví z oou podíek, estue pro každý tp ukce leárí, kvadratcká, loeá apod e edá sada paraetrů, která splňue druhou podíku Určeí kokrétího tpu ukce eí součástí úloh a e v rukou užvatele Vektor paraetrů regresí ukce,,,, které l staove výše popsaý postupe, edozačý způsoe alzue součet čtverců odchlek pozorovaých a aěřeých hodot závsle proěé pro přede zvoleý tp regresí ukce Příklad 44 Př zkoušeí turí l eperetátore vole otáčk a ěřea rekvece chvěí Pro každou zvoleou hodotu ěrých otáček vsvětluící proěá lo provedeo ěřeí edé až tří hodot ěré rekvece chvěí vsvětlovaá proěá Naěřeé hodot sou zázorě a or 4 Z orázku vplývá, že vhodou regresí ukcí ohla ýt kvadratcká ukce Staovíe ted eí rovc V úloze sou použt tzv ěré velč Každou rozěrou zkálí velču ůžee převést a ezrozěrou a a tervalu ; orovaou ěrou velču poocí vztahu a 4

Or 4 Naěřeé hodot ěrých otáček a ěré rekvece chvěí a uvažovaé regresí ukce K určeí regresí paraol příka e evdetě evhodá staovíe z aěřeých hodot tto velč 4 6; 8,5; 5,55;,65875;,7455; 6,55;,75;,65875 Tto použee k sestaveí soustav orálích rovc z příkladu 4 6,55,75 6 8,5,65875 5,55 8,5 5,55,65875 5,55,65875,7455, eíž řešeí održíe, 6 ; z čehož rovce kvadratcké ukce e,9745;,; vz or 4,9745, +,6 Or 4 Naěřeé hodot a vpočteá regresí paraola Určete př akých ěrých otáčkách ude ěré chvěí álí a staovte eho hodotu 5

4 Rozklad součtu čtverců a de korelace Rezduálí součet čtverců lze vádřt rověž ako rozdíl součtu čtverců pozorovaých hodot kole artetckého průěru a součtu čtverců vrovaých vpočteých hodot kole artetckého průěru př to : Rovce rozkladu součtu čtverců pozorovaých hodot vsvětlovaé proěé rozkládá varaltu pozorovaých hodot vsvětlovaé proěé a složku vsvětleou regresí a složku rezduálí Na toto prcpu e založeo ěřeí tezt závslost poocí deu korelace Or 4 Rozklad součtu čtverců vsvětlovaé proěé, Je-l regresí vsvětlea veškerá varalta pozorovaých hodot vsvětlovaé proěé, e a všech pozorovaé hodot leží přesě a regresí čáře Neí-l regresí vsvětlea žádá varalta, e apř ěí-l se hodot, zůstává kost vz or 4 a čtverce odchlek pozorovaých hodot kole ech artetckého průěru čtverce odchlek vrovaých hodot kole c čtverce odchlek pozorovaých hodot ech artetckého průěru kole hodot vrovaých + 6

Or 4 Etréí případ deu korelace kost K ákresů a or 4 přřaďte, Příklad 45 Výpočet deu korelace Rozklad rovce součtu čtverců odchlek pro vsvětlovaou proěou vedoucí k deu korelace v příkladu 44 e v ázaku:, 9744, 877 +, 89544 a pak,877,9744,9494 Podle očekáváí e závslost poěrě těsá Testováí výzaost deu korelace Hpotézu o ulové hodotě deu korelace prot alteratví hpotéze ověříe poocí testového kr- téra, kde e počet paraetrů regresí ukce ted s výkou Testové krté- ru á sherovo Sedecorovo rozděleí s a Jde o edostraý test, takže vpoč- α ; teá hodota se porovává s taelovaou hodotou pro [ ] Příklad 46 Test výzaost deu korelace Ověříe výzaost deu korelace z příkladu 45,9 59,6 Hpotézu ted a všech sltelých hladách výzaost zaítáe,,9 6 8 eoť pravděpodoost, že de korelace al své hodot áhodou e přlžě Př posuzováí statstcké výzaost deu korelace e třea vzít v úvahu, že eho ízká, evýzaá, hodota eusí ýt utě způsoea eestecí závslost vsvětlovaé proěé, ale příča ůže ýt v evhodé volě tpu ukce závslost estue, e zvoleá ukce eí průěh ěří špatě Pokud cho apř v příkladu 44 použl k vrováí příku, získal cho de korelace, 5, což e zaváděící hodota 4, 9 a pravděpodoost e,49, takže hpotézu 7

o ulové hodotě deu korelace elze a hladě α, zaítout Posledí výpočt l provede s použtí specalzovaého prograového vaveí a čteář s e eůže zkotrolovat Adustace deu korelace Další prolée e esrovatelost hodot deu korelace u ukcí s růzý počte paraetrů Vzhlede k tou, že regresí ukce s větší počte paraetrů á př volě vhodého tpu ukce lepší předpoklad vsthout průěh ukce, á přdáí dalšího paraetru za ásledek zvýšeí hodot deu korelace Proto se provádí tzv adustace deu korelace, která sžue eho hodotu v závslost a počtu paraetrů ukce s výkou paraetru : vzorce e zřeé, že adustace á výza zeéa př alé počtu ěřeí ad Ze + Příklad 47 Adustace deu korelace Provedee adustac vpočteého deu korelace z příkladu 45 ad 5,9,94 Hodota adustovaého deu se ted epatrě sížla de deterace Výše zíěá hodota, často vadřovaá, kde, udává, aká část varalt v % la vsvětlea regresí a azývá se de deterace 44 Prolé learzuící trasorace Použtí learzuící trasorace u ukcí, které esou leárí v paraetrech řada z ch se ěžě používá, eí ez proléů Je-l ukce leárí v paraetrech ve tvaru ϕ, kde ϕ e learzuící trasoračí ukce, e rezduálí součet čtverců odchlek rove [ ϕ ] ϕ t apř log log, apod Je zřeé, že všecha tato krtéra sou esrovatelá s původí krtére z odst 4 Proto esou srovatelé a de korelace, vpočteé př použtí růzých learzuících ukcí Teto prolé se týká rověž [ ϕ ϕ ], které e splěo pouze pro trasorovaé hodot vsvětlovaé proěé Pokud vpočteou ukc podroíe verzí trasorac, kladé a záporé odchlk pozorovaých hodot kole regresí ukce se ž ekopezuí 8

Příklad 48 Datový souor, v ěž vsvětlovaá proěá e epoecálí ukcí vsvětluící proěé, t, l po logartcké trasorac vrová ukcí log, +, 44 V toto případě e log log a ted log log Po odlogartováí e epoecálí ukce,79,, přčež ovše 4, 7 65, zatíco 4, 86 a 4,5 Rovce rozkladu rozptlu pro epoecálí ukc eplatí, protože 96,8 947,8 + 7, 8 de korelace l dokoce větší ež eda, zatíco pro logartovaou ukc e, 996 log Vzhlede k úskalí learzuících trasorací lo vvuto ěkolk algortů pro příou aplkac etod eeších čtverců a ukce, které esou leárí v paraetrech Jedí z těchto algortů lze apř staovt,99,47,, 999 Tto algort eleárí regrese ovše přesahuí ráec tohoto tetu a eudee se zaývat 4 5 6 K příkladu 48 áte k dspozc data Na těchto datech prověříe 9 4 6 6 všech výpočt z příkladu saozřeě s výkou eleárí regrese 4 V techcké pra se vužívá rověž řada ukcí, které aí často složté rovce s oha paraetr, které elze žádý způsoe learzovat Rověž v toto případě se vužívaí v příkladu 48 zíěé procedur eleárí regrese, které sou však výpočetě ohe áročěší Σ Další úlohou o ěřeí závslost e regresí úloha, kd pouze vsvětlovaá proěá e áhodou velčou, zatíco vsvětluící proěá e řízea eperetátore Charakterstkou tezt závslost e v toto případě de korelace a průěh závslost charakterzue spotá regresí ukce Stěžeí etodou řešeí regresích úloh e etoda eeších čtverců, poocí íž určuee sadu paraetrů regresí ukce, která alzue hodotu rezduálího součtu čtverců Metodu eeších čtverců se ukázal edak pro ukce leárí v paraetrech, edak pro ukce, pro ěž estue vhodá learzuící trasorace 4 Metoda eeších čtverců uožňue rozložt součet čtverců pozorovaých hodot vsvětlovaé proěé a složku oasěou regresí a rezduu Na toto prcpu e založe de korelace 5 Závěre e třea zdůrazt, že se se ezaýval a ěřeí závslostí více ež dvou proěých, a případe, kd v regresí úloze gurue regresí ukce, eleárí v paraetrech, pro íž eestue learzuící trasorace 9

4 4 log log + log, + 4 Výsledk sou součástí příkladu 48 Stačí e pouze zkotrolovat Pokuste se pokud ožo co epřesě speckovat a porovat regresí a korelačí úlohu Sestavte soustav orálích rovc pro regresí ukce a, c + log, + + Upřesěte okolost, za kterých ude a >,, c Ta, kde e to ožé, určete de korelace 4 Patří de korelace ez setrcké eo asetrcké charakterstk závslost? 5 Kolk procet varalt chvěí se podařlo oast závslostí a otáčkách turí v příkladu 44? Jak se azývá příslušá charakterstka? 6 Porovete výsledek adustace s dee korelace vpočteý a základě vrováí údaů v úloze 44 poloe stupě,9,95 +,78 +,4777 pro, 9497 7 Jak azvee a vsvětlíe rozdíl? 8 Př zkoušeí traktoru la eperetátore staovea rchlost v khod - ako vsvětluící proěá a ěřea síla a hací ápravě v kn ako vsvětlovaá proěá Zštěá data sou v taulce Ke každé hodotě vsvětluící proěé sou aěře shodě tř hodot vsvětlovaé proěé a ted 8 4 6 8 65 49 44 9 6 5 6 5 4 7 9 6 64 48 4 8 7 4 Ze zkušeostí e záo, že vhodou ukcí e loeá ukce + Řešte úlohu po vzoru příkladů 44 až 47 Soustavu orálích rovc pro tuto ukc ste určoval ve 4