Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Podobné dokumenty
Lineární regrese ( ) 2

Metody zkoumání závislosti numerických proměnných

PRAVDĚPODOBNOST A STATISTIKA

SP2 Korelační analýza. Korelační analýza. Libor Žák

, jsou naměřené a vypočtené hodnoty závisle

PRAVDĚPODOBNOST A STATISTIKA

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Generování dvojrozměrných rozdělení pomocí copulí

Úvod do korelační a regresní analýzy

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Interpolace a aproximace. Interpolace algebraickým polynomem a aproximace metodou nejmenších čtverců

v. Úkolem regrese (vyrovnání) argumentu y je nalézt vhodnou regresní funkci Y f (x)

9. Měření závislostí ve statistice Pevná a volná závislost

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Téma 5: Analýza závislostí

VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI

Přednáška č. 2 náhodné veličiny

Komplexní čísla. Definice komplexních čísel

Regresní a korelační analýza

Doc. Ing. Dagmar Blatná, CSc.

14. B o d o v é o d h a d y p a r a m e t r ů

Charakteristiky úrovně

PRAVDĚPODOBNOST A STATISTIKA

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

8.1.2 Vzorec pro n-tý člen

KVALITA REGRESNÍHO MODELU Radek Fajfr

Náhodné jevy, jevové pole, pravděpodobnost

Spolehlivost a diagnostika

4.2 Elementární statistické zpracování Rozdělení četností

7. Analytická geometrie

8.1.2 Vzorec pro n-tý člen

Pravděpodobnostní modely

0. 4b) 4) Je dán úhel Urči jeho základní velikost a převeď ji na radiány. 2b) Jasný Q Q ZK T D ZNÁMKA. 1. pololetí

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

8. Analýza rozptylu.

Odhady parametrů 1. Odhady parametrů

MATICOVÉ HRY MATICOVÝCH HER

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

S k l á d á n í s i l

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Optimalizace portfolia

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Úvod do zpracování měření

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Důkazy Ackermannova vzorce

8 NELINEÁRNÍ REGRESNÍ MODELY

Statistická rozdělení

Rovnice 1.řádu. (taková řešení nazýváme singulární řešení). řeší rovnici (*) na intervalu ( a, b)

Intervalové odhady parametrů některých rozdělení.

PRAVDĚPODOBNOST A STATISTIKA

1. Základy měření neelektrických veličin

Statistické charakteristiky (míry)

Pravděpodobnost a aplikovaná statistika

IAJCE Přednáška č. 12

Rozhodovací stromy. Úloha klasifikace objektů do tříd. Top down induction of decision trees (TDIDT) - metoda divide and conquer (rozděl a panuj)

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Univerzita Karlova v Praze Pedagogická fakulta

5. Lineární diferenciální rovnice n-tého řádu

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

Jednoduchá lineární regrese

3. Charakteristiky a parametry náhodných veličin

[ jednotky ] Chyby měření

8. Odhady parametrů rozdělení pravděpodobnosti

5 - Identifikace. Michael Šebek Automatické řízení

2. Vícekriteriální a cílové programování

Analytická geometrie

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

ANALÝZA A KLASIFIKACE DAT

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

12. N á h o d n ý v ý b ě r

3. Lineární diferenciální rovnice úvod do teorie

3. cvičení 4ST201 - řešení

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

u, v, w nazýváme číslo u.( v w). Chyba! Chybné propojení.,

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Hartre-Fock method (HF)

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

} kvantitativní znaky

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

2. TEORIE PRAVDĚPODOBNOSTI

4. B o d o v é o d h a d y p a r a m e t r ů

Deskriptivní statistika 1

k(k + 1) = A k + B. s n = n 1 n + 1 = = 3. = ln 2 + ln. 2 + ln

1.7.4 Těžiště, rovnovážná poloha

V. Normální rozdělení

Národní informační středisko pro podporu kvality

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Pro orientaci v této problematice jsme se seznámili s nkolika novými pojmy:

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Obyčejné diferenciální rovnice. Cauchyova úloha Dirichletova úloha

Transkript:

Regrese Aproxmace metodou ejmeších čtverců v v ( ) = f x v v x x x x Je dáo bodů [x, ], =,,, předpoládáme závslost a x a chceme ajít fuc, terá vsthuje teto tred - Sažíme se proložt fuc = f x ta, ab v = m ( ) =

Fuc fucí ( ) = f x obvle hledáme ve tvaru leárí ombace elemetárích = c g (x) + c g (x) +... + c g (x) Kde g, g,,g, jsou vhodě zvoleé (zadaé) fuce a c, c,,c jsou hledaé ostat. v = = c c c = Φ c c = = = ( ) ( g (x ) g (x )... g (x )) (,,...,c ) - rterálí fuce ( c, c,...,c ) ( c g (x ) c g (x )... c g (x )) m = Φ = =

Φ = ( c g (x ) c g (x )... c g (x )) ( g (x )) = 0 c = Φ = ( c g (x ) c g (x )... c g (x )) ( g (x )) = 0 c = Φ = ( c g (x ) c g (x )... c g (x )) ( g (x )) = 0 c = g (x ) + g (x ) g (x ) +... + g (x ) g (x ) = g (x ) = = = = c c c g (x ) g (x ) + g (x ) +... + g (x ) g (x ) = g (x ) = = = = c c c c = = g (x ) g (x ) + c g (x ) g (x ) +... + c g (x ) = g (x ) = = soustava ormálích rovc (soustava leárích rovc)

Poz.: V prax se úloha řeší ta,že pro zadaá data se sestrojí celá moža regresích fucí a z í se pa vbere ejlépe aproxmující fuce. K výběru té ejlepší používáme buď rtéra součtu vadrátů odchle (hodota rterálí fuce) ebo dexu orelace (podíl směrodatých odchle) I = ( ) ( )

Př.: Odvozeí soustav ormálích rovc pro regresí přímu = a+ b x c = a, c = b, fuce g (x)=, g (x)=x Je dáo bodů [x, ], =,, rterálí fuce: = = = Φ ( ab, ) = v = ( ) Φ ( ab, ) = ( a b x) = m = ( + a+ b x ) = 0 ( x + a x + b x ) = 0 = Φ = ( a b x) ( ) = 0 a = Φ = ( a b x)( x) = 0 b = a+ b x = = = = a x + b x = x = = = a + b x = = = = = = a x + b x = x

Př.: Odvozeí soustav ormálích rovc pro regresí parabolu = a+ b x+ c x c = a, c = b, c 3 =c fuce g (x)=, g (x)=x, g 3 (x)=x Je dáo bodů [x, ], =,, rterálí fuce: = = Φ ( abc,, ) = v = ( ) ( abc,, ) ( a b x c x ) m = Φ = = Φ = = a ( a b x c x ) ( ) 0 = Φ = = b ( a b x c x )( x) 0 = Φ = = c ( a b x c x )( x ) 0 =

( + a+ b x + c x ) = 0 = 3 ( x + a x + b x + c x ) = 0 = 3 4 ( x + a x + b x + c x ) = 0 = a+ b x + c x = = = = = 3 a x + b x + c x = x = = = = 3 4 a x + b x + c x = = = = x = = = = a + b x + c x = 3 = = = = a x + b x + c x = x 3 4 = = = = a x + b x + c x = x

Př.: Odvozeí soustav ormálích rovc pro regresí hperbolu c = a, c = b, fuce g (x)=, g (x)=/x Je dáo bodů [x, ], =,, rterálí fuce: = = b = x Φ ( ab, ) = v = ( ) Φ ( ab, ) = ( a ) = m = a b = x x x = a+ b ( + a+ ) = 0 x ( + + ) = 0 b x Φ b = ( a ) ( ) = 0 a x = Φ b = ( a )( ) = 0 b x x = b a+ = x = = = a b + = = x = x = x a + b = x = = a + = b = x = x = x

Poz.: Je-l hledaá fuce ve tvaru leárí ombace elemetárích fucí = c g (x) + c g (x) +... + c g (x) jedá se o leárí regres a její řešeí vede a soustavu leárích rovc. Poud je hledaá fuce v jém tvaru, jedá se o eleárí regres a její řešeí vede a soustavu eleárích rovc. Řešeí eleárí soustav rovc je problematcé evíme, ol řešeí exstuje a poud ějaé řešeí alezeme ta evíme, jestl je ejlepší možé. Soustavu eleárích rovc lze řešt umerc. Ve specálích případech můžeme eleárí regres learzovat.

Learzovatelá eleárí regrese. = = c g ( x) = Φ ( c, c,...,c ) = ( ) = ( ) = = = = = ( c g (x ) c g (x )... c g (x )) pro porováí s jým regresím fucem použjeme hodotu = ( )

Learzovatelá eleárí regrese. bx = a e = l() = = Φ (A,b) = ( ) = (l( ) l( )) = (l( ) l( a) b x) (l( ) A b x), A=l(a) = = = = Koefcet A, b ajdeme stejě jao u regresí přím, místo souřadc se zadávají jejch logartm. a = e A pro porováí s jým regresím fucem použjeme hodotu = ( )

Learzovatelá eleárí regrese 3. b = a x = l() = = Φ (A,b) = ( ) = (l( ) l( )) = (l( ) l( a) b l( x)) (l( ) A b l( x)), A=l(a) = = = = Koefcet A, b ajdeme stejě jao u regresí přím, místo souřadc x, se zadávají jejch logartm. a = e A pro porováí s jým regresím fucem použjeme hodotu = ( )

x x^ x* x^4 x^3 x^* ~ ~ (-~)^ (-~)^ ^ ~^ ~^ 4 4 4 3,4 3,68574 0,36 0,0987755 6,56 3,58449 3 4 6 6 8 4, 4,05743,44,7550 9 7,64 6,4604 3 3 6 9 8 8 7 54 5 4,7486,65306 36 5,449 4 4 5 6 0 56 64 80 5,8 5,65743 0,64 0,4383673 5 33,64 3,0037 5 5 7 5 35 65 5 75 6,6 6,88574 0,6 0,0306 49 43,56 47,4306 sum 5 5 55 83 979 5 35 5 5 3,6 3,34857 35 3,4 3,6857 A: 55 5 b: 83 A: 979 5 55 b: 35 5 5 5 5 55 5 83 55 5 5 5 A^-: 0, -0,3 x: 0,8 =a -0,3,,6 =b A^- 0,0749-0,4857 0,5 x: 0,48574 =a -0,4857,6749-3,3-0,05749 =b x 0,5-3,3 4,6 3,6 =c 0,6 3,6 0,,68 3,59574 I= 0,8 0,,76 3,59486 I= 0,8766 0,3,84 3,59574 0,4,9 3,6 0,5 3 3,60743 regrese 0,6 3,08 3,6743 0,7 3,6 3,63 9 bod 0,8 3,4 3,64574 0,9 3,3 3,66486 8 3,4 3,68574 7 =a*x+b, 3,48 3,7, 3,56 3,73743 6,3 3,64 3,76743 5 =a*x^+b*x+c,4 3,7 3,8,5 3,8 3,83574 4,6 3,88 3,87486 3,7 3,96 3,9574,8 4,04 3,96,9 4, 4,00743 4, 4,05743, 4,8 4, 0 -, 4,36 4,6574 3 5 7,3 4,44 4,486

Idex determace Zaveďme tato ozačeí pro specálím způsobem defovaé rozptl: = ( ), ( ) sy = Y Y, s ( ) x = Y s = = = de jsou zadaé -ové souřadce Y jsou fučí hodot regresí fuce příslušá -té x- ové složce. Platí mez m vztah: s = = Y + Y + = = = = ( ) ( ) ( ) ( ) (( Y) ( Y ) ( Y) ( Y ) ) = + + + = = s + s + Y Y x Y = ( ) ( ).

Idex determace Pro leárí regres, u teré je v leárí ombac fuce je = je rove ule. pravé straě ( Y ) ( Y ) = Y a posledí výraz a Potom s = s + s a podíl x Y s s s = bývá používá jao míra těsost, vhodost Y x s regresí fuce azývaá oefcet determace. Udává vlastě, jaá část dsperze zau je způsobea závslostí a x. Doplě oefcetu determace do jedé zameá podíl áhodé slož a dsperz. Odmoca I x = s s Y s = s se azývá dex orelace. x