Matematika pro chemické inženýry

Podobné dokumenty
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Téma 22. Ondřej Nývlt

Pravděpodobnost a aplikovaná statistika

Náhodný vektor a jeho charakteristiky

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

AVDAT Náhodný vektor, mnohorozměrné rozdělení

MATEMATICKÁ STATISTIKA - XP01MST

Základy teorie pravděpodobnosti

Statistika II. Jiří Neubauer

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

f(x) = arccotg x 2 x lim f(x). Určete všechny asymptoty grafu x 2 2 =

I. D i s k r é t n í r o z d ě l e n í

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Aplikovaná numerická matematika

p(x) = P (X = x), x R,

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

PRAVDĚPODOBNOST A STATISTIKA

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

AVDAT Nelineární regresní model

8 Střední hodnota a rozptyl

AVDAT Klasický lineární model, metoda nejmenších

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

NÁHODNÁ VELIČINA. 3. cvičení

10. N á h o d n ý v e k t o r

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza 1. Regresní analýza

NMAI059 Pravděpodobnost a statistika

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

NÁHODNÝ VEKTOR. 4. cvičení

Charakterizace rozdělení

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Náhodné chyby přímých měření

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Chyby měření 210DPSM

Interpolace, ortogonální polynomy, Gaussova kvadratura

1 Rozptyl a kovariance

Náhodné vektory a matice

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Učební texty k státní bakalářské zkoušce Matematika Diferenciální rovnice. študenti MFF 15. augusta 2008

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Odhad parametrů N(µ, σ 2 )

MATEMATICKÁ STATISTIKA

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

7. Rozdělení pravděpodobnosti ve statistice

REÁLNÁ FUNKCE JEDNÉ PROMĚNNÉ

Pravděpodobnost a statistika I KMA/K413

Statistická analýza jednorozměrných dat

7. Analýza rozptylu.

Regresní a korelační analýza

4. Aplikace matematiky v ekonomii

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

0.1 Úvod do lineární algebry

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

Kapitola 10: Diferenciální rovnice 1/14

Vícerozměrná rozdělení

Jevy a náhodná veličina

Úlohy k přednášce NMAG 101 a 120: Lineární algebra a geometrie 1 a 2,

Náhodná veličina a rozdělení pravděpodobnosti

Funkce - pro třídu 1EB

Diskrétní náhodná veličina. November 12, 2008

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Organizace. Zápočet: test týden semestru (pátek) bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část

DEFINICE Z LINEÁRNÍ ALGEBRY

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

Matematika III. Miroslava Dubcová, Daniel Turzík, Drahoslava Janovská. Ústav matematiky

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Funkce a lineární funkce pro studijní obory

Úvodní informace. 17. února 2018

Požadavky ke zkoušce. Ukázková písemka

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

0.1 Úvod do lineární algebry

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Transkript:

Matematika pro chemické inženýry Drahoslava Janovská Lineární a nelineární regrese Přednášky ZS 2016-2017 Sponzorováno grantem VŠCHT Praha, PIGA 413-17-6642, 2016

Povinná látka. Bude v písemkách a bude se zkoušet při ústní zkoušce (žádné označení) Řešené příklady k procvičení - dobrovolné Pro studenty, kteří chtějí vědět víc. Tato látka se nebude přednášet, nebude v písemkách, nebude se zkoušet.

Obsah 1 Vyhodnocování experimentálních dat Náhodná veličina, distribuční funkce Střední hodnota a rozptyl náhodné veličiny Kovariance náhodných veličin 2 Základy regresní analýzy Základní model lineární regrese Ekvivalentní model Metoda nejmenších čtverců 3 Nelineární regrese 4 Literatura k dalšímu studiu

Vyhodnocování experimentálních dat - Při řešení chemicko-inženýrských problémů jsme obvykle schopni odvodit model procesu nebo děje probíhajícího v zařízení, ale... - Často nejsme schopni určit numerické hodnoty parametrů, které v modelu vystupují Z matematického hlediska mohou být modely různé povahy: lineární nebo nelineární algebraické rovnice, obyčejné diferenciální rovnice nebo parciální diferenciální rovnice. Zajímá nás závislost modelu na množině bezrozměrných parametrů. Předpokládáme závislost ve tvaru y = f (x, a), (1) kde x = (x 1, x 2,..., x n) je vektor nezávisle proměnných, a = (a 1,..., a P ) je vektor parametrů, jejichž hodnoty je třeba určit, a y je závisle proměnná (odezva). Předpokládáme, že nezávisle proměnné x i se měří s prakticky zanedbatelnou chybou ve srovnání s chybou měření závisle proměnné y.

Náhodná veličina, distribuční funkce Náhodná veličina Náhodná veličina X je reálná funkce, definovaná na množině všech elementárních jevů Ω s hodnotami v R. Je to tedy funkce, která přiřazuje každému náhodnému pokusu ω Ω reálné číslo X(ω). Náhodné veličiny dělíme na diskrétní jejich obor hodnot je konečná nebo spočetná množina, a na spojité jejich obor hodnot je nespočetná množina. Pravděpodobnost, se kterou náhodná proměnná nabývá určité hodnoty nebo je obsažena v určitém intervalu hodnot, se nazývá rozdělení pravděpodobnosti. Základní možnost, jak popsat pravděpodobnostní rozdělení náhodné veličiny X, je určit její distribuční funkci. Distribuční funkcí náhodné veličiny X nazveme reálnou funkci F(x), x R, definovanou vztahem F(x) = P(X x). Tedy hodnota distribuční funkce v bodě x je pravděpodobnost toho, že náhodná veličina X bude mít hodnotu menší nebo rovnou tomuto x.

Náhodná veličina, distribuční funkce Příklad Příklad: Hraní rulety Sledujme dva hody kuličkou a pozorujme, kolikrát přitom padne lichá. Diskrétní náhodná veličina X má za hodnoty počet kol, v nichž padlo liché číslo. Prostor elementárních jevů tohoto náhodného pokusu (označíme S sudou a L lichou) má čtyři prvky: ω 1 = SS, ω 2 = SL, ω 3 = LS, ω 4 = LL a náhodná veličina má tyto hodnoty: X(ω 1 ) = 0, X(ω 2 ) = X(ω 3 ) = 1, X(ω 4 ) = 2.

Náhodná veličina, distribuční funkce Vlastnosti distribuční funkce Vlastnosti distribuční funkce: 0 F(x) 1, je neklesající, je zprava spojitá, ma konečně nebo nejvýše spočetně mnoho bodů nespojitosti lim x F(x) = 0, lim x F(x) = 1.

Náhodná veličina, distribuční funkce Pravděpodobnostní funkce Diskrétní náhodná veličina X má konečně nebo nejvýše spočetně mnoho hodnot {x 1, x 2,..., x n,... }. Pravděpodobnosti, že tyto hodnoty náhodná veličina nabude, jsou kladné, tj. P(X = x i ) > 0 a platí pro ně x i P(X = x i ) = 1. Říkáme také, že náhodná veličina X ma rozdělení diskrétniho typu. Funkce p(x) = P(X = x) se nazývá pravděpodobnostní funkce diskrétní náhodné veličiny X. Je definovaná pouze na oboru hodnot {x 1, x 2,..., x n,... } náhodné veličiny X a platí p(x i ) > 0, p(x i ) = 1. x i Pravděpodobnostní funkce umožňuje určit distribuční funkci F náhodné veličiny X: F(x) = xi x P(X = x i ) = xi x p(x i ), < x <.

Náhodná veličina, distribuční funkce Tedy distribuční funkce diskrétní náhodné veličiny je nespojitá v bodech x 1, x 2,... v každém x i má skok velikosti P(X = x i ), v intervalech x i ; x i+1 ) je vždy konstantní. Spojitá náhodná veličina X má rozdělení pravděpodobnosti spojitého typu, existuje-li nezáporná reálná funkce f (x) taková, že distribuční funkci F(x) lze vyjádřit ve tvaru F(x) = f (t)dt, < x <. Funkce f (x) je definovaná pro všechna reálná x a nazývá se hustota pravděpodobnosti náhodné veličiny X. Lze ukázat, že takto definovaná distribuční funkce F spojité náhodné veličiny je spojitá pro všechna x a ve všech bodech, v nichž má derivaci, je f (x) = F (x).

Střední hodnota a rozptyl náhodné veličiny Číselné charakteristiky náhodných veličin Střední hodnota náhodné veličiny X je charakteristikou její polohy (myšleno ve smyslu polohy hodnot veličiny X na číselné ose), je to jistá průměrná hodnota, kolem níž náhodná veličina náhodně kolísá. Je-li X náhodná veličina s diskrétním rozdělením pravděpodobnosti, která nabývá hodnoty x 1, x 2,... a má pravděpodobnostní funkci p(x), pak její střední hodnota je číslo E(X) = x i x i p(x i ). Je-li X náhodná veličina se spojitým rozdělením pravděpodobnosti a s hustotu f (x), je její střední hodnota číslo E(X) = xf (x)dx.

Střední hodnota a rozptyl náhodné veličiny Rozptyl charakterizuje kolísání náhodné veličiny kolem její střední hodnoty. Rozptylem náhodné veličiny X nazveme číslo: D(X) = E(X E(X)) 2. Dosadíme-li do tohoto vztahu vzorec pro střední hodnotu pro veličinu s diskrétním a potom se spojitým rozdělením, dostaneme pro rozptyl: Je-li X diskrétní náhodná veličina, je D(X) = x i (x i E(X)) 2 p(x i ). Je-li X spojitá náhodná veličina, je D(X) = Vždy platí D(X) 0. (x E(X)) 2 f (x)dx.

Střední hodnota a rozptyl náhodné veličiny Rozptyl se také značí σ 2. Odmocnině z rozptylu se říká směrodatná odchylka. Tedy σ = D(X). Je-li σ malé, nabývá náhodná veličina s velkou pravděpodobností hodnot, velmi blízkých své střední hodnotě E(X). Rozptyl se často počítá podle vzorce D(X) = E(X 2 ) (E(X)) 2, tedy pro veličinu s diskrétním rozdělením D(X) = xi 2 p(x i ) (E(X)) 2, x i pro veličinu se spojitým rozdělením D(X) = x 2 f (x)dx (E(X)) 2.

Dvojice náhodných veličin Uvažujme dvojici náhodných veličin, někdy říkáme, že tvoří náhodný vektor (X, Y ) nebo také dvourozměrnou náhodnou veličinu. Distribuční funkcí náhodné veličiny (X, Y ) nazveme reálnou funkci F(x.y) definovanou v R 2 vztahem F(x, y) = P(X x, Y y). Střední hodnotou dvourozměrné náhodné veličiny (X, Y ) budeme nazývat dvojici (E(X), E(Y )).

Kovariance náhodných veličin Kovariance náhodných veličin Kromě číselných charakteristik jednotlivých náhodných veličin X a Y jsou důležité číselné charakteristiky, které vyjadřují jejich vzájemnou souvislost: Kovariance náhodných veličin X a Y je číslo cov(x, Y ) = E([X E(X)] [Y E(Y )]) cov(x, X) = E([X E(X)] 2 ) = D(X). K výpočtu kovariance slouží nejčastěji vzorec cov(x, Y ) = E(X Y ) E(X) E(Y ), kde E(X Y ) = x i y j x i y j p(x i, y j ). Kovariance je mírou lineární závislosti veličin X a Y. Pro zhodnocení takové závislosti je ale většinou vhodnější tzv. korelační koeficient ϱ(x, Y ), ϱ(x, Y ) = cov(x, Y ) D(X) D(Y ).

Kovariance náhodných veličin Kovarianční matice Pro korelační koeficient vždy platí 1 ϱ 1. Například závisí-li Y na X lineárně, tj. Y = ax + b, platí: 1 je-li grafem této závislosti rostoucí přímka, čili a > 0, je ϱ = 1, 2 je-li grafem této závislosti klesající přímka, čili a < 0, je ϱ = 1 Je-li kovariance X a Y rovna nule, je také jejich korelační koeficient roven nule a takové veličiny nazýváme nekorelované. Pro takové veličiny pak platí E(X Y ) = E(X) E(Y ). Matice [ cov(x, X) cov(x, Y ) cov(y, X) cov(y, Y ) ] [ = D(X) cov(x, Y ) cov(y, X) D(Y ) ] se nazývá kovarianční matice dvojice náhodných veličin X a Y. Kovarianční matice je analogie k jednorozměrnému rozptylu náhodné veličiny X.

Regresní funkce Funkci η(x) = E(Y (x)) definovanou na definičním oboru A R proměnné x nazveme regresní funkcí. Regresí rozumíme závislost střední hodnoty náhodné veličiny Y (x) na veličině x. Předpokládáme, že známe tvar regresní funkce, a na základě náhodného výběru odhadujeme její neznámé parametry: Vybereme n hodnot x j, j = 1,..., n, x j A, nezávisle proměnné. Pro každé x j napozorujeme (naměříme) realizaci (hodnotu) y j náhodné veličiny Y j : x j, j = 1,..., n, A y j = Y (x j ). Získané dvojice hodnot (x 1, y 1 ),..., (x n, y n) nám poslouží k odhadu neznámých parametrů regresní funkce. Speciální případ: Jednoduchá lineární regresní funkce má tvar η(x) = β 1 + β 2 x, kde β 1, β 2 jsou parametry této funkce, jejichž hodnoty hledáme. Grafem jednoduché lineární regresní funkce je přímka se směrnicí β 2, říkáme, že jde o přímkovou regresi.

Základní model lineární regrese Základní model lineární regrese Model lineární regrese by měl splňovat: 1. Regresní funkce η(x) je lineární funkcí tvaru η(x) = p β k f k (x), k=1 kde f k (x) jsou známé funkce a β k, k = 1,..., p, neznámé parametry. Funkce η je lineární vzhledem k parametrům. 2. Hodnotě x j je přiřazena náhodná veličina Y j, pro kterou platí E(Y j ) = η(x j ), D(Y j ) = σ 2, j = 1,..., n, Druhá rovnice znamená, že rozptyl náhodné veličiny Y nezávisí na x j a je tedy konstantní, což může např. znamenat, že všechny realizace y 1,..., y n náhodných veličin Y 1,..., Y n jsou naměřeny se stejnou přesností. 3. Hodnoty nezávisle proměnné x j, j = 1,..., n, nejsou všechny stejné.

Základní model lineární regrese 4. Matice F = (f ij ), kde f ij = f i (x j ), i = 1,..., p, j = 1,..., n. má hodnost p. Poznamenejme, že počet n dvojic (x j, y j ) musí být větší než počet neznámých parametrů p, přesněji, mělo by platit n p > 2. 5. Náhodné veličiny Y 1,..., Y n jsou nekorelované, t.j. Maticově zapsáno cov(y i, Y j ) = 0, i, j = 1,..., n, i j. C y = σ 2 E n, kde E n je jednotková matice řádu n, C y je matice kovariance veličin Y 1,..., Y n. Příklad Pro regresní přímku, tj. regresní funkci tvaru η(x) = α + βx je počet neznámých parametrů p = 2 a β 1 = α, f 1 = 1, β 2 = β, f 2 = x.

Ekvivalentní model Ekvivalentní model Popsaný model v ekvivalentním tvaru Y j = η(x j ) + ε j = p β k f kj + ε j, j = 1,..., n, (2) k=1 kde hodnoty x 1,..., x n jsou hodnotami nenáhodné proměnné, hodnoty f kj = f k (x j ) splňují podmínku 3. modelu. Pro náhodné chyby ε j, j = 1,..., n, a pro kovarianční matici C ε náhodného vektoru ε = (ε 1,..., ε n) platí E(ε j ) = 0, j = 1,..., n, C ε = σ 2 E n = C y. Rovnici (2) lze zapsat maticově Y = F T β + ε.

Metoda nejmenších čtverců Metoda nejmenších čtverců Odhady neznámých parametrů β 1,..., β p v popsaném modelu lineární regrese budeme hledat metodou nejmenších čtverců. Označme tyto odhady b 1,..., b p, což jsou výběrové funkce náhodného výběru Y 1,..., Y n. Minimalizujeme součet čtverců odchylek napozorovaných hodnot y j od středních hodnot η j = η(x j ), tedy součet čtverců Q(β 1,..., β p) = n (y j η j ) 2 = j=1 ( n y j Odhady b 1,..., b p tedy najdeme jako řešení soustavy rovnic j=1 Q β k = 0, k = 1,..., p. Tato soustava se nazývá soustavou normálních rovnic. ) 2 p β k f kj. k=1

Metoda nejmenších čtverců Soustavu pro hledané odhady b 1,..., b p zapíšeme v přehledném tvaru kde b 1 S 11 + b 2 S 12 + + b ps 1p = S 1y b 1 S 21 + b 2 S 22 + + b ps 2p = S 2y. b 1 S p1 + b 2 S p2 + + b ps pp = S py, S ki = S ky = n f kj f ij, i, k = 1,..., p, j=1 n f kj y j, k = 1,..., p. j=1 Zřejmě S ik = S ki pro i, k = 1,..., p.

Metoda nejmenších čtverců Maticově: Je-li y = (y 1,..., y n) T, b = (b 1,..., b p) T, pak normální rovnice lze zapsat ve tvaru F F T b = F y. (3) Podle předpokladu je h(f ) = p, pak také h(f F T ) = p a F F T je typu p p, regulární = existuje (F F T ) 1, a tedy z rovnice (3) lze vyjádřit vektor b : b = (F F T ) 1 F y, vektor b je jednoznačně určen a jeho jednotlivé složky jsou lineárními kombinacemi hodnot y 1,..., y n. Pozor! Výpočet je extrémně numericky nestabilní, viz přednáška Lineární algebra.

Metoda nejmenších čtverců Příklad Necht regresní přímka prochází počátkem, η(x) = a x, pak f ij = x a β 1 = a. Označme x = (x 1,..., x n) T, F = (x 1,..., x n). Pak F F T = (x 1,..., x n) (x 1,..., x n) T = n j=1 xj 2 = (FF T ) 1 1 = n j=1 x. j 2 Odhad parametru a je a = (F F T ) 1 F y = ( ) n 1 n x T j=1 x jy j y = j=1 x j 2 n j=1 x. j 2

Metoda nejmenších čtverců Příklad Růst ledových krystalů Ledové krystaly byly uloženy do boxu s konstantní teplotou -5 C. Cílem bylo analyzovat růst krystalů jako funkci času. V následující tabulce jsou uvedena naměřená data, y je délka krystalů v mikronech, x je čas v sekundách. Uvedena jsou i opakovaná měření. S využitím přímkové regrese y = β 0 + β 1 x určete parametry β 0 a β 1. x[s] y[mm] x[s] y[mm] 50 19 125 28 60 20, 21 130 31, 32 70 17, 22 135 34, 25 80 25, 28 140 26, 33 90 21, 25, 31 145 31 95 25 150 36, 33 100 30, 29, 33 155 41, 33 105 35, 32 160 40, 30, 37 110 30, 28, 30 165 32 115 31, 36, 30 170 35 120 36, 25, 28 180 38

Metoda nejmenších čtverců Řešení Experimentální data zapíšeme maticově 19 20 21 17 y =. 35 38 X = 1 50 1 60 1 60 1 70.. 1 170 1 180, kde y R n je vektor a X R n p matice. Celkový počet měřicích bodů je n = 43 a p reprezentuje počet parametrů, v tomto případě dva: β 0, β 1. První sloupec matice X má v každém řádku jen 1. Počet navzájem různých měřicích bodů je m = 22. Protože se mnoho experimentů opakuje, je m podstatně menší, než celkový počet měřicích bodů n. Označme n i počet měření pro každé x i, i = 1,..., m, přičemž n = m i=1 n i. Parametry modelu můžeme spočítat následovně: b = [ β 0, β 1 ] = (X T X) 1 X T y = Získali jsme model y = 14.19 + 0.1346 x. [ 14.19 0.1346 ].

Metoda nejmenších čtverců Nejlepší nestranný odhad lineární parametrické funkce Úloha Hledáme nejlepší nestranný odhad lineární funkce parametrů β = (β1,..., β p) T. Uvažujme parametrickou funkci γ = p c k β k = c T β, k=1 kde c = (c 1,..., c p) T je známý nenulový vektor ( c 0). Tvrzení Nejlepším nestranným lineárním odhadem parametrické funkce c T β je výběrová funkce (statistika) g = c T b, kde b je řešením normálních rovnic. E(g) = γ a nejlepší znamená, že rozptyl D(g) je minimální ve třídě nestranných odhadů.

Nelineární regrese Cíl: odhad parametrů a 1,..., a n v nelineární empirické formuli y = f (x, a). Budeme minimalizovat součet čtverců odchylek S(a) = m (f (x j, a) y j) 2 m = qj 2 (a), j=1 j=1 kde q j je residuum j tého měřeného bodu. Označme a + bod, v němž součet čtverců S(a) nabývá svého minima. Hodnotu a + hledáme jako limitu tzv. minimizující posloupnosti a k tak, aby platilo S(a k+1 ) < S(a k ).

Taylorův rozvoj funkce f (zanedbáme členy vyššího řádu než 1): f (x, a) f (x, a k ) + grad T a f (x, ak ) (a a k ) f (x, a) f (x, a k ) + Vyhodnot me aproximativní formuli n j=1 f (x, a k ) a j (a j a k j ). y f (x, a k ) = n j=1 f (x, a k ) a j a k j. Označme Γ(a) Jacobiovu matici, f (x 1, a) f (x 1, a)... a 1 a 2 Γ(a) =. f (x m, a) f (x 1, a)... a 1 a 2 f (x 1, a) a n. f (x m, a) a n.

Hledané řešení: ( 1 + a k = Γ T (a k ) Γ(a )) k Γ T (a k )q(a k ), kde q = (q 1,..., q m). Pomocí + a k vypočteme další iteraci a k+1 = a k + λ + a k, λ (0, 1. První hodnota: λ = 1. Je-li S(a k+1 ) S(a k ), zmenšíme λ. Výpočet provádíme pro Γ T (a k ) Γ(a k ) }{{} + a k = Γ T (a k ) q(a k ). matice n n Proces ukončíme, je-li + a k menší, než zadaná přesnost.

Literatura k dalšímu studiu D. R. Cox, Christl A. Donnelly: Principles of Applied Statistics. Cambridge University Press, 2011. Kubíček M., Dubcová M., Janovská D.: Numerické metody a algoritmy, VŠCHT Praha, 2005 (second edition). Harvey Motulsky, Arthur Christopoulos: Fitting Models to Biological Data using Linear and Nonlinear Regression. A practical guide to curve fitting. 2003, GraohPad Software Inc. San Diego CA, www.graphpad.com. J. Pavlík a kol.: Aplikovaná statistika. Vysoká škola chemicko-technologická v Praze, Praha 2005. Anders Rasmuson, Bengt Andersson, Louise Olsson, Ronnie Andersson: Mathematical Modeling in Chemical Engineering. Cambridge University Press, 2014.