Regresní analýza 1. Regresní analýza
|
|
- Luboš Holub
- před 8 lety
- Počet zobrazení:
Transkript
1 Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému charakteru reprezentuje nezávisle proměnné náhodný vektor X = (X 1,, X k ) a závisle proměnnou náhodná veličina Y Vektor X může být i nenáhodný, jak bývá v aplikacích časté, anebo jsou rozptyly všech složek X 1,, X k zanedbatelné vůči rozptylu náhodné veličiny Y 1 Pojmy K popisu a vyšetřování závislosti Y na X užíváme regresní analýzu, přičemž tuto závislost vyjadřuje regresní funkce y = ϕ (x, β) = E (Y X = x), kde x = (x 1,, x k ) je vektor nezávisle proměnných (hodnota náhodného vektoru X), y je závisle proměnná (hodnota náhodné veličiny Y ), β = (β 1,, β m ) je vektor parametrů, tzv regresních koeficientů β j, j = 1,, m, a E (Y X = x) je podmíněná střední hodnota Obrázek 1: Závislost Y na X pro k = 1 2 Poznámka Při vyšetřování závislosti Y na X získáme realizací n experimentů (k + 1)-rozměrný statistický soubor ((x 1, y 1 ),, (x n, y n )) s rozsahem n, kde y i je pozorovaná hodnota náhodné veličiny Y i a x i je pozorovaná hodnota vektoru nezávisle proměnných X, i = 1,, n Na Obrázku 1 je znázorněn případ pro k = 1, tedy pro x = x 1 = x (místo x 1 stačí psát x), a s opakovanými pozorováními Opakování pozorování pro danou hodnotu nezávisle proměnné x však v regresní analýze není nezbytné 3 Pojmy Pro určení odhadů neznámých regresních koeficientů β j minimalizujeme tzv reziduální součet čtverců n S = [y i ϕ (x i, β)] 2 a hovoříme o tzv metodě nejmenších čtverců Pro aplikaci regresní analýzy je nezbytné znát tvar (předpis) regresní funkce Obvykle jej volíme tak, aby co nejvíce odpovídal vyšetřované nebo uvažované závislosti Bývá zvykem volit regresní funkci s co nejmenším počtem regresních koeficientů, avšak dostatečně flexibilní a s požadovanými vlastnostmi: monotonie, předepsané hodnoty, asymptoty aj Vychází se přitom povětšinou ze zkušenosti, avšak v současné době se při realizaci regresní analýzy na PC dají často úspěšně použít vhodné databáze regresních funkcí doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
2 Regresní analýza 2 2 Lineární regresní funkce 4 Pojmy Lineární regresní funkce (lineární vzhledem k regresním koeficientům) má tvar y = m β j f j (x), kde f j (x) jsou známé funkce neobsahující regresní koeficientyβ 1,, β m 5 Poznámka Při lineární regresní analýze, kdy hledáme lineární regresní funkci, aplikujeme tzv lineární regresní model založený na předpokladech: 1 Vektor x je nenáhodný, takže funkce nabývají nenáhodných hodnot f ji = f j (x i ) pro j = 1,, m a i = 1,, n f 11 f 1n 2 Matice F = typu (m, n) s prvky f ji má hodnost m < n f m1 f mn 3 Náhodná veličina má střední hodnotu E (Y i ) = m β j f ji a konstantní rozptyl D (Y i ) = σ 2 > 0 pro i = 1,, n 4 Náhodné veličiny Y i jsou nekorelované a mají normální rozdělení pravděpodobnosti pro i = 1,, n 6 Poznámka V části literatury se místo popsaného lineárního regresního modelu také uvádí ekvivalentní lineární model ve tvaru m Y i = β j f j (x i ) + E i, i = 1,, n, kde E i jsou nekorelované náhodné veličiny (vyjadřující např náhodné chyby měření) s normálním rozdělením pravděpodobnosti N ( 0, σ 2) Odhady regresních koeficientů, rozptylu a funkčních hodnot, a také testy statistických hypotéz o regresních koeficientech provádíme pomocí následujících vztahů V nich jsou použita označení matic: n n f 1i f 1i f 1i f mi b 1 H = FF T =, b =, n n b f mi f 1i f mi f m mi y = y 1 y n kde F T značí transponovanou matici, g = Fy = n f 1i y i n f mi y i, doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
3 Regresní analýza 3 7 Vlastnosti Platí: 1 Bodový odhad regresního koeficientu je b j, j = 1,, m, kde matice b je řešení soustavy lineárních algebraických rovnic (tzv soustavy normálních rovnic) 2 Bodový odhad lineární regresní funkce je y = Hb = g m b j f j (x) 3 Bodový odhad rozptylu σ 2 je s 2 = S min n m, ( ) 2 kde Smin = n y i m b j f ji = n yi 2 m b j g j je minimální hodnota reziduálního součtu čtverců a g j je prvek matice g 4 Intervalový odhad regresního koeficientu β j se spolehlivostí 1 α, je b j t 1 α/2 s h jj ; b j + t 1 α/2 s h jj, kde h jj je j-tý diagonální prvek matice H 1 a t 1 α/2 je ( 1 α 2 ) -kvantil Studentova rozdělení s n m stupni volnosti - viz tabulku T2 5 Intervalový odhad střední funkční hodnoty regresní funkce y pro libovolné pevné x se spolehlivostí je m b j f j (x) t 1 α/2 s m h ; b j f j (x) + t 1 α/2 s h, kde h = f (x) T H 1 f (x), přičemž f(x) = f 1 (x) a t 1 α/2 je ( 1 α 2 ) -kvantil Studentova f m (x) rozdělení s n m stupni volnosti - viz tabulku T2 Intervalový odhad individuální funkční hodnoty regresní funkce y pro libovolné pevné x se spolehlivostí 1 α obdržíme analogicky, avšak místo h vezmeme 1 + h 6 Test hypotézy H : β j = β j0 proti alternativní hypotéze H : β j β j0 na hladině významnosti α, kde j je jeden pevně zvolený index,j = 1,, m, provádíme pomocí pozorované hodnoty testového kritéria t = b j β j0 s h jj, W α = t 1 α/2 ; t 1 α/2 a t1 α/2 je ( 1 α 2 ) -kvantil Studentova rozdělení s n m stupni volnosti - viz tabulku T2 Tento test je možno také provést pomocí výše uvedeného intervalového odhadu koeficientu β j se spolehlivostí 1 α 8 Poznámka Z intervalových odhadů střední funkční hodnoty, resp individuální funkční hodnoty, se konstruuje pás spolehlivosti pro střední hodnotu (viz užší pás kolem regresní přímky na obr 2), resp pás spolehlivosti pro individuální hodnotu (viz širší pás kolem regresní přímky na obr 2) Test hypotézy se týká jen jednoho (i když libovolného) regresního koeficientu Současný test více regresních koeficientů je nutno provést pomocí tzv sdružené hypotézy doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
4 Regresní analýza 4 9 Poznámka Orientační mírou vhodnosti vypočtené regresní funkce pro získaná data je koeficient vícenásobné korelace Smin r = 1 y 2 i n (ȳ) 2, resp index (koeficient) determinace r 2, které nabývají hodnot z intervalu 0; 1 Číslo r % vyjadřuje (dle často užívané konvence) procentuální podíl z rozptylu hodnot y i vysvětlený vypočtenou regresní funkcí Hodnoty r (a tím také r 2 ) blízké 1 naznačují vhodnost zvoleného tvaru regresní funkce Pro bližší posouzení vhodnosti vypočtené regresní funkce se provádí její grafický rozbor vzhledem k pozorovaným bodům [x 1, y 1 ],, [x n, y n ] Pro rigorózní závěr je však nutné provést tzv regresní diagnostiku a testovat další statistické hypotézy Regresní funkce rozdělujeme na lineární a nelineární (vzhledem k regresním koeficientům) Některé nelineární regresní funkce můžeme vhodnou linearizací převést na lineární (např mocninnou nebo exponenciální funkci logaritmujeme) Jde sice o běžně používaný postup, kdy však řešíme jiný regresní model nežli původně uvažovaný 10 Poznámka Nejvíce užívanou lineární regresní funkcí pro pozorovaný dvourozměrný statistický soubor (x 1, y 1 ),,(x n, y n ) je funkce y = β 1 + β 2 x, jejímž grafem je tzv regresní přímka Pro tuto funkci je x = x 1 = x (místo x 1 píüeme x), m = 2, f 1 (x) = 1, f 2 (x) = x, takže F = ( ) 1 1 x 1 x n, y = Při ručním výpočtu lze pro regresní funkci použít následující explicitní vztahy, kde pro jednoduchost n značí y 1 y n 11 Vlastnosti Platí: ( 1 1 H = xi ) xi x 2, g = i ( ) yi, xi y i 1 = n, 2 det H = n x 2 i ( x i ) 2, b 2 = n x iy i x i yi det H, b 1 = ȳ b 2 x, 3 Smin = (y i b 1 b 2 x i ) 2 = yi 2 b 1 yi b 2 xi y i, s 2 = S min 4 h 11 x 2 i = det H, h22 = n det H, 5 h = 1 n + (x x)2 x 2 = 1 i n( x) 2 n + n(x x)2 det H, n 2, 6 r = r(x, y), kde r (x, y) je koeficient korelace (viz kapitolu Popisná statistika) 12 Příklad U osmi náhodně vybraných firem poskytujících konzultace v oblasti jakosti výroby byly v roce 1993 zjištěny počty zaměstnanců x a roční obraty y (mil Kč) jak je uvedeno v Tabulce 1: x i y i 0,8 1,2 1,5 1,9 1,8 2,4 2,5 3,1 Tabulka 1: Počty zaměstnanců a roční obraty Vyjádřete závislost ročního obratu firmy na počtu zaměstnanců ve tvaru y = β 1 + β 2 x, vypočtěte intervalový odhad β 2 se spolehlivostí 0,95, testujte na hladině významnosti 0,05 hypotézu H : β 1 = 0, 2, doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
5 Regresní analýza 5 určete bodový a intervalový odhad y (10) se spolehlivostí 0,95 Pomocí grafu a koeficientu korelace r posuďte vhodnost regresní funkce Předpokládejte, že roční obrat má podmíněné normální rozdělení s konstantním rozptylem vzhledem k počtu zaměstnanců Řešení V následující Tabulce 2 jsou pomocné výpočty: i x i y i x 2 i x i y i yi ,8 9 2,4 0, ,2 25 6,0 1, ,5 25 7,5 2, , ,2 3, , ,2 3, , ,4 5, , ,0 6, , ,5 9,61 Σ 68 15, ,2 32,80 Tabulka 2: Pomocné výpočty Vlastní výpočty provedeme v následujících krocích: (1) Jde o( regresní přímku, ) takže s využitím výše uvedených vzorců obdržíme pro n = 8 z tabulky 8 68 matici H =, jejíž determinant je det H = = 928, takže bodový odhad je b 2 = 8 150, , = 0, = 0, 181 Dále je x = 68/8 = 8, 5, ȳ = 15, 2/8 = 1, 9, takže bodový odhad β 1 je b 1 = 1, 9 0, , 5 = 0, = 0, 361 Potom bodový odhad regresní funkce je y = 0, , 181x (2) Minimální hodnota reziduálního součtu čtverců je S min = 32, 80 0, , 2 0, , 2 = 0, a bodový odhad rozptylu σ 2, resp směrodatné odchylky σ, je s 2 = 0, / (8 2) = 0, , resp s = 0, = 0, (3) Diagonální prvky matice jsou h 11 = 694/928 = 0, , h 22 = 8/928 = 0, Z tabulky T2 je pro 8 2 = 6 stupňů volnosti t 0,975 = 2, 447, takže intervalový odhad regresního koeficientu β 2 je β 2 0, , 447 0, , ; 0, , 447 0, , = = 0, ; 0, = 0, 149; 0, 213 Bodový odhad přírůstku ročního obratu odpovídajícího zvýšení stávajícího počtu zaměstnanců firmy o jednoho zaměstnance je tedy Kč a intervalový odhad tohoto přírůstku se spolehlivostí 0,95 je Kč až Kč (4) Pozorovaná hodnota testového kritéria pro je t = 0, , 2 0, = 1, , Pro alternativní hypotézu H : β 1 0, 2 je W 0,05 = 2, 447; 2, 447 Vzhledem k tomu, že t W 0,05, hypotézu H : β 1 = 0, 2 na hladině významnosti 0,05 nezamítáme Na dané hladině významnosti vlastně doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
6 Regresní analýza 6 nezamítáme hypotézu, že firma bez zaměstnanců (pracují jen majitelé), neboť y (0) = β 1, bude mít roční obrat okolo Kč (5) Bodový odhad střední i individuální hodnoty ročního obratu firmy pro 10 zaměstnanců je y (10) = 0, , = 2, = 2, 172 U dané firmy lze tedy očekávat roční obrat okolo Kč Protože h = (10 8, 5)2 928 = 0, , je intervalový odhad se spolehlivostí 0,95 střední hodnoty ročního obratu firmy s 10 zaměstnanci y (10) 2, , 447 0, , ; 2, , 447 0, , = = 2, ; 2, = 2, 041; 2, 302 Se spolehlivostí 0,95 lze očekávat, že střední hodnota ročního obratu takové firmy bude od Kč do Kč Jestliže použijeme ve výpočtu místo h, dostaneme intervalový odhad se spolehlivostí 0,95 individuální hodnoty ročního obratu firmy s 10 zaměstnanci y (10) 2, , 447 0, , ; 2, , 447 0, , = = 1, ; 2, = 1, 804; 2, 539 Se spolehlivostí 0,95 lze očekávat, že roční obrat (individuální hodnota ročního obratu) takové firmy bude od Kč do Kč, viz Obrázek 2 Obrázek 2: Graf regresní přímky a pásů spolehlivosti (6) Koeficient korelace je r = 0, , takže index determinace je r 2 = 0, Z grafu na Obrázku 2 a velikosti koeficientu korelace vidíme, že zvolený tvar regresní funkce vcelku dobře vystihuje danou závislost Podle často používané konvence lze říci, získaná regresní funkce vyjadřuje celkem r % = 96, 98 % změn (variability) pozorovaného obratu firmy doc RNDr Zdeněk Karpíšek, CSc ÚM FSI v Brně, 14 listopadu 2006
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
odpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
Bodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Inovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
Korelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
LINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
AVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Regresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Interpolace, aproximace
11 Interpolace, aproximace Metoda nejmenších čtverců 11.1 Interpolace Mějme body [x i,y i ], i =0, 1,...,n 1. Cílem interpolace je najít funkci f(x), jejíž graf prochází všemi těmito body, tj. f(x i )=y
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Statistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
f(x) = arccotg x 2 x lim f(x). Určete všechny asymptoty grafu x 2 2 =
Řešení vzorové písemky z předmětu MAR Poznámky: Řešení úloh ze vzorové písemky jsou formulována dosti podrobně podobným způsobem jako u řešených příkladů ve skriptech U zkoušky lze jednotlivé kroky postupu
12. prosince n pro n = n = 30 = S X
11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli
Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Cvičící Kuba Kubina Kubinčák Body u závěrečného testu
1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.
Semestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
AVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A
AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Bodové a intervalové odhady parametrů v regresním modelu
Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
Základní statistické metody v rizikovém inženýrství
Základní statistické metody v rizikovém inženýrství Petr Misák Ústav stavebního zkušebnictví Fakulta stavební, VUT v Brně misak.p@fce.vutbr.cz Základní pojmy Jev souhrn skutečností zobrazujících ucelenou
Měření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
Plánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
UNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.
Regresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
Kalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Matematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
Kontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
Normální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.
3.4. Výklad Předpokládejme, že v prostoru E 3 jsou dány body A, B, C neležící na jedné přímce. Těmito body prochází jediná rovina, kterou označíme ABC. Určíme vektory u = B - A, v = C - A, které jsou zřejmě