4EK216 Ekonometrie. Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, 30. října 2015

Rozměr: px
Začít zobrazení ze stránky:

Download "4EK216 Ekonometrie. Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, 30. října 2015"

Transkript

1 4EK216 Ekonometrie Příklady ke cvičením Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 30. října 2015 Cvičení 1: Opakování základní práce s lineárním regresním modelem Příklad 1.1. (Ojeté škodovky.) Pro tento příklad použijte data ze souboru skoda.csv. Data pocházejí z ledna 2004 a týkají se 328 ojetých vozů značky Škoda; konkrétně jde o modely Octavia, Felicia a Superb. a ) Odhadněte lineární regresní model, který vysvětluje cenu vozidla pomocí všech dostupných regresorů. Proč byly z modelu vyřazeny některé proměnné? Vysvětlete. b ) Odhadněte model znovu, tentokrát vynechejte vysvětlující proměnné rok, felicia a benzin. Interpretujte koeficienty a porovnejte je s předchozími výsledky. c ) Otestujte přítomnost heteroskedasticity pomocí Whiteova a Breuschova-Paganova testu. Potvrdí-li se výskyt heteroskedasticity, odhadněte model znovu za použití robustních směrodatných chyb. d ) Na základě odhadnutého modelu určete, zdali má typ paliva statisticky významný vliv na cenu vozidla. e ) Určete, jakou prodejní cenu byste očekávali (v lednu 2004) pro škodu Felicii, která má najeto km, motor 1.9D a je vyrobena v roce Příklad 1.2. (Práce s logaritmy.) V tomto příkladě pracujte se shodnými daty, jako v příkladu 1.1. a ) Odhadněte lineární regresní model, který vysvětluje logaritmus ceny vozidla pomocí všech dostupných regresorů. b ) Na základě odhadnutého modelu určete co nejpřesněji, kolik procent ceny ztratí vozidlo, které bude tři roky stát na místě (tj. zestárne o tři roky při nezměněných hodnotách ostatních regresorů). c ) Na základě odhadnutého modelu určete, zdali má typ paliva statisticky významný vliv na cenu vozidla. d ) Určete, jakou prodejní cenu byste očekávali (v lednu 2004) pro škodu Felicii, která má najeto km, motor 1.9D a je vyrobena v roce Pozor na predikci ceny vozu na základě modelu, který vysvětluje logaritmus ceny.

2 4EK216 Ekonometrie: Příklady ke cvičením 2 Příklad 1.3. (Lineární restrikce koeficientů.) Uvažujte model, který vysvětluje závislost mezd (wage) na vzdělání (v letech, educ), pracovních zkušenostech (v letech, exper) a době strávené u aktuálního zaměstnavatele (v letech, tenure), ve tvaru log.wage/ D ˇ0 C ˇ1educ C ˇ2exper C ˇ3tenure C u: a ) Formulujte nulovou hypotézu, že dodatečný rok všeobecných pracovních zkušeností má stejný dopad na mzdu jako další rok strávený u stávajícího zaměstnavatele. b ) Odhadněte zadaný model pomocí dat ze souboru wage.csv. Testujte hypotézu z předchozího bodu proti oboustranné alternativě na hladině významnosti 5 %. Příklad 1.4. (Práce se čtverci.) Použijte data ze souboru wage2.csv k odhadu modelu, který popisuje závislost mezd (wage) na vzdělání (v letech, educ), pracovních zkušenostech (v letech, exper) a rodinném stavu (married je nula-jednotkový indikátor ženatých/vdaných respondentů): log.wage/ D ˇ0 C ˇ1age C ˇ2age 2 C ˇ3educ C ˇ4exper C ˇ5married C u: Smysl kvadratického členu spočívá samozřejmě v tom, aby umožnil běžný průběh životního cyklu z hlediska mezd: v mládí mzdy zpravidla nejprve rostou, k stáru ovšem postupně začnou klesat závislost mezd na věku má tedy podobu obrácené u-křivky. a ) Po odhadu modelu otestujte přítomnost heteroskedasticity, pokud se potvrdí, pracujte dále s robustními směrodatnými chybami. b ) Na základě odhadnutého modelu testujte, zdali má věk respondenta vliv na jeho mzdu; formálně popište nulovou hypotézu, testujte na 5% hladině významnosti. c ) Poukazují odhadnuté koeficienty na výše zmíněnou obrácenou u-křivku? d ) Určete bodový odhad bodu zlomu, tj. počtu let, při kterém se začíná s věkem snižovat mzda. e ) Jaký je očekávaný přírůstek mzdy mezi 30. a 31. rokem života (při jinak stejných charakteristikách respondenta)? f ) Testujte, zdali je v odhadnutém modelu nezbytná kvadratická závislost mezi logaritmem mezd a věkem, či zda by stejně dobře posloužila závislost lineární. g ) Z rovnice vynechejte druhou mocninu proměnné age a znovu odhadněte; poté ověřte vhodnost výsledného funkčního tvaru pomocí Ramseyova RESET testu. Příklad 1.5. (Práce s interakcemi.) V tomto příkladu pracujte se stejným datovým souborem jako v příkladu 1.3, tj. se souborem wage.csv. a ) Ověřte pomocí dostupných hypotézu, že osoby žijící ve svazku manželském vydělávají více než jejich svobodné protějšky s jinak srovnatelnými charakteristikami. Navrhněte vhodný funkční tvar modelu, za kontrolní proměnné volte vzdělání, pracovní zkušenosti, indikátor bydliště v urbánních oblastech a pohlaví. Zapište formálně nulovou a alternativní statistickou hypotézu, testujte na hladině významnosti 5 %.

3 4EK216 Ekonometrie: Příklady ke cvičením 3 b ) Lze předpokládat, že vliv manželství na mzdu se pro muže a pro ženy liší. V dnes již spíše historickém rodinném modelu, který se ovšem může v našich datech z USA z roku 1976 stále projevit, ležela hlavní zodpovědnost za obstarání finančních prostředků na manželovi přírůstek mzdy v důsledku manželství lze tedy očekávat vyšší pro muže než pro ženy. Je-li to třeba, upravte funkční tvar závislosti z bodu a tak, aby model umožnil rozlišit vliv manželství na muže a na ženy. Jaký je odhadovaný dopad manželství na mzdu mužů podle tohoto modelu? A na mzdu žen? Je mezi těmito dvěma efekty statisticky významný rozdíl? Proved te formální statistický test na 5% hladině významnosti, volte jednostrannou alternativu, která souhlasí s popsaným rodinným modelem. c ) Je podle posledního modelu efekt manželství na mzdu ženy statisticky významný? Příklad 1.6. (Lineární pravděpodobnostní model.) K tomuto příkladu, převzatému z (Wooldridge, 2009:298), použijte data ze souboru 401ksubs.csv. Termínem 401(k) se v USA označuje forma důchodového spoření, na které přispívá zaměstnanci zaměstnavatel. Proměnná e401k je nula-jednotkovým indikátorem toho, zda je respondent způsobilý vstoupit do programu 401(k). a ) Pomocí OLS odhadněte lineární pravděpodobnostní model pro proměnnou e401k, za vysvětlující proměnné volte inc, inc 2, age, age 2, a male. Vypočtěte jak běžné směrodatné chyby, tak i verzi robustní vůči heteroskedasticitě. Vyskytly se mezi oběma verzemi nějaké zásadní rozdíly? b ) Máte v úmyslu použít speciální podobu Whiteova testu na heteroskedasticitu, kde se v pomocné regresi vysvětlují čtverce reziduí, Ou 2, pomocí první a druhé mocniny vyrovnaných hodnot závisle proměnné, Oy a Oy 2. Ukažte, že s rostoucím počtem pozorování by koeficient u Oy konvergoval podle pravděpodobnosti k 1, koeficientu u Oy 2 k 1 a intercept k 0. Návod: Pomněte, že v lineárním pravděpodobnostním modelu je var.y j x/ D p.x/œ1 p.x/, kde p.x/ D x. c ) Odhadněte zmiňovanou podobu Whiteova testu a porovnejte získané koeficienty s teoretickými závěry z bodu b. d ) Ověřte, že všechny vyrovnané hodnoty v modelu odhadnutém v a jsou mezi nulou a jednotkou. Následně odhadněte lineární pravděpodobnostní model znovu, tentokrát metodou vážených nejmenších čtverců (WLS). Porovnejte nové odhady s původními odhady získanými OLS. Cvičení 2: Teoretické rozcvičky opakování základní ekonometrické teorie Příklad 2.1. (Různé pojetí odchylek.) Je dána regresní přímka y D xc1 a jedno pozorování hodnot x a y, které představuje bod.x 0 ; y 0 / D.1; 1/. Vypočtěte, jaká je : : : a ) : : : absolutní odchylka bodu.x 0 ; y 0 / od regresní přímky.

4 4EK216 Ekonometrie: Příklady ke cvičením 4 b ) : : : čtvercová odchylka bodu.x 0 ; y 0 / od regresní přímky. c ) : : : ortogonální odchylka bodu.x 0 ; y 0 / od regresní přímky. Příklad 2.2. (Odhadová funkce metody nejmenších čtverců maticový zápis.) Máme k dispozici 8 pozorování proměnných y; x 1 a x 2, které obecně označíme následujícím způsobem: hodnoty y W y 1 ; y 2 ; : : : ; y 8 ; hodnoty x 1 W x 11 ; x 21 ; : : : ; x 81 ; hodnoty x 2 W x 12 ; x 12 ; : : : ; x 82 ; tj. pro i-té pozorování máme hodnoty y i ; x i1 ; x i2. Takto vyjádřenými pozorováními budeme prokládat regresní rovinu v obecném vyjádření y D yˇ0 C yˇ1x 1 C yˇ2x 2 : a ) Najděte předpis pro funkci SS. yˇ0; yˇ1; yˇ2/, která vyjadřuje celkový součet čtverců při daných hodnotách parametrů yˇ0; yˇ1 a yˇ2 (název funkce pochází z anglického sum of squares). Pokuste se o co nejúspornější vyjádření. b ) Vyjádřete opět funkci popisující celkový součet čtverců, tentokrát ovšem za použití maticového zápisu. Využijte následujících vektorů a matic: y 1 1 x 11 x y x 21 x 22 yˇ y D 6 4 : y ; X D 6 7 4: : : 5 ; y D 4 yˇ1 5 : yˇ2 1 x 81 x 82 c ) Najděte obecné vyjádření pro takové hodnoty parametrů yˇ0; yˇ1 a yˇ2, které minimalizují celkový součet čtverců. Návod: Najděte minimum funkce SS z bodu a) vynulováním parciálních poté získané vztahy přepište yˇ2 pomocí y; X a y. d ) Obecnému maticovému vyjádření vektoru y z bodu c) se říká odhadová funkce metody nejmenších čtverců. Použijte tuto funkci při výpočtu regresní roviny pro následující hodnoty sledovaných proměnných: i y i x i x i e ) Porovnejte výsledky z předchozího bodu s odhady parametrů pořízenými funkcí lm v R.

5 4EK216 Ekonometrie: Příklady ke cvičením 5 Příklad 2.3. (Statistické vlastnosti odhadové funkce OLS.) Uvažujte obecný lineární regresní model neboli y i D ˇ0 C ˇ1x i1 C ˇ2x i2 C : : : C ˇk x ik C u i ; i D 1; 2; : : : ; n; y D X C u; pro který platí E.u j X/ D 0 a var.u j X/ D 2 I. Označme symbolem y odhad vektoru parametrů pořízený OLS, tedy y D.XX/ 1 Xy. a ) Uvědomte si, že zatímco y je náhodný vektor, E.y / je konstantní. Vyjádřete hodnotu E.y /. b ) Vyjádřete var.y j X/. Příklad 2.4. (Střední hodnota a varianční matice odhadů pořízených OLS.) Je dán lineární regresní model y D ˇ0 C ˇ1x C u; přičemž víme, že ˇ0 D 4; ˇ1 D 8, náhodná složka u je v populaci nezávislá na x a má nulovou střední hodnotou a rozptyl 20. Z náhodného výběru o rozsahu n D 5 máme k dispozici následující hodnoty: x D Œx 1 x 2 x 3 x 4 x 5 D Œ : Označme odhady parametrů ˇ0 a ˇ1 pořízené OLS jako yˇ0 a yˇ1. a ) Určete E. yˇ0/, E. yˇ1/. b ) Vypočtěte var. yˇ0 j x D x 0 /, var. yˇ1 j x D x 0 /, kde x je vektor pozorování proměnné x v náhodném výběru o rozsahu n D 5, tj. x D Œx 1 x 2 x 3 x 4 x 5 ; a x 0 je vektor konkrétních pozorovaných hodnot x 0 D Œ : Příklad 2.5. (Varianční matice odhadů, t-test.) Odhadem parametru D Œˇ0 ˇ1 lineárního regresního modelu y D X Cu pomocí OLS jsme získali vektor y D Œ5 10. Výsledný vektor reziduí je yu D Œ a známe dále matici X > X D 5 3 a ) Odhadněte varianční matici var.y /. 3 4 : 4 12

6 4EK216 Ekonometrie: Příklady ke cvičením 6 b ) Na hladině významnosti 5% testujte statistickou významnost obou koeficientů zkoumaného modelu, tj. např. pro ˇ1 proved te test s hypotézami H 0 W ˇ1 D 0; H 1 W ˇ1 0: Příklad 2.6. (Střední hodnota exponenciály od náhodné složky.) Při predikci v lineárním regresním modelu, v němž se vysvětluje logaritmus závisle proměnné (log y), se při predikcích hodí následující tvrzení: má-li náhodná složka u rozdělení N.0; 2 /, potom E.e u / D e 2 =2. a ) Dokažte uvedené tvrzení. Návod: Stačí vyjít ze standardního výpočtu střední hodnoty pro libovolnou (měřitelnou) reálnou funkci g./ máme EŒg.u/ D R R g.u/f.u/ du, kde f./ je hustota pravděpodobnosti veličiny u. b ) Pokud rozdělení u není normální, uvedené tvrzení samozřejmě obecně neplatí; lze ale ukázat, že má-li u rozdělení s nulovou střední hodnotou a nenulovým rozptylem, platí E.e u / > 1. Zdůvodněte. Návod: Nemusíte zdůvodňovat elementárním způsobem jako u předchozího bodu, můžete se opřít o nějaké známé nerovnosti z teorie pravděpodobnosti či konvexní analýzy. Cvičení 3: Monte Carlo simulace s lineárním regresním modelem I Příklad 3.1. (Rozdělení odhadových statistik OLS.) Cílem příkladu zkoumat, jaké vlastnosti mají odhady parametrů LRM pořízené metodou nejmenších čtverců; správněji řečeno, půjde nám o statistické vlastnosti odhadové funkce (estimátoru) metody nejmenších čtverců. Půjdeme na to následovně: (i) nejprve si vytvoříme fiktivní populaci jedinců, ve které vztah mezi veličinami y; x a u přesně odpovídá LRM se známými parametry, poté (ii) budeme náhodně vybírat vzorky populace o dané velikosti a z hodnot x a y zkusíme zpětně odhadnout regresní parametry, abychom mohli posoudit, nakolik se liší od skutečných, tj. původních hodnot. a ) Vygenerujte pozorování hodnot proměnných y; x a u, které odpovídají následujícím vztahům: y D 5 C 10x C u; x R.0; 50/; u R. 30; 30/: Tento soubor pozorování budeme nadále označovat jako populaci. b ) Z populace vyberte náhodný výběr o rozsahu n D 15 a na základě výběrových hodnot proměnných y a x odhadněte metodou nejmenších čtverců model y D ˇ0 C ˇ1x C u: (1) Následně vytvořte bodový diagram (scatterplot) výběrových hodnot obou proměnných a zakreslete do něj navíc přímky 10 C 5x a yˇ0 C yˇ1x, kde yˇ0; yˇ1 značí odhady

7 4EK216 Ekonometrie: Příklady ke cvičením 7 parametrů ˇ0; ˇ1. Vysvětlete, kde jsou v grafu zachyceny odhady yˇ0 a yˇ1 a co představují tzv. rezidua, značená zpravidla jako Ou. c ) Předchozí bod několikrát opakujte a sledujte, nakolik se odhady parametrů liší od jejich skutečných hodnot 5 a 10. Kterou odhadovou statistiku byste označili za přesnější, yˇ0 nebo yˇ1? d ) Vygenerujte 10 4 náhodných výběrů, pro každý z nich odhadněte model (1), výsledné odhady zapište do 10 4 složkových vektorů beta.0 a beta.1. Najděte průměr a směrodatnou odchylku hodnot z obou vektorů a zobrazte histogramy získaných odhadů. Komentujte získané hodnoty a grafy. Příklad 3.2. (Limitní vlastnosti odhadových statistik OLS.) Příklad 3.1 opakujte s tím, že budete postupně zvětšovat rozsah výběru n na 30, 100 a 500. Porovnejte tvar histogramů pro všechny varianty velikosti výběrového souboru, komentujte. Příklad 3.3. (Směrodatné chyby, intervaly spolehlivosti, testování hypotéz.) Po odhadu lineárního regresního modelu se zpravidla věnujeme mj. statistické inferenci zobecnění závěrů učiněných na základě výběrového souboru na celou populaci. K tomu nezbytně patří výpočet intervalů spolehlivosti pro regresní parametry a případně testování hypotéz o skutečných (populačních) hodnotách parametrů. Postup simulace z příkladu 3.1 proto nyní rozšíříme tak, abychom mohli posoudit korektnost výpočtů doporučovaných pro tyto účely v přednášce; v následujících úkolech se počítá s tím, že máte před sebou kód, který řeší příklad 3.1. a ) V každém náhodném výběru ještě (i) dopočítejte směrodatnou chybu pro yˇ1, (ii) určete 95% interval spolehlivosti (CI) pro parametr ˇ1 a (iii) na 5% hladině významnosti testujte pomocí tradičního t-testu nulovou hypotézu, že ˇ1 D 10, proti oboustranné alternativě. Výsledky zapište (podobně jako vlastní odhady parametrů) do vektorů std.error (směrodatná chyba), CI.low (dolní mez 95% CI), CI.up (horní mez 95% CI) a reject (= 1, pokud zamítáme nulovou hypotézu, = 0 jinak). b ) Najděte střední hodnotu std.error a sestrojte histogram jeho hodnot. Směrodatná chyba odhadu parametru by měla odrážet směrodatnou odchylku výběrového rozdělení daného parametru, kterou můžeme získat přibližně jako směrodatnou odchylku vektoru beta.1. c ) Zjistěte, v jakém procentu případů se skutečná hodnota parametru ˇ1, totiž číslo 10, octlo uvnitř 95% CI pro ˇ1. Porovnejte s hladinou spolehlivosti 95%, komentujte případné rozdíly. d ) Zjistěte, v jakém procentu případů jste zamítli (pravdivou) nulovou hypotézu, že ˇ1 D 10. Porovnejte výsledek s hladinou významnosti D 0:05, komentujte případné rozdíly. e ) Opakujte celý pokus pro rozsah výběru n na 30, 100 a 500.

8 4EK216 Ekonometrie: Příklady ke cvičením 8 Cvičení 4: Monte Carlo simulace s lineárním regresním modelem II Příklad 4.1. (Porušení Gaussových-Markovových předpokladů nenulová střední hodnota u.) Jeden z Gaussových-Markovových (G-M) předpokladů pro model lineární regrese nad průřezovými daty vyžaduje, aby E.u j x/ D 0. Tento vztah má dvojí interpretaci. Jednak se vyžaduje, aby se (podmíněná) střední hodnota náhodné složky neměnila s hodnotami x, platí tedy E.u j x/ D E.u/; tato situace bývá označována termínem mean independence proměnných u a x a má za důsledek mj. nekorelovanost obou proměnných, tj. cov.x; u/ D 0. Zmíněný G-M předpoklad kromě toho dále vyžaduje, aby nepodmíněná střední hodnota náhodné složky byla nulová: E.u/ D 0. V tomto příkladě experimentální cestou ověříme, jaký dopad by měla změna této nepodmíněné střední hodnoty při zachování mean independence. a ) Podobně jako v příkladě 3.1 generujte populaci o pozorováních, ve které y D 5 C 10x C u; x R.0; 50/; u R. 10; 50/: Podotkněme, že hodnoty x a u mají být generovány nezávisle na sobě, platí tedy E.u j x/ D E.u/ a zřejmě E.u/ D 20. b ) Z vytvořené populace losujte 10 4 náhodných výběrů o rozsahu n D 30, pro každý z nich odhadněte metodou nejmenších čtverců model (1) a veškeré získané odhady parametrů ˇ0 a ˇ1 shrňte pomocí dvou histogramů. Je některý z odhadů vychýlený? O kolik přibližně? Lze vaše závěry nějak jednoduše zobecnit? Zdůvodněte. Příklad 4.2. (Porušení G-M předpokladů korelace u a x.) Závažnějším problémem, nežli byl ten zkoumaný v předchozím příkladě, je výskyt korelace mezi vysvětlující proměnnou a náhodnou složkou, tj. případ cov.x; u/ 0: a ) Vygenerujete populaci, ve které platí y D 5 C 10x C u; x N.30; 15 2 /; u N.0; 20 2 /; corr.x; u/ D 0:8: Návod: Novinkou v tomto příkladu je generování hodnot korelovaných náhodných veličin x a u; můžete k tomu využít následující algoritmus: (i) Generuj dvojici nezávislých veličin v; w z rozdělení N.0; 1/. (ii) Vypočti hodnoty x; u podle vztahů x D 30 C 15v; u D 0 C 20.0:8/v C 20 p 1 0:8 2 w: Není těžké ověřit (analyticky či experimentálně), že takto vzniklé veličiny x a u mají požadované vlastnosti. a ) Opakujte postup použitý při simulacích v předchozích příkladech a určete výběrová rozdělení odhadů parametrů modelu (1). Jsou odhady pro n D 15 nestranné? Jsou odhady konzistentní (jinými slovy: co se děje s výběrovým rozdělením odhadů při n! 1)?

9 4EK216 Ekonometrie: Příklady ke cvičením 9 b ) Opakujte předchozí analýzu s tím, že corr.x; u/ změníte v zadání postupně na 0.5 a 0.95 (algoritmus pro generování korelovaných veličin snadno přizpůsobíte pro nové zadání). Komentujte výsledky. Příklad 4.3. (Porušení G-M předpokladů heteroskedasticita.) Podobně jako v předchozích příkladech zkoumejte odhady regresních parametrů modelu (1) v populaci, kde y D 5 C 0x C u; x N.0; 1/; u j x N 0; Œ1 C e x 2 : Opět vytvořte výchozí populaci o pozorováních a z ní losujte 10 4 náhodných výběrů o rozsahu n D 150, v každém odhadněte model (1) pomocí OLS. a ) Použijte klasické směrodatné chyby pro výpočet testové statistiky v t-testu s nulovou hypotézou, že ˇ1 D 0; zjistěte, v jakém procentu případů jste na 5% hladině významnosti zamítli (pravdivou) nulovou hypotézu. b ) Opakujte předchozí bod s tím, že použijete směrodatné chyby robustní vůči heteroskedasticitě (Huber-White sandwich variance estimator). c ) Opakujte předchozí body pro n D 15 a n D Diskutujte získané výsledky. d ) Opakujte simulaci pro n D 150 ještě jednou, ale tentokrát získejte směrodatné chyby pomocí neparametrického bootstrapu. Příklad 4.4. (Chyby měření vysvětlující proměnné.) V praxi je běžné, že nejsme schopni hodnoty některých proměnných měřit zcela přesně; tato zkutečnost bude mít samozřejmě vliv na naše odhady. Smyslem tohoto příkladu je zkoumat tento vliv experimentální cestou, v přednášce se budeme bavit o analytických výsledcích. Využijeme zde vygenerovaná data z příkladu 3.1 o populaci jedinců, pro jejichž charakteristiky x a y přesně platí vztah y D 5 C 10x C u; x R.0; 50/; u R. 30; 30/: Oproti příkladu 3.1 jsme zde lehce poupravili značení u proměnné x se objevila hvězdička. Tímto způsobem se často v ekonometrických textech označují proměnné, jejichž hodnoty nejsme schopni přímo pozorovat třeba z důvodu nepřesného měření, jako tomu bude v tomto příkladě. Budeme předpokládat, že sledovaná hodnota vysvětlující proměnné, x, se získá tak, že se skutečná hodnota x zaneřádí náhodnou chybou měření šumem, značeným e, tj. x D x C e. V nejjednodušší modelové situaci můžeme předpokládat, že šum není odvislý od hodnoty vysvětlující proměnné, čili cov.x ; e/ D 0. To bude výchozí bod pro naši další práci. a ) Pro celou populaci (všech jedinců, charakterizovaných hodnotami proměnných y a x ) generujte sledované (naměřené) hodnoty vysvětlující proměnné podle vztahu x D x C e; e R. 20; 20/: b ) Z populace losujte postupně 10 4 náhodných výběrů o rozsahu n D 15, metodou nejmenších čtverců odhadněte regresní parametry modelu y D ˇ0 C ˇ1x C u;

10 4EK216 Ekonometrie: Příklady ke cvičením 10 ovšem na základě hodnot proměnných y a x (nikoli y a x ). Odhady ze všech výběrů uložte do vektorů beta.0 a beta.1. Najděte střední hodnotu a průměrnou čtvercovou chybu získaných odhadů a zobrazte jejich histogramy. Zdají se být odhady parametrů nestranné? c ) Opakujte předchozí body s tím, že zvýšíte rozptyl chyby měření tentokrát generujte e z rozdělení R. 40; 40/. Jak se změnilo vychýlení odhadu parametru ˇ1? d ) Znovu opakujte celou analýzu s tím, že pro vytvoření základního souboru (populace) tentokrát použijete vztah y D 5 10x C u; x R.0; 50/; u R. 30; 30/; tj. obrátíte směr závislosti mezi y a x. Jaký je směr vychýlení odhadu parametru ˇ1? Cvičení 5: Modely binární volby Příklad 5.1. (Podnikatelská sebedůvěra logit I.) V datovém souboru GEM.csv se nachází vzorek dat získaných v České republice v letech 2006 a Celkem je k dispozici 2000 pozorování, každé z nich představuje jednoho náhodně vybraného respondenta ve věku let. Jednotlivé proměnné a jejich kódování jsou stručně popsány přímo v datovém souboru po otevření v Gretlu. Jedna z proměnných nese název sebeduvera a zachycuje respondentovu odpověd na otázku Máte znalosti, dovednosti a zkušenosti potřebné pro zahájení nějakého nového podnikání? V následujících úkolech budete odpovídat na otázky týkající se toho, co ovlivňuje výskyt této podnikatelské sebedůvěry. a ) Pomocí standardního ekonometrického značení zapište model logistické regrese (logit), který vysvětluje přítomnost podnikatelské sebedůvěry pomocí pohlaví, věku, vzdělání a regionu; kategoriální proměnné kódujte podle potřeby do dummy proměnných, kvantitativní proměnné zařazujte bez další funkční transformace. b ) Model z bodu a odhadněte a odpovězte na následující otázky: (i) Proč Gretl nepoužil při odhadu všech 2000 pozorování? (ii) Jaká je interpretace hodnoty koeficientu u proměnné vek? (iii) Jaký je odhadovaný rozdíl v poměru šancí pro výskyt sebedůvěry při náhodném výběru dvou jinak srovnatelných osob z Prahy a Střední Moravy? (iv) Jaký statistický test byste použili, abyste ověřili, zda se sklony k podnikatelské sebedůvěře liší napříč regiony (tj. zdali má region vliv)? (Zapište formálně testované hypotézy, použijte značení vašeho modelu v a.) (v) Jaký je závěr testu z předchozího bodu? (Zapište kromě slovního vyhodnocení i hodnotu testové statistiky a p-hodnotu.) Příklad 5.2. (Podnikatelská sebedůvěra logit II.)

11 4EK216 Ekonometrie: Příklady ke cvičením 11 a ) Do modelu z příkladu 5.1 přidejte druhou mocninu proměnné vek a nový model odhadněte. Zjistěte, jaký tvar má odhadovaná závislost sebedůvěry na věku (zdali u nebo obrácené u ) a určete bod zlomu vlivu věku; uved te, jak jste bod zlomu spočetli. b ) Je známo, že podnikatelskou sebedůvěrou oplývají spíše muži než ženy; otázka je, zda se tyto pomyslné nůžky mezi pohlavími od roku 2006 do roku 2011 (tj. mezi dvěma sledovanými obdobími) spíše rozevřely, přivřely, či zůstaly na stejné úrovni. Vhodným způsobem rozšiřte model z bodu a tak, aby bylo možné na tuto otázku odpovědět. Následně formulujte a testujte hypotézu, že se rozdíl v sebedůvěře mezi pohlavími od roku 2006 do roku 2011 nezměnil. Příklad 5.3. (Podnikatelská sebedůvěra probit.) a ) Odhadněte analogický model jako v příkladu 5.1, tentokrát však volte probitový model místo logitu. Určete (a interpretujte) mezní efekt dodatečného roku (věku) pro fiktivní pozorování s hodnotami vysvětlujících proměnných na úrovni jejich výběrových průměrů, tj. najděte tzv. marginal (též partial) effect at mean (MEM). Pro účely výpočtu nakládejte s věkem jako se spojitou veličinou. b ) Pomocí Delta metody určete směrodatnou chybu pro MEM. c ) Ve stejném modelu najděte průměrný mezní efekt, tj. average marginal (též partial) effect (AME) pro proměnnou vek. d ) Pomocí Delta metody určete směrodatnou chybu pro AME. Příklad 5.4. (Kreditní karty dokonalá predikce, porovnání AME.) Pro tento příklad použijte soubor cred.csv. a ) Pokuste se odhadnout Acc v závislosti na Income, MDR, AvgExp a Age. K jakému problému při odhadu došlo? Vysvětlete. b ) Odhadněte postupně lineární pravděpodobnostní model, logit a probit pro závislost pravděpodobnosti přidělení kreditní karty Acc na proměnných Income, MDR, AvgExp, Age a OwnRent. Pro nelineární modely spočtěte AME pro všechny vysvětlující proměnné pečlivě rozlišujte výpočet pro spojité a indikátorové proměnné. Diskutujte rozdíly v jednotlivých modelech.

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2016/17 Cvičení 3: Lineární regresní model LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Seznámení s EViews Upřesnění

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Úvod do ekonometrie Minitesty

Úvod do ekonometrie Minitesty Úvod do ekonometrie Minitesty Poznámka k zadání Použité značení odpovídá přednáškám, v případě nejasností nahlédněte do zveřejněných prezentací. V zadání jsou všude použity desetinné tečky (kvůli souladu

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2014/15 Cvičení 5: Vícenásobná regrese, multikolinearita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Jednoduchá

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2016/17 Cvičení 5: Vícenásobná regrese LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Jednoduchá regrese opakování

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu 1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Statistická analýza dat

Statistická analýza dat Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte

Více

Matematická statistika Zimní semestr Testy o proporci

Matematická statistika Zimní semestr Testy o proporci Testy o proporci 18.12.2018 Jednovýběrový problém pro binární data. V roce 2008 se v České republice živě narodilo 119 570 dětí, z toho 58 244 dívek a 61 326 chlapců (zdroj ČSÚ). Zajímá nás, zda je pravděpodobnost

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,

Více

Matematická statistika Zimní semestr

Matematická statistika Zimní semestr Analýza rozptylu (jednoduché třídění) 11.1.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Med.txt. Otevřete si program R Studio a načtěte si výše

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základ ekonometrie Odhad klasického lineárního regresního modelu I Cvičení 2 Zuzana Dlouhá Metodologický postup tvor EM 1. Specifikace modelu určení proměnných určení vzájemných vaze mezi proměnnými

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Aplikovaná statistika v R - cvičení 3

Aplikovaná statistika v R - cvičení 3 Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární

Více

Praktikum z ekonometrie Panelová data

Praktikum z ekonometrie Panelová data Praktikum z ekonometrie Panelová data Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 9. května 2014 1 Terminologie a značení Sledujeme-li pro všechny průřezové jednotky stejná časová období,

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

ALGEBRA. Téma 5: Vektorové prostory

ALGEBRA. Téma 5: Vektorové prostory SLEZSKÁ UNIVERZITA V OPAVĚ Matematický ústav v Opavě Na Rybníčku 1, 746 01 Opava, tel. (553) 684 611 DENNÍ STUDIUM Téma 5: Vektorové prostory Základní pojmy Vektorový prostor nad polem P, reálný (komplexní)

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2014/15 Cvičení 6: Dummy proměnné, úvod do časových řad LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Multikolinearita

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Základy ekonometrie Příklady ze cvičení (ZS 2012)

Základy ekonometrie Příklady ze cvičení (ZS 2012) Základy ekonometrie Příklady ze cvičení (ZS 2012) Katedra ekonometrie FIS VŠE v Praze, zouharj@vse.cz 1. října 2014 Pár slov úvodem. Zadání příkladů je rozděleno po jednotlivých cvičeních. Jedná se o orientační

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1 18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je

Více

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

8 Střední hodnota a rozptyl

8 Střední hodnota a rozptyl Břetislav Fajmon, UMAT FEKT, VUT Brno Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 6: Multikolinearita, umělé proměnné LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Otevřete si data z

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více