Tomáš Karel LS 2012/2013



Podobné dokumenty
Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Statistika (KMI/PSTAT)

Tomáš Karel LS 2012/2013

INDUKTIVNÍ STATISTIKA

Tomáš Karel LS 2012/2013

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

LINEÁRNÍ REGRESE. Lineární regresní model

Regresní a korelační analýza

Regresní a korelační analýza

You created this PDF from an application that is not licensed to print to novapdf printer (

4EK211 Základy ekonometrie

Regresní a korelační analýza

4EK211 Základy ekonometrie

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

4ST201 STATISTIKA CVIČENÍ Č. 7

Regresní a korelační analýza

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA

Kontingenční tabulky, korelační koeficienty

4EK211 Základy ekonometrie

Regresní a korelační analýza

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Inovace bakalářského studijního oboru Aplikovaná chemie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Regresní analýza 1. Regresní analýza

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistická analýza jednorozměrných dat

You created this PDF from an application that is not licensed to print to novapdf printer (

Ilustrační příklad odhadu LRM v SW Gretl

Technická univerzita v Liberci

Doporučené příklady k procvičení k 2. Průběžnému testu

12. cvičení z PST. 20. prosince 2017

ADDS cviceni. Pavlina Kuranova

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

4ST201 STATISTIKA CVIČENÍ Č. 10

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Plánování experimentu

4EK211 Základy ekonometrie

KGG/STG Statistika pro geografy

Regresní analýza. Eva Jarošová

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

4EK211 Základy ekonometrie

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

4EK211 Základy ekonometrie

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA

Tomáš Karel LS 2012/2013

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

odpovídá jedna a jen jedna hodnota jiných

PRAVDĚPODOBNOST A STATISTIKA

Cvičení ze statistiky - 9. Filip Děchtěrenko

4EK211 Základy ekonometrie

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Téma 9: Vícenásobná regrese

Bodové a intervalové odhady parametrů v regresním modelu

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Cvičení 12: Binární logistická regrese

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Testování statistických hypotéz

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

MATEMATIKA III V PŘÍKLADECH

KORELACE. Komentované řešení pomocí programu Statistica

Měření závislosti statistických dat

TECHNICKÁ UNIVERZITA V LIBERCI

PRAVDĚPODOBNOST A STATISTIKA

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Korelační a regresní analýza

6. Lineární regresní modely

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Jednostranné intervaly spolehlivosti

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Přednáška IX. Analýza rozptylu (ANOVA)

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Transkript:

Tomáš Karel LS 2012/2013

Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo zdaleka všechno, co byste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámky z přednášek a cvičení! Tomáš Karel - 4ST201 2.12.2013 2

cv. Program cvičení 1. Úvod, popisná statistika 2. Popisná statistika 3. Míry variability, pravděpodobnost 4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky 5. Pravděpodobnostní rozdělení 6. TEST, odhady parametrů 7. Testování hypotéz 8. Chí kvadrát test dobré shody, kontingenční tabulky, ANOVA 9. Regrese 10. Regrese 11. Korelace, časové řady (bazické a řetězové indexy) 12. TEST, Časové řady 13. Indexní analýza

Z provedeného průzkumu máme informace o pohlaví a preferenci bydliště. Na základě těchto údajů rozhodněte, zda závisí preference trvalého bydlení na pohlaví. Bydliště Pohlaví Město Venkov Muž 71 91 Žena 82 56

- McNemarova statistika Q MN (n12 n 21) n n 12 21 2 pro n 12 +n 21 >30 má Chí kvadrát s 1 st. Volnosti Z tabulky: 95% kvantil 3,84 2 (91 82) QMN 0, 468 91 82 Nezamítáme na 5% hladině významnosti testovanou hypotézu o nezávislosti

Je třeba rozhodnout, zda varianty testu (označíme je jako A, B, C) jsou stejně náročné. Každou variantu si napsali 4 náhodně vybraní studenti. Jejich výsledky jsou zaneseny v tabulce. Rozhodněte, zda se průměrný počet bodů získaný za různé varianty testu významně liší. (Řešte ručně a v Excelu) Varianta testu Dosažené body A 91 81 74 57 B 83 72 63 47 C 71 69 58 40

Na zvolené 5% hladině významnosti přijímáme testovanou hypotézu o rovnosti středních hodnot

slouží k popisu jednostranné závislosti dvou číselných proměnných, kdy proti sobě stojí vysvětlující (nezávislá) proměnná jako příčina a vysvětlovaná (závislá) proměnná jako následek regresní funkce = idealizující matematická funkce, která co nejlépe vyjadřuje charakter závislosti

V tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tisících dolarů): Náklady 835 63 240 1005 184 213 313 658 195 545 Cena 136 24 52 143 42 43 67 106 61 99 a) modelujte závislost nákladů na údržbu na ceně regresní přímkou b) zhodnoťte kvalitu modelu pomocí koeficientu determinace c) interpretujte věcně hodnotu regresního koeficientu b1 d) odhadněte střední hodnotu nákladů u domů za 80. tisíc dolarů e) ověřte pomocí testu, zda se jedná o významnou závislost

Výpočet pomocí EXCELU a metody nejmenších čtverců i y i x i x i y i x i 2 1 835 136 113560 18496 2 63 24 1512 576 3 240 52 12480 2704 4 1005 143 143715 20449 5 184 42 7728 1764 6 213 43 9159 1849 7 313 67 20971 4489 8 658 106 69748 11236 9 195 61 11895 3721 10 545 99 53955 9801 suma 4251 773 444723 75085 průměr 425,1 77,3 44472,3 7508,5

závislost nákladů na údržbu na ceně můžeme modelovat následující přímkou:

MS excel: 1) data analýza dat regrese 2) Vstupní oblast y sloupec Náklady 3) Vstupní oblast x sloupec Cena 4) Nic jiného neupravovat (max. popisky)- OK b o - konstanta významnost koeficientu < alfa významnost koeficientu < alfa b 1 směrnice přímky, regresní koeficient T.K. pro významnost koeficientu

b) zhodnoťte kvalitu modelu pomocí koeficientu determinace vztah je tím silnější a regresní funkce je tím lepší, čím více jsou empirické hodnoty vysvětlované proměnné soustředěné kolem odhadnuté regresní funkce, a naopak tím slabší, čím více jsou vzdálené od odhadnuté regresní funkce závislost y a x bude tím silnější, čím větší bude podíl rozptylu vyrovnaných hodnot na celkovém rozptylu

i y i x i Yi yi-yi (yi-yi)2 (yi-y_)2 1 835 136 869,68-34,68 1202,43 168018,01 2 63 24 21,42 41,58 1728,74 131116,41 3 240 52 233,49 6,51 42,44 34262,01 4 1005 143 922,69 82,31 6774,61 336284,01 5 184 42 157,75 26,25 689,14 58129,21 6 213 43 165,32 47,68 2273,18 44986,41 7 313 67 347,09-34,09 1162,19 12566,41 8 658 106 642,47 15,53 241,33 54242,41 9 195 61 301,65-106,65 11373,95 52946,01 10 545 99 589,45-44,45 1975,74 14376,01 suma - 0 27463,75 906926,90 S R S y

R 2 = I 2 Index determinace Upravený index determinace 2.12.2013 26

c) interpretujte věcně hodnotu regresního koeficientu b1

d) odhadněte střední hodnotu nákladů u domů za 80. tisíc dolarů

e.) Ověřte pomocí testu, zda se jedná o významnou závislost. Výběrový regresní koeficient b 1 je náhodná veličina v tom smyslu, že jeho hodnota závisí na konkrétním výběru (tj. na konkrétních datech, jimiž jsme prokládali přímku). V našem případě vyšla hodnota Teoretický regresní koeficient β 1, který neznáme (a je konstantou), může být přesto roven nule. V tom případě by mezi cenou a náklady neexistovala lineární závislost. Otestujme proto hypotézu o nulové hodnotě teoretického regresního koeficientu β 1.

e) ověřte pomocí testu, zda se jedná o významnou závislost

Test. kritérium P- hodnota Teoretický součet čtverců Reziduální součet čtverců P-hodnota 0,00 je menší než hladina významnosti (α=0,05). Zamítáme tedy nulovou hypotézu. Lineární závislost je statisticky významná. Celkový součet čtverců Na 5% hladině významnosti můžeme na základě testu o modelu zamítnout hypotézu o nulové hodnotě regresního parametru β 1. Lineární závislost je tedy statisticky významná