Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Podobné dokumenty
Charakteristika datového souboru

Zápočtová práce STATISTIKA I

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Výpočet pravděpodobností

KGG/STG Statistika pro geografy

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Popisná statistika. Komentované řešení pomocí MS Excel

Tomáš Karel LS 2012/2013

STATISTICKÉ ODHADY Odhady populačních charakteristik

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Cíl: Práce s tabulkami a grafy v prostředí programu Microsoft Excel

4. Zpracování číselných dat

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Téma 9: Vícenásobná regrese

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

STATISTICKÉ ZJIŠŤOVÁNÍ

Regresní analýza 1. Regresní analýza

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Lineární regrese. Komentované řešení pomocí MS Excel

Analýza dat na PC I.

Pravděpodobnost a matematická statistika

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

Normální (Gaussovo) rozdělení

Simulace. Simulace dat. Parametry

Protokol č. 1. Tloušťková struktura. Zadání:

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

You created this PDF from an application that is not licensed to print to novapdf printer (

Testy. Pavel Provinský. 19. listopadu 2013

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Aproximace binomického rozdělení normálním

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Tomáš Karel LS 2012/2013

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Časové řady - Cvičení

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

5. Odhady parametrů. KGG/STG Zimní semestr

Odhad parametrů N(µ, σ 2 )

Kontingenční tabulky v MS Excel 2010

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Nejčastější chyby v explorační analýze

Statistika pro geografy

Jednovýběrové testy. Komentované řešení pomocí MS Excel

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

INDUKTIVNÍ STATISTIKA

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Excel tabulkový procesor

Normální (Gaussovo) rozdělení

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Tomáš Karel LS 2012/2013

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Náhodné (statistické) chyby přímých měření

Bodové odhady parametrů a výstupů

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

Pravděpodobnost a aplikovaná statistika

Úvod do problematiky měření

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Zpracování chybějících dat a dat mimo rozsah

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

4EK211 Základy ekonometrie

Vybraná rozdělení náhodné veličiny

Regulační diagramy (RD)

4EK211 Základy ekonometrie

Popisná statistika kvantitativní veličiny

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

10. Předpovídání - aplikace regresní úlohy

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Testování statistických hypotéz. Obecný postup

Základy pravděpodobnosti a statistiky. Popisná statistika

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

KORELACE. Komentované řešení pomocí programu Statistica

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Návrh a vyhodnocení experimentu

na za átku se denuje náhodná veli ina

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

Odhady parametrů základního souboru Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Motivační příklad Mám průměrné roční teploty vzduchu z 8 stanic v oblasti Antarktického poloostrova z let 2005 2015.

Motivační příklad Výběrové průměry a směrodatné odchylky: Výše uvedené statistiky platí pro náš výběr (tj. 8 míst, na nichž se měří), ale platí i pro základní soubor (celou oblast Antarktického poloostrova)?

Trocha teorie Můžeme počítat statistické charakteristiky pro náš výběr, např. Výběrový průměr Výběrový rozptyl Výběrová směrodatná odchylka a spousta dalších V praxi ale potřebujeme znát statistické charakteristiky základního souboru, resp. jak moc se naše výběrové stat. charakteristiky liší od stat. charakteristik základního souboru?

Odhady Odhad bodový: vyjádření jedním číslem nevýhoda: neznáme riziko, že dané číslo není skutečnou charakteristikou základního souboru! Odhad aritmetického průměru: Odhad rozptylu: Odhad směrodatné odchylky: Pro tyto tři charakteristiky platí, že výběrové charakteristiky jsou nestranným odhadem charakteristik základního souboru.

Záhada směrodatné odchylky aneb proč bylo na přednášce, že směrodatná odchylka výběrového souboru není nezkresleným odhadem směrodatné odchylky základního souboru? Popisná statistika: Zabývá se pouze popisem vlastností našeho výběru Definice směrodatné odchylky (výběrového souboru): (1) Matematická statistika a statistika pravděpodobnosti: Uvědomuje si, že náš soubor je pouze výběr, a že bude třeba zobecňovat Definice směrodatné odchylky (výběrového souboru): Sm. odchylka ze vzorce (1) tedy není nezkresleným odhadem, hodnota ze vzorce (2) je nezkresleným odhadem Tohle počítá program STATISTICA. Hodnotu jako ze vzorce (1) lze získat takto: (2) (1) = (2) * (n-1) / n

Poznámka k bodovému odhadu průměru Směrodatná chyba průměru (Standard error of the mean): směrodatná odchylka výběrových průměrů, která závisí na směrodatné odchylce základního souboru (σ) a velikosti výběrů (n) v praxi se používá výpočet na základě 1 náhodného výběru o velikosti n a směrodatné odchylce s Je zjevné, že čím větší je náš výběr n,tím je menší chyba (a menší riziko, že jsme se v odhadu zmýlili) Provedeme-li např. 1000 výběrů z tohoto souboru o velikosti n=16, jejich průměry lze vykreslit ve vedlejším grafu Intuitivně by všechny výběrové průměry měly být rovny průměru základního souboru, prakticky tomu tak není. Soubor složený z těchto výběrových průměrů má svou variabilitu, která bude tím menší, čím větší je n.

Odhady Odhad intervalový Odhad intervalem hodnot známe riziko, s nímž se reálná hodnota v tomto intervalu nenachází Existují tři typy intervalů: 1. Oboustranný interval spolehlivosti Odhadovaná charakteristika se v intervalu (D,H) nachází s pravděpodobností 1-α 2. Pravostranný interval spolehlivosti Odhadovaná charakteristika je menší než H s pravděpodobností 1-α 3. Levostranný interval spolehlivosti Odhadovaná charakteristika je větší než D s pravděpodobností 1-α α hladina významnosti (riziko). Zvolíme-li α=0.05, pak bude odhad. charakteristika v daném intervalu s pravděpodobností 95 % (0.95).

Intervalové odhady PŘEDPOKLAD NORMÁLNÍHO ROZDĚLENÍ! D H Intervalový odhad aritmetického průměru (n>30): Intervalový odhad rozptylu: Intervalový odhad směrodatné odchylky: meze získáme odmocněním hodnot D a H α = 0.05 -> z=1.96 α = 0.01 -> z=2.576 χ2 potřeba nalézt v tabulkách, protože závisí na n

Zpět k motivačnímu případu Bodový a intervalový odhad: Statistiky Základní statistiky Popisné statistiky Proměnné: Vše* * ve vašem případě může jít i o 1 sloupec

Zpět k motivačnímu případu Bodový a intervalový odhad: Nastavení modulu:* -> klikneme na Výpočet Bodový odhad sm. odchylky Bodový odhad průměru Výpočet intervalu spolehlivosti sm. odchylky (zde na hladině spolehlivosti 95 %!!!!!!!!) Minimum a maximum Směrodatná chyba průměru Výpočet intervalu spolehlivosti průměru (zde na hladině spolehlivosti 95 %!!!!!!!!) * ve cvičení máte 2 zadání a ne vždy musíte počítat všechno!

Zpět k motivačnímu příkladu Bodový a intervalový odhad Bodový odhad průměru Dolní hranice intervalu spolehlivosti průměru Horní hranice intervalu spolehlivosti průměru Bodový odhad sm. odchylky Dolní hranice intervalu spolehlivosti sm. odchylky Horní hranice intervalu spolehlivosti sm. odchylky Některé věci jsou logické, např. bodový odhad hodnoty je vždy mezi dolní a horní hranicí intervalu Pokud to tak nemáte, něco bylo uděláno špatně.

Zpět k motivačnímu příkladu Tvorba spojnicového grafu pro bodový a intervalové odhady průměru Nejprve levým tlačítkem označit sloupce průměru a obou hranic intervalů spolehlivosti a kliknout pravým tlačítkem

Zpět k motivačnímu příkladu Teplota vzduchu [ C] -2-4 -6-8 Název lze odstranit označením a kliknutím na Delete Křivka dole: dolní hranice intervalu, křivka uprostřed: bodový odhad průměru, křivka nahoře: horní hranice intervalu -10 Průměr Int. spolehl. Int. spolehl. 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 Rok Název osy lze změnit kliknutím pravým tlačítkem: Možnosti grafu Osa Název Legendu lze posouvat po kliknutí pravým tlačítkem: Změnit na plovoucí text Čeho si třeba všimnout do závěru: Nejnižší teplota byla v r. 2007, kdy byl také zjevně nejširší interval spolehlivosti. Tzn. v tomto roce je bodový odhad méně spolehlivý!

Cvičení č. 6 6.1. Zadání: Proveďte bodový a intervalový odhad průměru a směrodatné odchylky základního souboru pro 95% a 99% interval spolehlivosti. Jako výběrový soubor použijte řadu průměrných ročních teplot vzduchu na stanici Praha, Klementinum za období 120 let od... do... (viz. cvičení 2). 6.2. Zadání: Z průměrných měsíčních hodnot teploty vzduchu Vámi zpracovávané stanice (viz. cvičení 3) určete pro každý měsíc intervalový odhad průměru na hladině spolehlivosti 95 % a dále směrodatnou chybu průměru, [aritmetický průměr, minimum a maximum]. Hodnoty aritmetického průměru a intervalového odhadu vyneste do vhodného typu grafu, tak abyste mohli názorně prezentovat rozdíly mezi jednotlivými měsíci. V závěru porovnejte intervalový odhad pro jednotlivé měsíce a interpretujte - o čem vypovídá? Jak souvisí např. s variabilitou studované veličiny v daném měsíci?

Cvičení 6 Požadovaný výstup cvičení: V zadání uvést Vaše období ze cv. 2 a Vaši stanici ze cv.3 6.1: Tabulka s odhady 6.2: Tabulka s aritm. průměry, dolní a horní hranicí intervalů a sm. chybou průměru; spojnicový NEBO krabicový graf Závěr: 6.1: Všimněte si např. šířky intervalů pro 99% a 95% interval spolehlivosti který je širší? 6.2: Všimněte si, jak se šířka intervalu měří v průběhu roku? Čím to může být způsobeno? Teplota vzduchu [ C] -2-4 -6-8 -10 Průměr Int. spolehl. Int. spolehl. 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015

Poznámka ke cvičení: Nastavení pro tvorbu krabicového grafu Grafy 2D grafy Krabicové grafy Proměnné: Závislé (označit všechny měsíce) Karta Detaily I tento graf je třeba upravit (osy, názvy, legenda )

Zdroje BRÁZDIL, Rudolf. Statistické metody v geografii :cvičení. 3. vyd. Brno: Vydavatelství Masarykovy univerzity, 1995. 177 s. ISBN 80-210-1260-9. BUDÍKOVÁ, Marie. Základní pojmy matematické statistiky (přednáška). Brno: Masarykova univerzita, 27.9. 2016. DOBROVOLNÝ, Petr. Z1069 Statistické metody a zpracování dat:iv. Odhady parametrů. Brno: Masarykova univerzita, 27.9.2016. KHAN ACADEMY. KhanAcademy. <https://www.khanacademy.org/> 27.9.2016. STATSOFT. Nápověda k programu STATISTICA. 27.9.2016. Část dat použitých v příkladu pochází z databáze READER <https://legacy.bas.ac.uk/met/reader/>.