KGG/STG Statistika pro geografy

Podobné dokumenty
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Charakteristika datového souboru

STATISTICKÉ ZJIŠŤOVÁNÍ

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Tomáš Karel LS 2012/2013

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

STATISTICKÉ ODHADY Odhady populačních charakteristik

5. Odhady parametrů. KGG/STG Zimní semestr

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

KGG/STG Statistika pro geografy

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Odhad parametrů N(µ, σ 2 )

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Úvod do problematiky měření

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

15. T e s t o v á n í h y p o t é z

You created this PDF from an application that is not licensed to print to novapdf printer (

Výběrové charakteristiky a jejich rozdělení

Definice spojité náhodné veličiny zjednodušená verze

12. cvičení z PST. 20. prosince 2017

Odhad parametrů N(µ, σ 2 )

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

8. Normální rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Statistika pro geografy

= = 2368

Intervalové Odhady Parametrů

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Náhodné (statistické) chyby přímých měření

Rozdělení přenosové rychlosti disku

Intervalové Odhady Parametrů II Testování Hypotéz

Bodové a intervalové odhady parametrů v regresním modelu

Základy teorie odhadu parametrů bodový odhad

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Vybraná rozdělení náhodné veličiny

Pravděpodobnost a aplikovaná statistika

Náhodné chyby přímých měření

Cvičení ze statistiky - 8. Filip Děchtěrenko

Pravděpodobnost a matematická statistika

Testování statistických hypotéz

Jednofaktorová analýza rozptylu

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Regresní analýza 1. Regresní analýza

3 Bodové odhady a jejich vlastnosti

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Testování hypotéz o parametrech regresního modelu

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Testování hypotéz o parametrech regresního modelu

Regulační diagramy (RD)

Diskrétní náhodná veličina. November 12, 2008

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zápočtová práce STATISTIKA I

KGG/STG Statistika pro geografy

Téma 22. Ondřej Nývlt

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Praktická statistika. Petr Ponížil Eva Kutálková

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Posouzení přesnosti měření

PRAVDĚPODOBNOST A STATISTIKA

12. prosince n pro n = n = 30 = S X

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

1. Přednáška. Ing. Miroslav Šulai, MBA

Cvičení ze statistiky - 7. Filip Děchtěrenko

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz

Normální rozložení a odvozená rozložení

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Charakterizace rozdělení

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Chyby měření 210DPSM

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Transkript:

KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015

Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním souborem 2 parametrů základního souboru Výběrové rozdělení 3 Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru

Vztahy mezi výběrovým a základním souborem Opakování základních pojmů jak lze odhadnout z výběrového souboru charakteristiky souboru základního základní soubor výběrový soubor

Vztahy mezi výběrovým a základním souborem Náhodný výběr Definice Náhodným výběrem rozumíme výběr, ve kterém má každý prvek základního souboru stejnou šanci být vybrán. Prostorová specifikace: stratifikovaný - z každého okresu jeden prvek systematický - seřadit a každá pátá obec prostý náhodný

Vztahy mezi výběrovým a základním souborem Grafické znázornění náhodných výběrů Obrázek: Systematický, náhodný a stratifikovaný náhodný výběr

Vztahy mezi výběrovým a základním souborem Statistiky = funkce odvozené z náhodného výběru výběrový aritmetický průměr x = 1 n výběrová směrodatná odchylka n 1 s = n 1 n x i i=1 i=1 (x i x) 2

Vztahy mezi výběrovým a základním souborem Základní x výběrový soubor Tabulka: Označení charakteristik základního a výběrového souboru Základní soubor Výběrový soubor rozsah N n i-tý prvek a i x i střední hodnota µ x směrodatná odchylka σ s rozptyl σ 2 s 2

Vztahy mezi výběrovým a základním souborem Bodový a intervalový odhad bodový odhad - realizací tohoto odhadu získáme pro hledanou charakteristiku základního souboru konkrétní číslo intervalový odhad - realizací tohoto odhadu získáme pro hledanou charakteristiku základního souboru interval hodnot, který s předem danou pravděpodobností bude pokrývat hledanou charakteristiku

parametrů základního souboru Výběrové rozdělení slouží k odhadu parametrů základního souboru, ze kterého daný náhodný výběr pochází realizací tohoto odhadu získáme pro konkrétní charakteristiku určitou hodnotu pro různé náhodné výběry ze stejného základního souboru se bodový odhad téže charakteristiky zpravidla liší

parametrů základního souboru Výběrové rozdělení střední hodnoty Definice Bodovým odhadem střední hodnoty ˆµ základního souboru rozumíme aritmetický průměr daného náhodného výběru, tj. ˆµ = x = 1 n n x i. i=1 bodový odhad střední hodnoty základního souboru ztotožňujeme z výběrovým průměrem

parametrů základního souboru Výběrové rozdělení směrodatné odchylky Definice směrodatné odchylky ˆσ základního souboru určujeme pomocí kvadrátů odchylek jednotlivých prvků od výběrového průměru, tj. ˆσ = 1 n 1 n i=1 (v případě, že rozsah výběru n 2). (x i x) 2

parametrů základního souboru Výběrové rozdělení směrodatné odchylky bodový odhad směrodatné odchylky základního souboru ztotožňujeme z výběrovou směrodatnou odchylkou pozor: v popisné statistice jsme počítali hodnotu směrodatné odchylky jinak (odlišíme čárkou): s = 1 n n i=1 (x i x) 2

parametrů základního souboru Výběrové rozdělení Stupně volnosti udávají, jaký je potřeba minimální počet nezávislých výběrů k tomu, abychom dostali výslednou statistiku kvůli položení rovnosti mezi bodový odhad a výběrovou charakteristiku ztrácíme jeden nezávislý výběr - proto n 1 například pokud průměr vypočtený ze tří měření je 5 a první dvě měření budou 4 a 5, poslední měření již není nezávislé, nebot se musí rovnat 6

parametrů základního souboru Výběrové rozdělení vždy platí ˆσ > s 1 ˆσ s = n 1 n i=1 (x i x) 2 = 1 n n i=1 (x i x) 2 1 n 1 n i=1 (x i x) 2 1 n = n i=1 (x i x) 2 neboli 1 n 1 1 n n ˆσ = s n 1 n = n 1

parametrů základního souboru Výběrové rozdělení 1. konzistentnost odhadu označuje trend zmenšování se rozdílu mezi skutečnou a odhadnutou hodnotou charakteristiky s rostoucím rozsahem výběru; tj. s rostoucím rozsahem výběru se realizace odhadu dané charakteristiky přibližuje hodnotě dané charakteristiky základního souboru (s pravděpodobností 1) 2. nestrannost odhadu při opakovaných výběrech kolísá odhad kolem teoretické hodnoty symetricky na obě strany

parametrů základního souboru Výběrové rozdělení 3. vydatnost odhadu rozptyl odhadů při opakovaných výběrech je malý 4. rezistence odhadu odlehlé hodnoty vzniklé chybou měření, či špatným zápisem, nemají velký vliv na hodnotu odhadu

parametrů základního souboru Výběrové rozdělení Výběrové rozdělení pravděpodobnostní rozdělení hodnot, které statistika nabývá ve všech možných výběrech z daného základního souboru následující statistiky jsou definovány jako vážené - z důvodu různých rozsahů výběrů

parametrů základního souboru Výběrové rozdělení Statistiky výběrového rozdělení 1 Vážený průměr výběrových průměrů µ x = (n 1 x 1 + n 2 x 2 + + n r 1 x r 1 + n r x r )/r = 1 n r i=1 n i x i 2 Vážený průměr výběrových rozptylů s 2 = (n 1 1)s 2 1 + (n 2 1)s 2 2 + + (n r 1)s 2 r n 1 + n 2 + + n r r = r i=1 (n i 1)s 2 i n r kde n = n 1 + + n r a r je počet výběrů.,

parametrů základního souboru Výběrové rozdělení Vlastnosti parametrů 1. v případě náhodného výběru z normálního rozdělení s parametry µ a σ platí, že rozdělení výběrových průměrů je také normální s parametry µ x = µ σ x = σ/ n 2. směrodatná odchylka rozdělení výběrových průměrů σ x (také používáme název směrodatná chyba odhadu průměru) je menší než směrodatná odchylka základního souboru a to tím menší, čím je větší rozsah výběru

parametrů základního souboru Výběrové rozdělení Vlastnosti parametrů 3. pro rozsah výběru jdoucí do nekonečna se výběrové rozdělení průměrů dokonce blíží normálnímu rozdělení bez ohledu na tvar původního rozdělení

Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru realizací tohoto odhadu získáme pro konkrétní charakteristiku interval hodnot, v němž se zadanou pravděpodobností leží odhadovaný neznámý parametr liší se podle rozsahu výběru záleží na tom, které parametry známe a které nikoliv

Kvalita odhadu Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Přesnost odhadu je dána násobkem směrodatné chyby odhadu (tj. poloviční šířkou intervalu spolehlivosti). Spolehlivost odhadu je určena pravděpodobností, se kterou je možné určitý odhad považovat za správný.

Interval spolehlivosti Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Princip konstrukce pro střední hodnotu: středem intervalu spolehlivosti je bodový odhad dané charakteristiky (tj. výběrový průměr) na obě strany od výběrového průměru ve vzdálenosti určené násobkem směrodatné chyby odhadu - hranice intervalu spolehlivosti označení: nalevo dolní hranice (q 1 ), napravo horní hranice (q 2 ) rozdíl horní a dolní hranice určuje šířku intervalu spolehlivosti polovina šířky je mírou přesnosti odhadu

Základní pojmy Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru míra spolehlivosti odhadu (1 α) (pravděpodobnost, že se skutečný parametr základního souboru nachází uvnitř intervalu) riziko α - pravděpodobnost, že skutečný parametr není pokryt intervalem spolehlivosti Tabulka: Nejčastěji používané intervaly spolehlivosti Násobky s Spolehlivost Riziko 1,960 0,95 0,05 2,576 0,99 0,01 3,291 0,999 0,001

Charakteristiky Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru výběry s velkým rozsahem jsou přesnější výběry s rozsahem nad 30 - jejich výběrové rozdělení lze považovat za normální navíc lze ve vzorci pro intervalový odhad dosadit místo σ 2 výběrový rozptyl s 2 platí P(q 1 µ q 2 ) = 1 α rozdělení na případy v závislosti na tom, zda známe rozptyl σ 2, nebo nikoliv

Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Odhad parametru µ při známém rozptylu σ 2 pro hranice intervalu spolehlivosti platí: q 1 = x z 1 α 2 q 2 = x + z 1 α 2 σ n, σ n, přičemž z 1 α 2 je příslušný kvantil normovaného normálního rozdělení intervalový odhad lze přepsat do tvaru: x z 1 α 2 σ σ n µ x + z 1 α n 2

Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Odhad parametru µ při neznámém rozptylu σ 2 nutnost nahradit hodnotu jistého kvantilu normovaného normálního rozdělení kvantilem Studentova t rozdělení pro ν = n 1 stupňů volnosti x t 1 α 2 (n 1) s n µ x + t 1 α 2 (n 1) s n

Přípustná chyba Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru = z 1 α 2 σ n S tímto novým označením tak můžeme přepsat obecný tvar intervalového odhadu do podoby: x µ x +

Odhad parametru σ 2 Úvod, pojmy Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru obecně bude mít intervalový odhad parametru σ 2 tvar: P(q 1 σ 2 q 2 ) = 1 α omezení se na variantu, kdy neznáme parametr µ výsledný interval má tvar (n 1)s 2 χ 2 α 2 (n 1) σ2 (n 1)s2 χ 2 1 α 2 (n 1)

Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Určení rozsahu n náhodného výběru situace: potřebujeme předem vědět, jak velký soubor vybrat (předem si zvolit přesnost intervalového odhadu) úpravou vzorce přípustné chyby dostáváme vztah n ( σ z1 α 2 ) 2, kde za n zvolíme nejmenší přirozené číslo vyhovující této podmínce

Přesnost a spolehlivost odhadu Interval spolehlivosti Odhad parametru µ Odhad parametru σ 2 Určení rozsahu n náhodného výběru Děkuji za pozornost...