STATISTICKÉ ZJIŠŤOVÁNÍ

Podobné dokumenty
STATISTICKÉ HYPOTÉZY

KGG/STG Statistika pro geografy

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Tomáš Karel LS 2012/2013

Testy. Pavel Provinský. 19. listopadu 2013

5. Odhady parametrů. KGG/STG Zimní semestr

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

PRAVDĚPODOBNOST A STATISTIKA

Charakteristika datového souboru

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování statistických hypotéz

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Normální (Gaussovo) rozdělení

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

PRAVDĚPODOBNOST A STATISTIKA

Náhodné chyby přímých měření

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Vybraná rozdělení náhodné veličiny

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

15. T e s t o v á n í h y p o t é z

Inovace bakalářského studijního oboru Aplikovaná chemie

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Odhad parametrů N(µ, σ 2 )

STATISTICKÉ ODHADY Odhady populačních charakteristik

Náhodné (statistické) chyby přímých měření

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

KGG/STG Statistika pro geografy

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Zápočtová práce STATISTIKA I

ROZDĚLENÍ NÁHODNÝCH VELIČIN

4ST201 STATISTIKA CVIČENÍ Č. 7

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Výběrové charakteristiky a jejich rozdělení

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Normální (Gaussovo) rozdělení

Chyby měření 210DPSM

Intervalové Odhady Parametrů II Testování Hypotéz

Odhad parametrů N(µ, σ 2 )

Testování statistických hypotéz

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Náhodné veličiny, náhodné chyby

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

= = 2368

Deskriptivní statistické metody II. Míry polohy Míry variability

Testování statistických hypotéz. Obecný postup

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

2 ) 4, Φ 1 (1 0,005)

Intervalové Odhady Parametrů

Definice spojité náhodné veličiny zjednodušená verze

3 Bodové odhady a jejich vlastnosti

Praktická statistika. Petr Ponížil Eva Kutálková

Pravděpodobnost a aplikovaná statistika

Lineární regrese. Komentované řešení pomocí MS Excel

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

4EK211 Základy ekonometrie

Bodové a intervalové odhady parametrů v regresním modelu

Testování hypotéz Biolog Statistik: Matematik: Informatik:

8. Normální rozdělení

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Úvod do problematiky měření

2 Charakterizace jedné náhodné veličiny

Regresní a korelační analýza

Aproximace binomického rozdělení normálním

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Technický experiment, příprava, provedení, hodnocení výsledků

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Pravděpodobnost a matematická statistika

Cvičení ze statistiky - 7. Filip Děchtěrenko

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

5 Parametrické testy hypotéz

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Charakterizace rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

12. cvičení z PST. 20. prosince 2017

Národní informační středisko pro podporu kvality

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

INDUKTIVNÍ STATISTIKA

15. T e s t o v á n í h y p o t é z

Transkript:

STATISTICKÉ ZJIŠŤOVÁNÍ

ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho pravého Provedení vyčerpávajícího šetření změří se všechny jednotky Nákladné, nemožné atd. Výběrové šetření a výběrový soubor Vybereme pouze část ze základního souboru (100 ryb, 50 chlapců/děvčat) Následně budeme usuzovat vlastnosti základního souboru z výběrového souboru 1 )Maruška otestuje 50 chlapců (na škole 5000) 2) Bude určovat charakteristiky výběrové charakteristiky (statistiky) na celé škole Průměr, pravděpodobnost nad 17 cm velikost PRSTŮ atd.

Postup Základní soubor má N jednotek 5000 chlapců Maruška vytvoří výběrový soubor o n jednotkách 50 chlapců Provede úsudek o celém základním souboru Základní soubor - konečně velký -nekonečně velký Snaha, aby výběrový soubor měl stejné vlastnosti jako základní soubor Výběr Prostý náhodný výběr co se náhodně Marušce dostane pod ruku (nejčastější) (každý chlapec má stejnou pravděpodobnost, že se dostane k Marušce) Prostý náhodný výběr rozlišujeme na výběr s vracením/bez vracením (s vracením Lukáš se může dostat do Marušky výzkumu vícekrát) Výběr s nestejnou pravděpodobností Maruška bude hledat jednotky výběrového souboru ve školním plaveckém týmu

BODOVÝ A INTERVALOVÝ ODHAD Statistický soubor lze popsat pomocí charakteristik Průměr, rozptyl, relativní četnost Kvůli zjednodušení zjišťujeme výběrové charakteristiky nazýváme statistiky Základní soubor je pevně dán (ryby v rybníce, studenti na škole) Statistiky se však mění mají charakter náhodné veličiny Jedná se o náhodný výběr průměr, rozptyl bude kolísat Na škole je 5000 chlapců Maruška provede náhodný výběr 50 chlapců Nějakým způsobem zjistí velikost PRSTŮ a spočítá průměr Průměr bude statistikou nazveme výběrový průměr (x - ) Získá rozdělení výběrových průměru (12,15,13,30-Uganda,.) Díky tomu si bude moc Maruška udělat úsudek o celém základním souboru 5000 Chceme-li odhadnout hodnoty charakteristiky základního souboru Je nutné znát pravděpodobnostní rozdělení vhodné výběrové statiky Znát její výběrové rozdělení!!! -velikost PRSTŮ se řídí normálním rozdělením

Odhad neznámé charakteristiky základního souboru Buď Maruška spočítá průměr, jedno číslo 16 cm Bodový odhad 16cm je bodový odhad průměru základního souboru Statistika (g) průměr je odhadem charakteristiky (G) průměr Z.S. Statistiku g nemůžeme volit jak chceme pravidla: Statistika nesmí vést k systematickým chybám E(g)=G - g je nezkresleným (nevychýleným) odhadem G (charakteristiky ZS) Asymptoticky nezkreslený odhad Co když máme více nezkreslených statistik? Vybereme statistiku s co nejmenším rozptylem Vydatný odhad Co když je odhad zkreslený? Požadavek konzistentního odhadu

Intervalový odhad Častější použití Odhad určité charakteristiky základního souboru (Maruška a průměr) Pomocí intervalu průměr bude (16,5-17,4) Odhad základního souboru je určen intervalem (G d,g h ) Dolní a horní interval Interval říká: daná charakteristika bude v něm ležet s vysokou pravděpodobností Tato pravděpodobnost se nazývá spolehlivost odhadu (1-α) Maruška bude moci třeba říci: Průměrná velikost PRSTŮ celého základního souboru (5000 chlapců) Se na 95% (α=5%) nachází v intervalu (16,5;17,4) 100.(1-α)% interval spolehlivosti konfidenční interval

Spolehlivost vs. Přesnost Spolehlivost je dána (1-α) čím menší α tím větší spolehlivost Když α=0,01 spolehlivost, že charakteristiky bude ležet v intervalu 99% ALE S rostoucí spolehlivostí bude růst velikost intervalu bude klesat přesnost Maruška ví, na 95% - průměr (16,5;17,4) Nebo Maruška ví, že na 99% - průměr (16,3;17,5) Mezi přesností a spolehlivostí existuje nepřímá úměra!!!

Intervaly spolehlivosti Rozlišujeme jednostranné a dvoustranné Jednostranné horní/dolní mez Horní mez (G h ) pravostranný interval Dolní mez (G d ) levostranný interval Např: Maruška může říct, že s 95% je průměrná velikost větší jak 16,8 cm Jedná se o levostranný interval 16,8 je doplní mez Dvoustranný interval f(x) 16,8 G d G h x

Odhad průměru základního souboru Pro dostatečně velký rozsah výběru pravděpodobnostní rozdělení Výběrových průměrů přibližně normální N[μ;σ 2 /n] Transformace na normované normální rozdělení Už známe, zjednodušení pro výpočet NNR v tabulkách Když známe x-,μ,σ,n, tak vypočítáme U P, že U padne sem je 95% f(x) u 1-0,05 --- u 0,95 = 1,645 u 0,05 =-1,645 V tabulce najdu P=0,95 Kvantil je 1,645 P, že U padne sem je 5% -1,645 1,645 x

Dvoustranný interval Pravděpodobnost, že U padne do červené plochy je 95% α=0,05 Hledáme takové kvantily(čísla), že pravděpodobnost, že U padne mezi ně bude 95% a tedy, že nepadne 5% u 0,975 P(0,975) = 1,960 u 0,025 = -1,960-1,960 1,960

V tomto případě známe rozptyl základního souboru proto σ Známe x - - průměr spočítaný z výběrového souboru, Marušky 50 chlapců Neznáme μ což je průměr základního souboru Jednoduchá matematická operace Pravděpodobnost, že střední hodnota základního souboru leží v daném intervalu, je 1-α

Příklad: Maruška naměří 50 hodnot Sečte je a vydělí množstvím (50) a získá výběrový průměr (x - ) 16,5 Budeme znát rozptyl velikosti prstů u mužů Jedná se o rozptyl základního souboru důležité!!!! Známe jej!!! Rozptyl (σ 2 ) =4 Maruška chce stanovit 95% interval spolehlivosti Pro průměr základního souboru (μ) stanoví interval Kde se průměr bude nacházet s 95% pravděpodobností α=0,05 n=50 σ=2 x - =16,5 u 0,975 = 1,960 / -u 0,975 =-1,960 15,945<μ<17,054 Maruška zjistila, že na 95% je průměr základního souboru mezi 15,945cm a 17,054cm

Určení jednostranných intervalů Levostranný interval f(x) Pozor už není α/2!!! Pravděpodobnost, že střední hodnota Bude větší než: x - -u 1-α. σ/ n Pravostranný interval x - -u 1-α. σ/ n x - +u 1-α. σ/ n x Pravděpodobnost, že střední hodnota Bude menší než: x - +u 1-α. σ/ n

Maruška nebude znát rozptyl základního souboru σ 2 Dejte si pozor je v tom rozdíl!!! Zde musí Maruška vypočítat výběrový rozptyl (s x 2) Vezme jednotlivé údaje (x i ) a počítá Znovu když budeme předpokládat velký rozsah výběru n>30 Můžeme dané pravděpodobnostní rozdělení nahradit NR Stejné jako minule pouze nahradíme σ - (s x ) Levostranný Pravostranný Pouhé dosazení do vzorce, ale pozor na: 1) n>30 2) Jestli známe rozptyl Z.S. nebo ne!!! 3) Oboustranný interval u 1-α/2 4) Jednostranný u 1-α

Maruška nebude tak aktivní a získá výběrový soubor pouze o 20 chlapcích Použije Studentovo t-rozdělení s (n-1) stupni volnosti Statistika má tvar: Pozor budou jiné kvantily t 1-α Pro jednostranné intervaly stejný postup Pouze kvantily NNR nahradíme kvantily t-rozdělení Dáme si pozor na počet stupňů volnosti a vyhledáme v tabulkách

Odhad rozptylu základního souboru Maruška bude dělat závěry nad výpočtem rozptylu z výběrového souboru Setkali jsme se s bodovým odhadem rozptylu v základním souboru σ 2 Tento odhad je výběrový rozptyl (s x 2) nezkreslený, konzistentní Je třeba rozlišovat, zda-li známe, tentokrát průměr ZS (μ) A nebo jej neznáme zde se bude řešit pouze příklad, že známe Cílem je konstrukce intervalu spolehlivosti pro rozptyl (interval ve kterém se bude hodnota rozptylu Z.S. nacházet s 1-α P ) Využijeme χ 2 (chí kvadrát) rozdělení s v=n-1 stupni volnosti Nezapomínat na stupně volnosti podle nich hledáme v tabulkách Statistika má tvar:

Interval spolehlivosti budeme odvozovat z: Hodnota statistiky leží v intervalu daných kvantily χ 2 s P=1-α Našim cílem je zjistit σ 2 provedeme úpravy na osamostatnění σ 2 100(1-α)% interval spolehlivosti pro rozptyl základního souboru: Zde žádné χ 2 1-α=- χ 2 1-α toto rozdělení není symetrické Ale pro n>30 aproximujeme pomocí kvantilů NNR Pravostranný interval spolehlivosti Levostranný interval spolehlivosti