7. cvičení 4ST201. Úvod: bodový a intervalový odhad

Podobné dokumenty
7. cvičení 4ST201-řešení

Tomáš Karel LS 2012/2013

1. cvičení 4ST201. Základní informace: Vyučující: Obsah: Informace o kurzu Popisná statistika Úvod do SASu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

STATISTICKÉ ZJIŠŤOVÁNÍ

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

KGG/STG Statistika pro geografy

STATISTICKÉ ODHADY Odhady populačních charakteristik

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Normální (Gaussovo) rozdělení

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

4ST201 STATISTIKA CVIČENÍ Č. 7

Seminář 6 statistické testy

Intervalové Odhady Parametrů

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

PRAVDĚPODOBNOST A STATISTIKA

Normální (Gaussovo) rozdělení

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

STATISTICKÉ HYPOTÉZY

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

You created this PDF from an application that is not licensed to print to novapdf printer (

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Testy. Pavel Provinský. 19. listopadu 2013

Ing. Michael Rost, Ph.D.

Pravděpodobnost a aplikovaná statistika

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Charakteristika datového souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Zápočtová práce STATISTIKA I

Testy statistických hypotéz

Seminář 6 statistické testy

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

4EK211 Základy ekonometrie

Testování statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI

Základní statistické metody v rizikovém inženýrství

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

5. Odhady parametrů. KGG/STG Zimní semestr

Testování statistických hypotéz. Obecný postup

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Úvod do problematiky měření

Intervalové Odhady Parametrů II Testování Hypotéz

Testování statistických hypotéz

Testování hypotéz. 4. přednáška

Cvičení ze statistiky - 7. Filip Děchtěrenko

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

4EK211 Základy ekonometrie

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

15. T e s t o v á n í h y p o t é z

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Stručný úvod do testování statistických hypotéz

Příklady na testy hypotéz o parametrech normálního rozdělení

Návrh a vyhodnocení experimentu

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Technická univerzita v Liberci

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Příklad 81b. Předpokládejme, že výška chlapců ve věku 9,5 až 10 roků má normální rozdělení N(mi;sig2)

Tomáš Karel LS 2012/2013

Vybraná rozdělení náhodné veličiny

4EK211 Základy ekonometrie

Opakování: Nominální proměnná více hodnotová odpověď.

Pravděpodobnost a matematická statistika

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Aproximace binomického rozdělení normálním

12. cvičení z PST. 20. prosince 2017

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Analýza dat z dotazníkových šetření

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Tomáš Karel LS 2012/2013

INDUKTIVNÍ STATISTIKA

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Lineární regrese. Komentované řešení pomocí MS Excel

Testování statistických hypotéz

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Biostatistika Cvičení 7

Uni- and multi-dimensional parametric tests for comparison of sample results

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

cvičící 7. cvičení 4ST20 Obsah: Bodový odhad Intervalový odhad Testování hypotéz Vysoká škola ekonomická Úvod: bodový a intervalový odhad Statistický soubor lze popsat pomocípopisných charakteristik jako aritmetický průměr, rozptyl, relativníčetnost. Vlastnosti základního souboru(např. obyvatel ČR), kterése nedajízjistit přímo (těžko se dotázat všech 0 mil. obyvatel) odhadujeme pomocívýběrového souborua jeho výběrových charakteristik. Zatímco charakteristiky ZS jsou pevnéhodnoty, statistiky VS se mění od jednoho náhodného výběru ke druhému a mají charakter náhodných veličin, neboťjsou získávány s hodnot náhodného výběru. 2

Bodový odhad Odhadujeme parametr ZS pomocí jednoho čísla eznámou hodnotu parametru Gzákladního souboru odhadneme pomocí vypočítané hodnoty vhodné výběrové charakteristiky g Bodovým odhadem i=. Průměru ZS μ = je výběrový průměr x i x = 2 ( xi μ) 2. Rozptylu ZS 2 i= σ = je výběrový rozptyl i= n x i s,2 x = ( xi x ) i= n 2 M 3. Relativní četnosti ZS π = je výběrová relativní četnost m p = n 3 Intervalový odhad Chceme co nejužšíinterval takový, že se zvolenou spolehlivostíobsahuje odhadovaný parametr. Odhad charakteristiky ZS činíme pomocí intervalu, v němž bude hledaná charakteristika ležet s určitou spolehlivostí. Spolehlivost odhadu = -α(95%,99%) α= riziko, že charakteristika nebude intervalem pokryta, volíme sami, nejčastěji 5%, % Přesnost intervalového odhadu roste s rozsahem souboru. Přesnost intervalového odhadu klesá s rostoucí spolehlivostí. Interval je pro každý výběr jiný a je náhodný! Ve (-α)*00% pokusů konstrukce intervalu, bude tento interval zahrnovat sledovaný parametr. Interval samotný jeden, sledovaný parametr zahrnuje nebo nezahrnuje! 4

Příklady: Bodový a intervalový odhad Příklad. 7..: V souboru data_cv07.sas7bdatje proměnná body z testu. V souboru je uvedeno 60 výsledků z. průběžného testu. Budeme odhadovat dosažené body za celou školu. Budeme předpokládat, že tito studenti byli náhodně vybráni ze všech.. a základětohoto výběru odhadněte středníhodnotudosažených bodůz testu, pokud z minulých výzkumůvíme, že rozptyl dosažených bodůze statistiky je přibližněroven 20,9. (POZOR, rozlišovat, zda rozptyl známe či neznáme!!) 2. Sestrojte 95% interval spolehlivosti pro střední hodnotu získaných bodů. 3. Pomocí jednostranného intervalu spolehlivosti určete dolní mez pro střední hodnotu dosažených bodů takovou, aby pravděpodobnost jejího překročení byla 0,95. Úkoly řešte ručněi v SASu. 5 Příklad 7.. v SASu. Zjistíme bodový odhad a dalšícharakteristiky: průměr, směrodatnou odchylku, směrodatnou chybu odhadu a) Describe-Summary Statistics-Analysis Variable b) Zadám proměnnou c) V listu Statistics Basic: Mean, Standard deviation, Standard error. 2. Zjistíme intervaly spolehlivosti: a) Describe-Summary Statistics-Analysis Variable První způsob b) Zadám proměnnou c) V listu Statistics Additional-Confidence limits od the mean d) Zaškrtnu 95% Druhý způsob i. Describe-Distibution Analysis-Task role-zadám proměnnou ii. V listu Distributions vyberu rozdělení-ormal iii. V listu Tables-Basic confidence interval iv. Zadám type: two-side, 95%. (pokud jednostranný: upper, lower) 6

Příklady: Bodový a intervalový odhad Příklad 7.2. : Byla zjišťována spokojenost zákazníkůrestaurace po změnějídelního lístku. Bylo náhodněosloveno celkem 320zákazníků, z nichž59bylo celkověs restauracínespokojeno.. a základětohoto výběrůodhadněte procentospokojenýchzákazníků. 2. Sestrojte 95% dvoustranný intervalspolehlivosti pro odhad procenta nespokojených zákazníků. 3. Jaký je nejmenšípodíl nespokojených zákazníkůs novou restauracíza výše daných podmínek? (nápověda: nejmenší=levostranný interval) 4. Pokud známe celkový početzákazníkůtéto restaurace a to 30 000lidí, jaký je minimálnípočet nespokojenýchzákazníků? 7 Testování hypotéz Chceme ověřit, jestli platínějakétvrzení(testovanáhypotéza). V případěparametrických testůje tato hypotéza formulována jako tvrzenío parametrech rozdělení náhodné veličiny. Testovanou hypotézu přijímáme nebo vyvracíme na základě vypočítané hodnoty testového kritéria. Tím je vhodnáfunkce hodnot náhodného výběru, která má při platnosti testované hypotézy známé rozdělení. a základěznalosti rozdělenítestového kritéria rozdělíme obor jeho hodnot na obor přijetía kritický obortak, aby pravděpodobnost, že hodnota testového kritéria bude v kritickém oboru byla rovna α. Tuto pravděpodobnost nazýváme hladina významnosti. Pravděpodobnost, že hodnota testového kritéria spadne do kritického oboru a my tak chybnězamítneme pravdivou hypotézu, by měla být malá. Čím je však αmenší, tím většíje pravděpodobnost, že naopak přijmeme chybnou hypotézu. 8

Přehled testů. Test hypotézy o střední hodnotě a) Pokud známe rozptyl b) Pokud neznáme rozptyl 2. Test hypotézy o relativní četnosti 3. Test hypotézy o shodě dvou středních hodnot a) Pokud známe hodnotu rozptylů b) Pokud neznámehodnotu rozptylů, ale domníváme se, že se rovnají c) Pokud neznámehodnotu rozptylůa domníváme se, že se nerovnají! Podívat se do vzorců, Vždy se zamyslet, najít co testuji, zvolit správný test! 9 Příklady: testování hypotéz Příklad 7.3.: Vyučujícítvrdí, že výsledek studentůz testu ze statistiky je v průměru5 bodů. a základězjištěných 60 údajůz příkladu 7.. se pokuste na hladiněvýznamnosti 5% prokázat, že to tak není. 0

Příklad. 7.4.: Příklady testování hypotéz Vraťme se k zadání příkladu 7.2.: Byla zjišťována spokojenost zákazníkůrestaurace po změnějídelního lístku. Bylo náhodněosloveno celkem 320zákazníků, z nichž59bylo celkověs restauracínespokojeno. Pokud měla restaurace při starém lístku v průměru 20% nespokojených zákazníků, ověřte předpoklad, zda se tento podíl po změnějídelního lístku změnil. (hladina významnosti je 5%). (SAS umí, podívejte se do Aplikací!)! Porovnejte doma interval spolehlivosti pro podíl nespokojených zákazníků a testovanou hypotézu! Děkuji za pozornost! Pokud budete mít jakékoliv dotazy či připomínky, pište mi na mail jana.fenclova@vse.cz nebo přijďte do konzultačních hodin každý pátek 9:00-:00 JM37. 2