cvičící 7. cvičení 4ST20 Obsah: Bodový odhad Intervalový odhad Testování hypotéz Vysoká škola ekonomická Úvod: bodový a intervalový odhad Statistický soubor lze popsat pomocípopisných charakteristik jako aritmetický průměr, rozptyl, relativníčetnost. Vlastnosti základního souboru(např. obyvatel ČR), kterése nedajízjistit přímo (těžko se dotázat všech 0 mil. obyvatel) odhadujeme pomocívýběrového souborua jeho výběrových charakteristik. Zatímco charakteristiky ZS jsou pevnéhodnoty, statistiky VS se mění od jednoho náhodného výběru ke druhému a mají charakter náhodných veličin, neboťjsou získávány s hodnot náhodného výběru. 2
Bodový odhad Odhadujeme parametr ZS pomocí jednoho čísla eznámou hodnotu parametru Gzákladního souboru odhadneme pomocí vypočítané hodnoty vhodné výběrové charakteristiky g Bodovým odhadem i=. Průměru ZS μ = je výběrový průměr x i x = 2 ( xi μ) 2. Rozptylu ZS 2 i= σ = je výběrový rozptyl i= n x i s,2 x = ( xi x ) i= n 2 M 3. Relativní četnosti ZS π = je výběrová relativní četnost m p = n 3 Intervalový odhad Chceme co nejužšíinterval takový, že se zvolenou spolehlivostíobsahuje odhadovaný parametr. Odhad charakteristiky ZS činíme pomocí intervalu, v němž bude hledaná charakteristika ležet s určitou spolehlivostí. Spolehlivost odhadu = -α(95%,99%) α= riziko, že charakteristika nebude intervalem pokryta, volíme sami, nejčastěji 5%, % Přesnost intervalového odhadu roste s rozsahem souboru. Přesnost intervalového odhadu klesá s rostoucí spolehlivostí. Interval je pro každý výběr jiný a je náhodný! Ve (-α)*00% pokusů konstrukce intervalu, bude tento interval zahrnovat sledovaný parametr. Interval samotný jeden, sledovaný parametr zahrnuje nebo nezahrnuje! 4
Příklady: Bodový a intervalový odhad Příklad. 7..: V souboru data_cv07.sas7bdatje proměnná body z testu. V souboru je uvedeno 60 výsledků z. průběžného testu. Budeme odhadovat dosažené body za celou školu. Budeme předpokládat, že tito studenti byli náhodně vybráni ze všech.. a základětohoto výběru odhadněte středníhodnotudosažených bodůz testu, pokud z minulých výzkumůvíme, že rozptyl dosažených bodůze statistiky je přibližněroven 20,9. (POZOR, rozlišovat, zda rozptyl známe či neznáme!!) 2. Sestrojte 95% interval spolehlivosti pro střední hodnotu získaných bodů. 3. Pomocí jednostranného intervalu spolehlivosti určete dolní mez pro střední hodnotu dosažených bodů takovou, aby pravděpodobnost jejího překročení byla 0,95. Úkoly řešte ručněi v SASu. 5 Příklad 7.. v SASu. Zjistíme bodový odhad a dalšícharakteristiky: průměr, směrodatnou odchylku, směrodatnou chybu odhadu a) Describe-Summary Statistics-Analysis Variable b) Zadám proměnnou c) V listu Statistics Basic: Mean, Standard deviation, Standard error. 2. Zjistíme intervaly spolehlivosti: a) Describe-Summary Statistics-Analysis Variable První způsob b) Zadám proměnnou c) V listu Statistics Additional-Confidence limits od the mean d) Zaškrtnu 95% Druhý způsob i. Describe-Distibution Analysis-Task role-zadám proměnnou ii. V listu Distributions vyberu rozdělení-ormal iii. V listu Tables-Basic confidence interval iv. Zadám type: two-side, 95%. (pokud jednostranný: upper, lower) 6
Příklady: Bodový a intervalový odhad Příklad 7.2. : Byla zjišťována spokojenost zákazníkůrestaurace po změnějídelního lístku. Bylo náhodněosloveno celkem 320zákazníků, z nichž59bylo celkověs restauracínespokojeno.. a základětohoto výběrůodhadněte procentospokojenýchzákazníků. 2. Sestrojte 95% dvoustranný intervalspolehlivosti pro odhad procenta nespokojených zákazníků. 3. Jaký je nejmenšípodíl nespokojených zákazníkůs novou restauracíza výše daných podmínek? (nápověda: nejmenší=levostranný interval) 4. Pokud známe celkový početzákazníkůtéto restaurace a to 30 000lidí, jaký je minimálnípočet nespokojenýchzákazníků? 7 Testování hypotéz Chceme ověřit, jestli platínějakétvrzení(testovanáhypotéza). V případěparametrických testůje tato hypotéza formulována jako tvrzenío parametrech rozdělení náhodné veličiny. Testovanou hypotézu přijímáme nebo vyvracíme na základě vypočítané hodnoty testového kritéria. Tím je vhodnáfunkce hodnot náhodného výběru, která má při platnosti testované hypotézy známé rozdělení. a základěznalosti rozdělenítestového kritéria rozdělíme obor jeho hodnot na obor přijetía kritický obortak, aby pravděpodobnost, že hodnota testového kritéria bude v kritickém oboru byla rovna α. Tuto pravděpodobnost nazýváme hladina významnosti. Pravděpodobnost, že hodnota testového kritéria spadne do kritického oboru a my tak chybnězamítneme pravdivou hypotézu, by měla být malá. Čím je však αmenší, tím většíje pravděpodobnost, že naopak přijmeme chybnou hypotézu. 8
Přehled testů. Test hypotézy o střední hodnotě a) Pokud známe rozptyl b) Pokud neznáme rozptyl 2. Test hypotézy o relativní četnosti 3. Test hypotézy o shodě dvou středních hodnot a) Pokud známe hodnotu rozptylů b) Pokud neznámehodnotu rozptylů, ale domníváme se, že se rovnají c) Pokud neznámehodnotu rozptylůa domníváme se, že se nerovnají! Podívat se do vzorců, Vždy se zamyslet, najít co testuji, zvolit správný test! 9 Příklady: testování hypotéz Příklad 7.3.: Vyučujícítvrdí, že výsledek studentůz testu ze statistiky je v průměru5 bodů. a základězjištěných 60 údajůz příkladu 7.. se pokuste na hladiněvýznamnosti 5% prokázat, že to tak není. 0
Příklad. 7.4.: Příklady testování hypotéz Vraťme se k zadání příkladu 7.2.: Byla zjišťována spokojenost zákazníkůrestaurace po změnějídelního lístku. Bylo náhodněosloveno celkem 320zákazníků, z nichž59bylo celkověs restauracínespokojeno. Pokud měla restaurace při starém lístku v průměru 20% nespokojených zákazníků, ověřte předpoklad, zda se tento podíl po změnějídelního lístku změnil. (hladina významnosti je 5%). (SAS umí, podívejte se do Aplikací!)! Porovnejte doma interval spolehlivosti pro podíl nespokojených zákazníků a testovanou hypotézu! Děkuji za pozornost! Pokud budete mít jakékoliv dotazy či připomínky, pište mi na mail jana.fenclova@vse.cz nebo přijďte do konzultačních hodin každý pátek 9:00-:00 JM37. 2