12 Úvod do statistiky

Podobné dokumenty
Aproximace binomického rozdělení normálním

Testování statistických hypotéz

8 Střední hodnota a rozptyl

Cvičení ze statistiky - 8. Filip Děchtěrenko

Charakteristika datového souboru

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování statistických hypotéz

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testy. Pavel Provinský. 19. listopadu 2013

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

12. cvičení z PST. 20. prosince 2017

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

2 ) 4, Φ 1 (1 0,005)

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Normální (Gaussovo) rozdělení

Zápočtová práce STATISTIKA I

5 Parametrické testy hypotéz

KGG/STG Statistika pro geografy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Ing. Michael Rost, Ph.D.

Tomáš Karel LS 2012/2013

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

4ST201 STATISTIKA CVIČENÍ Č. 7

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

8. Normální rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

7.1. Podstata testu statistické hypotézy

Pravděpodobnost a aplikovaná statistika

Testy statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

12. prosince n pro n = n = 30 = S X

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

pravděpodobnosti 9 Některá význačná diskrétní rozdělení pravděpodobnosti

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

You created this PDF from an application that is not licensed to print to novapdf printer (

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Náhodná veličina a rozdělení pravděpodobnosti

= = 2368

Při statistickém zkoumání se snažíme udělat nějaký závěr ohledně vlastností celého statistického souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Návrh a vyhodnocení experimentu

Jednofaktorová analýza rozptylu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Základy popisné statistiky

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Náhodné veličiny, náhodné chyby

15. T e s t o v á n í h y p o t é z

Vybraná rozdělení náhodné veličiny

Náhodné (statistické) chyby přímých měření

Testování hypotéz. 4. přednáška

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Náhodné chyby přímých měření

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Jana Vránová, 3. lékařská fakulta UK

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

15. T e s t o v á n í h y p o t é z

11 Rovnoměrné a normální rozdělení psti

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Základní statistické metody v rizikovém inženýrství

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

y = 0, ,19716x.

Pravděpodobnost a matematická statistika

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

4EK211 Základy ekonometrie

Regresní analýza 1. Regresní analýza

STATISTICKÉ HYPOTÉZY

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Příklady na testy hypotéz o parametrech normálního rozdělení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ ODHADY Odhady populačních charakteristik

7 Pravděpodobnostní modely úvod

ROZDĚLENÍ NÁHODNÝCH VELIČIN

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Cvičení ze statistiky - 7. Filip Děchtěrenko

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

KGG/STG Statistika pro geografy

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Transkript:

12 Úvod do statistiky 12 Úvod do statistiky Břetislav Fajmon, UMAT FEKT, VUT Brno Tato přednáška je složena z částí textu [1], a sice oddíl 10.2 empirické charakteristiky popisu dat oddíl 11.3 základní principy statistického testu oddíl 11.4 příklad diskrétního statistického testu oddíl 13.5 příklad spojitého statistického testu kapitola 14 test střední hodnoty průměru X při známém rozptylu. bed b@d OBSAH 1/37

12 Úvod do statistiky Za důležitý text na českém internetu považuji též text http://homen.vsb.cz/~oti73/cdpast1/, který je velmi přehledný (a obsahuje nejen partie statistiky, ale též jej doporučuji v rámci opakování části pravděpodobnost). Já osobně jsem se statistice věnoval v první polovině textu [3] předmětu MPSO na FEKT. bed b@d OBSAH 2/37

12 Úvod do statistiky12.1 Základy statistického měření 12.1 Základy statistického měření Co je to statistika? První informace, které lze označit za statistiku, určitě souvisí se slovem status (= stav), a možná také přeneseně i se slovem stát, protože první souhrnná měření se většinou týkala měření či informací shrnujících stav na území určitého státu. Dnes bychom možná pojem statistiky vymezili obšírněji: statistika = jakékoli zpracování informací, které souvisí s měřením určitých veličin. bed b@d OBSAH 3/37

12 Úvod do statistiky12.1 Základy statistického měření Základní pojmy, které zpracovávají soubor měření jedné veličiny: Průměr z naměřených hodnot x 1, x 2,..., x n : x = 1 n n i=1 x i. Označení x je celkem standardní a používá se ve fyzice i dalších vědách k vyjádření průměrné hodnoty. Medián z hodnot x 1, x 2,..., x n je prostřední z těchto hodnot vzhledem k jejich uspořádání podle velikosti. Modus z hodnot x 1, x 2,..., x n je ta z hodnot, která se vyskytuje s nejvyšší četností. bed b@d OBSAH 4/37

12 Úvod do statistiky12.1 Základy statistického měření Příklad 12.1. u 11 osob: Jsou získány výsledky kvizového skóre 8, 5, 7, 9, 8, 1, 3, 4, 7, 7, 7. Průměr těchto hodnot je x = 1 11 x i = 66 11 = 6. Modus tohoto souboru je hodnota, která se vyskytuje nejčastěji, čili číslo 7. A abychom mohli určit medián, musíme hodnoty seřadit podle velikosti (například vzestupně): 1, 3, 4, 5, 7, 7, 7, 7, 8, 8, 9. Prostřední z těchto hodnot je na šesté pozici, čili mediánem je číslo 7. bed b@d OBSAH 5/37

12 Úvod do statistiky12.1 Základy statistického měření Příklad 12.2. Mějme jiný soubor hodnot, už uspořádaný podle velikosti, například sestupně: 7, 6, 5, 5, 4, 2, 1, 1. Protože počet měření je sudý (budeme též říkat, že soubor měření má sudou délku), medián určíme jako průměr dvou prostředních hodnot: 1 2 (5 + 4) = 4,5. bed b@d OBSAH 6/37

12 Úvod do statistiky12.1 Základy statistického měření Příklad 12.3. Soubor měření může mít více modů (= druhý pád od slova modus). Například soubor 8, 6, 6, 5, 4, 3, 3 je tzv. bimodální soubor, protože nejčastěji (= dvakrát) se v něm objevují hodnoty 6 (=modus1) a 3 (=modus2). Při třech modech mluvíme o trimodálním, při čtyřech o kvatromodálním souboru, atd. Některé učebnice ignorují možnost více modů a za modus označují největší nejčastěji nabývanou hodnotu, což by v našem případě bylo 6. Z uvedených tří charakteristik je většinou nejužitečnější průměr až na situace tzv. odkloněných hodnot (např.: měření výše platu v ČR). bed b@d OBSAH 7/37

12 Úvod do statistiky12.1 Základy statistického měření Dalšími pojmy kromě pojmů již uvedených je horní a dolní kvartil lze označit např. q 25 a q 75. Dolní kvartil získáme ze souboru měření uspořádaného podle velikosti tak, že vezmeme hodnotu, která je větší než 25 procent souboru měření; horní kvartil je hodnota větší než 75 procent souboru měření (opět uspořádaného podle velikosti vzestupně). Viz obrázek o platech v ČR. zmínka o α-kvantilu (netýká se statistiky, ale pravděpodobnosti, protože α-kvantil konstruujeme pomocí F (x)). bed b@d OBSAH 8/37

12 Úvod do statistiky12.1 Základy statistického měření Příklad 12.4. Náhodná veličina X udává počet líců při čtyřech hodech mincí. Měřením se získalo těchto dvacet hodnot veličiny: 3, 1, 1, 3, 1, 2, 0, 2, 4, 4, 1, 2, 2, 1, 2, 1, 2, 3, 3, 3. Určete průměr a empirický rozptyl souboru měření. a) Klasické řešení: Vypočteme průměr, empirický rozptyl i empirickou směrodatnou odchylku: x = 1 20 20 1 x i = 2,05; bed b@d OBSAH 9/37

12 Úvod do statistiky12.1 Základy statistického měření s 2 = 1 20 20 ( 1 x 2 i ) 2,05 2 = 1,1475; s = 1,1475 = 1,0712. Vidíme tedy, že při čtyřech hodech mincí padalo průměrně 2, 05 líců; odchylka s. = 1,07 znamená, že pokud měřenou veličinu lze popsat normálním rozdělením, víme, že asi 68 procent měření veličiny leží v intervalu (2, 05 1, 07; 2, 05 + 1, 07). b) Řešení pomocí rozdělení četnosti: Máme li data zpracována v podobě četností viz tabulka 1, kde ν i jsou hodnoty, kterých veličina X nabývá (ν je písmeno řecké abecedy a čte se ný ) bed b@d OBSAH 10/37

12 Úvod do statistiky12.1 Základy statistického měření Tabulka 1: K příkladu 4: Tabulka četností souboru měření veličiny X. ν i νi 2 četnost c(ν i ) 0 0 1 1 1 6 2 4 6 3 9 5 4 16 2 x = 1 n ν i c(ν i ); s 2 = 1 n ( νi 2 c(ν i )) x 2. ν i ν i bed b@d OBSAH 11/37

12 Úvod do statistiky12.1 Základy statistického měření c) Řešení pomocí rozdělení pravděpodobnosti: Úpravou c(ν i ) n = p(ν i). lze dosáhnout přepisu vzorců ve tvaru x = ν i c(ν i) n = ν i p(ν i ); ν i ν ( ) i s 2 = νi 2 c(ν i) x 2 = ( νi 2 p(ν i )) x 2. n ν i ν i S využitím tabulky 2 empirických pravděpodobností pak dosazením do těchto vzorců dostaneme tentýž výsledek jako v případě a) a b). bed b@d OBSAH 12/37

12 Úvod do statistiky12.1 Základy statistického měření Tabulka 2: K příkladu 4: Tabulka empirických pravděpodobností. ν i νi 2 p(ν i ) 0 0 0,05 1 1 0,3 2 4 0,3 3 9 0,25 4 16 0,1 I v tomto případě se stále jedná o pouhé přepsání stejných vzorců a) nebo b) s využitím označení pomocí pravděpodobnosti. bed b@d OBSAH 13/37

12 Úvod do statistiky12.2 Principy statistického textu 12.2 Principy statistického textu Příklad 12.5. Soudní proces jako příklad rozhodovacího procesu. Uvažujme jednoduchý soudní proces, ve kterém existuje pouze jediný možný trest a soud rozhodne, zda se tomuto trestu obžalovaný podrobí nebo ne. A navíc proti rozhodnutí soudu neexistuje žádné odvolání. Jedná se o jakýsi rozhodovací proces, u kterého mohou nastat čtyři možné výsledky: bed b@d OBSAH 14/37

12 Úvod do statistiky12.2 Principy statistického textu 1. Obžalovaný je vinen a soud jej odsoudí. 2. Obžalovaný je nevinen a soud jej osvobodí. 3. Obžalovaný je nevinen a soud jej odsoudí. Jedná se o chybné rozhodnutí - tuto chybu budeme označovat jako chybu prvního druhu. 4. Obžalovaný je vinen a soud jej osvobodí. Toto rozhodnutí je rovněž chybné - budeme tuto chybu označovat chybou druhého druhu. V každém soudním procesu se musí hledat jistá rovnováha mezi tvrdostí a mírností. Jedním extrémem je liberální soudce, který k usvědčení obžalovaného vyžaduje velké množství důkazů. bed b@d OBSAH 15/37

12 Úvod do statistiky12.2 Principy statistického textu Takový soudce jen zřídka odsoudí nevinného (zřídka se dopustí chyby prvního druhu), ale dosti často osvobodí viníka (chyba druhého druhu). Druhým extrémem je soudce, kterému k usvědčení stačí jen několik důkazů. Takový soudce posílá do vězení i jen při stínu podezření, čili častěji odsoudí nevinného (chyba prvního druhu), ale zřídka osvobodí darebáka (= zřídka se dopustí chyby druhého druhu). Slova konzervativní a liberální jsou termíny z politiky. V dnešní době už nikdo neví, co znamenají. Tato jejich statistická definice navrhuje jejich význam, ale také upozorňuje na nebezpečí každého z těchto postojů. bed b@d OBSAH 16/37

12 Úvod do statistiky12.2 Principy statistického textu Je otázkou, která z chyb je závažnější - zda chyba prvního druhu, nebo chyba druhého druhu. Všeobecně se má za to, že závažnější je uvěznit nevinného, než osvobodit darebáka. A proto se chybě odsouzení nevinného přisuzuje druh číslo 1 a věnuje se jí větší pozornost. Ale někde musí být stanovena jistá hranice, po jejímž překročení už soud přistoupí k rozhodnutí vinen a bez skrupulí člověka potrestá. Všimněme si jedné věci, která platí jako obecný princip. Pokud se soudce snaží být benevolentní a odsoudí člověka až po nahromadění velkého množství důkazů (snižuje tím možnost výskytu chyby prvního druhu), současně narůstá nebezpečí, že i když je bed b@d OBSAH 17/37

12 Úvod do statistiky12.2 Principy statistického textu obžalovaný vinen, potřebné množství důkazů se nenajde a soud jej osvobodí (roste možnost výskytu chyby druhého druhu). Není to nic světoborného, ale už jsme dlouho neměli žádný rámeček, a proto jej aspoň uvnitř příkladu můžeme použít: Snižováním možnosti výskytu chyby prvního druhu roste možnost výskytu chyby druhého druhu - a naopak: pokud zvyšujeme možnost výskytu chyby prvního druhu, snižuje se možnost výskytu chyby druhého druhu. Z uvedeného je vidět, že žádnou z chyb není možné naprosto vyrušit: pokud totiž snižujeme možnost výskytu chyby prvního druhu až téměř na nulu, bed b@d OBSAH 18/37

12 Úvod do statistiky12.2 Principy statistického textu roste tím možnost výskytu chyby druhého druhu do obludných rozměrů a rozhodnutí učiněná tímto stylem jsou nerozumná, až nemoudrá. Strategií v rozhodovacích procesech tohoto typu je tedy zvolit pravděpodobnost výskytu chyby prvního druhu malou, ale ne příliš malou. Shrňme předchozí úvahy do pěti kroků, které popisují celý soudní proces: 1. Stojí proti sobě dvě možná rozhodnutí soudu: H 0... obžalovaný je nevinen H 1... obžalovaný je vinen bed b@d OBSAH 19/37

12 Úvod do statistiky12.2 Principy statistického textu Soud musí rozhodnout právě jednu z těchto variant a toto rozhodnutí je nezvratné, neexistuje proti němu odvolání. 2. Vystoupí žalobce, který předloží nashromážděné důkazy pro platnost H 1. 3. Vystoupí obhájce a vysvětlí všechny souvislosti za předpokladu, že platí H 0. Snaží se vidět a vysvětlit všechny argumenty obžaloby ve světle toho, že obžalovaný je nevinen. 4. Porota soudu se odebere k rokování. Bere v ůvahu jak množství důkazů a jejich závažnost, tak i argumenty obhajoby a možnost, že tyto důkazy neznamenají nutně vinu obžalovaného, ale jen shodu náhod. bed b@d OBSAH 20/37

12 Úvod do statistiky12.2 Principy statistického textu 5. Porota se vrací a vyslovuje svůj verdikt: pokud byla překročena míra závažnosti důkazů pro platnost H 1, obžalovaný je vinen. pokud ne, obžalovaný je osvobozen. Toto rozhodnutí soudu je nezvratné. Tabulka 3: Čtyři možné výsledky statistického testu. skutečnost: H 0 platí skutečnost: H 1 platí rozhodnutí: H 0 nezamítáme O.K. chyba 2.druhu rozhodnutí: H 0 zamítáme chyba 1.druhu O.K. Právě uvedených pět kroků v příkladu 5 se vyskytuje v mnoha rozhodovacích procesech, které nazý- bed b@d OBSAH 21/37

12 Úvod do statistiky12.2 Principy statistického textu váme statistické testy. Tyto principy platí obecně, vyslovme je tedy obecně, už oproštěni od příkladu soudce a obžalovaného (ovšem analogie se soudním procesem zde existuje velice přímá): (K1) Statistický test obyčejně rozhoduje o tom, zda platí hypotéza H 0 (tzv. nulová hypotéza) nebo H 1 (tzv. alternativní hypotéza). Tyto dvě hypotézy přitom stojí ve vzájemném rozporu. Ve většině testů H 0 tvrdí, že jistá veličina nezávisí na hodnotách určité další veličiny, kdežto H 1 tvrdí, že naopak závisí. (K2) Stanovíme kritérium (zpravidla určitou funkci), které ukazuje na míru platnosti alternativní hy- bed b@d OBSAH 22/37

12 Úvod do statistiky12.2 Principy statistického textu potézy H 1 (určuje závažnost důkazů pro H 1 ). Pak provedeme experiment, změříme data a dosadíme do našeho kritéria. (K3) Kritériem bývá jistá funkce, která při různých měřeních nabývá různých hodnot, je to tedy náhodná veličina. Určíme teoretické rozdělení kritéria za předpokladu, že platí hypotéza H 0. Jinými slovy, popíšeme vlastnosti kriterijní veličiny ve světle toho, že platí H 0. (K4) Na základě teoretického rozdělení kriterijní veličiny stanovíme určitý interval hodnot, kam když padne empirická hodnota kritéria, tak nezviklá naše přesvědčení o platnosti H 0, ale bed b@d OBSAH 23/37

12 Úvod do statistiky12.2 Principy statistického textu eventuelní dopad hodnoty kritéria mimo tento interval nás povede k názoru, že byla překročena jistá kritická míra, takže usoudíme, že H 0 neplatí. Kritickou míru zpravidla určujeme tak, aby pravděpodobnost výskytu chyby prvního druhu (tj. že rozhodneme, že H 0 neplatí, když ve skutečnosti H 0 platí) byla dostatečně malá, např rovna 0.05 (to se chyby prvního druhu dopustíme nejvýše v pěti procentech případů), ale ne příliš malá, aby nerostla možnost výskytu chyby druhého druhu (tj. že rozhodneme, že H 0 platí, když ve skutečnosti H 0 neplatí) do nerozumných rozměrů. bed b@d OBSAH 24/37

12 Úvod do statistiky12.2 Principy statistického textu (K5) Porovnáme empirickou hodnotu kritéria s kritickou mírou. Pokud je kritická míra překročena (hodnota kritéria leží mimo interval nalezený v bodě 4), zamítáme hypotézu H 0 ve prospěch alternativní hypotézy H 1. Pokud není kritická míra překročena, hypotézu H 0 nezamítáme. Další standardní označení (viz tabulka 3) se používá pro pravděpodobnost výskytu chyby 1.druhu (značí se α) a pravděpodobnost výskytu chyby 2.druhu (značíme β). bed b@d OBSAH 25/37

12 12.3 Úvod Znaménkový do statistiky test příklad testu parametru diskrétní veličiny 12.3 Znaménkový test příklad testu parametru diskrétní veličiny Příklad 12.6. Podle expertního předpokladu má mít o nový výrobek zájem dvacet procent zákazníků. Ze 80 dotázaných jich projevilo zájem 25. Testujte hypotézu, že předpoklad expertů se naplnil. bed b@d OBSAH 26/37

12 12.3 Úvod Znaménkový do statistiky test příklad testu parametru diskrétní veličiny Projdeme při řešení příkladu pět kroků statistického testu. Kritický interval: pro α = 0,05 zamítáme mimo interval 10 až 22, protože p(0)+p(1)+ +p(9) = 0,0287 > 0,025 (tím je určena mez 10, protože je to první číslo, pro které součet všech předchozích pstí přesáhne hodnotu 0,025 = α 2 ), a dále p(23) + p(24) + + p(80) =. 0,0388 > 0,025 (tím je určena mez 22, protože to je první číslo zprava, pro které součet všech následujících pstí přesáhne hodnotu 0,025 = α 2 ). Jednotlivé psti se vypočtou pomocí binomického rozdělení Bi(n = 80; p = 0,2). bed b@d OBSAH 27/37

12 Úvod do 12.4 statistiky U-test příklad testu parametru spojité veličiny 12.4 U-test příklad testu parametru spojité veličiny Příklad 12.7. Podle expertního předpokladu má mít o nový výrobek zájem dvacet procent zákazníků. Ze 80 dotázaných jich projevilo zájem 25. Testujte hypotézu, že předpoklad expertů se naplnil. Tentýž příklad nyní vyřešíme testem na normální rozdělení: budeme potřebovat znát EX a DX, které vypočteme způsobem binomickým (= nahrazujeme binomické rozdělení normálním se stejnou střední hodnotou a rozptylem): EX = Np = 80 0,2 = 16 DX = Np(1 p) = 80 0,2 0,8 = 12,8; bed b@d OBSAH 28/37

12 Úvod do 12.4 statistiky U-test příklad testu parametru spojité veličiny využijeme spíše hodnotu σ = DX =. 3,5777. Nyní převedeme naměřenou hodnotu X = 25 na U-hodnotu U = 25 16 3,5777. = 2,516, a to překračuje sice interval 1,96; 1,96 standardizované normálně rozdělené veličiny pro α = 0,05, ale spadá do intervalu 2,58; 2,58 pro α = 0,01 čili hodnota X = 25 je slabě významně vychýlená od předpokládané střední hodnoty 16. bed b@d OBSAH 29/37

12 Úvod do 12.4 statistiky U-test příklad testu parametru spojité veličiny Uvedené intervaly lze transformací X = U σ + µ do řeči hodnot veličiny X: pro α = 0,05 je interval pro nezamítnutí H 0 roven 1,96; 1,96 3,577 + 16 = 8,99; 23,01 ; pro α = 0,01 je interval pro nezamítnutí H 0 roven 2,58; 2,58 3,577 + 16 = 6,77; 25,23 ; bed b@d OBSAH 30/37

12 Úvod12.5doTest statistiky střední hodnoty průměru X při známém rozptylu 12.5 Test střední hodnoty průměru X při známém rozptylu Příklad 12.8. Výrobce pružin prohlašuje, že jeho výrobek má střední hodnotu zlomu µ = 58 kg a směrodatnou odchylku σ = 3,5 kg. Testujte, zda odpovídá tvrzení skutečnosti, je-li pro 49 testovaných pružin průměrný bod zlomu 55 kg použijte hladinu významnosti α = 0,01. (K1) Hypotéza H 0 : µ = 58 kg (= střední hodnota je skutečně rovna 58 kg); H 1 : µ 58. (K2) Kritériem je průměr 49 měření: X = 1 49 Xi... bed b@d OBSAH 31/37

12 Úvod12.5doTest statistiky střední hodnoty průměru X při známém rozptylu průměr normálně rozdělených veličin. (K3) Za předpokladu platnosti H 0 má veličina X rozdělení No(µ = 58; σ X = 3,5 = 0,5) 49 (oba parametry jsou v kilogramech). (K4) Pro α = 0,01 kritické hodnoty oboustranného testu vytvářejí interval pro nezamítnutí H 0 roven 2,58; 2,58, což po transformaci ne veličinu X dělá 2,58; 2,58 0,5 + 58 = 56,71; 59,29 ; a to jsme ještě konzervativní (α = 0,01!!!). bed b@d OBSAH 32/37

12 Úvod12.5doTest statistiky střední hodnoty průměru X při známém rozptylu (K5) Průměr zlomu 55 kg pro 49 měření neleží v intervalu pro nezamítnutí H 0, je tedy statisticky významným potvrzením, že výrobce lže (bod zlomu je nižší, nové pružiny tolik nevydrží). Příklad 12.9. Určete sílu testu z předchozího příkladu, je-li ve skutečnosti střední hodnota průměru pružin bodu zlomu rovna µ = 56 kg (síla testu = pst správného zamítnutí hypotézy H 0, když ve skutečnosti platí H 1 ). bed b@d OBSAH 33/37

12 Úvod12.5doTest statistiky střední hodnoty průměru X při známém rozptylu Řešení: hodnota µ = 56 je tedy hodnotou, ze které budeme v tomto určení síly testu vycházet: Máme spočítat pst zamítnutí H 0, tj. pst, že X naměříme mimo interval 56,71; 59,29 (viz předchozí příklad). To tedy znamená: p = P (X < 56,71) + P (X > 59,29) = F (56,71) + (1 F (59,29)) = ( ) ( ) 56,71 56 59,29 56 = Φ + 1 Φ = 0,5 0,5 = Φ(1,42) + 1 Φ(6,58) =. 0,9222 + 1 1 = 0,9222. bed b@d OBSAH 34/37

12 Úvod12.5doTest statistiky střední hodnoty průměru X při známém rozptylu Jedna drobná poznámka ke statistickým testům: někdy pokud to teoretické předpoklady veličiny dovolují, provádíme tzv. jednostranný statistický test, tj. hypotéza H 1 není tvaru µ const, ale je tvaru µ > const (respektive tvaru µ > const) viz příklad v oddílku 13.5.1, nebo příklad 14.4 ve skriptech [1]. (v takových příkladech při určení intervalu pro nezamítnutí H 0 neusekneme α 2 obsahu na obou stranách reálné osy, ale usekneme celý obsah α na jedné straně na té straně, na kterou je od uvažované konstanty testu vychýlena střední hodnota µ v hypotéze H 1 ). bed b@d OBSAH 35/37

Literatura Do základního kursu statistiky patří též povídání o intervalech spolehlivosti, které často obsahují více informací než statistické testy ovšem to už není možné stihnout v úvodní přednášce na toto téma (ve skriptech [1] též už intervaly spolehlivosti nejsou zmíněny). Literatura [1] Fajmon, B., Růžičková, I.: Matematika 3. Skriptum FEKT 2003 (identifikační číslo v informačním systému VUT: MAT103). http://www.rozhovor.cz/souvislosti/matematika3.pdf. bed b@d OBSAH 36/37

Literatura [2] Petr Otipka, Vladislav Šmajstrla: Pravděpodobnost a statistika. Studijní text v rámci distanční formy studijních textů. VŠB - Technická unjiverzita Ostrava. Přístupné na adrese http://homen.vsb.cz/~oti73/cdpast1/. [3] Fajmon, B., Koláček, J.: Pravděpodobnost, statistika a operační výzkum. Elektronický text VUT (MAT503), Brno 2005. K dispozici na adrese http://www.rozhovor.cz/ma+fy/index.php. bed b@d OBSAH 37/37