Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Podobné dokumenty
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Pravděpodobnost a aplikovaná statistika

Testování statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování statistických hypotéz

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

= = 2368

Ing. Michael Rost, Ph.D.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

12. cvičení z PST. 20. prosince 2017

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Aproximace binomického rozdělení normálním

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Zápočtová práce STATISTIKA I

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

12. prosince n pro n = n = 30 = S X

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testy nezávislosti kardinálních veličin

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz. Obecný postup

Stručný úvod do testování statistických hypotéz

Korelace. Komentované řešení pomocí MS Excel

Jednovýběrové testy. Komentované řešení pomocí MS Excel

Testy statistických hypotéz

Náhodné veličiny, náhodné chyby

Normální (Gaussovo) rozdělení

Charakteristika datového souboru

Cvičení ze statistiky - 9. Filip Děchtěrenko

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

15. T e s t o v á n í h y p o t é z

2 ) 4, Φ 1 (1 0,005)

8. Normální rozdělení

4EK211 Základy ekonometrie

5. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Jednostranné intervaly spolehlivosti

4ST201 STATISTIKA CVIČENÍ Č. 7

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

STATISTICKÉ TESTY VÝZNAMNOSTI

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

7.1. Podstata testu statistické hypotézy

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Normální rozložení a odvozená rozložení

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

STATISTICKÉ ODHADY Odhady populačních charakteristik

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Výběrové charakteristiky a jejich rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Intervalové Odhady Parametrů II Testování Hypotéz

STATISTICKÉ HYPOTÉZY

5 Parametrické testy hypotéz

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Intervalové Odhady Parametrů

Vybrané partie z biostatistiky

Jednofaktorová analýza rozptylu

Testování hypotéz o parametrech regresního modelu

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Testování hypotéz o parametrech regresního modelu

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Pearsonův korelační koeficient

Transkript:

Pravděpodobnost vs. statistika Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo Statistika odvozovali jsme charakteristiky těchto rozdělení atd. pracuje s pozorováními (daty) náhodný výběr z nějakého neznámého rozdělení na základě dat se snažíme něco říci o rozdělení, z něhož pocházejí (např. o střední hodnotě apod.) někdy pozorujeme více náhodných veličin (více náhodných výběrů) a chceme něco usoudit o jejich vzájemném vztahu Příklad datového souboru Studie zkoumající účinky nového léku pro snižování krevního tlaku: id lék tlak pred tlak po pohl. váha... kuřák........ 103 T 145 120 M 82... ano 104 C 155 130 M 97... ano 105 T 140 135 Z 74... ne 106 C 160 150 M 123... ano........ Dva typy problémů: odhady neznámých kvantit odhady parametrů rozhodování o platnosti nějakého výroku testování hypotéz Univerzita Karlova v Praze Matematická statistika 1/ 43 Univerzita Karlova v Praze Matematická statistika 2/ 43 Teorie odhadu Formální definice máme data x 1,..., x n (např. hodnoty výšky studentů) považujeme je za realizaci náhodného výběru X 1,..., X n z nějakého neznámého rozdělení chceme něco usuzovat o charakteristikách tohoto rozdělení (střední hodnota, rozptyl, hustota... ) budeme konstruovat jejich odhady (tzv. bodové odhady) odhadů je mnoho, chceme vybrat ty dobré Jak by měl vypadat dobrý odhad? Neměl by mít žádnou systematickou výchylku (v průměru by měl odhadovat to, co chceme odhadovat). S přibývajícím počtem pozorování by měl být přesnější a přesnější. Definice Odhadem neznámé charakteristiky θ rozumíme jakoukoli funkci θ n pozorování X 1,..., X n. 1 Odhad θ n nazýváme nestranný (nevychýlený), pokud E θ n = θ. 2 Odhad θ n nazýváme konzistentní, pokud lim n θn = θ. Závěr: Rozumné odhady by měly být konzistentní a pokud možno nestranné (ale malá výchylka nevadí). Už víme: průměr je dobrý odhad střední hodnoty (je nestranný i konzistentní). Univerzita Karlova v Praze Matematická statistika 3/ 43 Univerzita Karlova v Praze Matematická statistika 4/ 43

Popisné statistiky jako bodové odhady Odhad distribuční funkce Teorie náhodná veličina X hustota f střední hodnota EX rozptyl var X medián, kvantily pravděpodobnost jevu Odhady data realizace náh.výběru histogram výběrový průměr X n výběrový rozptyl S 2 X výběrový medián, výběrové kvantily relativní četnost případů Problém: X 1,..., X n náhodný výběr, chceme odhadnout distribuční funkci F (x) = P(X x) Empirická distribuční funkce definovaná jako F n (x) = #[i : X i x] n lze ukázat, že má dobré vlastnosti hodnota funkce F n v bodě x je odhadem pravděpodobnosti P[X i x] pomocí relativní četnosti jevu [X i x] Univerzita Karlova v Praze Matematická statistika 5/ 43 Univerzita Karlova v Praze Matematická statistika 6/ 43 Odhad distribuční funkce Empirická distribuční funkce váhy studentů 1. ročníku PřF (muži a ženy zvlášť). Odhad kovariance a korelace Problém: náhodný výběr ( X 1 ) ( Y 1,..., Xn ) Y n z dvourozměrného rozdělení, chceme odhadnout kovarianci a korelaci znaků X a Y Výběrová kovariance: EDF 0.0 0.2 0.4 0.6 0.8 1.0 zeny muzi 40 60 80 100 120 S XY = 1 n 1 n (X i X )(Y i Y ) i=1 X je výběrový průměr X 1,..., X n Y je výběrový průměr Y 1,..., Y n S XY má stejnou struktura jako teoretická kovariance, jen střední hodnoty nahrazeny průměry S XY je dobrý odhad cov (X, Y ) Hmotnost Univerzita Karlova v Praze Matematická statistika 7/ 43 Univerzita Karlova v Praze Matematická statistika 8/ 43

Odhad korelace Korelace: ρ XY = cov (X, Y ) var X var Y Výběrový korelační koeficient r XY = S XY S X S Y = S 2 X je výběrový rozptyl X 1,..., X n S 2 Y je výběrový rozptyl Y 1,..., Y n n i=1 (X i X )(Y i Y ) n i=1 (X i X ) 2. n i=1 (Y i Y ) 2 r XY je dobrý (konzistentní ale ne nestranný) odhad ρ XY Univerzita Karlova v Praze Matematická statistika 9/ 43 Odhad kovariance a korelace: příklad Graf váhy proti výšce (r XY = 0.72): Vyska 50 60 70 80 90 100 110 150 160 170 180 190 200 hodnota r XY koresponduje s obrázkem zdá se, že větší výška se pojí s vyšší hmotností Univerzita Karlova v Praze Matematická statistika 10/ 43 Vaha Odhad kovariance a korelace příklad Intervalové odhady Graf výšky proti věku otce při narození dítěte (r XY = 0.04): Vyska 150 160 170 180 190 200 20 25 30 35 40 45 doteď: tzv. bodové odhady (odhadem charakteristiky je číslo) nevyjadřuje nic o přesnosti odhadu Intervalový odhad parametru θ interval s náhodnými mezemi, který překryje θ s předepsanou pravděpodobností 1 α např. 95% interval spolehlivosti, interval na hladině 99% apod. konkrétněji si uvedeme později Vek otce pri narozeni ditete nic nenaznačuje, že by výška nějak souvisela s věkem otce při narození dítěte Univerzita Karlova v Praze Matematická statistika 11/ 43 Univerzita Karlova v Praze Matematická statistika 12/ 43

Testování hypotéz motivační příklad Testování hypotéz motivační příklad Příklad: Provádíme průzkum, jaký skutečný objem piva točí v nejmenované hospodě. Zakoupeno bylo 10 piv a jejich objem byl (v litrech): 0.510, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488, 0.512, 0.505. Z pohledu zákazníka bychom chtěli otestovat, zda hostinský netočí pod míru. Průměr vychází X = 0.4893 < 0.5. Otázkou je, zda je to vlivem náhody, nebo už se jedná o systematickou výchylku? Je rozdíl X = 0.4893 < 0.5 dostatečný na to, abychom mohli tvrdit, že hostinský točí pod míru? vezmeme-li přímo výběr se střední hodnotou 0.5 průměr nebude nikdy přesně 0.5, ale neměl by se lišit velmi je potřeba zohlednit: počet pozorování (více dat větší přesnost odhadů) variabilitu (vysoký rozptyl = větší nejistota) vezmeme v úvahu rozdělení X 0.5 a z něho zjistíme, jaké hodnoty jsou již extrémní a málo pravděpodobné statistické testy Univerzita Karlova v Praze Matematická statistika 13/ 43 Univerzita Karlova v Praze Matematická statistika 14/ 43 Testování hypotéz Testování hypotéz = vyhodnocování pravdivostní hodnoty výroků na základě náhodného výběru (tj. ověřování platnosti nějakého výroku) provádíme pomocí statistických testů Hypotéza = výrok, o jehož pravdivosti chceme rozhodnout nulová hypotéza H 0 tvrzení o populaci, o jehož platnosti rozhodujeme (není rozdíl, nezávisí, neliší se,... ) alternativní hypotéza H 1 : alternativa (doplňující možnost) k H 0 často tvrzení, které chceme prokázat Univerzita Karlova v Praze Matematická statistika 15/ 43 Statistický test Statistický test = rozhodovací pravidlo, na jehož základě zamítáme nebo nezamítáme H 0 testová statistika T n = T n (X 1,..., X n ) = náhodná veličina, která je funkcí pozorování X 1,..., X n kritický obor C = možné výsledky pokusu, kdy H 0 zamítáme Rozhodovací pravidlo: pokud T n C zamítáme hypotézu H 0 ve prospěch alternativy H 1 (naše data svědčí proti H 0 a prokazujeme tak platnost H 1 ) pokud T n / C hypotézu H 0 nezamítáme (na základě našich dat nelze zamítnout H 0, naše data nejsou v rozporu s H 0 ) Pozor: nesymetrie mezi H 0 a H 1 Univerzita Karlova v Praze Matematická statistika 16/ 43

Chyba I. a II. druhu Chyba I. a II. druhu rozhodujeme na základě náhodného výběru nemůžeme testovanou otázku zodpovědět s absolutní jistotou můžeme se dopustit chyby tyto chyby se budeme snažit omezit (resp. kontrolovat jejich pravděpodobnosti) Označíme: H 0 zamítáme H 0 nezamítáme H 0 platí chyba 1. druhu OK H 0 neplatí OK chyba 2. druhu α = P(chyba 1. druhu) = P(zamítáme H 0 H 0 platí) β = P(chyba 2. druhu) = P(nezamítáme H 0 H 0 neplatí) Přirozený požadavek: α, β min bohužel nelze současně Univerzita Karlova v Praze Matematická statistika 17/ 43 zvolíme hladinu testu α (zpravidla α = 0.05) maximální dovolená pst chyby 1. druhu maximální pst falešného prokázání vědecké hypotézy chyba 1.druhu je závažnější (falešně něco prokazujeme) volíme před pokusem, nezávisle na jeho výsledku pro dané α chceme minimální β maximální 1 β síla testu 1 β pst zamítnutí neplatné H 0 pst, s jakou prokážeme platnou vědeckou hypotézu H 1 nemáme pod kontrolou (závisí na tom, co opravdu platí) můžeme ovlivnit volbou statistického testu, počtem pozorování,... α máme plně pod kontrolou, o β toho moc nevíme Univerzita Karlova v Praze Matematická statistika 18/ 43 Dosažená hladina testu Testování hypotéz shrnutí Dosažená hladina testu p-hodnota (angl. p-value) pravděpodobnost, že dostaneme výsledek, který stejně nebo ještě méně podporuje H 0, jestliže H 0 platí nejmenší hladina α, na které lze ještě H 0 zamítnout stupeň důvěry v platnost H 0 výsledek provedení statistického testu pomocí softwaru Pravidlo: je-li p α zamítáme H 0 je-li p > α nezamítáme H 0 (Zapamatovat!) Při testování můžeme Postup: dojít ke správnému rozhodnutí udělat chybu 1. druhu (zamítnout platnou H 0 ) anebo 2. druhu (nezamítnout neplatnou H 0 ) stanovíme dostatečně nízkou pravděpodobnost chyby 1. druhu α (hladinu testu) (chyba 1. druhu je závažnější její pst máme pod kotrolou) pravděpodobnost chyby 2. druhu β závisí na okolnostech (volba testu, počet pozorování, variabilita,... ) a její hodnotu v praxi neznáme Proto: H 0 a H 1 nejsou posuzovány symetricky Univerzita Karlova v Praze Matematická statistika 19/ 43 Univerzita Karlova v Praze Matematická statistika 20/ 43

Nesymetrie H 0 a H 1 H 0 a H 1 nejsou posuzovány symetricky: Závěr H 0 považujeme a priori za platnou a zamítáme ji jen tehdy, pokud k tomu máme dostatečně silné důvody pokud jsme zamítli H 0 můžeme tvrdit, že data svědčí o tom, že H 0 neplatí (a prokazujeme platnost H 1 ) pokud jsme H 0 nezamítli pak buď H 0 opravdu platí anebo H 0 neplatí, ale data neposkytují dostatečné důkazy k jejímu zamítnutí (malá síla testu) nutné volit opatrné formulace závěrů (hypotézu H 0 nelze na základě našich dat zamítnout apod.) Hypotézu H 0 nemůžeme prokázat, ale pouze vyvrátit Filozofie testování hypotéz soudní proces ctící princip presumpce neviny. H 0 : Obžalovaný je nevinen. H 1 : Obžalovaný je vinen. zamítneme-li H 0 odsoudíme obžalovaného k trestu nezamítneme-li H 0 obžalovaný je propuštěn data důkazy svědčící pro nebo proti vině testová statistika soudce kritický obor důkazní břemeno = množství důkazů nutné k odsouzení hladina testu α pst odsouzení nevinného síla testu 1 β pst odsouzení skutečného pachatele Univerzita Karlova v Praze Matematická statistika 21/ 43 Univerzita Karlova v Praze Matematická statistika 22/ 43 Filozofie testování hypotéz Hladinu α zvolíme malou (např. 5 %) chráníme nevinné před odsouzením čím menší α vyšší důkazní břemeno řada viníků propuštěna pro nedostatek důkazů Výsledek procesu: odsouzení obžalovaného lze tvrdit, že je vinen propuštění obžalovaného buď opravdu nevinen, anebo vinen, ale soud neměl dostatečné důkazy k jeho odsouzení K odsouzení viníka může dopomoci (bez porušení presumpce neviny): schopný soudce (vhodná testová statistika), dodatečné množství důkazů (více dat) málo chyb a omylů v důkazním materiálu (malý rozptyl) Univerzita Karlova v Praze Matematická statistika 23/ 43 Statistické testy statistických testů je obrovské množství uvedeme si jen několik vybraných základních podrobné odvození testové statistiky a kritického oboru jen u některých v praxi důležité: výběr vhodného testu pro daný problém provedení testu ověření předpokladů testu (např. normalita dat,... ) správná interpretace výsledku Univerzita Karlova v Praze Matematická statistika 24/ 43

Test o střední hodnotě v normálním rozdělení Situace: X 1,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), kde σ > 0 známe; chceme testovat H 0 : µ = µ 0, kde µ 0 je nějaká známá (předepsaná) hodnota, proti alternativě H 1 : µ > µ 0. Chceme: statistický test testová statistka a kritický obor Jiné možné alternativy: H 1 : µ µ 0 tzv. oboustranná alternativa H 1 : µ < µ 0 tzv. jednostranná alternativa (volba alternativy dle zadání úlohy vyplývá z její formulace) Univerzita Karlova v Praze Matematická statistika 25/ 43 Odvození testu Víme: střední hodnotu µ odhadujeme pomocí X n rozdělení X n je N(µ, σ2 n ), a proto n X n µ σ N(0, 1) Proti H 0 a ve prospěch H 1 svědčí hodnoty X n >> µ 0 zvolíme hladinu testu α budeme hledat mezní hodnotu K tak, že pro X n > K už zamítneme H 0 musí platit P( chyba 1.druhu ) = P(X n > K H 0 platí) = α Univerzita Karlova v Praze Matematická statistika 26/ 43 Odvození testu pokrač. Postupně upravíme: α = P(X n > K H 0 platí) = P(X n > K µ = µ 0 ) = P( n X µ 0 σ }{{} T n N(0,1) > n K µ 0 σ } {{ } =C µ = µ 0 ) = 1 Φ(C) Test o střední hodnotě normálního rozdělení při známém σ 2 Odvodili jsme test: testová statistika T n = n X µ 0 σ kritický obor C = (u 1 α, ) je-li T n > u 1 α zamítáme H 0 Odtud C = u 1 α, K = σ n u 1 α + µ 0 je-li T n u 1 α nezamítáme H 0 Podobným postupem bychom odvodili test H 0 proti (Připomenutí: u 1 α je 1 α kvantil normálního rozdělení, u 1 α = z α, kde z α je kritická hodnota) Univerzita Karlova v Praze Matematická statistika 27/ 43 H 1 : µ < µ 0 kritický obor T n < u 1 α H 1 : µ µ 0 kritický obor T n > u 1 α 2 Zvolíme-li hladinu α = 0.05 dostaneme u 1 α = u 0.95 = 1.64 a u 1 α/2 = u 0.975 = 1.96. Univerzita Karlova v Praze Matematická statistika 28/ 43

Příklad pivo Provedení testu Máme zakoupeno 10 piv, chceme otestovat, zda hostinský netočí pod míru. Předpokládejme, že z předchozí zkušenosti víme, že směrodatná odchylka naměřených objemů piva je 0.02 l. Model: Předpokládáme, že data jsou realizací náhodného výběru z N(µ, σ 2 ), kde σ = 0.02 (známe) Hypotézy: H 0 : µ = 0.5 proti H 1 : µ < 0.5 Hladina testu: zvolíme test na hladině 5 %, tj. α = 0.05 Test: musíme zjistit, zda platí T n = n X 0.05 σ < u 0.95 = 1.645 máme X = 0.4893, odtud testová statistika T n = 10 0.4893 0.5 0.02 = 1.691 test: platí T n < u 0.95 = 1.645 zamítáme nulovou hypotézu a prokazujeme alternativu podařilo se nám tedy prokázat, že hostinský točí pod míru riskovali jsme 5%, že budeme nesprávně tvrdit, že hostinský točí pod míru, pokud to tak není Univerzita Karlova v Praze Matematická statistika 29/ 43 Univerzita Karlova v Praze Matematická statistika 30/ 43 Příklad pokrač. Jiné alternativy Dosažená hladina testu (p-hodnota) pravděpodobnost za platnosti H 0, že dostaneme výsledek ještě extrémněji svědčící proti H 0 a ve prospěch H 1 P( n X n 0.5 σ < 1.691) = Φ(1.691) = 0.045 p-hodnota je rovna 0.045 (je tedy nižší než α = 0.05) podařilo se nám tedy prokázat, že hostinský točí pod míru ale p-hodnota je jen těsně menší než α = 0.05 ne úplně přesvědčivý výsledek kdybychom se zajímali o test H 0 : µ = 0.5 proti H 1 : µ > 0.5, pak bychom se zkoumali, zda platí (neplatí) T n > 1.64 kdybychom se zajímali o test H 0 : µ = 0.5 proti H 1 : µ 0.5, pak bychom se zkoumali, zda platí (neplatí) T n > u 0.975 = 1.96 Univerzita Karlova v Praze Matematická statistika 31/ 43 Univerzita Karlova v Praze Matematická statistika 32/ 43

Jednovýběrový t-test úvod dosud jsme předpokládali, že σ 2 je známé v praxi většinou σ 2 neznáme odhadujeme pomocí S 2 n v testové statistice místo σ použijeme S n : t-rozdělení hustota rozdělení t k má pro velké k tvar velmi podobný normovanému normálnímu rozdělení pro malé k má rozptyl větší než 1 a kritické hodnoty jsou vzdálenější od 0 (cena, kterou platíme za neznalost σ) T n = n X n µ 0 S n rozdělení T n za H 0 není normální N(0, 1), ale nazývá se t-rozdělení s n 1 stupni volnosti, značíme jej t n 1 rozdělení 0.0 0.1 0.2 0.3 0.4 k=2 k=5 k=10 k=20 k=50 N(0,1) Univerzita Karlova v Praze Matematická statistika 33/ 43 4 2 0 2 4 Univerzita Karlova v Praze Matematická statistika 34/ 43 x Kvantily t-rozdělení Jednovýběrový t-test α-kvantil budeme značit t k (α) α k 0.9 0.95 0.975 0.99 0.995 5 1.476 2.015 2.571 3.365 4.032 10 1.372 1.812 2.228 2.764 3.169 20 1.325 1.725 2.086 2.528 2.845 50 1.299 1.676 2.009 2.403 2.678 100 1.290 1.660 1.984 2.364 2.626 N(0, 1) 1.282 1.645 1.960 2.326 2.576 Situace: X 1,..., X n náhodný výběr z rozdělení N(µ, σ 2 ), chceme otestovat hypotézu H 0 : µ = µ 0 proti (oboustranné) alternativě H 1 : µ µ 0. Testová statistika: Kritický obor T n = n X n µ 0 S n T n > t n 1 (1 α 2 ) = zamítáme H 0, kde t n 1 (1 α 2 ) je (1 α 2 )-kvantil rozdělení t n 1 Tento test nazýváme jednovýběrový t-test na hladině α. Univerzita Karlova v Praze Matematická statistika 35/ 43 Univerzita Karlova v Praze Matematická statistika 36/ 43

Další možné alternativy Lze uvažovat také jednostranné alternativy: H 1 : µ > µ 0 kritický obor T n > t n 1 (1 α) H 1 : µ < µ 0 kritický obor T n < t n 1 (1 α) Poznámky t-rozdělení se někdy také nazývá Studentovo t-rozdělení William Sealy Gosset (1876 1937) chemik pracující v pivovaru Guinness 1908 odvození jednovýběrového t-testu (pseudonym Student) Příklad pivo Máme zakoupeno 10 piv, chceme otestovat, zda hostinský netočí pod míru: Model: Předpokládejme, že datům odpovídají nezávislé náhodné veličiny s normálním rozdělením N(µ, σ 2 ), σ 2 neznáme Hypotézy: H 0 : µ = 0.5 proti H 1 : µ < 0.5 Hladina testu: opět budeme uvažovat test na hladině 5% Test: zajímá nás, zda platí T n = n X 0.5 S < t 9 (0.95) = 1.833 (pak budeme zamítat H 0 ) Univerzita Karlova v Praze Matematická statistika 37/ 43 Univerzita Karlova v Praze Matematická statistika 38/ 43 Provedení testu Příklad výpočet v programu R spočteme odtud T n = n X 0.5 S X = 0.4893, S = 0.0197, = 0.4893 0.5 10 = 1.7148 0.0197 máme T n > t 9 (0.95) = 1.833 H 0 nelze na hladině významnosti 5 % zamítnout nelze prokázat, že by hostinský točil pivo pod míru (buď skutečně pod míru netočí nebo tak málo, že tuto odchylku nemůžeme na základě našich dat prokázat) >t.test(pivo,mu=0.5,alternative= less ) One Sample t-test data: pivo t = -1.7148, df = 9, p-value = 0.06026 alternative hypothesis: true mean is less than 0.5 95 percent confidence interval: Inf 0.5007382 sample estimates: mean of x 0.4893 p-hodnota > 0.05 nezamítáme H 0 na hladině 5 % Univerzita Karlova v Praze Matematická statistika 39/ 43 Univerzita Karlova v Praze Matematická statistika 40/ 43

Ověření předpokladu o normálním rozdělení Jak ověříme, že data pocházejí skutečně z normálního rozdělení graficky porovnáme histogram s hustotou normálního rozdělení Q-Q graf (diagram normality) porovnává výběrové kvantily s teoretickými kvantily normálního rozdělení statistickým testem např. Shapirův-Wilkův test H 0 : výběr pochází z normálního rozdělení H 1 : výběr nepochází z normálního rozdělení shapiro.test: p-hodnota zamítáme nebo nezamítáme normalitu lze nebo nelze použít jednovýběrový t-test Univerzita Karlova v Praze Matematická statistika 41/ 43 Porušení normality Situace: X 1,..., X n výběr z (jiného než normálního) rozdělení se střední hodnotou µ a konečným rozptylem, chceme testovat H 0 : µ = µ 0 proti alternativě H 1 : µ µ 0 Jednovýběrový t-test předpoklad normality není splněn skutečná hladina testu není rovna předepsanému α (a můžeme se tedy dopouštět daleko větší chyby) použijeme-li hladinu testu se blíží k α pro n (zdůvodnění: centrální limitní věta) při velkém počtu pozorování n je hladina testu α Závěr: Jednovýběrový t-test je možné použít k testování střední hodnoty nenormálních dat, pokud je pozorování dostatečně mnoho (řekněme alespoň 50). Univerzita Karlova v Praze Matematická statistika 42/ 43 Porušení normality Co dělat v případě, že normální rozdělení nelze pro naše data uvažovat? použijeme t-test výsledek interpretujeme asymptoticky (ve smyslu, že test je proveden na hladině, která je asymptoticky rovna α) nutné mít dostatečný počet pozorování použijeme jiný (např. neparametrický) test Univerzita Karlova v Praze Matematická statistika 43/ 43