Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Podobné dokumenty
Statistika, Biostatistika pro kombinované studium. Jan Kracík

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testy. Pavel Provinský. 19. listopadu 2013

Ing. Michael Rost, Ph.D.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

4ST201 STATISTIKA CVIČENÍ Č. 7

Pravděpodobnost a aplikovaná statistika

5 Parametrické testy hypotéz

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Testování statistických hypotéz. Obecný postup

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

= = 2368

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

12. cvičení z PST. 20. prosince 2017

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

STATISTICKÉ ZJIŠŤOVÁNÍ

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Normální (Gaussovo) rozdělení

Testy statistických hypotéz

Charakteristika datového souboru

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Aproximace binomického rozdělení normálním

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

Normální (Gaussovo) rozdělení

12. prosince n pro n = n = 30 = S X

Pravděpodobnost a matematická statistika

Náhodné veličiny, náhodné chyby

5. T e s t o v á n í h y p o t é z

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

You created this PDF from an application that is not licensed to print to novapdf printer (

STATISTICKÉ HYPOTÉZY

7.1. Podstata testu statistické hypotézy

Cvičení ze statistiky - 9. Filip Děchtěrenko

Intervalové Odhady Parametrů

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Výběrové charakteristiky a jejich rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8. Normální rozdělení

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Příklady na testy hypotéz o parametrech normálního rozdělení

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

4EK211 Základy ekonometrie

7. Analýza rozptylu.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Zápočtová práce STATISTIKA I

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz. 4. přednáška

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Intervalové Odhady Parametrů II Testování Hypotéz

Tomáš Karel LS 2012/2013

Stručný úvod do testování statistických hypotéz

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

3 Bodové odhady a jejich vlastnosti

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Odhad parametrů N(µ, σ 2 )

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

KGG/STG Statistika pro geografy

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

6. T e s t o v á n í h y p o t é z

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Přednáška VII. Úvod do testování hypotéz

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Regresní analýza 1. Regresní analýza

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Jednofaktorová analýza rozptylu

Statistické metody uţívané při ověřování platnosti hypotéz

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Transkript:

Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz

Obsah: Výběrová rozdělení Bodové a intervalové odhady Testování hypotéz

Výběrová rozdělení

Výběrové charakteristiky (opakování): číslné charakteristiky výběrového souboru výběrový průměr, výběrový rozptyl, relativní četnost,... náhodné veličiny (funkce pozorování)

Výběrové charakteristiky (opakování): číslné charakteristiky výběrového souboru výběrový průměr, výběrový rozptyl, relativní četnost,... náhodné veličiny (funkce pozorování) E[ X] = E[ 1 n n i=1 X i] = 1 n n E[X] = µ X D[ X] = D[ 1 n n i=1 X i] = 1 n D[X] = 1 n 2 n σ2 X centrální limitní věta: X ( ) N µ x, σ2 x n další aplikace CLV: rozdělení součtu náhodných veličin, rozdílu průměrů, rozdílu relativních četností,...

Výběrová rozdělení: rozdělení pravděpodobnosti důležitých výběrových charakteristik vyžití pro odhady parametrů, testování hypotéz,... 3 důležitá rozdělení: χ 2 -rozdělení Studentovo rozdělení Fisher-Snedecorovo rozdělení

χ 2 -rozdělení ( chí kvadrát ) Mějme Z 1, Z 2,..., Z n nezávislé náhodné veličiny s rozdělením N(0, 1). Označme X = n i=1 Z i 2. Potom X má rozdělení χ 2 s n stupni volnosti. Zapisujeme X χ 2 n. Důležitá vlastnost: Pro nezávislé X 1, X 2,..., X n N(µ, σ 2 ) platí kde S 2 je výběrový rozptyl, (n 1)S 2 S 2 = 1 n 1 σ 2 χ 2 n 1, n (X i X) 2. i=1

Studentovo (t) rozdělení Necht Z a X jsou nezávislé náhodné veličiny. Z N(0, 1) X χ 2 n Označme T = Z. X n Potom T má Studentovo t rozdělení s n stupni volnosti. Zapisujeme T t n. Důležitá vlastnost: Pro nezávislé X 1, X 2,..., X n N(µ, σ 2 ) platí X µ n tn 1. S

Fisher-Snedecorovo (F ) rozdělení Necht V a W jsou nezávislé náhodné veličiny. V χ 2 m W χ 2 n Označme F = V m W n. Potom F má Fisher-Snedecorovo rozdělení o m a n stupních volnosti. Zapisujeme F F m,n. Důležtá vlastnost: Pro nezávislé X 1, X 2,..., X m N(µ X, σ 2 X ) a Y 1, Y 2,..., Y n N(µ Y, σ 2 Y ) platí S 2 X m S 2 Y n F m 1,n 1.

Cílem odhadu je určení neznámého parametru rozdělení populace (náhodné veličiny X) na základě informace obsažené ve výběrovém souboru (realizacích náhodné veličiny, datech). Příklad: Hod nesymetrickou mincí lze modelovat jako Bernoulliovský pokus s alternativním (Bernoulliho) rozdělením. Parametrem rozdělení může být pravděpodobnost padnutí orla. Co můžeme říci o neznámém parametru, pokud při 10 hodech padne 3 krát orel?

Cílem odhadu je určení neznámého parametru rozdělení populace (náhodné veličiny X) na základě informace obsažené ve výběrovém souboru (realizacích náhodné veličiny, datech). Příklad: Hod nesymetrickou mincí lze modelovat jako Bernoulliovský pokus s alternativním (Bernoulliho) rozdělením. Parametrem rozdělení může být pravděpodobnost padnutí orla. Co můžeme říci o neznámém parametru, pokud při 10 hodech padne 3 krát orel? při 2 hodech orel nepadne ani jednou?

Cílem odhadu je určení neznámého parametru rozdělení populace (náhodné veličiny X) na základě informace obsažené ve výběrovém souboru (realizacích náhodné veličiny, datech). Příklad: Hod nesymetrickou mincí lze modelovat jako Bernoulliovský pokus s alternativním (Bernoulliho) rozdělením. Parametrem rozdělení může být pravděpodobnost padnutí orla. Co můžeme říci o neznámém parametru, pokud při 10 hodech padne 3 krát orel? při 2 hodech orel nepadne ani jednou? při 100 hodech padne 30 krát orel? při 10000000 hodech padne 3000000 orel? při 2 hodech nepadne ani jednou orel, přitom mince je běžná 1 Kč, jen lehce poškrábaná

Při odhadování se zajímáme o hodnotu odhadu (přibližnou hodnotu neznámého parametru), přesnost odhadu - odhad na základě konečného počtu dat bude vždy pouze přibližný.

Při odhadování se zajímáme o hodnotu odhadu (přibližnou hodnotu neznámého parametru), přesnost odhadu - odhad na základě konečného počtu dat bude vždy pouze přibližný. Rozlišujeme dva základní typy odhadu: Bodový odhad - neznámý parametr charakterizujeme jedinou hodnotou, pokud možno blízko skutečné hodnotě. Hodnota bodového odhadu nevypovídá nic o přesnosti odhadu. Intervalový odhad - neznámý parametr charakterizujeme intervalem, který s velkou pravděpodobností obsahuje skutečnou hodnotu. Délka intervalu vypovídá o přesnosti odhadu.

Bodový odhad

Bodový odhad Mějme X 1, X 2,..., X n náhodný výběr z neznámého rozdělení závislého na parametru Θ. Bodovým odhadem parametru Θ je obecně libovolná výběrová charakteristika (funkce náhodného výběru) T (X 1, X 1,..., X n ). Příklady T (X 1, X 2,..., X n ) = 1 n n i=1 X i

Bodový odhad Mějme X 1, X 2,..., X n náhodný výběr z neznámého rozdělení závislého na parametru Θ. Bodovým odhadem parametru Θ je obecně libovolná výběrová charakteristika (funkce náhodného výběru) T (X 1, X 1,..., X n ). Příklady T (X 1, X 2,..., X n ) = 1 n n i=1 X i (bodový odhad střední hodnoty) T (X 1, X 2,..., X n ) = 1 n n 1 i=1 (X i X) 2

Bodový odhad Mějme X 1, X 2,..., X n náhodný výběr z neznámého rozdělení závislého na parametru Θ. Bodovým odhadem parametru Θ je obecně libovolná výběrová charakteristika (funkce náhodného výběru) T (X 1, X 1,..., X n ). Příklady T (X 1, X 2,..., X n ) = 1 n n i=1 X i (bodový odhad střední hodnoty) T (X 1, X 2,..., X n ) = 1 n n 1 i=1 (X i X) 2 (bodový odhad rozptylu) T (X 1, X 2,..., X n ) = arctg(x 1 X 2... X n )

Bodový odhad Mějme X 1, X 2,..., X n náhodný výběr z neznámého rozdělení závislého na parametru Θ. Bodovým odhadem parametru Θ je obecně libovolná výběrová charakteristika (funkce náhodného výběru) T (X 1, X 1,..., X n ). Příklady T (X 1, X 2,..., X n ) = 1 n n i=1 X i (bodový odhad střední hodnoty) T (X 1, X 2,..., X n ) = 1 n n 1 i=1 (X i X) 2 (bodový odhad rozptylu) T (X 1, X 2,..., X n ) = arctg(x 1 X 2... X n ) (podle definice rovněž bodový odhad - mimo jiné čehokoliv)

Vlastnosti, které zaručují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T ( ) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ

Vlastnosti, které zaručují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T ( ) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ vydatnost, eficience - nejlepší nestranný (vydatný, eficientní)

Vlastnosti, které zaručují, že danný bodový odhad je v jistém smyslu dobrý: nestrannost (nevychýlenost) - odhad T ( ) parametru Θ je nestranný, jestliže E[T ] = Θ pro každé Θ vydatnost, eficience - nejlepší nestranný (vydatný, eficientní) konzistence - odhad T n (X 1,..., X n ) je konzistentní, pokud E[T n ] Θ a D[T n ] 0, tj.odhad se s rostoucím počtem dat zpřesňuje

Příklad: X 1, X 2,..., X n nezávislý náhodný výběr z rozdělení se stř. hodnotou µ a rozptylem σ 2. Snadno lze ukázat, že E[ 1 n n i=1 X i] = µ, E[ 1 n 1 n i=1 (X i X) 2 ] = σ 2. Odtud plyne, že výběrový průměr je nestranným odhadem střední hodnoty a výběrový rozptyl je nestranným odhadem rozptylu.

Intervalový odhad

Interval spolehlivosti (konfidenční interval) pro parametr θ se spolehlivostí 1 α, kde α 0, 1, je dvojice statistik (T D ( ), T H ( )) taková, že P(T D θ T H ) = 1 α. Poznámka: Meze intervalu spolehlivosti T D ( ), T H ( ) jsou náhodné veličiny

Interval spolehlivosti (konfidenční interval) pro parametr θ se spolehlivostí 1 α, kde α 0, 1, je dvojice statistik (T D ( ), T H ( )) taková, že P(T D θ T H ) = 1 α. Poznámka: Meze intervalu spolehlivosti T D ( ), T H ( ) jsou náhodné veličiny Intervalový odhad t D, t H je konkrétní realizace intervalu spolehlivosti.

Interval spolehlivosti (konfidenční interval) pro parametr θ se spolehlivostí 1 α, kde α 0, 1, je dvojice statistik (T D ( ), T H ( )) taková, že P(T D θ T H ) = 1 α. Poznámka: Meze intervalu spolehlivosti T D ( ), T H ( ) jsou náhodné veličiny Intervalový odhad t D, t H je konkrétní realizace intervalu spolehlivosti. Koeficient α nazýváme hladina významnosti.

Délka intervalového odhadu charakterizuje přesnost, kratší interval (při stejném α) představuje přesnější lokalizaci skutečné hodnoty parametru klesá s rostoucím počtem dat (odhad se zpřesňuje) roste s (1 α), vyšší spolehlivost vyžaduje širší interval

Délka intervalového odhadu charakterizuje přesnost, kratší interval (při stejném α) představuje přesnější lokalizaci skutečné hodnoty parametru klesá s rostoucím počtem dat (odhad se zpřesňuje) roste s (1 α), vyšší spolehlivost vyžaduje širší interval V praxi volíme α = 0.05 nebo α = 0.01 (při požadavku na vyšší spolehlivost).

Typy intervalových odhadů oboustranný P(θ < T D ) = P(θ T H ) = α 2 jednostranný - je-li pro nás důležitá pouze jedna mez levostranný P(T D θ) = 1 α pravostranný P(θ T H) = 1 α

Postup při tvorbě intervalového odhadu 1 Zvolíme vhodnou výběrovou charakteristiku T (X), jejíž rozdělení (závislé na θ) známe. 2 Určíme α 2 a (1 α 2 )-kvantily x α a x 1 α veličiny T. 2 2 3 Z podmínky x α T (X) x 1 α stanovíme meze pro θ. 2 2 4 Obdobně pro jednostranné odhady.

Příklad: Intervalový odhad střední hodnoty normálního rozdělění s neznámým rozptylem se spolehlivostí 0.95. Máme vzorek velikosti n s výběrovým průměrem X a výběrovým rozptylem S 2. Statistika T (X) = X µ S n. Z vlastností Studentova rozdělení: T (X) t n 1. P ( t α X µ 2 S n t1 α 2 ) = 0.95 Úpravou nerovností dostaneme (využijeme t α = t 1 α ) 2 2 ( P X S t 1 α µ X + S ) t n 2 1 α = 0.95. n 2

Výpočet intervalového odhadu Pro výpočet lze využít tabulky se vzorci (u zk. legální tahák), nejlépe však vhodný software (Statgraphics, R commander, applety ML,...). Nutný předpoklad pro získání smysluplného výsledku je správná volba typu odhadu a ověření předpokladů. Další odhady viz skripta a tabulky.

Testování hypotéz

Cílem testování hypotéz je ověřit, zda data nepopírají předpoklad (hypotézu), který jsme učinili o rozdělení populace před provedením testu. Terminologie: Statistická hypotéza - tvrzení o rozdělení náhodné veličiny Nulová hypotéza H 0 - výchozí (defaultní) stanovisko, které jsme ochotni akceptovat, pokud data nebudou mluvit výrazně proti; např: neexistuje závislost, systematická výchylka je 0,... Alternativní hypotéza H 1 (H A ) - popírá nulovou hypotézu Na základě výsledku testu pak bud zamítáme H 0, nebo nezamítáme H 0. H 0 nelze na základě testu potvrdit. Lze pouze říci, že data nesvědčí proti ní.

Typy testů Parametrické - tvrzení o parametru (parametrech) jedné, dvou, nebo více populací Neparametrické - tvrzení o jiné vlastnosti rozdělení populace - typ rozdělení, závislost mezi sledovanými znaky,...

Postup při testování hypotéz (klasický přístup) 1 Formulujeme nulovou H 0 a alternativní hypotézu H 1. 2 Zvolíme testovou statistiku. Rozdělení testové statistiky za předpokladu platnosti nulové hypotézy nazýváme nulové rozdělění. 3 Ověříme předpoklady testu! 4 Určíme kritický obor W, tj. množinu v níž se za předpokladu platnosti H 0 hodnoty testové statistiky vyskytují s velmi malou pravděpodobností. Doplňkem W je tzv. obor přijetí V. Hranici mezi W a V označujeme jako kritickou hodnotu t krit. 5 Na základě realizace výběru určíme pozorovanou hodnotu testové statistiky x OBS. 6 Na základě vztahu x OBS a t krit (tj. podle toho zda x OBS W nebo x OBS V ) rozhodujeme o výsledku testu (zamítnutí nebo nezamítnutí H 0 ).

V závislosti na platnosti H 0 a výsledku testu mohou nastat 4 situace: Nezamítáme H 0 Zamítáme H 0 Platí H 0 Správné rozhodnutí Chyba I. druhu: Pravděpodobnost: 1 α Pravděpodobnost: α Platí H 1 Chyba II. druhu Správné rozhodnutí Pravděpodobnost: β Pravděpodobnost: 1 β Chybám I. a II. druhu se z podstaty problému nelze vyhnout, protože rozhodujeme na základě náhodného výběru. α: hladina významnosti testu, v praxi volíme 0.05 nebo 0.01 1 β: síla testu; nevolíme je určena hladinou významnosti a konstrukcí testu

Ideálně bychom chtěli testy s nízkou hladinou významnosti a vysokou sílou - protichůdné požadavky. Snížit α i β lze pouze zvýšením počtu dat.

Čistý test významnosti (pomocí p-hodnoty) 1 Formulace nulové a alternativní hypotézy. 2 Volba testové statistiky T (X). 3 Ověření předpokladů testu. 4 Výpočet pozorované hodnoty testové statistiky x OBS. 5 Výpočet p-hodnoty, tj. pravděpodobnosti alespoň tak extrémního výsledku jako x OBS za předpokladu nulové hypotézy.

tvar H 1 p-hodnota θ θ 0 p-hodnota = F 0 (x OBS ) θ θ 0 p-hodnota = 1 F 0 (x OBS ) θ θ 0 p-hodnota = 2min(F(x OBS ), 1 F 0 (x OBS )) Rozhodnutí o výsledku testu: p-hodnota Rozhodnutí p-hodnota < α Zamítáme H 0 ve prospěch H 1 p-hodnota > α Nezamítáme H 0 Výhodou čistého testu významnosti je, že rovnou vidíme, na jaké hladině významnosti lze ještě rozhodnout o zamítnutí H 0. Tento typ testu se v praxi používá častěji. Bývá výstupem statistického software.

Příklad: Spotřeba automobilu byla testována 11 řidiči s výsledky: 8,8; 8,9; 9,0; 8,7; 9,3; 9,0; 8,7; 8,8; 9,4; 8,6; 8,9 (l/100 km). Lze výrobcem udávanou spotřebu 8,8 l/100 km považovat za pravdivou? Náhodná veličina X... spotřeba l/100 km Předpokládáme: X N (µ, σ 2 ) Z dat vypočteme: X = 8.92, S 2 = 0.06. H 0 : µ = 8.8 H 1 : µ > 8.8 T (X) = X µ S n, T t10 T OBS = 1.62 p-value: 2(1 F(T OBS )) = 0.068 p-value > 0.05 na hladině významnosti 0.05 nezamítáme H 0. Nelze tvrdit, že spotřeba není rovna 8.8l.