Testování statistických hypotéz

Podobné dokumenty
Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Testování statistických hypotéz

a další charakteristikou je četnost výběrového souboru n.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

TECHNICKÁ UNIVERZITA V LIBERCI

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Národní informační středisko pro podporu kvality

11. INDUKTIVNÍ STATISTIKA

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Intervalové odhady parametrů některých rozdělení.

12. Neparametrické hypotézy

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Odhady parametrů 1. Odhady parametrů

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Mendelova univerzita v Brně Statistika projekt

Metody zkoumání závislosti numerických proměnných

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Náhodný výběr 1. Náhodný výběr

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

11 TESTOVÁNÍ HYPOTÉZ Základní pojmy

PRAVDĚPODOBNOST ... m n

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Úvod do teorie měření

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

PRAVDĚPODOBNOST A STATISTIKA

Úvod do korelační a regresní analýzy

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

, jsou naměřené a vypočtené hodnoty závisle

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Testování hypotéz. 3.1 Základní pojmy a obecný postup při testování

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

8. Analýza rozptylu.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

14. B o d o v é o d h a d y p a r a m e t r ů

Přednáška č. 11 Analýza rozptylu při dvojném třídění

PRAVDĚPODOBNOST A STATISTIKA

NEPARAMETRICKÉ METODY

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Téma 6: Indexy a diference

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

PRAVDĚPODOBNOST A STATISTIKA

V. Normální rozdělení

Chyby přímých měření. Úvod

Směrnice 1/2011 Statistické vyhodnocování dat, verze 3 Verze 3 je shodná s původní Směrnicí 1/2011 verze 2, za čl. 2.3 je vložen nový odstavec

Pravděpodobnost a aplikovaná statistika

12. N á h o d n ý v ý b ě r

Pravděpodobnost a aplikovaná statistika

Tento materiál vznikl díky Operačnímu programu Praha Adaptabilita CZ.2.17/3.1.00/33254

Markovovy řetězce s diskrétním časem (Discrete Time Markov Chain)

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

Testy statistických hypotéz

Intervalové odhady parametrů

Definice obecné mocniny

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Teorie chyb a vyrovnávací počet. Obsah:

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

9. Měření závislostí ve statistice Pevná a volná závislost

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

Domácí práce z p edm tu D01M6F Statistika

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

Jednoduchá lineární regrese

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

4.2 Elementární statistické zpracování Rozdělení četností

Pravděpodobnost a aplikovaná statistika

Náhodné jevy, jevové pole, pravděpodobnost

4. B o d o v é o d h a d y p a r a m e t r ů

8. Odhady parametrů rozdělení pravděpodobnosti

Deskriptivní statistika 1

Genetická diverzita. doc. Ing. Jindřich. ich Čítek, CSc. Genetickou diverzitu chápeme jako různost mezi živými organismy, která je geneticky fixovaná.

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Generování dvojrozměrných rozdělení pomocí copulí

Vícekanálové čekací systémy

Odhady a testy hypotéz o regresních přímkách

PRAVDĚPODOBNOST A STATISTIKA

Problémy hodnocení výkonnosti a způsobilosti řízení procesů v rámci nesplnění normality rozdělení dominantního znaku jakosti

můžeme toto číslo považovat za pravděpodobnost jevu A.

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Univerzita Karlova v Praze Pedagogická fakulta

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Náhodná veličina-označení Parametry Obor platnosti Normální N(µ,σ) Střední hodnota µ Střední směr. odchylka σ. Střední hodnota µ

c) Pomocí Liouvillovy věty dokažte, že Liouvillovo číslo je transcendentí. xp 1 (p 1)! (x 1)p (x 2) p... (x d) p e x t f(t) d t = F (0)e x F (x),

Doc. Ing. Dagmar Blatná, CSc.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

STATISTICKÁ ANALÝZA. Doc. RNDr. Zden k Karpíšek, CSc. P ehledový u ební text pro doktorské studium. Vysoké u ení technické v Brn

APLIKOVANÁ STATISTIKA

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

VY_52_INOVACE_J 05 01

Transkript:

Testováí statstckých hyotéz Př statstckých šetřeích se často setkáváme s roblémy tohoto druhu () Máme zjstt, zda dva daé vzorky ocházejí z téhož ZS. () Máme rozhodout, zda rozdíly hodot růměrů (res. roztylů) dvou vzorků áhodě vybraých z téhož ZS jsou áhodě vysvětltelé ebo je říča systematckého charakteru. () Máme rozhodout, zda tvar emrckého rozděleí četostí získaého a základě vzorku s velkým rozsahem a řomíajícího jsté rozděleí je možo ovažovat za řblžě rový teoretckému rozděleí a s jakou solehlvostí. Tyto roblémy se řeší metodou testů statstckých hyotéz.

Statstcká hyotéza Statstckou hyotézou rozumíme každý ředoklad o ezámé vlastost rozložeí základího souboru. Statstcké testy Prověřovaá statstcká hyotéza se obvykle azývá ulová. Prot ulové hyotéze stavíme alteratví hyotézu. Krtera, která slouží k rověřováí ulové hyotézy, se azývají statstcké testy, oř. testy výzamost. Testovací krterum Testovací krterum je statstka (fukce áhodého výběru mající vztah k ulové hyotéze), jejíž rozděleí za ředokladu latost ulové hyotézy záme. Pozámka Z tohoto rozděleí dokážeme určt krtcké hodoty testovacího krtera (a hladě výzamost ), které určují obor raktcky možých hodot, v chž je - st realzace testovacího krtera velká (rova -), od krtckých oborů, v chž je realzace testovacího krtera málo ravděodobá (rova ). Př realzac testovacího krtera v krtckých oborech ulovou hyotézu zamítáme, jak j řjímáme (a zvoleé hladě výzamost ).

Výsledek testu Porováí hodoty testovacího krtéra s jeho krtckým hodotam slouží k rozhodutí o výsledku testu. Musíme s uvědomt, že emůžeme mluvt o dokazováí srávost č esrávost zvoleé hyotézy - to eí v možostech statstcké dukce. Závěr testu ouze rozhode mez dvěma možostm hyotézu řjímáme (zamítáme alteratví hyotézu), leží-l ozorovaá hodota testovacího krtéra v tervalu raktcky možých hodot. Zameá to, že rozdíl mez ozorovaou a teoretckou hodotou testovacího krtéra je vysvětltelý a daé hladě výzamost áhodostí výběru. hyotézu zamítáme (řjímáme alteratví hyotézu), leží-l ozorovaá hodota testovacího krtéra v krtckém oboru. Rozdíly ovažujeme za statstcky výzamé a zvoleé hladě výzamost, tz., že se edají vysvětlt ouze áhodostí výběru.

Staoveí hyotéz Př testováí statstckých hyotéz rot sobě stavíme testovaou tzv. ulovou hyotézu a alteratví hyotézu, která ulovou hyotézu oírá. Staoveí hyotéz a ostu testováí vysvětlíme a testu arametru Θ. Testovaou hyotézu zasujeme ve tvaru rovost Θ =Θ, kde Θ R je očekávaá (testovaá) hodota testovaého arametru Θ. Alteratví hyotézu formulujeme zravdla ve tvaru jedoduchá Θ Θ, ravostraá Θ >Θ, levostraá Θ <Θ. Alteratví hyotéza je zvolea v kotextu s ožadavky řešeého roblému a určuje krtéra ro zamítutí č ezamítutí testovaé hyotézy.

Závěr testu Rozhodováí o latost ulové hyotézy se rovádí a základě osouzeí statstky t, zvaé testovací krtérum a její říslušost do možy říustých hodot V α ebo do tzv. krtckého oboru (tj. oboru hodot eříustých) W = R V. Krtcký obor vymezuje terval hodot testovacího krtéra, které jsou vzhledem k testovaým hyotézám málo ravděodobé a vedou tedy k zamítutí ve rosěch. Krtcký obor je defová ro jedoduchou Wα = { t t < td t > t }, kde Pt ( < td) = Pt ( > t) = α /, ravostraou W = { t t > α t }, kde Pt ( > t ) = α, levostraou W = { t t < α t D }, kde Pt ( < t ) D = α. α α Pokud je t W α, je mez testovaou hodotou Θ arametru Θ a jejím odhadem řílš velký rozdíl. Pravděodobost latost ulové hyotézy je velm ízká, roto je ulová hyotéza zamítuta a řjata alteratví hyotéza. Pokud t V α, ak ulovou hyotézu eí možo zamítout, tj. řouštíme latost.

Běžě se uvádí () Pokud eí ulová hyotéza zamítuta a hladě výzamost =.5, ovažuje se rozdíl mez teoretckou hodotou a zvoleým arametrem za evýzamý (áhodě vysvětltelý). () Pokud je ulová hyotéza zamítuta a hladě výzamost =., ovažuje se rozdíl mez teoretckou hodotou a zvoleým arametrem za statstcky výzamý (sgfkatí). () Pokud je ulová hyotéza zamítuta a hladě výzamost =.5, ale eí zamítuta a hladě výzamost =., uvádí se, že rozdíl mez teoretckou hodotou a zvoleým arametrem je slabě statstcky výzamý (ěkdy se uvádí, že test eoskytl ro daý rozsah výběru dostatečé formace k rozhodutí). Postu ř testováí a) rovedeí áhodého výběru, b) formulace ulové a alteratví hyotézy, c) volba hlady výzamost, d) volba testovacího krtera, e) určeí krtckých hodot testovacího krtera, f) výočet realzace testovacího krtera, g) srováí s krtckým ochotam, h) závěr testu.

Test jako rozhodováí Př testováí hyotéz mohou astat čtyř možost, které osuje ásledující tabulka Závěr testu latí elatí Skutečost latí srávý chyba I.druhu elatí chyba II.druhu srávý Exstují tedy dva druhy chyby () chyba I. druhu, zamítutí srávé hyotézy, () chyba II. druhu, řjetí esrávé hyotézy.

Příklad Testováí řblížíme omocí aaloge se soudím rocesem. Má adout rozhodutí, zda obžalovaý sáchal č esáchal zloč. Řešeí Soudí systém se řídí zásadou, že obžalovaý je eve, dokud se eodaří rokázat oak. Formulace hyotéz má tedy tuto odobu Obžalovaý je eve. Obžalovaý je ve. Růzé možost vztahu mez ravdou a rozhodutím soudu vdíme v tabulce Skutečost Závěr soudu Obžalovaý je eve Obžalovaý je ve Obžalovaý je eve srávý chyba I. druhu Obžalovaý je ve chyba II. druhu srávý Chyba I. druhu má ro jedce fatálí ásledky. Proto její možost elmujeme a ejmeší možou míru. Soud musí jasě rokázat vu obžalovaého. Jeho rozhodutí také odléhají řezkoumáí vyšších stací. Odovídá to volbě velm malé hlady výzamost. V moha jých říadech však evíme zcela řesě, která chyba je ro ás důležtější.

Test výzamost rozdílu dvou roztylů (F-test) Předoklady Jsou dáy dva výběry o rozsazích, s roztyly S, S vybraé ze dvou základích souborů s rozděleím N ( μ, σ ) a N ( μ, σ ). Nulová hyotéza σ = σ Alteratví hyotéza σ σ Testovací krtérum TK (. ) S =. S ( ) Krtcká hodota K ( ) = F (, ) Idexy volíme tak, aby latlo TK >. V rax stačí volt dexy tak, aby v čtatel byla větší dserze. Závěr Je-l TK > K ( ), ak Pro σ = σ σ > σ je krtcká hodota K ( ) = F (, )

Podroběj Předoklady Jsou dáy dva výběry o rozsazích, s em. roztyly S základích souborů s rozděleím N ( μ, σ ) a N ( μ, σ ). Nulová hyotéza σ = σ Alteratví hyotéza σ σ Testovací krtérum (. ) S TK =. S ( ), d h F (, ) S vybraé ze dvou Krtcké hodoty K ( ) = F (, ) =, K ( ) = F (, ) Je-l TK >, ak stačí horí kvatl. V rax stačí volt dexy tak, aby v čtatel byla větší dserze. Závěr Je-l TK > K h ( ), ak Pro σ = σ

Jedostraé hyotézy ( ) ( ). S TK = S. Pro σ = σ σ > σ Krtcká hodota K ( ) = F (, ) Závěr Je-l TK > K ( ) ak Pro σ = σ σ < σ Krtcká hodota K ( ) = F (, ) = Závěr Je-l TK < K ( ) ak F (, )

Test výzamost rozdílu M μ Předoklady Je dá výběr ze základího souboru s rozděleím hodotou M a em. dserzí S. N ( μ, σ ) o rozsahu se středí μ = μ μ μ M μ TK = S K ( ) = t ( ) Je-l TK > K ( ), ak Pro μ = μ μ > μ μ = μ μ < μ K ( ) = t ( ) K ( ) = t ( ) Je-l TK > K ( ), ak Je-l TK < K ( ), ak

Test výzamost rozdílu dvou výběrových růměrů (t-test) Předoklady Jsou dáy dva výběry o rozsazích,, se středím hodotam M, M a s roztyly S, S vybraé ze dvou základích souborů s rozděleím N ( μ, σ ) a N ( μ, σ ). μ = μ μ μ

a) můžeme ředokládat σ TK = M + S S K ( ) = t ( + ) M = σ (rověříme F-testem) ( + ) + Je-l TK > K ( ), ak b) můžeme ředokládat σ σ (rověříme F-testem) M M TK = K ( ) ( )( ) ( ) S + ( ) S ( ) S t( ) + ( ) S t( ) = ( ) S + ( ) S Je-l TK > K ( ), ak

Studetův test ro árovaé hodoty Předoklady Jsou dáy dva výběry o stejém rozsahu, vybraé ze dvou základích souborů s ormálím rozděleím, řčemž každému rvku x rvího výběru (hodotě zaku X ) odovídá rávě jede rvek x druhého výběru (hodota zaku X ). Výběrem jsou tedy áry ( x, x) ( =,,..., ). Netestujeme rozdíl středích hodot, ale rozdíly mez rvky, které tvoří ár v rvím a druhém výběru. Testovaou velčou D jsou rozdíly hodot zaků (e absolutích hodot) rvků, které tvoří ár ( d = x x). Ozačme d středí hodotu zaku D a S d dserz zaku D. μ = μ μ μ TK d = S d K ( ) = t ( ) Je-l TK > K ( ), ak

Testy dobré shody (testy řléhavost) Pearsoův test dobré shody ro jede výběr (χ test) Předoklady Nechť výsledky ozorováí jsou roztříděy do k tříd a v každé třídě je zjštěa třídí četost e (četost emrcká, exermetálí). Uvažujme určté rozděleí, které budeme ovažovat za model ro áš výběr. Pro každou třídu určíme očekávaou četost o (četost teoretcká). základí soubor má očekávaé rozděleí základí soubor emá očekávaé rozděleí Shodu rozděleí výběru s rozděleím ZS testujeme srováím třídích četostí. Dá se očekávat, že četost ve třídách by měly být úměré ravděodobostem. Ozačme TK = k = k očet tříd, e... emrcké četost v -té třídě, o. očekávaé četost v -té třídě, s. očet arametrů očekávaého rozděleí odhadutých a základě výběru. ( e o ) o K χ k s ( ) = ( ) Je-l TK > K ( ), ak

Př oužtí testu se ožaduje slěí odmíek () Všechy očekávaé třídí četost mají být větší ež. () Nejvýše % očekávaých četostí má být meších ež 5. Pokud tomu tak eí, rovede se sloučeí tříd v ezbytém rozsahu.

Kolmogorovův-Smrovův test dobré shody ro jede výběr Předoklady jsou stejé jako u ředcházejícího testu. základí soubor má očekávaé rozděleí základí soubor emá očekávaé rozděleí Shodu rozděleí výběru s rozděleím ZS testujeme srováím kumulatvích četostí. Ozačme k. očet tříd, Ne... kumulatví četost výběru a horí hrac -té třídy, No. kumulatví četost očekávaou,. rozsah souboru. TK = max Ne No Krtcké hodoty K ( )( = D; ) jsou tabelováy ro < 6 (tabulka č VIII). Pro > 6 se užívají asymtotcké vzorce a K ( ) =, kde a závsí ouze a hladě výzamost. Pro oužívaé hlady latí a,5 =, 36 a a, =, 63. Je-l TK > K ( ), ak

Kolmogorovův-Smrovův test dobré shody ro dva výběry Předoklady Jsou dáy dva výběry s rozsahy a roztříděé do k tříd. Ozačme N F a N.. kumulatví četost výběrů a horí hrac -té třídy. a F. říslušé třídí relatví kumulatví četost. oba výběry ocházejí z téhož ZS výběry eocházejí z téhož ZS

a) ro výběry o malém rozsahu, = 4 TK = N N max Krtcké hodoty K ( )( = D; ) jsou uvedey v tabulkách (tabulka IX). b) ro > 4, > 4, (rozsahy mohou být růzé) TK = F F max Krtcká hodota se určí omocí asymtotckého vzorce K ( ) + = a,. kde a závsí ouze a hladě výzamost. Pro oužívaé hlady latí a,5 =, 36 a a, =, 63. Je-l TK > K ( ), ak

Dxoův test extrémích odchylek Ozačme x = m( x ) mmálí hodota souboru x = max( x )... maxmálí hodota souboru hodota x res. x se výzamě elší od ostatích hodot souboru hodota x res. x se výzamě lší od ostatích hodot souboru TK x x TK = res. = x x x x x x Krtcké hodoty K ( )( = Q; ) res. K ( ) ( = Q; ) jsou tabelováy (tabulka č. XI). Je-l TK > ( ) K res. TK > K ( ), ak se zamítá

Grubbsův test extrémích odchylek hodota x res. x se výzamě elší od ostatích hodot souboru hodota x res. x se výzamě lší od ostatích hodot souboru TK x x S = res. TK = x S x Krtcké hodoty K ( )( = T; ) res. K ( ) ( = T; ) jsou tabelováy (tabulka č. X). Je-l TK > ( ) K res. TK ( ) > K, ak Pozámka Dojdeme-l ř oužtí testu k závěru, že odlehlou hodotu je třeba vyloučt, ak j vyloučíme a celý výočet zoakujeme.