Testy statistických hypotéz



Podobné dokumenty
- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

17. Statistické hypotézy parametrické testy

Fakulta elektrotechniky a informatiky Statistika STATISTIKA

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Statistika - vícerozměrné metody

1. Základy měření neelektrických veličin

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Mendelova univerzita v Brně Statistika projekt

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Test hypotézy o parametru π alternativního rozdělení příklad

PRAVDĚPODOBNOST A STATISTIKA

S1P Popisná statistika. Popisná statistika. Libor Žák

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Pravděpodobnost a statistika - absolutní minumum

6. T e s t o v á n í h y p o t é z

z možností, jak tuto veličinu charakterizovat, je určit součet

Poznámky k předmětu Aplikovaná statistika, 9.téma

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

a další charakteristikou je četnost výběrového souboru n.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

1. Základy počtu pravděpodobnosti:

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

, jsou naměřené a vypočtené hodnoty závisle

Testování statistických hypotéz

Úvod do zpracování měření

PRAVDĚPODOBNOST A STATISTIKA

Cvičení 3 - teorie. Teorie pravděpodobnosti vychází ze studia náhodných pokusů.

HYPOTEČNÍ ÚVĚR. , kde v = je diskontní faktor, Dl počáteční výše úvěru, a anuita, i roční úroková sazba v procentech vyjádřená desetinným číslem.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Generování dvojrozměrných rozdělení pomocí copulí

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

1. Pravděpodobnost a statistika (MP leden 2010)

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

PRAVDĚPODOBNOST A STATISTIKA

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

P1: Úvod do experimentálních metod

Spolehlivost a diagnostika

NEPARAMETRICKÉ TESTY

Univerzita Pardubice Fakulta ekonomicko-správní

Intervalové odhady parametrů

Úvod do teorie měření

Aktivita 1 Seminář základů statistiky a workshop (Prof. Ing. Milan Palát, CSc., Ing. Kristina Somerlíková, Ph.D.)

4.2 Elementární statistické zpracování Rozdělení četností

12. N á h o d n ý v ý b ě r

Metody zkoumání závislosti numerických proměnných

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

Náhodný výběr 1. Náhodný výběr

IV. NEJISTOTY MENÍ A ZPRACOVÁNÍ VÝSLEDK

C V I Č E N Í 4 1. Představení firmy Splintex Czech 2. Vlastnosti skla a skloviny 3. Aditivita 4. Příklady výpočtů

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Soustava kapalina + tuhá látka Izobarický fázový diagram pro soustavu obsahující vodu a chlorid sodný

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

u, v, w nazýváme číslo u.( v w). Chyba! Chybné propojení.,

cenný papír, jehož koupí si investor zajistí předem definované peněžní toky, které obdrží v budoucnosti

KABELY. Pro drátové okruhy (za drát se považuje i světlovodné vlákno): metalické kabely optické kabely

TECHNICKÁ UNIVERZITA V LIBERCI

9. Měření závislostí ve statistice Pevná a volná závislost

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY Přírodovědecká fakulta ANALÝZA DAT. Josef Tvrdík

Cvičení z termomechaniky Cvičení 5.

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

PRAVDĚPODOBNOST A STATISTIKA

Úkol měření. Použité přístroje a pomůcky. Tabulky a výpočty

VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI

11. Popisná statistika


OBRAZOVÁ ANALÝZA POVRCHU POTISKOVANÝCH MATERIÁLŮ A POTIŠTĚNÝCH PLOCH

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

12. Neparametrické hypotézy

Seznámíte se s pojmem Riemannova integrálu funkce jedné proměnné a geometrickým významem tohoto integrálu.

8. Zákony velkých čísel

PRAVDĚPODOBNOST A STATISTIKA

Doc. Ing. Dagmar Blatná, CSc.

Odůvodnění. Obecná část

1. K o m b i n a t o r i k a

Jednoduchá lineární regrese

Úvod do korelační a regresní analýzy

8 NELINEÁRNÍ REGRESNÍ MODELY

Domácí práce z p edm tu D01M6F Statistika

Pravděpodobnost a aplikovaná statistika

APLIKACE REGRESNÍ ANALÝZY NA VÝPOČET BODU ZVRATU

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Intervalové odhady parametrů některých rozdělení.

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

2. Definice plazmatu, základní charakteristiky plazmatu

FINANČNÍ MATEMATIKA- INFLACE

FLUORIMETRIE. Jan Fähnrich. Obecné základy

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

Statistická rozdělení

DYNAMICKÉ MODULY PRUŽNOSTI NÁVOD DO CVIČENÍ

Matice. nazýváme m.n reálných čísel a. , sestavených do m řádků a n sloupců ve tvaru... a1

Přednáška č. 2 náhodné veličiny

Transkript:

Úvod Testy statstckých hypotéz Václav Adamec vadamec@medelu.cz Testováí: kvalfkovaá procedura vedoucí v zamítutí ebo ezamítutí ulové hypotézy v podmíkách ejstoty Testy jsou vázáy a rozděleí áhodých velč Testy jsou podmíěy formulací vědeckého problému a expermetálím desgem ypotéza: předpoklad o statstckých parametrech ebo jejch kombacích. Typy: hypotéza ulová a alteratví Testovací statstka: umercká charakterstka vypočteá z dat popř. z parametrů. Má zámé rozděleí Statstcké hypotézy Typy chyb př statstckém testováí Nulová hypotéza : formulace egatvím způsobem (efekt eexstuje : θ θ vytváří předpoklad o rozděleí parametrů ebo testovací statstky Alteratví hypotéza : formulace mmo obor hodot ulové hypotézy. Obsahuje alteratví předpoklad, který chceme dokázat Dvoustraá : θ θ Levostraá : θ < θ Pravostraá : θ > θ zamítáme, je-l vypočteá testovací statstka v oblast zamítutí Oblast zamítutí je určea typem a parametry rozděleí testovací statstky Realta o pravdvá epravdvá Rozhodutí o zamítuta chyba I. typu (α síla testu (-β ezamítuta (- α chyba II. typu (β

Chyby př statstckém testováí Síla testu Chyba I. Typu (α: zamítuta a zároveň je pravdvá. Rozdíly prohlášey za průkazé, avšak průkazé ejsou ( je pravdvá. Test produkoval esprávý poztví ález Chyba II. Typu (β: ezamítuta a zároveň je epravdvá. Rozdíly prohlášey za eprůkazé, avšak průkazé jsou ( je epravdvá. Test produkoval esprávý egatví ález Stuace - α a - β jsou korektí V případě (-α ezamítáme je pravdvá V případě (-β zamítáme a je epravdvá Oba typy chyb emohou astat současě Kotrolujeme pouze α s ohledem a míru přjatelého rzka důsledků chyby I. typu Pravděpodobost -β se azývá síla statstckého testu. Vysoká hodota - β je žádoucí pro úspěch testováí Síla testu závsí a: Rozsahu souboru: vyšší zvyšuje sílu Varabltě dat: kotrolovaá varablta zvyšuje sílu Zvoleé hodotě alfa: vysoká alfa zvyšuje sílu, (ale chybu I. typu Ploše překryvu rozděleí testovací statstky za platost a. Vysoký překryv sžuje sílu testu Žádoucí hodota -β u testů je > 8 % Testy s jedostraou mají vyšší sílu ež oboustraé Testy jedovýběrové mají vyšší sílu ež dvou-výběrové a shodých datech Rozsah souboru a síla testu Vlv překrytí rozděleí za a Power of oe-sample z-test Dstrbutos of the statstc uder ad power...4.6.8. 3 Desty....3.4.5 Null dstrbuto :mu Z.975 β Alter. dstrbuto :mu 3 α β Power -. -.5..5. delta alpha.5, delta-:, sd -4-4 6 8

Malé překrytí rozděleí za a Síla testu Dstrbutos of the statstc uder ad Desty....3.4.5 Null dstrbuto :mu Z.975 α Alter. dstrbuto :mu 6 β Power Negatvě působí a sílu testu (obecě: eterogeta varací Sérové závslost resduí (pod-specfkovaý model Odchylky od ormalty (extrémí škmost Vysoký počet proměých v testovací statstce - 4 6 8 P-value Úskalí statstckých testů Je pravděpodobost výskytu extrémější hodoty testovací statstky, ež té, která byla emprcky vypočtea Syoyma: vypočteá průkazost ebo vypočteá alfa Účel: rovoceé krtérum (ezamítutí Testovací krtérum: p-value < alfa zamítáme odota p-value testu je určea typem a parametry rozděleí testovací statstky, z kterého se zjšťuje. Zamítutí závsí a: rozsahu souboru zvoleé hodotě alfa varabltě dat parametrech rozděleí testovací statstky za platost a Mapulací těchto velč lze dosáhout zamítutí každé! Statstcky průkazý rozdíl ezameá praktcky výzamý rozdíl!

Z-test ebo t-test? Předpoklady testů Fakt: Lokačí míry lze odhadovat relatvě saděj a spolehlvěj ež dspersí míry Z - testy o parametrech se používají v stuacích, je-l záma, tedy kvaltí odhad rozptylu Výběrová rozděleí se mohou lšt v lokačí míře, avšak mají stejý a zámý rozptyl T-testy o parametrech se používají v stuacích, eí-l záma, tedy když máme méě kvaltí odhad rozptylu s Výběrová rozděleí se mohou lšt v lokačí míře, avšak mají stejý ale ezámý rozptyl Rozptyly z dvou ebo více výběrů mohou být stejorodé ebo růzorodé Normálí rozděleí výběrového souboru s daým průměrem a rozptylem Kostatost a sérová ezávslost rozděleí hodot (I.I.D. Obecá formule Z testu: θ Z ~ (, ( N se θθ θ Obecá formule T testu: θ θ t ~ t se( θ θ Poz.: θ - θ rozdíl parametrů; se(θ - θ středí chyba rozdílu ν Testy a ormaltu Jedo-výběrový z-test a t-test Test dobré shody: eparametrcký aproxmačí test vycházející z χ rozděleí Použtelý pro více typů rozděleí, především espojtá Využívá tervalového tříděí výběru do p tříd (p / Kalkulace emprckých (O a očekávaých (E četostí (z fukce F(x p ( O E χ ~ χp E Shapro Wlks test: Sad ejlepší test ormalty Kalkuluje statstku W podobou čtverc korelace mez emprckým a teoretckým kvatlam Test je levostraý! Nízká hodota W (jž okolo.9! zamítá : Y ~ N(µ,. Kolmogorov Smrov test: test pro jede (K ebo dva soubory (S a spojtá rozděleí. Porovává F (y emprckého a rozděleí : maxfˆ( y F ( y D Vysoká hodota D zamítá. (pravostraý test Z - test: Testujeme, zda-l se průměr výběru lší od specfkovaé hodoty µ, za dostupost rozptylu populace. : µ µ µ µ Z ~ N(, / Oblast zamítutí : : µ µ z > z α / : µ > µ z > z α : µ < µ z < zα T - test: Testujeme, zda-l se průměr výběru lší od specfkovaé hodoty µ, za dostupost výběrového rozptylu s. µ µ t ~ t s / µ µ t > t : α /; : µ > µ t > t α ; : µ < µ t < tα;

Oblast zamítutí F-test o dvou rozptylech Rejecto rego of the statstc: oe-sded Desty...4 Z.95 Reject! α -4-4 T Rejecto rego of the statstc: two-sded F - test homogety dvou ezávslých souborů : : Testovací statstka: Oblast zamítutí : Oboustraá : F : < s ~ F ; s F < Fα / ; ; F > F α / ; ; : > Desty...4 Z.5 Z.975 Reject! Reject! α α Pravostraá : Levostraá : F > F α ; ; F < Fα ; ; -4-4 T Dvou-výběrový z-test Dvou-výběrový t-test (sdružeý Dva ezávslé soubory o průměrech a zámých rozptylech a. y N( µ, / y ~ N( µ, / y y ~ N( µ µ, + ~ : µ µ : µ µ : µ > µ : µ < µ Dva ezávslé soubory o průměrech a ezámých rozptylech s a s. Rozptyly jsou s rovy! Sdružeý odhad rozptylu ( s + ( s : s p + S p je odhadem společé varace obou souborů Testovací statstka: Z y y + ~ N(, Oblast zamítutí je shodá s jedo-výběrovým z-testem Za podmíky ormalty: Testovací statstka: t y y ~ N( µ µ, p ( + y y s p + ~ t +

Dvou-výběrový t-test (Welschův Cetrálí lmtí věta Dva ezávslé soubory o průměrech a ezámých rozptylech s as. Rozptyly s rovy ejsou! y y Welschova testovací statstka: w ~ t ν s s + Stupě volost ν se aproxmují podle Satterthwata: s s + ν ( s / ( / s + Welschův t - test vykazuje méě ν a proto má žší β ež sdružeý t-test. Použtí: Je-l jeda z varací je více ež trojásobek druhé Zěí: Jestlže y je áhodý výběrový soubor o rozsahu, společé středí hodotě µ a varac, pak rozděleí výběrových průměrů aproxmuje Gaussovo rozděleí o průměru µ a varac / pokud se přblžuje asymptotě (. Důsledek: výběrové průměry souborů pocházející z kteréhokolv rozděleí mají přblžě ormálí rozděleí, je-l dostatečě velké z y E( y y µ ~ N(, Var( y / / Výhoda: možost ormálí aproxmace př dostatečém rozsahu Mmálí rozsah závsí a typu rozděleí (meší pro souměrá, větší pro esouměrá výběrů,,a,b,uformí desta Z-test o jedom výběrovém poměru 4 Rozdele prumeru Normal Q-Q Plot Aplkace CLV: Testujeme, zda se výběrový poměr π rová populačímu poměru π Frequecy 8 6 4 Sample Quatles 6 8 4-3 - - 3 : π π : π π Testovací statstka: : π > π : π < π z π π ±.5 / ~ N (, π ( π představuje rozsah výběrového souboru Korekce a kotutu v čtatel (Yates když *m(π,-π < 5 Je záporá o hodotě -.5/ když π > π Je kladá o hodotě +.5/ když π < π 5 5 Theoretcal Quatles s

Z-test rovost dvou výběrových poměrů Příklad testu dvou výběrových poměrů Testujeme, zda se výběrový poměr π rová výběrovému poměru π : π π : π π : π π > : π π < Testovací statstka: z π π ~ (, π( π + a představují rozsahy výběrových souborů CLV aplkovatelá, když m(π,-π * m(, 5 Test je ekvvaletí testu rovost obou výběrových poměrů π a π sdružeému poměru π. Odhad π se vypočítá: uspech πˆ Ekvvaletí je Ch-kvadrát test x kotgečí tabulky χ.. (.... ~ χ Počty albíů ve populacích: 8 a 5 Rozsahy populací: 67 a 78 Výběrové poměry populací: 8 / 67,94 a 5 / 68,93 Sdružeý poměr populací: 3 / 45,586 Testovací statstka : (,94 -,93/odm(,586*(-,586*(/67 + /78 -,98 P-value,3 (dvoustraá : rozdíly eprůkazé χ test o rovost více poměrů Rozšířeí a polychotomcký případ Testujeme, zda se výběrové poměry π π... π p rovají : π π... π p : erovost Výpočet sdružeé hodoty π Výpočet dílčích statstk z Souhrá statstka χ je pak πˆ π z χ uspech π ±.5 / π ( π p z ~ χ ~ N p (, Testujeme, zda se multomcké výběrové poměry π π... π j rovají mez k skupam Nejsazší řešeí přes rekostrukc kotgečí tabulky a χ test ezávslost Příklad: Ve čtyřech výběrech z růzých populací laboratorích myší ( ; ; 3 96; 4 6; byly pozorováy relatví četost alel A, A a A3. Testujte, zda se četost lší mez populacem. Řešeí možé χ testem ( x p kotgečí tabulky

Potřebý rozsah áhodého výběru Příklady a rozsah výběru Mmálí rozsah výběru ( lze určt úpravou vzorců testovací statstky ebo tzv. přípusté chyby používaé k sestaveí (-α* % tervalu spolehlvost. Výsledé hodoty se obvykle zaokrouhlují ahoru ( jedovýběrový z - test jedostraé : z( α + z( β jedovýběrový z - test dvoustraé : ( z( α / + z( β dvouvýběrový z - test jedostraé : ( z( α + z( β ( + / k dvouvýběrový z - test dvoustraé : ( z( α/ + z( β ( + / k k koefcet / V případě t-testu: se ásobí (ν + 3/(ν +, kde ν jsou stupě volost pro chybu (Cox ad Cochra. Rozpětí křídel dospělých jedců jstého ptačího druhu je v průměru µ 48 cm. Bolog chce objevt ový poddruh, který se lší ejméě o 4 cm. Kolk jedců musí být odchyceo a změřeo, jestlže rozpětí je 6,5 cm? Předpokládáme -β,95, α,5. jedostraá : (z,95 + z,95 *6,5 / 4 8,5773 9 dvoustraá : (z,975 + z,95 *6,5 / 4 34,34 35 Chceme zjstt jestl se četost homozygotů alely jstého geu u mportovaé ladrace průkazě lší od domácí populace, kde je zámá frekvece p 3%. Kolk jedců je potřeba geotypovat, chceme-l zjstt mmálí rozdíl 3%. Předpokládáme -β,9, α,5, maxmálí varac. jedostraá : (z,95 + z,9 *,5 /,3 378,85 379 dvoustraá : (z,975 + z,9 *,5 /,3 98.73 99 Statstky jsou ejvyšším vývojovým stádem lž...