Kapitola 2 - Testování hypotéz. Testy dobré shody



Podobné dokumenty
V mnoha pípadech, kdy známe rozdlení náhodné veliiny X, potebujeme urit rozdlení náhodné veliiny Y, která je funkcí X, tzn. Y = h(x).

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

You created this PDF from an application that is not licensed to print to novapdf printer (

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt

IV. CVIENÍ ZE STATISTIKY

2. Posouzení efektivnosti investice do malé vtrné elektrárny

POROVNÁNÍ MEZI SKUPINAMI

4ST201 STATISTIKA CVIČENÍ Č. 7

Cykly Intermezzo. FOR cyklus

1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)

Metodický pokyn pro urení optimální velikosti fakturaního vodomru a profilu vodovodní pípojky.

Energie elektrického pole

REGRESNÍ ANALÝZA. 13. cvičení

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

PRVKY KOVOVÝCH KONSTRUKCÍ

9. Kombinatorika, pravd podobnost a statistika

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

Normální (Gaussovo) rozdělení

2. Definice pravděpodobnosti

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

Regresní a korelační analýza

v cenových hladinách. 2

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Teoretické modely diskrétních náhodných veličin

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

5 Parametrické testy hypotéz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Stručný úvod do testování statistických hypotéz

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Informace pro autory píspvk na konferenci ICTM 2007

Testování statistických hypotéz

Testování statistických hypotéz

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

Ing. Michael Rost, Ph.D.

Statistická analýza volebních výsledk

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Teoretické modely diskrétních náhodných veličin

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

III. CVIENÍ ZE STATISTIKY

Cvičení ze statistiky - 9. Filip Děchtěrenko

Podílový fond PLUS. komplexní zabezpeení na penzi

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

MECHANIKA I. Jaromír Švígler

= = 2368

Lepení plexi v bonici pružnými lepidly

7.1. Podstata testu statistické hypotézy

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU. Obchodní zákoník 5:

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

Normální (Gaussovo) rozdělení

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA )

Testy statistických hypotéz

7. Analýza rozptylu jednoduchého třídění

STATISTICKÉ TESTY VÝZNAMNOSTI

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

STATISTIKA (pro navazující magisterské studium)

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Pednáška mikro 07 : Teorie chování spotebitele 2

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Spojité regulátory - 1 -

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

STATISTICKÉ TESTY VÝZNAMNOSTI

NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM

Soudní exekutor JUDr. Vít Novozámský Bratislavská 40/ Brno k.j. 056 EX 9379/10-46

Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu.

Testování statistických hypotéz

2.1 Pokyny k otev eným úlohám. 2.2 Pokyny k uzav eným úlohám. Testový sešit neotvírejte, po kejte na pokyn!

Testování statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

12. cvičení z PST. 20. prosince 2017

Bezpenost dtí v okolí škol z pohledu bezpenostního auditora

L I C H O B Ž N Í K (2 HODINY) ? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky:

Promnné. [citováno z

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

2 ) 4, Φ 1 (1 0,005)

STATISTICKÉ HYPOTÉZY

= = 25

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Jednofaktorová analýza rozptylu

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Náhodné veličiny, náhodné chyby

Úvod do analýzy rozptylu

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Statistické ízení finanních tok

Transkript:

Kaptola - Testování hypotéz. Testy dobré shody Dva základní statstcké postupy jsou odhad parametr a testování hypotéz. V mnulé kaptole jsme s ukázal, jak odhadujeme charakterstky základního souboru, v této kaptole probereme základy testování hypotéz (hypothess testng). Mez základní pouky metodologe vdy patí, že shoda dat s hypotézou ješt neznamená, že hypotéza je pravdvá; naprot tomu data odporující hypotéze ukazují na to, že hypotéza pravdvá není. Hypotézu nelze na základ dat dokázat; hypotézu však lze na základ dat vyvrátt. z toho vychází statstcké testování hypotéz. Ukážeme s jej na píklad vyhodnocení nomnálních dat; ne proto, že by se pro jné typy dat neužívalo, ale proto, že je na nomnálních datech nejsnáze pochoptelné. Postup je následující: Formuluj nulovou hypotézu. Nulová hypotéza je formulována tak, aby j mohla data vyvrátt v pípad, že není pravdvá. Vtšnou to tedy bývá opak toho, co chc dokázat. Nulová hypotéza (null hypothess, H 0 ) je vtšnou formulována jako: nco se nelší; není dference; není závslost; platí zákon atd. Poté se snažím dokázat, že urtá data nejsou slutelná (jsou v rozporu) s touto nulovou hypotézou. Pokud to dokáž, zamítám nulovou hypotézu a pjímám alternatvní hypotézu H A, nkdy též H 1, která je negací nulové hypotézy. Píklad: Studuj ddnost rostlny a ptám se, zda zde platí pro barvu kvt jednoduchá mendelovská ddnost. Pedpokládám, že v F 1 generac bude pomr potu ervenokvtých k blokvtým 3:1. Mám 80 potomk. Potom pedpokládám, že v potomstvu bude 60 ervenokvtých a 0 blokvtých jednc. Já však mám 10 blokvtých a 70 ervenokvtých. Jsou moje výsledky v rozporu s pomrem 3:1, tzn. s tím, že každé ndvduum má pravdpodobnost 0.75 být ervenokvté a 0.5 být blokvté? I v pípad, že pravdpodobnost jsou 0.75 a 0.5, mohu s urtou pravdpodobností dostat výsledný pomr 70:10. Dokonce mohu dostat všech 80 ervenokvtých (s pravdpodobností 0.75 80, což je ádov 10-10 ). V takovém pípad ovšem nebudu ochoten vt, že šlo pouze o náhodu, a dojdu k názoru, že nulová hypotéza neplatí (zamítnu j). Nulovou hypotézu zamítám, pokud dostanu uspoádání dat, které je za pedpokladu platnost nulové hypotézy velm nepravdpodobné. Co to ale je, velm nepravdpodobné? Statstka nám k tomu poskytuje následující návod: Zvol s, jak nepravdpodobný výsledek za pedpokladu platnost nulové musíš dostat, abys ses rozhodl pro závr, že nulová hypotéza neplatí. Vtšnou se rozhodujeme pro 5% nebo 1%. Této hodnot íkáme hladna významnost testu a znaíme j α; bývá zvykem j vyjadovat desetnným íslem, nap. α=0.05. Potom spot testové krterum (nkdy tuto hodnotu nazýváme testová statstka; zde je další význam termínu statstka). Pro toto krterum je známo, jaké má rozdlení v pípad platnost nulové hypotézy. Je tedy známo, kterou hodnotu pekroí s pravdpodobností 5%, kterou hodnotu pekroí s pravdpodobností 1% atd. Tmto hodnotám íkáme krtcké hodnoty. Jestlže hodnota testového krtera pekroí krtckou hodnotu pro zvolenou hladnu významnost, zamítn nulovou hypotézu na dané hladn významnost. íkáme potom, že výsledek (nesouhlas s nulovou hypotézou) je sgnfkantní na dané hladn významnost. Pro kategorální data používáme testy dobré shody (goodness of ft) a používáme krtéra (statstky) χ, t 3

chí-kvadrát, angl. ch-square, t kaj (píšern psobí bžn používaná esko-anglcká sms, vyslovovaná chí-skvér ): χ = k = 1 ( f fˆ) fˆ Vz. Kaptola -A k je celkový poet kategorí, které sleduj (v našem píklad ), fˆ je oekávaná etnost v -té kategor (asto se také znaí E, z anglckého Expected, f je etnost skutená (pozorovaná, nkdy též O, Observed). V našem pípad tedy formuluj nulovou hypotézu: v F 1 generac je pomr pravdpodobností výskytu ervenokvtých k blokvtým 3:1; v 80-tlenném potomstvu tedy pedpokládám 60 a 0 ndvduí. ( 70 60) ( 10 0) 60 0 χ = + = 6. 66 Tuto hodnotu porovnávám s tabulkovou hodnotou krtckých hodnot χ pro danou hladnu významnost α (vtšnou volíme 0.05 nebo 0.01) a daný poet stup volnost. Stupn volnost, (degrees of freedom; srovnej se zvoláním bojovník za práva ernoch, vloženým do sprtuálu: Oh, Freedom), znaíme je vtšnou d.f., DF nebo ν (= ný ). Pro testy tohoto typu je poet stup volnost roven potu kategorí zmenšenému o jednu (k - 1). Je to poet etností ve skupnách, které potebujeme znát, abychom znal celý výsledek. Poet pípad v poslední kategor mžeme dopoítat ze znalost pedcházejících k-1 kategorí a celkového potu pozorování (ten je v testech považován za fxní). Vím-l, že z osmdesát jednc bylo sedmdesát ervenokvtých, znám výsledek celého pokusu. Krtcké hodnoty najdeme ve statstckých tabulkách (vz tabulka kaptola -c); dnes jsou tyto hodnoty ve vtšn statstckých program, takže se bžný užvatel jž s tabulkam vtšnou nesetká. Získaná hodnota 6.66 je vtší než krtcká hodnota χ 0.05,1, (tj. p 5% hladn významnost a jednom stupn volnost), jejíž hodnota je 3.84. Zamítáme tedy nulovou hypotézu na ptprocentní hladn významnost. Závr by tedy znl: Pozorovaná data se významn (sgnfkantn) na 5%-ní hladn významnost lší od etností, pedpokládaných jednoduchou mendelovskou ddností. V našem pípad by odlšnost byla prkazná na 1%-ní hladn významnost. Pozor: v testu užíváme pímo napozorované etnost. Nelze pevést nejprve údaje na procenta a potom poítat s procenty!!! Píklad: V jeskyn je velké množství netopýr (pro nás jch je nekonen mnoho), samc a samce. Chc zjstt, zda je pomr samc a samc 1:1. Nejsem ale schopen prohlédnout všechny netopýry v jeskyn. Chytím jch tedy 100 a podle nch se snažím rozhodnout. Onch 100 ndvduí musí být náhodným výbrem! Nulová hypotéza zní: V jeskyn je stejn samc jako samc (což je totéž jako: pravdpodobnost, že náhodn vybrané ndvduum je samec, je stejná, jako že náhodn vybrané ndvduum je samce). Exstují dv možnost, jak je tomu ve skutenost: 1. V jeskyn je stejn samc jako samc, ob pravdpodobnost jsou tedy 0.5. To znamená, že nulová hypotéza platí (je pravdvá). Výsledek pokusu mže být dvojí: 4

1a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < 3.84. Nemohu zamítnout nulovou hypotézu. Správné rozhodnutí. 1b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > 3.84. Zamítám nulovou hypotézu na 5%-ní hladn významnost. Udlal jsem chybu prvního druhu - Type I error. Pravdpodobnost této chyby známe: je to α. Hladna významnost α je tedy podmínná pravdpodobnost zamítnutí nulové hypotézy za pedpokladu, že nulová hypotéza platí.. Samc tvoí 60% ndvduí, náhodn vybrané ndvduum bude samec s pravdpodobností 0.6; samce s pravdpodobností 0.4. Nulová hypotéza tedy neplatí - je nepravdvá. Výsledek pokusu mže být opt dvojí: a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < 3.84. Nemohu zamítnout nulovou hypotézu. Dopustl jsem se chyby druhého druhu. Její pravdpodobnost oznaujeme jako β a vtšnou j neznáme. 1 - β je síla testu (power of the test). Obecn platí, že síla testu roste s odchylkou od nulové hypotézy a s potem pozorování. Dále platí, že ím menší je α, tím vtší je β. Protože β neznáme, je správná formulace výsledku: Na základ dat nemžeme zamítnout nulovou hypotézu. Formulace: Dokázal jsme nulovou hypotézu je nesprávná! b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > 3.84. Zamítám nulovou hypotézu na 5%-ní hladn významnost. Správné rozhodnutí. Máme tedy dv možnost, jaká je realta (nulová hypotéza bu platí nebo neplatí) a naše rozhodnutí mže být také dvojí (nulovou hypotézu zamítám, nebo nezamítám). Celý proces je zvykem lustrovat tabulkou: Skutenost Je-l H 0 pravdvá Je-l H 0 nepravdvá Naše H 0 jsme zamítl Chyba 1. druhu Správné rozhodnutí rozhodnutí H 0 jsme nezamítl Správné rozhodnutí Chyba. druhu Tab. Kaptola -A Chyba 1. a. druhu p statstckém rozhodování Chyba prvního druhého druhu jsou vlastní statstckému rozhodování a vyplývají ze stochastckého (náhodného) charakteru studovaných proces; nelze je tedy žádným zpsobem z našeho rozhodování zcela elmnovat. ím menší pravdpodobnost chyby prvního druhu jsme ochotn ppustt, tím vtší máme pravdpodobnost chyby druhého druhu. Pedstavme s v píkladu netopýr, že jsme ochotn pjmout pravdpodobnost chyby prvního druhu pouze 0.01. Krtcká hodnota testu je 6.63. Co je toho dsledkem? V pípad 1b jsem se díky písnost krtera nedopustl chyby prvního druhu; naprot tomu jsem se v pípad b dopustl chyby druhého druhu. Za lepší ochranu ped chybou prvního druhu platím vtší pravdpodobností chyby druhého druhu. Na tomto píklad však lze demonstrovat nebezpeí jných chyb, které sce nejsou vlastní statstce, ale p aplkac statstckých metod na bologcké problémy se jm vtšnou také nevyhneme. Onch 100 ndvduí pokládáme za náhodný výbr. Ncmén, abychom opravdu mohl provést náhodný výbr, musel bychom všechna ndvdua oíslovat a potom podle tabulky náhodných ísel vybrat 100 ndvduí - to 5

logcky není možné. Za náhodný výbr obvykle považujeme ta ndvdua, která se nám podaí získat. Pedpokládejme, že sbíráme netopýry v zm, když vsí ze stropu jeskyn. Pokud s nap. samc vybírají pro pezmování pro lovka obtížnj dostupná místa než samce, nebo se samc rychlej probudí a dív nás pokoušou, takže nám jch víc uletí, je pravdpodobné, že v našem výbru bude (statstcky významn) více samc - nepodalo se nám provést náhodný výbr. V prax tedy mže být zamítnutí nulové hypotézy dsledkem tí skuteností: testu. 1. Nulová hypotéza neplatí.. Nulová hypotéza platí, ale dopustl jsme se chyby 1. druhu. 3. Nulová hypotéza platí, ale my jsme nesplnl všechny pedpoklady pro užtí Test a základní vzorec χ k ( f = = 1 f fˆ ˆ) je možno použít pro lbovolný poet kategorí. Následuje píklad (Zar 1984) sledování dvou znak na semenech (semena zelená, žlutá; svraskalá a hladká). Žlutá a hladká se považují za domnantní. Oekávaný pomr je potom 9:3:3:1. V tomto pípad je poet kategorí k = 4, DF (ν) = 3. Bylo sledováno 50 semen. Pozorované etnost fenotyp byly 15, 39, 53, 6. Nulová hypotéza (H 0 ): Sledovaný výbr semen pochází ze základního souboru charakterzovaného pomrem fenotyp žlutých hladkých, žlutých svraskalých, zelených hladkých a zelených svraskalých 9:3:3:1. (Mžeme též formulovat: pravdpodobnost výskytu daných fenotyp jsou v pomru 9:3:3:1.) Alternatva (H A ): Semena pocházejí ze základního souboru, který nemá pomr shora uvedených fenotyp 9:3:3:1. Oekávané etnost spoteme trojlenkou. Nap. oekávaný poet žlutých hladkých semen je 50. (9/16) =140.65 žlutá žlutá zelená zelená hladká svraskalá hladká svraskalá n pozorované 15 39 53 6 50 oekávané 140.65 46.875 46.875 15.65 Tab. Kaptola -B Píklad užtí χ testu 97 11375. 140. 65 7. 875 46. 875 615. 46. 875 χ = + + + 9. 65 =0.901+1.330+0.8003+5.990=8. 15. 65 Protože 8.97 je vtší než krtcká hodnota pro α=0.05 (ta je 7.815, vz tabulka -3), zamítáme nulovou hypotézu na 5%-ní hladn významnost. Mžeme tedy zamítnout hypotézu, že data odpovídají modelu jednoduché mendelovské ddnost s nezávslým znaky. Z hodnot jednotlvých sítanc vdíme, že nejvýraznjší píspvek 6

k vysoké hodnot testovacího krtéra dává poslední kategore (semena zelená, svraskalá). Uveme další píklady užtí tohoto testu: (1.) Vely jsou postupn vpouštny do pokusného prostoru se žlutým, erveným a modrým ter. Sledujeme barvu tere, na který každá vela poprvé usedne. Nulová hypotéza je, že pravdpodobnost usednutí nezávsí na barv tere (tímto zpsobem zjš ujeme, zda se vely vzuáln orentují a zda p této orentac hrají njakou úlohu barvy). Data: bylo vpuštno 100 vel; etnost barev, na které poprvé usedly: žlutá 47, ervená 38, modrá 15. Lze z tchto dat usoudt, že vely nkterou barvu preferovaly? Nulová hypotéza bude znít: Pravdpodobnost usednutí vely na ter nezávsí na barv tere, a oekávané etnost budou 33.3 : 33.3 : 33.3. Na tomto pokusu mžeme demonstrovat další podmínky použtí tohoto testu: 1. etnost pocházejí z nezávslých pokus. Proto vpouštíme vely do pokusného prostoru po jedné, a zaznamenáváme chování každé vely. Kdybychom vpustl všechny vely do prostoru najednou a spoetl poet, který se usadl na každém ter, mže být (prkazná) odchylka od nulové hypotézy dána tím, že vely poletí spolen jako roj, a spolen usednou na ter, který náhodn vybere jedna z nch, jakás vedoucí roje. P provádní pokusu s musíme být jst, že usednuvší vela nenechá na ter njakou znaku (nap. pachovou), která by umožnla dalším velám se orentovat. Pokud s tím nejsme jst, musíme tere vymovat ped vpuštním každé další vely. Dále je teba zajstt, aby vely nemohl preferovat urtý ter nkolv kvl barv, ale kvl pozc v pokusném prostoru. Proto bychom ve správn provádném pokusu pozce barevných ter náhodn stídal po každé jednotlvé vele.. Ped pokusem jsme ml pevn daný celkový rozsah výbru. Nesprávný (a asto užívaný) postup je takový, kdy po prvních 100 velách zjstíme, zda je výsledek testu prkazný; pokud není, zvtšíme velkost výbru, pdáme dalších 30 vel a proceduru opakujeme, a tak to zkoušíme nkolkrát a sledujeme, zda dostaneme kýžený prkazný výsledek, který nám umožní publkovat zásadní prác o tom, jak se vely orentují podle barvy. Takovýto postup mnohonásobn zvyšuje pravdpodobnost chyby prvního druhu!! (.) Porovnání pomru pohlaví (sex rato) ve skupn s oekávaným pomrem 1:1. Data: Za poslední msíc se v porodnc msta X narodlo 89 chlapc a 99 dvat. Byl pomr prkazn odlšný od oekávaného 1:1? Nulová hypotéza tedy zní: Pravdpodobnost narození chlapce a dvete byla stejná. Oekávané etnost jsou tedy 94:94. Ze statstckého hledska nám nc nebrání testovat nulovou hypotézu, že pravdpodobnost narození chlapce byla dvakrát vtší než pravdpodobnost narození dvete. Potom by ovšem oekávané etnost byly 15.34 a 6.66. Tuto hypotézu bychom jst zamítl. Ovšem zamítnutí takové hypotézy je málo zajímavé, nebo není žádný dvod pedpokládat, pro by mla platt. Naprot tomu, pokud bychom zamítl nulovou hypotézu o pomru 1:1, mžeme hledat smysluplná vysvtlení, pro tomu tak je. Obdobn, p testování štpných v pomr v genetce nám ze statstckého hledska nc nebrání testovat nulovou hypotézu, že štpný pomr je nap. 1:17. (Její zamítnutí nám ovšem potvrdí to, co jsme pedem vdl, že štpný pomr 1:17 je zejmý nesmysl.) Pomr 3:1 oekáváme, protože známe zákony mendelovské ddnost, a zárove víme, že exstují mechansmy, které tento pomr narušují. Ty budeme hledat v systémech, kde jsme dokázal odchylku od oekávaného štpného pomru. (Pípadné zamítnutí nulové hypotézy o pomru 3:1 tedy nebudeme považovat za 7

argument pro lysenkovskou bolog.) Formulace nulové hypotézy je tedy, stejn jako postavení pokusu plán sledování, vcí nejen statstckou, ale pedevším vcí znalost problému a jeho bologcké podstaty. Nulovou hypotézu formulujeme v matematckých termínech, v uvedených píkladech používáme pravdpodobnost nebo oekávané etnost jev. Vše ostatní je mmostatstcké uvažování. V píkladu s barevným te jst mohu usoudt, že pokud zamítnu nulovou hypotézu o stejné pravdpodobnost usednutí na ter, nezávsející na barv tere, potom vely musí mít schopnost barvy rozlšt. Ncmén hypotéza: vely nejsou schopny rozlšt barvy není nulovou hypotézou statstckého testu. Velkost výbru Tento test je pouze pblžný. Pblížení je velm dobré, pokud je velkost výbru velká; doporuuje se, aby žádná oekávaná etnost nebyla menší než 1 a aby mén než 0% etností bylo menších než 5. Pokud tomu tak není, mžeme nkteré kategore s malým etnostm spojt. Co jsou krtcké hodnoty; dosažená hladna významnost Základem mnoha statstckých test je následující postup. Spoteme testovou statstku, nap. χ, o které víme, jaké má rozdlení v pípad platnost nulové hypotézy. Nap. víme, že testová statstka, která vznkne setením χ = k = 1 ( f fˆ) fˆ = k = 1 (O E) E Vz. Kaptola -B O je pozorovaná etnost (observed), E je oekávaná etnost (expected). má za pedpokladu platnost nulové hypotézy, na jejímž základ jsou oekávané etnost poítány, rozdlení, které jsme schopn charakterzovat dstrbuní funkcí a tuto dstrbuní funkc vyíslt. Toto rozdlení se nazývá, stejn jako testová statstka, χ. Toto rozdlení je spojté; testové krterum poítáme z potu pípad, tedy nutn z dat dskrétních a proto mže testové krterum nabývat pouze urtých hodnot. Proto musí být velkost výbru dostaten velká, aby nespojtost pílš nevadla. Toto rozdlení patí mez tzv. výbrová rozdlení a tvar jeho dstrbuní funkce závsí na potu stup volnost. Protože toto rozdlení je známé, lze spoítat jeho 95%-ní kvantl. Víme, že podle defnce je 95%-ní kvantl hodnota, kterou náhodná promnná pekroí s pravdpodobností 0.05. Pro shora uvedený test je tedy 95%-ní kvantl rozdlení krtckou hodnotou na 5%-ní hladn významnost (tj. p α = 0.05). Víme, že hodnota krtera je tím vtší, ím je vtší odchylka od nulové hypotézy. Pokud tedy hodnota testového krtera pekroí krtckou hladnu na 5%-ní hladn významnost, mžeme íc, že pokud nulová hypotéza platí, potom pravdpodobnost, že dostaneme výsledek takto nebo více odlšný od nulové hypotézy je menší než 5%. Dnes vtšna statstckých program pímo s hodnotou testové statstky poskytuje také odpovídající hodnotu, kterou nejastj nazývá Probablty, pípadn jenom P, ale také nkdy Sgnfcance level. Je to 1 - hodnota dstrbuní funkce pro spotenou hodnotu testového krtera, což je totéž jak hodnota urtého 8

ntegrálu z hustoty pravdpodobnost od spotené hodnoty do +. Na grafu hustoty pravdpodobnost (Chyba! Nenalezen zdroj odkaz.obr. kaptola -a) je to plocha, kterou pokrývá ocas rozdlení od dané hodnoty do nekonena (proto se jm také íká Tal Area Probabltes). Tato hodnota nám udává pímo pravdpodobnost, s jakou dostaneme takto nebo více od nulové hypotézy odlšný výsledek za pedpokladu, že nulová hypotéza platí. Této hodnot se íká dosažená hladna významnost. Pokud je dosažená hladna významnost menší než 0.05, znamená to, že test je prkazný p α = 0.05. V bologckých láncích se nyní nejastj referuje o výsledcích test následujícím zpsobem (výsledek testu z Chyba! Nenalezen zdroj odkaz.): V pokusu získaný štpný pomr 15:39:53:6 se statstcky významn lšl od pomru pedpokládaného jednoduchou mendelovskou ddností (χ = 8.97, df=3, P<0.05). Pro prezentac vlastních dat je vhodné dodržovat následující: α používáme pro pedem stanovenou hladnu významnost, takže píšeme nap. test je prkazný p α=0.05 ; P (nebo p) používáme pro dosaženou hladnu významnost, takže píšeme P<0.05. Pokud napíšeme P<<0.01, znamená to, že dosažená hladna významnost je výrazn nžší než 0.01; pravdpodobnost chyby prvního druhu je tedy zanedbateln malá. Pokud nám poíta napíše, že P=0, znamená to, že hodnota dosažené hladny významnost je menší než pesnost poítae. Nepšte do lánk P=0, ale nap. P<10-6. Nkdy udáváme pímo dosaženou hladnu významnost. Sdlením P=0.49 naznaujeme, že výsledek testu byl sce prkazný na 5% hladn významnost, ale s odenýma ušma. Podobn sdlení P=0.5 naznauje, že jsme nulovou hypotézu sce nezamítl, ale mnoho nechyblo, aby...uvádní dosažené hladny významnost v publkacích považuj za velm cennou nformac. Obr. Kaptola -A Hustota pravdpodobnost rozdlení χ se dvma stupn volnost. Celá plocha vymezená kvkou a osou x je rovna jedné, velkost tekované plochy odpovídá pravdpodobnost, že promnná nabude hodnotu vtší než 8.. Jestlže jsme dostal hodnotu testového krtera 8., potom velkost tekované plochy odpovídá dosažené hladn významnost testu. Klascká statstka doporuovala strktn postup, kdy nejprve pevn stanovíme hladnu významnost, a poté dostaneme jednoznanou odpov: zamítáme nebo nezamítáme. Dnes se, zvlášt v bologcké prax, prosazuje spíše pístup, kdy prezentujeme dosaženou hladnu významnost a podle ní posuzujeme dvryhodnost výsledku: pokud posuzujeme pomr pohlaví v populac netopýr, s urtou nejstotou 9

se smííme, není teba zcela jednoznan rozhodnou ano nebo ne. Naprot tomu prvý zpsob musíme nutn použít tam, kde na základ testu níme rozhodnutí typu ano/ne. Napíklad se rozhoduj, zda zavést výrobu preparátu, který v populac mní pomr pohlaví. Zde s musím pedem stanovt míru rzka, kterou jako výrobce hodlám nést (bude pravdpodobn velm malá, napíklad 0.001), a pokud výsledek pokusu nebude prkazný, výrobu nezavedu. Obdobný postup se užívá u klnckých test p zavádní nových lék. Pílš dobré, aby to byla pravda (Too good to be true) Píklad: Spolenost, vyrábjící nový druh žvýkaky byla obvnna, že pravdelné žvýkání jejích produkt vede u muž ke zvýšené mortalt spermí nesoucích chromosom X (a pak se jm budou rodt pevážn synové). Spolenost najala pokusnou osobu, která dva roky ntenzvn žvýkala její produkty; poté provedla vyšetení jeho spermatu. Ve zveejnné zpráv uvádí, že provedla test na pítomnost chromosomu X v 10000 spermí pokusné osoby, a zjstla pítomnost chromosomu X v 5001 pípad, tzn. nepítomnost v 4999 pípadech. Spolenost na základ toho konstatuje, že shoda s oekávaným pomrem 1:1 je dostaten jasná a že tedy její produkty jsou z tohoto hledska zcela neškodné. Co k tomu mžeme íc jako statstc? Odhlédnme nyní od toho, že pozorování nebylo nejlépe naplánováno (eufemsmus, íkající, že bylo naplánováno úpln špatn), chybí kontrola, jedná o vlv na jedného lovka, a pokusme se vyhodnott porovnání pomru spermí s chromosomem k potu spermí s chromosomem Y s oekávaným pomrem 1:1. Použjme χ - test dobré shody. Dostáváme χ = 4.10-4, P=0.984. Výsledek testu je tedy neprkazý, ale dosažená hladna významnost se blíží jedné. To je velm podezelé. Co nám to íká? Pedpokládejme, že pomr 1:1 je v základním souboru opravdu zachován. Potom s pravdpodobností více než 98% dostaneme v náhodném výbru spermí vtší odchylku od pomru 1:1, než v našch datech. Nebo jnak: šance, že dostaneme takto dobrou shodu s pomrem 1:1 byla menší než %. Bu tedy mla spolenost z pekla štstí, nebo spíše výsledky zfalšovala tak, jak j vyhovovaly. Jsou pílš dobré na to, aby to mohla být pravda. Uvedený píklad je jst vymyšlený. Ncmén ukazuje na to, jak se dá statstkou objevt falšování dat. Obdobný (statstcky) píklad je ovšem ve svtové vd znám: Vyhodnotíme-l uvedeným postupem výsledky orgnálních Mendelových pokus, zjstíme, že jsou z uvedeného hledska pílš dobré, shoda se štepným pomry je nepravdpodobn dobrá. Mendel sám ovšem o statstce netušl a nkde netvrdí, že se ídl pravdly pro náhodný výbr; naopak, konstatuje, že tam, kde byl výbr malý pdával další ndvdua. Závr, hojn ctovaný v dob, kdy u nás byla genetka nazývána buržoasní pavdou, že prelát Mendel falšoval data, je tedy nesmyslný; pro zájemce doporuuj lánek T. Havránka (1986). Pouení pro nás je ovšem dvojí: když pnášíme zprávu o výsledku pokusu, popšme detaln, jak jsme k datm pšl a p použtí hstorckých dat nemžeme pedpokládat, že data byla sebrána zpsobem odpovídajícím statstckým zásadám. 30

Doporuená etba Zar (1984), pp. 40-60, Sokal-Rohlf (1981), pp. 69-730, Havránek (1993): testování hypotéz obecn - 73-95. Havránek T. (1986): Gregor Mendel a expermentální data. - Vesmír 65: 331-333. Tabulka Kaptola -C tabulka krtckých hodnot χ dstrbuce α df 0.05 0.01 0.001 1 3.841 6.635 10.87 5.991 9.10 13.815 3 7.815 11.345 16.68 4 9.488 13.77 18.465 5 11.070 15.086 0.517 6 1.59 16.81.457 7 14.067 18.475 4.3 8 15.507 0.090 6.15 9 16.919 1.666 7.877 10 18.307 3.09 9.588 11 19.675 4.75 31.64 1 1.06 6.17 3.909 13.36 7.688 34.58 14 3.685 9.141 36.13 15 4.996 30.578 37.697 16 6.96 3.000 39.5 17 7.587 33.409 40.790 18 8.869 34.805 4.31 19 30.144 36.191 43.80 0 31.410 34.170 37.566 31