Kapitola 2 - Testování hypotéz. Testy dobré shody

Rozměr: px
Začít zobrazení ze stránky:

Download "Kapitola 2 - Testování hypotéz. Testy dobré shody"

Transkript

1 Kaptola - Testování hypotéz. Testy dobré shody Dva základní statstcké postupy jsou odhad parametr a testování hypotéz. V mnulé kaptole jsme s ukázal, jak odhadujeme charakterstky základního souboru, v této kaptole probereme základy testování hypotéz (hypothess testng). Mez základní pouky metodologe vdy patí, že shoda dat s hypotézou ješt neznamená, že hypotéza je pravdvá; naprot tomu data odporující hypotéze ukazují na to, že hypotéza pravdvá není. Hypotézu nelze na základ dat dokázat; hypotézu však lze na základ dat vyvrátt. z toho vychází statstcké testování hypotéz. Ukážeme s jej na píklad vyhodnocení nomnálních dat; ne proto, že by se pro jné typy dat neužívalo, ale proto, že je na nomnálních datech nejsnáze pochoptelné. Postup je následující: Formuluj nulovou hypotézu. Nulová hypotéza je formulována tak, aby j mohla data vyvrátt v pípad, že není pravdvá. Vtšnou to tedy bývá opak toho, co chc dokázat. Nulová hypotéza (null hypothess, H 0 ) je vtšnou formulována jako: nco se nelší; není dference; není závslost; platí zákon atd. Poté se snažím dokázat, že urtá data nejsou slutelná (jsou v rozporu) s touto nulovou hypotézou. Pokud to dokáž, zamítám nulovou hypotézu a pjímám alternatvní hypotézu H A, nkdy též H 1, která je negací nulové hypotézy. Píklad: Studuj ddnost rostlny a ptám se, zda zde platí pro barvu kvt jednoduchá mendelovská ddnost. Pedpokládám, že v F 1 generac bude pomr potu ervenokvtých k blokvtým 3:1. Mám 80 potomk. Potom pedpokládám, že v potomstvu bude 60 ervenokvtých a 0 blokvtých jednc. Já však mám 10 blokvtých a 70 ervenokvtých. Jsou moje výsledky v rozporu s pomrem 3:1, tzn. s tím, že každé ndvduum má pravdpodobnost 0.75 být ervenokvté a 0.5 být blokvté? I v pípad, že pravdpodobnost jsou 0.75 a 0.5, mohu s urtou pravdpodobností dostat výsledný pomr 70:10. Dokonce mohu dostat všech 80 ervenokvtých (s pravdpodobností , což je ádov ). V takovém pípad ovšem nebudu ochoten vt, že šlo pouze o náhodu, a dojdu k názoru, že nulová hypotéza neplatí (zamítnu j). Nulovou hypotézu zamítám, pokud dostanu uspoádání dat, které je za pedpokladu platnost nulové hypotézy velm nepravdpodobné. Co to ale je, velm nepravdpodobné? Statstka nám k tomu poskytuje následující návod: Zvol s, jak nepravdpodobný výsledek za pedpokladu platnost nulové musíš dostat, abys ses rozhodl pro závr, že nulová hypotéza neplatí. Vtšnou se rozhodujeme pro 5% nebo 1%. Této hodnot íkáme hladna významnost testu a znaíme j α; bývá zvykem j vyjadovat desetnným íslem, nap. α=0.05. Potom spot testové krterum (nkdy tuto hodnotu nazýváme testová statstka; zde je další význam termínu statstka). Pro toto krterum je známo, jaké má rozdlení v pípad platnost nulové hypotézy. Je tedy známo, kterou hodnotu pekroí s pravdpodobností 5%, kterou hodnotu pekroí s pravdpodobností 1% atd. Tmto hodnotám íkáme krtcké hodnoty. Jestlže hodnota testového krtera pekroí krtckou hodnotu pro zvolenou hladnu významnost, zamítn nulovou hypotézu na dané hladn významnost. íkáme potom, že výsledek (nesouhlas s nulovou hypotézou) je sgnfkantní na dané hladn významnost. Pro kategorální data používáme testy dobré shody (goodness of ft) a používáme krtéra (statstky) χ, t 3

2 chí-kvadrát, angl. ch-square, t kaj (píšern psobí bžn používaná esko-anglcká sms, vyslovovaná chí-skvér ): χ = k = 1 ( f fˆ) fˆ Vz. Kaptola -A k je celkový poet kategorí, které sleduj (v našem píklad ), fˆ je oekávaná etnost v -té kategor (asto se také znaí E, z anglckého Expected, f je etnost skutená (pozorovaná, nkdy též O, Observed). V našem pípad tedy formuluj nulovou hypotézu: v F 1 generac je pomr pravdpodobností výskytu ervenokvtých k blokvtým 3:1; v 80-tlenném potomstvu tedy pedpokládám 60 a 0 ndvduí. ( 70 60) ( 10 0) 60 0 χ = + = Tuto hodnotu porovnávám s tabulkovou hodnotou krtckých hodnot χ pro danou hladnu významnost α (vtšnou volíme 0.05 nebo 0.01) a daný poet stup volnost. Stupn volnost, (degrees of freedom; srovnej se zvoláním bojovník za práva ernoch, vloženým do sprtuálu: Oh, Freedom), znaíme je vtšnou d.f., DF nebo ν (= ný ). Pro testy tohoto typu je poet stup volnost roven potu kategorí zmenšenému o jednu (k - 1). Je to poet etností ve skupnách, které potebujeme znát, abychom znal celý výsledek. Poet pípad v poslední kategor mžeme dopoítat ze znalost pedcházejících k-1 kategorí a celkového potu pozorování (ten je v testech považován za fxní). Vím-l, že z osmdesát jednc bylo sedmdesát ervenokvtých, znám výsledek celého pokusu. Krtcké hodnoty najdeme ve statstckých tabulkách (vz tabulka kaptola -c); dnes jsou tyto hodnoty ve vtšn statstckých program, takže se bžný užvatel jž s tabulkam vtšnou nesetká. Získaná hodnota 6.66 je vtší než krtcká hodnota χ 0.05,1, (tj. p 5% hladn významnost a jednom stupn volnost), jejíž hodnota je Zamítáme tedy nulovou hypotézu na ptprocentní hladn významnost. Závr by tedy znl: Pozorovaná data se významn (sgnfkantn) na 5%-ní hladn významnost lší od etností, pedpokládaných jednoduchou mendelovskou ddností. V našem pípad by odlšnost byla prkazná na 1%-ní hladn významnost. Pozor: v testu užíváme pímo napozorované etnost. Nelze pevést nejprve údaje na procenta a potom poítat s procenty!!! Píklad: V jeskyn je velké množství netopýr (pro nás jch je nekonen mnoho), samc a samce. Chc zjstt, zda je pomr samc a samc 1:1. Nejsem ale schopen prohlédnout všechny netopýry v jeskyn. Chytím jch tedy 100 a podle nch se snažím rozhodnout. Onch 100 ndvduí musí být náhodným výbrem! Nulová hypotéza zní: V jeskyn je stejn samc jako samc (což je totéž jako: pravdpodobnost, že náhodn vybrané ndvduum je samec, je stejná, jako že náhodn vybrané ndvduum je samce). Exstují dv možnost, jak je tomu ve skutenost: 1. V jeskyn je stejn samc jako samc, ob pravdpodobnost jsou tedy 0.5. To znamená, že nulová hypotéza platí (je pravdvá). Výsledek pokusu mže být dvojí: 4

3 1a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < Nemohu zamítnout nulovou hypotézu. Správné rozhodnutí. 1b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > Zamítám nulovou hypotézu na 5%-ní hladn významnost. Udlal jsem chybu prvního druhu - Type I error. Pravdpodobnost této chyby známe: je to α. Hladna významnost α je tedy podmínná pravdpodobnost zamítnutí nulové hypotézy za pedpokladu, že nulová hypotéza platí.. Samc tvoí 60% ndvduí, náhodn vybrané ndvduum bude samec s pravdpodobností 0.6; samce s pravdpodobností 0.4. Nulová hypotéza tedy neplatí - je nepravdvá. Výsledek pokusu mže být opt dvojí: a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < Nemohu zamítnout nulovou hypotézu. Dopustl jsem se chyby druhého druhu. Její pravdpodobnost oznaujeme jako β a vtšnou j neznáme. 1 - β je síla testu (power of the test). Obecn platí, že síla testu roste s odchylkou od nulové hypotézy a s potem pozorování. Dále platí, že ím menší je α, tím vtší je β. Protože β neznáme, je správná formulace výsledku: Na základ dat nemžeme zamítnout nulovou hypotézu. Formulace: Dokázal jsme nulovou hypotézu je nesprávná! b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > Zamítám nulovou hypotézu na 5%-ní hladn významnost. Správné rozhodnutí. Máme tedy dv možnost, jaká je realta (nulová hypotéza bu platí nebo neplatí) a naše rozhodnutí mže být také dvojí (nulovou hypotézu zamítám, nebo nezamítám). Celý proces je zvykem lustrovat tabulkou: Skutenost Je-l H 0 pravdvá Je-l H 0 nepravdvá Naše H 0 jsme zamítl Chyba 1. druhu Správné rozhodnutí rozhodnutí H 0 jsme nezamítl Správné rozhodnutí Chyba. druhu Tab. Kaptola -A Chyba 1. a. druhu p statstckém rozhodování Chyba prvního druhého druhu jsou vlastní statstckému rozhodování a vyplývají ze stochastckého (náhodného) charakteru studovaných proces; nelze je tedy žádným zpsobem z našeho rozhodování zcela elmnovat. ím menší pravdpodobnost chyby prvního druhu jsme ochotn ppustt, tím vtší máme pravdpodobnost chyby druhého druhu. Pedstavme s v píkladu netopýr, že jsme ochotn pjmout pravdpodobnost chyby prvního druhu pouze Krtcká hodnota testu je Co je toho dsledkem? V pípad 1b jsem se díky písnost krtera nedopustl chyby prvního druhu; naprot tomu jsem se v pípad b dopustl chyby druhého druhu. Za lepší ochranu ped chybou prvního druhu platím vtší pravdpodobností chyby druhého druhu. Na tomto píklad však lze demonstrovat nebezpeí jných chyb, které sce nejsou vlastní statstce, ale p aplkac statstckých metod na bologcké problémy se jm vtšnou také nevyhneme. Onch 100 ndvduí pokládáme za náhodný výbr. Ncmén, abychom opravdu mohl provést náhodný výbr, musel bychom všechna ndvdua oíslovat a potom podle tabulky náhodných ísel vybrat 100 ndvduí - to 5

4 logcky není možné. Za náhodný výbr obvykle považujeme ta ndvdua, která se nám podaí získat. Pedpokládejme, že sbíráme netopýry v zm, když vsí ze stropu jeskyn. Pokud s nap. samc vybírají pro pezmování pro lovka obtížnj dostupná místa než samce, nebo se samc rychlej probudí a dív nás pokoušou, takže nám jch víc uletí, je pravdpodobné, že v našem výbru bude (statstcky významn) více samc - nepodalo se nám provést náhodný výbr. V prax tedy mže být zamítnutí nulové hypotézy dsledkem tí skuteností: testu. 1. Nulová hypotéza neplatí.. Nulová hypotéza platí, ale dopustl jsme se chyby 1. druhu. 3. Nulová hypotéza platí, ale my jsme nesplnl všechny pedpoklady pro užtí Test a základní vzorec χ k ( f = = 1 f fˆ ˆ) je možno použít pro lbovolný poet kategorí. Následuje píklad (Zar 1984) sledování dvou znak na semenech (semena zelená, žlutá; svraskalá a hladká). Žlutá a hladká se považují za domnantní. Oekávaný pomr je potom 9:3:3:1. V tomto pípad je poet kategorí k = 4, DF (ν) = 3. Bylo sledováno 50 semen. Pozorované etnost fenotyp byly 15, 39, 53, 6. Nulová hypotéza (H 0 ): Sledovaný výbr semen pochází ze základního souboru charakterzovaného pomrem fenotyp žlutých hladkých, žlutých svraskalých, zelených hladkých a zelených svraskalých 9:3:3:1. (Mžeme též formulovat: pravdpodobnost výskytu daných fenotyp jsou v pomru 9:3:3:1.) Alternatva (H A ): Semena pocházejí ze základního souboru, který nemá pomr shora uvedených fenotyp 9:3:3:1. Oekávané etnost spoteme trojlenkou. Nap. oekávaný poet žlutých hladkých semen je 50. (9/16) = žlutá žlutá zelená zelená hladká svraskalá hladká svraskalá n pozorované oekávané Tab. Kaptola -B Píklad užtí χ testu χ = = = Protože 8.97 je vtší než krtcká hodnota pro α=0.05 (ta je 7.815, vz tabulka -3), zamítáme nulovou hypotézu na 5%-ní hladn významnost. Mžeme tedy zamítnout hypotézu, že data odpovídají modelu jednoduché mendelovské ddnost s nezávslým znaky. Z hodnot jednotlvých sítanc vdíme, že nejvýraznjší píspvek 6

5 k vysoké hodnot testovacího krtéra dává poslední kategore (semena zelená, svraskalá). Uveme další píklady užtí tohoto testu: (1.) Vely jsou postupn vpouštny do pokusného prostoru se žlutým, erveným a modrým ter. Sledujeme barvu tere, na který každá vela poprvé usedne. Nulová hypotéza je, že pravdpodobnost usednutí nezávsí na barv tere (tímto zpsobem zjš ujeme, zda se vely vzuáln orentují a zda p této orentac hrají njakou úlohu barvy). Data: bylo vpuštno 100 vel; etnost barev, na které poprvé usedly: žlutá 47, ervená 38, modrá 15. Lze z tchto dat usoudt, že vely nkterou barvu preferovaly? Nulová hypotéza bude znít: Pravdpodobnost usednutí vely na ter nezávsí na barv tere, a oekávané etnost budou 33.3 : 33.3 : Na tomto pokusu mžeme demonstrovat další podmínky použtí tohoto testu: 1. etnost pocházejí z nezávslých pokus. Proto vpouštíme vely do pokusného prostoru po jedné, a zaznamenáváme chování každé vely. Kdybychom vpustl všechny vely do prostoru najednou a spoetl poet, který se usadl na každém ter, mže být (prkazná) odchylka od nulové hypotézy dána tím, že vely poletí spolen jako roj, a spolen usednou na ter, který náhodn vybere jedna z nch, jakás vedoucí roje. P provádní pokusu s musíme být jst, že usednuvší vela nenechá na ter njakou znaku (nap. pachovou), která by umožnla dalším velám se orentovat. Pokud s tím nejsme jst, musíme tere vymovat ped vpuštním každé další vely. Dále je teba zajstt, aby vely nemohl preferovat urtý ter nkolv kvl barv, ale kvl pozc v pokusném prostoru. Proto bychom ve správn provádném pokusu pozce barevných ter náhodn stídal po každé jednotlvé vele.. Ped pokusem jsme ml pevn daný celkový rozsah výbru. Nesprávný (a asto užívaný) postup je takový, kdy po prvních 100 velách zjstíme, zda je výsledek testu prkazný; pokud není, zvtšíme velkost výbru, pdáme dalších 30 vel a proceduru opakujeme, a tak to zkoušíme nkolkrát a sledujeme, zda dostaneme kýžený prkazný výsledek, který nám umožní publkovat zásadní prác o tom, jak se vely orentují podle barvy. Takovýto postup mnohonásobn zvyšuje pravdpodobnost chyby prvního druhu!! (.) Porovnání pomru pohlaví (sex rato) ve skupn s oekávaným pomrem 1:1. Data: Za poslední msíc se v porodnc msta X narodlo 89 chlapc a 99 dvat. Byl pomr prkazn odlšný od oekávaného 1:1? Nulová hypotéza tedy zní: Pravdpodobnost narození chlapce a dvete byla stejná. Oekávané etnost jsou tedy 94:94. Ze statstckého hledska nám nc nebrání testovat nulovou hypotézu, že pravdpodobnost narození chlapce byla dvakrát vtší než pravdpodobnost narození dvete. Potom by ovšem oekávané etnost byly a Tuto hypotézu bychom jst zamítl. Ovšem zamítnutí takové hypotézy je málo zajímavé, nebo není žádný dvod pedpokládat, pro by mla platt. Naprot tomu, pokud bychom zamítl nulovou hypotézu o pomru 1:1, mžeme hledat smysluplná vysvtlení, pro tomu tak je. Obdobn, p testování štpných v pomr v genetce nám ze statstckého hledska nc nebrání testovat nulovou hypotézu, že štpný pomr je nap. 1:17. (Její zamítnutí nám ovšem potvrdí to, co jsme pedem vdl, že štpný pomr 1:17 je zejmý nesmysl.) Pomr 3:1 oekáváme, protože známe zákony mendelovské ddnost, a zárove víme, že exstují mechansmy, které tento pomr narušují. Ty budeme hledat v systémech, kde jsme dokázal odchylku od oekávaného štpného pomru. (Pípadné zamítnutí nulové hypotézy o pomru 3:1 tedy nebudeme považovat za 7

6 argument pro lysenkovskou bolog.) Formulace nulové hypotézy je tedy, stejn jako postavení pokusu plán sledování, vcí nejen statstckou, ale pedevším vcí znalost problému a jeho bologcké podstaty. Nulovou hypotézu formulujeme v matematckých termínech, v uvedených píkladech používáme pravdpodobnost nebo oekávané etnost jev. Vše ostatní je mmostatstcké uvažování. V píkladu s barevným te jst mohu usoudt, že pokud zamítnu nulovou hypotézu o stejné pravdpodobnost usednutí na ter, nezávsející na barv tere, potom vely musí mít schopnost barvy rozlšt. Ncmén hypotéza: vely nejsou schopny rozlšt barvy není nulovou hypotézou statstckého testu. Velkost výbru Tento test je pouze pblžný. Pblížení je velm dobré, pokud je velkost výbru velká; doporuuje se, aby žádná oekávaná etnost nebyla menší než 1 a aby mén než 0% etností bylo menších než 5. Pokud tomu tak není, mžeme nkteré kategore s malým etnostm spojt. Co jsou krtcké hodnoty; dosažená hladna významnost Základem mnoha statstckých test je následující postup. Spoteme testovou statstku, nap. χ, o které víme, jaké má rozdlení v pípad platnost nulové hypotézy. Nap. víme, že testová statstka, která vznkne setením χ = k = 1 ( f fˆ) fˆ = k = 1 (O E) E Vz. Kaptola -B O je pozorovaná etnost (observed), E je oekávaná etnost (expected). má za pedpokladu platnost nulové hypotézy, na jejímž základ jsou oekávané etnost poítány, rozdlení, které jsme schopn charakterzovat dstrbuní funkcí a tuto dstrbuní funkc vyíslt. Toto rozdlení se nazývá, stejn jako testová statstka, χ. Toto rozdlení je spojté; testové krterum poítáme z potu pípad, tedy nutn z dat dskrétních a proto mže testové krterum nabývat pouze urtých hodnot. Proto musí být velkost výbru dostaten velká, aby nespojtost pílš nevadla. Toto rozdlení patí mez tzv. výbrová rozdlení a tvar jeho dstrbuní funkce závsí na potu stup volnost. Protože toto rozdlení je známé, lze spoítat jeho 95%-ní kvantl. Víme, že podle defnce je 95%-ní kvantl hodnota, kterou náhodná promnná pekroí s pravdpodobností Pro shora uvedený test je tedy 95%-ní kvantl rozdlení krtckou hodnotou na 5%-ní hladn významnost (tj. p α = 0.05). Víme, že hodnota krtera je tím vtší, ím je vtší odchylka od nulové hypotézy. Pokud tedy hodnota testového krtera pekroí krtckou hladnu na 5%-ní hladn významnost, mžeme íc, že pokud nulová hypotéza platí, potom pravdpodobnost, že dostaneme výsledek takto nebo více odlšný od nulové hypotézy je menší než 5%. Dnes vtšna statstckých program pímo s hodnotou testové statstky poskytuje také odpovídající hodnotu, kterou nejastj nazývá Probablty, pípadn jenom P, ale také nkdy Sgnfcance level. Je to 1 - hodnota dstrbuní funkce pro spotenou hodnotu testového krtera, což je totéž jak hodnota urtého 8

7 ntegrálu z hustoty pravdpodobnost od spotené hodnoty do +. Na grafu hustoty pravdpodobnost (Chyba! Nenalezen zdroj odkaz.obr. kaptola -a) je to plocha, kterou pokrývá ocas rozdlení od dané hodnoty do nekonena (proto se jm také íká Tal Area Probabltes). Tato hodnota nám udává pímo pravdpodobnost, s jakou dostaneme takto nebo více od nulové hypotézy odlšný výsledek za pedpokladu, že nulová hypotéza platí. Této hodnot se íká dosažená hladna významnost. Pokud je dosažená hladna významnost menší než 0.05, znamená to, že test je prkazný p α = V bologckých láncích se nyní nejastj referuje o výsledcích test následujícím zpsobem (výsledek testu z Chyba! Nenalezen zdroj odkaz.): V pokusu získaný štpný pomr 15:39:53:6 se statstcky významn lšl od pomru pedpokládaného jednoduchou mendelovskou ddností (χ = 8.97, df=3, P<0.05). Pro prezentac vlastních dat je vhodné dodržovat následující: α používáme pro pedem stanovenou hladnu významnost, takže píšeme nap. test je prkazný p α=0.05 ; P (nebo p) používáme pro dosaženou hladnu významnost, takže píšeme P<0.05. Pokud napíšeme P<<0.01, znamená to, že dosažená hladna významnost je výrazn nžší než 0.01; pravdpodobnost chyby prvního druhu je tedy zanedbateln malá. Pokud nám poíta napíše, že P=0, znamená to, že hodnota dosažené hladny významnost je menší než pesnost poítae. Nepšte do lánk P=0, ale nap. P<10-6. Nkdy udáváme pímo dosaženou hladnu významnost. Sdlením P=0.49 naznaujeme, že výsledek testu byl sce prkazný na 5% hladn významnost, ale s odenýma ušma. Podobn sdlení P=0.5 naznauje, že jsme nulovou hypotézu sce nezamítl, ale mnoho nechyblo, aby...uvádní dosažené hladny významnost v publkacích považuj za velm cennou nformac. Obr. Kaptola -A Hustota pravdpodobnost rozdlení χ se dvma stupn volnost. Celá plocha vymezená kvkou a osou x je rovna jedné, velkost tekované plochy odpovídá pravdpodobnost, že promnná nabude hodnotu vtší než 8.. Jestlže jsme dostal hodnotu testového krtera 8., potom velkost tekované plochy odpovídá dosažené hladn významnost testu. Klascká statstka doporuovala strktn postup, kdy nejprve pevn stanovíme hladnu významnost, a poté dostaneme jednoznanou odpov: zamítáme nebo nezamítáme. Dnes se, zvlášt v bologcké prax, prosazuje spíše pístup, kdy prezentujeme dosaženou hladnu významnost a podle ní posuzujeme dvryhodnost výsledku: pokud posuzujeme pomr pohlaví v populac netopýr, s urtou nejstotou 9

8 se smííme, není teba zcela jednoznan rozhodnou ano nebo ne. Naprot tomu prvý zpsob musíme nutn použít tam, kde na základ testu níme rozhodnutí typu ano/ne. Napíklad se rozhoduj, zda zavést výrobu preparátu, který v populac mní pomr pohlaví. Zde s musím pedem stanovt míru rzka, kterou jako výrobce hodlám nést (bude pravdpodobn velm malá, napíklad 0.001), a pokud výsledek pokusu nebude prkazný, výrobu nezavedu. Obdobný postup se užívá u klnckých test p zavádní nových lék. Pílš dobré, aby to byla pravda (Too good to be true) Píklad: Spolenost, vyrábjící nový druh žvýkaky byla obvnna, že pravdelné žvýkání jejích produkt vede u muž ke zvýšené mortalt spermí nesoucích chromosom X (a pak se jm budou rodt pevážn synové). Spolenost najala pokusnou osobu, která dva roky ntenzvn žvýkala její produkty; poté provedla vyšetení jeho spermatu. Ve zveejnné zpráv uvádí, že provedla test na pítomnost chromosomu X v spermí pokusné osoby, a zjstla pítomnost chromosomu X v 5001 pípad, tzn. nepítomnost v 4999 pípadech. Spolenost na základ toho konstatuje, že shoda s oekávaným pomrem 1:1 je dostaten jasná a že tedy její produkty jsou z tohoto hledska zcela neškodné. Co k tomu mžeme íc jako statstc? Odhlédnme nyní od toho, že pozorování nebylo nejlépe naplánováno (eufemsmus, íkající, že bylo naplánováno úpln špatn), chybí kontrola, jedná o vlv na jedného lovka, a pokusme se vyhodnott porovnání pomru spermí s chromosomem k potu spermí s chromosomem Y s oekávaným pomrem 1:1. Použjme χ - test dobré shody. Dostáváme χ = , P= Výsledek testu je tedy neprkazý, ale dosažená hladna významnost se blíží jedné. To je velm podezelé. Co nám to íká? Pedpokládejme, že pomr 1:1 je v základním souboru opravdu zachován. Potom s pravdpodobností více než 98% dostaneme v náhodném výbru spermí vtší odchylku od pomru 1:1, než v našch datech. Nebo jnak: šance, že dostaneme takto dobrou shodu s pomrem 1:1 byla menší než %. Bu tedy mla spolenost z pekla štstí, nebo spíše výsledky zfalšovala tak, jak j vyhovovaly. Jsou pílš dobré na to, aby to mohla být pravda. Uvedený píklad je jst vymyšlený. Ncmén ukazuje na to, jak se dá statstkou objevt falšování dat. Obdobný (statstcky) píklad je ovšem ve svtové vd znám: Vyhodnotíme-l uvedeným postupem výsledky orgnálních Mendelových pokus, zjstíme, že jsou z uvedeného hledska pílš dobré, shoda se štepným pomry je nepravdpodobn dobrá. Mendel sám ovšem o statstce netušl a nkde netvrdí, že se ídl pravdly pro náhodný výbr; naopak, konstatuje, že tam, kde byl výbr malý pdával další ndvdua. Závr, hojn ctovaný v dob, kdy u nás byla genetka nazývána buržoasní pavdou, že prelát Mendel falšoval data, je tedy nesmyslný; pro zájemce doporuuj lánek T. Havránka (1986). Pouení pro nás je ovšem dvojí: když pnášíme zprávu o výsledku pokusu, popšme detaln, jak jsme k datm pšl a p použtí hstorckých dat nemžeme pedpokládat, že data byla sebrána zpsobem odpovídajícím statstckým zásadám. 30

9 Doporuená etba Zar (1984), pp , Sokal-Rohlf (1981), pp , Havránek (1993): testování hypotéz obecn Havránek T. (1986): Gregor Mendel a expermentální data. - Vesmír 65: Tabulka Kaptola -C tabulka krtckých hodnot χ dstrbuce α df

V mnoha pípadech, kdy známe rozdlení náhodné veliiny X, potebujeme urit rozdlení náhodné veliiny Y, která je funkcí X, tzn. Y = h(x).

V mnoha pípadech, kdy známe rozdlení náhodné veliiny X, potebujeme urit rozdlení náhodné veliiny Y, která je funkcí X, tzn. Y = h(x). 3. FUNKCE NÁHODNÉ VELIINY as ke studu: 40 mnut Cíl: Po prostudování této kaptol budete umt transformovat náhodnou velnu na náhodnou velnu Y, je l mez tmto náhodným velnam vzájemn jednoznaný vztah VÝKLAD

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky Analýza dojíždní z dotazníkového šetení v MSK Semestrální projekt 18.1.2007 GN 262 Barbora Hejlková 1 OBSAH OBSAH...2 ZADÁNÍ...3

Více

IV. CVIENÍ ZE STATISTIKY

IV. CVIENÍ ZE STATISTIKY IV. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data kvantitativní povahy. K tomuto budeme opt používat program Excel 2007 MS Office. 1. Jak mžeme analyzovat kvantitativní

Více

2. Posouzení efektivnosti investice do malé vtrné elektrárny

2. Posouzení efektivnosti investice do malé vtrné elektrárny 2. Posouzení efektvnost nvestce do malé vtrné elektrárny Cíle úlohy: Posoudt ekonomckou výhodnost proektu malé vtrné elektrárny pomocí základních metod hodnocení efektvnost nvestních proekt ako sou metoda

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Cykly Intermezzo. FOR cyklus

Cykly Intermezzo. FOR cyklus Cykly Intermezzo Rozhodl jsem se zaadit do série nkolika lánk o základech programování v Delphi/Pascalu malou vsuvku, která nám pomže pochopit principy a zásady pi používání tzv. cykl. Mnoho ástí i jednoduchých

Více

1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST

1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST 1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST Kombinatorické pravidlo o souinu Poet všech uspoádaných k-tic, jejichž první len lze vybrat n 1 zpsoby, druhý len po výbru prvního lenu n 2 zpsoby atd. až k-tý

Více

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x) NÁHODNÁ VELIINA Náhodná veliina je veliina, jejíž hodnota je jednoznan urena výsledkem náhodného pokusu (je-li tento výsledek dán reálným íslem). Jde o reálnou funkci definovanou na základním prostoru

Více

Metodický pokyn pro urení optimální velikosti fakturaního vodomru a profilu vodovodní pípojky.

Metodický pokyn pro urení optimální velikosti fakturaního vodomru a profilu vodovodní pípojky. Metodcký pokyn pro urení optální velkost fakturaního vodoru a proflu vodovodní pípojky. Ureno: Vodoprávní úad K využtí : Vlastník a provozovatel vodovod a odbratel ptné vody Mnsterstvo zedlství.j.: 0 535/00-6000

Více

Energie elektrického pole

Energie elektrického pole Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

PRVKY KOVOVÝCH KONSTRUKCÍ

PRVKY KOVOVÝCH KONSTRUKCÍ VYSOKÉ UEÍ TECHICKÉ V BR FAKULTA STAVEBÍ PROF. IG. JIDICH MELCHER, DrSc. DOC. IG. MIROSLAV BAJER, CSc. PRVKY KOVOVÝCH KOSTRUKCÍ MODUL BO02-M07 AVRHOVÁÍ OCELOVÝCH KOSTRUKCÍ A MEZÍ STAV ÚAVY STUDIJÍ OPORY

Více

9. Kombinatorika, pravd podobnost a statistika

9. Kombinatorika, pravd podobnost a statistika 9. Kombinatorika, pravdpodobnost a statistika VÝCHOZÍ TEXT K ÚLOZE 1 V kódu je na prvním míst jedno z písmen A, B, C nebo D. Na dalších dvou pozicích je libovolné dvojciferné íslo od 11 do 45. (Existují

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy

Více

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B. Ing. Martna Ltschmannová Statsta I., cvení ANOVA Rozšíením dvouvýbrových test pro stední hodnoty je analýza rozptylu nebol ANOVA, terá umožuje srovnávat nol stedních hodnot nezávslých náhodných výbr. Analýza

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

v cenových hladinách. 2

v cenových hladinách. 2 roblematka reálné konvergence Reálná konvergence vmezuje sblžování ekonomcké úrovn dané zem s vbraným ukazatel vsplých zemí, nebo s jejch například ekonomckým uskupením. ato metoda je založena na konvergenc

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt 2 ELEMENTÁRNÍ OET RAVDODOBNOSTI as ke studu kaptoly: 70 mnut Cíl: o prostudování této kaptoly budete umt charakterzovat teor pravdpodobnost a matematckou statstku vysvtlt základní pojmy teore pravdpodobnost

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Informace pro autory píspvk na konferenci ICTM 2007

Informace pro autory píspvk na konferenci ICTM 2007 Informace pro autory píspvk na konferenci ICTM 2007 Pokyny pro obsahové a grafické zpracování píspvk Strana 1 z 5 Obsah dokumentu: 1. ÚVODNÍ INFORMACE... 3 2. POKYNY PRO ZPRACOVÁNÍ REFERÁTU... 3 2.1. OBSAHOVÉ

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Statistická analýza volebních výsledk

Statistická analýza volebních výsledk Statistická analýza volebních výsledk Volby do PSP R 2006 Josef Myslín 1 Obsah 1 Obsah...2 2 Úvod...3 1 Zdrojová data...4 1.1 Procentuální podpora jednotlivých parlamentních stran...4 1.2 Údaje o nezamstnanosti...4

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více

III. CVIENÍ ZE STATISTIKY

III. CVIENÍ ZE STATISTIKY III. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data pomocí chí-kvadrát testu, korelaní a regresní analýzy. K tomuto budeme používat program Excel 2007 MS Office,

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Podílový fond PLUS. komplexní zabezpeení na penzi

Podílový fond PLUS. komplexní zabezpeení na penzi Podílový fond PLUS komplexní zabezpeení na penzi Aleš Poklop, generálníeditel Penzijního fondu eské spoitelny Martin Burda, generálníeditel Investiní spolenosti eské spoitelny Praha 29. ervna 2010 R potebuje

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

MECHANIKA I. Jaromír Švígler

MECHANIKA I. Jaromír Švígler MECHNIK I Jaomí Švígle OBSH Pedmluva Rozdlení a základní pojm mechank 4 Statka Základní pojm a aom statk Síla Moment síl k bodu a k ose Slová dvojce Základní vta statk Páce a výkon síl a momentu 5 Slové

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Lepení plexi v bonici pružnými lepidly

Lepení plexi v bonici pružnými lepidly Lepení plexi v bonici pružnými lepidly Dnes si mžete prohlédnout jednoduchý návod jak pilepit plexi do vyezané bonice. Samozejm možností lepení je mnoho, dnes se však podíváme na lepení pružnými lepidly.

Více

7.1. Podstata testu statistické hypotézy

7.1. Podstata testu statistické hypotézy 7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU. Obchodní zákoník 5:

METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU. Obchodní zákoník 5: METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU Obchodní zákoník 5: soubor hmotných, jakož i osobních a nehmotných složek podnikání. K podniku náleží vci, práva a jiné majetkové hodnoty, které patí podnikateli

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC 25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc

Více

EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA )

EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA ) PRACOVNÍ PEKLAD PRO POTEBY BA 01/08/2005 EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA ) Tato Úmluva byla sjednána mezi Evropskými

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt

2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt 2 ELEMENTÁRNÍ OET RAVDODOBNOSTI as ke studiu kapitoly: 70 minut Cíl: o prostudování této kapitoly budete umt charakterizovat teorii pravdpodobnosti a matematickou statistiku vysvtlit základní pojmy teorie

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Pednáška mikro 07 : Teorie chování spotebitele 2

Pednáška mikro 07 : Teorie chování spotebitele 2 Pednáška mikro 07 : Teorie chování spotebitele 2 1. ngelova kivka x poptávka po statku, M- dchod x luxusní komodita ( w >1) standardní komodita (0< w 1) podadná komodita ( w < 0) 2. Dchodový a substituní

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz 6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Přednáška č. 11 Analýza rozptylu při dvojném třídění Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané

Více

Spojité regulátory - 1 -

Spojité regulátory - 1 - Spojté regulátory - 1 - SPOJIÉ EGULÁOY Nespojté regulátory mají většnou jednoduchou konstrukc a jsou levné, ale jsou nevhodné tím, že neudržují regulovanou velčnu přesně na žádané hodnotě, neboť regulovaná

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM

NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM Vysoká škola zdravotnická, o. p. s. Praha 5 NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM NELA VILHELMOVÁ Praha 2009 PEDMLUVA Nikotinismus je stále aktuálnjším tématem nabývajícím na dležitosti, zárove s rostoucím

Více

Soudní exekutor JUDr. Vít Novozámský Bratislavská 40/ Brno k.j. 056 EX 9379/10-46

Soudní exekutor JUDr. Vít Novozámský Bratislavská 40/ Brno k.j. 056 EX 9379/10-46 ZNALECKÝ POSUDEK. 3158-87/12 o cen nemovitostí - pozemk p.. 6946/8, 6946/10, 6946/22, 6946/23 a 6946/24, k.ú. Domašov u Jeseníka, obec Blá pod Praddem, okres Jeseník, kraj Olomoucký. Objednatel: Exekutorský

Více

Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu.

Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu. Datový objekt [citováno z http://wraith.iglu.cz/python/index.php] Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu. Identita Identita datového objektu je jedinený a

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

2.1 Pokyny k otev eným úlohám. 2.2 Pokyny k uzav eným úlohám. Testový sešit neotvírejte, po kejte na pokyn!

2.1 Pokyny k otev eným úlohám. 2.2 Pokyny k uzav eným úlohám. Testový sešit neotvírejte, po kejte na pokyn! MATEMATIKA základní úrove obtížnosti DIDAKTICKÝ TEST Maximální bodové hodnocení: 50 bod Hranice úspšnosti: 33 % Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. asový limit pro ešení

Více

Testování statistických hypotéz

Testování statistických hypotéz Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Bezpenost dtí v okolí škol z pohledu bezpenostního auditora

Bezpenost dtí v okolí škol z pohledu bezpenostního auditora Bezpenost dtí v okolí škol z pohledu bezpenostního auditora Ing. Jaroslav Heinich, HBH Projekt spol. s r.o. pednáška na konferenci Bezpenos dopravy na pozemných komunikáciách 2008 ve Vyhne (SK) ÚVOD Bezpenostní

Více

L I C H O B Ž N Í K (2 HODINY) ? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky:

L I C H O B Ž N Í K (2 HODINY) ? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky: L I C H O B Ž N Í K (2 HODINY)? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky: Na obrázcích je vyobrazena hospodáská budova a židlika, kterou urit mají tvoji rodie na chodb nebo

Více

Promnné. [citováno z

Promnné. [citováno z Promnné [citováno z http://wraith.iglu.cz/python/index.php] Abychom s datovým objektem mohli v programu njak rozumn pracovat, potebujeme se na nj njakým zpsobem odkázat. Potebujeme Pythonu íct, aby napíklad

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

STATISTICKÉ HYPOTÉZY

STATISTICKÉ HYPOTÉZY STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude

Více

= = 25

= = 25 Seznámení s Pythagorovou vtou (1 hodina) Opakování: zopakuj si poítání s druhými moninami ísla Motivae: Jsem leteký modelá. Práv jsem si ve své díln sestrojil model letadla a hybí mi pipevnit poslední

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 3. prosince 2018 Úvod do testování hypotéz Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Statistické ízení finanních tok

Statistické ízení finanních tok Statistické ízení finanních tok OBUST 3.. - 7..006 Fakulta strojní VUT v Praze, Ústav technické matematiky Eliška Cézová eliska_c@email.cz Úvod Statistické ízení finanních tok znamená ízení penžních prostedk

Více