Kapitola 2 - Testování hypotéz. Testy dobré shody
|
|
- Michal Jelínek
- před 9 lety
- Počet zobrazení:
Transkript
1 Kaptola - Testování hypotéz. Testy dobré shody Dva základní statstcké postupy jsou odhad parametr a testování hypotéz. V mnulé kaptole jsme s ukázal, jak odhadujeme charakterstky základního souboru, v této kaptole probereme základy testování hypotéz (hypothess testng). Mez základní pouky metodologe vdy patí, že shoda dat s hypotézou ješt neznamená, že hypotéza je pravdvá; naprot tomu data odporující hypotéze ukazují na to, že hypotéza pravdvá není. Hypotézu nelze na základ dat dokázat; hypotézu však lze na základ dat vyvrátt. z toho vychází statstcké testování hypotéz. Ukážeme s jej na píklad vyhodnocení nomnálních dat; ne proto, že by se pro jné typy dat neužívalo, ale proto, že je na nomnálních datech nejsnáze pochoptelné. Postup je následující: Formuluj nulovou hypotézu. Nulová hypotéza je formulována tak, aby j mohla data vyvrátt v pípad, že není pravdvá. Vtšnou to tedy bývá opak toho, co chc dokázat. Nulová hypotéza (null hypothess, H 0 ) je vtšnou formulována jako: nco se nelší; není dference; není závslost; platí zákon atd. Poté se snažím dokázat, že urtá data nejsou slutelná (jsou v rozporu) s touto nulovou hypotézou. Pokud to dokáž, zamítám nulovou hypotézu a pjímám alternatvní hypotézu H A, nkdy též H 1, která je negací nulové hypotézy. Píklad: Studuj ddnost rostlny a ptám se, zda zde platí pro barvu kvt jednoduchá mendelovská ddnost. Pedpokládám, že v F 1 generac bude pomr potu ervenokvtých k blokvtým 3:1. Mám 80 potomk. Potom pedpokládám, že v potomstvu bude 60 ervenokvtých a 0 blokvtých jednc. Já však mám 10 blokvtých a 70 ervenokvtých. Jsou moje výsledky v rozporu s pomrem 3:1, tzn. s tím, že každé ndvduum má pravdpodobnost 0.75 být ervenokvté a 0.5 být blokvté? I v pípad, že pravdpodobnost jsou 0.75 a 0.5, mohu s urtou pravdpodobností dostat výsledný pomr 70:10. Dokonce mohu dostat všech 80 ervenokvtých (s pravdpodobností , což je ádov ). V takovém pípad ovšem nebudu ochoten vt, že šlo pouze o náhodu, a dojdu k názoru, že nulová hypotéza neplatí (zamítnu j). Nulovou hypotézu zamítám, pokud dostanu uspoádání dat, které je za pedpokladu platnost nulové hypotézy velm nepravdpodobné. Co to ale je, velm nepravdpodobné? Statstka nám k tomu poskytuje následující návod: Zvol s, jak nepravdpodobný výsledek za pedpokladu platnost nulové musíš dostat, abys ses rozhodl pro závr, že nulová hypotéza neplatí. Vtšnou se rozhodujeme pro 5% nebo 1%. Této hodnot íkáme hladna významnost testu a znaíme j α; bývá zvykem j vyjadovat desetnným íslem, nap. α=0.05. Potom spot testové krterum (nkdy tuto hodnotu nazýváme testová statstka; zde je další význam termínu statstka). Pro toto krterum je známo, jaké má rozdlení v pípad platnost nulové hypotézy. Je tedy známo, kterou hodnotu pekroí s pravdpodobností 5%, kterou hodnotu pekroí s pravdpodobností 1% atd. Tmto hodnotám íkáme krtcké hodnoty. Jestlže hodnota testového krtera pekroí krtckou hodnotu pro zvolenou hladnu významnost, zamítn nulovou hypotézu na dané hladn významnost. íkáme potom, že výsledek (nesouhlas s nulovou hypotézou) je sgnfkantní na dané hladn významnost. Pro kategorální data používáme testy dobré shody (goodness of ft) a používáme krtéra (statstky) χ, t 3
2 chí-kvadrát, angl. ch-square, t kaj (píšern psobí bžn používaná esko-anglcká sms, vyslovovaná chí-skvér ): χ = k = 1 ( f fˆ) fˆ Vz. Kaptola -A k je celkový poet kategorí, které sleduj (v našem píklad ), fˆ je oekávaná etnost v -té kategor (asto se také znaí E, z anglckého Expected, f je etnost skutená (pozorovaná, nkdy též O, Observed). V našem pípad tedy formuluj nulovou hypotézu: v F 1 generac je pomr pravdpodobností výskytu ervenokvtých k blokvtým 3:1; v 80-tlenném potomstvu tedy pedpokládám 60 a 0 ndvduí. ( 70 60) ( 10 0) 60 0 χ = + = Tuto hodnotu porovnávám s tabulkovou hodnotou krtckých hodnot χ pro danou hladnu významnost α (vtšnou volíme 0.05 nebo 0.01) a daný poet stup volnost. Stupn volnost, (degrees of freedom; srovnej se zvoláním bojovník za práva ernoch, vloženým do sprtuálu: Oh, Freedom), znaíme je vtšnou d.f., DF nebo ν (= ný ). Pro testy tohoto typu je poet stup volnost roven potu kategorí zmenšenému o jednu (k - 1). Je to poet etností ve skupnách, které potebujeme znát, abychom znal celý výsledek. Poet pípad v poslední kategor mžeme dopoítat ze znalost pedcházejících k-1 kategorí a celkového potu pozorování (ten je v testech považován za fxní). Vím-l, že z osmdesát jednc bylo sedmdesát ervenokvtých, znám výsledek celého pokusu. Krtcké hodnoty najdeme ve statstckých tabulkách (vz tabulka kaptola -c); dnes jsou tyto hodnoty ve vtšn statstckých program, takže se bžný užvatel jž s tabulkam vtšnou nesetká. Získaná hodnota 6.66 je vtší než krtcká hodnota χ 0.05,1, (tj. p 5% hladn významnost a jednom stupn volnost), jejíž hodnota je Zamítáme tedy nulovou hypotézu na ptprocentní hladn významnost. Závr by tedy znl: Pozorovaná data se významn (sgnfkantn) na 5%-ní hladn významnost lší od etností, pedpokládaných jednoduchou mendelovskou ddností. V našem pípad by odlšnost byla prkazná na 1%-ní hladn významnost. Pozor: v testu užíváme pímo napozorované etnost. Nelze pevést nejprve údaje na procenta a potom poítat s procenty!!! Píklad: V jeskyn je velké množství netopýr (pro nás jch je nekonen mnoho), samc a samce. Chc zjstt, zda je pomr samc a samc 1:1. Nejsem ale schopen prohlédnout všechny netopýry v jeskyn. Chytím jch tedy 100 a podle nch se snažím rozhodnout. Onch 100 ndvduí musí být náhodným výbrem! Nulová hypotéza zní: V jeskyn je stejn samc jako samc (což je totéž jako: pravdpodobnost, že náhodn vybrané ndvduum je samec, je stejná, jako že náhodn vybrané ndvduum je samce). Exstují dv možnost, jak je tomu ve skutenost: 1. V jeskyn je stejn samc jako samc, ob pravdpodobnost jsou tedy 0.5. To znamená, že nulová hypotéza platí (je pravdvá). Výsledek pokusu mže být dvojí: 4
3 1a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < Nemohu zamítnout nulovou hypotézu. Správné rozhodnutí. 1b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > Zamítám nulovou hypotézu na 5%-ní hladn významnost. Udlal jsem chybu prvního druhu - Type I error. Pravdpodobnost této chyby známe: je to α. Hladna významnost α je tedy podmínná pravdpodobnost zamítnutí nulové hypotézy za pedpokladu, že nulová hypotéza platí.. Samc tvoí 60% ndvduí, náhodn vybrané ndvduum bude samec s pravdpodobností 0.6; samce s pravdpodobností 0.4. Nulová hypotéza tedy neplatí - je nepravdvá. Výsledek pokusu mže být opt dvojí: a) nap. 55 samc; 45 samc. Potom χ =(55-50) /50+(45-50) /50 = 1.0 < Nemohu zamítnout nulovou hypotézu. Dopustl jsem se chyby druhého druhu. Její pravdpodobnost oznaujeme jako β a vtšnou j neznáme. 1 - β je síla testu (power of the test). Obecn platí, že síla testu roste s odchylkou od nulové hypotézy a s potem pozorování. Dále platí, že ím menší je α, tím vtší je β. Protože β neznáme, je správná formulace výsledku: Na základ dat nemžeme zamítnout nulovou hypotézu. Formulace: Dokázal jsme nulovou hypotézu je nesprávná! b) nap. 60 samc; 40 samc. Potom χ =(60-50) /50+(40-50) /50 = 4.0 > Zamítám nulovou hypotézu na 5%-ní hladn významnost. Správné rozhodnutí. Máme tedy dv možnost, jaká je realta (nulová hypotéza bu platí nebo neplatí) a naše rozhodnutí mže být také dvojí (nulovou hypotézu zamítám, nebo nezamítám). Celý proces je zvykem lustrovat tabulkou: Skutenost Je-l H 0 pravdvá Je-l H 0 nepravdvá Naše H 0 jsme zamítl Chyba 1. druhu Správné rozhodnutí rozhodnutí H 0 jsme nezamítl Správné rozhodnutí Chyba. druhu Tab. Kaptola -A Chyba 1. a. druhu p statstckém rozhodování Chyba prvního druhého druhu jsou vlastní statstckému rozhodování a vyplývají ze stochastckého (náhodného) charakteru studovaných proces; nelze je tedy žádným zpsobem z našeho rozhodování zcela elmnovat. ím menší pravdpodobnost chyby prvního druhu jsme ochotn ppustt, tím vtší máme pravdpodobnost chyby druhého druhu. Pedstavme s v píkladu netopýr, že jsme ochotn pjmout pravdpodobnost chyby prvního druhu pouze Krtcká hodnota testu je Co je toho dsledkem? V pípad 1b jsem se díky písnost krtera nedopustl chyby prvního druhu; naprot tomu jsem se v pípad b dopustl chyby druhého druhu. Za lepší ochranu ped chybou prvního druhu platím vtší pravdpodobností chyby druhého druhu. Na tomto píklad však lze demonstrovat nebezpeí jných chyb, které sce nejsou vlastní statstce, ale p aplkac statstckých metod na bologcké problémy se jm vtšnou také nevyhneme. Onch 100 ndvduí pokládáme za náhodný výbr. Ncmén, abychom opravdu mohl provést náhodný výbr, musel bychom všechna ndvdua oíslovat a potom podle tabulky náhodných ísel vybrat 100 ndvduí - to 5
4 logcky není možné. Za náhodný výbr obvykle považujeme ta ndvdua, která se nám podaí získat. Pedpokládejme, že sbíráme netopýry v zm, když vsí ze stropu jeskyn. Pokud s nap. samc vybírají pro pezmování pro lovka obtížnj dostupná místa než samce, nebo se samc rychlej probudí a dív nás pokoušou, takže nám jch víc uletí, je pravdpodobné, že v našem výbru bude (statstcky významn) více samc - nepodalo se nám provést náhodný výbr. V prax tedy mže být zamítnutí nulové hypotézy dsledkem tí skuteností: testu. 1. Nulová hypotéza neplatí.. Nulová hypotéza platí, ale dopustl jsme se chyby 1. druhu. 3. Nulová hypotéza platí, ale my jsme nesplnl všechny pedpoklady pro užtí Test a základní vzorec χ k ( f = = 1 f fˆ ˆ) je možno použít pro lbovolný poet kategorí. Následuje píklad (Zar 1984) sledování dvou znak na semenech (semena zelená, žlutá; svraskalá a hladká). Žlutá a hladká se považují za domnantní. Oekávaný pomr je potom 9:3:3:1. V tomto pípad je poet kategorí k = 4, DF (ν) = 3. Bylo sledováno 50 semen. Pozorované etnost fenotyp byly 15, 39, 53, 6. Nulová hypotéza (H 0 ): Sledovaný výbr semen pochází ze základního souboru charakterzovaného pomrem fenotyp žlutých hladkých, žlutých svraskalých, zelených hladkých a zelených svraskalých 9:3:3:1. (Mžeme též formulovat: pravdpodobnost výskytu daných fenotyp jsou v pomru 9:3:3:1.) Alternatva (H A ): Semena pocházejí ze základního souboru, který nemá pomr shora uvedených fenotyp 9:3:3:1. Oekávané etnost spoteme trojlenkou. Nap. oekávaný poet žlutých hladkých semen je 50. (9/16) = žlutá žlutá zelená zelená hladká svraskalá hladká svraskalá n pozorované oekávané Tab. Kaptola -B Píklad užtí χ testu χ = = = Protože 8.97 je vtší než krtcká hodnota pro α=0.05 (ta je 7.815, vz tabulka -3), zamítáme nulovou hypotézu na 5%-ní hladn významnost. Mžeme tedy zamítnout hypotézu, že data odpovídají modelu jednoduché mendelovské ddnost s nezávslým znaky. Z hodnot jednotlvých sítanc vdíme, že nejvýraznjší píspvek 6
5 k vysoké hodnot testovacího krtéra dává poslední kategore (semena zelená, svraskalá). Uveme další píklady užtí tohoto testu: (1.) Vely jsou postupn vpouštny do pokusného prostoru se žlutým, erveným a modrým ter. Sledujeme barvu tere, na který každá vela poprvé usedne. Nulová hypotéza je, že pravdpodobnost usednutí nezávsí na barv tere (tímto zpsobem zjš ujeme, zda se vely vzuáln orentují a zda p této orentac hrají njakou úlohu barvy). Data: bylo vpuštno 100 vel; etnost barev, na které poprvé usedly: žlutá 47, ervená 38, modrá 15. Lze z tchto dat usoudt, že vely nkterou barvu preferovaly? Nulová hypotéza bude znít: Pravdpodobnost usednutí vely na ter nezávsí na barv tere, a oekávané etnost budou 33.3 : 33.3 : Na tomto pokusu mžeme demonstrovat další podmínky použtí tohoto testu: 1. etnost pocházejí z nezávslých pokus. Proto vpouštíme vely do pokusného prostoru po jedné, a zaznamenáváme chování každé vely. Kdybychom vpustl všechny vely do prostoru najednou a spoetl poet, který se usadl na každém ter, mže být (prkazná) odchylka od nulové hypotézy dána tím, že vely poletí spolen jako roj, a spolen usednou na ter, který náhodn vybere jedna z nch, jakás vedoucí roje. P provádní pokusu s musíme být jst, že usednuvší vela nenechá na ter njakou znaku (nap. pachovou), která by umožnla dalším velám se orentovat. Pokud s tím nejsme jst, musíme tere vymovat ped vpuštním každé další vely. Dále je teba zajstt, aby vely nemohl preferovat urtý ter nkolv kvl barv, ale kvl pozc v pokusném prostoru. Proto bychom ve správn provádném pokusu pozce barevných ter náhodn stídal po každé jednotlvé vele.. Ped pokusem jsme ml pevn daný celkový rozsah výbru. Nesprávný (a asto užívaný) postup je takový, kdy po prvních 100 velách zjstíme, zda je výsledek testu prkazný; pokud není, zvtšíme velkost výbru, pdáme dalších 30 vel a proceduru opakujeme, a tak to zkoušíme nkolkrát a sledujeme, zda dostaneme kýžený prkazný výsledek, který nám umožní publkovat zásadní prác o tom, jak se vely orentují podle barvy. Takovýto postup mnohonásobn zvyšuje pravdpodobnost chyby prvního druhu!! (.) Porovnání pomru pohlaví (sex rato) ve skupn s oekávaným pomrem 1:1. Data: Za poslední msíc se v porodnc msta X narodlo 89 chlapc a 99 dvat. Byl pomr prkazn odlšný od oekávaného 1:1? Nulová hypotéza tedy zní: Pravdpodobnost narození chlapce a dvete byla stejná. Oekávané etnost jsou tedy 94:94. Ze statstckého hledska nám nc nebrání testovat nulovou hypotézu, že pravdpodobnost narození chlapce byla dvakrát vtší než pravdpodobnost narození dvete. Potom by ovšem oekávané etnost byly a Tuto hypotézu bychom jst zamítl. Ovšem zamítnutí takové hypotézy je málo zajímavé, nebo není žádný dvod pedpokládat, pro by mla platt. Naprot tomu, pokud bychom zamítl nulovou hypotézu o pomru 1:1, mžeme hledat smysluplná vysvtlení, pro tomu tak je. Obdobn, p testování štpných v pomr v genetce nám ze statstckého hledska nc nebrání testovat nulovou hypotézu, že štpný pomr je nap. 1:17. (Její zamítnutí nám ovšem potvrdí to, co jsme pedem vdl, že štpný pomr 1:17 je zejmý nesmysl.) Pomr 3:1 oekáváme, protože známe zákony mendelovské ddnost, a zárove víme, že exstují mechansmy, které tento pomr narušují. Ty budeme hledat v systémech, kde jsme dokázal odchylku od oekávaného štpného pomru. (Pípadné zamítnutí nulové hypotézy o pomru 3:1 tedy nebudeme považovat za 7
6 argument pro lysenkovskou bolog.) Formulace nulové hypotézy je tedy, stejn jako postavení pokusu plán sledování, vcí nejen statstckou, ale pedevším vcí znalost problému a jeho bologcké podstaty. Nulovou hypotézu formulujeme v matematckých termínech, v uvedených píkladech používáme pravdpodobnost nebo oekávané etnost jev. Vše ostatní je mmostatstcké uvažování. V píkladu s barevným te jst mohu usoudt, že pokud zamítnu nulovou hypotézu o stejné pravdpodobnost usednutí na ter, nezávsející na barv tere, potom vely musí mít schopnost barvy rozlšt. Ncmén hypotéza: vely nejsou schopny rozlšt barvy není nulovou hypotézou statstckého testu. Velkost výbru Tento test je pouze pblžný. Pblížení je velm dobré, pokud je velkost výbru velká; doporuuje se, aby žádná oekávaná etnost nebyla menší než 1 a aby mén než 0% etností bylo menších než 5. Pokud tomu tak není, mžeme nkteré kategore s malým etnostm spojt. Co jsou krtcké hodnoty; dosažená hladna významnost Základem mnoha statstckých test je následující postup. Spoteme testovou statstku, nap. χ, o které víme, jaké má rozdlení v pípad platnost nulové hypotézy. Nap. víme, že testová statstka, která vznkne setením χ = k = 1 ( f fˆ) fˆ = k = 1 (O E) E Vz. Kaptola -B O je pozorovaná etnost (observed), E je oekávaná etnost (expected). má za pedpokladu platnost nulové hypotézy, na jejímž základ jsou oekávané etnost poítány, rozdlení, které jsme schopn charakterzovat dstrbuní funkcí a tuto dstrbuní funkc vyíslt. Toto rozdlení se nazývá, stejn jako testová statstka, χ. Toto rozdlení je spojté; testové krterum poítáme z potu pípad, tedy nutn z dat dskrétních a proto mže testové krterum nabývat pouze urtých hodnot. Proto musí být velkost výbru dostaten velká, aby nespojtost pílš nevadla. Toto rozdlení patí mez tzv. výbrová rozdlení a tvar jeho dstrbuní funkce závsí na potu stup volnost. Protože toto rozdlení je známé, lze spoítat jeho 95%-ní kvantl. Víme, že podle defnce je 95%-ní kvantl hodnota, kterou náhodná promnná pekroí s pravdpodobností Pro shora uvedený test je tedy 95%-ní kvantl rozdlení krtckou hodnotou na 5%-ní hladn významnost (tj. p α = 0.05). Víme, že hodnota krtera je tím vtší, ím je vtší odchylka od nulové hypotézy. Pokud tedy hodnota testového krtera pekroí krtckou hladnu na 5%-ní hladn významnost, mžeme íc, že pokud nulová hypotéza platí, potom pravdpodobnost, že dostaneme výsledek takto nebo více odlšný od nulové hypotézy je menší než 5%. Dnes vtšna statstckých program pímo s hodnotou testové statstky poskytuje také odpovídající hodnotu, kterou nejastj nazývá Probablty, pípadn jenom P, ale také nkdy Sgnfcance level. Je to 1 - hodnota dstrbuní funkce pro spotenou hodnotu testového krtera, což je totéž jak hodnota urtého 8
7 ntegrálu z hustoty pravdpodobnost od spotené hodnoty do +. Na grafu hustoty pravdpodobnost (Chyba! Nenalezen zdroj odkaz.obr. kaptola -a) je to plocha, kterou pokrývá ocas rozdlení od dané hodnoty do nekonena (proto se jm také íká Tal Area Probabltes). Tato hodnota nám udává pímo pravdpodobnost, s jakou dostaneme takto nebo více od nulové hypotézy odlšný výsledek za pedpokladu, že nulová hypotéza platí. Této hodnot se íká dosažená hladna významnost. Pokud je dosažená hladna významnost menší než 0.05, znamená to, že test je prkazný p α = V bologckých láncích se nyní nejastj referuje o výsledcích test následujícím zpsobem (výsledek testu z Chyba! Nenalezen zdroj odkaz.): V pokusu získaný štpný pomr 15:39:53:6 se statstcky významn lšl od pomru pedpokládaného jednoduchou mendelovskou ddností (χ = 8.97, df=3, P<0.05). Pro prezentac vlastních dat je vhodné dodržovat následující: α používáme pro pedem stanovenou hladnu významnost, takže píšeme nap. test je prkazný p α=0.05 ; P (nebo p) používáme pro dosaženou hladnu významnost, takže píšeme P<0.05. Pokud napíšeme P<<0.01, znamená to, že dosažená hladna významnost je výrazn nžší než 0.01; pravdpodobnost chyby prvního druhu je tedy zanedbateln malá. Pokud nám poíta napíše, že P=0, znamená to, že hodnota dosažené hladny významnost je menší než pesnost poítae. Nepšte do lánk P=0, ale nap. P<10-6. Nkdy udáváme pímo dosaženou hladnu významnost. Sdlením P=0.49 naznaujeme, že výsledek testu byl sce prkazný na 5% hladn významnost, ale s odenýma ušma. Podobn sdlení P=0.5 naznauje, že jsme nulovou hypotézu sce nezamítl, ale mnoho nechyblo, aby...uvádní dosažené hladny významnost v publkacích považuj za velm cennou nformac. Obr. Kaptola -A Hustota pravdpodobnost rozdlení χ se dvma stupn volnost. Celá plocha vymezená kvkou a osou x je rovna jedné, velkost tekované plochy odpovídá pravdpodobnost, že promnná nabude hodnotu vtší než 8.. Jestlže jsme dostal hodnotu testového krtera 8., potom velkost tekované plochy odpovídá dosažené hladn významnost testu. Klascká statstka doporuovala strktn postup, kdy nejprve pevn stanovíme hladnu významnost, a poté dostaneme jednoznanou odpov: zamítáme nebo nezamítáme. Dnes se, zvlášt v bologcké prax, prosazuje spíše pístup, kdy prezentujeme dosaženou hladnu významnost a podle ní posuzujeme dvryhodnost výsledku: pokud posuzujeme pomr pohlaví v populac netopýr, s urtou nejstotou 9
8 se smííme, není teba zcela jednoznan rozhodnou ano nebo ne. Naprot tomu prvý zpsob musíme nutn použít tam, kde na základ testu níme rozhodnutí typu ano/ne. Napíklad se rozhoduj, zda zavést výrobu preparátu, který v populac mní pomr pohlaví. Zde s musím pedem stanovt míru rzka, kterou jako výrobce hodlám nést (bude pravdpodobn velm malá, napíklad 0.001), a pokud výsledek pokusu nebude prkazný, výrobu nezavedu. Obdobný postup se užívá u klnckých test p zavádní nových lék. Pílš dobré, aby to byla pravda (Too good to be true) Píklad: Spolenost, vyrábjící nový druh žvýkaky byla obvnna, že pravdelné žvýkání jejích produkt vede u muž ke zvýšené mortalt spermí nesoucích chromosom X (a pak se jm budou rodt pevážn synové). Spolenost najala pokusnou osobu, která dva roky ntenzvn žvýkala její produkty; poté provedla vyšetení jeho spermatu. Ve zveejnné zpráv uvádí, že provedla test na pítomnost chromosomu X v spermí pokusné osoby, a zjstla pítomnost chromosomu X v 5001 pípad, tzn. nepítomnost v 4999 pípadech. Spolenost na základ toho konstatuje, že shoda s oekávaným pomrem 1:1 je dostaten jasná a že tedy její produkty jsou z tohoto hledska zcela neškodné. Co k tomu mžeme íc jako statstc? Odhlédnme nyní od toho, že pozorování nebylo nejlépe naplánováno (eufemsmus, íkající, že bylo naplánováno úpln špatn), chybí kontrola, jedná o vlv na jedného lovka, a pokusme se vyhodnott porovnání pomru spermí s chromosomem k potu spermí s chromosomem Y s oekávaným pomrem 1:1. Použjme χ - test dobré shody. Dostáváme χ = , P= Výsledek testu je tedy neprkazý, ale dosažená hladna významnost se blíží jedné. To je velm podezelé. Co nám to íká? Pedpokládejme, že pomr 1:1 je v základním souboru opravdu zachován. Potom s pravdpodobností více než 98% dostaneme v náhodném výbru spermí vtší odchylku od pomru 1:1, než v našch datech. Nebo jnak: šance, že dostaneme takto dobrou shodu s pomrem 1:1 byla menší než %. Bu tedy mla spolenost z pekla štstí, nebo spíše výsledky zfalšovala tak, jak j vyhovovaly. Jsou pílš dobré na to, aby to mohla být pravda. Uvedený píklad je jst vymyšlený. Ncmén ukazuje na to, jak se dá statstkou objevt falšování dat. Obdobný (statstcky) píklad je ovšem ve svtové vd znám: Vyhodnotíme-l uvedeným postupem výsledky orgnálních Mendelových pokus, zjstíme, že jsou z uvedeného hledska pílš dobré, shoda se štepným pomry je nepravdpodobn dobrá. Mendel sám ovšem o statstce netušl a nkde netvrdí, že se ídl pravdly pro náhodný výbr; naopak, konstatuje, že tam, kde byl výbr malý pdával další ndvdua. Závr, hojn ctovaný v dob, kdy u nás byla genetka nazývána buržoasní pavdou, že prelát Mendel falšoval data, je tedy nesmyslný; pro zájemce doporuuj lánek T. Havránka (1986). Pouení pro nás je ovšem dvojí: když pnášíme zprávu o výsledku pokusu, popšme detaln, jak jsme k datm pšl a p použtí hstorckých dat nemžeme pedpokládat, že data byla sebrána zpsobem odpovídajícím statstckým zásadám. 30
9 Doporuená etba Zar (1984), pp , Sokal-Rohlf (1981), pp , Havránek (1993): testování hypotéz obecn Havránek T. (1986): Gregor Mendel a expermentální data. - Vesmír 65: Tabulka Kaptola -C tabulka krtckých hodnot χ dstrbuce α df
V mnoha pípadech, kdy známe rozdlení náhodné veliiny X, potebujeme urit rozdlení náhodné veliiny Y, která je funkcí X, tzn. Y = h(x).
3. FUNKCE NÁHODNÉ VELIINY as ke studu: 40 mnut Cíl: Po prostudování této kaptol budete umt transformovat náhodnou velnu na náhodnou velnu Y, je l mez tmto náhodným velnam vzájemn jednoznaný vztah VÝKLAD
6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu
6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha
ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt
Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky Analýza dojíždní z dotazníkového šetení v MSK Semestrální projekt 18.1.2007 GN 262 Barbora Hejlková 1 OBSAH OBSAH...2 ZADÁNÍ...3
IV. CVIENÍ ZE STATISTIKY
IV. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data kvantitativní povahy. K tomuto budeme opt používat program Excel 2007 MS Office. 1. Jak mžeme analyzovat kvantitativní
2. Posouzení efektivnosti investice do malé vtrné elektrárny
2. Posouzení efektvnost nvestce do malé vtrné elektrárny Cíle úlohy: Posoudt ekonomckou výhodnost proektu malé vtrné elektrárny pomocí základních metod hodnocení efektvnost nvestních proekt ako sou metoda
POROVNÁNÍ MEZI SKUPINAMI
POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Cykly Intermezzo. FOR cyklus
Cykly Intermezzo Rozhodl jsem se zaadit do série nkolika lánk o základech programování v Delphi/Pascalu malou vsuvku, která nám pomže pochopit principy a zásady pi používání tzv. cykl. Mnoho ástí i jednoduchých
1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST
1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST Kombinatorické pravidlo o souinu Poet všech uspoádaných k-tic, jejichž první len lze vybrat n 1 zpsoby, druhý len po výbru prvního lenu n 2 zpsoby atd. až k-tý
Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)
NÁHODNÁ VELIINA Náhodná veliina je veliina, jejíž hodnota je jednoznan urena výsledkem náhodného pokusu (je-li tento výsledek dán reálným íslem). Jde o reálnou funkci definovanou na základním prostoru
Metodický pokyn pro urení optimální velikosti fakturaního vodomru a profilu vodovodní pípojky.
Metodcký pokyn pro urení optální velkost fakturaního vodoru a proflu vodovodní pípojky. Ureno: Vodoprávní úad K využtí : Vlastník a provozovatel vodovod a odbratel ptné vody Mnsterstvo zedlství.j.: 0 535/00-6000
Energie elektrického pole
Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný
REGRESNÍ ANALÝZA. 13. cvičení
REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
PRVKY KOVOVÝCH KONSTRUKCÍ
VYSOKÉ UEÍ TECHICKÉ V BR FAKULTA STAVEBÍ PROF. IG. JIDICH MELCHER, DrSc. DOC. IG. MIROSLAV BAJER, CSc. PRVKY KOVOVÝCH KOSTRUKCÍ MODUL BO02-M07 AVRHOVÁÍ OCELOVÝCH KOSTRUKCÍ A MEZÍ STAV ÚAVY STUDIJÍ OPORY
9. Kombinatorika, pravd podobnost a statistika
9. Kombinatorika, pravdpodobnost a statistika VÝCHOZÍ TEXT K ÚLOZE 1 V kódu je na prvním míst jedno z písmen A, B, C nebo D. Na dalších dvou pozicích je libovolné dvojciferné íslo od 11 do 45. (Existují
9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese
cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
2. Definice pravděpodobnosti
2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST
Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy
Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.
Ing. Martna Ltschmannová Statsta I., cvení ANOVA Rozšíením dvouvýbrových test pro stední hodnoty je analýza rozptylu nebol ANOVA, terá umožuje srovnávat nol stedních hodnot nezávslých náhodných výbr. Analýza
Regresní a korelační analýza
Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska
v cenových hladinách. 2
roblematka reálné konvergence Reálná konvergence vmezuje sblžování ekonomcké úrovn dané zem s vbraným ukazatel vsplých zemí, nebo s jejch například ekonomckým uskupením. ato metoda je založena na konvergenc
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Teoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt
2 ELEMENTÁRNÍ OET RAVDODOBNOSTI as ke studu kaptoly: 70 mnut Cíl: o prostudování této kaptoly budete umt charakterzovat teor pravdpodobnost a matematckou statstku vysvtlt základní pojmy teore pravdpodobnost
CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.
CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt
5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Informace pro autory píspvk na konferenci ICTM 2007
Informace pro autory píspvk na konferenci ICTM 2007 Pokyny pro obsahové a grafické zpracování píspvk Strana 1 z 5 Obsah dokumentu: 1. ÚVODNÍ INFORMACE... 3 2. POKYNY PRO ZPRACOVÁNÍ REFERÁTU... 3 2.1. OBSAHOVÉ
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM
7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
Statistická analýza volebních výsledk
Statistická analýza volebních výsledk Volby do PSP R 2006 Josef Myslín 1 Obsah 1 Obsah...2 2 Úvod...3 1 Zdrojová data...4 1.1 Procentuální podpora jednotlivých parlamentních stran...4 1.2 Údaje o nezamstnanosti...4
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Teoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran
Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz
III. CVIENÍ ZE STATISTIKY
III. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data pomocí chí-kvadrát testu, korelaní a regresní analýzy. K tomuto budeme používat program Excel 2007 MS Office,
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
Podílový fond PLUS. komplexní zabezpeení na penzi
Podílový fond PLUS komplexní zabezpeení na penzi Aleš Poklop, generálníeditel Penzijního fondu eské spoitelny Martin Burda, generálníeditel Investiní spolenosti eské spoitelny Praha 29. ervna 2010 R potebuje
podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y
4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.
MECHANIKA I. Jaromír Švígler
MECHNIK I Jaomí Švígle OBSH Pedmluva Rozdlení a základní pojm mechank 4 Statka Základní pojm a aom statk Síla Moment síl k bodu a k ose Slová dvojce Základní vta statk Páce a výkon síl a momentu 5 Slové
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Lepení plexi v bonici pružnými lepidly
Lepení plexi v bonici pružnými lepidly Dnes si mžete prohlédnout jednoduchý návod jak pilepit plexi do vyezané bonice. Samozejm možností lepení je mnoho, dnes se však podíváme na lepení pružnými lepidly.
7.1. Podstata testu statistické hypotézy
7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU. Obchodní zákoník 5:
METODY OCEOVÁNÍ PODNIKU DEFINICE PODNIKU Obchodní zákoník 5: soubor hmotných, jakož i osobních a nehmotných složek podnikání. K podniku náleží vci, práva a jiné majetkové hodnoty, které patí podnikateli
ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)
NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky
Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou
2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC
25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc
EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA )
PRACOVNÍ PEKLAD PRO POTEBY BA 01/08/2005 EVROPSKÁ ÚMLUVA O DOBROVOLNÉM KODEXU O POSKYTOVÁNÍ PEDSMLUVNÍCH INFORMACÍCH SOUVISEJÍCÍCH S ÚVRY NA BYDLENÍ (dále jen ÚMLUVA ) Tato Úmluva byla sjednána mezi Evropskými
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
7. Analýza rozptylu jednoduchého třídění
7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
STATISTIKA (pro navazující magisterské studium)
Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU
2 ELEMENTÁRNÍ POET PRAVDPODOBNOSTI. as ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umt
2 ELEMENTÁRNÍ OET RAVDODOBNOSTI as ke studiu kapitoly: 70 minut Cíl: o prostudování této kapitoly budete umt charakterizovat teorii pravdpodobnosti a matematickou statistiku vysvtlit základní pojmy teorie
Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Pednáška mikro 07 : Teorie chování spotebitele 2
Pednáška mikro 07 : Teorie chování spotebitele 2 1. ngelova kivka x poptávka po statku, M- dchod x luxusní komodita ( w >1) standardní komodita (0< w 1) podadná komodita ( w < 0) 2. Dchodový a substituní
analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz
6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Přednáška č. 11 Analýza rozptylu při dvojném třídění
Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané
Spojité regulátory - 1 -
Spojté regulátory - 1 - SPOJIÉ EGULÁOY Nespojté regulátory mají většnou jednoduchou konstrukc a jsou levné, ale jsou nevhodné tím, že neudržují regulovanou velčnu přesně na žádané hodnotě, neboť regulovaná
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM
Vysoká škola zdravotnická, o. p. s. Praha 5 NIKOTINISMUS JAKO SPOLEENSKÝ PROBLÉM NELA VILHELMOVÁ Praha 2009 PEDMLUVA Nikotinismus je stále aktuálnjším tématem nabývajícím na dležitosti, zárove s rostoucím
Soudní exekutor JUDr. Vít Novozámský Bratislavská 40/ Brno k.j. 056 EX 9379/10-46
ZNALECKÝ POSUDEK. 3158-87/12 o cen nemovitostí - pozemk p.. 6946/8, 6946/10, 6946/22, 6946/23 a 6946/24, k.ú. Domašov u Jeseníka, obec Blá pod Praddem, okres Jeseník, kraj Olomoucký. Objednatel: Exekutorský
Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu.
Datový objekt [citováno z http://wraith.iglu.cz/python/index.php] Každý datový objekt Pythonu má minimáln ti vlastnosti. Identitu, datový typ a hodnotu. Identita Identita datového objektu je jedinený a
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
2.1 Pokyny k otev eným úlohám. 2.2 Pokyny k uzav eným úlohám. Testový sešit neotvírejte, po kejte na pokyn!
MATEMATIKA základní úrove obtížnosti DIDAKTICKÝ TEST Maximální bodové hodnocení: 50 bod Hranice úspšnosti: 33 % Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. asový limit pro ešení
Testování statistických hypotéz
Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Bezpenost dtí v okolí škol z pohledu bezpenostního auditora
Bezpenost dtí v okolí škol z pohledu bezpenostního auditora Ing. Jaroslav Heinich, HBH Projekt spol. s r.o. pednáška na konferenci Bezpenos dopravy na pozemných komunikáciách 2008 ve Vyhne (SK) ÚVOD Bezpenostní
L I C H O B Ž N Í K (2 HODINY) ? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky:
L I C H O B Ž N Í K (2 HODINY)? Co to vlastn lichobžník je? Podívej se napíklad na následující obrázky: Na obrázcích je vyobrazena hospodáská budova a židlika, kterou urit mají tvoji rodie na chodb nebo
Promnné. [citováno z
Promnné [citováno z http://wraith.iglu.cz/python/index.php] Abychom s datovým objektem mohli v programu njak rozumn pracovat, potebujeme se na nj njakým zpsobem odkázat. Potebujeme Pythonu íct, aby napíklad
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
STATISTICKÉ HYPOTÉZY
STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude
= = 25
Seznámení s Pythagorovou vtou (1 hodina) Opakování: zopakuj si poítání s druhými moninami ísla Motivae: Jsem leteký modelá. Práv jsem si ve své díln sestrojil model letadla a hybí mi pipevnit poslední
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 3. prosince 2018 Úvod do testování hypotéz Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu
Náhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Statistické ízení finanních tok
Statistické ízení finanních tok OBUST 3.. - 7..006 Fakulta strojní VUT v Praze, Ústav technické matematiky Eliška Cézová eliska_c@email.cz Úvod Statistické ízení finanních tok znamená ízení penžních prostedk