STATISTICKÉ TESTY VÝZNAMNOSTI

Rozměr: px
Začít zobrazení ze stránky:

Download "STATISTICKÉ TESTY VÝZNAMNOSTI"

Transkript

1 STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená to, že je velmi nepravděpodobné, že by tento výsledek byl způsobený pouhou náhodou. Rozhodování ve statistických testech má vždy povahu pravděpodobnostní nikdy si nejsme svým rozhodnutím beze zbytku jisti. Pravděpodobnost, že neoprávněně zamítneme nulovou hypotézu, se nazývá hladina významnosti (signifikance). Na druhé straně můžeme neoprávněně přijmout nulovou hypotézu, ačkoliv neplatí. Snižujeme-li riziko první chyby, zvětšuje se riziko druhé chyby a naopak.

2 DRUHY STATISTICKÝCH TESTŮ VÝZNAMNOSTI: Z hlediska náročnosti na znalost předpokladů o rozdělení dělíme testy do dvou základních skupin na testy: PARAMETRICKÉ, které předpokládají naši znalost charakteru rozdělení studovaného statistického znaku (náhodné veličiny, dále v textu NV) a týkají se jednoho nebo více parametrů daného rozdělení (aritmetického průměru, směrodatné odchylky,..) a NEPARAMETRICKÉ, které jsou univerzálnější, robustnější, nevyžadují splnění žádných podmínek, ale nejsou tak silné.

3 Parametrické testy vyžadují splnění řady předpokladů, má-li být jejich užití oprávněné (nejčastěji se požaduje, aby rozdělení náhodné veličiny bylo normální). Jedná se o početně náročnější, avšak silné testy. Parametrické testy jsou však méně robustní než neparametrické testy. Robustnost Neparametrických testů můžeme chápat jako univerzálnost: pokud nejsou splněny předpoklady pro použití parametrických testů, musíme použít univerzálnější neparametrický test, který není tak silný, ale nevyžaduje splnění žádných podmínek.

4 NEPARAMETRICKÉ nevyžadují splnění žádných předpokladů o rozdělení náhodné veličiny. Obvykle se týkají nějaké obecné vlastnosti rozdělení a neparametrické se nazývají proto, že testované hypotézy neobsahují žádná tvrzení o průměrech nebo rozptylech. Můžeme je použít i v případě, že neznáme rozložení náhodné veličiny. Jsou tedy univerzálnější, ale mají menší statistickou účinnost, tj. schopnost rozpoznat i malé odchylky od nulové hypotézy. Výpočetně jsou jednodušší a rychlejší. Obvykle vyžadují větší počet pozorování než parametrické.

5 Podle dalších hledisek dělíme testy na: TESTY JEDNOSTRANNÉ a OBOUSTRANNÉ Podle toho, jakým způsobem formulujeme alternativní hypotézu, resp. zda nás zajímá změna pouze v jednom nebo obou směrech TESTY JEDNOVÝBĚROVÉ, DVOUVÝBĚROVÉ a VÍCEVÝBĚROVÉ Podle počtu výběrů se liší testované hypotézy a použité metody. Viz dále.

6 KVANTITATIVNÍ VELIČINY - JEDNOVÝBĚROVÉ TESTY POROVNÁNÍ MÍRY POLOHY SOUBORU S NĚJAKOU KONKRÉTNÍ HODNOTOU JEDNOVÝBĚROVÝ U-TEST (v Excelu označován jako Z-test) ověřuje, zda střední hodnota (výběrový průměr) se rovná nějaké konstantě, obvykle populačnímu průměru µ. Je nutný předpoklad normality sledované veličiny se známým populačním 2 rozptylem σ a nezávislost měřených hodnot (např. osoby se nesmí v souboru vyskytovat opakovaně).

7 Před provedením testu musíme zvolit hladinu významnosti α a rozhodnout, zda nás zajímá test jednostranný nebo oboustranný. Testovací statistika je: U = ( x µ) σ x n Příklad: Pro skupinu dětí zjistěte, zda nepřekračují hodnotu normy cholesterolu v krvi: 4,1 mmol/l, pokud známe populační rozptyl: 0,5. Formulujeme H 0 : střední hodnota cholesterolu u testované skupiny dětí nepřekračuje hodnotu normy cholesterolu. budeme porovnávat průměr sledované populace s hodnotou 4,1 mmol/l zajímá nás pouze překročení hladiny cholesterolu 4,1 mmol/l - proto test jednostranný hladinu testu (významnosti) volíme α = 0,05

8 Vypočteme střední hodnotu (aritmetický průměr) ve skupině dětí (výběru). Sledovanou veličinu považujeme za normálně rozloženou, můžeme tedy použít JEDNOVÝBĚROVÝ U-TEST Na základě vypočteného výběrového průměru a známé směrodatné odchylky (ze zadání) vypočteme statistiku U dosazením do vzorce ( x µ) n U = (4,302 4,1) 57 σ U = 0,5 = 2,162 Vypočtenou statistiku U porovnáme s kritickou hodnotou u α normálního rozdělení: pro zvolenou hladinu významnosti testu α = 0,05 najdeme hledanou statistiku v programu EXCEL pomocí Distribuční funkce Normálního standardizovaného rozdělení zadáním pravděpodobnosti 1-α = 0,95 x

9 Funkce v programu EXCEL se nazývá: =NORM.S.INV(pravděpodobnost), a za pravděpodobnost dosadíme hladinu spolehlivosti (1-α ), tj. 0,95. Funkce NORM.S.INV je inverzní k distribuční funkci, to znamená, že pro zadanou pravděpodobnost vrátí hodnotu příslušného kvantilu Normálního standardizovaného rozdělení: NORM.S.INV(0,95) = 1,645 Nyní porovnáváme vypočtenou statistiku U s tabulkovou hodnotou: 2,162 > 1,645 U je větší než kritická hodnota, odchylky od normy proto neumíme na hladině významnosti α vysvětlit pouhou náhodou a zamítáme H 0.

10 Jednodušším řešením je výpočet pravděpodobnosti, tzv. p-hodnoty. Všechny statistické programy včetně statistických funkcí v Excelu umí pro testovaná data vypočítat p-hodnotu, tj. pravděpodobnost, s jakou bychom v daném případě zamítli nulovou hypotézu. Tuto p-hodnotu pak porovnáme s předem stanovenou hladinou významnosti (námi zvolená pravděpodobnost tolerované chyby testu), a rozhodneme o platnosti nebo neplatnosti nulové hypotézy. V programu Excel, najdeme ve vzorcích statistickou funkci Z.TEST s parametry: pole (matice), testovaná hodnota a známá směrodatná odchylka základního souboru. Výsledkem funkce Z.TEST je p-hodnota. Vysvětlení: pole - zadáme oblast dat (výběrový soubor) testovaná hodnota - zadáme normu cholesterolu dětí v populaci známá směrodatná odchylka - odmocnina z populačního rozptylu

11 Stejný příklad: Pro skupinu dětí zjistěte, zda nepřekračují hodnotu normy cholesterolu v krvi: 4,1 mmol/l, pokud známe populační rozptyl: 0,5. =Z.TEST(pole;4,1;ODMOCNINA(0,5)) = 0, ,015 Výsledná p-hodnota 0,015 znamená, že nulovou hypotézu zamítáme na zvolené hladině významnosti 0,05. Znamená to přijetí alternativní hypotézy, kterou můžeme formulovat např.: Hodnota cholesterolu ve sledovaném výběru dětí je statisticky významně vyšší než je norma u běžné populace dětí.

12 Proč se v Excelu jmenuje tato funkce Z-test a ne U-test? Jedná se pouze o jiné označení - oba testy předpokládají normální rozdělení testované veličiny a porovnávají naměřené hodnoty se standardizovaným normálním rozdělením. Z-test nebo Z-rozdělení se nazývá podle tzv. z-skórů, tj. přepočtu hodnot x i na z i podle vzorce xi x zi = s, kde x je střední hodnota a s směrodatná odchylka výběru.

13 JEDNOVÝBĚROVÝ T-TEST Protože v praxi často neznáme skutečný rozptyl, ale používáme jeho odhad, místo jednovýběrového U-testu použijeme jednovýběrový t-test, který je založen na Studentově t-rozdělení a testovou statistiku vypočteme podle vzorce t = x µ s x n, kde je x výběrový průměr µ známá střední hodnota populace s x výběrová směrodatná odchylka n počet měření Vypočtenou testovou statistiku t porovnáváme s kritickou hodnotou Studentova rozdělení, kterou zjistíme např. funkcí v programu Excel =T.INV(pravděpodobnost; volnost), kde za pravděpodobnost dosadíme (1-α).

14 Příklad: Pro skupinu dětí zjistěte, zda nepřekračují hodnotu normy cholesterolu v krvi: 4,1 mmol/l. Populační rozptyl není znám, nahraďte jej odhadem výběrového rozptylu. Musíme použít Studentovo rozdělení, protože odhadujeme jeden parametr (rozptyl) a není splněn předpoklad pro použití U-testu. Použijeme vzorec: t = x µ s x n, po dosazení: t = 4,302 4,1 0, = 2,33 Vypočtenou testovou statistiku t = 2,33 porovnáme s kritickou hodnotou Studentova t-rozdělení, kterou vypočteme funkcí =T.INV(pravděp.; volnost), za pravděpodobnost dosadíme 1-α (pro α = 0,05) a za volnost 56 (57 měření-1) =T.INV(0,95;56) = 1,673 Porovnáním 2,33 > 1,673 zjistíme, že test je statisticky významný, H 0 zamítáme.

15 Protože v programu Excel jednovýběrový t-test není, museli bychom zvolit dvouvýběrový t-test a druhý ( fiktivní ) výběr nahradit hodnotou, která ho bude reprezentovat (střední hodnotou µ). T-test však z jedné hodnoty neumí vypočítat rozptyl, proto musí fiktivní druhý výběr obsahovat alespoň 2 hodnoty. Výpočet najdeme v souboru: 5d_priklady_parametricke_1vyberove_testy.xlsx na listu Z-test a t-test

16 V následující tabulce vidíme porovnání t-testu a z-testu, který jsme provedli v Excelu: t test pro různé CHOL_A Srovnávací z - test hodnota (2 výběry) rozptyly (2 výběry) CHOL_A Srovnávací hodnota Stř. hodnota 4,302 4,1 Stř. hodnota 4,302 4,1 Odhad rozptylu 0,430 0,000 Známý rozptyl 0,5 0,00001 Pozorování 57 2 Pozorování 57 2 Hyp. rozdíl stř. hodnot 0 Hyp. rozdíl stř. hodnot 0 Rozdíl*-stupně volnosti 56 t stat 2,330 z 2,162 P(T<=t) (1) 0,012 P(Z<=z) (1) 0,015 t krit (1) 1,673 z krit (1) 1,645 P(T<=t) (2) 0,023 P(Z<=z) (2) 0,031 t krit (2) 2,003 z krit (2) 1,960 Rozdíl* je chybné označení počtu stupňů volnosti - v našem případě (počet měření - 1)

17 Dvouvýběrový t-test pro různé rozptyly proto, že druhý výběr má nulový rozptyl. Testovací statistika pro t-test je 2,33, tj. stejná jako v případě výpočtu dosazením do vzorce t = x µ s x Porovnáním s kritickou hodnotou pro jednostranný test t krit(1) = 1,673 zamítáme nulovou hypotézu o shodě střední hodnoty s hodnotou 4,1 na hladině významnosti 0,05. n T-test a Z-test se liší především kvůli použití různého rozptylu. U Z-testu jsme použili známý rozptyl 0,5, u t-testu jsme rozptyl nahradili výběrovým odhadem.

18 Mohli bychom zamítnout nulovou hypotézu na hladině významnosti 0,01? Vypočtená p-hodnota = 0,012 vypovídá o tom, že nulovou hypotézu bychom v případě přísnějšího testu na hladině významnosti 0,01 nemohli zamítnout. Stejné výsledky nám poskytl i z-test, pro α = 0,01 bychom H 0 nemohli zamítnout (vypočtená p-hodnota = 0,015). Použití Z-testu je podmíněno znalostí populačního rozptylu. Pokud jej neznáme, musíme empirickou funkci (rozdělení výběrového souboru) porovnat se Studentovým t-rozdělením (nemůžeme použít normální rozdělení). Pro větší počet měření je Studentovo t-rozdělení prakticky shodné s normálním rozdělením.

19 SHRNUTÍ: Rozdíl mezi Z-testem a t-testem: t-test je konzervativnější (zamítnutí nulové hypotézy je o trochu přísnější - zamítáme dřív) při použití Z-testu musíme znát populační rozptyl oba tyto testy vyžadují normalitu dat, ale pro n > 20 je možno veličinu považovat za přibližně normální, protože součet většího počtu stejně rozdělených NV je přibližně normální

20 KVANTITATIVNÍ VELIČINY - DVĚ SKUPINY POROVNÁNÍ MÍRY POLOHY DVOU VÝBĚRŮ problém porovnání střední hodnoty dvou skupin: počet pozorování v obou skupinách se může lišit síla testu záleží na menším výběru skupiny se mohou lišit parametrem polohy odhadovaným průměrem skupiny se mohou lišit mírou variability různé rozptyly skupiny se mohou lišit oběmi charakteristikami současně

21 DVOUVÝBĚROVÝ T-TEST Použijeme za předpokladu, že je rozložení obou veličin normální. Nabídka Analýzy dat v Excelu obsahuje tyto možnosti dvouvýběrových t-testů: 1. Dvouvýběrový párový t-test na střední hodnotu 2. Dvouvýběrový t-test pro stejné rozptyly 3. Dvouvýběrový t-test pro různé rozptyly Stejné možnosti nabízí Excelová funkce T.TEST s parametry: Matice1, Matice2, Chvosty, Typ (1-spárované výběry, 2-dva výběry se shodným rozptylem, 3-dva výběry s různým rozptylem) První možnost probereme později, párová data jsou dvě hodnoty naměřené na stejných subjektech obvykle s časovým odstupem.

22 DVOUVÝBĚROVÝ T-TEST PRO STEJNÉ ROZPTYLY Příklad: testujeme shodu středních hodnot naměřených hodnot cholesterolu u dětí ve škole A a B a předpokládáme, že výběry mají stejný rozptyl: Dvouvýběrový t-test s rovností rozptylů CHOL_A CHOL_B Stř. hodnota 4,302 4,334 Rozptyl 0,430 0,520 Pozorování Společný rozptyl 0,470 Hyp. rozdíl stř. hodnot 0 Počet stupňů volnosti (rozdíl) 100 t stat -0,232 P(T<=t) (1) 0,408 t krit (1) 1,660 P(T<=t) (2) 0,817 t krit (2) 1,984 Zeleně je zvýrazněna vypočtená statistika. Pro porovnání s kritickou hodnotou bereme její absolutní hodnotu - kdybychom zaměnili pořadí obou výběrů, statistika by nám vyšla kladně. Modře je probarvena kritická hodnota t-rozdělení Předpokládáme Studentovo rozdělení výběr. souboru.

23 Zajímá nás oboustranný test, protože nevíme, na které škole mají děti nižší (vyšší) hodnoty cholesterolu. Porovnáním vypočtené statistiky a kritické hodnoty pro oboustranný test: -0,232 < 1,984 testovaná statistika nepřekračuje kritickou hodnotu přijímáme nulovou hypotézu, že mezi dětmi z obou škola A a B není statisticky významný rozdíl v naměřených hodnotách cholesterolu. Na základě p-hodnoty (zobrazena červeně) se rozhodujeme stejně: 0,817 > 0,05... p-hodnota je větší než zvolená hladina významnosti testu, tj. hodnota statistiky odpovídající této p-hodnotě nedosáhla kritické hodnoty Počet stupňů volnosti vypočteme tak, že od počtu měření v obou výběrech odečteme 1 a obě hodnoty sečteme ( ).

24 F-TEST PRO POROVNÁNÍ ROZPTYLŮ Příklad: testujeme shodu středních hodnot naměřených hodnot cholesterolu u mladších a starších zaměstnanců, rozdělených do skupiny A (mladší) a skupiny B (starší). Nevíme, zda můžeme použít dvouvýběrový t-test pro stejné rozptyly. Nejprve otestujeme shodu rozptylů pomocí Fischerova F-testu, kde výsledkem 2 je podíl dvou χ rozdělení. Stanovíme hypotézu H 0 - rozptyly obou souborů se statisticky významně neliší, alternativní hypotézu H A - rozptyly obou souborů se statisticky významně liší Pokud H 0 zamítneme, použijeme t-test pro různé rozptyly

25 Dvouvýběrový F-test pro rozptyl CHOL_B CHOL_A Stř. hodnota 4,20 4,33 Rozptyl 0,52 0,34 Pozorování Rozdíl F 1,54 P(F<=f) (1) 0,11 F krit (1) 1,80 Dvouvýběrový F-test pro rozptyl CHOL_A CHOL_B Stř. hodnota 4,33 4,20 Rozptyl 0,34 0,52 Pozorování Rozdíl F 0,65 P(F<=f) (1) 0,11 F krit (1) 0,55 Vidíme, že hodnoty v 1. tabulce odpovídají hodnotám na obrázku. Ve druhé tabulce, kde je přehozeno pořadí výběrů, musíme hodnoty F-rozdělení odečítat na grafu vlevo (v nižších hodnotách). Výsledek obou F-testů je stejný - test je statisticky nevýznamný, H 0 nemůžeme zamítnout.

26 Poznámka: hodnota F-testu (testovací statistika) v druhém výpočtu (po přehození pořadí výběrů) je inverzní hodnota první statistiky, tj. 1 pro obě statistiky platí vztah: F 1 = F Na základě F-testu použijeme opět DVOUVÝBĚROVÝ T-TEST PRO STEJNÉ ROZPTYLY Výběrové soubory otestujeme T-testem také dvakrát (podruhé v opačném pořadí výběrů), abychom zjistili, v čem se bude lišit výsledná tabulka. (Uvidíme, že se bude lišit pouze ve znaménku testovací statistiky t-stat.) Porovnáním absolutní hodnoty t-stat a t-krit (kritická hodnota stanovenou na základě zvolené hladiny významnosti α) zjistíme, že test cholesterolu pro obě skupiny zaměstnanců je statisticky nevýznamný - skupiny se v hodnotách cholesterolu statisticky významně neodlišují. Použili jsme oboustranný test. 2

27 Dvouvýběrový t-test s rovností rozptylů Dvouvýběrový t-test s rovností rozptylů Zaměstnanci CHOL_A CHOL_B Zaměstnanci CHOL_B CHOL_A Stř. hodnota 4,33 4,20 Stř. hodnota 4,20 4,33 Rozptyl 0,34 0,52 Rozptyl 0,52 0,34 Pozorování Pozorování Společný rozptyl 0,46 Společný rozptyl 0,46 Hyp.rozdíl stř.hodn. 0 Hyp.rozdíl stř.hodn. 0 Rozdíl 85 Rozdíl 85 t stat 0,84 t stat -0,84 P(T<=t) (1) 0,20 P(T<=t) (1) 0,20 t krit (1) 1,66 t krit (1) 1,66 P(T<=t) (2) 0,40 P(T<=t) (2) 0,40 t krit (2) 1,99 t krit (2) 1,99

28 Příklad: testujeme shodu středních hodnot naměřených hodnot cholesterolu u dětí ve škole A a C. Dvouvýběrový F-test pro rozptyl CHOL_A CHOL_C Stř. hodnota 4,408 4,483 Rozptyl 0,333 0,676 Pozorování Rozdíl F 0,493 P(F<=f) (1) 0,021 F krit (1) 0,564 Pro výběr t-testu jsme použili nejprve F-test pro porovnání rozptylů. Na hladině významnosti 0,05 jsme zjistili, že se rozptyly obou výběrů významně liší. K testování shody středních hodnot proto musíme použít dvouvýběrový t-test s nerovností rozptylů

29 Dvouvýběrový t-test s nerovností rozptylů CHOL_A CHOL_C Stř. hodnota 4,408 4,483 Rozptyl 0,333 0,676 Pozorování Hyp. rozdíl stř. hodnot 0 Rozdíl - stupně volnosti 61 t stat -0,444 P(T<=t) (1) 0,329 t krit (1) 1,670 P(T<=t) (2) 0,658 t krit (2) 2,000 K vyhodnocení t-testu porovnáme absolutní hodnotu t-stat a t krit(2) t stat < t krit(2) proto t-test není statisticky významný a hypotézu H o o shodě středních hodnot nemůžeme zamítnout. Totéž nám potvrzuje vysoká p-hodnota P(T<=t) (2) > α Počet stupňů volnosti se pro dvouvýběrový t-test s nerovností výběrů počítá složitějším algoritmem a vliv má především rozptyl výběru (čím je větší rozptyl, tím větší váhu má počet hodnot ve výběru).

30 PÁROVÉ POROVNÁNÍ používá se v situaci, kdy chceme prokázat vliv nějakého zásahu na stejné skupině objektů. Pokud máme sledovanou veličinu měřenu dvakrát, stačí vypočítat rozdíl těchto hodnot a testovat jednovýběrovým testem, zda je tato změna = 0. Technickým řešením se párové a nepárové testy neliší, ale z hlediska interpretace jde o zcela odlišné přístupy. Párové testy použijeme v okamžiku, kdy sledovanou charakteristiku pozorujeme na stejném objektu opakovaně (nejčastěji dvakrát) a rozdíl mezi sledovanymi subjekty je větší, než rozdíl mezi pozorováními. Snažíme se zjistit efekt času - obvykle během tohoto časového intervalu je provedena nějaká intervence a ptáme se tedy na její efekt.

31 Např. na skupině školních dětí byla měřena hladina HDL cholesterolu v krvi. Pak došlo ve školní jídelně k změně skladby stravy a po měsíci byla stejným dětem měřena opět hladina HDL cholesterolu. Ptáme se, zda změna jídelníčku snížila hladinu HDL cholesterolu v krvi jednotlivých dětí. Hodnota, o kterou je možno snížit hladinu HDL cholesterolu změnou části dětské stravy zřejmě nebude velká, naopak rozdíly hladiny HDL cholesterolu mezi jednotlivými dětmi mohou být mnohem větší. Pokud bychom porovnali obě skupiny dvouvýběrovým testem, zůstane efekt našeho zásahu skryt variabilitou mezi jedinci a dvouvýběrový test neprokáže významné rozdíly. Dopustili bychom se chyby tím, že bychom neuvažovali závislost hodnot na měřené osobě. Musíme tedy vyloučit vliv variability mezi osobami. Budeme pracovat s rozdíly obou měření a porovnávat změnu ke které došlo za sledované období. To je právě princip párového t-testu, který je zaměřený na odhalení změn u vzájemně spárovaných hodnot - počty měření si musí navzájem odpovídat.

32 Dvouvýběrový párový t-test na střední hodnotu HDL1 HDL2 Stř. hodnota 1,265 1,372 Rozptyl 0,086 0,146 Pozorování Pears. korelace 0,702 Hyp. rozdíl stř. hodnot 0 Rozdíl - počet st. volnosti 38 t stat -2,452 P(T<=t) (1) 0,009 t krit (1) 1,686 P(T<=t) (2) 0,019 t krit (2) 2,024 Stanovíme nulovou hypotézu H 0 : hodnoty HDL-chlesterolu se po třech měsích změny režimu u dětí nezměnily. Počet pozorování je stejný - jednalo se o 39 dětí. Počet stupňů volnosti je n-1, kde n je počet dětí v jednom výběru. Hodnoty 1. a 2. měření jsou spárované. Výsledek testu: Absolutní hodnota t-statistiky je větší než kritická hodnota (2,452 > 1,686), p-hodnota je signifikantně nízká (0,009), proto H 0, že zamítáme na hladině spolehlivosti 95%.

33 Na základě p-hodnoty bychom nulovou hypotézu mohli zamítnout i na hladině významnosti 99% (P(T<=t) (1) < 0,01). Použili jsme jednostranný test, protože jsme předpokládali, že hodnota HDL cholesterolu se pomocí režimových opatření zlepší (bude vyšší - jedná se o tzv. hodný cholesterol ) Další příklady pro řešení PÁROVÝM T-TESTEM jsou: výkon sportovců po určité době tréninků zlepšení výsledků školních dětí v některém předmětu zlepšení zdravotních parametrů po léčbě úbytek hmotnosti po dietních opatřeních zvýšení hmotnosti po úspěšné léčbě anorexie Vždy se musí jednat o spárované hodnoty stejných jedinců.

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky

Více

NEPARAMETRICKÉ TESTY

NEPARAMETRICKÉ TESTY NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky)

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg.

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,

Více

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Testování hypotéz Biolog Statistik: Matematik: Informatik: Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

IV. CVIENÍ ZE STATISTIKY

IV. CVIENÍ ZE STATISTIKY IV. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data kvantitativní povahy. K tomuto budeme opt používat program Excel 2007 MS Office. 1. Jak mžeme analyzovat kvantitativní

Více

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz 6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

STATISTICKÉ HYPOTÉZY

STATISTICKÉ HYPOTÉZY STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Z pastí na daném území byla odhadnuta abundance několika druhů: myšice lesní 250, myšice křovinná 200, hraboš polní 150,

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Ranní úvahy o statistice

Ranní úvahy o statistice Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016 Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26 Základní pojmy

Více

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality Opakování Opakování: Testy o střední hodnotě normálního rozdělení 1 jednovýběrový t-test 2 párový t-test 3 dvouvýběrový t-test jednovýběrový Wilcoxonův test párový Wilcoxonův test dvouvýběrový Wilcoxonův

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Návod na vypracování semestrálního projektu

Návod na vypracování semestrálního projektu Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 2 Jak medicínská data správně testovat.

Více

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Vysoká škola ekonomická v Praze

Vysoká škola ekonomická v Praze Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické metody v ekonomii Autor bakalářské práce: Jakub Zajíček Vedoucí

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Úvod do testování hypotéz

Úvod do testování hypotéz Úvod do testování hypotéz Tato kapitola se zabývá rozhodováním o platnosti statistických hypotéz na základě vybraného pravděpodobnostního modelu chování náhodné veličiny a pozorovaných dat. Statistické

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více