Ústav patologické fyziologie LF MU. Pokročilé statistické metody. Filip Zlámal. rozptylu (ANOVA) tabulky.

Rozměr: px
Začít zobrazení ze stránky:

Download "Ústav patologické fyziologie LF MU. Pokročilé statistické metody. Filip Zlámal. rozptylu (ANOVA) tabulky."

Transkript

1 Ústav patologické fyziologie LF MU (Ústav patologické fyziologie LF MU) / 41

2 Obsah (Ústav patologické fyziologie LF MU) / 41

3 PRINCIP STATISTICKÉ INDUKCE TESTOVÁNÍ HYPOTÉZ - k ověření předem stanovených hypotéz - H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 - testování bud H 0 zamítneme, nebo H 0 nezamítneme H 0 nezamítneme H 0 zamítneme H 0 platí OK chyba I. druhu (α) H 0 neplatí chyba II. druhu (β) OK (Ústav patologické fyziologie LF MU) / 41

4 Motivace Dvouvýběrový t test POUŽITÍ: porovnání středních hodnot dvou souborů PŘEDPOKLADY: nezávislost, normalita, homoskedasticita (shoda rozptylů) ověření normality: exaktně (Shapiro-Wilk, Kolmogorov-Smirnov), N P grafy ověření homoskedasticity: F-test (Ústav patologické fyziologie LF MU) / 41

5 Motivace Dvouvýběrový t test - příklad Normalita Krabicové grafy t-test zamítáme hypotézu o shodě středních hodnot na hladině významnosti α = 0,05 (Ústav patologické fyziologie LF MU) / 41

6 - rozšíření t testu z angl. ANalysis Of VAriance POUŽITÍ: porovnává střední hodnoty více výběrů (I) H 0 : µ 1 = µ 2 = = µ I H 1 : alespoň dvě střední hodnoty se liší PŘEDPOKLADY: nezávislost, normalita, homoskedasticita ověření normality: exaktně (Shapiro-Wilk, Kolmogorov-Smirnov), N P grafy ověření homoskedasticity: Bartlettův test, Levenův test VÝSLEDKY ANOVA tabulka: Zdroj Součet Počet stupňů Střední součet F p-hodnota variability čtverců volnosti čtverců S skupiny S A I 1 S A /(I 1) A /(I 1) p Se/(n I) reziduální S e n I S e/(n I) celkový S T n 1 V případě platnosti H 0 má testová statistika F F(I 1,n I). (Ústav patologické fyziologie LF MU) / 41

7 Mnohonásobná porovnání Pokud H 0 zamítneme, chceme vědět, mezi kterými soubory je významný rozdíl. VYVÁŽENÉ TŘÍDĚNÍ - rozsahy souborů jsou stejné - Tukeyova metoda NEVYVÁŽENÉ TŘÍDĚNÍ - rozsahy souborů jsou různé - Scheffého metoda, modifikace Tukeyovy - Tukeyova-Kramerova (Tukey HSD) (Ústav patologické fyziologie LF MU) / 41

8 Příklad 15 plodů broskví, 3 stupně zralosti Normalita Homoskedasticita (Ústav patologické fyziologie LF MU) / 41

9 Příklad ANOVA tabulka zamítáme hypotézu o shodě středních hodnot mnohonásobná porovnání: Tukeyova metoda Závěr: Byly zjištěny statisticky významné rozdíly mezi skupinami nezralých a přezrálých broskví a mezi skupinami zralých a přezrálých broskví. (Ústav patologické fyziologie LF MU) / 41

10 Význam předpokladů NEZÁVISLOST: Velmi důležitý předpoklad, musí být splněn, jinak budou výsledky nesmyslné. NORMALITA: ANOVA není příliš citlivá na porušení normality, zvláště je li rozsah každého výběru větší než 20. Při větším porušení se doporučuje použít Kruskalův Wallisův test. HOMOSKEDASTICITA: Mírné porušení nevadí, při větším porušení se doporučuje použít Kruskalův Wallisův test. Test shody rozptylů má smysl provádět až po ověření normality. (Ústav patologické fyziologie LF MU) / 41

11 Modifikace ANOVy One-way ANOVA - jednocestná ANOVA, jednofaktorová ANOVA, jednoduchého třídění (dosud) Two-way ANOVA - dvoucestná ANOVA, dvoufaktorová ANOVA, dvojného třídění - bez interakcí - s interakcemi Three-way ANOVA ANCOVA - Analysis Of Covariance MANOVA - Multinomial Analysis Of Variance RMANOVA - Repeated Measures Analysis Of Variance Kruskalův-Wallisův test - neparametrická ANOVA - založena na pořadí hodnot v celém souboru - testuje se hypotéza o shodě mediánů - mnohonásobná porovnání - obdoba Scheffého a Tukeyovy (Ústav patologické fyziologie LF MU) / 41

12 Shrnutí je statistický test ověřující simultánní shodu středních hodnot sledované veličiny mezi nezávislými soubory, je li rozdělení této veličiny v rámci každého souboru normální a mají li soubory shodné rozptyly. (Ústav patologické fyziologie LF MU) / 41

13 ANOVA (jednocestná) v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics ANOVA One-way ANOVA OK Variables (výběr proměnných): Dependent variable list (závislá proměnná), Categorical predictor (skupinová proměnná) OK More results Assumptions (ověření předpokladů) normalita Normal p-p (v části Distribution of vars within groups) (výběr skupin) OK shoda rozptylů Levene s test, případně Cochran C, Hartley, Bartlett Summary All effects/graphs (ANOVA tabulka) (pokud zamítneme H 0 ) Post-hoc Scheffé, případně Tukey HSD, případně další Poznámka: Zkoumáme li vliv více kategoriálních proměnných na hodnotu závisle proměnné, použijeme vícecestnou ANOVu (dvoucestnou, trojcestnou atd.). V programu Statistica ji realizujeme stejně jako je uvedeno výše s jednou obměnou: pro ANOVu bez interakcí: Statistics ANOVA Main effects ANOVA... pro ANOVu s interakcemi: Statistics ANOVA Factorial ANOVA... (Ústav patologické fyziologie LF MU) / 41

14 Dvě náhodné veličiny X, Y nominálního typu (X... r úrovní, Y... s úrovní). n... rozsah výběru KONTINGENČNÍ TABULKA - četnostní tabulka Y\X x [1] x [2]... x [r] součet y [1] n 11 n n 1r n 1. y [2] n 21 n n 2r n y [s] n s1 n s2... n sr n s. součet n.1 n.2... n.r n Testujeme hypotézu H 0: X a Y jsou nezávislé H 1: X a Y jsou závislé (Ústav patologické fyziologie LF MU) / 41

15 Testování nezávislosti Pearsonův χ 2 test asymptotický test porovnává zjištěné četnosti s teoretickými (za platnosti H 0) v případě platnosti H 0 má statistika ( r s χ 2 nij n i.n.j n = i=1 j=1 n i. n.j n podmínka dobré aproximace: n i.n.j n > 5 ) 2 χ 2 ((r 1)(s 1)) Cramérův koeficient (Cramérovo V) V = χ 2 n(min{r,s} 1) Rozmezí V Závislost 0 0, 1 zanedbatelná 0, 1 0, 3 slabá 0, 3 0, 7 střední 0, 7 1, 0 silná - jedná se o obdobu korelačního koeficientu pro nominální veličiny - nabývá hodnot mezi 0 a 1 - určuje míru asociace mezi X a Y (Ústav patologické fyziologie LF MU) / 41

16 Testování nezávislosti Fisherův exaktní test Pro 2 2 Y\X x [1] x [2] součet y [1] a b a+b y [2] c d c +d součet a+c b +d n Pravděpodobnost, že náhodným výběrem vznikne tato tabulka s fixovanými marginálními četnostmi: ) P = ( a+b )( c+d b c ( n ) a+c p-hodnota testu nezávislosti = součet všech P, které více odporují H 0 při fixovaných marginálních četnostech (Ústav patologické fyziologie LF MU) / 41

17 Příklad 1 tabulka Ověření podmínky dobré aproximace: /758. = 52,54 > 5 Pearsonův χ 2 test Výsledky: Závěr: Nezamítáme hypotézu o nezávislosti obezity a genotypu. (Ústav patologické fyziologie LF MU) / 41

18 Příklad 2 tabulka Ověření podmínky dobré aproximace: 8.7/18. = 3,11 5 Fisherův exaktní test Výsledky: Závěr: Zamítáme hypotézu o nezávislosti pohlaví a diagnózy. (Ústav patologické fyziologie LF MU) / 41

19 Shrnutí Testování nezávislosti v kontingenčních tabulkách slouží ke zjištění možné asociace mezi náhodnými veličinami nominálního typu. Míru této asociace lze měřit. (Ústav patologické fyziologie LF MU) / 41

20 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Basic Statistics/Tables Tables and banners OK Specify tables (select variables) (výběr proměnných): List1 (1. proměnná), List2 (2. proměnná) OK OK (kontingenční tabulka) Summary (ověření podmínky dobré aproximace pro použití Pearsonova χ 2 testu) Options zatrhnout Expected frequencies Summary (Pearsonův χ 2 test) Options zatrhnout Pearson & M-L Chi-square, případně ještě Phi(2 2) & Cramér s V & C Advanced Detailed two-way tables (Fisherův exaktní test) Options zatrhnout Fisher exact, Yates, McNemar (2 2) Advanced Detailed two-way tables (Ústav patologické fyziologie LF MU) / 41

21 Vymezení pojmu je soubor statistických metod používaných k popisu a analýze dat, které mají charakter časového intervalu. Původně vyvinuta pro epidemiologické studie - předmětem zájmu byla doba zahájení léčby pacienta a jeho úmrtí. Je používaná např. v sociologii, ekonomii, strojírenství (jako doba je např. čas mezi ztrátou zaměstnání a získání nového, čas od zavedení stroje do jeho poruchy). Časový interval má jasně stanovený začátek (vstupní událost) a konec (sledovaná událost). (Ústav patologické fyziologie LF MU) / 41

22 Cenzorování Při dlouhodobém sledování pacientů bychom získali skutečnou dobu každého z nich. Bohužel, z technický, ekonomických a jiných důvodů je takové sledování obtížné, nebo přímo nemožné. Pozorování probíhá jen po určitou dobu (délka studie). Pro část pacientů je doba neznámá, a to v důsledku: - během doby pozorování se sledovaná událost u pacienta nevyskytla - pacient je ztracen z pozorování (např. v důsledku migrace) - pacient v době pozorování zemřel z jiné příčiny, než je sledovaná událost Proto dále pracujeme jen z částečnou informací - tomuto jevu se říká cenzorování. Ve výše uvedených případech víme pouze to, že doba pacienta je větší než doba, po níž byl pozorován cenzorování zprava (right-censoring). (Ústav patologické fyziologie LF MU) / 41

23 Doba T Doba mezi vstupní a sledovanou událostí se označuje jako doba T. - náhodná veličina nabývající kladných hodnot distribuční funkce F(t) = P(T t) F(t) je pravděpodobnost, že doba je menší nebo rovna t (Ústav patologické fyziologie LF MU) / 41

24 Funkce S(t) Vhodnější a častější k popisu analýzy je funkce S(t) = 1 F(t) = P(T > t) S(t) je pravděpodobnost, že pacient přežije čas t, tj. jeho doba je větší než t (v čase t pro něj sledovaná událost nenastane) (Ústav patologické fyziologie LF MU) / 41

25 Riziková funkce h(t) Další důležitá charakteristika v analýze je riziková funkce. Jedná se o intenzitu výskytu sledované události v čase závislou na délce (míra úmrtnosti pacientů v čase t za předpokladu, že se tito pacienti času t dožili). Mezi S(t) a h(t) existuje jednoznačný vztah. Na rozdíl od S(t) může být riziková funkce: - rostoucí (např. pro lidskou populaci straší 65 let) - klesající (např. novorozenecká úmrtnost, většina onkologických onemocnění) - konstantní (např. úmrtnost v produktivním věku, pokročilá chronická onemocnění) - vaničková - kombinuje klesající, konstantní i rostoucí průběh (typická pro úmrtnost v celé lidské populaci, kdy po narození klesá a ve stáří roste) (Ústav patologické fyziologie LF MU) / 41

26 Metody analýzy 1. Metody parametrické - vyžadují splnění předpokladů o pravděpodobnostním rozdělení doby T 2. Metody neparametrické - nevyžadují zvláštní předpoklady o rozdělení pravděpodobnosti doby T - nejčastěji používané - mezi nejpoužívanější patří Kaplanova-Meierova metoda a metoda odhadu pomocí úmrtnostních tabulek (life-table) 3. Metody semi-parametrické - nevyžadují předpoklady o rozdělení pravděpodobnosti doby T - pracují s parametry a regresními koeficienty - nejznámější Coxův regresní model proporcionálních rizik (Ústav patologické fyziologie LF MU) / 41

27 Metody analýzy Kaplanova-Meierova metoda Neparametrický odhad prostřednictvím dob t i v případě cenzorovaných pozorování. n pacientů, u k z nich dojde během pozorování k výskytu sledované události (k z nich během pozorování zemřelo) Časové okamžiky: t 1 < t 2 < < t k Odhad funkce : S(t j) = k j=1 ( 1 n j d j ) - n j...počet pacientů, kteří jsou ještě naživu v čase t j - d j...počet úmrtí v čase t j Grafem je schodovitá funkce (Ústav patologické fyziologie LF MU) / 41

28 Metody analýzy Life-table odhad Tato metoda je principiálně stejná jako Kaplanova-Meierova metoda. Rozdíl: definovány časové intervaly pevně dané velikosti. Odhad funkce : S(j) = ( ) j i=1 1 d j n j 2 1 c j - n j...počet pacientů, kteří jsou ještě naživu na počátku j tého intervalu - d j...počet úmrtí během intervalu j - c j...počet cenzorování v intervalu j (Ústav patologické fyziologie LF MU) / 41

29 Metody analýzy Porovnání obou metod Předpoklady: Kaplanova-Meierova metoda v riziku všichni pacienti s cenzorovaným časem Life-table odhad v riziku polovina pacientů s cenzorovaným časem Vyskytuje li se ve stejném časovém okamžiku úmrtí i cenzorování, je nepřesné předpokládat, že všechna úmrtí předchází všem cenzorováním (jak předpokládá Kaplanova-Meierova metoda), proto je vhodnější použití life-table. v případě výskytu úmrtí i cenzorování ve stejném čase Kaplanova-Meierova metoda pravděpodobnost oproti life-table metodě mírně nadhodnocuje Kaplanův-Meierův odhad je vhodnější použít pro klinické studie (kde jsou k dispozici přesné údaje o době pacientů). Metody úmrtnostních tabulek je vhodnější použít v populačních analýzách (kde je výskyt úmrtí a cenzorování ve stejném čase častější - velký počet pacientů, méně přesné zaznamenávání dob pacientů). (Ústav patologické fyziologie LF MU) / 41

30 Metody analýzy Log-rank test Běžný problém v klinických studíıch je porovnání dvou a více křivek, např. při zkoumání vlivu nového léčiva na dobu onkologických pacientů. Pro tato srovnání existuje několik statistických testů: - log-rank test - obecný Wilcoxonův test - Tarone-Ware test - Peto-Peto test - Fleming-Harrington test Všimneme si log-rank testu. (Ústav patologické fyziologie LF MU) / 41

31 Metody analýzy Log-rank test Jedná se v podstatě o χ 2 test. Log-rank statistika χ 2 = (O i E i ) 2, i = 1,2 Var(O i E i ) O i E i = n j=1 (m ij e ij ) - m ij...počet pozorovaných jevů v čase j v souboru i - e ij...očekávaný ( počet jevů v čase j v souboru i nij - e ij = )(m n 1j +n 1j +m 2j ) 2j Var(O i E i ) = n j=1 n 1j n 2j (m 1j +m 2j )(n 1j +n 2j m 1j m 2j ) (n 1j +n 2j ) 2 (n 1j +n 2j 1) H 0: Neexistuje rozdíl mezi křivkami H 1: Neplatí H 0 V případě platnosti H 0 má testová statistika χ 2 χ 2 (1). (Ústav patologické fyziologie LF MU) / 41

32 Log-rank test Příklad Data a křivky (Ústav patologické fyziologie LF MU) / 41

33 Log-rank test Příklad Data a výsledek log-rank testu Závěr: Zamítáme hypotézu o shodě křivek mezi skupinami A a B. (Ústav patologické fyziologie LF MU) / 41

34 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Advanced Linear/Nonlinear Models Survival Analysis (Kaplanova-Meierova metoda) Kaplan & Meier product limit method OK Variables (survival times & censoring indicator) (výběr proměnných): Survival times (or dates) (proměnná obsahující doby ), Censoring indicator (proměnná obsahující informace o cenzorování) OK doplnit do Code for complete responses hodnotu, kterou kódujeme necenzorovaná data, a do Code for censored responses hodnotu, kterou kódujeme cenzorovaná data Survival times vs. cum. proportion surviving, případně další možnosti (life table metoda) Life tables & Distributions (výběr proměnných stejný jako u Kaplanovy-Meierovy ) + možnost zvolit počet intervalů v části Compute table based on: Number of intervals OK Function plots Plot of survival function, případně další možnosti (log rank test) Comparing two samples OK (výběr proměnných jako u Kaplanovy-Meierovy ) + zvolit Grouping variable (skupinová proměnná) OK (výsledek testu) Two-sample tests Log-rank test (křivky ) Function plots Cum. prop. surviving by group (Kaplan Meier) (Ústav patologické fyziologie LF MU) / 41

35 Cíle a použití Jedna z vícerozměrných statistických metod ( hlavních komponent, faktorová, diskriminační, korespondenční,...). CÍL: roztřídění n objektů, z nichž každý je popsán p znaky, do pokud možno stejnorodých skupin (shluků, clusterů) shlukování POŽADAVEK: aby si objekty uvnitř shluku byly podobné co nejvíce, naopak objekty z různých shluků co nejméně Používá se spíše jako průzkumová metoda, slouží jako vodítko k dalšímu zpracování dat (např. k odhalení odlehlých objektů). (Ústav patologické fyziologie LF MU) / 41

36 Podobnost objektů Posuzujeme podle různých měr vzdálenosti mezi objekty. Vzdálenost je vyjádřena pomocí metriky, např. Eukleidovská vzdálenost d ij = p k=1 (x ik x jk ) 2 manhattanská (taxikářská) vzdálenost d ij = p k=1 x ik x jk A A B B např. Objekt Věk (l) Výška (cm) Váha (kg) Eukl. vzdál.: d 12 = (24 45) 2 +( ) 2 +(77 79) 2 = 31,89 manh. vzdál.: d 12 = = 35 Vzdálenosti mezi objekty se uspořádají do matice vzdáleností. (Ústav patologické fyziologie LF MU) / 41

37 Hierarchické shlukování Nejčastěji používaná je aglomerativní hierarchická procedura - postupné slučování objektů od nejbližších ke stále vzdálenějším. Návod: 1. Každý objekt - samostatný shluk. 2. Nalezneme dva shluky, jejichž vzdálenost je minimální. 3. Ty sloučíme do nového, většího shluku a přepočítáme matici vzdáleností. 1. krok 2. krok 3. krok (n-1). krok 4. krok (Ústav patologické fyziologie LF MU) / 41

38 Hierarchické shlukování Vzdálenosti mezi shluky Metoda nejbližšího souseda: vzdálenost mezi shluky je dána jako nejmenší vzdálenost mezi jejich objekty Metoda nejvzdálenějšího souseda: vzdálenost mezi shluky je dána jako největší vzdálenost mezi jejich objekty Metoda průměrné vazby: vzdálenost mezi shluky je průměrem ze všech vzdáleností mezi jejich objekty Odstranění vlivu měřítka veličin: standardizací. (Ústav patologické fyziologie LF MU) / 41

39 Dendrogram Výsledky aglomerativního hierarchického shlukování se zpravidla graficky vyjadřují pomocí dendrogramu. (Ústav patologické fyziologie LF MU) / 41

40 Další shlukování ní metodou nejbližších těžišt (K-Means) - musí být předem znám počet shluků - postup založen na nejbližším těžišti - do shluku je zařazen objekt, jehož vzdálenost od těžiště je nejmenší - neznáme li těžiště shluků, pak se určují iterativním výpočtem z dat ní metodou optimálních středů (medoidů) - optimální střed shluku (medoid) - takový střední objekt, pro nějž platí, že průměrná vzdálenost k ostatním objektům v tomto shluku je minimální (Ústav patologické fyziologie LF MU) / 41

41 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Multivariate Exploratory Techniques Cluster Analysis Joining (tree clustering) OK Variables (výběr proměnných) - zvoĺıme, které proměnné chceme zahrnout do analýzy OK Advanced v části Cluster zvoĺıme Cases (rows), v části Amalgamation (linkage) rule zvoĺıme metodu pro určení vzdáleností mezi shluky, v části Distance measure zvoĺıme typ metriky (vzdálenosti) OK Verticle icile plot nebo Horizontal hierarchical tree plot, v případně další možnosti Poznámka: Standardizaci veličin před provedením shlukové analýzy provedeme např. tak, že přímo označíme sloupce, které chceme standardizovat, a zvoĺıme Data Standardize. (Ústav patologické fyziologie LF MU) / 41

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a

Více

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Příklad: Test nezávislosti kategoriálních znaků

Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

Návod na vypracování semestrálního projektu

Návod na vypracování semestrálního projektu Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření 1.4 ANOVA Úloha 1 Jednofaktorová ANOVA Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření Bylo měřeno množství DNA hub Fusarium culmorum

Více

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) 5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující

Více

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PRINCIPY STATISTICKÉ INFERENCE identifikace závisle proměnné

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu Analýza rozptylu opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu Analýza rozptylu porovnání více průměrů sledujeme F-statistiku: poměr rozptylu mezi skupinami

Více

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová Masarykova univerzita v Brně Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Analýza rozptylu Vypracovala: Marika Dienová Vedoucí bakalářské práce: Mgr. Jan Koláček, Ph.D. Brno 2006/2007 Prohlášení Prohlašuji,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Testy nezávislosti kardinálních veličin

Testy nezávislosti kardinálních veličin Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21 Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8

Více

Fisherův exaktní test

Fisherův exaktní test Katedra pravděpodobnosti a matematické statistiky Karel Kozmík Fisherův exaktní test 4. prosince 2017 Motivace Máme kontingenční tabulku 2x2 a předpokládáme, že četnosti vznikly z pozorování s multinomickým

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz DATA, VÝZKUM, ANALÝZY ve výzkumu se střídají fáze prozkoumávací

Více

Vybrané partie z biostatistiky

Vybrané partie z biostatistiky 1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Proč neparametrické testy? Pokud provádíte formální analýzu či testování hypotéz (zejména provádíte-li

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Uni- and multi-dimensional parametric tests for comparison of sample results

Uni- and multi-dimensional parametric tests for comparison of sample results Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více