Ústav patologické fyziologie LF MU. Pokročilé statistické metody. Filip Zlámal. rozptylu (ANOVA) tabulky.
|
|
- Zdeněk Tichý
- před 7 lety
- Počet zobrazení:
Transkript
1 Ústav patologické fyziologie LF MU (Ústav patologické fyziologie LF MU) / 41
2 Obsah (Ústav patologické fyziologie LF MU) / 41
3 PRINCIP STATISTICKÉ INDUKCE TESTOVÁNÍ HYPOTÉZ - k ověření předem stanovených hypotéz - H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 - testování bud H 0 zamítneme, nebo H 0 nezamítneme H 0 nezamítneme H 0 zamítneme H 0 platí OK chyba I. druhu (α) H 0 neplatí chyba II. druhu (β) OK (Ústav patologické fyziologie LF MU) / 41
4 Motivace Dvouvýběrový t test POUŽITÍ: porovnání středních hodnot dvou souborů PŘEDPOKLADY: nezávislost, normalita, homoskedasticita (shoda rozptylů) ověření normality: exaktně (Shapiro-Wilk, Kolmogorov-Smirnov), N P grafy ověření homoskedasticity: F-test (Ústav patologické fyziologie LF MU) / 41
5 Motivace Dvouvýběrový t test - příklad Normalita Krabicové grafy t-test zamítáme hypotézu o shodě středních hodnot na hladině významnosti α = 0,05 (Ústav patologické fyziologie LF MU) / 41
6 - rozšíření t testu z angl. ANalysis Of VAriance POUŽITÍ: porovnává střední hodnoty více výběrů (I) H 0 : µ 1 = µ 2 = = µ I H 1 : alespoň dvě střední hodnoty se liší PŘEDPOKLADY: nezávislost, normalita, homoskedasticita ověření normality: exaktně (Shapiro-Wilk, Kolmogorov-Smirnov), N P grafy ověření homoskedasticity: Bartlettův test, Levenův test VÝSLEDKY ANOVA tabulka: Zdroj Součet Počet stupňů Střední součet F p-hodnota variability čtverců volnosti čtverců S skupiny S A I 1 S A /(I 1) A /(I 1) p Se/(n I) reziduální S e n I S e/(n I) celkový S T n 1 V případě platnosti H 0 má testová statistika F F(I 1,n I). (Ústav patologické fyziologie LF MU) / 41
7 Mnohonásobná porovnání Pokud H 0 zamítneme, chceme vědět, mezi kterými soubory je významný rozdíl. VYVÁŽENÉ TŘÍDĚNÍ - rozsahy souborů jsou stejné - Tukeyova metoda NEVYVÁŽENÉ TŘÍDĚNÍ - rozsahy souborů jsou různé - Scheffého metoda, modifikace Tukeyovy - Tukeyova-Kramerova (Tukey HSD) (Ústav patologické fyziologie LF MU) / 41
8 Příklad 15 plodů broskví, 3 stupně zralosti Normalita Homoskedasticita (Ústav patologické fyziologie LF MU) / 41
9 Příklad ANOVA tabulka zamítáme hypotézu o shodě středních hodnot mnohonásobná porovnání: Tukeyova metoda Závěr: Byly zjištěny statisticky významné rozdíly mezi skupinami nezralých a přezrálých broskví a mezi skupinami zralých a přezrálých broskví. (Ústav patologické fyziologie LF MU) / 41
10 Význam předpokladů NEZÁVISLOST: Velmi důležitý předpoklad, musí být splněn, jinak budou výsledky nesmyslné. NORMALITA: ANOVA není příliš citlivá na porušení normality, zvláště je li rozsah každého výběru větší než 20. Při větším porušení se doporučuje použít Kruskalův Wallisův test. HOMOSKEDASTICITA: Mírné porušení nevadí, při větším porušení se doporučuje použít Kruskalův Wallisův test. Test shody rozptylů má smysl provádět až po ověření normality. (Ústav patologické fyziologie LF MU) / 41
11 Modifikace ANOVy One-way ANOVA - jednocestná ANOVA, jednofaktorová ANOVA, jednoduchého třídění (dosud) Two-way ANOVA - dvoucestná ANOVA, dvoufaktorová ANOVA, dvojného třídění - bez interakcí - s interakcemi Three-way ANOVA ANCOVA - Analysis Of Covariance MANOVA - Multinomial Analysis Of Variance RMANOVA - Repeated Measures Analysis Of Variance Kruskalův-Wallisův test - neparametrická ANOVA - založena na pořadí hodnot v celém souboru - testuje se hypotéza o shodě mediánů - mnohonásobná porovnání - obdoba Scheffého a Tukeyovy (Ústav patologické fyziologie LF MU) / 41
12 Shrnutí je statistický test ověřující simultánní shodu středních hodnot sledované veličiny mezi nezávislými soubory, je li rozdělení této veličiny v rámci každého souboru normální a mají li soubory shodné rozptyly. (Ústav patologické fyziologie LF MU) / 41
13 ANOVA (jednocestná) v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics ANOVA One-way ANOVA OK Variables (výběr proměnných): Dependent variable list (závislá proměnná), Categorical predictor (skupinová proměnná) OK More results Assumptions (ověření předpokladů) normalita Normal p-p (v části Distribution of vars within groups) (výběr skupin) OK shoda rozptylů Levene s test, případně Cochran C, Hartley, Bartlett Summary All effects/graphs (ANOVA tabulka) (pokud zamítneme H 0 ) Post-hoc Scheffé, případně Tukey HSD, případně další Poznámka: Zkoumáme li vliv více kategoriálních proměnných na hodnotu závisle proměnné, použijeme vícecestnou ANOVu (dvoucestnou, trojcestnou atd.). V programu Statistica ji realizujeme stejně jako je uvedeno výše s jednou obměnou: pro ANOVu bez interakcí: Statistics ANOVA Main effects ANOVA... pro ANOVu s interakcemi: Statistics ANOVA Factorial ANOVA... (Ústav patologické fyziologie LF MU) / 41
14 Dvě náhodné veličiny X, Y nominálního typu (X... r úrovní, Y... s úrovní). n... rozsah výběru KONTINGENČNÍ TABULKA - četnostní tabulka Y\X x [1] x [2]... x [r] součet y [1] n 11 n n 1r n 1. y [2] n 21 n n 2r n y [s] n s1 n s2... n sr n s. součet n.1 n.2... n.r n Testujeme hypotézu H 0: X a Y jsou nezávislé H 1: X a Y jsou závislé (Ústav patologické fyziologie LF MU) / 41
15 Testování nezávislosti Pearsonův χ 2 test asymptotický test porovnává zjištěné četnosti s teoretickými (za platnosti H 0) v případě platnosti H 0 má statistika ( r s χ 2 nij n i.n.j n = i=1 j=1 n i. n.j n podmínka dobré aproximace: n i.n.j n > 5 ) 2 χ 2 ((r 1)(s 1)) Cramérův koeficient (Cramérovo V) V = χ 2 n(min{r,s} 1) Rozmezí V Závislost 0 0, 1 zanedbatelná 0, 1 0, 3 slabá 0, 3 0, 7 střední 0, 7 1, 0 silná - jedná se o obdobu korelačního koeficientu pro nominální veličiny - nabývá hodnot mezi 0 a 1 - určuje míru asociace mezi X a Y (Ústav patologické fyziologie LF MU) / 41
16 Testování nezávislosti Fisherův exaktní test Pro 2 2 Y\X x [1] x [2] součet y [1] a b a+b y [2] c d c +d součet a+c b +d n Pravděpodobnost, že náhodným výběrem vznikne tato tabulka s fixovanými marginálními četnostmi: ) P = ( a+b )( c+d b c ( n ) a+c p-hodnota testu nezávislosti = součet všech P, které více odporují H 0 při fixovaných marginálních četnostech (Ústav patologické fyziologie LF MU) / 41
17 Příklad 1 tabulka Ověření podmínky dobré aproximace: /758. = 52,54 > 5 Pearsonův χ 2 test Výsledky: Závěr: Nezamítáme hypotézu o nezávislosti obezity a genotypu. (Ústav patologické fyziologie LF MU) / 41
18 Příklad 2 tabulka Ověření podmínky dobré aproximace: 8.7/18. = 3,11 5 Fisherův exaktní test Výsledky: Závěr: Zamítáme hypotézu o nezávislosti pohlaví a diagnózy. (Ústav patologické fyziologie LF MU) / 41
19 Shrnutí Testování nezávislosti v kontingenčních tabulkách slouží ke zjištění možné asociace mezi náhodnými veličinami nominálního typu. Míru této asociace lze měřit. (Ústav patologické fyziologie LF MU) / 41
20 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Basic Statistics/Tables Tables and banners OK Specify tables (select variables) (výběr proměnných): List1 (1. proměnná), List2 (2. proměnná) OK OK (kontingenční tabulka) Summary (ověření podmínky dobré aproximace pro použití Pearsonova χ 2 testu) Options zatrhnout Expected frequencies Summary (Pearsonův χ 2 test) Options zatrhnout Pearson & M-L Chi-square, případně ještě Phi(2 2) & Cramér s V & C Advanced Detailed two-way tables (Fisherův exaktní test) Options zatrhnout Fisher exact, Yates, McNemar (2 2) Advanced Detailed two-way tables (Ústav patologické fyziologie LF MU) / 41
21 Vymezení pojmu je soubor statistických metod používaných k popisu a analýze dat, které mají charakter časového intervalu. Původně vyvinuta pro epidemiologické studie - předmětem zájmu byla doba zahájení léčby pacienta a jeho úmrtí. Je používaná např. v sociologii, ekonomii, strojírenství (jako doba je např. čas mezi ztrátou zaměstnání a získání nového, čas od zavedení stroje do jeho poruchy). Časový interval má jasně stanovený začátek (vstupní událost) a konec (sledovaná událost). (Ústav patologické fyziologie LF MU) / 41
22 Cenzorování Při dlouhodobém sledování pacientů bychom získali skutečnou dobu každého z nich. Bohužel, z technický, ekonomických a jiných důvodů je takové sledování obtížné, nebo přímo nemožné. Pozorování probíhá jen po určitou dobu (délka studie). Pro část pacientů je doba neznámá, a to v důsledku: - během doby pozorování se sledovaná událost u pacienta nevyskytla - pacient je ztracen z pozorování (např. v důsledku migrace) - pacient v době pozorování zemřel z jiné příčiny, než je sledovaná událost Proto dále pracujeme jen z částečnou informací - tomuto jevu se říká cenzorování. Ve výše uvedených případech víme pouze to, že doba pacienta je větší než doba, po níž byl pozorován cenzorování zprava (right-censoring). (Ústav patologické fyziologie LF MU) / 41
23 Doba T Doba mezi vstupní a sledovanou událostí se označuje jako doba T. - náhodná veličina nabývající kladných hodnot distribuční funkce F(t) = P(T t) F(t) je pravděpodobnost, že doba je menší nebo rovna t (Ústav patologické fyziologie LF MU) / 41
24 Funkce S(t) Vhodnější a častější k popisu analýzy je funkce S(t) = 1 F(t) = P(T > t) S(t) je pravděpodobnost, že pacient přežije čas t, tj. jeho doba je větší než t (v čase t pro něj sledovaná událost nenastane) (Ústav patologické fyziologie LF MU) / 41
25 Riziková funkce h(t) Další důležitá charakteristika v analýze je riziková funkce. Jedná se o intenzitu výskytu sledované události v čase závislou na délce (míra úmrtnosti pacientů v čase t za předpokladu, že se tito pacienti času t dožili). Mezi S(t) a h(t) existuje jednoznačný vztah. Na rozdíl od S(t) může být riziková funkce: - rostoucí (např. pro lidskou populaci straší 65 let) - klesající (např. novorozenecká úmrtnost, většina onkologických onemocnění) - konstantní (např. úmrtnost v produktivním věku, pokročilá chronická onemocnění) - vaničková - kombinuje klesající, konstantní i rostoucí průběh (typická pro úmrtnost v celé lidské populaci, kdy po narození klesá a ve stáří roste) (Ústav patologické fyziologie LF MU) / 41
26 Metody analýzy 1. Metody parametrické - vyžadují splnění předpokladů o pravděpodobnostním rozdělení doby T 2. Metody neparametrické - nevyžadují zvláštní předpoklady o rozdělení pravděpodobnosti doby T - nejčastěji používané - mezi nejpoužívanější patří Kaplanova-Meierova metoda a metoda odhadu pomocí úmrtnostních tabulek (life-table) 3. Metody semi-parametrické - nevyžadují předpoklady o rozdělení pravděpodobnosti doby T - pracují s parametry a regresními koeficienty - nejznámější Coxův regresní model proporcionálních rizik (Ústav patologické fyziologie LF MU) / 41
27 Metody analýzy Kaplanova-Meierova metoda Neparametrický odhad prostřednictvím dob t i v případě cenzorovaných pozorování. n pacientů, u k z nich dojde během pozorování k výskytu sledované události (k z nich během pozorování zemřelo) Časové okamžiky: t 1 < t 2 < < t k Odhad funkce : S(t j) = k j=1 ( 1 n j d j ) - n j...počet pacientů, kteří jsou ještě naživu v čase t j - d j...počet úmrtí v čase t j Grafem je schodovitá funkce (Ústav patologické fyziologie LF MU) / 41
28 Metody analýzy Life-table odhad Tato metoda je principiálně stejná jako Kaplanova-Meierova metoda. Rozdíl: definovány časové intervaly pevně dané velikosti. Odhad funkce : S(j) = ( ) j i=1 1 d j n j 2 1 c j - n j...počet pacientů, kteří jsou ještě naživu na počátku j tého intervalu - d j...počet úmrtí během intervalu j - c j...počet cenzorování v intervalu j (Ústav patologické fyziologie LF MU) / 41
29 Metody analýzy Porovnání obou metod Předpoklady: Kaplanova-Meierova metoda v riziku všichni pacienti s cenzorovaným časem Life-table odhad v riziku polovina pacientů s cenzorovaným časem Vyskytuje li se ve stejném časovém okamžiku úmrtí i cenzorování, je nepřesné předpokládat, že všechna úmrtí předchází všem cenzorováním (jak předpokládá Kaplanova-Meierova metoda), proto je vhodnější použití life-table. v případě výskytu úmrtí i cenzorování ve stejném čase Kaplanova-Meierova metoda pravděpodobnost oproti life-table metodě mírně nadhodnocuje Kaplanův-Meierův odhad je vhodnější použít pro klinické studie (kde jsou k dispozici přesné údaje o době pacientů). Metody úmrtnostních tabulek je vhodnější použít v populačních analýzách (kde je výskyt úmrtí a cenzorování ve stejném čase častější - velký počet pacientů, méně přesné zaznamenávání dob pacientů). (Ústav patologické fyziologie LF MU) / 41
30 Metody analýzy Log-rank test Běžný problém v klinických studíıch je porovnání dvou a více křivek, např. při zkoumání vlivu nového léčiva na dobu onkologických pacientů. Pro tato srovnání existuje několik statistických testů: - log-rank test - obecný Wilcoxonův test - Tarone-Ware test - Peto-Peto test - Fleming-Harrington test Všimneme si log-rank testu. (Ústav patologické fyziologie LF MU) / 41
31 Metody analýzy Log-rank test Jedná se v podstatě o χ 2 test. Log-rank statistika χ 2 = (O i E i ) 2, i = 1,2 Var(O i E i ) O i E i = n j=1 (m ij e ij ) - m ij...počet pozorovaných jevů v čase j v souboru i - e ij...očekávaný ( počet jevů v čase j v souboru i nij - e ij = )(m n 1j +n 1j +m 2j ) 2j Var(O i E i ) = n j=1 n 1j n 2j (m 1j +m 2j )(n 1j +n 2j m 1j m 2j ) (n 1j +n 2j ) 2 (n 1j +n 2j 1) H 0: Neexistuje rozdíl mezi křivkami H 1: Neplatí H 0 V případě platnosti H 0 má testová statistika χ 2 χ 2 (1). (Ústav patologické fyziologie LF MU) / 41
32 Log-rank test Příklad Data a křivky (Ústav patologické fyziologie LF MU) / 41
33 Log-rank test Příklad Data a výsledek log-rank testu Závěr: Zamítáme hypotézu o shodě křivek mezi skupinami A a B. (Ústav patologické fyziologie LF MU) / 41
34 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Advanced Linear/Nonlinear Models Survival Analysis (Kaplanova-Meierova metoda) Kaplan & Meier product limit method OK Variables (survival times & censoring indicator) (výběr proměnných): Survival times (or dates) (proměnná obsahující doby ), Censoring indicator (proměnná obsahující informace o cenzorování) OK doplnit do Code for complete responses hodnotu, kterou kódujeme necenzorovaná data, a do Code for censored responses hodnotu, kterou kódujeme cenzorovaná data Survival times vs. cum. proportion surviving, případně další možnosti (life table metoda) Life tables & Distributions (výběr proměnných stejný jako u Kaplanovy-Meierovy ) + možnost zvolit počet intervalů v části Compute table based on: Number of intervals OK Function plots Plot of survival function, případně další možnosti (log rank test) Comparing two samples OK (výběr proměnných jako u Kaplanovy-Meierovy ) + zvolit Grouping variable (skupinová proměnná) OK (výsledek testu) Two-sample tests Log-rank test (křivky ) Function plots Cum. prop. surviving by group (Kaplan Meier) (Ústav patologické fyziologie LF MU) / 41
35 Cíle a použití Jedna z vícerozměrných statistických metod ( hlavních komponent, faktorová, diskriminační, korespondenční,...). CÍL: roztřídění n objektů, z nichž každý je popsán p znaky, do pokud možno stejnorodých skupin (shluků, clusterů) shlukování POŽADAVEK: aby si objekty uvnitř shluku byly podobné co nejvíce, naopak objekty z různých shluků co nejméně Používá se spíše jako průzkumová metoda, slouží jako vodítko k dalšímu zpracování dat (např. k odhalení odlehlých objektů). (Ústav patologické fyziologie LF MU) / 41
36 Podobnost objektů Posuzujeme podle různých měr vzdálenosti mezi objekty. Vzdálenost je vyjádřena pomocí metriky, např. Eukleidovská vzdálenost d ij = p k=1 (x ik x jk ) 2 manhattanská (taxikářská) vzdálenost d ij = p k=1 x ik x jk A A B B např. Objekt Věk (l) Výška (cm) Váha (kg) Eukl. vzdál.: d 12 = (24 45) 2 +( ) 2 +(77 79) 2 = 31,89 manh. vzdál.: d 12 = = 35 Vzdálenosti mezi objekty se uspořádají do matice vzdáleností. (Ústav patologické fyziologie LF MU) / 41
37 Hierarchické shlukování Nejčastěji používaná je aglomerativní hierarchická procedura - postupné slučování objektů od nejbližších ke stále vzdálenějším. Návod: 1. Každý objekt - samostatný shluk. 2. Nalezneme dva shluky, jejichž vzdálenost je minimální. 3. Ty sloučíme do nového, většího shluku a přepočítáme matici vzdáleností. 1. krok 2. krok 3. krok (n-1). krok 4. krok (Ústav patologické fyziologie LF MU) / 41
38 Hierarchické shlukování Vzdálenosti mezi shluky Metoda nejbližšího souseda: vzdálenost mezi shluky je dána jako nejmenší vzdálenost mezi jejich objekty Metoda nejvzdálenějšího souseda: vzdálenost mezi shluky je dána jako největší vzdálenost mezi jejich objekty Metoda průměrné vazby: vzdálenost mezi shluky je průměrem ze všech vzdáleností mezi jejich objekty Odstranění vlivu měřítka veličin: standardizací. (Ústav patologické fyziologie LF MU) / 41
39 Dendrogram Výsledky aglomerativního hierarchického shlukování se zpravidla graficky vyjadřují pomocí dendrogramu. (Ústav patologické fyziologie LF MU) / 41
40 Další shlukování ní metodou nejbližších těžišt (K-Means) - musí být předem znám počet shluků - postup založen na nejbližším těžišti - do shluku je zařazen objekt, jehož vzdálenost od těžiště je nejmenší - neznáme li těžiště shluků, pak se určují iterativním výpočtem z dat ní metodou optimálních středů (medoidů) - optimální střed shluku (medoid) - takový střední objekt, pro nějž platí, že průměrná vzdálenost k ostatním objektům v tomto shluku je minimální (Ústav patologické fyziologie LF MU) / 41
41 v programu Statistica Po spuštění programu Statistica a načtení dat postupujeme následovně: Statistics Multivariate Exploratory Techniques Cluster Analysis Joining (tree clustering) OK Variables (výběr proměnných) - zvoĺıme, které proměnné chceme zahrnout do analýzy OK Advanced v části Cluster zvoĺıme Cases (rows), v části Amalgamation (linkage) rule zvoĺıme metodu pro určení vzdáleností mezi shluky, v části Distance measure zvoĺıme typ metriky (vzdálenosti) OK Verticle icile plot nebo Horizontal hierarchical tree plot, v případně další možnosti Poznámka: Standardizaci veličin před provedením shlukové analýzy provedeme např. tak, že přímo označíme sloupce, které chceme standardizovat, a zvoĺıme Data Standardize. (Ústav patologické fyziologie LF MU) / 41
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VícePřednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceObsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
VícePříklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VícePSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
VíceVzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
VíceSTATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
VíceKatedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
VíceCvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceStatistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup
Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
VíceAnalýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceÚvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
VícePřednáška X. Testování hypotéz o kvantitativních proměnných
Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
VíceSeminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná
VíceNávod na vypracování semestrálního projektu
Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
Více1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření
1.4 ANOVA Úloha 1 Jednofaktorová ANOVA Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření Bylo měřeno množství DNA hub Fusarium culmorum
Více5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
VíceANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PRINCIPY STATISTICKÉ INFERENCE identifikace závisle proměnné
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceNázev testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
VícePSY117/454 Statistická analýza dat v psychologii Přednáška 10
PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot
VíceSTATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceTESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceStatistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
VíceJednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
VíceAnalýza dat z dotazníkových šetření
Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Víceanalýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceAnalýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu
Analýza rozptylu opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu Analýza rozptylu porovnání více průměrů sledujeme F-statistiku: poměr rozptylu mezi skupinami
VíceMasarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová
Masarykova univerzita v Brně Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Analýza rozptylu Vypracovala: Marika Dienová Vedoucí bakalářské práce: Mgr. Jan Koláček, Ph.D. Brno 2006/2007 Prohlášení Prohlašuji,
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceSeminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceTestování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu
Více4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceVŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
VíceIBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics
IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla
VíceProgram Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
VícePrůzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
VíceDesign Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
VícePřednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VíceTesty nezávislosti kardinálních veličin
Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data
VíceEpidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceA 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21
Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8
VíceFisherův exaktní test
Katedra pravděpodobnosti a matematické statistiky Karel Kozmík Fisherův exaktní test 4. prosince 2017 Motivace Máme kontingenční tabulku 2x2 a předpokládáme, že četnosti vznikly z pozorování s multinomickým
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VícePřednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
VíceANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz DATA, VÝZKUM, ANALÝZY ve výzkumu se střídají fáze prozkoumávací
VíceVybrané partie z biostatistiky
1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Proč neparametrické testy? Pokud provádíte formální analýzu či testování hypotéz (zejména provádíte-li
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VíceUni- and multi-dimensional parametric tests for comparison of sample results
Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita
Více5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Více