Ranní úvahy o statistice
|
|
- Dušan Sedláček
- před 8 lety
- Počet zobrazení:
Transkript
1 Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016
2 Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26
3 Základní pojmy Základní pojmy 3 / 26
4 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... Základní pojmy 4 / 26
5 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... s = 1 N (x i x) N 1 2 i=1 Základní pojmy 4 / 26
6 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26
7 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26
8 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26
9 Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26
10 Testování hypotéz Nulová a alternativní hypotéza Hladina významnosti Chyba I. a II. druhu Testování hypotéz 5 / 26
11 Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26
12 Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26
13 Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26
14 Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26
15 Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26
16 Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26
17 Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26
18 Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26
19 Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26
20 Hladina významnosti Historické souvislosti pozdní 20. léta RONALD FISHER Neymanův přístup dětský a hrozivý pro intelektuální svobodu západu. EGON PEARSON, JERZY NEYMAN Fisherova práce horší než neužitečná. Testování hypotéz Historické souvislosti 8 / 26
21 Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Příklady 9 / 26
22 Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm Testování hypotéz Příklady 9 / 26
23 Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 12, 185cm, 170cm p = 0, 01 Testování hypotéz Příklady 9 / 26
24 Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 12, 185cm, 170cm p = 0, 01 n = 18, 182cm, 165cm p = 0, 001 Testování hypotéz Příklady 9 / 26
25 Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 207, 181cm, 167cm p n = 192, 180cm, 167cm p Testování hypotéz Příklady 9 / 26
26 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26
27 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26
28 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26
29 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26
30 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26
31 Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) P 20 = 1 0, = 0, 64 Testování hypotéz Co to znamená a neznamená? 10 / 26
32 1 Nature, Vol 506, 13. února 2014
33 Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26
34 Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26
35 Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26
36 Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26
37 Chyba I. a II. druhu rozhodnutí nezamítneme H 0 (nevýznamný výsledek) zamítneme H 0 (významný výsledek) skutečnost H 0 platí H 0 neplatí správně chyba II. druhu pravděpodobnost β chyba I. druhu pravděpodobnost α správně Testování hypotéz Chyba I. a II. druhu 13 / 26
38 Chyba I. druhu (α) Chyba II. druhu (β) Testování hypotéz Chyba I. a II. druhu 14 / 26
39 Confidence interval CI průměru při normálním rozdělení CI rozdílu průměrů dvou skupin Confidence interval 15 / 26
40 Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26
41 Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26
42 Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26
43 Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26
44 Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26
45 Interval spolehlivosti (confidence interval) Normální rozdělení a CI průměru Confidence interval CI průměru při normálním rozdělení 17 / 26
46 Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26
47 Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26
48 Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26
49 Odds ratio Šance a pravděpodobnost Čtyřpolní tabulka Odds ratio 19 / 26
50 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
51 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
52 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
53 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
54 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
55 Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26
56 Podíl šancí (odds ratio) tabulka Čtyřpolní onemocnění Ano Ne OR = A C B D = A D C B expozice Ano A C Ne B D OR má svoji p i CI! stejný princip u šance na výléčení při léčbě / bez léčby a pod. Odds ratio Čtyřpolní tabulka 21 / 26
57 Podíl šancí (odds ratio) Příklady onemocnění Ano Ne onemocnění Ano Ne expozice Ano 5 3 Ne 2 6 expozice Ano Ne 8 24 p = 0, 14 OR = 5 (95% CI: 0, 6 42, 8) obsahuje 1 p = 0, 003 OR = 5 (95% CI: 1, 7 14, 6) neobsahuje 1 Odds ratio Příklady 22 / 26
58 Podíl šancí (odds ratio) Příklady onemocnění Ano Ne onemocnění Ano Ne expozice Ano 5 3 Ne 2 6 expozice Ano Ne 8 24 p = 0, 14 OR = 5 (95% CI: 0, 6 42, 8) obsahuje 1 p = 0, 003 OR = 5 (95% CI: 1, 7 14, 6) neobsahuje 1 Odds ratio Příklady 22 / 26
59 Podíl šancí (odds ratio) Interpretace A snižuje riziko B, D zvyšují riziko C statisticky nevýznamný Odds ratio Interpretace 23 / 26
60 Literatura JANA ZVÁROVÁ: Biomedicínská statistika I. Karolinum (2011) SARAH BOSLAUGH & PAUL ANDREW WATTERS: Statistics in a Nutshell O Reilly (2008) REGINA NUZZO: Statistical Errors Nature, Vol. 506 (Feb 13, 2014) R CORE TEAM: R: A language and environment for statistical computing R Foundation for Statistical Computing, Vienna, Austria. URL XKCD: LAT E X 2ε Literatura 24 / 26
61 Příště uvidíte Příště uvidíte 25 / 26
62 Ke stažení
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Aproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33
1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.
Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová
Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Náhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
Přednáška VII. Úvod do testování hypotéz
Přednáška VII. Úvod do testování hypotéz Principy a pojmy testování hypotéz, chyba I. a II. druhu P hodnota a její interpretace Síla testu a souvislost s velikostí vzorku Statistická versus klinická/biologická
Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Návrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Intervalové Odhady Parametrů II Testování Hypotéz
Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství
ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová
ÚVOD DO TESTOVÁNÍ HYPOTÉZ Martina Litschmannová Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu v odhadu parametru náhodné veličiny Testování
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ
MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),
Statistické metody v medicíně II. - p-hodnota
Statistické metody v medicíně II. - p-hodnota Martin Hynek Gennet, Centre for Fetal Medicine, Prague EuroMISE Centre, First Faculty of Medicine of Charles University in Prague p-hodnota p-value (p-level)
Úvod do testování hypotéz
Úvod do testování hypotéz Tato kapitola se zabývá rozhodováním o platnosti statistických hypotéz na základě vybraného pravděpodobnostního modelu chování náhodné veličiny a pozorovaných dat. Statistické
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 9: Úvod do induktivní statistiky Obsah Induktivní statistika... 2 Kdy můžeme zobecňovat?... 2 Logika statistické indukce... 3 Proč nelze jednoduše
Opakování: Nominální proměnná více hodnotová odpověď.
Analýza dat z dotazníkových šetření Cvičení 4. - Zobecňování výběru na populaci Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/37771/ - Seznamte se s dotazníkem a strukturou otázek,
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Testování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
Číselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
Testování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
Statistická a věcná významnost. Statistická významnost. Historie hypotézy a testů. Hypotézy a statistické testy.
Statistická a věcná významnost Statistická významnost Petr Soukup 5.11.2009 Fisher (1925) Historie hypotézy a testů Null and alternative hypothesis (NHST) (Neyman&Pearson, 1937) Dnes běžná praxe a součást
Intervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Statistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné
Manuál pro zaokrouhlování
Manuál pro zaokrouhlování k předmětu Pravděpodobnost a Statistika (PS) Michal Béreš, Martina Litschmannová 19. března 2019 Obsah 1 Úvod 2 2 Obecné poznámky 2 2.1 Typy zaokrouhlování...........................................
I. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
p(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat
Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
7.1. Podstata testu statistické hypotézy
7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
ÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu