MÁME DATA A CO DÁL? Martina Litschmannová
|
|
- Hynek Rohla
- před 5 lety
- Počet zobrazení:
Transkript
1 MÁME DATA A CO DÁL? Martina Litschmannová
2 Obsah Část 1 Analýza dat Základní pojmy Popisná statistika kvalitativního znaku Tabulky četnosti, vizualizace Jak to vypadá v praxi Část 2 Popisná statistika kvantitativního znaku Míry polohy, míry variability, vizualizace, zaokrouhlování
3 Co je to statistika? Google odkazů (čeština), 1, odkazů (angličtina) Teoretická disciplína, která se zabývá metodami sběru a analýzy dat (matematická statistika vs. aplikovaná statistika) Číselný údaj syntetizující vlastnosti datových souborů (četnost, průměr, rozptyl, ) Uspořádaný datový soubor (statistika přístupů na web. stránky, statistika střel na branku, statistika nehodovosti, ekonomické statistiky, ) Real Time Statistics Project pěkná ukázka toho, k čemu lze použít statistické modely
4 Co vypovídá statistika o jednotlivci? Donald Trump podnikatel politik (prezident) američan Statistika nezkoumá jednotlivce jako individualitu, ale jako anonymního nositele některého znaku (činnosti, vlastnosti).
5 Základní pojmy Populace (základní soubor) je soubor nějakých prvků, o kterém chceme statistickými metodami něco vypovídat. Definuje se výčtem nebo pomocí zvolené vlastnosti. O každém prvku umíme rozhodnout, zda do populace patří či nikoliv. Výběr je část dané populace, která má sloužit k odvození závěrů platných pro celou populaci. (Pozor na reprezentativnost výběru!) Statistická jednotka je prvek populace. Statistický znak (proměnná) je nějaká měřitelná (zjistitelná) charakteristika statistické jednotky (hmotnost, pohlaví, ). statistická jednotka výběr populace
6 Typy statistických znaků (proměnných) Nominální varianty jsou ve formátu text nebo číselný kód o každých dvou variantách lze říci, zda jsou různé např. škola, fakulta, obor, výrobce, Další dělení: dichotomické (alternativní), vícekategoriální (množné) Ordinální (pořadová) varianty jsou ve fomátu text, datum nebo číslo u každých dvou variant lze stanovit jejich pořadí např. úroveň vzdělání, známka (A, B,, E), úroveň spokojenosti, Kvalitativní Intervalové (rozdílové) varianty jsou v číselném formátu u každých dvou variant lze určit jejich pořadí a rozdíl např. teplota ve C, chyba měření, Poměrové varianty jsou v číselném formátu (pouze kladná čísla + nulový bod) u každých dvou variant lze určit jejich pořadí, rozdíl a podíl (poměr) např. teplota v K, velikost chyby měření, Kvantitativní (numerické, kardinální) Další dělení: diskrétní, spojité
7 Vlastní pokus o výběrové šetření Dotazník pro studenty (např. pomocí Google Apps) -
8 Základní pojmy Populace (základní soubor) je soubor nějakých prvků, o kterém chceme statistickými metodami něco vypovídat. Výběr je část dané populace, která má sloužit k odvození závěrů platných pro celou populaci. Statistická jednotka je prvek populace. Statistický znak je nějaká měřitelná (zjistitelná) charakteristika statistické jednotky. Časová značka Pohlaví Výška (cm) Váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? Kolik času týdně obvykle věnujete brigádě? :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Kolik času týdně obvykle věnujete studiu?
9 Základní pojmy Časová značka Pohlaví Výška (cm) Váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? Kolik času týdně obvykle věnujete brigádě? :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Kolik času týdně obvykle věnujete studiu? Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.
10 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.
11 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry)
12 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry)
13 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry) Kvalitativní znak znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty např. známka z matematiky)
14 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry) Kvalitativní znak znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty např. známka z matematiky)
15 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry) Kvalitativní znak znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty např. známka z matematiky) Alternativní (dichotomický) znak znak, který nabývá pouze dvou variant
16 Základní pojmy Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru. Kvantitativní znak znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry) Kvalitativní znak znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty např. známka z matematiky) Alternativní (dichotomický) znak znak, který nabývá pouze dvou variant
17 Popisná statistika aneb Jak efektivně popsat a vizualizovat data Část 1 Kvalitativní znak
18 Popisná statistika Kvalitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Respondent (proband) označení statistické jednotky v dotazníkovém šetření Popište strukturu datového souboru v závislosti na pohlaví respondentů.
19 Popisná statistika Kvalitativní znak Tabulka četností Varianta znaku x i Tabulka četností Absolutní četnost n i Relativní četnost p i x 1 n 1 p 1 =n 1 /n x 2 n 2 p 2 =n 2 /n x k n k p k =n k /n Celkem: n 1 +n 2 + +n k =n 1 + Modus (varianta, které znak nabývá s nejvyšší četností)
20 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost muž 66 0, žena 19 0, Celkem: 85 1,
21 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž 66 77, žena 19 22, Celkem: , Jak zaokrouhlovat relativní četnosti? 1,0 % 0,85 osob 0,1 % 0,085 osob
22 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž 66 77, žena 19 22, Celkem: , Pozor na zaokrouhlovací chybu! Jak zaokrouhlovat relativní četnosti? 1,0 % 0,85 osob 0,1 % 0,085 osob
23 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž žena Celkem: Pozor na zaokrouhlovací chybu! Součet musí být 100 %! Jak zaokrouhlovat relativní četnosti? 1,0 % 0,85 osob 0,1 % 0,085 osob
24 Příklad demonstrující problém zaokrouhlovací chyby TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž 77 37,37864 Žena 85 41,26214 Dítě 44 21,35922 Celkem: , % 2,06 osob 0,1 % 0,206 osob Jak zaokrouhlit relativní četnost?
25 Příklad demonstrující problém zaokrouhlovací chyby TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž 77 37,4 Žena 85 41,3 Dítě 44 21,4 POZOR na zaokrouhlovací chybu! Celkem: ,1
26 Příklad demonstrující problém zaokrouhlovací chyby TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž 77 37,4 Žena 85 41,3 Dítě 44 21,3 Celkem: ,0 Dopočet do 100 %!
27 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž? 78 žena? 22 Celkem: Relativní četnosti používejte pouze jako doplněk absolutních četností!
28 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž žena Celkem: Určete modus proměnné pohlaví.
29 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž žena Celkem: Modus = muž Mezi respondenty převažovali muži.
30 Popisná statistika Kvalitativní znak Tabulka četností Tabulka četností Pohlaví Absolutní četnost Relativní četnost (%) muž žena Celkem: Jak data vizualizovat?
31 počet respondentů počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) muž žena 0 muž žena Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme od oka přesně odečíst.
32 Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) muž žena 0 muž žena Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme od oka přesně odečíst.
33 počet respondentů relativní počet respondentů (%) Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) muž žena 0 muž žena Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme od oka přesně odečíst. Pozor na uvádění popisu os!
34 Popisná statistika Kvalitativní znak Zdroj: Srovnávací testy pro žáky 9. tříd Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný.
35 Popisná statistika Kvalitativní znak Zdroj: Srovnávací testy pro žáky 9. tříd Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný Pozor na omezenou vypovídací schopnost grafů!
36 počet respondentů Popisná statistika Kvalitativní znak Sloupcový graf muž žena Nezapomínejte, že méně mnohdy znamená více
37 Popisná statistika Kvalitativní znak I takto může vypadat sloupcový graf Počet
38 Popisná statistika Kvalitativní znak I takto může vypadat sloupcový graf Počet
39 Popisná statistika Kvalitativní znak 3D sloupcový graf Opravdu musí být v každé efektní prezentaci / publikaci? 3D graf může být pro čtenáře matoucí Modrý a zelený sloupec mají stejnou výšku. Odpovídá to tomu, jak obrázek vnímáte? Zvětšíte-li k krát stranu krychle, její objem (to, co vnímáte) se zvětší k 3 krát. Zdroj: Whitbread, David (2001). The design manual (2nd ed.). Sydney: University of New South Wales Press. ISBN
40 CENA PRODUKTU Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Nepoužívejte barevné pozadí grafů! Cena produktů k produkt A produkt B produkt C produkt D produkt E produkt F PRODUKT produkt G produkt H produkt I cena produktu
41 cena produktu Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Neopakujte informace! Cena produktů k cena produktu produkt A produkt B produkt C produkt D produkt E produkt F produkt G produkt H produkt I produkt
42 cena produktu Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Neopakujte informace! V tomto případě je legenda zcela nadbytečná. V případě, že ji potřebujete, zvažte její umístění! Cena produktů k cena produktu produkt A produkt B produkt C produkt D produkt E produkt F produkt G produkt H produkt I produkt
43 cena Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Zvažte úpravu popisku horizontální osy! Cena produktů k produkt A produkt B produkt C produkt D produkt E produkt F produkt produkt G produkt H produkt I
44 produkt A produkt B produkt C produkt D produkt E produkt F produkt G produkt H produkt I cena Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Zvažte úpravu popisku horizontální osy! Cena produktů k produkt
45 cena Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Vždy uvádějte jednotky! Cena produktů k A B C D E F G H I produkt
46 cena (Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Nepoužívejte neefektivní nuly! (Nebo alespoň použijte oddělovače tisíců!) Cena produktů k A B C D E F G H I produkt
47 cena (Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Nepoužívejte neefektivní nuly! (Nebo alespoň použijte oddělovače tisíců!) Cena produktů k A B C D E F G H I produkt
48 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Používejte strukturované nadpisy! Cena produktů k A B C D E F G H I produkt
49 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Zvažte zvýraznění mřížky! Cena produktů (k ) A B C D E F G H I produkt
50 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Nepoužívejte 3D grafy! Cena produktů (k ) A B C D E F G H I produkt
51 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Pokud je to vhodné, seřaďte varianty proměnné! Cena produktů (k ) 0 A B C D E F G H I produkt
52 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy Nejsou-li v grafu uvedeny absolutní četnosti, obvykle je nedokážeme od oka přesně odečíst! Cena produktů (k ) 0 B H E F I C D G A produkt
53 cena (tis. Kč) Popisná statistika Kvalitativní znak Tipy nejen pro sloupcové grafy V případě, že graf je součástí publikace, musí obsahovat titulek. V tomto případě obvykle není třeba používat nadpis grafu. Informace obsažena v nadpisu bývá uváděna v titulku. Cena produktů (k ) B H E F I C D G A produkt
54 Produkce CO2 (tuny na osobu) (% roku 1993) Produkce CO2 (tuny na osobu) USA ČR Který z grafů je správný? USA ČR 120% 100% 100% 80% 60% 40% 20% 98% 96% 94% 92% 0% % USA ČR USA ČR
55 Popisná statistika Kvalitativní znak Výsečový graf 19; 22% 66; 78% muž žena
56 Popisná statistika Kvalitativní znak Prstencový graf 19; 22% muž žena 66; 78%
57 Popisná statistika Kvalitativní znak 3D výsečový graf 19; 22% muž žena 66; 78%
58 Popisná statistika Kvalitativní znak 3D výsečový graf 66; 78% muž žena 19; 22% Pozor na vypovídací schopnost 3D grafů!
59 Popisná statistika Kvalitativní znak 3D vs 2D výsečový graf Jaký je poměr výsečí A a C? Jaký je poměr výsečí B a D?
60 Anketa Jste pro navýšení hodinové dotace matematiky? TAKHLE NE!!! Nezapomínejte, že relativní četnosti byste měli uvádět pouze jako doplněk četností absolutních!
61 Je výsečový graf tou správnou volbou? zdroj:
62 Obrázkové grafy užiteční pomocníci?
63 Obrázkové grafy Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR ( $) a Irsku ( $)
64 Obrázkové grafy Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR ( $) a Irsku ( $)
65 Obrázkové grafy Zdroj: UTTS, Jessica M. Seeing through statistics. 3rd ed. Belmont, CA: Thomson, Brooks/Cole, c2005. ISBN
66 Obrázkové grafy Zdroj: UTTS, Jessica M. Seeing through statistics. 3rd ed. Belmont, CA: Thomson, Brooks/Cole, c2005. ISBN
67 Pár příkladů z praxe
68 Obrázkové grafy užiteční pomocníci? (Zdroj: Mf Dnes, : Zemědělci si rozdělí miliardy. Krávy a vepři se budou mít lépe.
69 Úžasná infografika o výdajích státního rozpočtu České republiky v roce 2013 Zdroj:
70 Zdroj:
71 Příklad s klobásou
72 Příklad s klobásou
73 minimální mzda (Kč) Zdroj: (20. srpna 2015) Kč Vývoj minimální mzdy v ČR od roku 2007 (zdroj: MPSV) Kč Kč Kč
74 Zdroj: Dotyk, týdeník, 34. číslo, , ISSN:
75 Pozor na logaritmické měřítko!
76
77
78 Český export Zdroj:
79 Průzkum o představách studentů o budoucím zaměstnání Zdroj: Mimořádná příloha Mf Dnes, výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: přes tisíc vysokoškoláků ze všech ročníků po celé republice )
80 Průzkum o představách studentů o budoucím zaměstnání Zdroj: Mimořádná příloha Mf Dnes, výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: přes tisíc vysokoškoláků ze všech ročníků po celé republice )
81 Jak výsledky šetření zobrazit správně? Co je pro Vás důležité při výběru zaměstnání? (vyberte 3 pro Vás nejdůležitější faktory) četnost rel. četnost (%) rel. četnost (%) vzhledem k počtu respondentů plat profesní růst atraktivita pracovní pozice pracovní prostředí work-life balance benefity reputace společnosti celkem % ---
82 rel. četnost z 1030 respondentů Jak výsledky šetření zobrazit správně? Co je pro Vás důležité při výběru zaměstnání? 80% 70% 67% 60% 50% 40% 53% 48% 47% 43% 30% 20% 23% 19% 10% 0% plat profesní růst atraktivita pracovní pozice pracovní prostředí work-life balance benefity reputace společnosti
83 Pokuste se o interpretaci! V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z oslovených občanů. Žádné další informace k dané otázce uvedeny nejsou. Zdroj: ( )
84 Informace z vyžádané podrobnější zprávy (na webu není zveřejněna)
85 Analýza je jedním z podkladů pro tvorbu Strategického plánu obce! Pokuste se o interpretaci! V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z oslovených občanů. Žádné další informace k dané otázce uvedeny nejsou. Informace z vyžádané zprávy: Celkový počet odpovědí na tuto otázku byl 686. Celkem 120 občanů (18 % z celkového počtu odpovědí) je nespokojeno s chodníky Titulek k grafu: Graf 10 Podíl výskytu odpovědi na vyjádření občanů, které prvky infrastruktury v obci nejvíce chybí nebo jsou v nevyhovujícím stavu dle podílu z celkového počtu odpovědí Zdroj: ( )
86 Zdroj: original=dotaznikove_setreni_obce_krmelin_vys ledky_10_18.pdf ( ) Co je pro respondenty palčivějším problémem stav chodníků nebo chybějící bankomat? V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z oslovených občanů. Žádné další informace k dané otázce uvedeny nejsou. Informace z vyžádané zprávy: Občané uvedli celkem 160 námětů na chybějící služby v obci. Občanům nejčastěji chybí v obci bankomat (20 % z celkového počtu odpovědí, 32 odpovědí) Titulek k grafu: Graf 6 Vyjádření občanů k otázce, jaké služby jim v obci chybí dle podílů z celkového počtu odpovědí
87 Popisná statistika aneb Jak efektivně popsat a vizualizovat data Část 2 Kvantitativní znak
88 Popisná statistika - Kvantitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Popište a vizualizujte hmotnost respondentů.
89 Popisná statistika - Kvantitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivyděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak byste svou brigádu charakterizoval(a)? brigáda frekvence brigády charakteristika brigády Kolik času týdně obvykle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvykle věnujete studiu? čas věnovaný studiu (h/týden) :38 muž ano každý pracovní den praxe v oboru během studia :41 muž ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů :41 muž ano nepravidelně praxe v oboru během studia :45 žena ano Různě, 2-3 týdně Hlídání dětí :52 žena ano 3 dny v tydnu praxe v oboru během studia Míry polohy: průměr, kvantily Míry variability: rozptyl, směrodatná odchylka, variační koeficient
90 ҧ Popisná statistika - Kvantitativní znak Míry polohy (Aritmetický) průměr: n x = σ i=1 n xi
91 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Zdroj: Swoboda Helmut, Moderní statistika, 1977
92 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Země K Průměrná produkce kuřat (na osobu): 1,0 (denně)
93 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Zdroj: Blesk,
94 Kč % Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Průměrná měsíční mzda (čtvrtletí - absolutně, meziroční změny) Q2/13 Q3/13 Q4/13 Q1/14 Q2/14 Q3/14 Q4/14 Q1/15 Q2/15 21,0 19,0 17,0 15,0 13,0 11,0 9,0 7,0 5,0 3,0 1,0-1,0-3,0 průměrná hrubá nominální mzda (Kč) average gross nominal wage (CZK) nominální mzda po očištění od sezónních vlivů (Kč) nominal wage seasonally adjusted (CZK)
95 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Průměrná rodina má 2,2 dítěte. Zdroj: Swoboda Helmut, Moderní statistika, 1977
96 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 POZOR! n xi Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku. (např. průměrný počet dětí jedné ženy)
97 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže. $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $ $ $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. ($31 830) ($ )
98 Popisná statistika kvantitativní znak
99 ҧ Popisná statistika - Kvantitativní znak Míry polohy (Aritmetický) průměr: n x = σ i=1 n xi POZOR! Pozor na interpretaci průměru! Nepřisuzujme mu vlastnosti, které nemá! Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku. (např. průměrný počet dětí jedné ženy) Průměr není rezistentní vůči odlehlým pozorováním!
100 Popisná statistika kvantitativní znak Míry polohy Aritmetický průměr: x ҧ = σ n i=1 n xi Medián Med (50% kvantil 50 % hodnot je menších nebo rovných mediánů) Dolní kvartil Q1 (25% kvantil 25 % hodnot je menších nebo rovných dolnímu kvartilu) Horní kvartil Q3 (75% kvantil 75 % hodnot je menších nebo rovných hornímu kvartilu) 100p% kvantil 100p % hodnot je menších nebo rovných 100p% kvantilu Speciální typy kvantilů: Kvartily Decily Percentily
101 Kvantily v praxi
102 Kvantily v praxi
103 Kvantily v praxi
104 100p% kvantil hmotnosti (kg) Popisná statistika kvantitativní znak Vizualizace p % Míry polohy Váha (kg) minimum 50 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maximum 130 Kvantilová funkce
105 četnost Popisná statistika - Kvantitativní znak Vizualizace Míry polohy Hmotnost (kg) Minimum 50 Dolní kvartil 68 Průměr 78 Medián 76 Horní kvartil 85 Maximum 130 hmotnost (kg) Histogram
106 četnost Popisná statistika - Kvantitativní znak Vizualizace Další hmotnost (kg) Míry polohy Hmotnost (kg) Minimum 50 Dolní kvartil 68 Průměr 78 Medián 76 Horní kvartil 85 Maximum 130 Histogram Tvar histogramů závisí na počtu tříd (sloupečků)!
107 Popisná statistika - Kvantitativní znak Tvar histogramů závisí na počtu tříd (sloupečků)!
108 Popisná statistika - Kvantitativní znak Histogram doplněný o polygon četnosti
109 Jak se výběrové kvantily určují? Jedna z používaných metod: 1. Výběrový soubor uspořádáme podle velikosti. 2. Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) p%- ní kvantil je roven hodnotě proměnné s pořadím z p, kde z p = np + 0,5. 4. Není-li z p celé číslo, pak daný kvantil určíme jako průměr prvků s pořadím z p a z p.
110 V předložených datech určete 0,3 kvantil (30% kvantil). MN (%) 8,7 7,8 6,8 6,8 7,8 9,7 15,7 6,8 4,9 6,8
111 V předložených datech určete 0,3 kvantil (30% kvantil). MN (%) MN (%) (seřazeno) 8,7 4,9 7,8 6,8 6,8 6,8 6,8 6,8 7,8 6,8 9,7 7,8 15,7 7,8 6,8 8,7 4,9 9,7 6,8 16 z p = np + 0,5
112 V předložených datech určete 0,3 kvantil (30% kvantil). MN (%) MN (%) (seřazeno) 8,7 4,9 7,8 6,8 6,8 6,8 6,8 6,8 7,8 6,8 9,7 7,8 15,7 7,8 6,8 8,7 4,9 9,7 6,8 16 z p = np + 0,5 z 0,3 = 10 0,3 + 0,5 = 3,5
113 V předložených datech určete 0,3 kvantil (30% kvantil). MN (%) MN (%) (seřazeno) 8,7 4,9 7,8 6,8 6,8 6,8 6,8 6,8 7,8 6,8 9,7 7,8 15,7 7,8 6,8 8,7 4,9 9,7 6,8 16 x 0,3 = 6,8 + 6,8 2 = 6, 8 z p = np + 0,5 z 0,3 = 10 0,3 + 0,5 = 3,5
114 Popisná statistika Kvantitativní znak Míry variability K čemu nám jsou dobré? Zdroj:
115 Popisná statistika kvantitativní znak Míry variability Výběrový rozptyl: s 2 = σ i=1 n x i xҧ 2 n 1 POZOR! Jednotka rozptylu je kvadrátem jednotky analyzovaného znaku. σ n i=1 x i xҧ 2 Výběrová směrodatná odchylka: s = n 1 Neumožňuje srovnání variability znaků s různými jednotkami. Variační koeficient: V = s 100 % xҧ Čím nižší var. koeficient, tím homogennější soubor. V > 50 % značí silně rozptýlený soubor. (empirické doporučení) Rozpětí: R = max min Interkvartilové rozpětí: IQR = x 0,75 x 0,25
116 Proč se pro směrodatnou odchylku někdy používá symbol s a jindy symbol σ? Míry variability Výběrová směrodatná odchylka: s = σ n i=1 x i xҧ 2 n 1 Populační směrodatná odchylka: σ = σ i=1 N x i xҧ 2 N N rozsah populace, tj. pro výpočet musíme mít k dispozici všechna data ze základního souboru (populace), tj. musíme provést úplné šetření. Lze ukázat, že nejlepším odhadem populační směrodatné odchylky je výběrová směrodatná odchylka: σ s
117 Jakou představu o variabilitě dat nám dává směrodatná odchylka? Obecně platí tzv. Chebyshevova nerovnost Mají-li data libovolné rozdělení s konečným průměrem (μ) a konečnou sm. odchylkou (σ), pak nejméně 1 1 k % variant leží v intervalu μ kσ; μ + kσ. k > 0: P μ kσ < X < μ + kσ > 1 1 k 2 k P(μ kσ < X < μ + kσ) (tj. pravděpodobnost, že data leží v intervalu μ kσ; μ + kσ ) 1 > 0 % 2 > 75 % 3 > 88 %
118 hustota pravděpodobnosti Jakou představu o variabilitě dat nám dává směrodatná odchylka? Obecně platí tzv. Chebyschevova nerovnost Mají-li data libovolné rozdělení s konečným průměrem (μ) and konečnou sm. odchylkou (σ), pak nejméně 1 1 k % variant leží v intervalu μ kσ; μ + kσ. nejméně 88 % nejméně 75 %
119 Jakou představu o variabilitě dat nám dává směrodatná odchylka? Pro data, která mají normální rozdělení platí: Mají-li data normální rozdělení (obálka histogramu odpovídá Gaussově křivce (zvonovitý tvar)) s konečným průměrem (μ) a konečnou sm. odchylkou (σ), pak: k P(μ kσ < X < μ + kσ) (tj. pravděpodobnost, že data leží v intervalu μ kσ; μ + kσ ) 1 68 % 2 95 % 3 99,7 %
120 hustota pravděpodobnosti Jakou představu o variabilitě dat nám dává směrodatná odchylka? Pro data, která mají normální rozdělení platí: Mají-li data normální rozdělení (obálka histogramu odpovídá Gaussově křivce (zvonovitý tvar)) s konečným průměrem (μ) a konečnou sm. odchylkou (σ), pak:
121 Odlehlá pozorování ty hodnoty proměnné, které se mimořádně liší od ostatních hodnot a tím ovlivňují např. vypovídací hodnotu průměru. Jak postupovat v případě, že v datech identifikujeme odlehlá pozorování? V případě, že odlehlost pozorování je způsobena: hrubými chybami, překlepy, prokazatelným selháním lidí či techniky... důsledky poruch, chybného měření, technologických chyb... tzn., známe-li příčinu odlehlosti a předpokládáme-li, že již nenastane, jsme oprávněni tato pozorování vyloučit z dalšího zpracování. V ostatních případech je nutno zvážit, zda se vyloučením odlehlých pozorování nepřipravíme o důležité informace o jevech vyskytujících se s nízkou četností.
122 Identifikace odlehlých pozorování Metoda vnitřních hradeb x x,5iqr x x 1, 5IQR x je odlehlým pozorování m i 0,25 1 i 0, 75 i Dolní mez vnitřních hradeb Horní mez vnitřních hradeb
123 Identifikace extrémních pozorování Metoda vnějších hradeb x x IQR x x 3IQR x je extrémním pozorování m i 0, 25 3 i 0, 75 i Dolní mez vnějších hradeb Horní mez vnějších hradeb
124 V předložených datech identifikujte odlehlá pozorování: MN 0,25 = 6, 8 MN 0,5 =7,3 MN 0,75 = 8,7 MN (%) 4,9 6,8 6,8 6,8 6,8 7,8 7,8 8,7 9,7 15,7 IQR = MN 0,75 MN 0,25 = 1,9 1,5 IQR = 2,85 Vnitřní hradby: Dolní mez: 6,8 2,85 = 3, 95 Horní mez: 8,7 + 2,85 = 11, 55
125 V předložených datech identifikujte odlehlá pozorování: MN 0,25 = 6, 8 MN 0,5 =7,3 MN 0,75 = 8,7 MN (%) 4,9 6,8 6,8 6,8 6,8 7,8 7,8 8,7 9,7 15,7 IQR = MN 0,75 MN 0,25 = 1,9 1,5 IQR = 2,85 Vnitřní hradby: Dolní mez: 6,8 2,85 = 3, 95 Horní mez: 8,7 + 2,85 = 11, 55
126 Identifikace odlehlých pozorování z souřadnice z souřadnice i = x i xҧ s Je-li z souřadnice i > 3, je x i odlehlým pozorováním. Zase nový vzorec?
127 Identifikace odlehlých pozorování z souřadnice z souřadnice i = x i xҧ s Je-li z souřadnice i > 3, je x i odlehlým pozorováním. Ne, jde jen o jinou podobu pravidla 3σ!
128 Popisná statistika - Kvantitativní znak Míry variability Hmotnost (kg) Rozptyl 215,3893 Směrodatná odchylka 14,67615 Variační koeficient (%) 18,90576 Jak zaokrouhlovat výběrové charakteristiky? Směrodatnou odchylku zaokrouhlujeme nahoru na k platných cifer, kde k závisí na rozsahu výběru. Míry polohy zaokrouhlujeme následně na stejný řád.
129 Popisná statistika - Kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Rozsah výběru = 29 Směrodatnou odchylku zaokrouhlujeme nahoru na 2 platné cifry. Míry polohy zaokrouhlujeme následně na stejný řád. Míry polohy Váha (kg) zaokrouhleno minimum 50 dolní kvartil 68 průměr 77,62791 medián 75,5 horní kvartil 84,5 maximum 130 Míry variability směrodatná odchylka 14,67615 variační koeficient (%) 18,90576
130 Popisná statistika - Kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Rozsah výběru = 29 Směrodatnou odchylku zaokrouhlujeme nahoru na 2 platné cifry. Míry polohy zaokrouhlujeme následně na stejný řád. Míry polohy Váha (kg) zaokrouhleno minimum 50 dolní kvartil 68 průměr 77,62791 medián 75,5 horní kvartil 84,5 maximum 130 Míry variability směrodatná odchylka 14, variační koeficient (%) 18,90576 zaokrouhlujeme nahoru na 1-2 platné cifry
131 Popisná statistika - Kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Rozsah výběru = 29 Směrodatnou odchylku zaokrouhlujeme nahoru na 2 platné cifry. Míry polohy zaokrouhlujeme následně na stejný řád. Míry polohy Váha (kg) zaokrouhleno minimum 50 dolní kvartil průměr 77, medián 75,5 76 horní kvartil 84,5 85 maximum 130 Míry variability směrodatná odchylka 14, variační koeficient (%) 18,90576 zaokrouhlujeme na stejný řád jako směrodatnou odchylku
132 Popisná statistika - Kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Rozsah výběru = 29 Směrodatnou odchylku zaokrouhlujeme nahoru na 2 platné cifry. Míry polohy zaokrouhlujeme následně na stejný řád. Míry polohy Váha (kg) zaokrouhleno minimum dolní kvartil průměr 77, medián 75,5 76 horní kvartil 84,5 85 maximum Míry variability směrodatná odchylka 14, variační koeficient (%) 18,90576 nezaokrouhlujeme (údaj vybrán z datového souboru) nezaokrouhlujeme (údaj vybrán z datového souboru)
133 Popisná statistika - Kvantitativní znak Jak zaokrouhlovat výběrové charakteristiky? Rozsah výběru = 29 Směrodatnou odchylku zaokrouhlujeme nahoru na 2 platné cifry. Míry polohy zaokrouhlujeme následně na stejný řád. Míry polohy Váha (kg) zaokrouhleno minimum dolní kvartil průměr 77, medián 75,5 76 horní kvartil 84,5 85 maximum Míry variability směrodatná odchylka 14, variační koeficient (%) 18, ,9 zaokrouhlujeme na desetiny % (potřebujeme srovnávat s 50 %)
134 Další způsoby vizualizace kvantitativní proměnné
135 Popisná statistika - Kvantitativní znak Vizualizace Krabicový graf s vousama (Box and whisker plot) odlehlá pozorování, tj. defaultně: data ležící vně vnitřních hradeb není definováno jednoznačně, v R je to defaultně nastaveno jako max(data)[data<horní mez vnitřních hradeb] horní kvartil medián dolní kvartil není definováno jednoznačně, v R je to defaultně nastaveno jako min(data)[data>dolní mez vnitřních hradeb] boxplot(data) # nebo boxplot(data,range = 1.5) # parametrem range lze modifikovat velikost hradeb
136 Odhad hustoty pravděpodobnosti
137 Empirická distribuční funkce
138 Posuzování normality na základě explorační analýzy pro vybrané typy výběrových souborů
139 Q-Q graf Jak to funguje? výběrový 30% kvantil teoretický 30% kvantil Pokud jsou data výběrem z daného rozdělení, výběrové a teoretické kvantily by měly být shodné.
140 Q-Q graf
141 Q-Q graf
142
143
144 Q-Q graf ve tvaru S
145
146 Jak ověřit shodu rozptylů dvou populací na základě explorační analýzy? s A = 36 mah s D = 38 mah s2 max s min ,12 < 2 nepředpokládáme, že výběry pocházejí z populací s různými rozptyly
147 Jak ověřit shodu rozptylů dvou populací na základě explorační analýzy? s A = 36 mah s B = 15 mah s2 max s min ,76 > 2 předpokládáme, že výběry pocházejí z populací s různými rozptyly
148 Pár tipů pro zpracování domácích úkolů
149 Výrobce \ Kvalita Vyhovující Nevyhovující Celkem A 45 (62,5%) 27 (37,5%) 72 B 32 (49,2%) 33 (50,8%) 65 C 28 (46,7%) 32 (53,3%) 60 D 52 (71,2%) 21 (28,8%) 73 Celkem 157 (58,1%) 113 (41,9%) 270 Příliš barviček škodí dobrému dojmu Každá tabulka a každý obrázek musí mít výstižný titulek! Nezařazujte tabulky a obrázky, na něž se v dalším textu neodkazujete. Tabulky a grafy by měly být v myšlenkovém souladu.
150 Výrobce \ Kvalita Vyhovující Nevyhovující Celkem A 45 (62,5%) 27 (37,5%) 72 B 32 (49,2%) 33 (50,8%) 65 C 28 (46,7%) 32 (53,3%) 60 D 52 (71,2%) 21 (28,8%) 73 Celkem 157 (58,1%) 113 (41,9%) 270 Tab. 1: Zastoupení různých typů akumulátorů (dle kvality) pro jednotlivé výrobce Obr. 1: Zastoupení různých typů akumulátorů (dle kvality) pro jednotlivé výrobce
151 Obr. 2 : Krabicové grafy výrobců Každá tabulka a každý obrázek musí mít výstižný titulek! Standardní součástí grafů je popis os. Chceme-li grafy používat k vzájemnému porovnávání výsledků, snažíme se používat stejné rozsahy os.
152 Obr. 2 : Srovnání kapacit akumulátorů po 5 nabíjecích cyklech (mah) dle výrobců (krabicový graf)
153 Obr. 3 : Srovnání kapacit akumulátorů po 5 nabíjecích cyklech (mah) výrobců A a B Naučte se grafy efektivně kombinovat!
154 DĚKUJI ZA POZORNOST!
VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS
VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS Martina Litschmannová Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky, Katedra aplikované matematiky ŠKOMAM 19 29. 1. 2019
STATISTIKA S EXCELEM. Martina Litschmannová MODAM,
STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216 Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,
Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak získat data?
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Přednáška 5. Výběrová šetření, Exploratorní analýza
Přednáška 5 Výběrová šetření, Exploratorní analýza Pravděpodobnost vs. statistika Výběrová šetření aneb jak získat výběrový soubor Exploratorní statistika aneb jak popsat výběrový soubor Typy proměnných
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry
Červenou barvou jsou poznámky, věci na které máte při vypracovávání úkolu myslet. Úkol 1 a) Pomocí nástrojů explorační analýzy analyzujte kapacity akumulátorů výrobce A po 5 a po 100 nabíjecích cyklech.
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? Google 196.10 6 odkazů (čeština), 2,88.10 9 odkazů (angličtina)
Popisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika
Nejčastější chyby v explorační analýze
Nejčastější chyby v explorační analýze Obecně doporučuju přečíst přednášku 5: Výběrová šetření, Exploratorní analýza http://homel.vsb.cz/~lit40/sta1/materialy/io.pptx Použití nesprávných charakteristik
Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Metodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT
EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka
ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Manuál pro zaokrouhlování
Manuál pro zaokrouhlování k předmětu Pravděpodobnost a Statistika (PS) Michal Béreš, Martina Litschmannová 19. března 2019 Obsah 1 Úvod 2 2 Obecné poznámky 2 2.1 Typy zaokrouhlování...........................................
VŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Číselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 2. POPISNÉ STATISTIKY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz CO SE SKRÝVÁ V DATECH data sbíráme proto, abychom porozuměli
marek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku
Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v
Základy pravděpodobnosti a statistiky. Popisná statistika
Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,
Náhodná veličina a rozdělení pravděpodobnosti
3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro
STATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Př. : Stanovte jednotlivé četnosti a číselné charakteristiky zadaného statistického souboru a nakreslete krabicový graf:, 8, 7, 43, 9, 47, 4, 34, 34, 4, 35. Statistický soubor seřadíme vzestupně podle
Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.
Metody sociálních výzkumů Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Statistika Význam slova-vychází ze slova stát, s jeho administrativou
Analýza dat s využitím MS Excel
Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti
Popisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
Popisná statistika. Jaroslav MAREK. Univerzita Palackého
Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí
Praktická statistika. Petr Ponížil Eva Kutálková
Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo
JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová
JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE
STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
Renáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
Základní statistické charakteristiky
Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické
Tabulka 1. Výběr z datové tabulky
1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat
Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1
Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
Aplikovaná statistika v R
Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15 Co bude náplní našich
VŠB Technická univerzita Ostrava
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: PRAVDĚPODOBNOST A STATISTIKA Domácí úkoly Zadání 21 DATUM ODEVZDÁNÍ
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Deskriptivní statistika (kategorizované proměnné)
Deskriptivní statistika (kategorizované proměnné) Nejprve malé opakování: - Deskriptivní statistika se zabývá popisem dat, jejich sumarizaci a prezentací. - Kategorizované proměnné jsou všechny proměnné,
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR
STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT Patrícia Martinková Ústav informatiky AV ČR martinkova@cs.cas.cz www.cs.cas.cz/martinkova 1.LF UK, 22. a 30. března 2017 Motivace 1 Velké množství (medicínských
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
JAK MODELOVAT VÝSLEDKY
JAK MODELOVAT VÝSLEDKY NÁHODNÝCH POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za
Třídění statistických dat
2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.
Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky
Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
23. Matematická statistika
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti
mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.
Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Průzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Úvod do kurzu. Moodle kurz. (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost
Úvod do kurzu Moodle kurz (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost Výpočty online: www.statisticsonweb.tf.czu.cz Začátek výuky posunut
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis
Kontingenční tabulky v Excelu. Představení programu Statistica
ASTAc/01 Biostatistika 2. cvičení Kontingenční tabulky v Excelu Základní popisné statistiky Představení programu Statistica Import a základní popis dat ve Statistice, M. Cvanová I. Kontingenční tabulky
Mnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33
1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které
Číselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,
Statistika. pro žáky 8. ročníku. úterý, 26. března 13
Statistika pro žáky 8. ročníku Co je to statistika? Statistika je věda, která se snaží zkoumat reálná data a přibližuje nám zkoumaný jev a zákonitosti s ním spojené. Co nám statistika přináší? Co nám statistika
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
VŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Zadání 11 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA
7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA Oblasti využití statistiky v medicíně Zvládání variability Variabilita: biologická, podmínek, měřících přístrojů - hodnocení variability, variabilita náhodná x nenáhodná
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?
Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.
Mnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka
2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
NÁHODNÁ VELIČINA. 3. cvičení
NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který