STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216
Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního znaku mír poloh, mír variabilit, vizualizace Analýza závislosti dvou kvantitativních znaků koeficient korelace, vizualizace
Motivace Dotazník pro student (např. pomocí Google Apps) -http://goo.gl/forms/z289salpy
Základní pojm Časová značka Pohlaví Výška (cm) Váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? Kolik času týdně obvkle věnujete brigádě? 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? Statistika se zabývá zkoumáním hromadných jevů. Statistický soubor soubor osob, věcí, událostí, časových období, Statistická jednotka prvek statistického souboru (v dotazníkovém šetření nazýváme statistické jednotk respondent) Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme)
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme)
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot Kvalitativní znak znak, jehož variant se liší kvalitou (může jít i o číselné hodnot např. známka z matematik)
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot Kvalitativní znak znak, jehož variant se liší kvalitou (může jít i o číselné hodnot např. známka z matematik)
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot Kvalitativní znak znak, jehož variant se liší kvalitou (může jít i o číselné hodnot např. známka z matematik) Alternativní znak kvalitativní znak, který nabývá pouze dvou možných variant
Základní pojm Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 Statistický znak atribut statistické jednotk (to, co u stat. jednotek zkoumáme) Kvantitativní znak znak, jehož variant nabývají číselných hodnot Kvalitativní znak znak, jehož variant se liší kvalitou (může jít i o číselné hodnot např. známka z matematik) Alternativní znak kvalitativní znak, který nabývá pouze dvou možných variant
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledk šetření? Část I. Kvalitativní znak
Popisná statistika kvalitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26
Popisná statistika kvalitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně kancelářská práce a na ní navazující práce manuální při realizaci projektů 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 1 1.4.216 1:52 žena 188 7 ano 3 dn v tdnu prae v oboru během studia 24 26 POZOR na nutnost čištění databáze!
Popisná statistika kvalitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) POZOR na nutnost čištění databáze!
Popisná statistika kvalitativní znak Rozdělení četnosti + Modus (název nejčetnější variant)
Popisná statistika kvalitativní znak Rozdělení četnosti
Popisná statistika kvalitativní znak Rozdělení četnosti Jak zaokrouhlovat relativní četnost? 1%,85 osob,1%,85 osob
Popisná statistika kvalitativní znak Rozdělení četnosti POZOR na zaokrouhlovací chbu! Jak zaokrouhlovat relativní četnost? 1%,85 osob,1%,85 osob
Popisná statistika kvalitativní znak Rozdělení četnosti POZOR na zaokrouhlovací chbu! Dopočet do 1%! Jak zaokrouhlovat relativní četnost? 1%,85 osob,1%,85 osob
Popisná statistika kvalitativní znak Rozdělení četnosti Relativní četnosti uvádějme vžd pouze jako doplněk absolutních četností, nikoliv samostatně!
Popisná statistika kvalitativní znak Rozdělení četnosti Modus = muž (Mezi respondent převažovali muži.)
Popisná statistika kvalitativní znak Jak výsledk vizualizovat?
počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 6 5 4 3 2 1 muž žena
počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 6 5 4 3 2 1 muž žena
počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 6 5 4 3 2 1 muž žena
počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 66 19 muž žena
počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 66 19 muž žena
241 24 Určete pravdivost tvrzení: V žádných dvou letech nebl počet studentů stejný. Zdroj: Testové příklad určené žákům 9. tříd.
počet respondentů počet respondentů Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 6 7 6 66 5 4 5 4 3 2 3 2 19 1 1 muž žena muž žena Nejsou-li v grafu uveden absolutní četnosti, obvkle je nedokážeme od oka přesně odečíst.
Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 66 8 78 6 7 5 4 3 2 1 19 6 5 4 3 2 1 22 muž žena muž žena Nejsou-li v grafu uveden absolutní (relativní) četnosti, obvkle je nedokážeme od oka přesně odečíst.
počet respondentů relativní počet respondentů (%) Popisná statistika kvalitativní znak Sloupcový graf (Bar Chart) 7 66 8 78 6 7 5 4 3 2 1 19 6 5 4 3 2 1 22 muž žena muž žena Nejsou-li v grafu uveden absolutní (relativní) četnosti, obvkle je nedokážeme od oka přesně odečíst. Pozor na uvádění popisu os!
Popisná statistika kvalitativní znak Výsečový graf 19; 22% 66; 78% muž žena
Popisná statistika kvalitativní znak Prstencový graf 19; 22% muž žena 66; 78%
Popisná statistika kvalitativní znak Výsečový graf 19; 22% 66; 78% muž žena
Popisná statistika kvalitativní znak Výsečový graf 66; 78% muž žena 19; 22%
Anketa Jste pro navýšení hodinové dotace matematik? TAKHLE NE!!!
Zdroj: Testové příklad určené žákům 9. tříd. Co je to A, B, C, D? Jsou výseče odpovídající variantám B a D stejně velké? Lze velikosti jednotlivých výsečí charakterizovat v absolutních číslech i v procentech? Určete pravdivost tvrzení: a) Místo otazníku patří 2%. b) Místo otazníku patří 126 Kč. c) Část C je dvojnásobkem části D. Rozdělení četností kvalitativního znaku se znázorňuje kruhovým diagramem, kde různým hodnotám znaku odpovídají kruhové výseče, jejichž plošné obsah jsou úměrné četnostem. (Prometheus)
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledk šetření? Část II. Kvantitativní znak
Popisná statistika kvantitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden)
Popisná statistika kvantitativní znak Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden) Mír poloh (aritmetický průměr, kvantil) Mír variabilit (rozptl, směrodatná odchlka, variační koeficient) Odlehlá pozorování
Popisná statistika kvantitativní znak Mír poloh Aritmetický průměr: ҧ = σ n i=1 POZOR! n i Průměr je číslo, které nemusí patřit do definičního oboru analzovaného znaku. (např. průměrný počet dětí jedné žen)
Popisná statistika kvantitativní znak Mír poloh Aritmetický průměr: ҧ = σ n i=1 n i V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže. $25 $27 $29 $35 $37 $38 Určete průměrný plat obvatel této vesnice. Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $4. $25 $27 $29 $35 $37 $38 $4 ($31 83) Určete průměrný plat obvatel této vesnice. ($5 741 571)
Popisná statistika kvantitativní znak Mír poloh Aritmetický průměr: ҧ = σ n i=1 POZOR! n i Průměr je číslo, které nemusí patřit do definičního oboru analzovaného znaku. (např. průměrný počet dětí jedné žen) Průměr není rezistentní vůči odlehlým pozorováním.
Popisná statistika kvantitativní znak Mír poloh Aritmetický průměr: ҧ = σ n i=1 n i Medián Med (5% kvantil 5% hodnot je menších nebo rovných mediánů) Dolní kvartil Q1 (25% kvantil 25% hodnot je menších nebo rovných dolnímu kvartilu) Horní kvartil Q3 (75% kvantil 75% hodnot je menších nebo rovných hornímu kvartilu) 1p% kvantil 1p% hodnot je menších nebo rovných 1p% kvantilu
1p% kvantil váh (kg) Popisná statistika kvantitativní znak Mír poloh 14 13 12 11 1 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 1p% Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 Kvantilová funkce
5 55 6 65 7 75 8 85 9 95 1 15 11 115 12 125 13 Další Četnost Popisná statistika kvantitativní znak Mír poloh 18 16 14 12 1 8 6 4 2 Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 váha (kg) Histogram
Četnost Popisná statistika kvantitativní znak Mír poloh 3 25 2 15 1 5 5 59 68 77 86 94 13 112 121 Další váha (kg) Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 Histogram Tvar histogramu závisí na počtu tříd ( sloupečků ).
Četnost Popisná statistika kvantitativní znak Mír poloh 3 25 2 15 1 5 5 59 68 77 86 94 13 112 121 Další váha (kg) Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 Histogram
Popisná statistika kvantitativní znak Odlehlá pozorování 1 váha - rozptlogram 4 6 8 1 12 14 váha (kg) Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13
Popisná statistika kvantitativní znak Odlehlá pozorování 1 4 6 8 1 12 14 váha (kg) medián Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13
Popisná statistika kvantitativní znak Odlehlá pozorování 1 4 6 8 1 12 14 váha (kg) dolní kvartil horní kvartil medián Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 Mezikvartilové rozpětí: IQR = Q3 Q1 < Q1 1,5 IQR > Q3 + 1,5 IQR je odlehlé pozorování vnitřní hradb
Popisná statistika kvantitativní znak Odlehlá pozorování 1 4 6 8 1 12 14 váha (kg) dolní kvartil horní kvartil medián Mír poloh Váha (kg) minimum 5 dolní kvartil 68 průměr 78 medián 76 horní kvartil 85 maimum 13 Mezikvartilové rozpětí: IQR = Q3 Q1 < Q1 1,5 IQR > Q3 + 1,5 IQR je odlehlé pozorování vnitřní hradb
Popisná statistika kvantitativní znak Odlehlá pozorování 1 4 6 8 1 12 14 váha (kg) dolní kvartil horní kvartil medián Mezikvartilové rozpětí: IQR = Q3 Q1 Mír poloh Váha (kg) Váha* (kg) minimum 5 5 dolní kvartil 68 68 průměr 78 77 medián 76 75 horní kvartil 85 83 maimum 13 15 *po odstranění odlehlých pozorování < Q1 1,5 IQR > Q3 + 1,5 IQR je odlehlé pozorování vnitřní hradb
Popisná statistika kvantitativní znak Mír variabilit n i ҧ 2 Výběrový rozptl: s 2 = σ i=1 n 1 POZOR! Jednotka rozptlu je kvadrátem jednotk analzovaného znaku. σ n i=1 i ҧ 2 Výběrová směrodatná odchlka: s = n 1 Neumožňuje srovnání variabilit znaků s různými jednotkami. Variační koeficient: V = s ҧ 1 % Čím nižší var. koeficient, tím homogennější soubor. V > 5% značí silně rozptýlený soubor.
Popisná statistika kvantitativní znak Mír variabilit Váha (kg) Váha* (kg) rozptl 215,3893 169,556311 směrodatná odchlka 14,67615 13,21169 variační koeficient (%) 18,9576 17,78917 *po odstranění odlehlých pozorování Jak zaokrouhlovat výběrové charakteristik? Směrodatnou odchlku jakožto míru nejistot měření zaokrouhlujeme nahoru na jednu, maimálně dvě platné cifr a mír poloh (průměr, kvantil ) zaokrouhlujeme tak, ab nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchlk.
Popisná statistika kvantitativní znak Jak zaokrouhlovat výběrové charakteristik? Směrodatnou odchlku jakožto míru nejistot měření zaokrouhlujeme nahoru na jednu, maimálně dvě platné cifr a mír poloh (průměr, kvantil ) zaokrouhlujeme tak, ab nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchlk. Mír poloh Váha (kg) zaokrouhleno minimum 5 dolní kvartil 68 průměr 77,62791 medián 75,5 horní kvartil 84,5 maimum 13 Mír variabilit směrodatná odchlka 14,67615 variační koeficient (%) 18,9576
Popisná statistika kvantitativní znak Jak zaokrouhlovat výběrové charakteristik? Směrodatnou odchlku jakožto míru nejistot měření zaokrouhlujeme nahoru na jednu, maimálně dvě platné cifr a mír poloh (průměr, kvantil ) zaokrouhlujeme tak, ab nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchlk. Mír poloh Váha (kg) zaokrouhleno minimum 5 dolní kvartil 68 průměr 77,62791 medián 75,5 horní kvartil 84,5 maimum 13 Mír variabilit směrodatná odchlka 14,67615 15 variační koeficient (%) 18,9576
Popisná statistika kvantitativní znak Jak zaokrouhlovat výběrové charakteristik? Směrodatnou odchlku jakožto míru nejistot měření zaokrouhlujeme nahoru na jednu, maimálně dvě platné cifr a mír poloh (průměr, kvantil ) zaokrouhlujeme tak, ab nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchlk. Mír poloh Váha (kg) zaokrouhleno minimum 5 5 dolní kvartil 68 68 průměr 77,62791 78 medián 75,5 76 horní kvartil 84,5 85 maimum 13 13 Mír variabilit směrodatná odchlka 14,67615 15 variační koeficient (%) 18,9576
Popisná statistika kvantitativní znak Jak zaokrouhlovat výběrové charakteristik? Směrodatnou odchlku jakožto míru nejistot měření zaokrouhlujeme nahoru na jednu, maimálně dvě platné cifr a mír poloh (průměr, kvantil ) zaokrouhlujeme tak, ab nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchlk. Mír poloh Váha (kg) zaokrouhleno minimum 5 5 dolní kvartil 68 68 průměr 77,62791 78 medián 75,5 76 horní kvartil 84,5 85 maimum 13 13 Mír variabilit směrodatná odchlka 14,67615 15 variační koeficient (%) 18,9576 18,9 zaokrouhlujeme na desetin %
Popisná statistika aneb Jak jednoduše a přehledně prezentovat výsledk šetření? Část III. Analýza závislosti dvou kvantitativních znaků
Analýza závislosti dvou kvantitativních znaků Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden)
Analýza závislosti dvou kvantitativních znaků Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Vizualizace bodový graf Korelační koeficient Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden)
váha (kg) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 11 Výběrový korelační koeficient: 1 9 8 7 6 5 4 16 17 18 19 2 výška (cm) r = 1 n 1 σ n i=1 i ҧ i ത s X s Y
váha (kg) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 11 Výběrový korelační koeficient: 1 9 8 7 6 5 4 16 17 18 19 2 výška (cm) r = 1 n 1 σ n i=1 i ҧ i ത s X s Y
váha (kg) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 11 Výběrový korelační koeficient: 1 9 8 7 6 5 4 16 17 18 19 2 výška (cm) r X, Y = 1 n 1 σ n i=1 i ҧ i ത s X s Y
Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf Výběrový korelační koeficient: r X, Y = 1 σ n i=1 n 1 i ҧ s X s Y i ത 1. 1 r X, Y 1, 2. r X, Y = r Y, X, 3. r X, X = 1, 4. je-li r X, Y =, říkáme, že X, Y jsou nekorelované náhodné veličin, 5. je-li r X, Y >, říkáme, že X, Y jsou pozitivně korelované (s rostoucím X roste Y), 6. je-li r X, Y <, říkáme, že X, Y jsou negativně korelované (s rostoucím X klesá Y), 7. je-li r X, Y = 1, pak je mezi X a Y lineární závislost.
Korelační koeficient 25 2 15 1 5 1 2
Korelační koeficient 25 2 15 1 5 1 2 r=1
Korelační koeficient 25 2 2 15 1 5 r=1 15 1 5 1 2 1 2
Korelační koeficient 25 2 2 15 1 5 r=1 15 1 5 r= 1 1 2 1 2
Korelační koeficient 25 2 25 2 15 1 5 r=1 15 1 5 r= 1 2 15 1 5 1 2 1 2 1 2
Korelační koeficient 25 2 15 1 5 r=1 2 15 1 5 r= 1 25 2 15 1 5 r=,1 1 2 1 2 1 2
Korelační koeficient 25 2 15 1 5 r=1 2 15 1 5 r= 1 25 2 15 1 5 r=,1 1 2 1 2 1 2 25 2 15 1 5 1 2
Korelační koeficient 25 2 15 1 5 r=1 2 15 1 5 r= 1 25 2 15 1 5 r=,1 1 2 1 2 1 2 25 2 15 1 5 1 2 r=,88
Korelační koeficient 25 2 2 15 25 2 r=,1 15 1 5 r=1 1 5 r= 1 15 1 5 1 2 1 2 1 2 25 25 2 2 15 15 1 1 5 r=,88 1 2 5 1 2
Korelační koeficient 25 2 2 15 25 2 r=,1 15 1 5 r=1 1 5 r= 1 15 1 5 1 2 1 2 1 2 25 25 2 2 15 15 1 1 5 r=,88 1 2 5 r=,86 1 2
Korelační koeficient 25 2 2 15 25 2 r=,1 15 1 5 r=1 1 2 25 2 15 1 5 r=,88 1 2 1 5 25 2 15 1 5 r= 1 1 2 r=,86 1 2 15 1 5 7 6 5 4 3 2 1 1 2 1 2
Korelační koeficient 25 2 15 1 5 r=1 2 15 1 5 r= 1 25 2 15 1 5 r=,1 1 2 1 2 1 2 25 2 15 1 5 r=,88 1 2 25 2 15 1 5 r=,86 1 2 7 6 5 4 3 2 1 r=,4 1 2
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 1 2
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 1 2 r=,93
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 1 2 r=,93 1 8 6 4 2 1 2
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 1 2 r=,93 1 8 6 4 2 r= 1 2
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 r=,93 1 2 1 8 6 4 2 r= 1 2 7 6 5 4 3 2 1 1 2 3 4 5 6
Korelační koeficient 3,5 3 2,5 2 1,5 1,5 7 6 5 4 3 2 1 r=,93 1 2 1 2 3 4 5 6 1 8 6 4 2 7 6 5 4 3 2 1 r= 1 2 r=,85 1 2 3 4 5 6
váha (kg) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 11 1 9 8 7 6 5 4 16 17 18 19 2 výška (cm) Výběrový korelační koeficient: r =,6146
váha (kg) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 14 12 1 Výběrový korelační koeficient: r =,6146 vs. r =,2832 8 6 4 14 15 16 17 18 19 2 výška (cm)
Analýza závislosti dvou kvantitativních znaků Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden)
Analýza závislosti dvou kvantitativních znaků Časová značka ID Pohlaví pohlaví Výška (cm) výška (cm) Váha (kg) váha (kg) Přivděláváte si v rámci prezenčního studia na brigádách? Jak často brigádu máte? Jak bste svou brigádu charakterizoval(a)? brigáda frekvence brigád charakteristika brigád Kolik času týdně obvkle věnujete brigádě? čas věnovaný brigádě (h/týden) 1.4.216 1:38 muž 18 7 ano každý pracovní den prae v oboru během studia 2 15 1.4.216 1:41 muž 186 85 ano nepravidelně jinak 3 2 1.4.216 1:41 muž 172 75 ano nepravidelně prae v oboru během studia 5 36 1.4.216 1:45 žena 166 56 ano jinak jinak 12 1 1.4.216 1:52 žena 188 7 ano jinak prae v oboru během studia 24 26 Kolik času týdně obvkle věnujete studiu? čas věnovaný studiu (h/týden)
obvklý čas strávený v týdnu studiem (h) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 8 7 6 Výběrový korelační koeficient: r =,137 vs. r =,227 5 4 3 2 1 1 2 3 4 5 6 7 obvklý čas strávený v týdnu na brigádě (h)
obvklý čas strávený v týdnu studiem (h) Analýza závislosti dvou kvantitativních znaků Vizualizace bodový graf 8 7 6 5 Výběrový korelační koeficient: r =,137 4 3 2 1 1 2 3 4 5 6 7 obvklý čas strávený v týdnu na brigádě (h)
Korelační koeficient Pokud jsou dvě náhodné veličin korelované, znamená to pouze to, že jsou lineárně závislé. Nelze z toho však ještě usoudit, že b jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout. Silná korelace
Sebevražd oběšením a uškrcením (počet mertvých v USA) tisíce Americké výdaje na vědu, vesmírná výzkum a technologie (miliard dolarů) Korelační koeficient Pokud jsou dvě náhodné veličin korelované, znamená to pouze to, že jsou lineárně závislé. Nelze z toho však ještě usoudit, že b jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout. 1 9 8 7 6 5 4 3 2 1 r=,99 1998 2 22 24 26 28 21 35 3 25 2 15 1 5 Sebevražd oběšením a uškrcením (počet mertvých v USA) Americké výdaje na vědu, vesmírná výzkum a technologie (miliard dolarů)
Zdroj: http://zprav.aktualne.cz/zahranici/k-nobelove-cene-dopomahacokolada-naznacuje-studie/r~i:article:76147/
Korelační koeficient V prai se zpravidla hodnota koeficientu korelace interpretuje takto: Korelační koeficient r =, r ሺ,; r ሺ,3; r ሺ,7; r = 1, Tp lineární závislosti neeistující,3 velmi slabá,7 středně silná ሻ 1, těsná funkční Mezi proudem a napětím na odporu bl zjištěn korelační koeficient,6. Mezi školním prospěchem a pocitem deprese u dětí bl zjištěn korelační koeficient,6. Výsledk interpretujte!
DĚKUJI ZA POZORNOST!