Přednáška 5. Výběrová šetření, Exploratorní analýza

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "Přednáška 5. Výběrová šetření, Exploratorní analýza"

Transkript

1 Přednáška 5 Výběrová šetření, Exploratorní analýza Pravděpodobnost vs. statistika Výběrová šetření aneb jak získat výběrový soubor Exploratorní statistika aneb jak popsat výběrový soubor Typy proměnných Popis kategoriální proměnné (číselné charakteristiky, grafy) Popis numerické proměnné (číselné charakteristiky, grafy)

2 Čím se zabývá teorie pravděpodobnosti? Teorie pravděpodobnosti je matematická disciplína popisující zákonitosti týkající se náhodných jevů, tj. používá se k modelování náhodnosti a neurčitosti. (Náhodnost je spojena s nedostatečnou znalostí počátečních podmínek.)

3 Čím se zabývá statistika? Rozvíjí znalosti na základě empirických dat. Co je to statistika? Google odkazů (čeština), 2, odkazů (angličtina) Uspořádaný datový soubor (statistika přístupů na web. stránky, statistika střel na branku, statistika nehodovosti, ekonomické statistiky, ) Český statistický úřad, Real Time Statistics Project Teoretická disciplína, která se zabývá metodami sběru a analýzy dat (matematická statistika vs. aplikovaná statistika) Číselný údaj syntetizující vlastnosti datových souborů (četnost, průměr, rozptyl, )

4 Proč je dobré znát (alespoň) základy statistiky? Informace, informace. Ó, data! Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz

5 Proč je dobré znát (alespoň) základy statistiky? Informace, informace. Ó, data! Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz

6 Základní pojmy ze statistické metodologie Populace (základní soubor) je množina všech prvků, které sledujeme při statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich společných vlastností. (Statistické) jednotky - prvky populace (Statistické) znaky (proměnné, veličiny) kvantitativní údaje, které u výběrového souboru sledujeme

7 Základní pojmy ze statistické metodologie úplné šetření statistické zjišťování Populace (základní soubor) je množina všech prvků, které sledujeme při statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich společných vlastností. (Statistické) jednotky - prvky populace (Statistické) znaky (proměnné, veličiny) kvantitativní údaje, které u výběrového souboru sledujeme

8 Základní pojmy ze statistické metodologie statistické zjišťování Exploratorní (popisná) statistika Jak provádět statistické zjišťování? Pokus (kontrolovaný, znáhodněný, slepý, dvojitě slepý pokus) Šetření (výzkumník do průběhu šetření zasahuje co nejméně)

9 Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika Popisná statistika (angl. Exploratory Data Analysis, EDA) - uspořádání proměnných do názornější formy a jejich popis několika málo hodnotami, které by obsahovaly co největší množství informací obsažených v původním souboru.

10 Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika

11 Statistické šetření Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.

12 Způsoby statistického šetření Vyčerpávající šetření Výběrové šetření Výhody: přesnost a detailnost zjištěných informací Výhody: menší personální, finanční a časová náročnost Nevýhody: personální, finanční a časová náročnost Nevýhody: mírou objektivnosti získaných informací je kvalita provedení výběrového šetření

13 Výběrové šetření Výběr by měl být reprezentativní tj. odrážet vlastnosti celé populace vzhledem ke sledovaným znakům. Opakem reprezentativního výběru je výběr selektivní (např. vzorek účastnic soutěže MISS ČR, z něhož chceme dělat závěry o váze v české populaci dívek ve věku let). Náhodný výběr, tj. výběr, v němž má každá statistická jednotka stejnou pravděpodobnost být zařazena do výběru. Reprezentuje všechny známé i neznámé vlastnosti populace. Umožňuje odhadnout velikost chyby, která je způsobena výběrovým šetřením. Opora (rámec) výběru technická dokumentace umožňující výběr stat. jednotek do výběru.

14 Metody náhodného výběru prostý náhodný výběr losováním, pomocí tabulek náhodných čísel systematický výběr založen na předem známém uspořádání populace (riziko souvislosti uspořádání s analyzovaným znakem), vybíráme každý k. prvek. oblastní (stratifikovaný) výběr populace rozdělena do heterogenních podskupin, v jejichž rámci je prováděn prostý náhodný, resp. systematický výběr. skupinový výběr populace je rozdělena do rovnocenných podskupin, tj. variabilita mezi podskupinami musí být co nejmenší. Poté je proveden prostý náhodný výběr podskupiny a následuje její úplné šetření. vícestupňový výběr Založen na hierarchickém popisu jednotek populace (např. krajeměsta-školy).

15 Další metody výběru Anketa tzv. samovýběr, tj. výběr jedinců je založen na rozhodnutí respondenta odpovědět na anketu nelze definovat populaci, na níž se výsledky vztahují Snowball sampling dotázaní uvádějí kontakt na další jedince vhodné pro výzkum dočasných populací (svědkové události, účastníci akce apod.) Záměrný výběr, tj. výběr založený na expertním stanovisku Metoda základního masivu prošetření velkých a středních jednotek

16

17 Exploratorní analýza dat

18 Typy proměnných Typy proměnných Kvalitativní proměnná (kategoriální, slovní...) Nominální proměnná (nelze uspořádat) Ordinální proměnná (lze uspořádat) Kvantitativní proměnná (numerická, číselná...)

19 EDA pro kategoriální veličinu

20 Kategoriální veličina nominální (nemá smysl uspořádání) (např. Typ SŠ, Barva auta, Pohlaví, )

21 Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Varianty x i Absolutní četnosti n i Relativní četnosti p i x 1 n 1 p 1 =n 1 /n x 2 n 2 p 2 =n 2 /n x k n k p k =n k /n Celkem: n 1 +n 2 + +n k =n 1 + Modus (název nejčetnější varianty)

22 Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Pohlaví Absolutní četnosti Relativní četnosti [%] Muž ,2 Žena ,8 Celkem: ,0 Modus = Muž

23 Grafické znázornění A) Sloupcový graf (bar chart) Počet Výborně Chvalitebně Prospěl Neprospěl můžete vytvořit sloupcový graf a dodat mu zcela nový a přitažlivý vzhled

24 Grafické znázornění A) Sloupcový graf (bar chart) Počet

25 Grafické znázornění A) Sloupcový graf (bar chart) Počet

26 Grafické znázornění A) Sloupcový graf (bar chart) Počet

27 Grafické znázornění A) Sloupcový graf (bar chart) Počet

28 Grafické znázornění A) Sloupcový graf (bar chart) Počet

29 Grafické znázornění A) Sloupcový graf (bar chart) Na co si dát pozor? Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých sloupců.

30 Produkce CO2 [kg] na osobu Grafické znázornění A) Sloupcový graf (bar chart) Na co si dát pozor? Sloupcový graf USA ČR zdroj dat:

31 Grafické znázornění A) Sloupcový graf (bar chart) Na co si dát pozor? Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých sloupců. Nadbytečné názvy grafu, legendy, Neefektivní nuly A na co ještě?

32 Produkce CO2 [tun] na osobu (% roku 1993) Produkce CO2 [tun] na osobu USA Který ČR z grafů je správný? USA ČR 120% 100% 80% 60% 40% 20% 0% USA ČR 100% 98% 96% 94% 92% 90% USA ČR

33 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) 7; 17% 5; 12% 5; 12% 10; 24% Výborně 7; 17% Výborně 10; 24% Chvalitebně Prospěl Chvalitebně Prospěl Neprospěl Neprospěl 20; 47% 20; 47%

34 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) 7; 17% 5; 12% 5; 12% 10; 24% Výborně 7; 17% Výborně 10; 24% Chvalitebně Prospěl Chvalitebně Prospěl Neprospěl Neprospěl 20; 47% 20; 47%

35 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) Na co si dát pozor?

36 Anketa Jste pro navýšení hodinové dotace Statistiky? TAKHLE NE!!!

37 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) Na co si dát pozor? Neuvádění absolutních četností, resp. celkového počtu respondentů v blízkosti grafu Nadbytečné názvy grafu

38 Výskyt krevních skupin a Rh faktoru v USA Krevní Rh faktor skupina Rh+ Rh- Celkem A B AB Celkem

39 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) Na co si dát pozor? Neuvádění absolutních četností, resp. celkového počtu respondentů v blízkosti grafu Nadbytečné názvy grafu, legendy, Ne vždy je graf přehlednější než tabulka A na co ještě?

40

41 6; 3% 32; 15% Srozumitelnost výkladu 1; 0% 114; 53% 64; 29% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 Hodnocení 5 2; 1% Srozumitelnost řešených příkladů 37; 17% 103; 47% 0; 0% 76; 35% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 Hodnocení 5 Množství řešených příkladů 15; 7% 1; 0% 48; 22% 80; 37% 73; 34% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 Hodnocení 5 Užitečnost úloh k samostatné práci 5; 2% 0; 0% 34; 16% 96; 44% 82; 38% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 Hodnocení 5 3; 1% Praktické aplikace 18; 9% 81; 39% 75; 36% 31; 15% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 Hodnocení 5 8; 4% 5; 2% Grafická úprava 25; 11% 92; 42% 89; 41% Hodnocení 1 Hodnocení 2 Hodnocení 3 Hodnocení 4 2 grafy ještě chybí Hodnocení 5

42 Hodnocení modulu PRA (220 respondentů) Dostatečnost textu Míra používání textu Grafická úprava Praktické aplikace Užitečnost úloh k samostatné práci Množství řešených příkladů Srozumitelnost řešených příkladů Srozumitelnost výkladu % 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% % skládaný pruhový graf

43 Grafické znázornění B) Výsečový graf koláčový graf (pie chart) Na co si dát pozor? Neuvádění absolutních četností, resp. celkového počtu respondentů v blízkosti grafu Nadbytečné názvy grafu, legendy, Ne vždy je graf přehlednější než tabulka Jediná věc je horší než výsečový graf několik nebo dokonce mnoho výsečových grafů Van Belle

44 Kategoriální proměnná ordinální (má smysl uspořádání) (např. míra nezaměstnanosti (nízká, střední, vysoká), dosažené vzdělání, )

45 Seřazené podle velikosti Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Varianty x i Absolutní četnosti n i Relativní četnosti p i Kumulativní četnosti m i Kumulativní relativní četnosti F i x 1 n 1 p 1 =n 1 /n n 1 p 1 x 2 n 2 p 2 =n 2 /n n 1 +n 2 p 1 +p 2 x k n k p k =n k /n n 1 +n 2 + +n k =n p 1 +p 2 + +p k =1 Celkem: n 1 +n 2 + +n k =n Modus

46 Číselné charakteristiky Míra nezaměstnanosti TABULKA ROZDĚLENÍ ČETNOSTI Absolutní četnosti Relativní četnosti [%) Kumulativní četnosti Kumulativní relativní četnosti [%) nízká 27 13, ,6 střední , ,4 vysoká 25 12, ,0 Celkem: ,0 Modus = střední

47 Grafické znázornění A) Sloupcový graf (bar chart) B) Výsečový graf koláčový graf (pie chart)

48 EDA pro numerická data

49 Číselné charakteristiky A) Míry polohy (úrovně) B) Míry variability

50 Míry polohy

51 Aritmetický průměr x n i 1 n x i

52 1. Průměrný věk 20 osob v místnosti je 25 let. 28 letý člověk odejde z místnosti a 30 letý člověk do místnosti vejde. Změní se průměrný věk osob v místnosti? Pokud ano, jaký je nový průměrný věk osob v místnosti?

53 Aritmetický průměr x n i 1 n x i Pozor na ošidnost aritmetického průměru!

54 Jeden člověk sní celé kuře, druhý nic. V průměru měl každý půlku kuřete, takže se oba dobře najedli.??? Průměr slouží k získání charakteristik velkého souboru objektů, ale ne k popisu jednotlivých objektů z tohoto souboru.

55 Předpokládejme, že v malé vesnici žije 6 lidí, jejichž roční příjem byl: $ $ $ $ $ $ Jaký je jejich průměrný plat? ($31 830) Do vesničky se přistěhoval Bill Gates (roční příjem $ ) Jaký je nyní průměrný plat obyvatel vesnice? ($ )

56 Aritmetický průměr x n i 1 n x Na co si dát pozor? Průměr není rezistentní vůči odlehlým pozorováním! Harmonický průměr (proměnné vyjadřující čas na jednotku výkonu, poměrná čísla) Geometrický průměr (tempa růstu) Vážený průměr Průměrování dat na cirkulární škále Circular Statistics Toolbox i

57 2. Zemědělské družstvo dostalo kuřat s průměrnou váhou 1,37 kg. Cena byla 50,- Kč za kilogram. Během dne se prodalo 300 kuřat za ,- Kč. Jaká byla průměrná váha neprodaných kuřat? Počet kuřat Celková váha [kg] Celková cena [Kč] původně prodáno zůstalo

58 2. Zemědělské družstvo dostalo kuřat s průměrnou váhou 1,37 kg. Cena byla 50,- Kč za kilogram. Během dne se prodalo 300 kuřat za ,- Kč. Jaká byla průměrná váha neprodaných kuřat? Počet kuřat Celková váha [kg] Celková cena [Kč] původně prodáno /50 = zůstalo

59 2. Zemědělské družstvo dostalo kuřat s průměrnou váhou 1,37 kg. Cena byla 50,- Kč za kilogram. Během dne se prodalo 300 kuřat za ,- Kč. Jaká byla průměrná váha neprodaných kuřat? Počet kuřat Celková váha [kg] Celková cena [Kč] původně prodáno /50 = zůstalo

60 2. Zemědělské družstvo dostalo kuřat s průměrnou váhou 1,37 kg. Cena byla 50,- Kč za kilogram. Během dne se prodalo 300 kuřat za ,- Kč. Jaká byla průměrná váha neprodaných kuřat? Počet kuřat Celková váha [kg] Celková cena [Kč] původně prodáno /50 = zůstalo = x 1, kg

61 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že a) vzdálenost všech úseků je stejná 5 km. A B C D AB BC CD Dráha [km] Rychlost [km/h]

62 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že a) vzdálenost všech úseků je stejná 5 km. A B C D AB BC CD Dráha [km] Rychlost [km/h] Čas [h] 5/40 5/50 5/60

63 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že a) vzdálenost všech úseků je stejná 5 km. A B C D AB BC CD AD Dráha [km] Rychlost [km/h] Čas [h] 5/40 5/50 5/60

64 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že a) vzdálenost všech úseků je stejná 5 km. A B C D AB BC CD AD Dráha [km] Rychlost [km/h] Čas [h] 5/40 5/50 5/60 5/40 + 5/50 + 5/ x 48, km/ h

65 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že a) vzdálenost všech úseků je stejná 5 km. A B C D AB BC CD AD Dráha [km] Rychlost [km/h] Čas [h] 5/40 5/50 5/60 5/40 + 5/50 + 5/ x 48, km/ h Harmonický průměr

66 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. A B C D AB BC CD Dráha [km] 0,15AD 0,60AD Rychlost [km/h]

67 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. A B C D AB BC CD Dráha [km] 0,15AD 0,25AD 0,60AD Rychlost [km/h]

68 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. A B C D AB BC CD Dráha [km] 0,15AD 0,25AD 0,60AD Rychlost [km/h] Čas [h] 0,15AD/40 0,25AD/50 0,60AD/60

69 3. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. A B C D AB BC CD AD Dráha [km] 0,15AD 0,25AD 0,60AD AD Rychlost [km/h] Čas [h] 0,15AD/40 0,25AD/50 0,60AD/60 AD 1 x 53, 3 015, AD 0, 25AD 0, 60AD 015, 0, 25 0, km/ 0,15AD/40 + 0,25AD/50 + 0,60AD/60 h Vážený harmonický průměr

70 4. Cena jedné akcie energetické společnosti vzrostla na burze XY v období od 13. do 15. března téhož roku z 952,50 Kč na 982,00 Kč. Jaký byl průměrný denní relativní přírůstek ceny této akcie? Cena akcie [Kč] 13. března 952, března? 15. března 982,0

71 4. Cena jedné akcie energetické společnosti vzrostla na burze XY v období od 13. do 15. března téhož roku z 952,50 Kč na 982,00 Kč. Jaký byl průměrný denní relativní přírůstek ceny této akcie? Cena akcie [Kč] Koeficient růstu 13. března 952, března??/952,5 15. března 982,0 982,0/? Průměrný denní relativní přírůstek ceny akcie byl 1,5%. x? 982, 0 952, 5? 982, 0 952, , Geometrický průměr

72 Výběrové kvantily 100p %-ní kvantil x p odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)

73 Význačné výběrové kvantily Kvartily Dolní kvartil x 0,25 Medián x 0,5 Horní kvartil x 0,75 Decily x 0,1 ; x 0,2 ;... ; x 0,9 Percentily x 0,01 ; x 0,02 ; ; x 0,03 Minimum x min a Maximum x max

74 Jak se výběrové kvantily určují? Jedna z používaných metod: 1. Výběrový soubor uspořádáme podle velikosti. 2. Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) p%- ní kvantil je roven hodnotě proměnné s pořadím z p, kde z p = np + 0,5. 4. Není-li z p celé číslo, pak daný kvantil určíme jako průměr prvků s pořadím z p a z p.

75 5. V předložených datech určete 0,3 kvantil (30-ti procentní kvantil): MN [%] 8,7 7,8 6,8 6,8 7,8 9,7 15,7 6,8 4,9 6,8 z p = np + 0,5

76 5. V předložených datech určete 0,3 kvantil (30-ti procentní kvantil): MN [%] MN [%] (seřazeno) 8,7 4,9 7,8 6,8 6,8 6,8 6,8 6,8 7,8 6,8 9,7 7,8 15,7 7,8 6,8 8,7 4,9 9,7 6,8 16 z p = np + 0,5 z 0,3 = 10 0,3 + 0,5 = 3,5

77 5. V předložených datech určete 0,3 kvantil (30-ti procentní kvantil): MN [%] MN [%] (seřazeno) 8,7 4,9 7,8 6,8 6,8 6,8 6,8 6,8 7,8 6,8 9,7 7,8 15,7 7,8 6,8 8,7 4,9 9,7 6,8 16 x 0,3 = 6,8 + 6,8 2 = 6, 8 z p = np + 0,5 z 0,3 = 10 0,3 + 0,5 = 3,5

78 6. Průměrný věk 20 osob v místnosti je 25 let. 28 letý člověk odejde z místnosti a 30 letý člověk do místnosti vejde. Změní se medián věku osob v místnosti? Pokud ano, jaký je nový medián věku osob v místnosti?

79 7. Průměrný věk 21 osob v místnosti je 25 let. 28 letý člověk odejde z místnosti a 30 letý člověk do místnosti vejde. Změní se medián věku osob v místnosti? Pokud ano, jaký je nový medián věku osob v místnosti?

80 Efekt změny jednotky Jak se změní míry polohy, změníme-li jednotku měřené veličiny (minuty hodiny, metr palec, atd.)? Když přičteme konstantu ke každé hodnotě, tak se průměr i medián změní o tutéž konstantu. Když každou hodnotu násobíme konstantou, průměr i medián jsou násobeny toutéž konstantou.

81 Míry variability

82 Výběrový rozptyl s 2 n i 1 x i x n 1 2 Na co si dát pozor? Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

83 Výběrová směrodatná odchylka s s 2 n i 1 x i x n 1 2

84 Jakou představu o variabilitě dat nám dává sm. odchylka? Čebyševova nerovnost: k > 0: P μ kσ < X < μ + kσ > 1 1 k 2 k P μ kσ < X < μ + kσ 1 >0 2 >0,75 3 >0,89 k P μ kσ < X < μ + kσ 1 0, , ,998 Empirické pravidlo 3 sigma

85 Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) V x x s 100 % Čím nižší var. koeficient, tím homogennější soubor. V x > 50% značí silně rozptýlený soubor. Proč potřebujeme bezrozměrnou míru variability? Umožňuje srovnání variability proměnných, které mají různé jednotky.

86 Interkvartilové rozpětí IQR = x 0,75 - x 0,25 Užití: např. při identifikaci odlehlých pozorování

87 Efekt změny jednotky Jak se změní míry variability, změníme-li jednotku měřené veličiny (minuty hodiny, metr palec, atd.)? Když přičteme konstantu ke každé hodnotě, vzdálenosti mezi hodnotami zůstanou zachovány. V důsledku toho se rozptyl ani směrodatná odchylka nezmění. Když každou hodnotu násobíme konstantou, rozptyl je násoben kvadrátem této konstanty (viz definice rozptylu), směrodatná odchylka je násobena danou konstantou.

88 8. Průměrná roční teplota v Praze je 10,40 C, rozptyl teploty je 0,25 C 2. Určete průměrnou roční teplotu v Praze a její rozptyl ve stupních Fahrenheita. F = 9C x F = 9 5 x C + 32 = 50,72 F s 2 F 2 = s 2 C 2 = 0,81 F 2

89 MAD median absolute deviation from the median, čili česky: medián absolutních odchylek od mediánu pomocná proměnná pro identifikaci odlehlých pozorování Jak jej určíme? 1. Výběrový soubor uspořádáme podle velikosti. 2. Určíme medián souboru. 3. Pro každou hodnotu souboru určíme absolutní hodnotu její odchylky od mediánu. 4. Absolutní odchylky od mediánu uspořádáme podle velikosti. 5. Určíme medián absolutních odchylek od mediánu, tj. MAD.

90 Odlehlá pozorování ty hodnoty proměnné, které se mimořádně liší od ostatních hodnot a tím ovlivňují např. vypovídací hodnotu průměru. Jak postupovat v případě, že v datech identifikujeme odlehlá pozorování? V případě, že odlehlost pozorování je způsobena: hrubými chybami, překlepy, prokazatelným selháním lidí či techniky... důsledky poruch, chybného měření, technologických chyb... tzn., známe-li příčinu odlehlosti a předpokládáme-li, že již nenastane, jsme oprávněni tato pozorování vyloučit z dalšího zpracování. V ostatních případech je nutno zvážit, zda se vyloučením odlehlých pozorování nepřipravíme o důležité informace o jevech vyskytujících se s nízkou četností.

91 Identifikace odlehlých pozorování Metoda vnitřních hradeb x x,5iqr x x 1, 5IQR x je odlehlým pozorování m i 0,25 1 i 0, 75 i Dolní mez vnitřních hradeb Horní mez vnitřních hradeb

92 Identifikace extrémních pozorování Metoda vnějších hradeb x x IQR x x 3IQR x je extrémním pozorování m i 0, 25 3 i 0, 75 i Dolní mez vnějších hradeb Horní mez vnějších hradeb

93 9. V předložených datech identifikujte odlehlá pozorování: MN 0,25 =6,8 MN 0,5 =7,3 MN 0,75 =8,7 MN [%] 4,9 6,8 6,8 6,8 6,8 7,8 7,8 8,7 9,7 15,7 IQR=MN 0,75 -MN 0,25 =1,9 1,5.IQR=2,85 Vnitřní hradby: Dolní mez: 6,8-2,85=3,95 Horní mez: 8,7+2,85=11,55

94 9. V předložených datech identifikujte odlehlá pozorování: MN 0,25 =6,8 MN 0,5 =7,3 MN 0,75 =8,7 MN [%] 4,9 6,8 6,8 6,8 6,8 7,8 7,8 8,7 9,7 15,7 IQR=MN 0,75 -MN 0,25 =1,9 1,5.IQR=2,85 Vnitřní hradby: Dolní mez: 6,8-2,85=3,95 Horní mez: 8,7+2,85=11,55

95 Identifikace odlehlých pozorování z-souřadnice z souřadnice i = x i x s Je-li z souřadnice i > 3, je x i odlehlým pozorováním. Zase nový vzorec?

96 Identifikace odlehlých pozorování z-souřadnice z souřadnice i = x i x s Je-li z souřadnice i > 3, je x i odlehlým pozorováním. Ne, jde jen o jinou podobu pravidla 3σ!

97 Identifikace odlehlých pozorování x 0,5 -souřadnice x 0,5 souřadnice i = x i x 0,5 1,483MAD Je-li x 0,5 souřadnice i > 3, je x i odlehlým pozorováním.

98 Míry šikmosti a špičatosti

99 Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.

100 Výběrová šikmost (standardizovaná) a = n i=1 3 n n 1 n 2 x i x s 3 f(x) f(x) f(x) a < 0 negativně zešikmené rozdělení x < x 0,5 < x x a = 0 symetrické rozdělení x = x 0,5 = x x x a > 0 pozitivně zešikmené rozdělení x > x 0,5 > x obvykle

101 Výběrová špičatost (standardizovaná) míra koncentrace kolem průměru b = n i=1 4 n n + 1 n 1 n 2 n 3 x i x s 4 3 n 1 2 n 2 n 3 f(x) f(x) f(x) x b < 0 špičatost menší než u norm. rozdělení (plošší rozdělení) b = 0 špičatost odpovídající normálnímu rozdělení x x b > 0 špičatost větší než u norm. rozdělení (špičatější rozdělení)

102 Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g 1, angl. skewness) a špičatost (g 2, angl. kurtosis).

103 Přesnost číselných charakteristik

104 Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily ) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky.

105 Chybný zápis číselných charakteristik Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2, , Směrodatná ,78 23,7 odchylka (před zaokrouhlením 1235) Proč je zápis chybný?

106 Chybný zápis číselných charakteristik Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2, , Směrodatná odchylka 0,78 23,7 Proč je zápis chybný? Různý počet des. míst (před zaokrouhlením 1235)

107 Chybný zápis číselných charakteristik Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2, , Směrodatná odchylka 0,78 23,7 Proč je zápis chybný? Různý počet des. míst. 3 platné cifry u směrodatné odchylky (před zaokrouhlením 1235)

108 Chybný zápis číselných charakteristik Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2, , Směrodatná ,78 23,7 odchylka (před zaokrouhlením 1235) Nejnižší zapsaný řád 3 platné průměru (jednotky) Různý cifry neodpovídá nejnižšímu Proč je zápis počet des. u zapsanému řádu směrodatné chybný? míst. směrodatné odchylky (stovky)+ směr. odchylky. odch. není zaokrouhlena nahoru.

109 Oprava Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2,68 117, Směrodatná ,78 23,7 odchylka (před zaokrouhlením 1235) Nejnižší zapsaný řád 3 platné průměru (jednotky) cifry neodpovídá nejnižšímu Proč je zápis u zapsanému řádu směrodatné chybný? směrodatné odchylky (stovky)+ směr. odchylky. odch. není zaokrouhlena nahoru.

110 Oprava Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2, Medián 2, Směrodatná ,78 24 odchylka (před zaokrouhlením 1235) Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu Proč je zápis zapsanému řádu směrodatné chybný? odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

111 Správný zápis číselných charakteristik Délka [m] Váha [kg] Teplota [ 0 C] Průměr 2,26 127, Medián 2, , Směrodatná odchylka 0,78 23,

112 Grafické znázornění num. proměnné A.) Krabicový graf (Box plot)

113 <27,1; 57,2> (57,2; 87,3> (87,3; 117,4> (117,4; 147,4> (147,4; 177,6> <27,1; 36,5> (45,9; 55,3> (64,7; 74,1> (83,5; 92,9> (102,3; 111,7> (121,1; 130,5> (139,9; 149,3> (158,7; 168,1> Grafické znázornění num. proměnné B.) Histogram Četnost Četnost Na co si dát pozor?

114 Grafické znázornění num. proměnné B.) Histogram

115 <27,1; 57,2> (57,2; 87,3> (87,3; 117,4> (117,4; 147,4> (147,4; 177,6> Četnost Grafické znázornění num. proměnné B.) Histogram Četnost ,1 43,8 60,6 77,3 94,0 110,7 127,4 144,1 160,8 Další Data MS Excel 2007, funkce Histogram Výpočetní applet Explorační analýza Na co si dát pozor?

116 Souvislost mezi číselnými charakteristikami a grafy V java appletu Výběrové charakteristiky sledujte souvislost mezi číselnými charakteristikami a grafy numerické proměnné.

117 Zajímavé odkazy k tématu Exploratorní statistika Slovníček pojmů z exploratorní statistiky aneb co by se Vám mohlo hodit při práci se statistickým softwarem v angličtině Interstat sylabus popisné statistiky (nedokončeno) Jak nevytvářet grafy (anglicky) The Evil Tutor s Guide Real Time Statistics Project Projekt Gapminder Circular Statistics Toolbox (Matlab)

Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? Google 196.10 6 odkazů (čeština), 2,88.10 9 odkazů (angličtina)

Více

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak získat data?

Více

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

STATISTIKA S EXCELEM. Martina Litschmannová MODAM, STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216 Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního

Více

VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS

VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS Martina Litschmannová Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky, Katedra aplikované matematiky ŠKOMAM 19 29. 1. 2019

Více

Matematická statistika

Matematická statistika Matematická statistika Daniel Husek Gymnázium Rožnov pod Radhoštěm, 8. A8 Dne 12. 12. 2010 v Rožnově pod Radhoštěm Osnova Strana 1) Úvod 3 2) Historie matematické statistiky 4 3) Základní pojmy matematické

Více

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120 KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Charakteristiky variability Mgr. Jakub Němec VY_32_INOVACE_M4r0120 CHARAKTERISTIKY VARIABILITY Charakteristika variability se určuje pouze u kvantitativních znaků.

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Př. : Stanovte jednotlivé četnosti a číselné charakteristiky zadaného statistického souboru a nakreslete krabicový graf:, 8, 7, 43, 9, 47, 4, 34, 34, 4, 35. Statistický soubor seřadíme vzestupně podle

Více

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2 Semestrální projekt do předmětu Statistika Vypracoval: Adam Mlejnek 2-36 Oponenti: Patrik Novotný 2-36 Jakub Nováček 2-36 Úvod Pro vypracování projektu do předmětu statistika jsem si zvolil průzkum kvality

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

VŠB Technická univerzita Ostrava

VŠB Technická univerzita Ostrava VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: PRAVDĚPODOBNOST A STATISTIKA Domácí úkoly Zadání 21 DATUM ODEVZDÁNÍ

Více

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika Statistika Cvičení z matematické statistiky na PřF Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy léto 2012 Základní dělení popisná (deskriptivní)

Více

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka

Více

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 2. POPISNÉ STATISTIKY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz CO SE SKRÝVÁ V DATECH data sbíráme proto, abychom porozuměli

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

Nejčastější chyby v explorační analýze

Nejčastější chyby v explorační analýze Nejčastější chyby v explorační analýze Obecně doporučuju přečíst přednášku 5: Výběrová šetření, Exploratorní analýza http://homel.vsb.cz/~lit40/sta1/materialy/io.pptx Použití nesprávných charakteristik

Více

EXPLORATORNÍ ANALÝZA DAT. 7. cvičení

EXPLORATORNÍ ANALÝZA DAT. 7. cvičení EXPLORATORNÍ ANALÝZA DAT 7. cvičení Teorie pravděpodobnosti x Statistika Teorie pravděpodobnosti popisuje zákonitosti týkající se náhodných jevů, používá se k modelování náhodností a neurčitostí, které

Více

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT Patrícia Martinková Ústav informatiky AV ČR martinkova@cs.cas.cz www.cs.cas.cz/martinkova 1.LF UK, 22. a 30. března 2017 Motivace 1 Velké množství (medicínských

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava BIOSTATISTIKA VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Zadání 11 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL

Více

Úvod do kurzu. Moodle kurz. (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Úvod do kurzu. Moodle kurz. (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost Úvod do kurzu Moodle kurz (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost Výpočty online: www.statisticsonweb.tf.czu.cz Začátek výuky posunut

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Biostatistika a matematické metody epidemiologie- stručné studijní texty Biostatistika a matematické metody epidemiologie- stručné studijní texty Bohumír Procházka, SZÚ Praha 1 Co můžeme sledovat Pro charakteristiku nebo vlastnost, kterou chceme sledovat zvolíme termín jev.

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Základy statistiky pro obor Kadeřník

Základy statistiky pro obor Kadeřník Variace 1 Základy statistiky pro obor Kadeřník Autor: Mgr. Jaromír JUŘEK Kopírování a jakékoliv další využití výukového materiálu je povoleno pouze s uvedením odkazu na www.jarjurek.cz 1. Aritmetický průměr

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Robust 2010 31. ledna 5. února 2010, Králíky

Robust 2010 31. ledna 5. února 2010, Králíky Modelování rozdělení ročních příjmů českých domácností J. Bartošová 1 M. Forbelská 2 1 Katedra managementu informací Fakulta managementu v Jindřichově Hradci Vysoká škola ekonomická v Praze 2 Ústav matematiky

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.

Více

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1. 2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis

Více

Drsná matematika IV 7. přednáška Jak na statistiku?

Drsná matematika IV 7. přednáška Jak na statistiku? Drsná matematika IV 7. přednáška Jak na statistiku? Jan Slovák Masarykova univerzita Fakulta informatiky 2. 4. 2012 Obsah přednášky 1 Literatura 2 Co je statistika? 3 Popisná statistika Míry polohy statistických

Více

Funkce a vzorce v Excelu

Funkce a vzorce v Excelu Funkce a vzorce v Excelu Lektor: Ing. Martin Kořínek, Ph.D. Formátování tabulky V této kapitole si vysvětlíme, jak tabulku graficky zdokonalit, jak změnit nastavení šířky a případně výšky sloupců, jak

Více

ÚKOL 2 1886 22 5,77 5,00 5 2,531,003,056 -,869,113

ÚKOL 2 1886 22 5,77 5,00 5 2,531,003,056 -,869,113 ÚKOL 2 Jméno a příjmení: UČO: Imatrik. ročník: Úkol 2.1: V souboru EVS99_cvicny.sav zjistěte, zdali rozložení názoru na to, kdo by měl být odpovědný za zajištění bydlení (proměnná q54h), je normální. Řešte

Více

Lineární programování

Lineární programování Lineární programování Úlohy LP patří mezi takové úlohy matematického programování, ve kterých jsou jak kriteriální funkce, tak i všechny rovnice a nerovnice podmínek výhradně tvořeny lineárními výrazy.

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Úvod do teorie pravděpodobnosti Náhoda a pravděpodobnost, náhodný jev, náhodná veličina rozdělení pravděpodobnosti

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Po(λ) je možné použít jako model náhodné veličiny, která nabývá hodnot 0, 1, 2,... a udává buď počet událostí,

Více

DUM 01 téma: Obecné vlastnosti tabulkového editoru, rozsah, zápis do buňky, klávesové zkratky

DUM 01 téma: Obecné vlastnosti tabulkového editoru, rozsah, zápis do buňky, klávesové zkratky DUM 01 téma: Obecné vlastnosti tabulkového editoru, rozsah, zápis do buňky, klávesové zkratky ze sady: 02 tematický okruh sady: Tabulkový editor ze šablony: 07 KANCELÁŘSKÝ SOFTWARE určeno pro: 1-4. ročník

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu Metoda Monte Carlo a její aplikace v problematice oceňování technologií Manuál k programu This software was created under the state subsidy of the Czech Republic within the research and development project

Více

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ FIGALA V. a), KAFKA V. b) a) VŠB-TU Ostrava, FMMI, katedra slévárenství, 17. listopadu 15, 708 33 b) RACIO&RACIO, Vnitřní

Více

Teoretická rozdělení

Teoretická rozdělení Teoretická rozdělení Diskrétní rozdělení Obsah kapitoly Studijní cíle Doba potřebná ke studiu Pojmy k zapamatování Úvod Některá teoretická rozdělení diskrétních veličin: Alternativní rozdělení Binomické

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) doc. RNDr. PhMr. Karel

Více

Příklad bezprostředně navazuje na předchozí příklad č. 17. Bez zvládnutí příkladu č. 17 není možné pokračovat

Příklad bezprostředně navazuje na předchozí příklad č. 17. Bez zvládnutí příkladu č. 17 není možné pokračovat Příklad zahrnuje Textová editace buněk Základní vzorce Vložené kliparty Propojené listy Grafi cká úprava buněk Složitější vzorce Vložené externí obrázky Formuláře Úprava formátu Vysoce speciální funkce

Více

Analýza dat s využitím MS Excel

Analýza dat s využitím MS Excel Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11

Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Analýza výsledků testu čtenářské gramotnosti v PRO23 2010/11 Zpracoval: www.scio.cz, s.r.o. (15. 2. 2012) Datové podklady: výsledky a dotazníky z PRO23, test čtenářské gramotnosti, www.scio.cz, s.r.o.

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

Pomůcka pro cvičení: 3. semestr Bc studia

Pomůcka pro cvičení: 3. semestr Bc studia Pomůcka pro cvičení: 3. semestr Bc studia Statistika Základní pojmy balíček: Statistics Pro veškeré výpočty je třeba načíst balíček Statistic. Při řešení můžeme použít proceduru infolevel[statistics]:=1,

Více

Poznámky k předmětu Aplikovaná statistika, 9.téma

Poznámky k předmětu Aplikovaná statistika, 9.téma Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Statistika - charakteristiky variability

Statistika - charakteristiky variability Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím ICT Číslo projektu: CZ.1.07/1.5.00/34.0940

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI

PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI Pracovník, který spravuje podnikovou databázi, exportoval do tabulkového procesoru všechny pracovníky podniku

Více

zcela převažující druh průměru, který má uplatnění při řešení téměř všech úloh statistiky široké využití: v ekonomických

zcela převažující druh průměru, který má uplatnění při řešení téměř všech úloh statistiky široké využití: v ekonomických STŘEDNÍ HODNOTY VÝZNAM Rozdělení četností poskytuje užitečnou informaci a přehled o zkoumaném statistickém souboru. Porovnávat několik souborů pomocí tabulek rozděleni četností by však bylo.a. Proto se

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

Zpracování a vyhodnocování analytických dat

Zpracování a vyhodnocování analytických dat Zpracování a vyhodnocování analytických dat naměřená data Zpracování a statistická analýza dat analytické výsledky Naměř ěřená data jedna hodnota 5,00 mg (bod 1D) navážka, odměřený objem řada dat 15,8;

Více

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj.

Více

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE Náplní tohoto projektu byl prvotní průzkum, následné statistické zpracování dat a vyhodnocení. Data jsme získaly skrze internetový dotazník, který jsme rozeslaly

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství 1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí

Více

Dynamické metody pro predikci rizika

Dynamické metody pro predikci rizika Dynamické metody pro predikci rizika 1 Úvod do analýzy časových řad Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých časových intervalech okamžikové např

Více

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Pondělí 16:40, C328 http://www.ms.mff.cuni.cz/~dechf7am Praktické zaměření Proč potřebuji statistiku, když chci dělat (doplň)?

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

2 EXPLORATORNÍ ANALÝZA

2 EXPLORATORNÍ ANALÝZA Počet automobilů Ig. Martia Litschmaová EXPLORATORNÍ ANALÝZA.1. Níže uvedeá data představují částečý výsledek zazameaý při průzkumu zatížeí jedé z ostravských křižovatek, a to barvu projíždějících automobilů.

Více

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných

Více

VYSOK A ˇ SKOLA POLYTECHNICK A JIHLAVA Katedra matematiky Statistick a anal yza a ˇ casov e ˇ rady v pˇ r ıkladech Stanislava Dvoˇ r akov a 2015

VYSOK A ˇ SKOLA POLYTECHNICK A JIHLAVA Katedra matematiky Statistick a anal yza a ˇ casov e ˇ rady v pˇ r ıkladech Stanislava Dvoˇ r akov a 2015 VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra matematiky Statistická analýza a časové řady v příkladech Stanislava Dvořáková 2015 Stanislava Dvořáková STATISTICKÁ ANALÝZA A ČASOVÉ ŘADY V PŘÍKLADECH 1. vydání

Více

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií STATISTIKA pro TZP Modul : Pravděpodobnost a náhodné veličiny Prof

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Jevy a náhodná veličina

Jevy a náhodná veličina Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili

Více

Příprava souboru dat a analýza

Příprava souboru dat a analýza UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (LS 2007) Kvantitativní metody výzkumu v praxi PRAKTIKUM část 2 Příprava souboru dat a analýza Jiří Šafr jiri.safr@seznam.cz vytvořeno

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy

Více

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily Testování hypotéz Testování hypotéz jsou klasické statistické úsudky založené na nějakém apriorním předpokladu. Vyslovíme-li předpoklad o hodnotě neznámého parametru nebo o zákonu rozdělení sledované náhodné

Více

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics) 1. PODSTATA STATISTIKY Původní význam - pouhé sbírání čísel (název z latinského status = stát, použití k označení vědy zabývající se sběrem informací o státu - o počtu obyvatel, ekonomice,...) Dnešní pojetí

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více