Statistická šetření a zpracování dat.

Podobné dokumenty
4. Třídění statistických dat pořádek v datech

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

2. Statistická terminologie a vyjadřovací prostředky Statistická terminologie. Statistická jednotka

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky)

Škály podle informace v datech:

Třídění statistických dat

Normalizovaná úprava písemností v MS Word

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

PŘEDMĚT: PEK TÉMA: TVORBA TABULEK U SZ. Zpracováno: prezentace powerpoint Ing. Hana Augustinová 2012

REGRESNÍ ANALÝZA. 13. cvičení

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Zápočtová práce STATISTIKA I

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

APLIKOVANÁ STATISTIKA pro FRRMS

Třídění a významné hodnoty

POROVNÁNÍ MEZI SKUPINAMI

Regresní a korelační analýza

7. Rozdělení pravděpodobnosti ve statistice

4.2 Elementární statistické zpracování Rozdělení četností

Statistika. Zpracování informací ze statistického šetření. Roman Biskup

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

Pracovní list č. 3 Charakteristiky variability

í I Průchod a rozptyl záření gama ve vrstvách materiálu Prof. Ing. J. Šeda, DrSc. KDAIZ - PJPI

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

Vícekriteriální rozhodování. Typy kritérií

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

Prezentace dat. Grafy Aleš Drobník strana 1

Excel tabulkový procesor

Prezentace dat. Slovní popis a tabulky prosté Aleš Drobník strana 1

MODELOVÁNÍ A SIMULACE

INFORMATIKA WORD 2007

Mnohorozměrná statistická data

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

Protokol č. 1. Tloušťková struktura. Zadání:

II. Úlohy na vložené cykly a podprogramy

STATISTICA Téma 1. Práce s datovým souborem

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Statistická prezentace je umění vytvořit dobrou tabulku nebo graf, které přitáhnou oko k tomu, co je zajímavé. Mgr. Ing.

9.6 TŘÍDĚNÍ PODLE JEDNOHO NESPOJITÉHO ČÍSELNÉHO ZNAKU

INDUKTIVNÍ STATISTIKA

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

Digitální přenosové systémy a účastnické přípojky ADSL

Statistika I (KMI/PSTAT)

Výukový materiál zpracován v rámci projektu EU peníze školám

Písemná práce k modulu Statistika

Statistika pro geografy

Mnohorozměrná statistická data

Grafy EU peníze středním školám Didaktický učební materiál

Popisná statistika. Komentované řešení pomocí MS Excel

Pracovní list č. 3 Charakteristiky variability

Naučte se víc... Microsoft Office Excel 2007 PŘÍKLADY

Soukromá střední odborná škola Frýdek-Místek, s.r.o.

Pojem a úkoly statistiky

Diskrétní náhodná veličina

INFORMATIKA EXCEL 2007

Projekt Využití ICT ve výuce na gymnáziích, registrační číslo projektu CZ.1.07/1.1.07/ MS Excel

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

Tematický okruh: písemná a elektronická komunikace na Státních zkouškách

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

PREZENTACE DAT: JEDNODUCHÉ GRAFY

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Renáta Bednárová STATISTIKA PRO EKONOMY

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Měření zrychlení volného pádu

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Výsledný graf ukazuje následující obrázek.

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Hodnocení využití parku vozidel

5.2.4 POMĚRNÁ ČÍSLA SPLNĚNÍ PLÁNU

KAPITOLA 12 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

Stručný obsah. K2118.indd :15:27

VÝPOČET PŘETVOŘENÍ PŘÍHRADOVÝCH KONSTRUKCÍ SILOVOU METODOU řešený příklad pro BO004

Náhodným vektorem rozumíme sloupcový vektor složený z náhodných veličin X = (X 1, X 2,

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Popisná statistika. Statistika pro sociology

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců.

Základy popisné statistiky

Pracovní list č. 3: Pracujeme s kategorizovanými daty

ANALÝZA A KLASIFIKACE DAT

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Microsoft Office Excel 2003

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

9.7 TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI

8.1.2 TABULKA SKUPINOVÁ

Deskriptivní statistika (kategorizované proměnné)

SISP - charakteristika výběrového souboru

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Střední průmyslová škola v Teplicích Předmět: Kontrola a měření ve strojírenství

DISKUSE K JEDNÁNÍ 1. PRACOVNÍHO TÝMU ODBORNÉ KOMISE PRO DŮCHODOVOU REFORMU 21. září 2016 ZEMŘELÍ V ČR PODLE VZDĚLÁNÍ

František Hudek. červenec 2012

Přehled nabízených kurzů

- 1 - Zdeněk Havel, Jan Hnízdil. Cvičení z Antropomotoriky. Obsah:

1. Stanovení modulu pružnosti v tahu přímou metodou

Transkript:

Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka. Prezentační tabulky: prezentace dat, výsledků zpracování a analýzy. Pracovní tabulky: například na jednotlvých lstech v excelu, zaznamenávání zjštěných a dopočítaných hodnot. Tabulky statstckých konstant. Př konstrukc tabulky by se měly dodržet obecně platné zásady vedoucí k maxmální srozumtelnost tabulky, přehlednost, volbou vhodné grafcké úpravy. Základní prvky tabulky jsou uvedeny v tabulce. číslo tabulky legenda políčko Tab. Indexy vzdělanost obyvatel Zlínského kraje a jeho okresů Index vzdělanost k. 3. 200 Index vzdělanost k 26. 3. 20 O k r e s celkové středoškolské vysokoškolské celkové středoškolské vysokoškolské Kroměříž 52,8 4,96 7,78 73,39 54,5 2,48 2 Uherské Hradště 48,45 37,75 7,64 69,9 50,57 2,85 3 Vsetín 55,39 43,62 8,4 78,57 58,07 2,97 4 Zlín 56,49 45,59 9,46 84, 59,05 5,75 Zlínský kraj 54,76 42,45 8,38 77,3 55,73 3,74 Zdroj: Vlastní výpočty pramen název tabulky součtový řádek záhlaví číselné pole řádek sloupec Případné vysvětlvky, poznámky

Statstcká šetření a zpracování dat. Tab. 2 Smluvené značky používané ve statstckých tabulkách Smluvená značka Symbol Použtí ležatá čárka - nulový údaj, žádný případ ležatý křížek vyplnění políčka není logcké nula 0 méně než polovna měrné jednotky tečka. neznámý údaj Zdroj: Mnařík, Popsná statstka, Brno 2008 Prostředí pro tvorbu tabulek: nejlehčí MS Word STATISTICKÉ GRAFY Výhodou je názornost a přehlednost. Základní prvky grafu jsou totožné s prvky tabulky, grafcký obraz je tvořen geometrckým prostředky (body, úsečky, křvky), smluveným prostředky (typy a tloušťky čar, vybarvení ploch) a pomocným prostředky (osy a stupnce). 60,00 40,00 20,00 00,00 80,00 60,00 40,00 20,00 0,00 Jhomoravský kraj - ndex celkové vzdělanost legenda ICV200 ICV20 pomocné grafcké prostředky (osy, stupnce, sť) geometrcké grafcké prostředky smluvené grafcké prostředky (barvy) číslo grafu 3D efekt Obr. Index celkové vzdělanost pro Jhomoravský kraj Zdroj: Vlastní výpočty pramen název grafu Prostředí pro tvorbu grafů: MS Excel Nepřeberné množství grafů, pro nás nejdůležtější hstogram, polygon četnostní, graf kumulatvní četnost, výsečový graf.

Statstcká šetření a zpracování dat. Počet obyvatel města XY Spotřeba jednotlvých značek pva v Brně 60 50 40 30 20 Radegast % Šerák 6% Holba 5% Plzeň 6% 0 0 do 8) <8 28) <28 38) <38 48) <48 58) <58 a více Staropramen 32% Starobrno 30% věková struktura Obr. 2 Hstogram Obr. 3 Výsečový graf Nedostatky grafů: malá přesnost, možnost nechtěného nebo úmyslného matení čtenářů grafů pomocí optckých klamů.

Významné hodnoty varační řady Nejjednodušší metoda statstckého zpracování dat - Třídění vhodné uspořádání zjštěných nebo naměřených hodnot spočívá v rozdělení prvotních statstckých údajů do určtého počtu skupn (tříd, ntervalů) a zjštění četností (počtu jednotek) v těchto skupnách Klasfkace statstckých řad Statstcká řada Časová řada Prostorová řada Věcná řada Slovní Číselná Varační Statstcká řada neuspořádaná (daná pořadím zjšťování, chaotcké) uspořádaná - seřazená - setříděná Původní řada:, x,... 2 x xn Podle velkost: x ( ), x( 2),... x( ),..., x( n ) x,..., kde x x,... x... x n tentokrát ndex souvsí s velkostí hodnot, přčemž ( ) ( 2) ( ) ( ) x = x, x = n x ( ) mn ( ) max a Třídění podle více znaků - vícestupňové soubor je tříděn v postupných krocích, třídění podle každého dalšího znaku je prováděno uvntř tříd, - kombnační soubor je tříděn současně podle více znaků, výsledkem je kombnační tabulka (kontngenční x asocační, korelační) Varační třídění třídící znak

Významné hodnoty varační řady nespojtý vykazuje menší počet obměn, třídí soubor na skupny jednoduché rozdělení četností bodové třídění spojtý velký počet obměn příbuzné obměny se shrnují do společných skupn (tříd, ntervalů) skupnové (ntervalové) rozdělení četností Tabulka rozdělení četností: pro kvaltatvní znak (bodové třídění, výsečový graf) pro dskrétní znak pro spojtý znak Třídění číselných znaků bodové třídění Příklad č. Roztřďte soubor podle členů domácnost: 2, 5, 6, 4, 3,, 2, 3, 3, 4,,, 2, 4, 4, 3, 3, 5, 2,, 3, 4, 2,, 2, 3,, 4, 3, 6, 5, 3, 4,, 2, 3, 2, 2, 3, 4. Tabulka jednoduchého rozdělení četností (Počet členů v domácnost) Hodnoty znaku Absolutní Relatvní četnost Kumulatvní Kumulatvní x četnost p četnost absolutní četnost relatvní n kn kp 2 3 4 5 6 7 9 8 3 2 0,75 0,225 0,275 0,2 0,075 0,05 7 6 27 35 38 40 0,75 0,4 0,675 0,875 0,95 Suma 40 x x Každé rozdělení četností má dva aspekty - aspekt jednečnost neopakovatelnost, - aspekt zákontost. Grafcké zobrazení hůlkový graf (úsečkový). Co lze z uvedeného rozdělení četností vyčíst

Významné hodnoty varační řady Ukazatel Určení Hodnota Počet domácností (rozsah souboru) Počet domácností např. se třem členy Podíl domácností např. se třem členy (v %) Počet domácností např. s nejvýše třem členy Podíl domácností např. s nejvýše třem členy n n 00 p kn = n j = 00 kp = 00 p j = 40 27,5 % 27 67,5 % Třídění číselných znaků skupnové (ntervalové) třídění Třídění probíhá v rámc uměle vytvořených skupn (ntervalů, tříd). Postup př varačním třídění. Hodnoty uspořádat vzestupně 2. Seskupení do ntervalů stejné šířky do 00 prvků do 500 prvků nad 500 prvků 6-9 ntervalů 0-5 ntervalů 6 20 ntervalů nebo odhad počtu ntervalů na základě výrazu: 3. Šířka ntervalu h k = R = R = X k max - X mn (varační rozpětí) 4. Hrance ntervalů musí být vyznačeny jednoznačně, první a poslední nterval může být určen pouze jednou hrancí (otevřený nterval) zachycení extrémních hodnot 5. Třídění (čárkovací metodou) //// /// Střed ntervalu - průměr dolní a horní hrance ntervalu (nezávslý na hodnotách zařazených jednotek), formálně nahrazuje ndvduální hodnoty patřící do určté třídy, reprezentuje úroveň třídy n

Významné hodnoty varační řady Zjstíme absolutní četnost jednotlvých ntervalů n Vypočteme relatvní četnost p Kumulatvní četnost 6. Graf k kn = n n= = n k 00 [%], kde k je počet řádků n n= hstogram četností (sloupkový graf) úsečkový (ve středech ntervalů) polygon četností (spojncový - spojuje vrcholy úsečkového grafu) Po provedeném třídění jsou všechny konkrétní hodnoty patřící do určté třídy zapomenuty a jsou nahrazeny středem třídy x, který reprezentuje úroveň třídy. Úhrn třídy vypočítáme jako součn x. n a nahradíme jím přesnou hodnotu součtu všech hodnot třídy. Příklad č. 2 Proveďte třídění v souboru středně velkých průmyslových podnků podle průměrného počtu zaměstnanců ve sledovaném roce. Sestavte tabulku skupnového rozdělení četnost. Určete významné hodnoty. 28 43 62 76 80 63 47 235 25 38 47 69 29 3 64 0 85 82 27 47 56 44 74 75 7 64 30 45 43 42 44 25 22 48 53 35 39 43 6 48 3 84 9 92 60 7 36 207 86 23 205 67 52 67 55 4 99 63 20 37 82 59 28 64 72 38 49 93 92 6 x mn = 0 x max = 235 Varační rozpětí R = x max - x mn R = 235-0 R = 25

Významné hodnoty varační řady Šířka třídy h = R 25 h = = 20, k 6 83 25 h = = 7,86 20 7 25 h = = 5,63 8 Tabulka ntervalového rozložení četností Třída Vymezení tříd Střed třídy Abs.četnost Kumulat. Relatvní četn. Kumulat. x n méně než 20) 0 4 4 0,05743 0,05743 2 <20,40) 30 5 9 0,24286 0,27429 3 <40,60) 50 9 38 0,27429 0,542857 4 <60,80) 70 7 55 0,242857 0,78574 5 <80,200) 90 66 0,5743 0,942857 6 <200,220) 20 3 69 0,042857 0,98574 7 <220 a více 230 70 0,04286 Celkem X X 70 X X kn p kp

Významné hodnoty varační řady Grafcké zobrazení rozdělení četností (Excel) Hstogram rozdělení četností 20 Počet podnků 5 0 5 0 méně než <20,40)<40,60)<60,80)<80,200)<200,220)<220 a víc 20) Počet zaměstnanců Polygon četností 20 Počet podnků 5 0 5 0 0 30 50 70 90 20 230 Počet zaměstnanců Graf kumulatvních četností Počet podnků 80 70 60 50 40 30 20 0 0 20 40 60 80 200 220 240 Počet zaměstnanců