Obsah. Statistika Zpracování informací ze statistického šetření Třídění statistického souboru. Třídění dle statistického znaku.

Podobné dokumenty
Statistika. Zpracování informací ze statistického šetření. Roman Biskup

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Škály podle informace v datech:

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Třídění statistických dat

Základy teorie pravděpodobnosti

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Statistická prezentace je umění vytvořit dobrou tabulku nebo graf, které přitáhnou oko k tomu, co je zajímavé. Mgr. Ing.

Pojem a úkoly statistiky

Základní pojmy a cíle statistiky 1

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

ČETNOSTI A ROZLOŽENÍ ČETNOSTÍ

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Mnohorozměrná statistická data

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: 75% docházka na cvičení. + odevzdání seminární práce (úkoly na PC)

2. Bodové a intervalové rozložení četností

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Základy popisné statistiky

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Renáta Bednárová STATISTIKA PRO EKONOMY

Statistika. pro žáky 8. ročníku. úterý, 26. března 13

Statistika pro geografy

Zápočtová práce STATISTIKA I

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Základy teorie pravděpodobnosti

9.7 TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI

Základy biostatistiky

STATISTICA Téma 1. Práce s datovým souborem

Nejčastější chyby v explorační analýze

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

9.6 TŘÍDĚNÍ PODLE JEDNOHO NESPOJITÉHO ČÍSELNÉHO ZNAKU

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

23. Matematická statistika

Cvičení 12: Binární logistická regrese

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Statistika I (KMI/PSTAT)

Kontingenční tabulky v Excelu. Představení programu Statistica

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Popisná statistika. Statistika pro sociology

Analýza dat na PC I.

Protokol č. 1. Tloušťková struktura. Zadání:

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

8.1.2 TABULKA SKUPINOVÁ

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Základy popisné statistiky

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Popisná statistika. Komentované řešení pomocí MS Excel

PREZENTACE DAT: SLOŽITĚJŠÍ GRAFY

Mnohorozměrná statistická data

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Statistika I (KMI/PSTAT)

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Vzorová prezentace do předmětu Statistika

Deskriptivní statistika (kategorizované proměnné)

Analýza dat s využitím MS Excel

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

Soukromá střední odborná škola Frýdek-Místek, s.r.o.

7. Rozdělení pravděpodobnosti ve statistice

HODNOCENÍ VÝUKY STUDENTY PEDF UK ZS 2016/2017

Statistika pro geografy. Rozd lení etností DEPARTMENT OF GEOGRAPHY

PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO SPOJITÉHO ČÍSELNÉHO ZNAKU. INTERVALOVÉ ROZDĚLENÍ ČETNOSTI

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

PŘÍKLAD NA TŘÍDĚNÍ PODLE JEDNOHO NESPOJITÉHO ČÍSELNÉHO ZNAKU

Vybrané statistické metody. You created this PDF from an application that is not licensed to print to novapdf printer (

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU


APERIO PROBLÉMY A POTŘEBY RODIČŮ

1. cvičení 4ST201. Základní informace: Vyučující: Obsah: Informace o kurzu Popisná statistika Úvod do SASu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Informační technologie a statistika 1

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Tabulka 1. Výběr z datové tabulky

Informace ze zdravotnictví Ústeckého kraje

Daně z pohledu veřejného mínění listopad 2014

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců)

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

1. Kategoriální proměnná nominální: (Tabulka a graf četností) Př.: sloupec (PokudanoJakčasto) -> Analyze -> Descriptive statistics -> Frequencies

Metodologie pro Informační studia a knihovnictví 2

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Návod na vypracování semestrálního projektu

Chyby měření 210DPSM

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Základy statistiky pro obor Kadeřník

Míra přerozdělování příjmů v ČR

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Praktická statistika. Petr Ponížil Eva Kutálková

MATEMATIKA III V PŘÍKLADECH

Excel mini úvod do kontingenčních tabulek

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

Transkript:

Obsah Statistika Zpracování informací ze statistického šetření Třídění statistického souboru Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi;-) romanbiskup(at)emailcz 20 února 2012 Třídění dle statistického znaku Prosté a intervalové třídění Četnosti statistického znaku Tabulky četností Prosté třídění Intervalové třídění Grafická vizualizace rozložení četností Histogram četnosti Výsečový graf Statistika bybirom Statistika Třídění 1/20 Statistika bybirom Statistika Třídění 2/20 Třídění dle statistického znaku Důvody třídění: zpřehledněnísouboru, zjištěníempirickéhorozdělenístatistickéhosouboru, sníženínumerickénáročnostivýpočtustatistickýchcharakteristik Dle počtu třídících znaků: jednostupňové, dvoustupňové(kontingenčnítabulky), vícestupňové Dle typu třídění: tříděníprosté(malýpočetrůznýchhodnotznaku), tříděníintervalové(velkýpočetrůznýchhodnotznaku,spojitýnumerický znak) Základní zásady při třídění: zásadaúplnosti(každájednotkamusíněkampatřit), zásadajednoznačnosti(každájednotkamusímítprávějednomístopřitřídění) Postup třídění I Prosté třídění libovolný statistický znak 1 stanovení počtu pozorování různých hodnot znaku(předpokládejme k různých hodnot) Intervalové třídění numerický statistický znak 1 stanovenípočtuintervalů k,optimálně8 k 20 k 1+3,3 logn (Sturgesovopravidlo) k 8 (maxx minx) 100 k n 2 stanovení délky intervalu h maxx minx h = k 3 rozdělenínaintervaly ; ), ; ),, ; minx +i h;minx +(i +1) h), proi =0,,k 2a minx +(k 1) h;maxx Pro popis statistického znaku je vhodné jak délku intervalů, tak hranice intervalů učesat,tjvhodnězaokrouhlit;jevšaktřebazajistit,abytakto upravené intervaly pokryly všechny hodnoty statistického znaku Statistika bybirom Statistika Třídění 3/20 Statistika bybirom Statistika Třídění 4/20

Postup třídění II Meze jednotlivých intervalů je třeba volit tak, aby nedocházelo k nejasnostem, tjabysekaždépozorováníjednoznačně spadalo dourčitéhointervalu 4 stanovení počtu pozorovaní s hodnotou znaku spadajícího do příslušného intervalu Absolutní a relativní četnost I Označme sledovaný statistický znak x, nechť má N pozorování, pak pro i =1,,k: n i absolutníčetnost početpozorováníshodnotouznakurovnoux i,respektivepočet pozorování s hodnotou znaku spadající do i-tého intervalu, zřejměplatí: k n i =N i=1 p i relativníčetnost poměrpočtupozorováníshodnotouznakurovnoux i vzhledem celkovému počtu pozorování, respektive poměr počtu pozorování s hodnotou znaku spadající do i-tého intervalu vzhledem celkovému počtu pozorování, p i = n i N (p i 100%), i =1,,k; Statistika bybirom Statistika Třídění 5/20 Statistika bybirom Statistika Třídění 6/20 Absolutní a relativní četnost II izdezřejmě: k p i =1 (100%) i=1 Statistika bybirom Statistika Třídění 7/20 Kumulativní četnosti I k ni kumulativní(absolutní)četnost početpozorování,unichžjehodnotastatistickéhoznakux x i, respektive počet pozorování zařazených díky hodnotě statistického znaku od prvního až do i-tého intervalu včetně, tj k ni =n 1 +n 2 + +n i = i n j k pi kumulativnírelativníčetnost udávápoměrpočtupozorování,unichžjehodnotastatistickéhoznaku x x i,vzhledemkcelkovémupočtupozorovánírespektivepoměrpočtu pozorování zařazených díky hodnotě statistického znaku od prvního až do i-tého intervalu včetně vzhledem k celkovému počtu pozorování, tj k pi =p 1 +p 2 + +p i = j=1 i p j Je nutné uspořádání znaku x, tj má smysl dělat minimálně pro ordinální znak Nebo ne? Jakou by pak měla kumulativní četnost interpretaci? k nk =N,k pk =1 (100%) Statistika bybirom Statistika Třídění 8/20 j=1

Tabulky četností Prosté třídění Datový soubor Evidence studijních výsledků LS 2005 Obor Počet Zameškáno Zápočet Body Hodnocení PUPN 4 0 Ano 4 1 VZ 0 3 Ano 1,5 4 OP 0 2 Rost 4 2 PP 0 0 Biskup 2 4 VZ 0 3 Ano 1 4 OP 0 1 Rost 2 4 ZOO 1 0 Ano 4 2 BT 13 1 Ano 4 2 OP 0 0 Rost 0,5 4 VZ 1 2 Ano 4 2 VZ 0 3 Ne 0 4 VZ 0 2 Ano 1,5 4 ZOO 2 1 Ano 1,5 4 Tabulky četností Prosté třídění Přípravné práce Evidence studijních výsledků LS 2005 Body počet bodů získaných z písemné části zkoušky ze statistiky LS 2005 (řádný termín) 1N =139;k=13(0;0,5;;6bodů)stanovenípočtupozorování jednotlivých hodnot znaku Statistika bybirom Statistika Třídění 9/20 Statistika bybirom Statistika Třídění 10/20 Tabulky četností Prosté třídění Tabulka četností Evidence studijních výsledků LS 2005 Počet bodů získaných z písemné části zkoušky ze statistiky LS 2005(řádný termín) x i n i p i (%) k ni k pi (%) 0,0 27 19,42 27 19,42 0,5 11 7,91 38 27,34 1,0 20 14,39 58 41,73 1,5 15 10,79 73 52,52 2,0 14 10,07 87 62,59 2,5 11 7,91 98 70,50 3,0 22 15,83 120 86,33 3,5 8 5,76 128 92,09 4,0 7 5,04 135 97,12 4,5 3 2,16 138 99,28 5,0 1 0,72 139 100,00 5,5 0 0,00 139 100,00 6,0 0 0,00 139 100,00 Σ 139 100,00 Tabulky četností Intervalové třídění Datový soubor Splátkový prodej(2004) Věk Pohlaví Stav Vzdělání Zaměstnání Příjem(Kč) Úvěr(Kč) Splátek 59 žena ženatý základní důchodce 7 200 5 390 20 27 žena ženatý střední dělník 7 000 7 542 20 50 muž rozvedený střední kuchař 61 000 6 216 10 29 muž svobodný vyučený dělník 10 000 7 002 20 31 muž ženatý vyučený řidič 15 000 8 982 10 19 žena druh základní mateř dovolená 5 500 6 696 10 22 muž svobodný vyučený malíř, natěrač 10 000 4 621 20 34 muž ženatý střední státzam 15159 7624 30 45 žena ženatý vyučený podnikatel 10 000 7 515 20 24 muž rozvedený vyučený technik 12 000 6 680 20 30 muž rozvedený vyučený pekař 12 500 3 228 20 25 muž svobodný střední pol inspektor 14 000 14 229 30 Statistika bybirom Statistika Třídění 11/20 Statistika bybirom Statistika Třídění 12/20

Tabulky četností Intervalové třídění Příprava intervalů Splátkový prodej(2004) Úvěr cena zaplacená za celkový spotřebitelský úvěr; 1N =737;k 1+3,3 log737 =10,463, zvolmek=11; 2minx =1584amaxx =25164; 3h = 25164 1584 =2151,273, položmeh =2200adolnímezprvního 11 intervalu rovnu 1 500 pak: 1 1500 ; 3700) 2 3700 ; 5900) 3 5900 ; 8100) 10 21300 ;23500) 11 23500 ;25700 4 stanovení počtu pozorovaní v jednotlivých intervalech Tabulky četností Intervalové třídění Tabulka četností Splátkový prodej(2004) Cena zaplacená za celkový spotřebitelský úvěr Tabulka četností:celková výše úvěru Četnost Kumulativní Relčetnost Kumulativní OD DO četnost relčetnost 1500 Kč<=x<3 700 Kč 69 69 9,36228 9,3623 3700 Kč<=x<5 900 Kč 217 286 29,44369 38,8060 5900 Kč<=x<8 100 Kč 218 504 29,57938 68,3853 8100 Kč<=x<10 300 Kč 104 608 14,11126 82,4966 10300 Kč<=x<12 500 Kč 55 663 7,46269 89,9593 12500 Kč<=x<14 700 Kč 54 717 7,32700 97,2863 14700 Kč<=x<16 900 Kč 15 732 2,03528 99,3216 16900 Kč<=x<19 100 Kč 3 735 0,40706 99,7286 19100 Kč<=x<21 300 Kč 0 735 0,00000 99,7286 21300 Kč<=x<23 500 Kč 1 736 0,13569 99,8643 23500 Kč<=x<25 700 Kč 1 737 0,13569 100,0000 Vytvořeno ChD 0 737 0,00000 100,0000 Statistika bybirom Statistika Třídění 13/20 Statistika bybirom Statistika Třídění 14/20 Grafická vizualizace rozložení četností vizualizace absolutních četností prosté třídění navodorovnouosusevynášíhodnotysledovanéhoznaku nasvislouosusepakvynášíabsolutníčetnosti nadjednotlivýmihodnotamiznakujsouvynášenyhodnotyodpovídající příslušným absolutním četnostem jednotlivéhodnotyjsounavícspojenylomenoučárou Grafická vizualizace rozložení četností Počet bodů získaných z písemné části zkoušky ze statistiky LS 2005 řádný termín 30 25 20 Po et pozor 15 10 5 0 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 Vytvořeno v programu MS Excel 2000 Body Statistika bybirom Statistika Třídění 15/20 Statistika bybirom Statistika Třídění 16/20

Histogram četnosti Grafická vizualizace rozložení četností Histogram četnosti vizualizace absolutních četností intervalového třídění navodorovnouosusevynášímezeintervalů nasvislouosupakabsolutníčetnosti nadjednotlivýmiintervalyjsouvykreslenysloupcespodstavoušířkyintervalua výškou absolutní četnosti někdyjsouhodnotyvynášenénasvislouosumodifikoványtak,abycelková plocha sloupců byla rovná jedné vše pochopitelně v měřítku;-) Histogram četnosti Grafická vizualizace rozložení četností Histogram četnosti Cena zaplacená za celkový spotřebitelský úvěr Počet pozor Histogram: Celková výše úvěru 250 200 150 100 50 0 1 500 Kč<=x<3 700 Kč 3 700 Kč<=x<5 900 Kč 5 900 Kč<=x<8 100 Kč 8 100 Kč<=x<10 300 Kč Vytvořeno v programu STATISTICA komplet 61 Cz 10 300 Kč<=x<12 500 Kč 12 500 Kč<=x<14 700 Kč Kategorie 14 700 Kč<=x<16 900 Kč 16 900 Kč<=x<19 100 Kč 19 100 Kč<=x<21 300 Kč 21 300 Kč<=x<23 500 Kč 23 500 Kč<=x<25 700 Kč 25 700 Kč<=x<27 900 Kč Statistika bybirom Statistika Třídění 17/20 Statistika bybirom Statistika Třídění 18/20 Grafická vizualizace rozložení četností Výsečový graf Grafická vizualizace rozložení četností Výsečový graf Výsečový(koláčový) graf Výsečový graf vizualizace relativních četností Výsledné známky ze Statistiky 2004/05 LS plochagrafujedělenanakruhovévýsečevpoměru,kterýjedánrelativní četnosti, tj i =360 p i, zřejměplatí: k i=1 i =360 10,43% Graf je obvykle doplněn o legendu a relativní četnosti v procentech 45,40% 17,18% 26,99% Vytvořeno v programu MS Excel 2000 1 2 3 4 Statistika bybirom Statistika Třídění 19/20 Statistika bybirom Statistika Třídění 20/20