7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Podobné dokumenty
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Základy biostatistiky

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

23. Matematická statistika

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky


2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Statistika pro geografy

Třídění statistických dat

Analýza dat na PC I.

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Číselné charakteristiky

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Základy pravděpodobnosti a statistiky. Popisná statistika

Metodologie pro ISK II

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Pojem a úkoly statistiky

Škály podle informace v datech:

Zápočtová práce STATISTIKA I

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Renáta Bednárová STATISTIKA PRO EKONOMY

Pracovní list č. 3 Charakteristiky variability

Tomáš Karel LS 2012/2013

Náhodná veličina a rozdělení pravděpodobnosti

Popisná statistika. Statistika pro sociology

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Aplikovaná statistika v R

Statistika. pro žáky 8. ročníku. úterý, 26. března 13

Praktická statistika. Petr Ponížil Eva Kutálková

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Základní statistické pojmy

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Mnohorozměrná statistická data

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

INDUKTIVNÍ STATISTIKA

Popisná statistika kvantitativní veličiny

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Charakteristika datového souboru

Statistika v současnosti

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Popisná statistika. Komentované řešení pomocí MS Excel

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Mnohorozměrná statistická data

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

TECHNICKÁ UNIVERZITA V LIBERCI

Statistická šetření - PROČ? Žádná věda není skutečnou vědou, není-li podložena matematickými principy. (L.da Vinci)

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Statistika. Zpracování informací ze statistického šetření. Roman Biskup

Kontingenční tabulky v Excelu. Představení programu Statistica

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: 75% docházka na cvičení. + odevzdání seminární práce (úkoly na PC)

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Tabulka 1. Výběr z datové tabulky

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl?

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Nejčastější chyby v explorační analýze

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Informační technologie a statistika 1

MATEMATIKA III V PŘÍKLADECH

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Metodologie pro Informační studia a knihovnictví 2

STATISTIKA jako vědní obor

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Jevy a náhodná veličina

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

Číselné charakteristiky a jejich výpočet

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Ranní úvahy o statistice

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Základy popisné statistiky

Základní statistické charakteristiky

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Transkript:

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Oblasti využití statistiky v medicíně Zvládání variability Variabilita: biologická, podmínek, měřících přístrojů - hodnocení variability, variabilita náhodná x nenáhodná Diagnostika nemocí a identifikace zdravotních problémů společnosti Pravděpodobnostní závěry na základě mnoha údajů z předchozích obdobných případů (popis příznaků nemoci x počátek thalidomidové aféry) Prognóza léčby a odhad přínosu zdravotnických programů Pravděpodobnostní odhad dalšího průběhu léčby (vychází z minulých zkušeností podobnými případy) Také o aplikacích populačních zdr. opatřeních se vedou záznamy, které umoţňují odhadovat úspěšnost příštích opatření

Oblasti využití statistiky v medicíně Výběr vhodného medicínského postupu Dřívější zkušenosti + klinické zkoušky + další důleţité aspekty dané metody (ekon. náklady, riziko pro společnost) Řízení systému péče o zdraví Vyuţívání soustavy rutinních statistik doplňovaných o výběrová šetření velikost a struktura populace, informace o populačních procesech rození, umírání, migrace, zdravotní stav populace, ţivotní prostředí, ţivotní styl, zdravotnický systém

Počátky - popisná statistika Statistika jako popis státu: Popis a soupis zemědělského, hospodářského a politického stavu země a obyvatelstva Politická aritmetika zachycení vývoje obyvatelstva Vyčerpávající šetření zachycení veškerého obyvatelstva pomocí sčítání lidu a vedení podrobných záznamů o demografických, geografických a hospodářských jevech

Moderní (induktivní) statistika 30. léta 20. století rozvoj teorie pravděpodobnosti a revoluce ve statistice Výběrová šetření nové moţnosti: nezjišťuje se kaţdý jednotlivý detail rozvoj metod umoţňujících tvořit závěry o celku na základě výběrových šetření. hlubší analýza výběrového souboru, zkoumání mnoha dosud nezkoumaných jevů.

Statistika základní pojmy

Statistika jako vědní obor Jejím předmětem jsou hromadné jevy Vlastnosti, znaky a události, které se vyskytují ve velkém mnoţství. Zabývá se sběrem, popisem a analýzou dat. Data zjištěné (naměřené) hodnoty určitých vlastností hodnoty jednotlivých vlastností se vyznačují variabilitou Variabilita dat Důsledek působení velkého mnoţství drobných NÁHODNÝCH vlivů, z nichţ kaţdý výslednou hodnotu sledované vlastnosti ovlivňuje jen nepatrně.

Náhoda ve statistice Přirozený jev, který lze zkoumat exaktními metodami teorie pravděpodobnosti. Má svoje zákonitosti, jsou-li sledované vlastnosti určovány pouze náhodnými vlivy, podléhají zákonitostem náhody. Pokud zjištěné údaje neodpovídají těmto zákonitostem, nezpůsobuje rozdíly v hodnotách vlastnosti náhoda, ale systematické působení nějakého faktoru.

Induktivní a deduktivní úvaha Aplikace statistických metod se váţe ke dvěma typům uvaţování: Deduktivní úvaha: vyuţívání obecných znalostí k rozhodování v jednotlivých případech Obecný popis nemoci stanovení diagnózy u konkrétního pacienta Induktivní úvaha: zobecnění poznatků z jednotlivých případů na všechny moţné případy Sledovaní pacienti na lék reagovali příznivě - zobecnění - reakce všech pacientů budou příznivé Kaţdý závěr (rozhodnutí) je provázen určitou nejistotou, statistika umí tuto nejistotu vyčíslit.

Základní a výběrový soubor Základní soubor soubor jednotek, jejichţ vlastnosti chceme poznat Výběrový soubor ta část souboru, u které skutečně probíhá statistické šetření

Výběrový soubor Vypovídá jen o tom základním souboru, ze kterého byl odvozen. Reprezentativnost výběrového souboru (dobře reprezentuje všechny známé i neznámé charakteristiky základního souboru). Náhodný výběr je získán postupem, kdy kaţdý prvek základního souboru má na začátku výběru stejnou naději být vybrán.

Metody náhodného výběru 1. Prostý náhodný výběr losováním, pomocí tabulek (generátoru) náhodných čísel 2. Náhodný výběr mechanický (systematický) vytvoříme seznam jednotek, ze kterého vybereme např. kaţdou stou osobu, přičemţ první osobu vybereme metodou prostého náhodného výběru. 3. Náhodný výběr oblastní (stratifikovaný) rozdělení do oblastí (strat) např. rozdělíme soubor na muţe a ţeny a vybíráme prostým NV takový počet muţů a ţen, aby byl zachován poměr muţů a ţen v základním souboru.

Etapy statistického šetření 1) Plán šetření (cíl, studium literatury, statistická jednotka, základní soubor, sledované znaky, způsob a přesnost měření, forma záznamu, způsob a rozsah výběru, statistické zpracování, pracovní a testované hypotézy, přínos a náklady výzkumu, pilotní studie) 2) Sběr dat (dodrţování pravidel těmi, kdo sběr dat provádějí) 3) Popis a technické zpracování (deskriptivní statistika) 4) Rozbory a závěry (induktivní statistika)

Dvě základní oblasti statistiky Popisná statistika Induktivní statistika

Deskriptivní statistika - popis dat

Deskriptivní statistika 1. Statistické třídění 2. Prezentace (vizualizace) dat 3. Statistické charakteristiky

Statistické třídění

Třídění zpřehlednění souboru dat popis struktury souboru rozloţení četností Způsob třídění závisí na typu veličiny. Výsledky třídění uvádíme v tabulkách tzv. tabulky rozdělení četností.

Třídění: typy znaků (veličin) 50ti-letý muţ, měří 170 cm, váţí 90 kg, vitální kapacitu plic má 4,62 l, prodělal zánětlivé plicní onemocnění, má středoškolské vzdělání a je nekuřák. Charakteristika znak (veličina, proměnná) obor hodnot znaku Typy znaků: Kvalitativní (kategoriální) Kvantitativní (intervalové) - Nominální - Spojité Alternativní (test+, test-) Mnoţné - Diskrétní - Pořadové (ordinální)

Třídění kvalitativních veličin Kategorie třídění jsou předem dány. Jde o výčet všech hodnot, kterých můţe sledovaný znak nabývat (např. znak pohlaví - hodnoty znaku: muţ, ţena; vzdělání hodnoty znaku: ZŠ, SŠ, VŠ).

Třídění: jednostupňové a vícestupňové Třídění podle jednoho znaku. Třídění podle dvou a více znaků současně. Jednostup. třídění Nekuřák 120 Slabý kuřák 60 Silný kuřák 20 CELKEM 200 CELKEM Dvoustupňové třídění ZŠ SŠ VŠ CELKEM Nekuřák 20 40 60 120 Slabý kuřák 35 10 15 60 Silný kuřák 12 7 1 20 CELKEM 67 57 76 200

Kvalitativní znaky Tab. 1.: Rozloţení souboru 200 muţů podle kuřáckých zvyklostí a vzdělání (absolutní počty a procenta) ZŠ SŠ VŠ CELKEM Nekuřák 20 16,7 40 33,3 60 50,0 120 100,0 Slabý kuřák 29,9 70,1 78,9 60,0 35 58,3 10 16,7 15 25,0 60 100,0 52,2 17,5 19,7 30,0 Silný kuřák 12 60,0 7 35,0 1 5 20 100,0 17,9 12,3 1,4 10,0 CELKEM 67 33,5 57 28,5 76 38,0 200 100,0 100,0 100,0 100,0 100,0

Třídění kvantitativních veličin Třídy vytváříme teprve na základě získaných dat Dochází k redukci dat ve prospěch přehlednosti Vytváření intervalů: počet intervalů délka intervalů hranice intervalů Musíme brát v úvahu: počet dat (velikost souboru) přesnost měření cíl třídění

Prezentace dat v tabulkách Výsledky třídění uvádíme v tabulkách tzv. tabulky rozdělení četností. Četnosti: absolutní relativní kumulativní absolutní kumulativní relativní

Kvantitativní znaky Tab. 1.: Rozloţení vitální kapacity plic u 200 muţů ve věku 40-50 let (v litrech) interval střed četnost kumulativní četnost absolut. relat. % absolut. relat. % 3,00 3, 39 3,20 6 3,0 6 3,0 3,40 3,79 3,60 9 4,5 15 7,5 3,80 4,19 4,00 16 8,0 31 15,5 4,20 4,59 4,40 36 18,0 67 35,5 4,60 4,99 4,80 52 26,0 119 59,5 5,00 5,39 5,20 44 22,0 163 81,5 5,40 5,79 5,60 22 11,0 185 92,5 5,80 6,19 6,00 11 5,5 196 98,0 6,20 6,59 6,40 4 2,0 200 100,0 celkem 200 100,0 200 100,0

Třídění kvantitativních veličin Stejně dlouhé intervaly Nestejně dlouhé intervaly Věk 1 18 2 43 Abs. četnost 3 50 4 60 5 36 6 25 7 22 8 21 9 6 10 5 11-15 14 16-20 3 Celkem 303

Prezentace (vizualizace) dat

Prezentace dat Prezentace dat v grafech 1. Četnost jednotlivých kategorií (tříd, intervalů) 2. Tvar rozloţení četností Symetrické x asymetrické Jednovrcholové x dvouvrcholové Výběr vhodných statistických ukazatelů Výběr vhodného teoretického rozloţení četností při odhadu parametrů a testování hypotéz

Prezentace dat v grafech Kvalitativní veličiny Sloupcový graf (sloupce oddělené mezerou) Výsečový graf (struktura) Kartogram (regionální srovnání)

Sloupcový graf

Výsečový graf

Kartogram

Prezentace dat v grafech Kvantitativní veličiny Sloupcový graf Histogram Polygon četností

Prezentace kvantitat. dat osa X : naměřené hodnoty sledováné veličiny (VKP v l) osa Y : četnost intervalů (abs. nebo v %) Tvar rozloţení četností: Symetrické x asymetrické Jednovrcholové x vícevrcholové Podoba s teoretickými modely rozloţení četností

Prezentace kvantitativních dat

Statistické ukazatele

Statistické ukazatele a) Relativní ukazatele - (viz rutinní statistiky: ukazatele frekvence, ukazatele struktury, indexy) b) Střední hodnoty (ukazatele polohy) c) Ukazatele variability VOLBA VHODNÝCH UKAZATELŮ POLOHY A VARIABILITY ZÁVISÍ NA TYPU SLEDOVANÉHO ZNAKU (nominální x ordinální x intervalový) A NA TVARU ROZLOŢENÍ ČETNOSTÍ (symetrické x asymetrické).

Ukazatele polohy

Ukazatele polohy Aritmetický průměr (m): sečteme pozorované hodnoty a vydělíme je počtem sledovaných jednotek Medián (m e ): hodnota, která je právě uprostřed všech pozorování, která jsme seřadili podle velikosti Modus (m o ): třída (kategorie) s nejvyšší četností Kvantil (percentil, decil, kvartil) pořadový ukazatel, obměna mediánu

Ukazatele polohy Typ znaku: nominální: modus ordinální: modus, medián, percentil (kvantil) intervalové: modus, medián, percentil (kvantil), průměr POZOR NA INTERPRETACI ARITMETICKÉHO PRŮMĚRU U ASYMETRICKÝCH ROZLOŢENÍ. ARITMETICKÝ PRŮMĚR JE CITLIVÝ NA VYCHÝLENÉ HODNOTY. VHODNĚJŠÍM UKAZATELEM POLOHY U ASYMETRICKÝCH ROZLOŢENÍ MŮŢE BÝT MEDIÁN.

Ukazatele polohy m = 26 700 m o = 20 000 m e = 22 000

Ukazatele polohy Ukazatele polohy u symetrického a asymetrického rozloţení symetrické pravostr. asym. levostr. asym. m = m o = m e m o < m e < m m < m e < m o

Ukazatele variability

Ukazatele variability Proč nestačí ukazatele polohy k výstiţnému popisu dat? Př. 1. sk.: 3,08 4,42 5,05 5,67 6,59 m = 4,96 2. sk.: 4,86 4,90 4,91 5,03 5,11 m = 4,96 Obě skupiny mají stejný průměr, liší se ale kolísáním hodnot, tj. VARIABILITOU.

Ukazatele variability Spolu se střední hodnotou by se měl vţdy udávat příslušný ukazatel variability! Rozpětí (u malých souborů, kde n 10) Rozptyl - směrodatná odchylka (nejč.) - variační koeficient - uvádějí se s aritmetickým průměrem ( u symetrických rozdělení) Kvantily (percentily, decily, kvartily) - uvádějí se s modem či medián (asymetrický rozdělení) - lze je ale samozřejmě pouţít i s aritmetickým průměrem

Ukazatele variability

Ukazatele variability

Ukazatele variability Variační koeficient (v.k.) Relativní ukazatel variability Udává, jaký podíl tvoří směrodatná odchylka z průměru.

Ukazatele variability Variační koeficient (v.k.) Slouţí ke srovnání variability 2 souborů, jejichţ průměry se značně liší Př.: VKP u muţů a u ţen M: m = 4, 80 s = 0,66 v.k. = 13,8% Ţ: m = 3, 90 s = 0,42 v.k. = 10,8% Slouţí ke srovnání variability znaků uváděných v různých jednotkách Př.: VKP (l), výška (cm) a hmotnost muţů (kg) VKP: m = 4,80 s = 0,66 v.k. = 13,8% Výška: m = 178 s = 4 v.k. = 2,2% Hmotnost: m = 82 s = 6 v.k. = 7,3%

Ukazatele variability Kvantily percentily, decily, kvartily Kvantily dělí soubor dat uspořádaných podle velikosti na části obsahující stejný podíl z celkového počtu jednotek Variabilita se určuje pomocí intervalu, ve kterém se pohybuje nejčastěji 80% (P 10 P 90 ) nebo 50% (P 25 P 75 ) pozorování. Postup výpočtu: 1. Určíme hodnotu pozorování, které představuje 10. percentil = dolní hranice intervalu 2. Určíme hodnotu pozorování, které představuje 90. percentil = horní hranice intervalu Vhodné ukazatele variability pro asymetrická rozloţení

Příklad Porodní délka 5 novorozenců v cm: 49, 50, 50, 51, 53 Vypočítejte: Aritmetický průměr Rozptyl Směrodatnou odchylku Variační koeficient