Aplikovaná statistika v R

Podobné dokumenty
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika pro geografy

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Popisná statistika. Statistika pro sociology

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Analýza dat na PC I.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Základy popisné statistiky

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Metodologie pro ISK II

Číselné charakteristiky

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.


Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Základy pravděpodobnosti a statistiky. Popisná statistika

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Metodologie pro Informační studia a knihovnictví 2

Informační technologie a statistika 1

Popisná statistika kvantitativní veličiny

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Metodologie pro Informační studia a knihovnictví 2

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Číselné charakteristiky a jejich výpočet

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Nejčastější chyby v explorační analýze

Aplikovaná statistika v R - cvičení 2

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Statistika v současnosti

Popisná statistika. Komentované řešení pomocí MS Excel

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

MATEMATIKA III V PŘÍKLADECH

Charakteristika datového souboru

STATISTICKÉ CHARAKTERISTIKY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Třídění statistických dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

Renáta Bednárová STATISTIKA PRO EKONOMY

Základy popisné statistiky

Praktická statistika. Petr Ponížil Eva Kutálková

Zápočtová práce STATISTIKA I

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Náhodná veličina a rozdělení pravděpodobnosti

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

Statistika I (KMI/PSTAT)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Aplikovaná statistika v R - cvičení 3

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Základní statistické charakteristiky

23. Matematická statistika

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Základní analýza dat. Úvod

Základní statistické pojmy

Tomáš Karel LS 2012/2013

Minimální hodnota. Tabulka 11

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Charakterizace rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Deskriptivní statistika (kategorizované proměnné)

Přednáška III. Data, jejich popis a vizualizace. Náhodný výběr, cílová a výběrová populace Typy dat Vizualizace různých typů dat Popisné statistiky

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Mnohorozměrná statistická data

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Cvičení ze statistiky - 3. Filip Děchtěrenko

Tabulka 1. Výběr z datové tabulky

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Statistika pro gymnázia

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Úvod do statistické metodologie

Deskriptivní statistika (kategorizované proměnné)

TECHNICKÁ UNIVERZITA V LIBERCI

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Transkript:

Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15

Co bude náplní našich setkání? Seznámíme se základními metodami analýzy dat Vyzkoušíme si práci v jazyce R Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 2 / 15

Rozdělení statistiky Statistiku rozdělujeme na deskriptivní statistiku a inferenční statistiku Deskriptivní statistika se zabývá popisem vzorku Inferenční statistika se zabývá základní populací (pomocí výběru) Základní soubor (population) je množina všech jevů, kterými se zabýváme Výběrový soubor (sample) je podmnožina základního souboru Kdybychom měli k dispozici celý základní soubor, nemusíme dělat žádnou statistiku Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 3 / 15

Rozdělení statistiky v obrázku Obrázek: Vztah mezi základním a výběrovým souborem Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 4 / 15

Deskriptivní statistika Slouží ke zjednodušenému popisu vzorku - typicky ho chceme popsat několika čísly Můžeme se zabývat jednou proměnnou nebo více zaráz. Pro jednu proměnnou se typicky zabýváme: Míry středu popisují, kde přibližně leží prostředek proměnné Míry variability popisují, jak moc se proměnná pohybuje kolem tohoto středu Grafy nám zobrazí přehledně celý vzorek Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 5 / 15

Míry středu Průměr - určí nám průměrnou hodnotu proměnné Medián - určí nám prostřední hodnotu proměnné Modus - určí nám nejčastější hodnotu proměnné Označují se někdy jako triple M Průměr se používá při parametrických testech, medián při neparametrických testech Kromě mediánu se používají i jiná rozdělení dat. Konkrétně percentily, kvantily a kvartily. Dolní kvartil je číslo větší než 25% dat, horní než 75% dat Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 6 / 15

Míry variability Rozpětí - rozdíl největší a nejmenší hodnoty Mezikvartilové rozpětí - rozdíl horního a dolního kvartilu Mezikvartilová odchylka - polovina mezikvartilového rozpětí (odchylka od mediánu) Rozptyl - Celková míra variability Směrodatná odchylka - Průměrná míra variability Směrodatná odchylka (rozptyl) se používá při parametrických testech, mezikvartilová odchylka (rozpětí) při neparametrických testech Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 7 / 15

Grafy Obrázek: Histogram Obrázek: Scatter plot Obrázek: Box plot Obrázek: Ukázky běžně používaných grafů Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 8 / 15

Další popisné statistiky Šikmost - jak moc nahnuté je rozdělení. Kladná šiknost určuje padání doleva, záporná doprava Trimmed mean - spočítáme průměr bez spodních a horních x%, funkce describe používá spodních a horních 10% Median absolute deviation - MAD; absolutní odchylka od mediánu Tr. mean a MAD jsou robustní míry středu a polohy, používají se v robustních testech Střední chyba průměru - Standard error of the mean, SEM; určuje koĺısání všech možných výběrů ze základní populace (normovaná směrodatná odchylka) Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 9 / 15

Ukázka šikmosti Obrázek: Pozitivně a negativně zešikmená data Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 10 / 15

Druhy proměnných Jednotlivé výzkumné proměnné mohou být různých typů. Podle typu porměnných voĺıme statistický nástroj Obrázek: Pozitivně a negativně zešikmená data Kvantitativní se někdy rozděluje na intervalové a poměrové Častokrát není přiřazení proměnných jednoznačné Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 11 / 15

Příklady proměnných Nominální - barva, pohlaví, třídy ve škole Ordinální - Likertova škála, známky ve škole Kvantitativní - věk, výška Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 12 / 15

Vyzkoušíme si to prakticky Založte si v RStudiu nový projekt Stáhněte si soubor z http://goo.gl/t0iofl, rozbalte ho do adresáře s projektem a otevřete soubor cviceni1.r Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 13 / 15

A nyní sami:-) Otevřete si soubor cviceni1 test.r a prozkoumejte data, zobrazte vztah mezi proměnnými Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 14 / 15

Konec cvičení Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 15 / 15