Metodologie pro ISK II

Podobné dokumenty
Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Zápočtová práce STATISTIKA I

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Praktická statistika. Petr Ponížil Eva Kutálková

Číselné charakteristiky

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Charakteristika datového souboru

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Statistika pro geografy

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Základní statistické charakteristiky

Analýza dat na PC I.

Deskriptivní statistika (kategorizované proměnné)


Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Číselné charakteristiky a jejich výpočet

STATISTICKÉ CHARAKTERISTIKY

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Deskriptivní statistika (kategorizované proměnné)

Aplikovaná statistika v R

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Základy popisné statistiky

Náhodná veličina a rozdělení pravděpodobnosti

MATEMATIKA III V PŘÍKLADECH

Základy pravděpodobnosti a statistiky. Popisná statistika

Charakterizace rozdělení

Minimální hodnota. Tabulka 11

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Nejčastější chyby v explorační analýze

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Kontingenční tabulky v Excelu. Představení programu Statistica

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Popisná statistika. Komentované řešení pomocí MS Excel

Statistika - charakteristiky variability

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Popisná statistika kvantitativní veličiny

Statistická analýza dat v psychologii

Popisná statistika. Statistika pro sociology

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Základní analýza dat. Úvod

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

TECHNICKÁ UNIVERZITA V LIBERCI

EXPLORATORNÍ ANALÝZA DAT. 7. cvičení

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Základní statistické pojmy

Příprava souboru dat a analýza

23. Matematická statistika

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

PRAVDĚPODOBNOST A STATISTIKA

IES FSV UK. Domácí úkol Pravděpodobnost a statistika I. Cyklistův rok

Obecné momenty prosté tvary

Základy popisné statistiky

Návrhy dalších možností statistického zpracování aktualizovaných dat

Analýza dat s využitím MS Excel

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Příloha podrobný výklad vybraných pojmů

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Téma 2. Řešené příklady

VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

Statistika I (KMI/PSTAT)

UKAZATELÉ VARIABILITY

MATEMATICKÁ STATISTIKA - XP01MST

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Jevy a náhodná veličina

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Transkript:

Metodologie pro ISK II

Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram

MODUS je hodnota, která se v datech vyskytuje nejčastěji. MEDIÁN dělí řadu výsledků seřazených podle velikosti na dvě stejně početné poloviny MEDIÁNOVÁ KATEGORIE je ta, ve které je dosaženo 50% všech údajů, postupujeme-li od první kategorie výše. ARITMETICKÝ PRŮMĚR je součet všech hodnot vydělený jejich počtem

Analyze Descriptive Statistics Frequencies Statistics Mean, Median, Mode

V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč?

V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč?

MINIMUM MAXIMUM ROZPĚTÍ Analyze Frequencies - Statistics MIN: minimální hodnota MAX: maximální hodnota RANGE: rozpětí (maximální minus minimální hodnota)

Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty (průměru). vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty.

SMĚRODATNÁ ODCHYLKA je druhá odmocnina rozptylu, a v podstatě nám říká, uvnitř jakého intervalu okolo průměru leží zvolené procento případů Čím je směrodatná odchylka menší, tím lépe pro aritmetický průměr

Zdroj: http://wilderdom.com/intelligence/iqunderstandinginterpreting.html

Rozptyl a směrodatná odchylka mají vždy stejnou jednotku jako daná proměnná (věk v letech, výška v cm, plat v EUR ) Chceme-li porovnávat mezi sebou různé proměnné (s různými jednotkami), vypočítáme variační koeficient

Analyze - Frequencies - Statistics

Nejčastěji používané: MEDIÁN (x50) KVARTILY (x25, x50, x75) DECILY (x10, x20, x30, x40, x50, x60, x70, x80, x90)

http://finexpert.e15.cz/jak-se-lisi-prumernamzda-a-median

spodních 10 % čtenářů čte jen jednu knihu ročně polovina čtenářů přečte do 10 knih ročně tři čtvrtiny čtenářů přečte do 20 knih ročně

Symetrické (normální) rozložení - aritmetický průměr, medián a modus mají stejné nebo velmi podobné hodnoty. (0) Pokud je aritmetický průměr větší než medián, který je zase větší než modus, znamená to, že je více případů menších než průměr a naše rozložení je šikmé doprava. (+) Třetí možností je, že je více případů větších než aritmetický průměr. Ten je pak menší než medián a ten je menší než modus. Naše rozložení je šikmé doleva. (-)

Pozitivní špičatost Negativní špičatost

šikmost špičatost

nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí Velmi podrobné a přehledné vizualizace distribuce spojitých dat nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí nejnižší hodnota výběru, která je větší nebo rovna rozdílu hodnoty dolního kvartilu a 1.5 násobkuinterkvartilového rozpětí

extremes Analyze Explore - Plots outliers

Kolik průměrně naši respondenti kupují knih za rok? Je průměr v tomto případě vhodný ukazatel? Zdůvodněte své stanovisko Vytvořte boxploty pro přečtené a nakoupené knihy a porovnejte je.

Vytvořte novou proměnnou spokojenost_2, kde budou jen tři kategorie: Spokojen/a Ani/ani Nespokojen/a Vytvořte novou proměnnou vek a okomentujte rozložení (max, min, středové hodnoty) Z jakých zdrojů získávají knihy muži a ženy? (vytvořte tabulku četností podle pohlaví) Z kolika zdrojů získáváme knihy?