Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Podobné dokumenty
Praktická statistika. Petr Ponížil Eva Kutálková

Zápočtová práce STATISTIKA I

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Náhodná veličina a rozdělení pravděpodobnosti

Metodologie pro ISK II

Číselné charakteristiky

Charakteristika datového souboru

Normální (Gaussovo) rozdělení

Statistika pro geografy

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Testy statistických hypotéz

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Základní statistické charakteristiky

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Číselné charakteristiky a jejich výpočet

I. D i s k r é t n í r o z d ě l e n í

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

p(x) = P (X = x), x R,

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III


PRAVDĚPODOBNOST A STATISTIKA

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Mnohorozměrná statistická data

Charakterizace rozdělení

Mnohorozměrná statistická data

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Analýza dat na PC I.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Chyby měření 210DPSM

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Základy teorie pravděpodobnosti

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

STATISTICKÉ CHARAKTERISTIKY

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Základy popisné statistiky

MATEMATIKA III V PŘÍKLADECH

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Jevy a náhodná veličina

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

7. Rozdělení pravděpodobnosti ve statistice

MATEMATICKÁ STATISTIKA - XP01MST

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Téma 22. Ondřej Nývlt

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Minimální hodnota. Tabulka 11

Stručný úvod do testování statistických hypotéz

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Metodologie pro Informační studia a knihovnictví 2

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Náhodné (statistické) chyby přímých měření

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Vybraná rozdělení náhodné veličiny

Popisná statistika. Statistika pro sociology

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

Obecné, centrální a normované momenty

Metodologie pro Informační studia a knihovnictví 2

Statistická analýza jednorozměrných dat

Základy pravděpodobnosti a statistiky. Popisná statistika

Normální (Gaussovo) rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika I (KMI/PSTAT)

Náhodné chyby přímých měření

JAK MODELOVAT VÝSLEDKY

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Aplikovaná statistika v R

Výběrové charakteristiky a jejich rozdělení

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Popisná statistika. Komentované řešení pomocí MS Excel

Pojem a úkoly statistiky

Základní analýza dat. Úvod

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Předmět studia: Ekonomická statistika a analytické metody I, II

Základní statistické pojmy

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistika pro gymnázia

Příloha podrobný výklad vybraných pojmů

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Statistická analýza jednorozměrných dat

Kontingenční tabulky v Excelu. Představení programu Statistica

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

PRAVDĚPODOBNOST A STATISTIKA

23. Matematická statistika

Transkript:

Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité (<x 1 ; x 2 >) Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud je rozptyl měření podstatně větší než nejmenší rozlišitelná hodnota, lze měřenou veličinu považovat za spojitou (Meloun & Militký, 2013). Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Diagram rozptýlení Neroztříděná data - výšky 12 studentů FT [cm]: 177 170 182 183 186 188 191 177 189 178 187 188 Diagram rozptýlení (Neubauer et al., 2012) Používá se pro malý počet hodnot (do 30). Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Diagram rozptýlení nová data Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Diagram rozptýlení (Neubauer et al., 2012): Tudy cesta nevede Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Četnost bodové rozdělení Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Hodnota znaku x i Absolutní četnost n i Relativní četnost p i Absolutní kumulativní četnost N i Relativní kumulativní četnost P i 37 4 0,125 4 0,125 38 5 0,156 9 0,281 39 8 0,250 17 0,531 40 7 0,219 24 0,750 41 2 0,063 26 0,813 42 5 0,156 31 0,969 43 1 0,031 32 1,000 S 32 1,000 Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Četnost bodové rozdělení Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Polygon četností Součtová křivka (Neubauer et al., 2012) (Neubauer et al., 2012) Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Četnost bodové rozdělení Výška 32 studentek FT [cm]: 172 169 161 171 165 169 169 165 168 175 163 168 175 169 168 171 168 163 168 175 159 168 162 163 162 179 160 177 169 160 175 170 171 polygon četností (Neubauer et al., 2012): četnost ni 7 6 5 4 3 2 1 0 155 160 165 170 175 180 185 výška [cm] Tudy cesta nevede Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Četnost - intervalové rozdělení Výška 32 studentek FT [cm]: 172 169 161 171 165 169 169 165 168 175 163 168 175 169 168 171 168 163 168 175 159 168 162 163 162 179 160 177 169 160 175 170 171 polygon četností (Neubauer et al., 2012): četnost ni 8 7 6 5 4 3 2 1 0 155 158 161 164 167 170 173 176 179 182 doporučený počet tříd k 2,46( N 1) 0,4 nebo k N výška [cm] Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Četnost absolutní a relativní U spojité veličiny je pravděpodobnost výskytu dané hodnoty x nekonečně malá. P(x) 0 Je proto lepší zjišťovat pravděpodobnost výskytu hodnoty x v nějakém intervalu od x 1 do x 2. ozn. P(x 1, x 2 ) Počet výsledků spadajících do daného intervalu nazýváme (absolutní) četnost Q. Výhodnější je používat relativní četnost q = Q/N, kde N je počet měření (Anděl, 2011). Anděl, J. (2011). Základy matematcké statstky. Praha: MATFYZPRESS.

Histogram Četnosti měření graficky znázorníme histogramem (Budíková et al.,2010). k doporučený počet tříd histogramu k 2,46( N 1) 0,4 nebo k N Budíková, M., Králová, M., Maroš, B. (2010). Průvodce základními statstckými metodami. Praha: GRADA.

Histogram - počet tříd doporučený počet tříd histogramu (Budíková et al.,2010): k 2,46(N 1) 0,4 nebo k N Budíková, M., Králová, M., Maroš, B. (2010). Průvodce základními statstckými metodami. Praha: GRADA.

Hustota pravděpodobnosti f x = lim Δ x 0 (Neubauer et al., 2012) P x, x Δ x Δ x b P a, b = a f x d x Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Distribuční funkce x F x = f t d t Funkce hustoty pravděpodobnosti nebo distribuční funkce v sobě nesou kompletní informaci o náhodném rozdělení! (Neubauer et al., 2012). Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Kvantily Kvantil x p je hodnota znaku, pro kterou platí, že 100p % jednotek uspořádaného souboru má hodnotu menší nebo rovnu x p (Neubauer et al., 2012). 25% kvantil x 0,25 - dolní kvartil 75% kvantil x 0,75 - horní kvartil 50% kvantil x 0,50 - medián 90% kvantil x 0,90-9. decil 99% kvantil x 0,99-99. percentil Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Aritmetický průměr Aritmetický průměr spojité náhodné veličiny x E (x) = def.obor x f (x)d x Aritmetický průměr diskrétní náhodné veličiny x N E (x) = 1 N i=1 x i Ukážeme dále, že nejlepším odhadem střední hodnoty m je aritmetický průměr E(x) (Meloun & Militký, 2013) =E x Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Srovnání různých charakteristik polohy Aritmetický průměr - součet hodnot vydělený jejich počtem. Medián - kvantil x 0,50 - stejně hodnot pod mediánem jako nad ním. Modus - nejpravděpodobnější hodnota. http://www.z 翼 so.z 翼

Distribuční funkce - mzdy http://www.z 翼 so.z 翼 Jak je zkonstruovaná distribuční funkce mezd? Jak odstranit rozdíly?

Různé charakteristiky variability Variabilita popisuje rozsah souboru. Různé charakteristiky variability: rozdíl maximální a minimální hodnoty kvartilové rozpětí (rozdíl horního a dolního kvartilu) decilové rozpětí (rozdíl devátého a prvního decilu) percentilové rozpětí (rozdíl 99. a 1. percentilu)... (Meloun & Militký, 2013) Neubauer, J., Sedlačík, M., Kříž, O. (2012). Základy statstky Aplikace v technických a ekonomických oborech. Praha: GRADA.

Rozptyl a směrodatná odchylka Nejčastěji používanou charakteristikou variability (tj. míry odchylky jednotlivých hodnot od střední hodnoty) je rozptyl náhodné veličiny x. Pro spojitou náhodnou veličinu D(x) = def.obor Pro diskrétní náhodnou veličinu N D(x) = 1 N i=1 {x E (x)} 2 f (x)d x {x i E (x)} 2 Odmocnina z rozptylu se nazývá směrodatná odchylka ozn. s (Meloun & Militký, 2013). = D x Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Různé charakteristiky koncentrace Kromě střední hodnoty charakterizující polohu rozdělení a směrodatné odchylky charakterizující variabilitu (šířku) rozdělení existují i charakteristiky koncentrace informující o tvaru rozdělení. Budeme používat 1. koeficient šikmosti (šikmost) a 2. koeficient špičatosti (špičatost). Šikmost informuje o souměrnosti rozdělení. Špičatost informuje o koncentraci prostředních hodnot. Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Šikmost Šikmost je charakteristika rozdělení náhodné veličiny, která popisuje jeho symetrii (Meloun & Militký, 2013). Šikmost a 3 je definována vztahem: a 3 = n i=1 x i 3 N 3 pro a 3 = 0 je rozdělení symetrické Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Špičatost Špičatost (koeficient špičatosti) popisuje koncentraci rozdělení kolem středu (Meloun & Militký, 2013). normální rozdělení má nulovou špičatost při kladné špičatosti je křivka hustoty pravděpodobnosti špičatější než u normálního rozdělení při záporné špičatosti je křivka hustoty pravděpodobnosti plošší než u normálního rozdělení Šikmost a 4 je definována vztahem: a 4 = n i=1 x i 4 n 4 3 Meloun, M., Militký, J. (2013). Kompendium statstckého zpracování dat. Praha: Karolinum.

Výpočet šikmosti a špičatosti v Excelu V Excelu existuje pro výpočet šikmosti funkce a 3 * =SKEW() a pro výpočet špičatosti funkce a 4 *=KURT(). Bohužel jsou tyto funkce definovány pomocí jiných vzorců: a 3 * = N N 1 N 2 n i=1 x i 3 3 a * N N 1 4 = N 1 N 2 N 3 n i=1 x i 4 4 Hodnoty lze přepočítat podle vztahů: 3 N 1 2 N 2 N 3 a 3 = N 2 N N 1 a * 3 N 2 N 3 a 4 = N 2 1 a 4 * 6 N 1