Praktická statistika. Petr Ponížil Eva Kutálková

Podobné dokumenty
Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Normální (Gaussovo) rozdělení

Zápočtová práce STATISTIKA I

Normální (Gaussovo) rozdělení

Náhodná veličina a rozdělení pravděpodobnosti

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Číselné charakteristiky

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

Charakteristika datového souboru

Metodologie pro ISK II

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Charakterizace rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Vybraná rozdělení náhodné veličiny

Chyby měření 210DPSM


Číselné charakteristiky a jejich výpočet

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika pro geografy

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

MATEMATICKÁ STATISTIKA - XP01MST

Téma 22. Ondřej Nývlt

Jevy a náhodná veličina

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Náhodné (statistické) chyby přímých měření

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Základní statistické charakteristiky

Náhodné chyby přímých měření

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Základy teorie pravděpodobnosti

Výběrové charakteristiky a jejich rozdělení

7. Rozdělení pravděpodobnosti ve statistice

STATISTICKÉ CHARAKTERISTIKY

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Inovace bakalářského studijního oboru Aplikovaná chemie

Základy popisné statistiky

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Obecné, centrální a normované momenty

Mnohorozměrná statistická data

Analýza dat na PC I.

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

MATEMATIKA III V PŘÍKLADECH

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Metodologie pro Informační studia a knihovnictví 2

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

8. Normální rozdělení

JAK MODELOVAT VÝSLEDKY

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Příloha podrobný výklad vybraných pojmů

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

PRAVDĚPODOBNOST A STATISTIKA

Statistická analýza jednorozměrných dat

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Metodologie pro Informační studia a knihovnictví 2

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Mnohorozměrná statistická data

Minimální hodnota. Tabulka 11

Normální rozložení a odvozená rozložení

NÁHODNÁ VELIČINA. 3. cvičení

Pravděpodobnost a aplikovaná statistika

Popisná statistika. Komentované řešení pomocí MS Excel

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Předmět studia: Ekonomická statistika a analytické metody I, II

Základy pravděpodobnosti a statistiky. Popisná statistika

Deskriptivní statistické metody II. Míry polohy Míry variability

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Základní analýza dat. Úvod

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Kvantily a písmenové hodnoty E E E E-02

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

MATEMATICKÁ STATISTIKA

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

Popisná statistika. Statistika pro sociology

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Transkript:

Praktická statistika Petr Ponížil Eva Kutálková

Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo zasaženo chybou. Chybu píšeme na jednu platnou číslici a zokrouhlujeme nahoru. Pouze, má-li chyba jako první číslici jedničku, uvádíme chybu na dvě místa. U = (239 ± 4) V Zapisujeme-li hodnotu z nějakých důvodů bez chyby, je třeba zapsat ji na tolik míst, aby pouze poslední mohlo být zasaženo chybou.

Zápis výsledků měření Správně: U = (239 ± 4) V U = (238,9 ± 1,2) V U = (0,239 ± 0,004) V U = (239 ± 4).10 3 V nebo U = (239 ± 4) kv c = 299 792 458 m.s -1 Špatně: U = (238,8 ± 4) V U = (238,8 ± 4,2) V U = (238 ± 0,2) V U = (239 000 ± 4 000) mv c = 300 000 000 m.s -1

Neroztříděná data Výšky 12 studentů FT [cm]: 177 170 182 183 186 188 191 177 189 178 187 188 Diagram rozptýlení 165 170 175 180 185 190 195 h [cm] Používá se pro malý počet hodnot (do 30).

Bodové rozdělení četnosti Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Diagram rozptýlení: 36 37 38 39 40 41 42 43 44 velikost nohy [evropské číslování] - tudy cesta nevede.

Bodové rozdělení četnosti Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Hodnota znaku x i Absolutní četnost n i Relativní četnost p i Absolutní kumulativní četnost N i Relativní kumulativní četnost P i 37 4 0,125 4 0,125 38 5 0,156 9 0,281 39 8 0,250 17 0,531 40 7 0,219 24 0,750 41 2 0,063 26 0,813 42 5 0,156 31 0,969 43 1 0,031 32 1,000 S 32 1,000

Bodové rozdělení četnosti Velikost nohy 32 studentek FT [evropské číslování] 40 38 40 42 40 37 40 39 37 42 39 38 39 38 41 38 42 39 42 43 40 39 39 37 39 38 40 39 37 42 40 41 Polygon četností Součtová křivka. četnost ni 9 8 7 6 5 4 3 2 1 0 36 37 38 39 40 41 42 43 44. kumulativní četnost Ni 35 30 25 20 15 10 5 0 36 37 38 39 40 41 42 43 44 velikost nohy velikost nohy

Bodové rozdělení četnosti Výška 32 studentek FT [cm]: 172 169 161 171 165 169 169 165 168 175 163 168 175 169 168 171 168 163 168 175 159 168 162 163 162 179 160 177 169 160 175 170 171 polygon četností četnost ni 7 6 5 4 3 2 1 0 155 160 165 170 175 180 185 výška [cm] - tudy cesta nevede.

Intervalové rozdělení četnosti Výška 32 studentek FT [cm]: 172 169 161 171 165 169 169 165 168 175 163 168 175 169 168 171 168 163 168 175 159 168 162 163 162 179 160 177 169 160 175 170 171 polygon četností četnost ni 8 7 6 5 4 3 2 1 0 155 158 161 164 167 170 173 176 179 182 Doporučený počet tříd k 2,46(N 1) 0,4 nebo k N výška [cm]

Absolutní a relativní četnost měření U spojité veličiny je pravděpodobnost výskytu dané hodnoty x nekonečně malá P(x) 0. Je proto lepší zjišťovat pravděpodobnost výskytu hodnoty x v nějakém intervalu od x 1 do x 2 ozn. P(x 1, x 2 ). Počet výsledků spadajících do daného intervalu nazýváme (absolutní) četnost Q. Výhodnější je používat relativní četnost q = Q/N, kde N je počet měření.

Histogram četnosti měření Četnosti měření graficky znázorníme histogramem. k Doporučený počet tříd histogramu k 2,46(N 1) 0,4 nebo k N

Počet tříd histogramu Doporučený počet tříd histogramu k 2,46(N 1) 0,4 nebo k N

Hustota pravděpodobnosti f x = lim Δ x 0 P x, x Δ x Δ x b P a,b = a f x d x

Distribuční funkce x F x = f t d t Funkce hustoty pravděpodobnosti nebo distribuční funkce v sobě nesou kompletní informaci o náhodém rozdělení.

Charakteristiky rozdělení - kvantily Kvantil x p je hodnota znaku, pro kterou platí, že 100p % jednotek uspořádaného souboru má hodnotu menší nebo rovnu x p. 25% kvantil x 0,25 - dolní kvartil, 75% kvantil x 0,75 - horní kvartil, 50% kvantil x 0,50 - medián, 90% kvantil x 0,90-9. decil, 99% kvantil x 0,99-99. percentil

Aritmetický průměr Aritmetický průměr spojité náhodné veličiny x E (x) = def.obor x f (x)d x Aritmetický průměr diskrétní náhodné veličiny x N E (x) = 1 N i=1 x i Ukážeme dále, že nejlepším odhadem střední hodnoty m je aritmetický průměr E(x) =E x

Charakteristiky polohy Aritmetický průměr - součet hodnot vydělený jejich počtem. Medián - kvantil x 0,50 - stejně hodnot pod mediánem jako nad ním. Modus - nejpravděpodobnější hodnota.

Distribuční funkce mezd Jak je zkonstruovaná distribuční funkce mezd? Jak odstranit rozdíly?

Charakteristiky variability Variabilita popisuje rozsah souboru - rozdíl maximální a minimální hodnoty - kvartilové rozpětí (rozdíl horního a dolního kvartilu) - decilové rozpětí (rozdíl devátého a prvního decilu) - percentilové rozpětí (rozdíl 99. a 1. percentilu)

Charakteristiky variability Nejčastěji používanou charakteristikou variability (tj. míry odchylky jednotlivých hodnot od střední hodnoty) je rozptyl náhodné veličiny x. Pro spojitou náhodnou veličinu D(x) = {x E (x)} 2 f (x)d x def.obor Pro diskrétní náhodnou veličinu N D(x) = 1 N i=1 {x i E (x)} 2 Odmocnina z rozptylu se nazývá směrodatná odchylka a značí se s = D x Jako charakteristiku variability (nepříliš dobrou) lze použít i minimální a maximální hodnotu.

Charakteristiky koncentrace Kromě střední hodnoty charakterizující polohu rozdělení a směrodatné odchylky charakterizující variabilitu (šířku) rozdělení existují i charakteristiky koncentrace informující o hustotě dat. Budeme používat koeficient šikmosti (šikmost) a koeficient špičatosti (špičatost). Tyto koeficienty informují o tvaru rozdělení. Šikmost o jeho souměrnosti. Špičatost o koncentraci prostředních hodnot.

Šikmost Šikmost je charakteristika rozdělení náhodné veličiny, která popisuje jeho symetrii. Šikmost a 3 je definována vztahem: a 3 = n i=1 x i 3 N 3 pro a 3 = 0 je rozdělení symetrické

Špičatost Špičatost (koeficient špičatosti) popisuje koncentraci rozdělení kolem středu. normální rozdělení má nulovou špičatost při kladné špičatosti je křivka hustoty pravděpodobnosti špičatější než u normálního rozdělení při záporné špičatosti je křivka hustoty pravděpodobnosti plošší než u normálního rozdělení Šikmost a 4 je definována vztahem: a 4 = n i=1 x i 4 n 4 3

Výpočet šikmosti a špičatosti v Excelu V Excelu existuje pro výpočet šikmosti funkce a 3 * =SKEW() a pro výpočet špičatosti funkce a 4 *=KURT(). Bohužel jsou tyto funkce definovány pomocí jiných vzorců: a 3 * = N N 1 N 2 n i=1 x i 3 3 a * N N 1 4 = N 1 N 2 N 3 n i=1 x i 4 4 Hodnoty lze přepočítat podle vztahů: 3 N 1 2 N 2 N 3 a 3 = N 2 N N 1 a * 3 N 2 N 3 a 4 = N 2 1 a 4 * 6 N 1

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký počet a každý z nich ovlivňuje výsledek jen málo. Hustota pravděpodobnosti má v tomto případě tvar f x = 1 2 exp x 2 2 2

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Funkce f(x) je symetrická vůči poloze maxima x = μ, které odpovídá současně i střední hodnotě náhodné proměnné. S rostoucí hodnotou σ se křivka rozšiřuje a klesá její funkční hodnota v maximu v souladu s požadavkem, aby plocha pod křivkou zůstávala jednotková. Roste tak rozptyl hodnot. Hodnota σ se proto nazývá směrodatná odchylka (resp. střední kvadratická odchylka). Přesně jde o tzv. pološířku křivky mezi inflexními body.

Normální (Gaussovo) rozdělení - výpočet Hodnoty hustoty pravděpodobnosti i distribuční funkce lze spočítat pomocí funkce =NORM.DIST(x;střed_hod;sm_odch;S) (Excel 2007) nebo =NORMDIST(x;střed_hod;sm_odch;S) (Excel 2003 a OOCalc) x - hodnota, pro kterou zjišťujeme hodnotu rozdělení. střed_hod - střední hodnota. sm_odch - směrodatná odchylka rozdělení. S - je-li NEPRAVDA, vrací hustotu pravd., je-li PRAVDA, vrací distribuční funkci. =NORM.DIST(x;0;1;0) =NORM.DIST(x;0;1;1)

Normální (Gaussovo) rozdělení - výpočet Příklad: Výšky studentek FT mají normálni rozdělení se střední hodnotou 168 cm a směrodatnou odchylkou 6 cm. Odhadněte, kolik studentek FT má výšku mezi 158 a 166 cm. =NORM.DIST(158;168;6;1) vrací 0.047 =NORM.DIST(166;168;6;1) vrací 0.369