Obecné momenty prosté tvary

Podobné dokumenty
STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců)

Statistika I (KMI/PSTAT)

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Číselné charakteristiky a jejich výpočet

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Základní statistické charakteristiky

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Statistika pro geografy

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Základy popisné statistiky

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Metodologie pro ISK II

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Zápočtová práce STATISTIKA I

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Charakterizace rozdělení

Jevy a náhodná veličina

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

TECHNICKÁ UNIVERZITA V LIBERCI

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Mnohorozměrná statistická data

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

STATISTICKÉ CHARAKTERISTIKY

Náhodná veličina a rozdělení pravděpodobnosti

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Číselné charakteristiky

Základy pravděpodobnosti a statistiky. Popisná statistika

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica


Informační technologie a statistika 1

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

NÁHODNÁ VELIČINA. 3. cvičení

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

JAK MODELOVAT VÝSLEDKY

Charakteristika datového souboru

Statistika - charakteristiky variability

UKAZATELÉ VARIABILITY

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Základní statistické pojmy

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Písemná práce k modulu Statistika

Popisná statistika. Komentované řešení pomocí MS Excel

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

PRAVDĚPODOBNOST A STATISTIKA

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Pracovní list č. 3 Charakteristiky variability

Obecné, centrální a normované momenty

Mnohorozměrná statistická data

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Praktická statistika. Petr Ponížil Eva Kutálková

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

SEZNAM VZDĚLÁVACÍCH MATERIÁLŮ - ANOTACE

IES FSV UK. Domácí úkol Pravděpodobnost a statistika I. Cyklistův rok

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Pravděpodobnost a statistika

Renáta Bednárová STATISTIKA PRO EKONOMY

Manuál pro zaokrouhlování

MATEMATIKA III V PŘÍKLADECH

Diskrétní náhodná veličina. November 12, 2008

Aplikovaná matematika I

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Kontingenční tabulky v Excelu. Představení programu Statistica

8. Normální rozdělení

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Seminarni prace. 2 3 stranky staci, dat nema byt 3 a nema jich byt pul milionu. k te seminarce

Analýza dat na PC I.

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Regresní analýza 1. Regresní analýza

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Neparametrické metody

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Popisná statistika. Statistika pro sociology

Diskrétní náhodná veličina

Základy teorie pravděpodobnosti

23. Matematická statistika

EXPLORATORNÍ ANALÝZA DAT. 7. cvičení

Statistika pro gymnázia

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Náhodný vektor a jeho charakteristiky

Nejčastější chyby v explorační analýze

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Transkript:

Obecné momenty prosté tvary První obecný moment: (Σy i )/n, i=1 n aritmetický průměr, těžiště dat y Druhý obecný moment: (Σy i2 )/n, i=1 n y 2

Obecné momenty prosté tvary Příklad 1 pokračování: y = (3+4+2+3+2+3+3+3)/8 = 23/8 = 2,875 y 2 = (3 2 +4 2 +2 2 +3 2 +2 2 +3 2 +3 2 +3 2 )/8 = = (9+16+4+9+4+9+9+9)/8 = 69/8= 8,625

Obecné momenty prosté tvary Příklad 1 Poznámka: Hodnota SOUČTU všech pozorování (3+4+2+3+2+3+3+3) = 23 je tzv. ÚHRN (úhrnná hodnota). Platí: aneb: aneb: průměr = úhrn / počet úhrn = průměr počet počet = úhrn / průměr

Obecné momenty vážené tvary Při výpočtu lze využít četností absolutních: y = (Σy i n i )/n, i=1 K y 2 = (Σy i 2 n i )/n, i=1 K

Obecné momenty vážené tvary Příklad 1 - pokračování: y = (2 2+3 5+4 1)/8 = 23/8 = 2,875 y 2 = (2 2 2+3 2 5+4 2 1)/8 = (4 2+9 5+16 1)/8 = = 69/8= 8,625

Obecné momenty vážené tvary Při výpočtu lze využít také četností relativních: y = Σy i p i, i=1 K y 2 = Σy i 2 p i, i=1 K

Obecné momenty vážené tvary Příklad 1 - pokračování: y = 2 0,250+3 0,625+4 0,125 = 2,875 y 2 = 2 2 0,250+32 0,625+42 0,125 = = 4 0,250+9 0,625+16 0,125 = 8,625

Centrované momenty prosté tvary Druhý centrovaný moment: M 2 (y) = Σ(y i y ) 2 / n, i=1 n = ROZPTYL aneb průměrná čtvercová odchylka od aritmetického průměru M 2 (y) = směrodatná odchylka

Centrované momenty prosté tvary Příklad 1 - pokračování: M 2 (y)=[(3 2,875) 2 +(4 2,875) 2 +(2 2,875) 2 + +(3 2,875) 2 +(2 2,875) 2 +(3 2,875) 2 + +(3 2,875) 2 +(3 2,875) 2 ] / 8 = 0,359 M 2 (y) = 0,359 = 0,599 Známky byly zhruba v rozmezí 2,875±0,599 aneb v rozmezí 2,276 až 3,474.

Centrované momenty vážené tvary K výpočtu lze užít četností absolutních: M 2 (y) = Σ(y i y ) 2 n i / n, i=1 K nebo relativních: M 2 (y) = Σ(y i y ) 2 p i, i=1 K

Centrované momenty vážené tvary Příklad 1 - pokračování: M 2 (y) =[(2 2,875) 2 2+ +(3 2,875) 2 5+ +(4 2,875) 2 1] / 8 = 0,359 M 2 (y) =(2 2,875) 2 0,250+ +(3 2,875) 2 0,625+ +(4 2,875) 2 0,125 = 0,359

MOMENTY Mají smysl jen u číselných veličin (diskrétních či spojitých) Vážené tvary má smysl používat jen tehdy, jsou-li k dispozici četnosti (tj. u diskrétních veličin) Použití prostého i váženého tvaru musí dát stejný výsledek (jde o totéž, jen jinak počítáno)

MOMENTY Chování při aditivní lineární transformaci: Známe průměr a rozptyl. Každé pozorování změníme o stejnou konstantu c. Průměr se tak změní o tutéž konstantu c, rozptyl se nezmění.

MOMENTY Příklad 1 - pokračování: Pokud bychom žákovi všechny udělené známky o jeden stupeň zlepšili (c= -1), průměrná známka se změní z hodnoty 2,875 na hodnotu 1,875, ale rozptyl zůstane 0,359 (ověřte výpočtem).

MOMENTY Chování při multiplikativní lineární transformaci: Známe průměr a rozptyl. Každé pozorování vynásobíme stejnou konstantou c. Průměr se také musí vynásobit konstantou c, rozptyl se musí vynásobit její druhou mocninou c 2.

MOMENTY Příklad 2: Byly měřeny délky vyrobených trubek v centimetrech. Průměrná délka činí 49 cm a rozptyl 144 (cm 2 ). Nyní je nutno všechna měření převést na decimetry. Jak se změní hodnoty momentů? Jelikož c=0,1, průměr bude činit 4,90 dm a rozptyl 1,44 (dm 2 ).

MOMENTY ROZPTYL rychlý výpočetní tvar M 2 (y) = y 2 (y) 2 Příklad 1 - pokračování: M 2 (y) = 8,625 2,875 2 = 0,359 Poznámka: Vždy musí vyjít M 2 (y) 0!

MOMENTY Rozptyl čtvercová míra variability (proměnlivosti) dat Relativní mírou variability je variační koeficient Vy = M2(y) / y může porovnávat variabilitu souborů, v nichž je veličina zaznamenána v různých měrných jednotkách např. platy u nás v Kč versus platy v Německu v Euro), či je na jiné úrovni (poloze)

DISTRIBUČNÍ FUNKCE Slouží k popisu rozdělení (distribuce) číselných dat; jakési zobecnění kumul.relat.četností: F(y) udává podíl pozorování s hodnotou nejvýše y, viz graf pro data z příkladu 1:

KVANTILY Udávají pro číselnou veličinu Y hodnotu y, pod níž leží požadovaný podíl pozorování Značíme ỹ 100p, kde p je onen podíl (údaj mezi 0 1) p=0,5 50% kvantil medián (odděluje polovinu nižších od zbytku vyšších pozorování; značen obvykle jen ỹ ) p=0,25 25% kvantil dolní kvartil ỹ 25 p=0,75 75% kvantil horní kvartil ỹ 75

KVANTILY 1. Určení pomocí distribuční funkce Najdeme bod y, v němž poprvé F(y) dosáhne úroveň p. Příklad 1 pokračování: Nalezněte medián známek žáka. Medián tj. p=0,5. Kde poprvé příslušná F(y) dosáhla úroveň 0,5? Podle grafu je mediánem hodnota ỹ =3. Interpretace: Polovina známek měla hodnotu nejvýše 3 (tj. 3 nebo nižší)

KVANTILY 2. Určení přímo pomocí dat a) Data uspořádáme vzestupně dle velikosti b) Nalezneme celočíselné z vyhovující nerovnicím: n p < z < n p +1 c) Hledaným kvantilem je hodnota s pořadovým číslem z. Příklad 1 pokračování: Nalezněte 60% kvantil známek žáka. Známky seřadíme: 2, 2, 3, 3, 3, 3, 3, 4. Jelikož n=8 a p=0,6, vyjde n p=4,8, takže hledáme z : 4,8 < z < 5,8 Tudíž z=5, aneb hledaným kvantilem je 5. známka, čili trojka: ỹ 60 =3.

KVANTILY Příklad 1 pokračování: Interpretujte nalezený výsledek: ỹ 60 =3. Znamená to, že 60 % zjištěných známek mělo hodnotu nejvýše 3 (tj. 3 nebo nižší). Podobně interpretujte to, kdyby pro veličinu plat měl např. horní kvartil hodnotu 32 tis. Kč: Znamenalo by to, že 75 % zjištěných platů mělo hodnotu nejvýše 32 tis. Kč (tj. zbylých 25 % platů bylo jakých?)

KVANTILY 2. Určení přímo pomocí dat možný problém a) Data uspořádáme vzestupně dle velikosti b) Nenalezneme celočíselné z vyhovující nerovnicím: n p < z < n p +1 Stane se to tehdy, když obě hodnoty (n p ; n p+1) vyjdou přesně celočíselně. c) Nalezneme hodnotu s pořadovým číslem n p a s následujícím pořadovým číslem n p+1. d) Za hledaný kvantil prohlásíme průměr obou nalezených hodnot.

KVANTILY 2. Určení přímo pomocí dat možný problém Příklad 1 pokračování: Nalezněte medián známek žáka. Známky seřadíme: 2, 2, 3, 3, 3, 3, 3, 4. Jelikož n=8 a p=0,5, vyjde n p =4, takže hledáme z : 4 < z < 5 (neexistuje) Najdeme tedy jak 4., tak 5. známku. Jelikož jsou obě trojky, jejich průměrem je také trojka a to je hledaný medián: ỹ=3.

KVANTILY Poznámka 1: Není chybou, že nám pro tato data vyšly 50% a 60% kvantil shodně (=3), ale na druhou stranu to není pravidlo. Pro jiná data můžou tyto kvantily vyjít různě v takovém případě pak ale určitě bude ỹ < ỹ 60. Poznámka 2: Může se stát, že postup pomocí distribuční funkce a postup přímo z dat skončí různými výsledky (v případě problému s neexistencí z, a to kdyby se hodnoty s pořadím n p a n p+1 lišily). Rozdíl však obvykle bývá zanedbatelný.