Elementární zpracování statistického souboru

Podobné dokumenty
Obecné, centrální a normované momenty

Deskriptivní statistika 1

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

P2: Statistické zpracování dat

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Pravděpodobnost a aplikovaná statistika

Pravděpodobnostní modely

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

12. N á h o d n ý v ý b ě r

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

8. Základy statistiky. 8.1 Statistický soubor

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

OVMT Přesnost měření a teorie chyb

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

10.3 GEOMERTICKÝ PRŮMĚR

Popisná statistika. Zdeněk Janák 9. prosince 2007

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

PŘÍKLAD NA PRŮMĚRNÝ INDEX ŘETĚZOVÝ NEBOLI GEOMETRICKÝ PRŮMĚR

6. P o p i s n á s t a t i s t i k a

Iterační výpočty projekt č. 2

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Mendelova univerzita v Brně Statistika projekt

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Komplexní čísla. Definice komplexních čísel

V. Normální rozdělení

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Doc. Ing. Dagmar Blatná, CSc.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

STATISTIKA. Základní pojmy

8. Analýza rozptylu.

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

13 Popisná statistika

Pravděpodobnost a aplikovaná statistika

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

ZÁKLADY STATISTIKY (s aplikací na zdravotnictví)

STATISTIKA PRO EKONOMY

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

1. Číselné obory, dělitelnost, výrazy

2.4. INVERZNÍ MATICE

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

b c a P(A B) = c = 4% = 0,04 d

Petr Šedivý Šedivá matematika

Závislost slovních znaků

7. P o p i s n á s t a t i s t i k a

2 STEJNORODOST BETONU KONSTRUKCE

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Mod(x) = 2, Med(x) = = 2

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Matematika I, část II

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

1 PSE Definice základních pojmů. (ω je elementární jev: A ω (A ω) nebo (A );

DIFERENCIÁLNÍ POČET FUNKCE JEDNÉ PROMĚNNÉ. 1) Pojem funkce, graf funkce

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

4.2 Elementární statistické zpracování Rozdělení četností

Statistika pro metrologii

NEPARAMETRICKÉ METODY

z možností, jak tuto veličinu charakterizovat, je určit součet

Odhady parametrů 1. Odhady parametrů

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Úloha II.S... odhadnutelná

Zhodnocení přesnosti měření

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

( + ) ( ) ( ) ( ) ( ) Derivace elementárních funkcí II. Předpoklady: Př. 1: Urči derivaci funkce y = x ; n N.

[ jednotky ] Chyby měření

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

11. P o p i s n á s t a t i s t i k a

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

6. KOMBINATORIKA Základní pojmy Počítání s faktoriály a kombinačními čísly Variace

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

Národní informační středisko pro podporu jakosti

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA. pracujeme pouze s r hodnotami x. má svou absolutní četnost. n ) udává, jaká část souboru má hodnotu znaku

POLYNOM. 1) Základní pojmy. Polynomem stupně n nazveme funkci tvaru. a se nazývají koeficienty polynomu. 0, n N. Čísla. kde

MATICOVÉ HRY MATICOVÝCH HER

1.3. POLYNOMY. V této kapitole se dozvíte:

Náhodný výběr 1. Náhodný výběr

17. Statistické hypotézy parametrické testy

1. Měření ve fyzice, soustava jednotek SI

Metody zkoumání závislosti numerických proměnných


Přijímací řízení akademický rok 2012/2013 Kompletní znění testových otázek matematické myšlení

n-rozměrné normální rozdělení pravděpodobnosti

Úloha III.S... limitní

STATISTIKA PRO EKONOMY

2. Náhodná veličina. je konečná nebo spočetná množina;

Transkript:

Elemetárí zpracováí statistického souboru Obsah kapitoly 4. Elemetárí statistické zpracováí - parametrizace vhodými empirickými parametry Studijí cíle Naučit se výsledky měřeí parametrizovat vhodými empirickými parametry. Doba potřebá ke studiu Základí tet 1 hod. Příklady také 1 hod. Pojmy k zapamatováí Úvod Empirické parametry: Parametr polohy, variability, šikmosti a špičatosti Mometové parametry Aritmetický průměr Rozptyl a směrodatá odchylka Budeme dále pokračovat ve zpracováváí výsledků měřeí, kdy jsme v akademickém roce 008 09 zkoumali výšku studetek Vysoké školy fiačí a správí. Výkladová část 4. Elemetárí statistické zpracováí Výsledky měřeí je potřebé uspořádat do tabulky, graficky vyjádřit pomocí polygou (to už jsme udělali v miulém tématu) a parametrizovat vhodými empirickými parametry (z řeckého slova empirie - zkušeost). Tedy parametry vypočítaými z aměřeých hodot (tím se budeme zabývat yí). Výsledkem elemetárího statistického zpracováí je empirický obraz zkoumaého výběrového statistického souboru VSS. Empirické parametry stručě a jedoduše vystihují povahu zkoumaého statistického souboru. VSS - výběrové parametry Empirické parametry lze dělit podle toho, který rys zkoumaého statistického souboru vystihují: - parametry polohy, - parametry promělivosti (variability), - parametry šikmosti, - parametry špičatosti.

Polohou empirického rozděleí četostí je myšleo jeho umístěí a vodorové ose souřadicového systému. Pomocí aritmetického průměru lze výstižě charakterizovat parametr polohy. Vypočteme ho jako součet všech hodot děleý počtem hodot. Aritmetický průměr začíme. i = 1 zak i 1 je zápis součtu hodot přes všecha i od 1 do. V ašem příkladu můžeme aritmetický průměr vypočítat z tabulky, v íž máme zazameáy výšky studetek. č. pořadí výška 89 1 151 34 157 51 3 158 94 4 158 3 5 160 41 6 161 83 7 16 31 8 163 81 9 163 4 10 164 33 11 164 37 1 164 87 13 164 88 14 164 7 15 165 3 16 165 39 17 165 84 18 165 96 19 165 49 0 166 44 1 167 91 167 48 3 167 90 4 167 1 5 168 45 6 168 40 7 168 8 8 168 9 9 168

95 30 170 31 170 85 3 170 35 33 170 80 34 170 50 35 171 36 36 17 6 37 173 38 173 47 39 173 38 40 175 43 41 176 93 4 176 86 43 176 4 44 177 5 45 180 97 185 151+ 157 +... + 180 + 185 = = 167, 587cm. Pokud je každá hodota zastoupea pouze jedou, mluvíme o prostém aritmetickém průměru. Jelikož my už máme výšky že roztříděé do tabulky, můžeme k výpočtu s výhodou použít vážeý aritmetický průměr, kde vahami jsou počty že v jedotlivých výškových kategoriích. Jejich výšku bychom měli v každé kategorii zprůměrovat, ale to by ám práci ijak eusadilo. Za výšku budeme tedy brát střed itervalu. U krajích itervalů uvažujeme, jako by škála pokračovala. i. i = 1 Iterval střed itervalu i i do 157 155 1 158-16 160 5 163-167 165 3 17 168-17 170 4 1 173-177 175 5 8 178 a více 180 6

V ašem příkladu 155 + 5 160 + 17 165 + 1 170 + 8 175 + 180 7715 = = = =167,7174cm Jak vysvětlíte, že výpočet pomocí prostého (167,587cm) a vážeého (167,7174cm) aritmetického průměru se maliko liší? (V případě vážeého aritmetického průměru jsme za výšku brali střed itervalu, ikoliv aritmetický průměr všech výšek v daém itervalu. Tím došlo k drobému zkresleí.) Porováím výšky každé žey s aritmetickým průměrem obdržíme empirický parametr variability, kterému říkáme rozptyl. Začíme jej S a vypočítáme S = 1 ( ) i. Rozdíly od aritmetického průměru umocňujeme a druhou, aby se ám avzájem eodečetla kladá a záporá čísla. V ašem příkladu bychom postupovali ásledově: Prostý aritmetický průměr zaokrouhlíme a jedou desetiu = 167,6 cm. ( 151 167,6) + (157 167,6) +... + (180 167,6) + (185 167,6) S = S = 39,396. Pokud jste teto výpočet prováděli, zjistili jste, že je dost pracý. S výhodou můžeme opět použít data setříděá do tabulky, potom S vypočítáme podle vztahu S = 1 i ( ) i. Iterval střed itervalu i i do 157 155 1

158-16 160 5 163-167 165 3 17 168-17 170 4 1 173-177 175 5 8 178 a více 180 6 Použijeme vážeý aritmetický průměr také zaokrouhleý a jedu desetiu = 167,7 cm. S ( 155 167,7) + 5 (160 167,7) + 17 (165 167,7) + 1 (170 = S = 33,3770. Opět se rozptyly vypočítaé ze tříděých a etříděých hodot maliko liší. Jaká je iterpretace tohoto čísla? Protože jsme sčítali druhé mociy, tak je iterpretace obtížá. Proto počítáme odmociu z rozptylu S = S. Teto parametr azýváme směrodatá odchylka. S = 5,78 cm. Směrodatá odchylka ukazuje, jakou výpovědí hodotu má aritmetický průměr. Je-li směrodatá odchylka velká, výpovědí hodota aritmetického průměru je malá a opačě. Rozšiřující tet Geometrický průměr Prostý geometrický průměr kladých hodot 1,,...,, které opět emusí být uspořádáy, vypočteme jako G = 1 = i i = 1 L, kde řecké písmeo Π představuje symbol používaý pro souči hodot. Harmoický průměr

Prostý harmoický průměr kladých hodot 1,,...,, které emusí být uspořádáy, lze vypočítat jako H = 1 1i. Převráceá hodota harmoického průměru 1 H i 1 = = 1 i je aritmetickým průměrem převráceých hodot proměé. Kvadratický průměr Prostý kvadratický průměr hodot 1,,...,, které opět emusí být uspořádáy, vypočteme jako K = i 1. Pro kladé hodoty 1,,..., platí mezi uvedeými typy průměrů těchto hodot relace erovosti H G K. Zaméko rovosti platí pouze v případě, jestliže jsou všechy hodoty číselé proměé ve statistickém souboru stejé. Shrutí Kotrolí otázky a úkoly Empirická data jsme dále zpracovávali. Vypočítali jsme prví dva empirické parametry zkoumaého souboru. Parametr polohy jsme charakterizovali pomocí aritmetického průměru a parametr variability pomocí rozptylu, resp. směrodaté odchylky. 1) V tabulce jsou údaje o měsíčích výdajích 30-ti domácostí v Kč Iterval Střed itervalu i 1500-1999 1750 4 000-499 50 6 500-999 750 7 3000-3499 350 7 3500-3999 3750 4 4000-4500 450 30

Vypočtěte parametr polohy (aritmetický průměr) a variability (rozptyl, resp. směrodatou odchylku). ) V tabulce jsou údaje o počtu čleů 30-ti domácostí i i 1 6 3 4 4 10 5 5 6 3 30 Vypočtěte parametr polohy (aritmetický průměr) a variability (rozptyl, resp. směrodatou odchylku). Sezam použitých zkratek Studijí literatura Odkazy HNJ - Hromadý áhodý jev SS - Statický soubor SJ - Statistická jedotka SZ - Statistický zak HSZ - Hodota statistického zaku ZSS - Základí statistický soubor NV - Náhodý výběr VSS - Výběrový statistický soubor Bílková, D. Budiský, P. Voháka, V.: Pravděpodobost a statistika. Aleš Čeěk, Plzeň, 009. Cyhelský, L. Souček, E.: Základy statistiky. EUPRESS, Praha 009. Hidls, R. Hroová, S. Seger, J.: Statistika pro ekoomy. Professioal Publishig, Praha 004. Český statistický úřad - http://www.czso.cz/ Klíč k úkolům 1) Průměré měsíčí výdaje domácostí a potraviy jsou.866,70kč Směrodatá odchylka S měsíčích výdajů domácostí a potraviy je 715,11Kč. ) = 3,63 Průměrý počet čleů domácosti je mezi 3 až 4 čleové.

Směrodatá odchylka je 1,4 člea domácosti.