TECHNICKÁ UNIVERZITA V LIBERCI
|
|
- Ladislav Kadlec
- před 6 lety
- Počet zobrazení:
Transkript
1 TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: Pavel Kubát
2 Obsah Úvod Charakterizujte úroveň a variabilitu skutečné spotřeby u modelu Fiesta (pouze benzínové motory) Charakteristiky úrovně skutečné spotřeby u modelu Fiesta Velikost souboru Aritmetický průměr Medián Dolní kvartil Horní kvartil Charakteristiky variability skutečné spotřeby u modelu Fiesta Variační rozpětí Rozptyl Směrodatná odchylka Variační koeficient Otestujte, zdali průměrná spotřeba paliva u Fiesty je u benzínového motoru alespoň o 2 litry vyšší než u naftového Hypotézy Testové kritérium Test shody středních hodnot Jsou nezávislé veličiny palivo a pohlaví majitele vozu? Praha, Jihomoravský kraj a Středočeský kraj Zbytek republiky
3 Úvod Cílem této semestrální práce je analýza dat, která nám byla poskytnuta vyučujícími předmětu Statistický rozbor dat z dotazníkového šetření. Tato data se týkají automobilů značky Ford, u kterých bylo zjišťováno celkem 14 charakteristik, které se vztahují jak k automobilu samotnému tak také k jeho majiteli. V této práci je využita pouze určitá část informací, nikoliv veškeré zjišťované charakteristiky. Při analýze byl použit program Statgraphics Centurion XVII a také dosud známé statistické metody a postupy. Hladina významnosti α byla stanovena na hodnotě 5%. V následujících kapitolách a podkapitolách budou postupně vypracovány odpovědi na 3 zadané úkoly, které jsou následující: 1) Charakterizujte úroveň a variabilitu skutečné spotřeby u modelu Fiesta (pouze benzínové motory). 2) Otestujte, zdali průměrná spotřeba paliva u Fiesty je u benzínového motoru alespoň o 2 litry vyšší než u naftového. 3) Jsou nezávislé veličiny palivo a pohlaví majitele vozu? 3
4 1 Charakterizujte úroveň a variabilitu skutečné spotřeby u modelu Fiesta (pouze benzínové motory) Pro potřeby této kapitoly budeme z datového souboru potřebovat jenom automobily modelu Fiesta pouze s benzínovými motory, které si můžeme přesunout na nový datový list za pomocí funkce dělení souboru. Základní charakteristiky skutečné spotřeby modelu Fiesta u benzínových motorů jsou v následující tabulce. Tabulka 1: Základní charakteristiky skutečné spotřeby Počet 68 Průměr 8,71176 Medián 8,75 Rozptyl 0, Směrodatná odchylka 0, Variační koeficient 9,46878% Minimum 6,7 Maximum 10,3 Variační rozpětí 3,6 Dolní kvartil 8,1 Horní kvartil 9,25 Mezikvartilové rozpětí 1, Charakteristiky úrovně skutečné spotřeby u modelu Fiesta Základními statistickými charakteristikami úrovně jsou například průměry, modus či kvantily (zvláště užívaným kvantilem je 50% kvantil, též nazývaný medián). Dále zmíníme pouze průměr aritmetický a medián. Modus nemá smysl v tomto případě určovat Velikost souboru Soubor zahrnuje 68 automobilů typu Ford Fiesta s benzinovým typem motoru. 4
5 1.1.2 Aritmetický průměr V tomto případě dává smysl využít průměr aritmetický prostý, který spočteme dle následujícího vzorce: x = n i=1 x i n Jeden automobil spotřebuje v průměru 8,71176 litrů paliva na 100km jízdy Medián Jelikož rozsah našeho souboru je liché číslo, mediánem je konkrétní prvek, který dělí neklesající řadu hodnot na poloviny. n+1 Vzorec: x = x n+1 (, kde výraz udává pořadí mediánu v dané neklesající řadě hodnot. ) 2 2 Medián v tomto příkladu je roven 8,75 litrů paliva na 100km Dolní kvartil Dolní kvartil značíme x % automobilů značky Ford, model Fiesta s benzinovým typem motoru má spotřebu paliva na 100km menší nebo rovnu hodnotě 8,1 litrů Horní kvartil Horní kvartil značíme x % automobilů značky Ford, model Fiesta s benzinovým typem motoru má spotřebu paliva na 100km větší nebo rovnu hodnotě 9,25 litrů. 1.2 Charakteristiky variability skutečné spotřeby u modelu Fiesta Statistické charakteristiky variability udávají, jak hodnoty kolísají kolem zvoleného středu, který je nejčastěji vyjádřen pomoci některých výše uvedených charakteristik úrovně. Blíže se podíváme na variační rozpětí, rozptyl, směrodatnou odchylku a variační koeficient Variační rozpětí Variační rozpětí se řadí mezi charakteristiky měřící absolutní variabilitu. Lze ho spočítat pomocí vzorce R = x max x min Hodnota variačního rozpětí činí 3,6 litru paliva. 5
6 1.2.2 Rozptyl Rozptyl měří průměrnou odchylku do průměru, umocněnou na druhou. Výsledek tedy nevychází ve stejných měrných jednotkách, ale tyty jednotky jsou umocněny na druhou. Vzorec: s 2 x = n i=1 (x i x ) 2 n 1 Rozptyl má hodnotu 0, litrů Směrodatná odchylka Směrodatná odchylka udává průměrnou odchylku hodnoty znaku od aritmetického průměru. Vzorec: s x = s x 2 Směrodatná odchylka je 0, litrů benzinu na 100km Variační koeficient Variační koeficient je charakteristikou relativní variability, je to bezrozměrné číslo a umožňuje tedy porovnávání variability souborů s různou úrovní či odlišnými měrnými jednotkami. Pro interpretaci je možno číslo uvést v procentech. Vzorec: V x = s x x Variační koeficient je roven 9,46878%. 6
7 2 Otestujte, zdali průměrná spotřeba paliva u Fiesty je u benzínového motoru alespoň o 2 litry vyšší než u naftového V této kapitole se budeme zabývat tím, zdali na základě našeho výběrového souboru lze tvrdit, že průměrná spotřeba benzinového motoru u modelu Fiesta je alespoň o dva litry vyšší než u modelu Fiesta s motorem naftovým. Jde tedy o dvou výběrový test o shodě středních hodnot. Hodnoty spotřeby paliva u benzinových motoru označíme X1(μ1;δ1 2 ) a hodnoty naftových motorů budeme značit X2(μ2;δ2 2 ). 2.1 Hypotézy Prvním krokem je sestavení nulové (H0) a alternativní hypotézy (H1). H 0 : μ 1 μ 2 = 2 H 1 : μ 1 μ 2 > 2 Pro další pokračování testu je nutné ověřit, že jsou rozptyly výběrů shodné. Vypočtená P-hodnota programem Statgraphics je rovna 0, , což je větší než α (0,05) a nezamítáme tedy nulovou hypotézu o shodě rozptylů a můžeme pokračovat dále v testování hypotézy o shodě středních hodnot. 2.2 Testové kritérium Zvolíme vhodné testové kritérium, které má při platnosti H0 známé pravděpodobnostní rozložení. Vzorec: t = x 1 x 2 (n 2 1 1)s 1+(n 2 2 1)s 1 n1+n2 2 n1 + 1 n2 t(n 1 + n 2 2) t=5,9897 7
8 2.3 Test shody středních hodnot Dalším krokem je provedení samotného testu programem Statgraphics pro dva nezávislé vzorky na hladině významnosti 5%, do kterého zadáme údaje z následující tabulky. Tabulka 2: Porovnání skutečné spotřeby benzinových a naftových motorů benzin nafta Počet Průměr 8, ,85532 Směrodatná odchylka 0, ,63616 Vypočtená P-hodnota je rovna 0, , což je menší než hladina významnosti α=0,05 a tudíž zamítáme nulovou hypotézu H0 a přijímáme alternativní hypotézu H1. Na hladině významnosti 5% je průměrná spotřeba paliva u benzinových motorů modelu Ford Fiesta alespoň o 2 litry vyšší než u motorů naftových. 8
9 3 Jsou nezávislé veličiny palivo a pohlaví majitele vozu? V další a poslední kapitole se zabýváme, zdali jsou veličiny palivo a pohlaví majitele vozu závislé či nikoliv. Jedná se o dvě proměnné slovní (jak druh paliva tak také pohlaví majitele vozu) a nabývají pouze 2 hodnot. Vhodným prostředkem pro zjištění závislosti tedy je čtyřpolní tabulka. Nejprve provedeme analýzu pro kraje Praha, Jihomoravský a Středočeský a následně pro zbytek České republiky. 3.1 Praha, Jihomoravský kraj a Středočeský kraj V následující tabulce jsou vyznačeny jednotlivé četnosti typu motoru zvlášť, zdali je automobil vlastněn mužem či ženou pro kraje Praha, Jihomoravský a Středočeský. Tabulka 3: Tabulka četností pro typ motoru a pohlaví vlastníka pro kraje Praha, Jihomoravský a Středočeský Muž Žena Celkem Benzin ,46% 28,85% 67,31% Nafta ,31% 15,38% 32,69% Celkem ,77% 44,23% 100% Výsledky testu nezávislosti pohlaví a paliva pro kraje Praha, Jihomoravský a Středočeský jsou shrnuty v následující tabulce. Tabulka 4: Test nezávislosti pohlaví a paliva pro kraje Praha, Jihomoravský a Středočeský Test Testové kritérium Stupně volnosti P-hodnota Chi-kvadrát 0, ,7747 P-hodnota (0,7747) je vyšší než α (0,05) a tudíž jsme neprokázali závislost mezi palivem motoru a pohlavím majitele vozu. 9
10 3.2. Zbytek republiky V následující tabulce jsou vyznačeny jednotlivé četnosti typu motoru zvlášť, zdali je automobil vlastněn mužem či ženou pro zbývající kraje České republiky. Tabulka 5: Tabulka četností pro typ motoru a pohlaví vlastníka pro zbytek republiky Muž Žena Celkem Benzin ,92% 26,47% 55,39% Nafta ,51% 20,10% 44,61% Celkem ,43% 46,57% 100% Výsledky testu nezávislosti pohlaví a paliva pro zbytek České republiky jsou shrnuty v následující tabulce. Tabulka 6: Test nezávislosti pro zbytek České republiky Test Testové kritérium Stupně volnosti P-hodnota Chi-kvadrát 0, ,6973 P-hodnota (0,6973) je vyšší než α (0,05) a tudíž jsme neprokázali závislost mezi palivem motoru a pohlavím majitele vozu v Jihočeském kraji, Pardubickém kraji, Královehradeckém kraji, Kraji Vysočina, Karlovarském kraji, Libereckém kraji, Olomouckém kraji, Plzeňském kraji, Moravskoslezském kraji, Ústeckém kraji a ve Zlínském kraji. 10
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta ANALÝZA VÝSLEDKŮ DOTAZNÍKOVÉHO ŠETŘENÍ (FAKULTNÍ DOTAZNÍK) semestrální práce z předmětu STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Jan Kubiš, Kateřina
Technická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016
TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová,
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA Semestrální práce Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Vypracoval: Bonaconzová, Bryknarová, Milkovičová, Škrdlová
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ DOTAZNÍKOVÉHO ŠETŘENÍ (FAKULTNÍ DOTAZNÍK) Datum odevzdání: 13.05.2016
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Vypracovaly: Renata Němcová, Andrea Zuzánková, Lenka Vítová, Michaela Ťukalová, Kristýna
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ VYUŢITÍ PROJEKTOVÉHO ŘÍZENÍ V ESN Příjmení a jméno: Hrdá Sabina, Kovalčíková
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Návrhy dalších možností statistického zpracování aktualizovaných dat
Návrhy dalších možností statistického zpracování aktualizovaných dat Při zjišťování disparit ve fyzické dostupnosti bydlení navrhuji použití těchto statistických metod: Bag plot; Krabicové grafy a jejich
Testování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
Renáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
Vzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky
Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky Vladimíra Hovorková Valentová Iva Nedomlelová 17. 6. 2010 Cíl příspěvku provedení analýz a dalších
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Panajotis Cakirpaloglu, Jan Šmahaj. 361 hod. nízká. žádné. celý dotazník najednou
Metadata průzkumu "Cena a kvalita pohonných hmot" Autor průzkumu: Panajotis Cakirpaloglu, Jan Šmahaj Šetření: 21. 04. 2010-06. 05. 2010 Délka průzkumu: 361 hod Počet respondentů: 55 Vypovídací hodnota:
Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
Výnosy z kmenových včelstev v kg Sektor Počet Počet včelstev. k 1.5. k 31.10. a 1 2 3 4 5 6 7. 44 62 9,68 0,097 600,0 6,00 Ostatní 0,00
0 sumární sestava kraj: Hlavní město Praha.0.0 Sektor včelstev k.. k.0. a, 0,0 00,0,00 0 0 0 0,00 0,000 0,0,00 0, 0,,0,00 0 0, 0, 0,0,00, 0,,0,00 včelstev 0 včelstev včelstev 0 0 0 Vykoupeno medu v kg
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
PŘÍRUČKA PRO ŽADATELE GRANTU- FOND PRO NESTÁTNÍ NEZISKOVÉ ORGANIZACE Příloha č. 11 Tabulka obvyklé mzdy
PŘÍRUČKA PRO ŽADATELE GRANTU- FOND PRO NESTÁTNÍ NEZISKOVÉ ORGANIZACE Příloha č. 11 Tabulka obvyklé mzdy Tabulka doporučených mezd pro Jihomoravský kraj 20 404 121 24 347 144 26 808 158 21 681 126 26 547
PŘÍRUČKA PRO ŽADATELE GRANTU- FOND PRO NESTÁTNÍ NEZISKOVÉ ORGANIZACE Příloha č. 11 Tabulka obvyklé mzdy
PŘÍRUČKA PRO ŽADATELE GRANTU- FOND PRO NESTÁTNÍ NEZISKOVÉ ORGANIZACE Příloha č. 11 Tabulka obvyklé mzdy Tabulka doporučených mezd pro Hlavní město Praha horní hranice horní hranice 27 047 155 27 668 166
Aktivita A 0803. Zmapování a analýza disparit mezi regiony NUTS 3 ve fyzické dostupnosti bydlení
Aktivita A 0803 Zmapování a analýza disparit mezi regiony NUTS 3 ve fyzické dostupnosti bydlení 1/62 Aktivita A0803 Zmapování a analýza disparit mezi regiony NUTS 3 ve fyzické dostupnosti bydlení Datum
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Základní statistické charakteristiky
Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty
Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
STATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
Metodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky
Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Příloha č Tabulky a grafy porovnání výsledků z přezkoumání hospodaření za období let 2008 až 2012, obcí, MČ, DSO
Příloha č. 10 - Tabulky a grafy porovnání výsledků z přezkoumání hospodaření za období let 2008 až 2012, obcí, MČ, DSO Tabulka porovnání výsledků z přezkoumání hospodaření za období let 2008 2012 závěr
TEHNICKA UNIVERZITA V LIBERCI. Ekonomická fakulta
TEHNICKA UNIVERZITA V LIBERCI Ekonomická fakulta Statistický rozbor dat z dotazníkového šetření Analýza dotazníkového šetření pro společnost Nobilis Tilia 2015/2016 Veronika Krejčíková (vedoucí) 2. semestr
Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)
Základní výpočty pro MPPZ Teorie Aritmetický průměr = součet hodnot znaku zjištěných u všech jednotek souboru, dělený počtem všech jednotek souboru Modus = hodnota souboru s nejvyšší četností Medián =
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Statistický projekt. Název projektu: V jakých jezdíme automobilech. Autoři: Beneš Tomáš, Budka Josef. Oponenti: Bahenský Pavel, Buzák Jan
Statistický projekt Název projektu: V jakých jezdíme automobilech. Autoři: Beneš Tomáš, Budka Josef Oponenti: Bahenský Pavel, Buzák Jan Cílem našeho statistického projektu je zjistit, jakým vozovým parkem
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Přehled průběhu pozemních komunikací v jednotlivých krajích ČR
Přehled průběhu pozemních komunikací v jednotlivých ích ČR probíhá v ích Plzeňský Ústecký Zlínský Dálnice D1 X X X X X X X Dálnice D11 X X X X Dálnice D2 X Dálnice D3 X X Dálnice D5 X X Dálnice D8 X X
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Protokol č. 1. Tloušťková struktura. Zadání:
Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále
4. Rozdíly mezi kraji v tvorbě hrubého fixního kapitálu (THFK)
4. Rozdíly mezi kraji v tvorbě hrubého fixního kapitálu (THFK) V období 1995 2007 dosáhla v České republice tvorba hrubého fixního kapitálu objemu 7 963,4 mld. Kč. Na tomto objemu se hlavní měrou podílelo
marek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
ADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
MATEMATIKA III V PŘÍKLADECH
VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 8 Statistický soubor s jedním argumentem Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola
Číselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
Ing. Eva Hamplová, Ph.D. Ing. Jaroslav Kovárník, Ph.D.
XX. MEZINÁRODNÍ KOLOKVIUM O REGIONÁLNÍCH VĚDÁCH REGIONÁLNÍ DISPARITY KONCENTRACE AKTIVNÍCH PODNIKATELSKÝCH JEDNOTEK V ČESKÉ REPUBLICE V LETECH 2010-2016 REGIONAL DISPARITIES OF CONCENTRATION OF ACTIVE
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
SYSTEMATICKÉ MĚŘENÍ OBSAHU RADIONUKLIDŮ V PITNÉ VODĚ DODÁVANÉ DO VEŘEJNÝCH VODOVODŮ V ČR V ROCE 2016
SYSTEMATICKÉ MĚŘENÍ OBSAHU RADIONUKLIDŮ V PITNÉ VODĚ DODÁVANÉ DO VEŘEJNÝCH VODOVODŮ V ČR V ROCE 2016 Ing. Hana Procházková Státní úřad pro jadernou bezpečnost, Oddělení přírodních zdrojů e-mail: hana.prochazkova@sujb.cz
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
Aproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611. Semestrální práce ze Statistiky (SIS)
České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611 Semestrální práce ze Statistiky (SIS) Petr Procházka, Jakub Feninec Skupina: 97 Akademický rok: 01/013 Úvod V naší
Obecné momenty prosté tvary
Obecné momenty prosté tvary První obecný moment: (Σy i )/n, i=1 n aritmetický průměr, těžiště dat y Druhý obecný moment: (Σy i2 )/n, i=1 n y 2 Obecné momenty prosté tvary Příklad 1 pokračování: y = (3+4+2+3+2+3+3+3)/8
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1
3. charakteristiky charakteristiky 1 charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme charakteristiky 2 charakteristiky Dva hlavní
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Opakování: Nominální proměnná více hodnotová odpověď.
Analýza dat z dotazníkových šetření Cvičení 4. - Zobecňování výběru na populaci Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/37771/ - Seznamte se s dotazníkem a strukturou otázek,
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Příklady na testy hypotéz o parametrech normálního rozdělení
Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost