Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

Rozměr: px
Začít zobrazení ze stránky:

Download "Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2"

Transkript

1 Statistika jako obor Statistika Statistika je vědní obor zabývající se zkoumáním jevů hromadného charakteru. Tím se myslí to, že zkoumaný jev musí příslušet určité části velkého množství objektů (lidí, předmětů, událostí, ). V některých případech musí být dána možnost mnohokrát opakovat podmínky, za nichž uvažovaný jev může nastat. Popisná statistika Popisná statistika se zabývá popisem stavu nebo vývoje hromadných jevů. Nejprve vymezí soubor objektů, na nichž bude zkoumat uvažovaný jev, neboli vymezí vyšetřovaný soubor (například při sčítání lidu jde o všechny lidi na území konkrétního státu). Potom všechny jednotky vyšetří z hlediska studovaného jevu (na jejich existenci, hodnotu, ). Díky velkým pamětem současných počítačů je to obvykle možné. Nakonec zhuštěním získaných údajů vytvoří číselný obraz zkoumaného hromadného jevu vzhledem k vyšetřovanému souboru. Tento číselný obraz je složen buď z tabulky četností, vhodných grafů nebo z různých charakteristik vyšetřovaného souboru, případně ze všech těchto věcí najednou. Matematická statistika Matematická statistika se vyvinula z popisné statistiky. Jejím základem je teorie pravděpodobnosti. Rozdíl mezi popisnou statistikou a matematickou statistikou je v rozdílném přístupu ke zkoumání jevu. Popisná statistika zkoumá jev na souboru objektů přímo a musí mít tedy celý vyšetřovaný soubor najednou k dispozici. Získání celého souboru může být ovšem velmi náročné až nemožné (cena, organizace a doba sběru dat, ). Matematická statistika zkoumá jevy ve vyšetřovaném souboru nepřímo prostřednictvím výběrů. Výběrem se myslí určitá podmnožina vyšetřovaného souboru. Prvky výběrového souboru jsou vybrány náhodně a nezávisle ze základního souboru. Na získané údaje se pak pohlíží jako na výsledek určitého náhodného pokusu (ve výběru prvků do výběrového souboru hraje podstatnou roli náhoda), který mohl dát i jiné výsledky. Takto se ve zkoumání jevu objeví prvek náhodnosti. Proto mají všechny závěry matematické statistiky pravděpodobnostní charakter. 1

2 Popisná statistika Typy zkoumaných dat V rámci zkoumání souborů se můžeme setkat s různými typy statistických znaků popisujících vyšetřovaný jev. Jde vlastně o následující typy dat: kvantitativní (lze je vyjádřit hodnotou) o diskrétní (obvykle přirozená čísla nebo celá nezáporná čísla počet zaměstnanců, počet obyvatel, ) o spojité (spotřeba pohonných hmot, doba čekání na obsluhu, hmotnost, ) kvalitativní (lze je vyjádřit slovně nebo kódem jde o rozdělení do kategorií, případně jde o pořadí prvku) o nominální alternativní (nula-jedničkový, může nabývat jen dvou hodnot pohlaví, on/off, ) množný (může nabývat více hodnot profese, krevní skupina, ) o pořadové (ordinální míra spokojenosti, platová skupina, ) V některých případech se zkoumaná data vyjadřují v násobku nějaké dohodnuté jednotky, respektive je dostaneme k dispozici sdružená do intervalů (takto jsou často spojitá data převáděna na diskrétní). V takových situacích hovoříme o poměrovém respektive intervalovém typu dat. Z výše uvedeného rozdělení typů dat je zřejmé, že pro kvalitativní data můžeme vyšetřovat v podstatě jen počet výskytů v rámci kategorie či pořadí a jejich poměry. Vyšetřování kvantitativních dat umožňuje podstatně bohatší pohled na tato data. Statistické soubory jednorozměrné V této fázi se budeme zabývat jednorozměrnými statistickými soubory. Tyto soubory jsou tvořeny reálnými čísly,,,, kde je obvykle dost velké číslo. Při zkoumání souboru vypočítáváme různé charakteristiky tohoto souboru za účelem porozumění zkoumanému jevu. V průběhu vývoje statistiky jako oboru byla navržena celá řada různých charakteristik často spojených přímo se zkoumaným jevem. To ovšem neumožňovalo standardizovat statistické metody pro zkoumání jakéhokoliv jevu. Proto v moderní statistice byly takové charakteristiky již opuštěny. Jevy jsou nyní vyšetřovány zásadně standardními charakteristikami. Rozdělení četností Prosté rozdělení četností Zkoumaný soubor setřídíme do rostoucí posloupnosti,,. Při tom vynecháme duplicitní výskyty ve zkoumaném souboru. Ke každé hodnotě přiřadíme počet jejich výskytů v původním souboru nazývaný četnost. Vznikne tabulka rozdělení četností. Často je vhodné vypočítat relativní četnosti = Takto vznikne tabulka relativního rozdělení četností. Poznámka Součet relativních četností je vždy roven hodnotě 1. Často se vyjadřuje v procentech. Prosté rozdělení četností lze rozumně využívat jen pro zpracování statistického znaku s malým počtem různých hodnot. 2

3 Intervalové (třídní) rozdělení četností V situaci, kdy ve zkoumaném souboru je velké množství různých hodnot, postupujeme jinak. Rozpětí zkoumaného soboru rozdělíme na konečný a rozumně malý počet intervalů (tříd). Potom zjistíme počet hodnot patřících do tohoto intervalu. Vznikne tak tabulka intervalového rozdělení četností. Přitom je třeba si uvědomit, že při výpočtech statistických charakteristik z takovéto tabulky nahrazujeme všechny hodnoty z jednoho intervalu jedinou hodnotou, za kterou se zpravidla volí střed tohoto intervalu. Následně pak můžeme vytvořit tabulku relativního intervalového rozdělení četností stejným postupem, jako výše. Problémem je volba počtu intervalů (jde o přirozené číslo). V takovém případě je doporučováno, pokud nemáme jiný vhodný způsob pro určení počtu intervalů, volit ho dle Sturgessova pravidla 1+3,3log 1+log Podle tohoto pravidla volíme z tabulky, když má hodnotu v uvedeném rozmezí. n M n M Statistické grafy Je známo, že jeden obrázek vydá za deset tabulek a tisíc slov. Proto je pro prezentaci statistických výsledků velmi často užíváno jejich vyjádření v podobě grafu. Prakticky postačují následující typy. Histogram Jde o grafické vyjádření četnosti v jednotlivých třídách rozdělení četností obdélníkem tak, aby jeho plocha byla úměrná četnosti jevu v daném intervalu. Je vhodné volit intervaly stejné šíře pak výška obdélníku odpovídá četnosti. Liberec 1998 Počet obyvatel Věková skupina 3

4 Výsečový graf Výsečový (koláčový) graf je užíván nejčastěji a nejvhodněji pro vyjádření poměrů jednotlivých tříd. Liberec poměr věkových tříd 2% 15% 23% 30% 30% Poznámka Pro vyjádření charakteristik zkoumaného souboru přidáme později ještě jeden velmi speciální typ grafu boxplot neboli krabičkový diagram. Extrémní hodnoty Někdy je vhodné daný soubor uspořádat podle velikosti do neklesající posloupnosti Odtud snadno dostaneme min, max Charakteristiky polohy Charakteristiky polohy umožňují charakterizovat úroveň zkoumané veličiny jedním číslem. Charakteristika polohy ' zachovává linearitu '( ( ', pro libovolné (, *. Aritmetický průměr 1, Aritmetický průměr bývá často nazýván jen průměr. Jeho slabinou je citlivost na hrubé chyby zkoumaného souboru. Přesto jde o velmi důležitý ukazatel, protože velmi souvisí se souhrnem zkoumaných dat. Pro souhrn dat totiž platí, Průměr je též velmi důležitý v souvislosti s lineární transformací. V případě častého opakování některých hodnot (- je počet výskytů jevu ) lze počítat i vážený aritmetický průměr. - - Geometrický průměr 4 0. / 0 12 Geometrický průměr je používán jen málokdy. Má ale svůj význam při výpočtu průměrného koeficientu růstu časové řady a v podobných úlohách.

5 Harmonický průměr Jsou-li všechna kladná, lze uvažovat i 3 = = 4 I harmonický průměr má rovněž omezené použití. Má ale svůj smysl při výpočtu průměrů indexů typu rychlost a podobně. Kvadratický průměr 5 =6 + + = 6 Kvadratický průměr má rovněž velmi řídké použití ve statistické praxi. Později ale v souvislosti s mírami variability uvidíme, že směrodatná odchylka je vlastně kvadratickým průměrem odchylek jednotlivých hodnot od jejich aritmetického průměru. Poznámka Je možné zavést i vážený geometrický, harmonický či kvadratický průměr. Vzhledem k jejich velmi omezenému použití to nebudeme potřebovat. Poznámka je možná si definovat nejrůznější průměry. Uvedené typy průměrů ale mají svůj praktický význam. Navíc zvláště aritmetický průměr má řadu důležitých vlastností. Zvláště významné jsou vlastnosti odchylek od aritmetického průměru. Součet odchylek je nulový a součet čtverců odchylek je minimální. Věta o průměrech Jsou-li všechna kladná, pak platí 3. 5 Rovnost nastane pouze v případě, že všechna jsou si rovna. V opačném případě bude všude ostrá nerovnost. Medián Medián je definován jako prostřední hodnota setříděného souboru, je-li počet jeho prvků lichý, respektive jako aritmetický průměr dvou prostředních hodnot, je-li počet prvků souboru sudý. Medián patří k robustním mírám polohy, protože ani větší změna některého z prvků souboru nezpůsobí výraznou změnu mediánu. Známe-li 7 pak víme, že polovina prvků souboru je menší nebo rovna mediánu a polovina je větší nebo rovna mediánu. Tuto vlastnost pochopitelně nemá žádný z průměrů. Kvantily Podobně jako medián dělí setříděný soubor na stejně velké poloviny, můžeme definovat i další podobné dělení setříděného souboru. Obecně se nazývá kvantil, který dělí setříděný soubor na dvě části jedna je menší nebo rovna než tento kvantil a druhá je větší nebo rovna než tento kvantil. Z toho můžeme odvodit další zajímavá dělení na: kvartily dělení na čtyři stejné části první (dolní), druhý a třetí (horní) kvartil 8 =7,9, 7=7,9, 8 : =7,;9 decily dělení na deset stejných částí první až devátý decil 7,,,7,<, percentily dělení na sto stejných částí první až devětadevadesátý percentil 7,,,7,<<, Poznámka uvažovat druhý kvartil nebo pátý decil nemá obvykle smysl, jedná se o medián. 5

6 Modus Modus = je ta hodnota v souboru, která se vyskytuje nejčastěji. Je zřejmé, že modus není určen jednoznačně. Boxplot Boxplot neboli krabičkový diagram je velmi přehledným grafickým vyjádřením základních charakteristik polohy. Používá se jak ve svislé, tak vodorovné modifikaci. Velmi vhodné je jeho užití pro porovnání dvou souborů popisujících stejný jev v různých obdobích či územích. Boxplot zobrazuje minimum, dolní kvartil, medián, horní kvartil a maximum. V některých případech jsou extrémy (minimum a maximum) nahrazeny nejnižší a nejvyšší rozumnou hodnotou se zvýrazněním takzvaných odlehlých hodnot. Odlehlou hodnotou se myslí hodnoty ležící pod dolním kvartilem nebo nad horním kvartilem ve větší vzdálenosti než 1,5 8 :?8. Rozumnou hodnotou se myslí minimum a maximum souboru, ze kterého jsou odebrány odlehlé hodnoty. Charakteristiky variability Charakteristiky variability umožňují měřit úroveň rozptýlení (proměnlivost, variabilitu) zkoumané veličiny. Charakteristika zachovává multiplikativní část pro libovolné (, *. 1,? 1 A,? B 1 A, B? Rozptyl je aritmetickým průměrem čtverců odchylek jednotlivých hodnot souboru od jejich aritmetického průměru. Máme-li zkoumaný soubor zadaný ve formě rozdělení četností, pak rozptyl můžeme počítat podle 1,? Poznámka v některých případech lze vzorec pro rozptyl najít v literatuře v podobě se jmenovatelem?1. My takový tvar nebudeme používat. Směrodatná Směrodatná odchylka je kvadratickým průměrem odchylek jednotlivých hodnot souboru od jejich aritmetického průměru. Směrodatná odchylka se vyjadřuje ve stejných jednotkách, jako prvky zkoumaného souboru. 6

7 Variační koeficient Výhodou variačního koeficientu je nezávislost na jednotce zvolené pro vyjádření prvků zkoumaného souboru (variační rozpětí se nezmění, ať vyjádříme zkoumaný soubor v haléřích či korunách). Rozpětí *? max?min Jde o rozdíl maxima a minima zkoumaného souboru. Mezikvartilové rozpětí * E 8 :?8 7,;9?7,9 Jde o rozdíl třetího a prvního kvartilu. Obdobně lze definovat i další kvantilová rozpětí decilové a percentilové. Pro praxi to však má význam jen pro některá šetření. Střední odchylka Střední odchylka kolem bodu ( se definuje jako F 1,?( Nejčastěji se užívá průměrná odchylka kolem mediánu nebo kolem aritmetického průměru. V případě, že máme k dispozici data ve formě rozdělení četností, používáme vzorec pro střední odchylku kolem bodu ( v podobě F 1,?( Charakteristiky tvaru Charakteristiky tvaru umožňují měřit tvar rozdělení hodnot zkoumaného souboru. Charakteristika tvaru H splňuje H( H, pro libovolné (, *. Centrální moment Centrální moment k-tého řádu je Odtud přímo plyne ' 1,? ' 1,? 1,1 1 1 ' 1,? 1,? 0 ' Šikmost J ' : : L 7

8 Jsou-li prvky zkoumaného souboru rozptýleny symetricky kolem aritmetického průměru, je ( : 0. Je-li ( : M0, je zkoumaný soubor záporně zešikmen (má levý chvost). Při ( : N0, je zkoumaný soubor kladně zešikmen (má pravý chvost). Pro medián a průměr obvykle platí vztah naznačený na obrázku, nemusí tak tomu být ale vždy. Špičatost ( O ' O O L J ( O?3 ' Špičatost vyjadřuje informaci, jakým způsobem se prvky zkoumaného souboru koncentrují kolem jeho průměru. Je-li ( O 3, respektive J 0 (nebo aspoň blízké této hodnotě), pak má soubor normální špičatost. Je-li ( O M3, respektive J M0, je zkoumaný soubor plochý. Při ( O N3, respektive J N0, je zkoumaný soubor špičatý (jeho hodnoty jsou koncentrovány kolem průměru). Poznámka charakteristiky tvaru jsou užitečné pro porovnání s normálním rozdělením (co to je se ukáže později v teorii poravděpodobnosti), které má J 0,J 0. O L?3 Statistické soubory vícerozměrné Jde o soubory obsahující více znaků, které mohou být vyšetřovány. Kromě toho, že můžeme vyšetřovat každý z těchto statistických znaků samostatně, můžeme také zkoumat jejich závislost buď vypočtením hodnoty vhodné charakteristiky, nebo grafickým zobrazením. Grafické znázornění závislostí V případě zkoumání závislosti kvantitativního znaku na kvalitativním můžeme porovnat boxploty pro jednotlivé kategorie. Zkoumáme-li závislost dvou kvantitativních znaků, je vhodné sestavit takzvaný rozptylový diagram. Každý z těchto znaků má svou osu a do plochy se vynáší body odpovídající jednotlivým prvkům zkoumaného souboru. Přitom se mohou objevit jisté korelace a pomocí nich lze určovat trendy závislosti v souboru. Závislost je obvykle hledána v lineárním tvaru, tedy v podobě přímek. Pokud se závislost dat neprojeví, jsou body rozptýlené a nelze jimi rozumně proložit přímku trendu. 8

9 Charakteristiky závislosti Na každém prvku zkoumaného souboru máme dva kvantitativní znaky, neboli,q,,q Kovariance Kovariance měří směr závislosti, je ovlivněna změnou RS 1,? Q?QT 1 A, Q B? QT Platí, že kovariance kvantitativního znaku sama se sebou je RR S Korelační koeficient (Pearsonův) Pearsonův korelační koeficient je normovanou kovariancí, měří tedy směr i velikost (míru) lineární závislosti. U RS 1 R S S Korelační koeficient nabývá hodnot z intervalu?1,1. Je-li U R,S 0, pak znaky a Q jsou vzájemně nezávislé. Je-li U R,S 1, pak se jedná o silnou kladnou závislost, s rostoucím v průměru roste i Q. Jeli U R,S?1, pak se jedná o silnou zápornou závislost, s rostoucím v průměru klesá Q. Obecně můžeme pro verbální vyjádření úrovně závislosti použít následující tabulku: Korelační koeficient Úroveň závislosti U R,S?1 Pevná záporná závislost?1mu R,S M?0,7 Značně vysoká záporná závislost?0,7mu R,S M?0,5 Vysoká záporná závislost?0,5mu R,S M?0,3 Střední záporná závislost?0,3mu R,S M0 Slabá záporná závislost U R,S 0 Neexistující závislost 0MU R,S M0,3 Slabá kladná závislost 0,3MU R,S M0,5 Střední kladná závislost 0,5MU R,S M0,7 Vysoká kladná závislost 0,7MU R,S M1 Značně vysoká kladná závislost U R,S 1 Pevná kladná závislost 9

10 Korelační matice Korelační matici sestavujeme, máme-li zkoumat soubor s více než dvěma znaky. Korelační matice tak může vyjádřit všechny korelační koeficienty, které v našem souboru připadají v úvahu. Je zřejmé, že platí U R,S U S,R U RR R 1 R Proto korelační matice symetrická podle hlavní diagonály. Mějme například na každém prvku zkoumaného souboru čtyři kvantitativní znaky Z,,Q,[, Z,,Q,[ Pak korelační matice zkoumaného souboru má tvar U ],] U ],R U ],S U ],^ 1 U ],R U R,] U R,R U R,S U R,^ bu ],R 1 \ U S,] U S,R U S,S U S,^ au ],S U R,S U^,] U^,R U^,S U^,^_ U ],^ U R,^ ` U ],S U ],^ U R,S U R,^ e 1 U S,^ d 1 c U S,^ Statistika a MS Excel Při statistickém zpracování rozsáhlých souborů dat není nutné postupovat jen ručním vyhodnocováním charakteristik podle vzorců a nikdo to ani neočekává. K dispozici jsou různé softwarové nástroje. Jedním z nich je relativně snadno dostupný a hlavně velmi rozšířený MS Excel, který obsahuje krom celé řady statistických funkcí i doplněk Analýza dat. Tento doplněk má v sobě zapracované mnohé statistické metody. Navíc je v tomto programu k dispozici celá řada různých typů grafů. Jediná špatná zpráva klasický boxplot sice v Excelu udělat jde, ale rozhodně to nejde samo. Na Internetu lze najít celou řadu návodů na to, jak v MS Excel udělat boxplot (hledejte též box and whiskers ). Metodu jak lze boxplot vyrobit poměrně jednoduše z burzovního grafu (který je v MS Excel zabudován) uvedu v řešení první úlohy prvního týdne. Tento způsob jsem neviděl nikde publikován. Jeho výhodou je, že jde uložit jako šablona grafu a umožňuje tak opakované využití pro další grafy tohoto typu. Je publikováno i několik jiných postupů pro vytvoření velmi kultivovaných boxplot. Jsou založeny na skládaném sloupcovém grafu s nestandardním využitím chybových úseček. Opakované využití prostřednictvím uložené šablony bývá problematické, ale kopírování vzoru funguje. Viz ukázka. Možnosti MS Excelu nemá smysl zde detailně popisovat. To už udělali jiní. Nicméně v řešeních jednotlivých úloh se budeme k využívání MS Excel opakovaně vracet. 10

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Popisná statistika. Jaroslav MAREK. Univerzita Palackého Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9. Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Metodologie pro ISK II

Metodologie pro ISK II Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky V této kapitole se seznámíme se základy popisné statistiky, představíme si základní pojmy a budeme si je ilustrovat na praktických příkladech. Kapitola je psána formou volného

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 8 Statistický soubor s jedním argumentem Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola

Více

Úvod do kurzu. Moodle kurz. (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Úvod do kurzu. Moodle kurz. (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost Úvod do kurzu Moodle kurz (a) https://dl1.cuni.cz/course/view.php?id=2022 (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost Výpočty online: www.statisticsonweb.tf.czu.cz Začátek výuky posunut

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu. Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Základy biostatistiky

Základy biostatistiky Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace

Více

V roce 1998 se v Liberci oženili muži a vdaly ženy v jednotlivých věkových skupinách v následujících počtech:

V roce 1998 se v Liberci oženili muži a vdaly ženy v jednotlivých věkových skupinách v následujících počtech: Příklad 1 V roce 1998 se v Liberci oženili muži a vdaly ženy v jednotlivých věkových skupinách v následujících počtech: Skupina Počet ženichů Počet nevěst 15-19 let 11 30 20-24 let 166 272 25-29 let 191

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Statistika pro gymnázia

Statistika pro gymnázia Statistika pro gymnázia Pracovní verze učebního textu ZÁKLADNÍ POJMY Statistika zkoumá jevy (společenské, přírodní, technické) ve velkých statistických souborech. Prvky statistických souborů se nazývají

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Předmět studia: Ekonomická statistika a analytické metody I, II

Předmět studia: Ekonomická statistika a analytické metody I, II Předmět studia: Ekonomická statistika a analytické metody I, II Typ a zařazení předmětu: povinný předmět bakalářského studia, 1. ročník Rozsah předmětu: 2 semestry, celkem 24/0 hodin v kombinované formě

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Aplikovaná statistika v R

Aplikovaná statistika v R Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15 Co bude náplní našich

Více

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník a oktáva 3 hodiny týdně PC a dataprojektor, učebnice

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1 3. charakteristiky charakteristiky 1 charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme charakteristiky 2 charakteristiky Dva hlavní

Více

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

STATISTIKA S EXCELEM. Martina Litschmannová MODAM, STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216 Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

Příloha podrobný výklad vybraných pojmů

Příloha podrobný výklad vybraných pojmů Příloha podrobný výklad vybraných pojmů 1.1 Parametry (popisné charakteristiky) základního souboru 1.1.1 Míry polohy (střední hodnoty) Aritmetický průměr představuje pravděpodobně nejznámější střední hodnotou,

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Př. : Stanovte jednotlivé četnosti a číselné charakteristiky zadaného statistického souboru a nakreslete krabicový graf:, 8, 7, 43, 9, 47, 4, 34, 34, 4, 35. Statistický soubor seřadíme vzestupně podle

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics) 1. PODSTATA STATISTIKY Původní význam - pouhé sbírání čísel (název z latinského status = stát, použití k označení vědy zabývající se sběrem informací o státu - o počtu obyvatel, ekonomice,...) Dnešní pojetí

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

Deskriptivní statistika (kategorizované proměnné)

Deskriptivní statistika (kategorizované proměnné) Deskriptivní statistika (kategorizované proměnné) Nejprve malé opakování: - Deskriptivní statistika se zabývá popisem dat, jejich sumarizaci a prezentací. - Kategorizované proměnné jsou všechny proměnné,

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech. 3 Grafické zpracování dat Grafické znázorňování je velmi účinný způsob, jak prezentovat statistické údaje. Grafy nejsou tak přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých

Více

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák Základy statistického hodnocení výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý)

Více

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo

Více

Funkce a lineární funkce pro studijní obory

Funkce a lineární funkce pro studijní obory Variace 1 Funkce a lineární funkce pro studijní obory Autor: Mgr. Jaromír JUŘEK Kopírování a jakékoliv další využití výukového materiálu je povoleno pouze s uvedením odkazu na www.jarjurek.cz. 1. Funkce

Více

Základní analýza dat. Úvod

Základní analýza dat. Úvod Základní analýza dat literatura: Hendl, J. 2006: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. Praha: Portál. Macháček, J. 2001: Studie k velkomoravské keramice. Metody, analýzy

Více