Analýza dat v ekonomii
|
|
- Libor Kubíček
- před 10 lety
- Počet zobrazení:
Transkript
1 Vysoká škola ekonomie a managementu Ekonomický institut VŠEM Analýza dat v ekonomii (dříve Statistické metody a demografie) Mgr. Milena Opletalová, VŠEM milena.opletalova@vsem.cz Na základě materiálů Matěje Bulanta, Ph.D.
2 Probíraná témata Popisná statistika (1. část) Popisná statistika (2. část) Teorie odhadu, Časové řady Indení analýza, Úvod do demografie
3 Popisná statistika Obecný úvod Základní statistické pojmy Grafické znázornění dat Statistické šetření Tabulky četností Souhrnné charakteristiky
4 Data, informace, znalosti
5 Jak porozumět datům Data analyzujeme abychom z nich získali informace. Pomůže: znát odkud se data vzala (zdroj/původ) znát co to je za data (jejich význam) přesně vědět čeho musím dosáhnout znalosti + zkušenosti
6 Historický vývoj 2000 let před n.l. Čína popis státu 17. st. sir William Petty a John Graunt - Politická aritmetika 18. st. Gottfried Achenwall, Edmond Halley - Světská úřední statistika 19. st. Adolphe Quételet, Karl Pearson, Karl F. Gauss - Matematická statistika, normální rozdělení, průměr, pravděpodobnost 20. st. akademik Čěbyšev, Aleandr Ljapunov, Andrej Kolmogorov - Moderní statistka, induktivní statistika a statistická analýza, teorie věrohodnosti
7 Normální rozdělení Čím více náhodných vzájemně nezávislých jevů sčítáme, tím více se bude výsledné rozdělení blížit normálnímu. 2 0 = 1 kombinace 2 1 = 2 kombinace 2 2 = 4 kombinace 2 3 = 8 kombinací 2 4 = 16 kombinací Obr.1 Zdroj:
8 Vývoj moderní statistiky První vnímání nejistoty Statistiky hazardních her Kombinatorika Pascal, Newton, J. Bernoulli, Euler Proces návratu k průměru Sir Francis Galton ( ) Směrodatná odchylka, otisky prstů, eugenismus Riziko a nejistota Frank H. Knight ( ) Riziko Náhoda se známými pravděpodobnostmi Nejistota Náhoda s neznámými pravděpodobnostmi nejistota statistická - způsobena náhodou, je tedy nepředvídatelná nejistota systematická - způsobena naší neznalostí nebo nedostatkem/ nepřesností informací.
9 Základní definice 1 Hromadné jevy a procesy - jevy a procesy vyskytují se u velkého množství prvků. Statistická jednotka popisovaný prvek souboru, u něhož jsou sledované různé vlastnosti Statistický znak /proměnná/ zachycuje určitou vlastnost statistické jednotky. Hodnota statistického znaku ( pozorování) - míra dané vlastnosti (statistického znaku) u každé jednotky statistického souboru.! Počet hodnot (pozorování) = rozsah souboru. Obměna ( varianta) statistického znaku - hodnota ve smyslu vyjádření různého stupně dané vlastnosti.! Počet variant rozsah souboru.
10 Základní definice 2 Statistický soubor soubor, vytvořený ze statistických jednotek, u nichž se sleduji stejné statistické znaky. základní soubor (populace) soubor všech statistských prvků daných výčtem, nebo vymezením některých společných vlastností. výběrový soubor část jednotek základního souboru Rozsah souboru počet statistických jednotek ve statistickém souboru. Bývá označován písmenem n.
11 Základní definice 3 Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Číselné údaje o hromadných jevech Praktická činnost spočívající ve sběru, zpracování a vyhodnocování statistických údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu a odhalování zákonitostí při působení podstatných, relativně stálých činitelů na hromadné jevy.
12 Klasifikace statistických znaků Statistické znaky Kvantitativní - číselná Kvalitativní kategoriální Diskrétní - celočíselná Spojité - libovolné hodnoty z intervalu Nominální - slovní Ordinální - pořadové Obr. 2 Zdroj: Hindls, R., Hronová, S.,Seger, J., Statistika pro ekonomy, Professional Publishing, Praha, 2007
13 Klasifikace statistických znaků Kvantitativní - nabývají číselných hodnot (hmotnost, délka, pevnost, cena, doba, životnost) Diskrétní - nabývají pouze oddělených číselných hodnot (počet vad, kusová produkce apod.) Spojité - nabývají všech hodnot z nějakého intervalu reálných čísel (rozměr výrobku, doba do poruchy, cenový inde apod.) Kvalitativní /kategoriální/ - většinou slovní, používá se kódování Nominální /slovní/ - nelze uspořádat dle stupně vlastnosti, hodnoty jsou buď jen stejné nebo rozdílné Ordinální /pořadová/ - lze seřadit, nelze říci o kolík se liší Dichotomická /alternativní/ - ano/ne
14 Statistické zjišťování /šetření/ - získávání hodnot proměnných u statistických jednotek, které tvoří statistický soubor Etapy statistického zjišťování: Příprava statistického šetření co, kdo, kdy a jakým způsobem bude měřit rozhodný okamžik přímé zjišťování, výkaz, rozhovor, dotazník Provedení statistického šetření Statistické zpracování zjištěných údajů /dat/ - souhrny, tabulky četnosti, grafy Statistické vyhodnocování /analýza/ Publikace výsledků, prezentace
15 Příklad výkazu Zdroj: archiv MŠMT,
16 Vzor publikace statistické ročenky Obr.3 Zdroj: archiv MŠMT,
17 Statistické grafy, vizualizace dat Obr.4 Zdroj:
18 Nezamšstnanost v % Statistické grafy Porovnání nezaměstnanosti ve Středočeském a Ústeckém kraji 19,00 18,00 17,00 16,00 15,00 14,00 13,00 12,00 11,00 10,00 9,00 8,00 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0, Česká republika 0,66 4,13 2,57 3,52 3,19 2,93 3,52 5,23 7,48 9,37 8,78 8,90 9,81 10,3 9,47 8,88 7,67 5,98 5,96 9,24 9,57 Středočeský 0,65 4,86 3,37 3,98 2,86 2,57 2,98 4,62 6,06 7,46 6,80 6,76 7,21 7,43 6,85 6,25 5,32 4,25 4,47 7,01 7,73 Ústecký 0,67 4,47 3,58 5,23 5,24 5,79 7,05 10,0 13,1 15,9 16,1 15,8 17,1 17,9 15,8 15,4 13,7 10,9 10,2 13,6 13,
19 Statistické grafy, vizualizace dat Spojnicové a sloupkové grafy Polygon četností (spojnicový graf) vhodné zobrazení při srovnávání struktury různých souborů. Sloupcový graf Obr.5 Zdroj: Finanční analýza podnikové sféry za rok 2010,
20 % celkové populace Statistické grafy, sloupcový graf 40 Vývoj podílu obézních mužů a žen na celkové populaci ČR , ,3 12,1 13,6 16,1 Obézní ženy Obézní muži ,4 10, ,4 17,
21 Statistické grafy, vizualizace dat Histogram rozdělení četností vhodný pro znázornění spojitých proměnných (intervalové rozdělení četností) Obr.6 Zdroj:
22 Statistické grafy, vizualizace dat Bodové grafy - slouží ke znázornění závislostí mezi dvěma kvantitativními znaky (nebo průběhové časové řady) Vzor bodového grafu ze stránky Microsoft Obr.7 Zdroj:
23 Statistické grafy, vizualizace dat Výsečové grafy Vzor výsečového grafu ze stránky Microsoft Obr.8 Zdroj:
24 Statistické grafy, výsečový graf Podíl využití jednotlivých verzí Android Ice Cream Sandwich 26% Jelly Bean 3% Honeycomb 2% Gingerbread 54% Froyo 12% Eclair 3% Другой 2% Cupcake 0% Donut 0%
25 Statistické grafy, vizualizace dat Krabicový graf slouží k zakreslení základních výběrových charakteristik kvantitativní proměnné, v jednom obrázku poskytuje informaci o maimální a minimální hodnotě v souboru naměřených hodnot, o mediánu a horním a dolním kvartilu tohoto souboru atd. Příklad: Porovnáme statistické údaje hmotnosti 10. kaprů v jedné kádi i = {1.4; 0.8; 1.2; 1.6; 2.3; 1.3; 1.3; 0.9; 1.5; 2.1} Obr.9 Zdroj:
26 Statistické grafy, vizualizace dat Tornádo a Pavoučí grafy (Spider analýza) Obr.10 Zdroj: Ing. Ondřej Nowak, prezentace k přednášce Analýza rizika a finanční modelování, KPE FPH VŠE, 2011
27 Statistické grafy, spider-graf Solvency ratio (%) Liquidity ratio Return on shareholders funds (%) ROE 50,00 40,00 30,00 20,00 10,00 0,00-10,00-20,00-30,00-40,00 Return on capital employed (%) ROIC Return on total assets (%) ROA VOLKSWAGEN General Motors DAIMLER AG BAYERISCHE MOTOREN WERKE Peugeot S.A. Current ratio () Profit margin (%) EAT/Sales ROS EAT RENAULT ŠKODA Auto a.s. /součástí VW/ Interest cover () EBIT Margin (%) EBIT/Sales Net assets turnover
28 Úhrn srážek v mm Průměrná teplota v C Statistické grafy, histogram Průměrná teplota a srážky v ČR Srážky Průměrná teplota
29 Statistické grafy, vizualizace dat 14 Výroba motorů a plán výroby Above Plan Below Plan Engine Input Plan
30 Statistické grafy, dashboard I&I Turn-Around Time Customer OTD Delinquent Engines 100% % 4 2 0% CFM TAT GE90 TAT Delinquent Engines OTD $ $ $ Inventory (tis $) Inventory Engine Inputs % 50% FTY 160 Revenue QTD ($MM) OCPH YTD ($ per hr) % H80 FTY M601 FTY
31 Základní pojmy, příklady Př.1 n i1 i
32 Základní pojmy, příklady Př.1 n i n i1
33 Základní pojmy, příklady Př.1 n i n i1 5 i i1
34 Základní pojmy, příklady Př.1 n n i i i i i i
35 Základní pojmy, příklady Př.1 n n i i i i i i i
36 Základní pojmy, příklady Př.1 n n i i i i i i i 5 1 i i 8 3 i i
37 Základní pojmy, příklady Př.1 n n i i i i i i i 5 1 i i 8 3 i i 106
38 Základní pojmy, příklady Př.1 n n i i i i i i i 5 1 i i 8 3 i i
39 Př.2
40 Rozdělení četností Tab 1.1 Rozdělení četností, pravidlo Varianta Četnost Kumulativní četnost znaku X i Absolutní n i Relativní p i Absolutní Relativní 1 n 1 p 1 n 1 p 1 2 k n 2 n k p 2 p k n 1 +n 2 p 1 +p 2 k k Celkem ni n pi 1 i1 i1 k i1 ni n k i1 pi 1 Podává informaci o počtu (četnosti) výskytu jednotlivých variant znaku v souboru Absolutní/relativní četnosti ni k pi k n pi i i1 i1 k i1 ni n 1 n k n i1 i 1 n n 1
41 Rozdělení četností, příklad Př. 1.1 Z personálního oddělení průmyslového podniku jsme získali údaje o zařazení do tarifních tříd v souboru 75 pracovníků. Údaje jsou v tabulce 1.2 Zdroj: Hindls, R., Hronová, S.,Seger, J., Statistika pro ekonomy, Professional Publishing, Praha, 2007
42 Rozdělení četností, příklad
43 Rozdělení četností, příklad
44 Příklady Zdroj: Jarošová, E.,Marek, L., Statistika pro ekonomy, II vydání, 2007
45 a) Typ domácnosti Varianta znaku Z Četnost Absolutní n i Relativní p i Celkem
46 a) Typ domácnosti Varianta znaku Z Četnost Absolutní n i Relativní p i Zaměstnanecká jiná ,42 0,58 Celkem 31 1,00
47 b) Počet členů domácnosti Varianta znaku Četnost Kumulativní četnost Absolutní n i Relativní p i Absolutní Relativní Celkem
48 b) Počet členů domácnosti Varianta znaku Četnost Kumulativní četnost Absolutní n i Relativní p i Absolutní Relativní 1 3 0, , , , , , , , , , , ,000 Celkem 31 1,0000
49 c) Měsíční výdaje domácnosti za potraviny Interval pro měsíční výdaje za potraviny Četnost Kumulativní četnost Absolutní n i Relativní p i Absolutní Relativní 3000 a méně a více Celkem
50 c) Měsíční výdaje domácnosti za potraviny Interval pro měsíční výdaje za potraviny Četnost Kumulativní četnost Absolutní n i Relativní p i Absolutní Relativní 3000 a méně 3 0, , , , , , , , , , , , a více 2 0, ,0000 Celkem 31 1,0000
51 Souhrnné charakteristiky Problém s průměry Obr.11 Zdroj: SAVAGE, S. L.; DANZIGER, J.: The Flaw of Averages: Why We Underestimate Risk in the Face of Uncertainty. New York : John Wiley & Sons, 2009
52 Souhrnné charakteristiky Potíže, které má mnoho inteligentních lidí se sčítáním, jsou nekonečné. M. Greenwood Míry polohy určují typické rozložení hodnot souboru Střední hodnoty Kvantily Míry variability určují variabilitu (rozptyl) hodnot kolem své typické hodnoty Šikmost Špičatost Absolutní Relativní
53 Četnost Histogram Graf četností Četnost jednotlivých hodnot Četnost intervalu hodnot Histogram Hodnota
54 Souhrnné charakteristiky Příklad Rozdělení chlapců ve věku 9,5-10 let podle tělesné výšky (délka třídního intervalu 5 cm) Střed třídy i Absolutní četnost n i Relativní četnost n i /n Kumulativní absolutní četnost Kumulativní relativní četnost , , , , , , , , , , , , , , , , , ,0000 Celkem ,
55 Souhrnné charakteristiky Histogram výběrového rozdělení tělesné výšky 3231 chlapců ve věku 9,5-10 let (délka třídního intervalu 5 cm) a teoretická hustota normálního rozdělení
56 Souhrnné charakteristiky Míry polohy Aritmetický průměr - součet hodnot dělený jejich počtem. Průměr (aritmetický průměr) používáme, když čísla můžeme opravdu sčítat, tj. znaky jsou kvantitativní, měřené na číselné stupnici. X k k i i i 1 i1 X k n prostý tvar i1 * n n i i vážený tvar X k i1 * i pi Příklad: Vypočtěte průměr následujících výsledků vyšetření: 39, 42, 73, 67, 24, 55.
57 Souhrnné charakteristiky Míry polohy Aritmetický průměr - součet hodnot dělený jejich počtem. Průměr (aritmetický průměr) používáme, když čísla můžeme opravdu sčítat, tj. znaky jsou kvantitativní, měřené na číselné stupnici. X k k i i i 1 i1 X k n prostý tvar i1 * n n i i vážený tvar X k i1 * i pi Příklad 1: Vypočtěte průměr následujících výsledků vyšetření: 39, 42, 73, 67, 24, 55. Řešení: Součet pozorování je 300. Počet pozorování je 6. Průměrem je podíl 300/6 = 50.
58 Souhrnné charakteristiky k i i k i i i n n X 1 1 * Příklad 2: Rozdělení chlapců ve věku 9,5-10 let. Aritmetický průměr vážený pro n = 3231, k = 9 a * 1 k i i ni Míry polohy
59 Souhrnné charakteristiky Míry polohy Příklad 2: Rozdělení chlapců ve věku 9,5-10 let. Aritmetický průměr vážený pro n = 3231, k = 9 a k i1 * i ni X k i1 i * n i1 k n i i 138,52
60 Souhrnné charakteristiky Míry polohy Geometrický průměr - n-tá odmocnina ze součinu kladných hodnot. Využívá se k výpočtu průměrného růstu k ni n n n X G n i * 2*... * i1 prostý tvar nk k n n X G n i 1* 2*... * i1 vážený tvar n Příklad 3: Spočtěte geometrický průměr z následujících pěti hodnot: 4, 8, 16, 16 a *8*16*16* 64 a) 5 aritm.průměr 21,6
61 Souhrnné charakteristiky Míry polohy Geometrický průměr - n-tá odmocnina ze součinu kladných hodnot. Využívá se k výpočtu průměrného růstu k ni n n n X G n i * 2*... * i1 prostý tvar nk k n n X G n i 1* 2*... * i1 vážený tvar n Příklad 3: Spočtěte geometrický průměr z následujících pěti hodnot: 4, 8, 16, 16 a *8*16*16* ,929 n 1 log X * log n a) aritm.průměr 21,6 G i b) Zjednodušení postupu:, logaritmus geometrického průměru je roven průměru zlogaritmovaných pozorování. Zlogaritmováním zjištěných hodnot dostaneme čísla 0,60, 0,90, 1,20, 1,20 a 1,81. Jejich aritmetický průměr je 1,142., Odlogaritmováním této hodnoty dostaneme hodnotu geometrického průměru jako 13,9. i1 13,9
62 Souhrnné charakteristiky Harmonický průměr - počet hodnot proměnné dělený součtem jednotlivých obrácených hodnot. Hodnota, obracená aritmetickému průměru obracených hodnot původních dat. Využití v případech, kdy pracujeme s proměnnou vyjadřující relativní změny (např. průměrná rychlost, průměrná délka potřebná ke splnění určitého úkonu). X Míry polohy H k i1 n 1 i prostý tvar X H k i1 1 p i i vážený tvar Příklad 3: Spočtěte harmonický průměr z následujících pěti hodnot: 4, 8, 16, 16 a 64 X H k i1 k i1 n i n i i XH ,69
63 Souhrnné charakteristiky Míry polohy X Modus - nejčastěji se vyskytující kategorie sledované proměnné ve vztahu k nejbližšímu okolí Příklad 4: Co je modus v následujících výsledcích zjišťování krevních skupin: A, 0, 0, B, B, AB, A, A, 0, 0, 0, AB, B, 0, B, A, 0, AB, 0, 0, B, 0, A? krevní skupina A B AB 0 četnost výskytu
64 Souhrnné charakteristiky Míry polohy X Modus - nejčastěji se vyskytující kategorie sledované proměnné ve vztahu k nejbližšímu okolí Příklad 4: Co je modus v následujících výsledcích zjišťování krevních skupin: A, 0, 0, B, B, AB, A, A, 0, 0, 0, AB, B, 0, B, A, 0, AB, 0, 0, B, 0, A? krevní skupina A 5 B 5 AB 3 četnost výskytu 0 10
65 Medián Souhrnné charakteristiky Míry polohy X ~ Máme-li pozorování uspořádána vzestupně nebo sestupně, potom medián je ta hodnota, která rozdělí pozorování na dvě stejně velké skupiny. Přesněji řečeno, máme-li lichý počet uspořádaných pozorování, pak mediánem je prostřední z nich. U sudého počtu se mediánem rozumí obvykle průměr ze dvou prostředních pozorování. Medián využívá pouze informaci o pořadí hodnot, a proto ho má smysl používat pouze pro kvantitativní a ordinální veličiny. Příklad 5: Co je mediánem následujících výsledků vyšetření: 61, 49, 35, 74, 53, 82? Řešení: Uspořádejme pozorování vzestupně: 35, 49, 53, 61, 74, 82. Mediánem je průměr z hodnot 53 a 61, tj. ( )/2 = 57
66 Souhrnné charakteristiky Míry polohy p-procentní kvantil Určení pořadí jednotky 1) Datový soubor uspořádáme vzestupně podle velikosti 2) Seřazeným pozorováním přiřadíme pořadí od 1 do n 3) p%-ní kvantil je potom roven pozorování s pořadím zp n p p * Zp n* 1 X ~ pojmenované kvantily kvartily (25%, 50% a 75% kvantily) decily (10%, 20%,..., 90% kvantily) percentily (1%, 2%,..., 99% kvantily)
67 Souhrnné charakteristiky Příklad 6: Porovnáme statistické údaje hmotnosti 10. kaprů v jedné kádi i = {1.4; 0.8; 1.2; 1.6; 2.3; 1.3; 1.3; 0.9; 1.5; 2.1} Medián hmotnosti kapru je Konce dolního a horního fousu jsou (nejmenší hodnota vůbec) Největší hodnota Aritmetický průměr Kvartily jsou Mezikvartilové rozpětí Zdroj:
68 Souhrnné charakteristiky Příklad: Porovnáme statistické údaje hmotnosti 10. kaprů v jedné kádi i = {1.4; 0.8; 1.2; 1.6; 2.3; 1.3; 1.3; 0.9; 1.5; 2.1} Medián hmotnosti kapru je 1,35 Konce dolního a horního fousu jsou (nejmenší a největší hodnota) 0,8 a 2,1 Největší hodnota 2,3 odlehlá Aritmetický průměr 1,4 Kvartily jsou 1,2 a 1,6 Mezikvartilové rozpětí 0,4 Zdroj:
69 Souhrnné charakteristiky Míry variability Absolutní míry variability Variační rozpětí R - rozdíl největší a nejmenší hodnoty znaku R X ma X min Rozptyl - průměr čtverců odchylek jednotlivých hodnot znaku od jeho aritmetického průměru S 2 X n ( i1 i n ) 2 prostý tvar
70 Souhrnné charakteristiky Míry variability Absolutní míry variability - rozptyl k i i n i i i n n S * ) ( vážený tvar k i i k i i i k i i n i i i n n n n S * * Míry variability Souhrnné charakteristiky Míry variability Souhrnné charakteristiky Míry variability
71 Souhrnné charakteristiky Míry variability Absolutní míry variability Směrodatná odchylka - druhá odmocnina z rozptylu. Uvedena ve stejných jednotkách jako zkoumaný statistický znak. S S 2
72 Souhrnné charakteristiky Míry variability Relativní míry variability Variační koeficient - podíl směrodatné odchylky a aritmetického průměru sledované proměnné. V S Bezrozměrný, vyjadřuje relativní míru variability. Pro porovnání variability proměnných vyjádřených v různých jednotkách
73 Souhrnné charakteristiky Příklad Zdroj: Simulační nástroj Profeta Risk Analyzer
74 Souhrnné charakteristiky Příklad Navštívili jsme dvě restaurace a sledovali počet objednaných jídel v průběhu stejného časového úseku. V první restauraci bylo objednáno během pěti hodin: 1,1,2,1,10 a ve druhé: 2,4,3,4,2. Pro každou restauraci spočítejte následující míry: 1. Průměr 2. Medián 3. Rozptyl 4. Variační rozpětí 5. Variační koeficient Výsledky porovnejte a interpretujte
75 Souhrnné charakteristiky Výsledky 1
76 Souhrnné charakteristiky Výsledky 2
77 Souhrnné charakteristiky Rozklad rozptylu Máme-li datový soubor, který je rozdělen na skupiny a jsou-li zadané skupinové četnosti, skupinové průměry a skupinové rozptyly, počítáme celkový rozptyl pomocí rozkladu rozptylu na meziskupinovou a vnitroskupinovou variabilitu.
78 Souhrnné charakteristiky Rozklad rozptylu - vzorec Pokud máme statistický soubor o n jednotek rozdělen do k dílčích podsouborů, kde známe dílčí rozptyly, dílčí průměry a dílčí četnosti, potom rozptyl celého souboru je dán součtem rozptylu skupinových průměrů a průměrů ze skupinových rozptylů.
79 Souhrnné charakteristiky Rozklad rozptylu - příklad Dvě restaurace nabízejí v rámci polední nabídky hotová jídla. Restaurace číslo 1 prodala za měsíc 2000 hotových jídel, za průměrnou cenu 75 Kč, cena má směrodatnou odchylku 5. Restaurace číslo 2 prodala za měsíc 1500 hotových jídel za průměrnou cenu 85 Kč, cena má směrodatnou odchylku 10 Kč. Jaký je variační koeficient ceny hotových jídel za obě cukrárny? Zajímá nás, jak variabilita ceny hotových jídel kolísá během měsíce.
80 Souhrnné charakteristiky Rozklad rozptylu příklad Výsledky
81 Souhrnné charakteristiky Rozklad rozptylu - příklad
82 Souhrnné charakteristiky Šikmost a špičatost Charakteristika šikmosti popisuje soubor hodnot sledované proměnné z hlediska koncentrace malých a velkých hodnot sledované proměnné v porovnání se symetrickým rozdělením četností. a) Pokud je koeficient šikmosti kladný = větší koncentrace malých hodnot v souboru. b) Pokud je koeficient šikmosti záporný = větší koncentrace velkých hodnot v souboru. c) Pokud je koeficient šikmosti roven nule = rozdělení hodnot je symetrické. Zdroj: Mandelbrot, B. a Richard, L. H.: The Misbehavior of Markets: A Fractal View of Financial Turbulence. Basic Books, 2006.
83 Popisná statistika v Ecelu Každá funkce v Ecelu má své klíčové slovo. Průvodce funkcí (tlačítko f na začátku stavového řádku). Je třeba zadat do závorky z čeho má být příslušná funkce počítána. Funkce pro popisnou statistiku Rozsah souboru Aritmetický průměr Harmonický průměr Geometrický průměr Modus Medián POPISNÁ CHARAKTERISTIKA NÁZEV FUNKCE V EXCELU =POČET =PRŮMĚR =HARMEAN =GEOMEAN =MODE =MEDIAN 25 % kvartil =PERCENTIL Součet hodnot Rozptyl Výběrový rozptyl Směrodatná odchylka Výběrová směrodatná odchylka Maimum Minimum Šikmost Špičatost =SUMA =VAR =VAR.VÝBĚR =SMODCH =SMODCH.VÝBĚR =MAX =MIN =SKEW =KURT
84 Souhrnné charakteristiky Šikmost a špičatost Charakteristika špičatosti popisuje soubor hodnot sledované proměnné z hlediska koncentrace hodnot v souboru kolem střední hodnoty (v porovnání s tzv. Gaussovou křivkou). Čím je hodnota koeficientu špičatosti vyšší, tím je rozdělení četností strmější a v souboru je vyšší koncentrace hodnot blízkých střední hodnotě. Zdroj: Mandelbrot, B. a Richard, L. H.: The Misbehavior of Markets: A Fractal View of Financial Turbulence. Basic Books, 2006.
85 Vlastností aritmetického průměru n 1. i=1 i = 0 2. k = k 3. k = k 4. + k = +k n 2 n 5. i=1 i < i=1 i a 2 6. ± y = ± y 7. H G
86 Výpočet váženého aritmetického průměru Příklad 1.1 Tarifní třída dělníků i n í = = 5,6
87 Grafy Polygon rozdělení četností
88 Kvantily Kvantil hodnota, která rozděluje soubor hodnot statistických znaků na 2 části, p % hodnot menších nebo rovných hodnotě p% kvantilu a (100-p) % větších p% kvantilu. Hodnoty menší, než ta, co leží na kvantilu, tvoří stanovenou část rozsahu souboru. Zp pořadové číslo jednotky p p n* Zp n*
89 Příklady Kvantily Příklad 1.1 Počet odpracovaných hodin, n=75 pracovníků. 25% kvantil 0,25 : < Z p < ,75 < Zp < 19,75 Zp = 19 = 0,25 leží v intervalu , střed 170
90 Výpočet kvantilu na intervalovém rozdělení četnosti p = z p n 1 n 2 h p + a p, Z p = n p + 0,5 Zp pořadové číslo jednotky, jejíž hodnota bude hledaný kvantil. n rozsah souboru p relativní četnost hodnot n 1 kumulativní četnost jednotek ležících před kvantilovým intervalem n 2 četnost intervalu, v němž leží hledaný kvantil hp délka kvantilového intervalu ap dolní hranici kvantilového intervalu
91 Interval pro měsíční výdaje za potraviny Výpočet mediánu na intervalovém rozdělení četnosti c) Měsíční výdaje domácností za potraviny Četnost Kumulativní četnost Absolutní n i Relativní p i Absolutní Relativní 3000 a méně a více ,0968 0,1613 0,1935 0,1613 0,2581 0,0645 0, ,0968 0,2581 0,4516 0,6129 0,8710 0,9355 1,0000 Celkem 31 1,0000 Z 0,25 = 31 0,25 + 0,5 = 8,25 0,25 = 8, = 4051 Z 0,5 = 31 0,5 + 0,5 = 16 = =5401 5
92 Míry absolutní variability Rozptyl Míra variability, která současně měří variabilitu kolem aritmetického průměru a variabilitu přes vzájemné odchylky jednotlivých hodnot znaků je rozptyl. Rozptyl průměr čtverců odchylek jednotlivých hodnot od jejích aritmetického průměru.
93 S 2 = Výpočet rozptylu n i=1 i 2 n n i=1 2 i = n i 2 1. S 2 = i 2 - základní tvar, definice n i=1 2 i=1 i + n 2 Výpočtové tvary rozptylu i n n 2. S 2 = i 2 n 2 3. S 2 = 1 n n 2 = 2 2 i 2 1 n i 2
94 Výpočet rozptylu příklad V tabulce jsou údaje o tydenních mzdách ve dvou dílnách. Prorvnáme variabilitu v obou dílnách výpočtem rozptylu ve tvaru (1)
95 S 2 = S 2 = = ,708 I dílna 2 = ,694 II dílna S 2 I > S 2 II Směrodatná odchylka S = S 2 = n i=1 i 2 n S1= = 455,4 S2= = 387,3
96 Výpočet rozptylu ve váženém tvaru S 2 = = 45,5
97 Vlastnosti rozptylu 1. S 2 const =0 2. S 2 2 +const =S 3. S const 2 =const 2 S 2 4. S ±y 2 = S 2 +S y 2 ± 2 S y, kde S y - kovariance dvou proměnných charakterizuje jejích vzájemnou závislost S y = 1 n n i=1 i 5. Rozklad rozptylu Variabilita uvnitř skupiny, dílčí rozptyly y i y = i y i n S 2 = S 2 + S 2 y = y y Variabilita mezi skupinami, dílčí průměry
98 Příklad Rozklad rozptylu
99 Příklad Variační rozpětí
100 2. Teorie pravděpodobnosti Náhodná veličina X, Y, Z spojitá nespojitá Náhodný jev, y, z Zákon rozdělení náhodné veličiny pravidlo, které každé hodnotě přiřadí pravděpodobnost její výskytu Pravděpodobnostní funkce - nejjednodušší forma vyjádření zákonu rozdělení, pravděpodobnost, že diskrétní veličina X nabude hodnoty právě. P = P X = 1. 0 P 1 2. P = P 1 X 2 = P = 1
101 Distribuční funkce - je forma popisu spojité a nespojité náhodné veličiny, pravděpodobnost, že veličina X nabude hodnoty nejvýše. Hustota pravděpodobnosti f = F ()
102 Charakteristiky náhodné veličiny Střední, očekávaná hodnota Rozptyl Směrodatná odchylka Rozdělení pravděpodobností náhodné veličiny, obdobně jako rozdělení četností, mají svoje charakteristické vlastnosti: polohu, variabilitu, šikmost a špičatost
103 Rozdělení diskrétních veličin Sledováním nebo měřením náhodné veličiny lze určit rozdělení četností (např. relativních četností) naměřených hodnot. Můžeme ale také uvažovat rozdělení pravděpodobností hodnot náhodné veličiny Alternativní, Geometrické rozdělení hod kostky P 0 = 1 π; P 1 = π; E = π; D = π(1 π) Poissonovo rozdělení s parametrem λ >0 pepř v polívce E = λ; D = λ Binomické rozdělení hod minci E = nπ, D = nπ(1 π) Hypergeometrické rozdělení kontrola kvality součástek, nevíme předem kolik z toho jsou zmetky
104 Rovnoměrné Rozdělení spojitých veličin Normální Laplaceovo Gaussovo E = μ D = σ 2 Trojúhelníkové Lognormální
105
106 Normální rozdělení Rozdělení pravděpodobnosti spojité náhodné veličiny Charakterizováno střední hodnotou a směrodatnou odchylkou Normované normální rozdělení Střední hodnota = 0 Směrodatná odchylka = 1
107 3. Teorie odhadu Odhadování vlastností (parametrů) celého základního souboru (populace) na základě výběrového souboru a jeho výběrových charakteristik je zevšeobecňující úsudek Předpokladem zobecňujících úsudků je náhodný výběr při získávání jednotek do výběrového souboru (losování, výběr pomocí tabulek náhodných čísel, systematický výběr). K odhadu charakteristiky nelze využít jakoukoliv charakteristiku, ale takovou, která splňuje určitá kritéria.
108 Kritéria použití charakteristiky k odhadu 1) Nestrannost = zvolená statistika by neměla vést k systematickému nadhodnocování nebo podhodnocování odhadované charakteristiky (zkreslení) 2) Konzistence = s rostoucím rozsahem výběru by se měl odhad charakteristiky blížit hodnotě charakteristiky základního souboru 3) Vydatnost = velikost rozptylu (čím nižší hodnoty rozptylu výběrové charakteristiky, tím menší zkreslení odhadu základní charakteristiky) 4) Dostatečnost = mimo výběrové statistiky neeistuje žádná jiná statistika, která by poskytovala další doplňující informace o odhadované charakteristice základního souboru
109 Bodový odhad Odhadované charakteristiky Základní soubor sigma σ, mi μ, pi π
110 Bodový odhad
111 Intervalový odhad intervalový odhad je interval, který bude s vysokou pravděpodobností obsahovat skutečnou hodnotu odhadované charakteristiky základního odhadované souboru charakteristiky intervalový odhad = interval, který bude s vysokou pravděpodobností obsahovat skutečnou hodnotu odhadované charakteristiky základního souboru základní střední hodnota při známém základním rozptylu
112
113
114 Příklad
115 Výsledek
116 Příklad 2
117 Výsledek
118 Časové řady časová řada: posloupnost hodnot sledovaného ukazatele, která je uspořádána v čase.
119
120 Příklad
121 Výsledek
122
123 Dekompozice časové řady
124 Typy trendů
125 Lineární trend s prognózou Pohyb cen akcí VW s porgnózováním lineární trend y = 0, ,6 R² = 0,3956 Pohyb cen akcí VW Линейная (Pohyb cen akcí VW)
126 Další trendové křivky Pohyb cen akcí VW s porgnózováním y = 2E , ,84-1E+07 R² = 0,5399 y = 0, ,6 R² = 0,3956 Pohyb cen akcí VW Линейная (Pohyb cen akcí VW) Полиномиальная (Pohyb cen akcí VW)
127 Příklad
128 Výsledek
129
130 Klouzavé průměry
131
132
133 Praktické využití klouzavých průměrů 170 Price VW zkrácená řada každá třetí Price VW zkrácená řada každá třetí Klouzavý průměr 5
134 Trendová analýza na finančním trhu Býčí a medvědí trend na finančním trhu: Klouzavé průměr y 5 10 období nebo 12-24
135 Skutečné prodeje 180 Prodej akcí VW Price VW Volume
136 4. Indení analýza
137
138 Indení analýza Inde bezrozměrné číslo vyjadřující změnu sledovaného ukazatele mezi dvěma obdobími nebo místech srovnání v relativním vyjádření I Diference absolutní rozdíl, číslo vyjadřující změnu sledovaného ukazatele mezi dvěma obdobími nebo místech srovnání (ve stejných měrných jednotkách jako sledovaný ukazatel) Δ bazický inde versus řetězový inde individuální indey souhrnné (cenové a množstevní) jednoduché (p,q,q) a složené (Σq,ΣQ,ppr) Paascheho, Laspeyresův, Fisherův inde
139
140
141
142
143 Bazické a řetězové indey
144
145
146 Příklad
147 Řešení
148
149 Souhrnné indey
150 Objemové indey
151 Příklad
152 Řešení
153 5. Demografie
154 Demografická struktura
155
156
157 Pohyb obyvatel
158
159 Zahraniční a vnitřní migrace
160
161
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
Základní statistické charakteristiky
Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické
Popisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
marek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
Číselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
Praktická statistika. Petr Ponížil Eva Kutálková
Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo
Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1
Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud
23. Matematická statistika
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Číselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
Mnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7
Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru
Náhodná veličina a rozdělení pravděpodobnosti
3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro
STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE
STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí
Základy pravděpodobnosti a statistiky. Popisná statistika
Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Základní statistické pojmy
POPISNÁ STATISTIKA Základní statistické pojmy Jev hromadný Hromadná pozorování výsledek hromadný jev soustředění se na určitou vlastnost(i) ukáže po více pokusech Zjistit souvislosti v prostoru a čase
Mnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Základy biostatistiky
Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace
Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
Metodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
Předmět studia: Ekonomická statistika a analytické metody I, II
Předmět studia: Ekonomická statistika a analytické metody I, II Typ a zařazení předmětu: povinný předmět bakalářského studia, 1. ročník Rozsah předmětu: 2 semestry, celkem 24/0 hodin v kombinované formě
Renáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně
STATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =
Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní
Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.
Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1
3. charakteristiky charakteristiky 1 charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme charakteristiky 2 charakteristiky Dva hlavní
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka
2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:
Vybraná rozdělení náhodné veličiny
3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.
Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP
IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost
Popisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Popisná statistika. Jaroslav MAREK. Univerzita Palackého
Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.
Metody sociálních výzkumů Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Statistika Význam slova-vychází ze slova stát, s jeho administrativou
Statistika I (KMI/PSTAT)
Statistika I (KMI/PSTAT) Cvičení druhé aneb Kvantily, distribuční funkce Statistika I (KMI/PSTAT) 1 / 1 Co se dnes naučíme Po absolvování této hodiny byste měli být schopni: rozumět pojmu modus (modální
Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
Informační technologie a statistika 1
Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Vybrané statistické metody. You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.
Vybrané statistické metody Analýza časových řad Statistická řada je posloupnost hodnot znaku, které jsou určitým způsobem uspořádány. Je-li toto uspořádání realizováno na základě časového sledu hodnot
Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku
Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v
MATEMATIKA III V PŘÍKLADECH
VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 8 Statistický soubor s jedním argumentem Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola
I. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA
7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA Oblasti využití statistiky v medicíně Zvládání variability Variabilita: biologická, podmínek, měřících přístrojů - hodnocení variability, variabilita náhodná x nenáhodná
Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2
Statistika jako obor Statistika Statistika je vědní obor zabývající se zkoumáním jevů hromadného charakteru. Tím se myslí to, že zkoumaný jev musí příslušet určité části velkého množství objektů (lidí,
p(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT
EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka
Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník a oktáva 3 hodiny týdně PC a dataprojektor, učebnice
Statistika pro gymnázia
Statistika pro gymnázia Pracovní verze učebního textu ZÁKLADNÍ POJMY Statistika zkoumá jevy (společenské, přírodní, technické) ve velkých statistických souborech. Prvky statistických souborů se nazývají
Jevy a náhodná veličina
Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili
Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák
Základy statistického hodnocení výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý)
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Diskrétní náhodná veličina
Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci
Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)
Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY) Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky
Pravděpodobnost a statistika
Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo
Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
Charakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Základní pojmy a cíle statistiky Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Statistika Pojmy a cíle
Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Téma 2: Pravděpodobnostní vyjádření náhodných veličin
0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník
Kontingenční tabulky v Excelu. Představení programu Statistica
ASTAc/01 Biostatistika 2. cvičení Kontingenční tabulky v Excelu Základní popisné statistiky Představení programu Statistica Import a základní popis dat ve Statistice, M. Cvanová I. Kontingenční tabulky
STATISTICKÉ METODY. (kombinovaná forma, 8.4., 20.5. 2012) Matěj Bulant, Ph.D., VŠEM
STATISTICKÉ METODY A DEMOGRAFIE (kombinovaná forma, 8.4., 2.5. 22) Matěj Bulant, Ph.D., VŠEM Řekli o statistice Věřím ouze těm statistikám, které jsem sám zfalšoval. Tři stuně lži - lež, hnusná lež, statistika.
Základy popisné statistiky
Základy popisné statistiky V této kapitole se seznámíme se základy popisné statistiky, představíme si základní pojmy a budeme si je ilustrovat na praktických příkladech. Kapitola je psána formou volného
Statistika. zpracování statistického souboru
Statistika zpracování statistického souboru statistický soubor zkoumaná skupina znaky zkoumané informace 1 vyjádřen číslem a jednotkou = kvantitativní znak 2 není = kvalitativní znak statistická jednotka
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis
mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.
Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.
PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.
Metodický list č 1. Název tématického celku: Elementární statistické zpracování 1 - Kolekce a interpretace statistických dat, základní pojmy deskriptivní statistiky. Cíl: Základním cílem tohoto tematického
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,
Téma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené