8 Průzkumová analýza dat
|
|
- Kristina Slavíková
- před 8 lety
- Počet zobrazení:
Transkript
1 8 Průzkumová aalýza dat Cílem průzkumové aalýzy dat (také zámé pod zkratkou EDA - z aglického ázvu exploratory data aalysis) je alezeí zvláštostí statistického chováí dat a ověřeí jejich předpokladů pro ásledé statistické zpracováí (MELOUN - MILIT- KÝ 1994). Proč tyto vlastosti potřebujeme zkoumat? Většia běžě používaých statistických metod předpokládá určité vlastosti zpracovávaých souborů ebo výběrů, ejdůležitější z ich jsou ásledující: miimálí rozsah výběru, ormalita (tj. splěí předpokladu, že výběr pochází ze základího souboru s ormálím rozděleím), abseci silě vychýleých hodot, vzájemá ezávislost prvků výběru. Splěí těchto podmíek podmiňuje použití ejzámějších a ejpoužívaějších statistických charakteristik, tzv. mometových aritmetického průměru, rozptylu, směrodaté odchylky, koeficietů špičatosti a šikmosti. Pouhé okulárí posouzeí - zvláště u velkých souborů dat - eí průkazé a mohdy ai techicky možé. Grafické a početí metody průzkumové aalýzy dat mohou rozhodováí o splěí růzých předpokladů objektivizovat. Mohé soubory měřeých dat jsou zcela uikátí a často elze (jak z techických, tak i z ekoomických důvodů) měřeí opakovat ebo doplit. V těchto případech ám průzkumová aalýza dat může poskytout velmi ceé iformace ještě před provedeím vlastí statistické aalýzy, upozorit a možé problémy a pomoci při volbě ejvhodějších metod zpracováí (eboť i statistická aalýza stojí čas a peíze - a v eposledí řadě začou práci - a chybě staoveé metody aalýzy ebo její esprávé provedeí může mohdy zcela zehodotit důležitý a ákladý výzkumý ebo komerčí projekt). Průzkumová aalýza dat je relativě moderí statistickou disciplíou, jejíž rozvoj je spoje s rozšířeím výpočetí techiky. Většia postupů průzkumové aalýzy dat je totiž založea a grafických metodách, které je možé efektivě provádět je s použitím speciálích statistických programů. Výhodou těchto metod (oproti metodám početím) je jejich ázorost, relativí evýhodou je utost určité zkušeosti při jejich iterpretaci. Proto je ejvhodější kombiovat početí (testy) a grafické metody. Průzkumová aalýza dat využívá především robustích kvatilových charakteristik (o ich podroběji v kapitole 4.1 v I. dílu). Základem pro kostrukci kvatilových charakteristik je pořádková statistika, což jsou vzestupě uspořádaé prvky souboru x (1) x () x (). Pokud budou v dalším textu idexy ozačující jedotlivé prvky v závorce - x (1) - bude se jedat o pořádkovou statistiku. Z takto upraveého souboru je možé kostruovat kvatilové charakteristiky. Obecě platí, že středí hodota i-té pořádkové statistiky je rova 100P i procetímu kvatilu, což je hodota pod kterou leží 100P i procet prvků souboru. Určitým kvatilem je tedy každý prvek souboru. Hodota P i se azývá pořadová pravděpodobost. Obecě se P i staoví takto 1
2 i P i. 1 Pro účely průzkumové aalýzy dat se obvykle P i volí (MELOUN - MILITKÝ 1994) 1 i P 3 i 1 3 V průzkumové aalýze dat se používá vybraých kvatilů pro pořadové pravděpodobosti P i = -i pro i = 1,, 3, 4. Vzhledem k tomu, že se tyto vybraé kvatily obvykle ozačují písmey, azývají se písmeové hodoty. Jejich přehled je v tabulce 8.1. i i-tý kvatil P i Písmeo 1 mediá -1 = 1/ M kvartily - = 1/4 F 3 oktily -3 = 1/8 E 4 sedecily -4 = 1/16 D Tabulka Přehled základích kvatilů používaých v průzkumové aalýze dat a jejich písmeové ekvivalety Pro odhad písmeových hodot se používá techika pořadí a hloubek. Každá z uspořádaých hodot x (i) je určea trojicí {K i, R i, H i }, kde je K i = i rostoucí pořadí (pořadové číslo pořádkové statistiky počítaé od ejmešího prvku); R i = i klesající pořadí (kde je celkový počet prvků); H i = mi{ K i, R i } hloubka pořádkové statistiky (je to meší z hodot K i, R i ). Potom platí, že hloubka mediáu je 1 H M. Pokud tato hodota eí celé číslo, provádí se lieárí iterpolace mezi dvěma prostředími prvky souboru. Hloubky dolích písmeových hodot jsou 1 it(hl1) HL, kde L je obecé ozačeí kvatilu (L = M, F, E, D), it (x) je celočíselá část x. Ozačeí L - 1 začí vždy předchozí kvatil, tj. D - 1 = E, E - 1 = F, F - 1 = M. Pokud je H L celé číslo, potom platí, že dolí kvatil se rová LD x(h L ) a horí kvatil L x H ( 1H L )
3 Příklad 8.1 Vyčíslete písmeové hodoty pro zadaou číselou řadu o 19 prvcích. x (i) R i K i H i Tabulka 8. - Metoda pořadí a hloubek V tabulce 8. jsou vyčísley hodoty pořádkové statistiky, rostoucího a klesajícího pořadí a hloubky pro jedoduchou číselou řadu čísel Vidíme, že ejvětší hloubku (10) má prostředí prvek souboru - mediá. Jeho hloubka je (19 + 1)/ = 10. Ostatí kvatily se získají podle výše uvedeých vzorců. Např. pro kvartil platí - (1 + 10)/ = 5,5, tj. musíme iterpolovat mezi 5. a 6. prvkem. To je hodota dolího kvartilu, horí kvartil je rove ,5 = 14,5, tj. iterpolujeme mezi 14. a 15. prvkem. Podobě vypočítáme oktil s použitím hloubky kvartilu a sedecil s využitím hloubky oktilu. Tabulka 8.3 uvádí příslušé písmeové hodoty. Kvatil Dolí kvatil Horí kvatil Mediá - M Kvartil - F Oktil - E Sedecil - D Tabulka Hodoty písmeových hodot pro zadaou číselou řadu 8.1 Základí grafické metody průzkumové aalýzy dat Mezi základí úkoly průzkumové aalýzy dat patří posouzeí: stupě symetrie a špičatosti rozděleí, lokálích kocetrací dat, vybočujících měřeí, shody s teoretickým rozděleím (zpravidla s ormálím). Nejběžějšími prostředky pro splěí těchto úkolů jsou speciálí grafické metody, především diagram rozptýleí, rozmítutý diagram rozptýleí, krabicový graf, vrubový krabicový graf, graf hustoty pravděpodobosti, graf rozptýleí s kvatily. 3
4 Grafické metody mají oproti početím testům (apř. testům ormality, ezávislosti, apod.) určité výhody i evýhody. Na jedé straě edávají jedozačé rozhodutí o přijetí ebo odmítutí určité hypotézy jako testy, o míře esouladu s teoretickým rozděleím musí rozhodout aalytik a základě svých zalostí, ale a druhé straě jejich rozborem je možé postihout příčiy esouladu s určitým rozděleím (apř. vliv šikmosti, špičatosti, odlehlých hodot, je možé i detekovat směs více rozděleí apod.). Například při posuzováí ormality je statistický test a daé hladiě výzamosti průkazý, ale pouze ám zamíte ebo ezamíte ulovou hypotézu (tj. že výběr pochází ebo epochází z ormálího rozděleí), ale eaalyzuje příčiy. Vhodá grafická metoda průzkumové aalýzy dat - v tomto případě apř. kvatilový ebo rakitový graf - takto jedozačou iformaci eposkyte (o míře ormality musí rozhodout hodotitel), ale a druhé straě poskyte moho iformací o možých příčiách eormality (apř. vybočující měřeí, šikmost apod.).uvádí se také (ME- LOUN - MILITKÝ 1994), že grafické metody jsou citlivější, přísější, ež obvykle používaé testy, kde jejich schopost detekce závisí především a síle testu. Proto se doporučuje při posuzováí výběrů pomocí grafických metod průzkumové aalýzy dat obě skupiy metod kombiovat a závěry dělat až a základě posouzeí výsledků obou skupi Graf rozptýleí je v podstatě vyeseí hodot souboru a číselou osu. I takto jedoduché grafické zázorěí má daleko vyšší vypovídací hodotu ež pouhá řada čísel. Je možé rychle odhalit lokálí kocetrace dat (velké akupeí hodot v určitém úseku číselé osy) a podezřelé vybočující hodoty (extrémě ízké ebo vysoké). Grafické schéma je a obrázku 8.1. Rozmítutý graf rozptýleí je podobý jako předchozí a má i stejé použití. Body jsou však pomocí geerátoru áhodých čísel ve vhodém měřítku rozhozey ve směru osy Y, aby v místech s velkou kocetrací hodot edocházelo k jejich splýváí. Grafické schéma je a obrázku 8.1. Obrázek 8.1 Schéma grafu rozptýleí a rozmítutého grafu rozptýleí. 4
5 8.1. Krabicový graf je jedím z ejběžějších způsobů grafického zázorěí dat. Je součástí většiy moderích statistických programů. Také se ěkdy můžeme setkat s ázvem vousatá krabička (z agl. ázvu box ad whisker plot ). Umožňuje především zázorěí robustího odhadu polohy mediáu, posouzeí symetrie rozděleí, idetifikaci podezřelých odlehlých měřeí. Jeho základem je obdélík s vhodě zvoleou šířkou a délkou rovou iterkvartilovému rozpětí R F = F H - F D (tj. rozdílu horího a dolího kvartilu). Uvitř obdélíku ( krabičky ) je čára představující polohu mediáu M. Od obou protilehlých stra obdélíku pokračují úsečky ( vousy ), které jsou ukočey přilehlými hodotami - horí B PH a dolí B PD. Přilehlé hodoty jsou ty prvky souboru, které leží ejblíže vitřích hradeb souboru - dolí hraice hradby B D a horí hraice B H. Tyto hodoty se vypočítají B H = F H + 1.5R F, resp. B D = F D - 1.5R F. Samoté vitří hradby ejsou v grafu zpravidla zázorěy. Kocové body úseček jsou tedy ejmeší a ejvyšší bezproblémové hodoty souboru. Body ležící mimo vitří hradby jsou považováy za podezřelé (odlehlé, vybočující) a jsou graficky zázorěy (křížky, kolečky apod.) v příslušých vzdáleostech. Grafické schéma je a obrázku Vrubový krabicový graf je variatou předchozího grafu. Na krabičce se vytvoří zářez, jehož šířka je rova itervalu spolehlivosti mediáu (dolí hraice I D, horí hraice I H ). Hraice se vypočítají podle vzorců 1,57 R F 1,57 R F IH M ID M Ostatí charakteristiky jsou stejé jako u krabicového grafu. Grafické schéma je a obrázku 8.. Obrázek 8. - Obecé schéma krabicového (a) a vrubového krabicového grafu. (b). Nahoře je pro srováí diagram rozptýleí s vyzačeými důležitými body pro kostrukci krabicových grafů. Prázdými kolečky jsou vyzačea vybočující měřeí. Symboly: M- mediá, F D(H) dolí 5
6 (horí) kvartil, I D(H) dolí (horí) hraice itervalu spolehlivosti mediáu, B D(H) dolí(horí) vitří hradba souboru (podle MELOUN - MILITKÝ 1994) Graf rozptýleí s kvatily je jede z ejuiverzálějších a také ejpoužívaějších průzkumových grafů. Na ose X se vyáší pořadová pravděpodobost, a ose Y pořádková statistika. Základí tvar grafu vzike spojeím bodů {P i, x (i) }lieárími úseky. Základí tvar pro ormálí rozděleí je sigmoidálí, ejprve kokáví, potom kovexí. Ke zvýšeí přehledosti a vypovídací schoposti grafu se zakreslují kvatilové obdélíky (pro kvartil, oktil a sedecil) a poloha mediáu. Každý obdélík má a ose X souřadice daé hodotami dolího a horího příslušého kvatilu (kvartil 0.5 a 0.75; oktil 0.15 a a sedecil a ). Na ose Y jsou vyášey příslušé pořádkové statistiky (tedy vzestupě uspořádaé hodoty). Vodorové hray kvatilových obdélíků ám tedy a ose Y ukáží hodoty příslušých kvatilů. Bývá zde též zakresle mediá M včetě svého itervalu spolehlivosti. Pomocí grafu rozptýleí s kvatily se posuzuje zejméa: sešikmeost rozděleí, modalita (uimodálí - vícemodálí rozděleí), odlehlé hodoty. Sešikmeost rozděleí se posuzuje podle vzájemé polohy kvatilových obdélíků. Symetrické rozděleí je charakterizováo tím, že jedotlivé obdélíky jsou symetricky jede uvitř druhého. Nejlepší kotrola je podle vzdáleosti dolích a horích stra příslušých obdélíků. Pokud se jedá o výrazě levostraé rozděleí (sešikmeé k ižším hodotám), potom jsou vzdáleosti mezi dolími straami výrazě meší ež mezi horími straami. Je to způsobeo tím, že relativě stejý úsek souboru - apř. 5% hodot mezi dolím kvartilem a mediáem - je kocetrová do mešího rozpětí hodot a ose Y. U pravostraého rozděleí je situace opačá - meší vzdáleosti jsou mezi horími straami obdélíků. Modus (ejčastěji se vyskytující hodota v souboru) se pozá podle toho, že a kvatilové fukci je vytvoře schod - úsek rovoběžý s osou X. Je to způsobeo tím, že je zde kocetrováo více stejých hodot. Vícemodálí rozděleí mají takových stejých schodů ěkolik (ejpočetější výskyt v souboru má více hodot). Odlehlé hodoty idetifikujeme tak, že a kvatilové fukci se projeví a pravém koci áhlý vzrůst (ebo pokles a levém koci). Grafické schéma je a obrázku
7 Obrázek Obecé schéma grafu rozptýleí s kvatily a jeho srováí s grafem rozptýleí a krabicovým grafem. Vysvětleí symbolů viz v textu (podle MELOUN - MILITKÝ 1994) Kvatil kvatilový graf (Q-Q graf), ormálí pravděpodobostí graf Teto typ grafu porovává kvatily experimetálího a vybraého teoretického rozděleí (tedy vlastě vzestupě uspořádaé aměřeé hodoty a odpovídající hodoty staoveé pomocí příslušé pravděpodobostí fukce daého rozděleí). Jsou kostruováy tak, že pokud experimetálí rozděleí plě odpovídá teoretickému, potom je grafem přímka. Jakékoli odchylky od tohoto ideálího tvaru idikují odchylky od předpokládaého teoretického rozděleí. Q-Q graf lze sestrojit pro růzá rozděleí, pouze se jiak staovují příslušé hodoty a osách X a Y. Podroběji ke kostrukci Q-Q grafů pro vybraá zámá rozděleí viz apř. MELOUN - MILITKÝ Speciálím případem Q-Q grafu pro ormálí rozděleí je rakitový graf. Rakitový graf je kostruová tak, že a jedé ose jsou vyášey kvatily ormovaého ormálího rozděleí u Pi (to jsou tabelovaé hodoty ebo je možé je získat apř. v Excelu pomocí fukce NORMSINV) a a druhé ose pořádkové statistiky x (i). Pokud zkoumaé rozděleí skutečě odpovídá ormálímu, potom je grafem přímka. Ve statistických programech je obvykle pro srováí vykreslea srovávací přímka, a které by ležely všechy body v případě ideálí shody s ormálím rozděleím. Na základě typických tvarů sestrojeého grafu, které jsou schématicky uvedey a obrázku 8.4, je možé soudit a hlaví příčiy odchylky od ormality. Kromě těchto základích vzorů je možé také detekovat i jié případy, apř. silě odlehlá měřeí (odlehlý bod je daleko od ostatích, zpravidla mimo srovávací přímku) Graf hustoty pravděpodobosti Pojem hustoty pravděpodobosti záme již z I. dílu, z kapitoly o 5.3 o fukcích áhodých proměých. Víme tedy, že pro teoretická rozděleí je možé kostruovat tzv. frekvečí fukci, která se také azývá (v případě spojitých veliči) hustota pravděpodobosti. Tato fukce je velmi užitečá pro posouzeí rozložeí dat, pro detekci ehomogeity (výskyt více oblastí s vyšší kocetrací dat ebo odlehlých hodot) e- 7
8 bo sešikmeí (esouměrost) rozděleí. Z toho vyplývá, že kdybychom byli schopi sestrojit graf hustoty pravděpodobosti pro empirická data, porovat jej s příslušým teoretickým (obvykle ormálím) rozděleím, získali bychom velmi dobrý prostředek pro posouzeí odchylek od příslušého teoretického rozděleí. Sestrojit frekvečí fukci teoretického rozděleí je možé jako derivaci distribučí fukce. Jak ale tuto fukci sestrojit pro empirická data, u ichž žádou teoretickou fukci ezáme? Řešeí abízí techika azývaá jádrový odhad hustoty. Obrázek 8.4 Základí tvary odchylek od ormálího rozděleí v rakitovém grafu rozděleí ploché (a), špičaté (b), levostraě esouměré (c) a pravostraě esouměré (d). POZOR! Tato iterpretace platí pro uspořádáí os, které je uvedeo a obrázku. Pokud jsou osy přehozey (tj. a ose X jsou měřeé hodoty a a ose Y jsou očekávaé kvatily ormálího rozděleí) je iterpretace opačá!! Pricip metody je poměrě jedoduchý, matematické provedeí ale dost komplikovaé a její rutií užití je možé pouze s využitím specializovaých statistických programů. Vycházíme z ásledující myšleky: pro každou z N empirických hodot se sestrojí elemetárí křivka hustoty pravděpodobosti s plochou pod křivkou 1/N, která se azývá jádro. Toto jádro může mít teoreticky jakýkoli tvar, obvykle se používá frekvečí fukce ormálího rozděleí (Gaussova křivka). Tyto elemetárí křivky se sečtou a výsledkem je křivka, která určitým způsobem modeluje rozložeí empirických hodot. Pricip kostrukce je schématicky zázorě a obrázku 8.5. Je uté zdůrazit, že se jedá o odhad rozložeí hodot, eí to jedozačě determiovaá 8
9 křivka, kterou by bylo možé vyjádřit ějakým jedoduchým vzorcem. Výsledý tvar závisí především a dvou faktorech: tvaru jádra, šířce jádra. Tvar jádra může být v podstatě libovolý, obvykle se používá ormálí rozděleí. Velmi důležitá je šířka jádra (tj. šířka elemetárích fukcí sestrojeých kolem datových bodů). Pokud je šířka malá, vypadá výsledá křivka jako pohoří s moha štíty a eposkytuje iformaci o podstatých vlastostech daého rozděleí. Naopak velká šířka způsobí, že křivka je velmi hladká a výsledek z hlediska iterpretace je stejý ebo ještě horší ež v případě malého (úzkého) jádra. Správý odhad šířky jádra vyžaduje určitou zkušeost, a v případě, že máme možost šířku jádra volit, tak i experimetováí. Některé programy umožňují tuto volbu, jié se saží o optimálí odhad jádra a základě vestavěých (zpravidla iteračích) algoritmů, ale v obou případech si musíme uvědomit, že se jedá o odhad a výsledek eí zcela objektiví. I přes uvedeé edostatky je graf hustoty pravděpodobosti velmi oblíbeým diagostickým ástrojem, především pro možost rychlého a ázorého porováí empirických hodot s teoretickým rozděleím. Uvádí se empirické pravidlo (KUPKA 1997), že při dostatečé velikosti výběru (N > 50) dvě výrazá maxima a grafu hustoty pravděpodobosti svědčí o pravděpodobé ehomogeitě výběru a lze uvažovat o jeho rozděleí a dvě části. Výskyt velkého možství lokálích maxim svědčí obvykle o příliš úzkém jádru. Naproti tomu použití tohoto grafu má také svá omezeí. Nelze jej použít k odhadu kvatilů ebo ke kostrukci distribučí fukce. Statistické programy, pokud teto graf mají ve své výbavě, obvykle jej vykreslují ve srováí s ormálím rozděleím. Zájemci o matematickou formulaci kostrukce grafu, o postupy k vedoucí k určeí šířky jádra ajdou ejpoužívaější techiky apř. v MELOUN-MILITKÝ hustota pravděpodobosti jádra data empirické (aměřeé) hodoty Obrázek 8.5 Schéma kostrukce grafu hustoty pravděpodobosti. Výsledá součtová křivka je zázorěa tučě. 9
10 Proveďte průzkumovou aalýzu dat pro zadaé soubory pomocí grafických metod. Příklad 8. Pro ilustraci provedeí a iterpretace průzkumové aalýzy dat pomocí základích grafických metod byly geerováy 3 výběry - podle rovoměrého, ormálího a expoeciálího rozděleí. Rozděleí byla vybráa tak, že kromě základího statistického rozděleí (ormálího) se zde vyskytuje i rozděleí výrazě esymetrické (expoeciálí) a aopak rozděleí s velmi pravidelým rozložeím hodot v daém itervalu (rovoměré). Základí zadáí je v tabulce 8.4. Pro aplikaci průzkumové aalýzy dat je uté z prvotího zápisu udělat pořádkovou statistiku, tj. vzestupě uspořádaý výběr. Poté můžeme aplikovat výše popsaé základí grafické metody. Výsledek pro ormálí rozděleí je a obrázcích 8.6, 8.7, 8.8 a 8.9. Z grafu rozptýleí (tečkového grafu) a obrázku 8.6 vidíme, že daý výběr vykazuje určité lokálí kocetrace dat (skupiy ahloučeých bodů). V oblasti dolích hodot jsou dvě poměrě izolovaé hodoty, ale z krabicového grafu je zřejmé, že se zřejmě ejedá o vybočující (extrémí) hodoty, eboť pouze jeda vybočuje z vitřích hradeb souboru, a to velmi těsě. Srováí polohy mediáu a aritmetického průměru idikuje velmi dobrou shodu, což je typické právě pro ormálí rozděleí ebo symetrická rozděleí blízká ormálímu. Aalýza kvartilů ( krabičky ) azačuje, že daý výběr bude zřejmě velmi mírě pravostraý, eboť dolí část krabičky je o ěco delší ež horí, což zameá, že v úseku mezi mediáem a horím kvartilem (horí část krabičky) jsou data více kocetrováa ež v dolí části (tj. mezi mediáem a dolím kvartilem). Hodoty Krabicový graf pro ormálí rozděleí ormálí Obrázek 8.6 Krabicový graf a graf rozptýleí pro geerovaá data ormálího rozděleí. Popis jedotlivých prvků grafu je v textu. Krátká čárka ozačuje polohu aritmetického průměru. 10
11 K podobým závěrům můžeme dojít pomocí grafu rozptýleí s kvatily. Jedotlivé kvatilové obdélíky jsou v podstatě symetrické, což idikuje prakticky symetrické rozložeí bodů mezi jedotlivými výzamými kvatily. Čára spojující jedotlivé hodoty vykazuje určitou stupňovitost daou právě lokálími kocetracemi dat. Další dva grafy a obrázcích 8.8 a 8.9 umožňují kvalitě posoudit shodu s ormálím rozděleím. Kvatil-kvatilový graf vykazuje dobrou shodu, která je idikováa tím, že jedotlivé body (kvatily) leží velmi těsě kolem srovávací liie. Je uté si uvědomit, že ideálí shodu s přímkou edosáheme prakticky ikdy, jde v podstatě o míru těsosti, s jakou se měřeé (ebo v tomto případě geerovaé) hodoty přimykají srovávací liii. Větší odchylku vykazují pouze dvě ejižší hodoty, ale vzhledem k tomu, že výběr je dostatečě velký (50 hodot), zřejmě tato odchylka ebude mít větší vliv. Teto závěr potvrzuje i graf hustoty pravděpodobosti, kdy jádrový odhad hustoty empirické křivky (čárkovaě) se téměř shoduje s teoretickým průběhem ormálího rozděleí vypočítaého pomocí aritmetického průměru a směrodaté odchylky výběru. Potvrzuje předpoklad velmi míré špičatosti (empirická křivka je vyšší ež teoretická, což idikuje vyšší kocetraci hodot v oblasti tohoto vrcholu) a pravostraé esouměrosti (vrchol empirické křivky je mírě vpravo od teoretické křivky). Stejé výstupy byly vytvořey pro rovoměré rozděleí a obrázcích 8.10, 8.11, 8.1 a Pro rovoměré rozděleí je typické to, jak již ázev apovídá, že data jsou v podstatě stejoměrě rozdělea v daém itervalu (je to také symetrické rozděleí, od ormálího se liší tím, že v oblasti kolem středí hodoty edochází k vyšší kocetraci dat ež a okrajích rozděleí, jejich hustota je stále stejá). 11
12 Původí hodoty Pořádkové statistiky Rozděleí Norálí Expoeciálí Rovoměré Číslo prvku ormálí expoeciálí rovoměré Číslo prvku Hodota Číslo prvku Hodota Číslo prvku Hodota Tabulka 8.4- Geerovaá rozděleí pro ilustraci použití grafických metod průzkumové aalýzy dat 1
13 Obrázek 8.7 Graf rozptýleí s kvatily pro ormálí rozděleí Obrázek 8.8 Kvatil-kvatilový graf pro ormálí rozděleí 13
14 Obrázek 8.9 Graf hustoty pravděpodobosti pro ormálí rozděleí. Čárkovaá čára je jádrový odhad hustoty empirických hodot, plá čára je frekvečí fukce ormálího rozděleí. Tyto vlastosti jsou potvrzey také příslušými grafy. Na grafu rozptýleí (tečkovém) a krabicovém vidíme, že krabička je ve srováí s ormálím rozděleím poměrě dlouhá (to je právě idikace skutečosti, že kolem středí hodoty edochází k větší kocetraci dat, to potvrzuje i tečkový graf vedle). Také aritmetický průměr se velmi dobře shoduje s mediáem (hodoty prakticky splývají). Vzhledem ke začému iterkvartilovému rozpětí žádá hodota eleží mimo vitří hradby souboru. Teto typ krabicového grafu je typický pro plochá rozděleí, tj. pro taková, která evykazují výzamější kocetrace hodot. Výše uvedeé typické vlastosti rovoměrého rozděleí se a grafu rozptýleí s kvatily projeví tím, že kvatilové obdélíky a jsou skoro čtvercového tvaru a spojice empirických hodot je téměř přímka (oproti esovitému tvaru u ormálího rozděleí). Kvatil-kvatilový graf a graf hustoty pravděpodobosti také potvrzují typické vlastosti rovoměrého rozděleí a Q-Q grafu (obrázek 8.1 ) je patrý typický tvar pro ploché rozděleí (viz schématická zázorěí a obrázku 8.4 ). Také empirická křivka grafu hustoty pravděpodobosti ukazuje a ploché a víceméě souměré rozděleí (křivka je plošší ižší a širší, tj. má vyšší variabilitu, ež křivka ormálího rozděleí). Z obou obrázků je zřejmé, že rozdíly mezi rovoměrým a ormálím rozděleím ejsou velké a že modelováí takového rozděleí pomocí obvyklého ormálího rozděleí ve většiě případů vyhoví. 14
15 Krabicový graf pro rovomeré rozdeleí Hodoty Obrázek 8.10 Krabicový graf a diagram rozptýleí pro geerovaé rovoměré rozděleí Obrázek Graf rozptýleí s kvatily pro geerovaé rovoměré rozděleí 15
16 Obrázek 8.1 Kvatil-kvatilový graf pro rovoměré rozděleí Obrázek 8.13 Graf hustoty pravděpodobosti pro rovoměré rozděleí Posledím příkladem je expoeciálí rozděleí. Jeho grafické iterpretace jsou a obrázcích 8.14, 8.15, 8.16 a Je to typicky výrazě esouměré rozděleí, 16
17 což je ihed ázorě vidět z grafického zobrazeí a obrázcích 8.14 a Na diagramu rozptýleí (tečkový graf) vidíme, že většia hodot je kocetrováa v dolí části (oblast ižších hodot), jedá se tedy o výrazě levostraě esouměré rozděleí. O této skutečosti také svědčí výrazý rozdíl mezi mediáem a aritmetickým průměrem (krátká čárka). Na horí straě (vyšší hodoty) vidíme ěkolik hodot výrazě přesahujících vitří hradby souboru, přičemž by tyto hodoty musely být v případě kokrétích měřeí velmi pozorě posuzováy z hlediska jejich správosti a vypovídací schoposti. Na grafu rozptýleí s kvatily je levostraé sešikmeí vidět velmi ázorě: vzdáleosti mezi dolími a horími straami kvatilových obdélíků jsou začě odlišé - velká kocetrace ízkých hodot způsobuje, že dolí stray jsou u sebe velmi blízko, což je typické právě pro levostraou esouměrost. Také spojice empirických hodot vykazuje tvar typický pro levostraé rozděleí stejý jako a Q-Q grafu. Hodoty Krabicový graf pro expoeciálí rozdeleí Obrázek 8.14 Krabicový graf expoeciálího rozděleí Obrázek 8.15 Graf rozptýleí s kvatily pro expoeciálí rozděleí 17
18 Obrázek 8.16 Kvatil-kvatilový graf expoeciálího rozděleí Obrázek 8.17 Graf hustoty pravděpodobosti expoeciálího rozděleí Grafy shody s ormálím rozděleím potvrzují výrazou odchylku od ormálího rozděleí. Na kvatil-kvatilovém grafu sado rozezáme výrazé levostraé rozděleí (podle typického tvaru z obrázku 8.4 c). Stejý závěr potvrzuje obrázek 8.17, kde můžeme potvrdit levostraost a špičatost rozděleí. Tabulka 8.5 uvádí pro srováí základí statistické charakteristiky všech tří výběrů. Vidíme, že statistické charakteristiky dobře odpovídají předběžým závěrům, které jsme učiili a základě rozboru průzkumových grafů (ormálí rozděleí je mír- 18
19 ě pravostraé, rovoměré má vyšší variabilitu a je souměré, expoeciálí je silě levostraé s ejvyšší variabilitou daou odlehlými hodotami). Je to potvrzeí faktu, že z těchto relativě jedoduchých exploratorích grafů můžeme poměrě rychle a spolehlivě aalyzovat základí vlastosti posuzovaých výběrů. Charakteristika (bodové odhady základího souboru) Rozděleí ormálí rovoměré expoeciálí aritmetický průměr mediá rozptyl směrodatá odchylka koeficiet esouměrosti koeficiet špičatosti Tabulka 8.5 Statistické charakteristiky tří geerovaých rozděleí (koeficiet špičatosti pro ormálí rozděleí je rove 3, koeficiet esouměrosti ule) 8. Ověřeí předpokladů o datech Při použití obvyklých metod matematické statistiky (tedy pokud pracujeme s výběry) se zpravidla předpokládá, že se jedá o ezávislé áhodé veličiy pocházející z ormálího rozděleí a že výběr má dostatečý rozsah pro spolehlivý odhad parametrů a testováí hypotéz. Před provedeím vlastí statistické aalýzy bychom tedy měli ověřit ásledující vlastosti: dostatečý rozsah výběru, ezávislost prvků výběru, ormalitu výběru, homogeitu výběru Určeí miimálí velikosti výběru Základí postupy týkající se potřebé velikosti výběru byly uvedey v I. dílu, v kapitole a str Ověřeí ormality výběru Normalita výběrového rozděleí je jedím z ejdůležitějších předpokladů aalýzy dat, je a ěm založea většia obvykle používaých statistických metod, apř. 19
20 metody korelačí a regresí aalýzy, mohé testy apod. Pokud eí ormalita výběru prokázáa, je uto hlouběji aalyzovat data a pokusit se zjistit příčiy. Data, u kterých se ormalita eprokázala, je možé také aalyzovat (zpravidla speciálími ebo modifikovaými metodami) ebo je možé data přiblížit ormalitě pomocí tzv. trasformace. Grafické metody posouzeí ormality jsme probrali v předchozí kapitole (je to především kvatil-kvatilový, resp. rakitový graf a dále graf hustoty pravděpodobosti). Kromě toho existuje ještě celá řada testů ormality. Jede z ich je uvede v 1. dílu a straě 115 (kapitola ). Kromě ěho se často používají apř. Shapiro- Wilkův, D Agostiův omibus test, dále Aderso Darligův, Jarque Berův, Kolmogorov- Smirovův test a další. Uvedeme ještě dva testy, které jsou často používáy ve statistických programech, a to D Agostiův omibus test a Shapiro-Wilkův test.. D Agostiův omibus test (test kombiace výběrové šikmosti a špičatosti) (MELOUN - MILITKÝ 1994) Pro reálé velikosti výběrů se používá testovací statistika C Z (g1) Z (g ) kde hodoty Z ( g 1 ) a Z ( g ) jsou ormálí aproximace výběrové šikmosti, resp. špičatosti. Pro výpočet Z ( g 1 ) potřebujeme vypočítat ásledující pomocé veličiy: Y g ( ) G 3( 7 70)( 1)( 3) ( )( 5)( 7)( 9) W 1 G 1 A W 1 Z těchto pomocých veliči se určí aproximace 1 Y Y Z(g 1 ) l 1 l W A A Pro výpočet ormálí aproximace špičatosti vypočítáme veličiu S pomocí vztahu g E(g ) S D(g ) kde je g vypočítaá výběrová špičatost 0
21 E(g ) středí hodota výběrové špičatosti, která se pro ormálí rozděleí vypočítá podle vzorce 6 E(g ) 3 1 D(g ) je rozptyl výběrové špičatosti vypočítaý podle vzorce 4( )( 3) D(g ). ( 1) ( 3)( 5) Dále se vypočítá šikmost veličiy S 6( 5 ) 6( 3)( 5) g1(s) ( 7)( 9) ( )( 3) a pomocá hodota 8 4 A 6 1, g1(s) g1(s) g1 (S) Aproximace špičatosti se vypočítá 1 Z(g ) 9A 3 1 A 1 S A 4 Pokud zkoumaý výběr pochází z ormálího rozděleí, potom statistika C má rozděleí se dvěma stupi volosti. Teto test je považová za velmi silý. Má výhodu v tom, že pomocí ěho lze odděleě testovat samostaté hypotézy o vlivu šikmosti ebo špičatosti a ormalitu, resp. eormalitu výběru. Aproximace Z ( g 1 ) a Z ( g ) tedy lze použít jako samostaté testovací statistiky. V těchto případech mají obě aproximace ormovaé ormálí rozděleí N (0,1). Vzhledem k relativě zdlouhavému výpočtu se doporučuje pro použití tohoto testu vypracovat jedoduchý program, který vypočítá hodotu C i hodoty obou aproximací. Pokud alespoň jeda z aproximací evyhovuje ormalitě, je celé rozděleí považováo za statisticky výzamě odlišé od ormálího. Shapiro Wilkův test Teto test byl odvoze pro meší výběry (doporučeý rozsah výběru 3 50 prvků). Testové kritérium je W N i1 9A xi x i1 a i x (i) 1
Deskriptivní statistika 1
Deskriptiví statistika 1 1 Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 1145/2004. Základí charakteristiky souboru Pro lepší představu používáme k popisu vlastostí zkoumaého jevu určité charakteristiky
Více6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.
6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola
Více1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL
Elea Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy POPISNÁ STATISTIKA V PROGRAMU MS EXCEL RYCHLÝ NÁHLED KAPITOLY Žádý výzkum se v deší době evyhe statistickému zpracováí dat. Je jedo,
Více12. N á h o d n ý v ý b ě r
12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých
VícePravděpodobnost a aplikovaná statistika
Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017 Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí
VíceVYSOCE PŘESNÉ METODY OBRÁBĚNÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojího ižeýrství Ústav strojíreské techologie ISBN 978-80-214-4352-5 VYSOCE PŘESNÉ METODY OBRÁBĚNÍ doc. Ig. Jaroslav PROKOP, CSc. 1 1 Fakulta strojího ižeýrství,
VíceOdhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:
Odhady parametrů polohy a rozptýleí pro často se vyskytující rozděleí dat v laboratoři se vyčíslují podle ásledujících vztahů: a : Laplaceovo (oboustraé expoeciálí rozděleí se vyskytuje v případech, kdy
VíceOdhady parametrů 1. Odhady parametrů
Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě:
VíceNáhodný výběr 1. Náhodný výběr
Náhodý výběr 1 Náhodý výběr Matematická statistika poskytuje metody pro popis veliči áhodého charakteru pomocí jejich pozorovaých hodot, přesěji řečeo jde o určeí důležitých vlastostí rozděleí pravděpodobosti
VíceZáklady statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková
Základy statistiky Zpracováí pokusých dat Praktické příklady Kristia Somerlíková Data v biologii Zak ebo skupia zaků popisuje přírodí jevy, úlohou výzkumíka je vybrat takovou skupiu zaků, které charakterizují
Víceveličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou
1 Zápis číselých hodot a ejistoty měřeí Zápis číselých hodot Naměřeé hodoty zapisujeme jako číselý údaj s určitým koečým počtem číslic. Očekáváme, že všechy zapsaé číslice jsou správé a vyjadřují tak i
VíceSTATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson
STATISTIKA Statistika se těší pochybému vyzameáí tím, že je ejvíce epochopeým vědím oborem. H. Leviso Charakterizace statistického souboru Statistický soubor Prvek souboru Zak prvku kvatitativí teplota,
VícePravděpodobnostní modely
Pravděpodobostí modely Meu: QCEpert Pravděpodobostí modely Modul hledá metodou maimálí věrohodosti (MLE Maimum Likelihood Estimate) statistický model (rozděleí) který ejlépe popisuje data. Je přitom k
Více13 Popisná statistika
13 Popisá statistika 13.1 Jedorozměrý statistický soubor Statistický soubor je možia všech prvků, které jsou předmětem statistického zkoumáí. Každý z prvků je statistickou jedotkou. Prvky tvořící statistický
VíceZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)
ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU) Základy teorie pravděpodobosti měřeí chyba měřeí Provádíme kvalifikovaý odhad áhodá systematická výsledek ejistota výsledku Základy teorie pravděpodobosti
VíceREGRESNÍ DIAGNOSTIKA. Regresní diagnostika
4.11.011 REGRESNÍ DIAGNOSTIKA Chemometrie I, David MILDE Regresí diagostika Obsahuje postupy k posouzeí: kvality dat pro regresí model (přítomost vlivých bodů), kvality modelu pro daá data, splěí předpokladů
VíceP2: Statistické zpracování dat
P: Statistické zpracováí dat Úvodem - Statistika: věda, zabývající se shromažďováím, tříděím a ásledým popisem velkých datových souborů. - Základem statistiky je teorie pravděpodobosti, založeá a popisu
VíceNEPARAMETRICKÉ METODY
NEPARAMETRICKÉ METODY Jsou to metody, dy předmětem testu hypotézy eí tvrzeí o hodotě parametru ějaého orétího rozděleí, ale ulová hypotéza je formulováa obecěji, apř. jao shoda rozděleí ebo ezávislost
VíceUPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ
3..- 4.. 2009 DIVYP Bro, s.r.o., Filipova, 635 00 Bro, http://www.divypbro.cz UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ autoři: prof. Ig. Mila Holický, PhD., DrSc., Ig. Karel Jug, Ph.D., doc. Ig. Jaa Marková,
VíceMezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.
ováí - Hru IV /6 ováí Hru IV Mila RůžR ůžička, Josef Jureka,, Zbyěk k Hrubý zbyek.hruby hruby@fs.cvut.cz ováí - Hru IV /6 ravděpodobostí úavové diagramy s uvažováím předpětí R - plocha ve čtyřrozměrém
VíceCvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu
Cvičeí 6: Výpočet středí hodoty a rozptylu, bodové a itervalové odhady středí hodoty a rozptylu Příklad 1: Postupě se zkouší spolehlivost čtyř přístrojů Další se zkouší je tehdy, když předchozí je spolehlivý
Víceodhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.
10 Cvičeí 10 Statistický soubor. Náhodý výběr a výběrové statistiky aritmetický průměr, geometrický průměr, výběrový rozptyl,...). Bodové odhady parametrů. Itervalové odhady parametrů. Jedostraé a oboustraé
VíceZávislost slovních znaků
Závislost slovích zaků Závislost slovích (kvalitativích) zaků Obměy slovího zaku Alterativí zaky Možé zaky Tříděí věcé sloví řady: seřazeí obmě je subjektiví záležitostí (podle abecedy), možé i objektiví
VícePro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).
STATISTIKA Statistické šetřeí Proveďte a vyhodoťte statistické šetřeí:. Zvolte si statistický soubor. 2. Zvolte si určitý zak (zaky), které budete vyhodocovat. 3. Určete absolutí a relativí četosti zaků,
Více2 STEJNORODOST BETONU KONSTRUKCE
STEJNORODOST BETONU KONSTRUKCE Cíl kapitoly a časová áročost studia V této kapitole se sezámíte s možostmi hodoceí stejorodosti betou železobetoové kostrukce a prakticky provedete jede z možých způsobů
Vícei 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky
Téma 6.: Základí pojmy matematické statistiky Vlastosti důležitých statistik odvozeých z jedorozměrého áhodého výběru: Nechť X,..., X je áhodý výběr z rozložeí se středí hodotou μ, rozptylem σ a distribučí
VíceCvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu
Cvičeí 6: Bodové a itervalové odhady středí hodoty, rozptylu a koeficietu korelace, test hypotézy o středí hodotě při zámém rozptylu Příklad : Bylo zkoumáo 9 vzorků půdy s růzým obsahem fosforu (veličia
VíceTržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.
Techická aalýza Techická aalýza z vývoje cey a obchodovaých objemů akcie odvozuje odhad budoucího vývoje cey. Dalšími metodami odhadu vývoje ce akcií jsou apř. fudametálí aalýza (zkoumá podrobě účetictví
Více2. Náhodná veličina. je konečná nebo spočetná množina;
. Náhodá veličia Většia áhodých pokusů koaých v přírodích ebo společeských vědách má iterpretaci pomocí reálé hodoty. Při takovýchto dějích přiřazujeme tedy reálá čísla áhodým jevům. Proto je důležité
Více17. Statistické hypotézy parametrické testy
7. Statistické hypotézy parametrické testy V této části se budeme zabývat statistickými hypotézami, pomocí vyšetřujeme jedotlivé parametry populace. K takovýmto šetřeím většiou využíváme ám již dobře zámé
VícePravděpodobnost a aplikovaná statistika
Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 6. KAPITOLA CENTRÁLNÍ LIMITNÍ VĚTA 6.11.2017 Opakováí: Čebyševova erovost příklad Pravděpodobost vyrobeí zmetku je 0,5. Odhaděte pravděpodobost,
VíceMOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ
PŘÍSPĚVKY THE SCIENCE FOR POPULATION PROTECTION 0/008 MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ STATISTICAL ASSESSMENT
VíceIntervalové odhady parametrů některých rozdělení.
4. Itervalové odhady parametrů rozděleí. Jedou ze základích úloh mtematické statistiky je staoveí hodot parametrů rozděleí, ze kterého máme k dispozici áhodý výběr. Nejčastěji hledáme odhady dvou druhů:
Více1 ROVNOMĚRNOST BETONU KONSTRUKCE
ROVNOMĚRNOST BETONU KONSTRUKCE Cíl kapitoly a časová áročost studia V této kapitole se sezámíte s možostmi hodoceí rovoměrosti betou železobetoové kostrukce a prakticky provedete jede z možých způsobů
Více14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou
4. Testováí statistických hypotéz Úvod Při práci s daty se mohdy spokojujeme s itervalovým či bodovým odhadem parametrů populace. V mohých případech se však uchylujeme k jiému postupu, většiou jde o případy,
Více6. Posloupnosti a jejich limity, řady
Moderí techologie ve studiu aplikovaé fyziky CZ..07/..00/07.008 6. Poslouposti a jejich limity, řady Posloupost je speciálí, důležitý příklad fukce. Při praktickém měřeí hodot určité fyzikálí veličiy dostáváme
VícePravděpodobnostní model doby setrvání ministra školství ve funkci
Pravděpodobostí model doby setrváí miistra školství ve fukci Základí statistická iferece Data Zdro: http://www.msmt.cz/miisterstvo/miistri-skolstvi-od-roku-848. Ke statistickému zpracováí byla vzata pozorováí
VícePři sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací
3. Náhodý výběr Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých realizací
Více3. Lineární diferenciální rovnice úvod do teorie
3 338 8: Josef Hekrdla lieárí difereciálí rovice úvod do teorie 3 Lieárí difereciálí rovice úvod do teorie Defiice 3 (lieárí difereciálí rovice) Lieárí difereciálí rovice -tého řádu je rovice, která se
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Bodové a itervalové odhady Nechť X je áhodá proměá, která má distribučí fukci F(x, ϑ). Předpokládejme, že záme tvar distribučí fukce (víme jaké má rozděleí) a ezáme parametr
Více8. Analýza rozptylu.
8. Aalýza rozptylu. Lieárí model je popis závislosti, který je využívá v řadě disciplí matematické statistiky. Uvedeme jeho popis a tvrzeí, která budeme využívat. Setkáme se s ím jedak v aalýze rozptylu,
VícePopisná statistika. Zdeněk Janák 9. prosince 2007
Popisá statistika Zdeěk Jaák jaak@physics.mui.cz 9. prosice 007 Výsledkem měřeí atmosférické extikce z pozorováí komet a observatoři Skalaté Pleso jsou tyto hodoty extikčích koeficietů ve vlové délce 46
VíceÚloha II.S... odhadnutelná
Úloha II.S... odhadutelá 10 bodů; průměr 7,17; řešilo 35 studetů a) Zkuste vlastími slovy popsat, k čemu slouží itervalový odhad středí hodoty v ormálím rozděleí a uveďte jeho fyzikálí iterpretaci (postačí
Více1. Základy počtu pravděpodobnosti:
www.cz-milka.et. Základy počtu pravděpodobosti: Přehled pojmů Jev áhodý jev, který v závislosti a áhodě může, ale emusí při uskutečňováí daého komplexu podmíek astat. Náhoda souhr drobých, ezjistitelých
VícePravděpodobnost a aplikovaná statistika
Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 3. ÚKOL JB TEST 3. Úkol zadáí pro statistické testy U každého z ásledujících testů uveďte ázev (včetě autora), předpoklady použití, ulovou
VíceZákladní požadavky a pravidla měření
Základí požadavky a pravidla měřeí Základí požadavky pro správé měřeí jsou: bezpečost práce teoretické a praktické zalosti získaé přípravou a měřeí přesost a spolehlivost měřeí optimálí orgaizace průběhu
Více1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE
1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE V této kapitole se dozvíte: jak je axiomaticky defiová vektor a vektorový prostor včetě defiice sčítáí vektorů a ásobeí vektorů skalárem;
VíceMATICOVÉ HRY MATICOVÝCH HER
MATICOVÉ HRY FORMULACE, KONCEPCE ŘEŠENÍ, SMÍŠENÉ ROZŠÍŘENÍ MATICOVÝCH HER, ZÁKLADNÍ VĚTA MATICOVÝCH HER CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ? Teorie her je ekoomická vědí disciplía, která se zabývá studiem
VícePopisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem
Popisá statistika - zavedeí pojmů Popisá statistika - zavedeí pojmů Soubor idividuálích údajů o objektech azýváme základí soubor ebo také populace. Zkoumaé objekty jsou tzv. statistické jedotky a sledujeme
VíceParametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti
1 Základí statistické zpracováí dat 1.1 Základí pojmy Populace (základí soubor) je soubor objektů (statistických jedotek), který je vymeze jejich výčtem ebo charakterizací jejich vlastostí, může být proto
Vícezákladním prvkem teorie křivek v počítačové grafice křivky polynomiální n
Petra Suryková Modelováí křivek základím prvkem teorie křivek v počítačové grafice křivky polyomiálí Q( t) a a t... a t polyomiálí křivky můžeme sado vyčíslit sado diferecovatelé lze z ich skládat křivky
VíceVzorový příklad na rozhodování BPH_ZMAN
Vzorový příklad a rozhodováí BPH_ZMAN Základí charakteristiky a začeí symbol verbálí vyjádřeí iterval C g g-tý cíl g = 1,.. s V i i-tá variata i = 1,.. m K j j-té kriterium j = 1,.. v j x ij u ij váha
VíceIAJCE Přednáška č. 12
Složitost je úvod do problematiky Úvod praktická realizace algoritmu = omezeí zejméa: o časem o velikostí paměti složitost = vztah daého algoritmu k daým prostředkům: časová složitost každé možiě vstupích
VíceVaR analýza citlivosti, korekce
VŠB-TU Ostrava, Ekoomická fakulta, katedra fiací.-. září 008 VaR aalýza citlivosti, korekce Fratišek Vávra, Pavel Nový Abstrakt Práce se zabývá rozbory citlivosti ěkterých postupů, zahrutých pod zkratkou
VíceElementární zpracování statistického souboru
Elemetárí zpracováí statistického souboru Obsah kapitoly 4. Elemetárí statistické zpracováí - parametrizace vhodými empirickými parametry Studijí cíle Naučit se výsledky měřeí parametrizovat vhodými empirickými
VíceOVMT Přesnost měření a teorie chyb
Přesost měřeí a teorie chyb Základí pojmy Naměřeé údaje ejsou ikdy absolutě přesé, protože skutečé podmíky pro měřeí se odlišují od ideálích. Při každém měřeí vzikají odchylky od správých hodot chyby.
Více8.2.1 Aritmetická posloupnost I
8.2. Aritmetická posloupost I Předpoklady: 80, 802, 803, 807 Pedagogická pozámka: V hodiě rozdělím třídu a dvě skupiy a každá z ich dělá jede z prvích dvou příkladů. Čley posloupostí pak při kotrole vypíšu
VícePřednáška VIII. Testování hypotéz o kvantitativních proměnných
Předáška VIII. Testováí hypotéz o kvatitativích proměých Úvodí pozámky Testy o parametrech rozděleí Testy o parametrech rozděleí Permutačí testy Opakováí hypotézy Co jsou to hypotézy a jak je staovujeme?
VíceTeorie chyb a vyrovnávací počet. Obsah:
Teorie chyb a vyrovávací počet Obsah: Testováí statistických hypotéz.... Ověřováí hypotézy o středí hodotě základího souboru s orálí rozděleí... 4. Ověřováí hypotézy o rozptylu v základí souboru s orálí
VíceLaboratorní práce č. 10 Úloha č. 9. Polarizace světla a Brownův pohyb:
ruhlář Michal 8.. 5 Laboratorí práce č. Úloha č. 9 Polarizace světla a Browův pohyb: ϕ p, C 4% 97,kPa Úkol: - Staovte polarizačí schopost daého polaroidu - Určete polarimetrem úhel stočeí kmitavé roviy
Vícevají statistické metody v biomedicíně
Statistika v biomedicísk ském m výzkumu a ve zdravotictví Prof. RNDr. Jaa Zvárov rová,, DrSc. EuroMISE Cetrum Ústav iformatiky AV ČR R v.v.i. Proč se používaj vají statistické metody v biomedicíě Biomedicísk
Vícevají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví
Statistika v biomedicísk ském výzkumu a ve zdravotictví Prof. RNDr. Jaa Zvárov rová,, DrSc. EuroMISE Cetrum Ústav iformatiky AV ČR R v.v.i. Literatura Edice Biomedicísk ská statistika vydáva vaá a Uiverzitě
VíceZhodnocení přesnosti měření
Zhodoceí přesosti měřeí 1. Chyby měřeí Měřeím emůžeme ikdy zjistit skutečou (pravou) hodotu s měřeé veličiy. To je způsobeo edokoalostí metod měřeí, měřicích přístrojů, lidských smyslů i proměých podmíek
Více6. P o p i s n á s t a t i s t i k a
6. P o p i s á s t a t i s t i k a 6.. Pozámka: Při statistickém zkoumáí ás zajímají hromadé jevy a procesy, u kterých zkoumáme zákoitosti, které se projevují u velkého počtu prvků. Prvky zkoumáí azýváme
VíceStatistika pro metrologii
Statistika pro metrologii T. Rössler Teto projekt je spolufiacová Evropským sociálím fodem a státím rozpočtem České republiky v rámci projektu Vzděláváí výzkumých pracovíků v Regioálím cetru pokročilých
Více} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy
Měřeí statistické závislosti, korelace, regrese Prof. RNDr. Jaa Zvárov rová,, DrSc. MĚŘENÍZÁVISLOSTI Cílem statistické aalýzy vepidemiologii bývá eje staovit, zda oemocěí závisí a výskytu rizikového faktoru,
VíceNejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A
Nejstoty měřeí Pro každé přesé měřeí potřebujeme formac s jakou přesostí bylo měřeí provedeo. Nejstota měřeí vyjadřuje terval ve kterém se achází skutečá hodota měřeé velčy s určtou pravděpodobostí. Nejstota
VícePřednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti
Předáška VI. Itervalové odhady Motivace Směrodatá odchylka a směrodatá chyba Cetrálí limití věta Itervaly spolehlivosti Opakováí estraé a MLE Jaký je pricip estraých odhadů? Jaký je pricip odhadů metodou
Více1.3. POLYNOMY. V této kapitole se dozvíte:
1.3. POLYNOMY V této kapitole se dozvíte: co rozumíme pod pojmem polyom ebo-li mohočle -tého stupě jak provádět základí početí úkoy s polyomy, kokrétě součet a rozdíl polyomů, ásobeí, umocňováí a děleí
VíceU klasifikace podle minimální vzdálenosti je nutno zvolit:
.3. Klasifikace podle miimálí vzdáleosti Tato podkapitola je věováa popisu podstaty klasifikace podle miimálí vzdáleosti, jež úzce souvisí s klasifikací pomocí etaloů klasifikačích tříd. Představíme si
VíceIntervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním
Lekce Itervalový odhad Itervalový odhad je jedou ze stadardích statistických techik Cílem je sestrojit iterval (kofidečí iterval, iterval spolehlivosti, který s vysokou a avíc předem daou pravděpodobostí
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Náhodá veličia Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 45/004. Náhodá veličia Většia áhodých pokusů má jako výsledky reálá čísla. Budeme tedy dále áhodou veličiou rozumět proměou, která
Více10.3 GEOMERTICKÝ PRŮMĚR
Středí hodoty, geometrický průměr Aleš Drobík straa 1 10.3 GEOMERTICKÝ PRŮMĚR V matematice se geometrický průměr prostý staoví obdobě jako aritmetický průměr prostý, pouze operace jsou o řád vyšší: místo
VíceÚloha III.S... limitní
Úloha III.S... limití 10 bodů; průměr 7,81; řešilo 6 studetů a) Zkuste vlastími slovy popsat postup kostrukce itervalových odhadů středí hodoty v případě obecého rozděleí měřeých dat (postačí vlastími
VíceMetody zkoumání závislosti numerických proměnných
Metody zkoumáí závslost umerckých proměých závslost pevá (fukčí) změě jedoho zaku jedozačě odpovídá změa druhého zaku (podle ějakého fukčího vztahu) (matematka, fyzka... statstcká (volá) změám jedé velčy
VíceKvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)
Kvatová a statistická fyzika (Termodyamika a statistická fyzika) Boltzmaovo - Gibbsovo rozděleí - ilustračí příklad Pro ilustraci odvozeí rozděleí eergií v kaoickém asámblu uvažujme ásledující příklad.
Více8. Základy statistiky. 8.1 Statistický soubor
8. Základy statistiky 7. ročík - 8. Základy statistiky Statistika je vědí obor, který se zabývá zpracováím hromadých jevů. Tvoří základ pro řadu procesů řízeí, rozhodováí a orgaizováí, protoţe a základě
VíceEKONOMETRIE 9. přednáška Zobecněný lineární regresní model
EKONOMETRIE 9. předáška Zobecěý lieárí regresí model Porušeí základích podmíek klasického modelu Metoda zobecěých emeších čtverců Jestliže sou porušey ěkteré podmíky klasického modelu. E(u),. E (uu`) σ
VíceTento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/
Teto projekt je spolufiacová Evropským sociálím fodem a Státím rozpočtem ČR IoBio CZ..07/2.2.00/28.008 Připravil: Ig. Vlastimil Vala, CSc. Metody zkoumáí ekoomických jevů Kapitola straa 3 Metoda Z řeckého
VícePevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.
evost a životost - Hr III EVNOT a ŽIVOTNOT Hr III Mila Růžička, Josef Jreka, Zbyěk Hrbý zbyek.hrby@fs.cvt.cz evost a životost - Hr III tatistické metody vyhodocováí dat evost a životost - Hr III 3 tatistické
VíceIntervalové odhady parametrů
Itervalové odhady parametrů Petr Pošík Části dokumetu jsou převzaty (i doslově) z Mirko Navara: Pravděpodobost a matematická statistika, https://cw.felk.cvut.cz/lib/ee/fetch.php/courses/a6m33ssl/pms_prit.pdf
VíceStatistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.
Statistika Cíle: Chápat pomy statistický soubor, rozsah souboru, statistická edotka, statistický zak, umět sestavit tabulku rozděleí četostí, umět zázorit spoicový diagram a sloupcový diagram / kruhový
Více9. Měření závislostí ve statistice Pevná a volná závislost
Dráha [m] 9. Měřeí závislostí ve statistice Měřeí závislostí ve statistice se zabývá především zkoumáím vzájemé závislosti statistických zaků vícerozměrých souborů. Závislosti přitom mohou být apříklad
VíceCo je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika
Co e to statistika? Statistické hodoceí výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Statistika e ako bikiy. Odhalí téměř vše, ale to edůležitěší ám zůstae skryto. (autor ezámý) Statistika uda e, má
VíceUžití binomické věty
9..9 Užití biomické věty Předpoklady: 98 Často ám z biomického rozvoje stačí pouze jede kokrétí čle. Př. : x Urči šestý čle biomického rozvoje xy + 4y. Získaý výraz uprav. Biomický rozvoj začíá: ( a +
VíceStatistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc
Statistika Statistické fukce v tabulkových kalkulátorech MSO Excel a OO.o Calc Základí pojmy tabulkových kalkulátorů Cílem eí vyložit pojmy tabulkových kalkulátorů, ale je defiovat pojmy vyskytující se
Více1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V
Předáška 1: Vektorové prostory Vektorový prostor Pro abstraktí defiici vektorového prostoru jsou podstaté vlastosti dvou operací, sčítáí vektorů a ásobeí vektoru (reálým číslem) Tyto dvě operace musí být
VíceIlustrativní příklad ke zkoušce z B_PS_A léto 2014.
Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95
Více1. Měření ve fyzice, soustava jednotek SI
1. Měřeí ve fyzice, soustava jedotek SI Fyzika je vědí obor, který zkoumá zákoitosti přírodích jevů. Pozámka: Získáváí pozatků ve fyzice: 1. pozorováí - sledováí určitého jevu v jeho přirozeých podmíkách,
Vícejako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých
9 Limití věty. V aplikacích teorie pravděpodobosti (matematická statistika, metody Mote Carlo se užívají tvrzeí vět o kovergeci posloupostí áhodých veliči. Podle povahy kovergece se limití věty teorie
VíceFUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL
Difereciálí počet fukcí jedé reálé proměé - 6. - PRVNÍ DIFERENCIÁL TAYLORŮV ROZVOJ FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL PŘÍKLAD Pomocí věty o prvím difereciálu ukažte že platí přibližá rovost
VíceMatematika I, část II
1. FUNKCE Průvodce studiem V deím životě, v přírodě, v techice a hlavě v matematice se eustále setkáváme s fukčími závislostmi jedé veličiy (apř. y) a druhé (apř. x). Tak apř. cea jízdeky druhé třídy osobího
VíceOdhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení
Odhad parametru p biomického rozděleí a test hypotézy o tomto parametru Test hypotézy o parametru p biomického rozděleí Motivačí úloha Předpokládejme, že v důsledku realizace jistého áhodého pokusu P dochází
Více1.7.4 Těžiště, rovnovážná poloha
74 ěžiště, rovovážá poloha Předpoklady: 00703 Př : Polož si sešit a jede prst tak, aby espadl Záleží a místě, pod kterým sešit podložíš? Proč? Musíme sešit podložit prstem přesě uprostřed, jiak spade Sešit
VíceL A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE KATED RA F YZIKY L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y Jméo TUREČEK Daiel Datum měřeí 8.11.2006 Stud. rok 2006/2007 Ročík 2. Datum odevzdáí 15.11.2006 Stud.
VíceDERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM
Difereciálí počet fukcí jedé reálé proměé - - DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ ÚVODNÍ POZNÁMKY I derivace podobě jako limity můžeme počítat ěkolikerým způsobem a to kokrétě pomocí: defiice vět o algebře
VíceNárodní informační středisko pro podporu jakosti
Národí iformačí středisko pro podpor jakosti Kozltačí středisko statistických metod při NIS-PJ Výpočet koeficietů reglačích diagramů pro obecé riziko Ig. Václav Chmelík, CSc Ústav strojíreské techologie,
Více2,3 ČTYŘI STANDARDNÍ METODY I, ČTYŘI STANDARDNÍ METODY II
2,3 ČTYŘI STADARDÍ METODY I, ČTYŘI STADARDÍ METODY II 1.1.1 Statické metody a) ARR - Average Rate of Retur průměrý ročí čistý zisk (po zdaěí) ARR *100 % ( 20 ) ivestic do projektu V čitateli výrazu ( 20
VíceMatematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti
Úvod Opakováí Poslouposti Příklady Matematika 1 Katedra matematiky, Fakulta stavebí ČVUT v Praze středa 10-11:40 posluchára D-1122 2012 / 13 Úvod Opakováí Poslouposti Příklady Úvod Opakováí Poslouposti
Více2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.
0. KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Dovedosti :. Chápat pojem faktoriál a ovládat operace s faktoriály.. Zát defiici kombiačího čísla a základí vlastosti kombiačích čísel. Ovládat jedoduché operace
Více