UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE

Rozměr: px
Začít zobrazení ze stránky:

Download "UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE"

Transkript

1 UNICORN COLLEGE Katedra ekonomiky a managementu BAKALÁŘSKÁ PRÁCE Aplikace statistických metod v analýze preferencí absolventů vysokých škol Autor BP: Ladislav STRATIL Vedoucí BP: doc. Ing. Dagmar Blatná, CSc Praha

2 Čestné prohlášení Prohlašuji, že jsem svou bakalářskou práci na téma aplikace statistických metod v analýze preferencí absolventů vysokých škol vypracoval samostatně pod vedením vedoucího bakalářské práce a s použitím výhradně odborné literatury a dalších informačních zdrojů, které jsou v práci citovány a jsou také uvedeny v seznamu literatury a použitých zdrojů. Jako autor této bakalářské práce dále prohlašuji, že v souvislosti s jejím vytvořením jsem neporušil autorská práva třetích osob a jsem si plně vědom následků porušení ustanovení 11 a následujících autorského zákona č. 121/2000 Sb. V Praze dne..

3 Poděkování Děkuji vedoucímu bakalářské práce doc. Ing. Dagmar Blatné, CSc. za odbornou pomoc, poskytnutí rad a vedení při zpracování bakalářské práce a Jerome Dumetzovi za vzájemnou spolupráci a poskytnutí dat k praktické části.

4 Aplikace statistických metod v analýze preferencí absolventů vysokých škol Application of statistical methods in the analysis preferences of university graduates 6

5 Abstrakt V této práci budeme zkoumat vliv vybraných faktorů pro preferencí absolventů, studentů vysokých škol s ohledem na budoucí volbu povolání s využitím metod statistické analýzy dat. Konkrétně budeme analyzovat závislosti mezi studenty z různých zemí a jednotlivé faktory pomocí statistického softwaru Statistica a Statgraphics. Hlavní metody byly zvoleny analýza rozptylu (ANOVA) a shluková analýza (CLU). Analýza rozptylu je provedena pro každý faktor samostatně a porovnává názory studentů všech zemí a shluková analýza slouží k rozdělení respondentů na základě proměnných a posouzení závislostí mezi jednotlivými faktory a každou majoritní zemí. Získané výsledky jsou v závěru práce porovnány s výzkumem IBM. Klíčová slova: Analýza rozptylu, shluková analýza, kultura, faktory, majoritní země, absolventi vysokých škol 7

6 Abstract In this theses we will investigace influence of the chosen factors to gain a results of the preference graduates - university students with regard to future career choices by using the methods of statistical data analysis. Specifically, we analyze the dependencies among studends from different countries and factors using statistical software Statistica a Statgraphics. Prefered methods are a analysis of variance (ANOVA) and a cluster analysis (CLU). ANOVA compares each single factor with nationality and CLU is used for a division of respondents on the basis of their variables - foctors and calculation of the links between each factors and each major country. The all results will be compared with IBM research. Keywords: Analysis of variance, cluster analysis, culture, factors, major countries, university graduates 8

7 Obsah 1. Úvod Teoretická část Základní charakteristiky Princip testování hypotéz Průzkumová analýza dat Jednofaktorová analýza rozptylu Shluková analýza Charakteristika kulturních rysů Praktická část Základní charakteristiky jednotlivých faktorů Rozdělení četností Charakteristiky polohy, variability, šikmosti a špičatosti Shluková analýza jednotlivých faktorů Analýza rozptylu z pohledu majoritních skupin Vytvoření prototypu aplikace elektronického dotazování Vyhodnocení výzkumu celkové populace Srovnání s výzkumem IBM Závěr Conclusion Seznam použité literatury Seznam použitých symbolů a značek Seznam obrázků Seznam tabulek Seznam rovnic Seznam příloh

8 1. Úvod Původ sdělování vlastních názorů sahá až do středověku, kdy se lidé přestali bát sdělovat svůj názor a začali otevřeně hovořit téměř o čemkoliv. Tento jev má v dnešní době nesmírně důležitý informační význam, názory různých lidí se dají formulovat do názorů skupin, celků, národů či příslušníků rozdílných kultur tedy rozšířit na pojem veřejného mínění. Rozdíl mezi současností a minulostí je především v tom, že dříve lidé neměli dostatečný podklad, aby mohli názory veřejného mínění obhájit. Tím bylo kolikrát mínění zkreslené ba dokonce smyšlené. Zlom nastal až v moderní době, kdy jsou veškerá data týkající se názoru obyvatel zařazována do databází a později zkoumána za účelem vybrat si z nich to potřebné. Mezi úplně první metody získávání odpovědí respondentů bylo dotazníkové šetření již od 40. let 19. století. Dotazník sám o sobě má velmi vysokou vypovídající hodnotu, díky otázkám, které zvolíme do obsahu. Respondent se pak snaží nejlépe svou odpovědí sdělit svůj názor a z této myšlenky my můžeme později čerpat. Záměr výzkumu je nejčastěji prostřednictvím médií tyto názory prezentovat tak, abychom mohli zvýšit díky marketingu přidanou hodnotu subjektu, kterého se výzkum týká. V tomto ohledu se tato práce liší, hlavním cílem je poskytnout čtenáři nejsrozumitelnější výsledky, které mu pomohou při rozhodování díky vhodně zvoleným statistickým metodám, protože bez oboru statistika by nikdy nebyly ani věrohodné výsledky žádného průzkumu. Vzhledem k tomu, že se práce soustředí na preference jednotlivých národnostních skupin s odlišnou geografickou polohou, kulturou, a zároveň se jedná o studenty vysokých škol, záměrů využití může být nespočet. Z vědeckého pohledu se naše zkoumání nejvíce blíží poněkud mladému oboru multikulturního managementu. Mladému, protože až v posledních pár desetiletích se zlepšila ve světě komunikace a začali se odbourávat bariéry pro volný pohyb osob a tím pádem i studentů a výzkumníků. Jak bylo již zmíněno, důležité je vždy názory porovnávat a snažit se přijít na jejich původ, proto je důležitou součástí této práce porovnat výsledky s podobným výzkumem a říci, do jaké míry se šetření odlišují či jsou shodné, aby interpretace měla co možná nejvyšší vypovídající hodnotu. 6

9 2. Teoretická část Obecně známý fakt, že převážná část teorie ve statistice jako vědním oboru byla již dříve objevena a objevit něco nového se dá jen s velmi malou pravděpodobností. Na druhou stranu možnost aplikovat a využít dané metody je nekonečná. Proto je velmi důležité pro správnost daného zkoumání pochopení elementárních jevů a postupů. S využitím znalostí je možné dále postupovat v samotném rozboru. Na závěr za předpokladu korektnosti formulujeme vstupy do výstupu ve většině případů za pomoci zvoleného softwaru a moderních technologií, které nám usnadňují práci Základní charakteristiky Míry polohy Primárním cílem každého výzkumu je mimo samotného shromažďování dat také důležitá vhodná prezentace naměřených hodnot reprezentujících statistický soubor jako takový. Ve většině případů se snažíme zobrazit střední hodnotu charakteristik polohy průměr, modus, medián a kvantily popsané v [1, s ]. Průměr Průměr je nejčastěji používaná střední hodnota. Mezi nejčastěji používaný typ průměru se řadí průměr aritmetický s označením x. Jeho výpočet je dán jako součet naměřené hodnoty dělený jejím počtem. Souhrnně se dá průměr popsat vzorcem: x = 1 n n n=1 x i. (1) Kde je suma - součet jednotlivých hodnot xi a n počet prvků. Medián Medián označuje hodnotu ve statistickém souboru, která se nachází po seřazení přímo uprostřed. Jinak řečeno rozděluje soubor na dvě stejné poloviny, první část hodnot leží pod touto hodnotou, druhá část nad touto hodnotou. Medián se označuje x. Vzorec pro výpočet mediánu: x = 0,5(xn 2 + xn +1) pokud je počet prvků n sudý, (2) 2 x = x (n+1)/2 pokud je počet n prvků lichý. (3) 7

10 Modus Modus představuje nejčetnější hodnotu ve statistickém souboru. Je to tedy hodnota, která se zde vyskytuje nejčastěji, však může se jednat i o více hodnot, potom mluvíme o vícemodálních souborech. Označení pro modus je x. Kvantily Kvantil je hodnota, která rozděluje statistický soubor na dvě části. První část obsahuje hodnoty nižší než kvantil, druhá část hodnoty vyšší než kvantil tedy kvantily označujeme jako xp, kde p je procentuálně vyjádřená část sledovaného úseku. Můžeme tedy říci, že medián je vlastně 50% kvantil (x0,50). Polovina hodnot tedy leží pod a polovina nad mediánem. Dále známe označení dolní kvartil x0,25 oddělující nejnižších 25% hodnot uspořádané řady a horní kvartil x0,75 oddělující 25% nejvyšších hodnot. Dolní kvartil, horní kvartil a medián rozdělují statistický soubor na čtyři části. Pro bližší zkoumání lze využít pojmu decily, které rozdělují statistický soubor na deset částí či percentily na sto částí. [1, s ] Míry variability Míry variability popisují rozptýlenost dat ve statistickém souboru. Teorie k této kapitole je obsažena v odborné publikaci Statistika pro ekonomy [1, s ]. Pro získání rychlého přehledu o rozptýlení dat můžeme využít nejjednodušší míry variability a to variačního rozpětí. Výpočet je dán rozdílem nejvyšší a nejnižší hodnoty souboru dle vzorce: kde xmax představuje nejvyšší hodnotu a xmin nejnižší. R = x max x min (4) Problém nastává v případě, že se v souboru nachází nízké či vysoké extrémní hodnoty a ty nám zkreslují výsledek. Tento problém se dá vyřešit mezikvartilovým rozpětím využívající dolního a horního kvartilu: Kde x 75 značí horní kvartil a x 25 dolní. R M = x 75 x 25 (5) 8

11 Rozptyl Mezi nejvíce používanou míru variability se řadí rozptyl, který nám dává ucelenou představu, zda hodnoty dat leží více či méně kolem průměru a jak velké výkyvy se zde projevují. Rozptyl označovaný jako s x 2 je definován jako aritmetický průměr čtvercových odchylek jednotlivých hodnot pozorování od průměru a zapsán vzorcem: s x 2 = n i=1 (x i x) 2 n (6) kde n značí velikost souboru, x průměr a x i hodnotu proměnné. Směrodatná odchylka Díky faktu, že je rozptyl udáván ve čtvercích, je zapotřebí toho zobrazení přiblížit a k tomuto účelu se využívá charakteristika nazývaná směrodatná odchylka, značící se sx. Jedná se druhou odmocninu rozptylu s x = s 2. Čím jsou data více rozptýlená, tím je směrodatná odchylka větší. Charakteristiky šikmosti a špičatosti Za míry koncentrace hodnot se označují šikmost měřící nesouměrnost rozložení četností kolem průměru, tedy stupeň koncentrace malých a velkých hodnot, a špičatost měřící koncentraci hodnot kolem střední hodnoty. Šikmost Ze vzorce pro výpočet šikmosti α = n i=1 (x i x) 3 ns 3 (7) je zřejmé, že symetrické rozložení nastane, když α se rovná 0. Pokud jsou hodnoty nízké četnější než vysoké, zešikmení bude kladné a v opačném případě kdy vysoké budou četnější než nízké, bude se jednat o záporné sešikmení. Špičatost Podobně jako u šikmosti si lze odvodit ze vzorce pro výpočet špičatosti β = n i=1 (x i x) 4 ns 4 3, (8) že pro normální rozdělení dat musí platit β se rovná 0. Když β je větší než 0 je rozložení strmé, v opačném případě pro β menší než 0 ploché. 9

12 Grafické zobrazování Jeden ze způsobů interpretace výsledků statistického zkoumání je grafické znázorňování většinou ve spojení s výsledky vyjádřenými v tabulce. Graf má populační a propagační význam, urychluje orientaci a je více přehledný oproti tabulkám. Nevýhodou je poměrně malá přesnost a podrobnost zobrazených výsledků. Možnost grafického zobrazení je dnes možná u většiny statistických programů s rozšířenou volbou znázornění vysvětlivek, výběru různých typu čar, barev či šrafování. Nejčastěji používaným typem je spojnicový graf (line charts), který zobrazuje čára složená z úseček spojujících vždy dva body, odpovídajícím hodnotám sledovaného znaku ve dvou na sobě navazujících skupinách či obdobích. [1, s ] Histogram je graf, který se často používá k posouzení jednorozměrné normality, nazývaný také jako histogram rozdělení četností, který umožňuje posoudit, zda výsledky ve výběru mají charakteristický symetrický tvar Gaussovy křivky, odpovídající normálnímu rozdělení. Uvažujeme-li o spojité proměnné, je nutné rozdělit data do intervalů. [2, s ] Během analýzy je občas nutné graficky znázornit tvar rozdělení, ze kterého data pocházejí. K tomuto účelu slouží Krabicový diagram (Box and Whisker Plot) složený z pravoúhelníku (krabička) a čar (vousy) na obou stranách. Pravá strana krabičky pak vyjadřuje horní kvartil, levá strana dolní kvartil a délka samotné krabičky mezikvartilové rozpětí představující variabilitu v souboru. [3, s ] Princip testování hypotéz V některých případech na začátku našeho zkoumání je třeba ověřit, zda zkoumaná data nejsou v rozporu s určitou stanovenou hypotézou týkající se populace za pomoci statistického testu, za předpokladu, že výběr je pravděpodobnostní. Nutné je znát rozdělení testového kritéria, na jehož základu provedeme test ze vzorku. Obor hodnot testového kritéria se rozpadá do určitých intervalů, které lze dále rozdělit na příznivé pro danou hypotézu (obor hodnot přijetí) a nepřijatelné (kritický obor) kde zamítáme testovanou hypotézu. Díky pořizování hodnot ze vzorku standardní metodou mohou nastat dvě možné chyby a to s pravděpodobností α chyba I. druhu, kdy testovaná hypotéza platí, ale hodnota testového kritéria spočítaná ze vzorku se nachází v kritickém oboru. Tímto tuto hypotézu nesprávně zamítáme. Pravděpodobností chyby prvního druhu nazýváme hladina významnosti testu. Chyba II. druhu s pravděpodobností β souvisí s přijetím nesprávné testované hypotézy. Správné zamítnutí nesprávné testované hypotézy je pak považováno za sílu testu. [4, s ] 10

13 Průzkumová analýza dat Důvodem pro provedení průzkumové analýzy je skutečnost, že ve velké většině případů průzkumníci získávají data z nedostatečně kvalifikovaného a předem připraveného šetření. Díky tomuto faktu je třeba data později zpracovat a upravit k použitelné interpretaci. Ne vždy je tedy výsledek zadavatelů různých úloh shodný s předpoklady a přípravou celého procesu. Může nastat situace, kdy se sledované veličiny nemusí řídit normálním zákonem rozdělení. Hodnoty mohou či nemusí spolu souviset nebo naopak nemusí potvrzovat představu o nezávislosti. Dále se mohou vyskytnout odlehlá pozorování, celkový model může být chybně specifikován díky špatným datům, možností je celá řada. Cílem kvalitního výzkumu je za pomoci kvalitních diagnostických nástrojů a využitelných předpisů či návodů utvořit kvalitní výstup celkového procesu s adekvátními úsudky. Průkopník a otec průzkumové analýzy dat John Turky do své teorie zahrnoval veškeré nástroje nutné k popisu dat vedoucí k pochopení statistických souvislostí, které se liší od popisné statistiky především ve formulaci výstupů a to konkrétně zobrazení interpretace grafických a číselných. Nástroje se většinou opíraly o původní neupravená data, které lze uspořádat z hlediska velikosti hodnot a na jejich základě počítat základní charakteristiky. [2, s. 65] Náhrada chybějících hodnot Ne vždy je datová matice úplná a to z různých důvodů. Je zřejmé, že pokud u některého objektu či souboru četností datového souboru chybí větší počet hodnot nebo současný stav je nedostačující, lze doporučit tyto hodnoty buď z částečného, či celkového testování vyřadit. V případě hodnot, jejichž nestandardní výskyt je spíše náhodný, lze tyto hodnoty doplnit uměle snížením vypovídající ztráty informace. Umělou náhradu chybějících hodnot v datové matici vyřešíme dvěma způsoby: 1. nahrazení průměrnou hodnotou příslušné proměnné, 2. nahrazení náhodným číslem z rozdělení příslušné proměnné, 3. odhad založený na regresní rovnici charakterizující závislost příslušné proměnné na p-1 zbývajících proměnných popř. jen několika silně korelovaných proměnných. [2, s ] Dané postupy a vyhodnocení je závislé na používaném statistickém software. Třídění do intervalů Občas je nutné v jistých případech přejít od původních hodnot kvantitativních proměnných k intervalovému rozdělení četností za účelem lepší přehlednosti či jiných kvalitativních důvodů. V podstatě tím přecházíme k pořadové proměnné. Sloupcový vektor v matici dané proměnné bude obsahovat čísla intervalů. Pro určení 11

14 počtu a šíře intervalů není žádné přesné pravidlo, ale je nutné ji přizpůsobit k účelu a potřebě dané analýzy. [2, s ] Příprava dotazníkového šetření Než přejdeme k samotnému procesu sběru dat, je nutné stanovit a vymezit podmínky dotazování tak, aby získaná data byla použitelná a měla vypovídající schopnost. Při opomenutí této části se může stát, že v dalších etapách bude výzkum narušen neočekávanými vlivy, jaké jsou například špatná formulace cíle, způsob sběru dat, rozhodnutí o cílové skupině návrh dotazníku a další. [5, s ] Pořizování dat Než dojde k samotnému sestavení plánu pro získání dat, je důležité formulovat předmět zkoumání, zainteresované subjekty a situaci, ve které se nacházejí. Tyto prvky a doporučení nám mohou usnadnit postup a předpověď dalšího vývoje. K pořízení dat vždy přísluší náklady, ať jsou to finanční, či časové, jež mají odpovídat výsledku, který požadujeme. Výstupem jsou tedy informace použitelné pro naše vlastní potřeby. Je zde také možnost použít informace sekundární, které již dříve byly zjištěny ideálně pro stanovení předem dané prognózy či později k utvoření závěru. Primární data zajištěná během výzkumu šetření jsou více nákladná na pořízení, však rozdíl je zřejmý a to přehled o aktuálním stavu. Míra nákladů finančních a časových je stanovena nejen rozsahem průzkumu, ale také zvolenou metodou zkoumání. Je důležité rozdělit získání odpovědí kvantitativně či kvalitativně. V budoucím zkoumání praktické části jsou užity metody kvantitativního výzkumu, kde jsou respondenti z různých sociálních uskupení či národností a mají různé vlastnosti, potřeby, motivaci, charakter atd. Důležité je vymezit naši pozornost hromadným jevům, které ve zkoumání nastávají u větších skupin lidí. [4, s ] Při přípravě sběru primárních dat je nutné si odpovědět na otázky dle PECÁKOVÉ 1 : a) Co (nebo kdo) je statistickou jednotkou, jak je definován základní soubor všech statistických jednotek a jaký je rozsah? b) Jakým způsobem bude proveden výběr z toho souboru? Jaký bude rozsah výběru? c) Jak bude kontaktována každá jednotka, jak budou získány a zaznamenány zjištěné informace? 1 PECÁKOVÁ, I. Statistika v terénních průzkumech. 1. vyd. Praha: Professional Publishing, 2008, 231 s. ISBN

15 d) Jak mohou být zkoumané jevy změřeny, jaké lze k tomu používat stupnice (škály) a jakého charakteru budou v závislosti na tom získané proměnné? e) Jaké chyby a zkreslení vznikají při sběru dat a jak jim lze předcházet? Kombinace různých postupů závisí čistě na vlastní volbě, vždy jde o možnost rozhodování mezi více faktory ovlivňující náš průzkum. Základní soubor Nositelem primárních informací jsou konkrétní respondenti podrobení dotazování. Základní soubor tvoří skupina těchto respondentů osob či částí populace. Ne vždy je elementární jednotka jedinec, z ekonomického hlediska nás mohou zajímat např. firmy, společnosti či domácnosti. V moderní statistice za určitých situací, kdy jsou stanoveny přesné podmínky týkající se věcné stránky, času a prostoru, můžeme zobecnit skutečnosti v daném vzorku. Jako vždy platí podmínky nutnosti výběru správného postupu při přípravě, zpracování a vyhodnocení. Vybraný vzorek musí splňovat podmínku reprezentativnosti. Ověřováním korektnosti průzkumů u populace či lidských činitelů musíme brát v potaz časové dispozice. Díky základním lidským předpokladům jako jsou reprodukce, migrace a stárnutí postupujeme stále rychleji po časové ose a tím je nutné zvážit časovou amortizaci informací, zda jsou v daném prostředí aktuální. Problém také může nastat při kompetenci získávání informací, platí zde například zákony o ochraně osobních údajů či povolení zařazení do databází. Pomocnými prostředky mohou být údaje, registry, databáze subjektů zařazené na webových stránkách ministerstev, ČSÚ a jiné. Reprezentativnost a přesnost výsledků týkající se populace je vždy dána pravděpodobnostní mírou. Pro zajištění reprezentativního výstupu je potřeba získání co nejvíce charakteristických znaků, však závisí na cíli výzkumu. [4, s ] Formulace dotazů a výběr respondentů Jak je již zmíněno v předešlých kapitolách je nutné u každého šetření předem formulovat cíle. Samotné dotazy pro respondenty se mohou týkat například faktorů ovlivňujících jejich život (práci, rodinu, volný čas) a dalším aspektům. Otázky můžeme rozdělit do dvou základních skupin týkajících se: - chování a názorů respondentů, - účelu získání doplňujících informací např. kulturních a demografických. V první skupině se soustředíme na předem stanovený problém, který chceme šetřením objasnit. Tyto otázky se nazývají meritorní. Dále známe otázky pomocné a kontrolní. Druhá skupina se zabývá otázkami analytickými a to třídícími či identifikačními. Musíme brát také zřetel na srozumitelnost a jednoznačnost odpovědí. Selektivní otázky mají variantní charakter. Odpověď by tedy měla zajišťovat validitu 13

16 a realitu. Pozornost je nutné soustředit u šetření s možností seřazení otázek dle preferencí. Zde je důležité sled a strukturu zvolit logicky, aby předchozí otázky nezkreslily výsledek. [5, s. 11] Výběrové postupy V závislosti na velikosti, druhu šetření a kategorii dat s ohledem na pravděpodobnost výběru v pozdějším zobrazení si lze vybrat dvě možnosti. Výběr bez vracení znamená, že vybraná jednotka ze statistického souboru nemůže být opět vrácena a podrobena zkoumání a tím i vzorek obsahuje rozsáhlejší počet výběrových jednotek oproti snadnějšímu výběru s opakováním. Záleží ovšem na typu zkoumání. Při proporcionálním výběru rozvrženého do skupin, kdy jsou výběry z oblastí úměrné jejím velikostem, dosahujeme lepších úsudků o populaci oproti prostému náhodnému výběru. Nastane-li situace, kdy jsou rozdělené skupiny vnitřně různorodé a vzájemně velmi podobné je ideální metoda skupinový výběr. Postup spočívá v prošetření všech jednotek úseku dané skupiny. Výhoda je především individuální možnost posouzení situace postupu bez osnovy, zejména v situacích, kdy přirozeně vzájemné vztahy jednotek existují. [4, s ] Způsoby dotazování S tvorbou samotného dotazníku souvisí forma dotazování. Vybrat si můžeme mezi klasickým písemným, nejrozšířenějším osobním, telefonickým a v moderní době stále více preferovaným elektronickým dotazováním. Každá forma má své výhody a nevýhody, které se především týkají nákladů v poměru s kvalitou získaných informací. Výhodou písemného dotazování jsou poměrně nízké náklady a celkem věrohodná vypovídající schopnost. Nevýhodou je opětovná nutnost zařazení do databáze. Vhodným prostředkem pro zaujmutí respondenta je motivace ať po stránce finanční, tak po stránce vědecké. V současné době je velmi populární forma elektronického dotazování prostřednictvím internetu. Jsou dvě základní možnosti jak postupovat. První možnost je vytvoření vlastního webu s databází, kam se ukládají data po vyplnění elektronického dotazníku a druhá možnost využít služeb zprostředkovatele, v České republice například server který umožňuje vstup do databáze a práci se vstupními hodnotami. [8, s ] Jednofaktorová analýza rozptylu U jednorozměrné analýzy rozptylu předpokládáme jednu vypovídající proměnnou. Rozhodneme-li se zvolit analýzu rozptylu jako takovou, je nutné si uvědomit, že její využití se váže ke splnění předpokladů, že výběry jsou nezávislé, každý výběr náleží normálnímu rozdělení, rozptyly všech k skupin jsou shodné a počet pozorování je 14

17 větší než počet skupin. Třídícími jednotkou jsou zde kategoriální (slovní) nebo číselné znaky. Testujeme zde nulovou hypotézu u číselných znaků: nebo: H 0 : 1 = 2 = 3 = = n, (9) non H 0 : alespoň 2 střední hodnoty se liší H 0 : hodnoty znaku y nejsou závislé na třídícím znaku A, non H 0 : hodnoty znaku y jsou závislé na třídícím znaku A. Testové kritérium je konstruováno jako poměr součtu čtverců zastupující meziskupinovou (QB) a vnitroskupinovou (QE) variabilitu vysvětlované proměnné, F = Q B /(K 1) Q E /(n K). (10) Statistika F rozdělení s (k-1) a (n-k) stupni volnosti. Závislost je potvrzena při překročení kvantilu F1-α[(k-1);(n-k)]. [2, s ]; [9] Test normality ve většině případů není nutné ověřit díky nižší citlivosti na porušení normality, nicméně test o shodě rozptylů musíme ověřit vždy. Při nedodržení tohoto předpokladu je nutné zvolit jinou statistickou metodu např. Kruskal-Wallisův test. [9] Kruskal-Wallisův K ověření shody úrovně spojitého sledovaného znaku v k nezávislých výběrech využijeme tento test v případě, kdy není možné využití analýzy rozptylu jednoduchého třídění, zejména v rozdělení odlišného od normálního, resp. tehdy, když tvar rozdělení neznáme a není možnost ho ověřit. Základní předpoklad je pouze spojitost rozdělení. Rozsah skupin nemusí být vždy stejný, však je požadováno vyhovět velkosti větší než 5. Testování hypotéz H0 předpokládá výběry pocházejících ze stejného statistického souboru nebo ze souborů se stejnou úrovní zkoumaného spojitého znaku. Alternativní hypotéza non H0 toto tvrzení vyvrací. Nejčastější tvar Kruskal-Wallisova testu je dán vzorcem: Q KW = k 1 j =1 [T j n j n n ] = 12 n n+1 k T j 2 j =1 3 n + 1, (11) n j kde k je počet výběrů, nj je počet jednotek v j-tém výběru, n je celkový rozsah výběru n = nj, Tj je součet pořadí jednotek náležejících j-tému výběru. 15

18 U shodných pozorování přiřazujeme průměrná pořadí vypočtená jako aritmetický průměr pořadí všech shodných jednotek. Pokud je těchto shodných pozorování více než 25%, doporučuje se využít korigovaný vzorec Kruskalovy-Wallisovy statistiky ve tvaru: Q KW = Q KW 1 T j n 3 n, (12) kde Tj = tj 3 -tj, je t počet shodných pozorování ve skupině, Tj je součet všech skupin shod. Q KW = k j =1 12 n n +1 k j =1 T j 2 1 (t j 3 t j ) n 3 n n j 3 n (13) Postup testu probíhá spojením všech hodnot k výběru do jednoho souboru s rozsahem n = nj, uspořádání hodnot spojeného výběru a přiřazením pořadových čísel od 1 do n. Pro každý výběr vypočítáme součet pořadí příslušejících do k-tého výběru Tj. Platí-li pro každou skupinu nj 5 pozorování, pak má v případě přijetí nulové hypotézy veličina QKW rozdělení chí-kvadrát s k-1 volnosti X 2 [k-1]. Tím je možné pro testování hypotézy o shodě středních hodnot využít i kvantily daného rozdělení. Jestliže hodnota testového kritéria je větší než (1-α) procentní kvantil χ 2 [k-1], zamítáme nulovou hypotézu H0 o shodě znaků ve všech skupinách. Nepřijetím hypotézy o shodné úrovni sledovaného znaku ve všech skupinách je užitečné posoudit, které skupiny se od sebe vzájemně odlišují. V souladu všech k výběrů se stejným rozsahem neboli vyváženým tříděním platí-li n1 = n2 = = nk = m je možné posoudit, které dvojice se liší tzv. Neményivu metodou vícenásobného porovnání ve výpočtu rozdílů Ti-Tj s kritickou hodnotou. Nastane-li případ, že Ti-Tj kritické hodnotě, zamítáme nulovou hypotézu o shodnosti středních hodnot srovnané dvojice. Postup se opakuje pro všechna k(k-1)/2 dvojic Ti-Tj. [6, s ]; [9] 16

19 2.1.5 Shluková analýza Během zkoumání je často třeba v souboru rozlišit jaké skupiny (shluky) jsou si na základě vstupních hodnot podobné více či méně. Závislost může nastat mezi skupinami, ale také mezi samotnými faktory. Předlohou pro metody shluku je uspořádán algoritmus vstupních jednotek do symetrické matice n x n, kde tyto prvky vyjadřují pro každou dvojici jednotek míru podobnosti. Jsou si tedy ve výsledku blízké či vzdálené. V obou předešlých případech se jedná o hieararchické shlukování, nejčastěji používané aglomerativní, kdy na začátku je každá kategorie sama o sobě shlukem a postupně se vždy dvě kategorie s nejvyšší podobností spojí. Tento postup se opakuje, dokud nejsou všechny kategorie zařazeny do jednoho shluku. Pro vstup utváření kategorií shluku je tedy kontingenční tabulka, výstup se dá označit jako identifikace jednotlivých skupin dle podobnosti. Využitím matice vzdáleností (nepodobností) je vždy u každé dvojice přiřazeno číslo do jaké míry jsou si podobné. Obecně tedy platí čím blíže je daná hodnota 0, tím větší podobnost nastává. [4, s ] K objasnění principu jednorozměrného shlukování se využívají dvě míry podobnosti a to chí-kvadrát a φ. Za předpokladu, že proměnná u které zjišťujeme podobnost, je řádková, pak na základě kontingence můžeme vytvořit dílčí tabulky s pouze dvěma řádky. Pro veškeré tabulky pak vypočteme Pearsonovu statistiky chíkvadrát či koeficientu φ. Užitečnou pomůckou jsou míry vzdálenosti (euklidovské, Mahalanobisovo a dalších), které využíváme k hodnocení podobnosti objektů a shluků. K samotnému shlukování se aplikuje řada metod, mezi ty nejznámější patří: - Wardova metoda, kde základ tvoří čtverec euklidovské vzdálenosti, jenž má nejvyšší rozptýlení mezi shluky. - Metoda nejbližšího souseda první v pořadí jsou zde objekty s nejbližší vzdáleností, ke kterým je přiřazen další shluk pomocí následujícího nejbližšího objektu. - Metoda nejvzdálenějšího souseda rozdíl oproti předchozí metodě je, že hledá objekty s naopak největší vzdáleností. - Centroidní metoda kde vzdálenost shluků je určena euklidovskou vzdáleností mezi čtverci či těžišti, souřadnice jsou pak vyjádřeny průměry hodnot znaků pro veškeré objekty shluku. V návaznosti se vypočítá vždy nová hodnota pro dané těžiště. [3, s ] Určení optimálního počtu shluků v dendogramu a interpretace Dendogram je druh grafického znázornění jednotlivých kroků shlukové analýzy, tedy proces shlukování ve formě stromu zobrazením blízkých pozorování. Problém zde nastává pouze v počtu shluků, který při nastavení zvolíme. Existují dva základní 17

20 přístupy, a to formální cesty a heuristické procedury. Heuristické procedury patří mezi ty nejpoužívanější a řadí se sem i výše zmiňovaný dendogram, kde počet shluků je dán počtem řezu čar vzdáleností. Míra věrohodnosti je posouzena Pearsonovým korelačním koeficientem mezi vzdálenostmi určených z dendogramu. Čím více se blíží výsledná hodnota koeficientu druhé, tím nastává lepší proložení. Výsledný graf nám říká, že objekty spojené nízko jsou si více podobné oproti objektů vysoko, kde je podobnost nízká. [4, s. 204] 2.2 Charakteristika kulturních rysů Pro správné pochopení a interpretaci výsledků zkoumání, kdy je populace šetření rozdělená do skupin různých národnostních celků s odlišnou kulturou, je třeba znát jisté předpoklady a vlivy působící na jedince. K bližšímu posouzení stanovené hypotézy můžeme potvrdit či zamítnou a přijít s novým unikátním tvrzením. Odlišné smýšlení kultur Svět kolem nás je plný střetů mezi národy, skupinami i samotnými lidmi, které vždy smýšlejí odlišně, však dá se říci, že do jisté míry mají podobné všední problémy, které vyžadují spolupráci s okolím. Okolí chápáno jako sociální, politické, ekologické či geografické prostředí nekončí v rozdělení státních útvarů pouze za hranicemi. Pochopení těchto rozdílů je předloha pro řešení. Nastudování rozmanitosti lidí na tomto světě nevede pouze k výsledkům jistého zkoumání, ale také k bližšímu pochopení a vzájemnému porozumění týkající se všech sociálních sfér. Projevy rozdílnosti kultur se dají lépe přiblížit na cibulovém diagramu: Obrázek 1: Cibulový diagram úrovní projevu kultury Zdroj: Hofstede, 2007, strana 17, upraveno Kde symboly prezentují nejpovrchnější a hodnoty nejzákladnější projevy kultury. Symboly znamenají v dané kultuře konkrétní význam a mohou to být gesta, 18

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA Semestrální práce Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Vypracoval: Bonaconzová, Bryknarová, Milkovičová, Škrdlová

Více

Rozdělení náhodné veličiny

Rozdělení náhodné veličiny Rozdělení náhodné veličiny Náhodná proměnná může mít - diskrétní rozdělení (nabývá jen určitých číselných hodnot) - spojité rozdělení (nabývá libovolných hodnot z určitého intervalu) Fyzikální veličiny

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis

Více

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Nejčastější chyby v explorační analýze

Nejčastější chyby v explorační analýze Nejčastější chyby v explorační analýze Obecně doporučuju přečíst přednášku 5: Výběrová šetření, Exploratorní analýza http://homel.vsb.cz/~lit40/sta1/materialy/io.pptx Použití nesprávných charakteristik

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1 3. charakteristiky charakteristiky 1 charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme charakteristiky 2 charakteristiky Dva hlavní

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Předmět studia: Ekonomická statistika a analytické metody I, II

Předmět studia: Ekonomická statistika a analytické metody I, II Předmět studia: Ekonomická statistika a analytické metody I, II Typ a zařazení předmětu: povinný předmět bakalářského studia, 1. ročník Rozsah předmětu: 2 semestry, celkem 24/0 hodin v kombinované formě

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník a oktáva 3 hodiny týdně PC a dataprojektor, učebnice

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

UKAZATELÉ VARIABILITY

UKAZATELÉ VARIABILITY UKAZATELÉ VARIABILITY VÝZNAM Porovnejte známky dvou studentek ze stejného předmětu: Studentka A: Studentka B: Oba soubory mají stejný rozsah hodnoty, ale liší se známky studentky A jsou vyrovnanější, jsou

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl?

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl? 1.1 Základní statistické pojmy a metody Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl? 1 Co se dozvíte Co je to statistika

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

STATISTIKA S EXCELEM. Martina Litschmannová MODAM, STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216 Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního

Více

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.

Více

"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006

Competitivness in the EU Challenge for the V4 countries Nitra, May 17-18, 2006 ANALÝZA ROZPTYLU JAKO ZÁKLADNÍ METODA MNOHONÁSOBNÉHO POROVNÁVÁNÍ STŘEDNÍCH HODNOT V RŮZNÝCH SOFTWAROVÝCH PRODUKTECH ANALYSIS OF VARIANCE AS A PRIMARY METHOD OF MULTIPLE COMPARISON OF EXPECTED VALUES IN

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita Kartografické stupnice Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita Datum vytvoření dokumentu: 20. 9. 2004 Datum poslední aktualizace: 16. 10. 2012 Stupnice

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í Vybrané metody posuzování dopadu záměrů na životní prostředí. ř Posuzování dopadu (impaktu) posuzované činnosti na životní prostředí

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi Geografický seminář 30. března 2011 Pavel Bednář Výchozí stav Sebehodnocení práce s MS Excel studujícími oboru

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více