UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE

Rozměr: px
Začít zobrazení ze stránky:

Download "UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE"

Transkript

1 UNICORN COLLEGE Katedra ekonomiky a managementu BAKALÁŘSKÁ PRÁCE Aplikace statistických metod v analýze preferencí absolventů vysokých škol Autor BP: Ladislav STRATIL Vedoucí BP: doc. Ing. Dagmar Blatná, CSc Praha

2 Čestné prohlášení Prohlašuji, že jsem svou bakalářskou práci na téma aplikace statistických metod v analýze preferencí absolventů vysokých škol vypracoval samostatně pod vedením vedoucího bakalářské práce a s použitím výhradně odborné literatury a dalších informačních zdrojů, které jsou v práci citovány a jsou také uvedeny v seznamu literatury a použitých zdrojů. Jako autor této bakalářské práce dále prohlašuji, že v souvislosti s jejím vytvořením jsem neporušil autorská práva třetích osob a jsem si plně vědom následků porušení ustanovení 11 a následujících autorského zákona č. 121/2000 Sb. V Praze dne..

3 Poděkování Děkuji vedoucímu bakalářské práce doc. Ing. Dagmar Blatné, CSc. za odbornou pomoc, poskytnutí rad a vedení při zpracování bakalářské práce a Jerome Dumetzovi za vzájemnou spolupráci a poskytnutí dat k praktické části.

4 Aplikace statistických metod v analýze preferencí absolventů vysokých škol Application of statistical methods in the analysis preferences of university graduates 6

5 Abstrakt V této práci budeme zkoumat vliv vybraných faktorů pro preferencí absolventů, studentů vysokých škol s ohledem na budoucí volbu povolání s využitím metod statistické analýzy dat. Konkrétně budeme analyzovat závislosti mezi studenty z různých zemí a jednotlivé faktory pomocí statistického softwaru Statistica a Statgraphics. Hlavní metody byly zvoleny analýza rozptylu (ANOVA) a shluková analýza (CLU). Analýza rozptylu je provedena pro každý faktor samostatně a porovnává názory studentů všech zemí a shluková analýza slouží k rozdělení respondentů na základě proměnných a posouzení závislostí mezi jednotlivými faktory a každou majoritní zemí. Získané výsledky jsou v závěru práce porovnány s výzkumem IBM. Klíčová slova: Analýza rozptylu, shluková analýza, kultura, faktory, majoritní země, absolventi vysokých škol 7

6 Abstract In this theses we will investigace influence of the chosen factors to gain a results of the preference graduates - university students with regard to future career choices by using the methods of statistical data analysis. Specifically, we analyze the dependencies among studends from different countries and factors using statistical software Statistica a Statgraphics. Prefered methods are a analysis of variance (ANOVA) and a cluster analysis (CLU). ANOVA compares each single factor with nationality and CLU is used for a division of respondents on the basis of their variables - foctors and calculation of the links between each factors and each major country. The all results will be compared with IBM research. Keywords: Analysis of variance, cluster analysis, culture, factors, major countries, university graduates 8

7 Obsah 1. Úvod Teoretická část Základní charakteristiky Princip testování hypotéz Průzkumová analýza dat Jednofaktorová analýza rozptylu Shluková analýza Charakteristika kulturních rysů Praktická část Základní charakteristiky jednotlivých faktorů Rozdělení četností Charakteristiky polohy, variability, šikmosti a špičatosti Shluková analýza jednotlivých faktorů Analýza rozptylu z pohledu majoritních skupin Vytvoření prototypu aplikace elektronického dotazování Vyhodnocení výzkumu celkové populace Srovnání s výzkumem IBM Závěr Conclusion Seznam použité literatury Seznam použitých symbolů a značek Seznam obrázků Seznam tabulek Seznam rovnic Seznam příloh

8 1. Úvod Původ sdělování vlastních názorů sahá až do středověku, kdy se lidé přestali bát sdělovat svůj názor a začali otevřeně hovořit téměř o čemkoliv. Tento jev má v dnešní době nesmírně důležitý informační význam, názory různých lidí se dají formulovat do názorů skupin, celků, národů či příslušníků rozdílných kultur tedy rozšířit na pojem veřejného mínění. Rozdíl mezi současností a minulostí je především v tom, že dříve lidé neměli dostatečný podklad, aby mohli názory veřejného mínění obhájit. Tím bylo kolikrát mínění zkreslené ba dokonce smyšlené. Zlom nastal až v moderní době, kdy jsou veškerá data týkající se názoru obyvatel zařazována do databází a později zkoumána za účelem vybrat si z nich to potřebné. Mezi úplně první metody získávání odpovědí respondentů bylo dotazníkové šetření již od 40. let 19. století. Dotazník sám o sobě má velmi vysokou vypovídající hodnotu, díky otázkám, které zvolíme do obsahu. Respondent se pak snaží nejlépe svou odpovědí sdělit svůj názor a z této myšlenky my můžeme později čerpat. Záměr výzkumu je nejčastěji prostřednictvím médií tyto názory prezentovat tak, abychom mohli zvýšit díky marketingu přidanou hodnotu subjektu, kterého se výzkum týká. V tomto ohledu se tato práce liší, hlavním cílem je poskytnout čtenáři nejsrozumitelnější výsledky, které mu pomohou při rozhodování díky vhodně zvoleným statistickým metodám, protože bez oboru statistika by nikdy nebyly ani věrohodné výsledky žádného průzkumu. Vzhledem k tomu, že se práce soustředí na preference jednotlivých národnostních skupin s odlišnou geografickou polohou, kulturou, a zároveň se jedná o studenty vysokých škol, záměrů využití může být nespočet. Z vědeckého pohledu se naše zkoumání nejvíce blíží poněkud mladému oboru multikulturního managementu. Mladému, protože až v posledních pár desetiletích se zlepšila ve světě komunikace a začali se odbourávat bariéry pro volný pohyb osob a tím pádem i studentů a výzkumníků. Jak bylo již zmíněno, důležité je vždy názory porovnávat a snažit se přijít na jejich původ, proto je důležitou součástí této práce porovnat výsledky s podobným výzkumem a říci, do jaké míry se šetření odlišují či jsou shodné, aby interpretace měla co možná nejvyšší vypovídající hodnotu. 6

9 2. Teoretická část Obecně známý fakt, že převážná část teorie ve statistice jako vědním oboru byla již dříve objevena a objevit něco nového se dá jen s velmi malou pravděpodobností. Na druhou stranu možnost aplikovat a využít dané metody je nekonečná. Proto je velmi důležité pro správnost daného zkoumání pochopení elementárních jevů a postupů. S využitím znalostí je možné dále postupovat v samotném rozboru. Na závěr za předpokladu korektnosti formulujeme vstupy do výstupu ve většině případů za pomoci zvoleného softwaru a moderních technologií, které nám usnadňují práci Základní charakteristiky Míry polohy Primárním cílem každého výzkumu je mimo samotného shromažďování dat také důležitá vhodná prezentace naměřených hodnot reprezentujících statistický soubor jako takový. Ve většině případů se snažíme zobrazit střední hodnotu charakteristik polohy průměr, modus, medián a kvantily popsané v [1, s ]. Průměr Průměr je nejčastěji používaná střední hodnota. Mezi nejčastěji používaný typ průměru se řadí průměr aritmetický s označením x. Jeho výpočet je dán jako součet naměřené hodnoty dělený jejím počtem. Souhrnně se dá průměr popsat vzorcem: x = 1 n n n=1 x i. (1) Kde je suma - součet jednotlivých hodnot xi a n počet prvků. Medián Medián označuje hodnotu ve statistickém souboru, která se nachází po seřazení přímo uprostřed. Jinak řečeno rozděluje soubor na dvě stejné poloviny, první část hodnot leží pod touto hodnotou, druhá část nad touto hodnotou. Medián se označuje x. Vzorec pro výpočet mediánu: x = 0,5(xn 2 + xn +1) pokud je počet prvků n sudý, (2) 2 x = x (n+1)/2 pokud je počet n prvků lichý. (3) 7

10 Modus Modus představuje nejčetnější hodnotu ve statistickém souboru. Je to tedy hodnota, která se zde vyskytuje nejčastěji, však může se jednat i o více hodnot, potom mluvíme o vícemodálních souborech. Označení pro modus je x. Kvantily Kvantil je hodnota, která rozděluje statistický soubor na dvě části. První část obsahuje hodnoty nižší než kvantil, druhá část hodnoty vyšší než kvantil tedy kvantily označujeme jako xp, kde p je procentuálně vyjádřená část sledovaného úseku. Můžeme tedy říci, že medián je vlastně 50% kvantil (x0,50). Polovina hodnot tedy leží pod a polovina nad mediánem. Dále známe označení dolní kvartil x0,25 oddělující nejnižších 25% hodnot uspořádané řady a horní kvartil x0,75 oddělující 25% nejvyšších hodnot. Dolní kvartil, horní kvartil a medián rozdělují statistický soubor na čtyři části. Pro bližší zkoumání lze využít pojmu decily, které rozdělují statistický soubor na deset částí či percentily na sto částí. [1, s ] Míry variability Míry variability popisují rozptýlenost dat ve statistickém souboru. Teorie k této kapitole je obsažena v odborné publikaci Statistika pro ekonomy [1, s ]. Pro získání rychlého přehledu o rozptýlení dat můžeme využít nejjednodušší míry variability a to variačního rozpětí. Výpočet je dán rozdílem nejvyšší a nejnižší hodnoty souboru dle vzorce: kde xmax představuje nejvyšší hodnotu a xmin nejnižší. R = x max x min (4) Problém nastává v případě, že se v souboru nachází nízké či vysoké extrémní hodnoty a ty nám zkreslují výsledek. Tento problém se dá vyřešit mezikvartilovým rozpětím využívající dolního a horního kvartilu: Kde x 75 značí horní kvartil a x 25 dolní. R M = x 75 x 25 (5) 8

11 Rozptyl Mezi nejvíce používanou míru variability se řadí rozptyl, který nám dává ucelenou představu, zda hodnoty dat leží více či méně kolem průměru a jak velké výkyvy se zde projevují. Rozptyl označovaný jako s x 2 je definován jako aritmetický průměr čtvercových odchylek jednotlivých hodnot pozorování od průměru a zapsán vzorcem: s x 2 = n i=1 (x i x) 2 n (6) kde n značí velikost souboru, x průměr a x i hodnotu proměnné. Směrodatná odchylka Díky faktu, že je rozptyl udáván ve čtvercích, je zapotřebí toho zobrazení přiblížit a k tomuto účelu se využívá charakteristika nazývaná směrodatná odchylka, značící se sx. Jedná se druhou odmocninu rozptylu s x = s 2. Čím jsou data více rozptýlená, tím je směrodatná odchylka větší. Charakteristiky šikmosti a špičatosti Za míry koncentrace hodnot se označují šikmost měřící nesouměrnost rozložení četností kolem průměru, tedy stupeň koncentrace malých a velkých hodnot, a špičatost měřící koncentraci hodnot kolem střední hodnoty. Šikmost Ze vzorce pro výpočet šikmosti α = n i=1 (x i x) 3 ns 3 (7) je zřejmé, že symetrické rozložení nastane, když α se rovná 0. Pokud jsou hodnoty nízké četnější než vysoké, zešikmení bude kladné a v opačném případě kdy vysoké budou četnější než nízké, bude se jednat o záporné sešikmení. Špičatost Podobně jako u šikmosti si lze odvodit ze vzorce pro výpočet špičatosti β = n i=1 (x i x) 4 ns 4 3, (8) že pro normální rozdělení dat musí platit β se rovná 0. Když β je větší než 0 je rozložení strmé, v opačném případě pro β menší než 0 ploché. 9

12 Grafické zobrazování Jeden ze způsobů interpretace výsledků statistického zkoumání je grafické znázorňování většinou ve spojení s výsledky vyjádřenými v tabulce. Graf má populační a propagační význam, urychluje orientaci a je více přehledný oproti tabulkám. Nevýhodou je poměrně malá přesnost a podrobnost zobrazených výsledků. Možnost grafického zobrazení je dnes možná u většiny statistických programů s rozšířenou volbou znázornění vysvětlivek, výběru různých typu čar, barev či šrafování. Nejčastěji používaným typem je spojnicový graf (line charts), který zobrazuje čára složená z úseček spojujících vždy dva body, odpovídajícím hodnotám sledovaného znaku ve dvou na sobě navazujících skupinách či obdobích. [1, s ] Histogram je graf, který se často používá k posouzení jednorozměrné normality, nazývaný také jako histogram rozdělení četností, který umožňuje posoudit, zda výsledky ve výběru mají charakteristický symetrický tvar Gaussovy křivky, odpovídající normálnímu rozdělení. Uvažujeme-li o spojité proměnné, je nutné rozdělit data do intervalů. [2, s ] Během analýzy je občas nutné graficky znázornit tvar rozdělení, ze kterého data pocházejí. K tomuto účelu slouží Krabicový diagram (Box and Whisker Plot) složený z pravoúhelníku (krabička) a čar (vousy) na obou stranách. Pravá strana krabičky pak vyjadřuje horní kvartil, levá strana dolní kvartil a délka samotné krabičky mezikvartilové rozpětí představující variabilitu v souboru. [3, s ] Princip testování hypotéz V některých případech na začátku našeho zkoumání je třeba ověřit, zda zkoumaná data nejsou v rozporu s určitou stanovenou hypotézou týkající se populace za pomoci statistického testu, za předpokladu, že výběr je pravděpodobnostní. Nutné je znát rozdělení testového kritéria, na jehož základu provedeme test ze vzorku. Obor hodnot testového kritéria se rozpadá do určitých intervalů, které lze dále rozdělit na příznivé pro danou hypotézu (obor hodnot přijetí) a nepřijatelné (kritický obor) kde zamítáme testovanou hypotézu. Díky pořizování hodnot ze vzorku standardní metodou mohou nastat dvě možné chyby a to s pravděpodobností α chyba I. druhu, kdy testovaná hypotéza platí, ale hodnota testového kritéria spočítaná ze vzorku se nachází v kritickém oboru. Tímto tuto hypotézu nesprávně zamítáme. Pravděpodobností chyby prvního druhu nazýváme hladina významnosti testu. Chyba II. druhu s pravděpodobností β souvisí s přijetím nesprávné testované hypotézy. Správné zamítnutí nesprávné testované hypotézy je pak považováno za sílu testu. [4, s ] 10

13 Průzkumová analýza dat Důvodem pro provedení průzkumové analýzy je skutečnost, že ve velké většině případů průzkumníci získávají data z nedostatečně kvalifikovaného a předem připraveného šetření. Díky tomuto faktu je třeba data později zpracovat a upravit k použitelné interpretaci. Ne vždy je tedy výsledek zadavatelů různých úloh shodný s předpoklady a přípravou celého procesu. Může nastat situace, kdy se sledované veličiny nemusí řídit normálním zákonem rozdělení. Hodnoty mohou či nemusí spolu souviset nebo naopak nemusí potvrzovat představu o nezávislosti. Dále se mohou vyskytnout odlehlá pozorování, celkový model může být chybně specifikován díky špatným datům, možností je celá řada. Cílem kvalitního výzkumu je za pomoci kvalitních diagnostických nástrojů a využitelných předpisů či návodů utvořit kvalitní výstup celkového procesu s adekvátními úsudky. Průkopník a otec průzkumové analýzy dat John Turky do své teorie zahrnoval veškeré nástroje nutné k popisu dat vedoucí k pochopení statistických souvislostí, které se liší od popisné statistiky především ve formulaci výstupů a to konkrétně zobrazení interpretace grafických a číselných. Nástroje se většinou opíraly o původní neupravená data, které lze uspořádat z hlediska velikosti hodnot a na jejich základě počítat základní charakteristiky. [2, s. 65] Náhrada chybějících hodnot Ne vždy je datová matice úplná a to z různých důvodů. Je zřejmé, že pokud u některého objektu či souboru četností datového souboru chybí větší počet hodnot nebo současný stav je nedostačující, lze doporučit tyto hodnoty buď z částečného, či celkového testování vyřadit. V případě hodnot, jejichž nestandardní výskyt je spíše náhodný, lze tyto hodnoty doplnit uměle snížením vypovídající ztráty informace. Umělou náhradu chybějících hodnot v datové matici vyřešíme dvěma způsoby: 1. nahrazení průměrnou hodnotou příslušné proměnné, 2. nahrazení náhodným číslem z rozdělení příslušné proměnné, 3. odhad založený na regresní rovnici charakterizující závislost příslušné proměnné na p-1 zbývajících proměnných popř. jen několika silně korelovaných proměnných. [2, s ] Dané postupy a vyhodnocení je závislé na používaném statistickém software. Třídění do intervalů Občas je nutné v jistých případech přejít od původních hodnot kvantitativních proměnných k intervalovému rozdělení četností za účelem lepší přehlednosti či jiných kvalitativních důvodů. V podstatě tím přecházíme k pořadové proměnné. Sloupcový vektor v matici dané proměnné bude obsahovat čísla intervalů. Pro určení 11

14 počtu a šíře intervalů není žádné přesné pravidlo, ale je nutné ji přizpůsobit k účelu a potřebě dané analýzy. [2, s ] Příprava dotazníkového šetření Než přejdeme k samotnému procesu sběru dat, je nutné stanovit a vymezit podmínky dotazování tak, aby získaná data byla použitelná a měla vypovídající schopnost. Při opomenutí této části se může stát, že v dalších etapách bude výzkum narušen neočekávanými vlivy, jaké jsou například špatná formulace cíle, způsob sběru dat, rozhodnutí o cílové skupině návrh dotazníku a další. [5, s ] Pořizování dat Než dojde k samotnému sestavení plánu pro získání dat, je důležité formulovat předmět zkoumání, zainteresované subjekty a situaci, ve které se nacházejí. Tyto prvky a doporučení nám mohou usnadnit postup a předpověď dalšího vývoje. K pořízení dat vždy přísluší náklady, ať jsou to finanční, či časové, jež mají odpovídat výsledku, který požadujeme. Výstupem jsou tedy informace použitelné pro naše vlastní potřeby. Je zde také možnost použít informace sekundární, které již dříve byly zjištěny ideálně pro stanovení předem dané prognózy či později k utvoření závěru. Primární data zajištěná během výzkumu šetření jsou více nákladná na pořízení, však rozdíl je zřejmý a to přehled o aktuálním stavu. Míra nákladů finančních a časových je stanovena nejen rozsahem průzkumu, ale také zvolenou metodou zkoumání. Je důležité rozdělit získání odpovědí kvantitativně či kvalitativně. V budoucím zkoumání praktické části jsou užity metody kvantitativního výzkumu, kde jsou respondenti z různých sociálních uskupení či národností a mají různé vlastnosti, potřeby, motivaci, charakter atd. Důležité je vymezit naši pozornost hromadným jevům, které ve zkoumání nastávají u větších skupin lidí. [4, s ] Při přípravě sběru primárních dat je nutné si odpovědět na otázky dle PECÁKOVÉ 1 : a) Co (nebo kdo) je statistickou jednotkou, jak je definován základní soubor všech statistických jednotek a jaký je rozsah? b) Jakým způsobem bude proveden výběr z toho souboru? Jaký bude rozsah výběru? c) Jak bude kontaktována každá jednotka, jak budou získány a zaznamenány zjištěné informace? 1 PECÁKOVÁ, I. Statistika v terénních průzkumech. 1. vyd. Praha: Professional Publishing, 2008, 231 s. ISBN

15 d) Jak mohou být zkoumané jevy změřeny, jaké lze k tomu používat stupnice (škály) a jakého charakteru budou v závislosti na tom získané proměnné? e) Jaké chyby a zkreslení vznikají při sběru dat a jak jim lze předcházet? Kombinace různých postupů závisí čistě na vlastní volbě, vždy jde o možnost rozhodování mezi více faktory ovlivňující náš průzkum. Základní soubor Nositelem primárních informací jsou konkrétní respondenti podrobení dotazování. Základní soubor tvoří skupina těchto respondentů osob či částí populace. Ne vždy je elementární jednotka jedinec, z ekonomického hlediska nás mohou zajímat např. firmy, společnosti či domácnosti. V moderní statistice za určitých situací, kdy jsou stanoveny přesné podmínky týkající se věcné stránky, času a prostoru, můžeme zobecnit skutečnosti v daném vzorku. Jako vždy platí podmínky nutnosti výběru správného postupu při přípravě, zpracování a vyhodnocení. Vybraný vzorek musí splňovat podmínku reprezentativnosti. Ověřováním korektnosti průzkumů u populace či lidských činitelů musíme brát v potaz časové dispozice. Díky základním lidským předpokladům jako jsou reprodukce, migrace a stárnutí postupujeme stále rychleji po časové ose a tím je nutné zvážit časovou amortizaci informací, zda jsou v daném prostředí aktuální. Problém také může nastat při kompetenci získávání informací, platí zde například zákony o ochraně osobních údajů či povolení zařazení do databází. Pomocnými prostředky mohou být údaje, registry, databáze subjektů zařazené na webových stránkách ministerstev, ČSÚ a jiné. Reprezentativnost a přesnost výsledků týkající se populace je vždy dána pravděpodobnostní mírou. Pro zajištění reprezentativního výstupu je potřeba získání co nejvíce charakteristických znaků, však závisí na cíli výzkumu. [4, s ] Formulace dotazů a výběr respondentů Jak je již zmíněno v předešlých kapitolách je nutné u každého šetření předem formulovat cíle. Samotné dotazy pro respondenty se mohou týkat například faktorů ovlivňujících jejich život (práci, rodinu, volný čas) a dalším aspektům. Otázky můžeme rozdělit do dvou základních skupin týkajících se: - chování a názorů respondentů, - účelu získání doplňujících informací např. kulturních a demografických. V první skupině se soustředíme na předem stanovený problém, který chceme šetřením objasnit. Tyto otázky se nazývají meritorní. Dále známe otázky pomocné a kontrolní. Druhá skupina se zabývá otázkami analytickými a to třídícími či identifikačními. Musíme brát také zřetel na srozumitelnost a jednoznačnost odpovědí. Selektivní otázky mají variantní charakter. Odpověď by tedy měla zajišťovat validitu 13

16 a realitu. Pozornost je nutné soustředit u šetření s možností seřazení otázek dle preferencí. Zde je důležité sled a strukturu zvolit logicky, aby předchozí otázky nezkreslily výsledek. [5, s. 11] Výběrové postupy V závislosti na velikosti, druhu šetření a kategorii dat s ohledem na pravděpodobnost výběru v pozdějším zobrazení si lze vybrat dvě možnosti. Výběr bez vracení znamená, že vybraná jednotka ze statistického souboru nemůže být opět vrácena a podrobena zkoumání a tím i vzorek obsahuje rozsáhlejší počet výběrových jednotek oproti snadnějšímu výběru s opakováním. Záleží ovšem na typu zkoumání. Při proporcionálním výběru rozvrženého do skupin, kdy jsou výběry z oblastí úměrné jejím velikostem, dosahujeme lepších úsudků o populaci oproti prostému náhodnému výběru. Nastane-li situace, kdy jsou rozdělené skupiny vnitřně různorodé a vzájemně velmi podobné je ideální metoda skupinový výběr. Postup spočívá v prošetření všech jednotek úseku dané skupiny. Výhoda je především individuální možnost posouzení situace postupu bez osnovy, zejména v situacích, kdy přirozeně vzájemné vztahy jednotek existují. [4, s ] Způsoby dotazování S tvorbou samotného dotazníku souvisí forma dotazování. Vybrat si můžeme mezi klasickým písemným, nejrozšířenějším osobním, telefonickým a v moderní době stále více preferovaným elektronickým dotazováním. Každá forma má své výhody a nevýhody, které se především týkají nákladů v poměru s kvalitou získaných informací. Výhodou písemného dotazování jsou poměrně nízké náklady a celkem věrohodná vypovídající schopnost. Nevýhodou je opětovná nutnost zařazení do databáze. Vhodným prostředkem pro zaujmutí respondenta je motivace ať po stránce finanční, tak po stránce vědecké. V současné době je velmi populární forma elektronického dotazování prostřednictvím internetu. Jsou dvě základní možnosti jak postupovat. První možnost je vytvoření vlastního webu s databází, kam se ukládají data po vyplnění elektronického dotazníku a druhá možnost využít služeb zprostředkovatele, v České republice například server který umožňuje vstup do databáze a práci se vstupními hodnotami. [8, s ] Jednofaktorová analýza rozptylu U jednorozměrné analýzy rozptylu předpokládáme jednu vypovídající proměnnou. Rozhodneme-li se zvolit analýzu rozptylu jako takovou, je nutné si uvědomit, že její využití se váže ke splnění předpokladů, že výběry jsou nezávislé, každý výběr náleží normálnímu rozdělení, rozptyly všech k skupin jsou shodné a počet pozorování je 14

17 větší než počet skupin. Třídícími jednotkou jsou zde kategoriální (slovní) nebo číselné znaky. Testujeme zde nulovou hypotézu u číselných znaků: nebo: H 0 : 1 = 2 = 3 = = n, (9) non H 0 : alespoň 2 střední hodnoty se liší H 0 : hodnoty znaku y nejsou závislé na třídícím znaku A, non H 0 : hodnoty znaku y jsou závislé na třídícím znaku A. Testové kritérium je konstruováno jako poměr součtu čtverců zastupující meziskupinovou (QB) a vnitroskupinovou (QE) variabilitu vysvětlované proměnné, F = Q B /(K 1) Q E /(n K). (10) Statistika F rozdělení s (k-1) a (n-k) stupni volnosti. Závislost je potvrzena při překročení kvantilu F1-α[(k-1);(n-k)]. [2, s ]; [9] Test normality ve většině případů není nutné ověřit díky nižší citlivosti na porušení normality, nicméně test o shodě rozptylů musíme ověřit vždy. Při nedodržení tohoto předpokladu je nutné zvolit jinou statistickou metodu např. Kruskal-Wallisův test. [9] Kruskal-Wallisův K ověření shody úrovně spojitého sledovaného znaku v k nezávislých výběrech využijeme tento test v případě, kdy není možné využití analýzy rozptylu jednoduchého třídění, zejména v rozdělení odlišného od normálního, resp. tehdy, když tvar rozdělení neznáme a není možnost ho ověřit. Základní předpoklad je pouze spojitost rozdělení. Rozsah skupin nemusí být vždy stejný, však je požadováno vyhovět velkosti větší než 5. Testování hypotéz H0 předpokládá výběry pocházejících ze stejného statistického souboru nebo ze souborů se stejnou úrovní zkoumaného spojitého znaku. Alternativní hypotéza non H0 toto tvrzení vyvrací. Nejčastější tvar Kruskal-Wallisova testu je dán vzorcem: Q KW = k 1 j =1 [T j n j n n ] = 12 n n+1 k T j 2 j =1 3 n + 1, (11) n j kde k je počet výběrů, nj je počet jednotek v j-tém výběru, n je celkový rozsah výběru n = nj, Tj je součet pořadí jednotek náležejících j-tému výběru. 15

18 U shodných pozorování přiřazujeme průměrná pořadí vypočtená jako aritmetický průměr pořadí všech shodných jednotek. Pokud je těchto shodných pozorování více než 25%, doporučuje se využít korigovaný vzorec Kruskalovy-Wallisovy statistiky ve tvaru: Q KW = Q KW 1 T j n 3 n, (12) kde Tj = tj 3 -tj, je t počet shodných pozorování ve skupině, Tj je součet všech skupin shod. Q KW = k j =1 12 n n +1 k j =1 T j 2 1 (t j 3 t j ) n 3 n n j 3 n (13) Postup testu probíhá spojením všech hodnot k výběru do jednoho souboru s rozsahem n = nj, uspořádání hodnot spojeného výběru a přiřazením pořadových čísel od 1 do n. Pro každý výběr vypočítáme součet pořadí příslušejících do k-tého výběru Tj. Platí-li pro každou skupinu nj 5 pozorování, pak má v případě přijetí nulové hypotézy veličina QKW rozdělení chí-kvadrát s k-1 volnosti X 2 [k-1]. Tím je možné pro testování hypotézy o shodě středních hodnot využít i kvantily daného rozdělení. Jestliže hodnota testového kritéria je větší než (1-α) procentní kvantil χ 2 [k-1], zamítáme nulovou hypotézu H0 o shodě znaků ve všech skupinách. Nepřijetím hypotézy o shodné úrovni sledovaného znaku ve všech skupinách je užitečné posoudit, které skupiny se od sebe vzájemně odlišují. V souladu všech k výběrů se stejným rozsahem neboli vyváženým tříděním platí-li n1 = n2 = = nk = m je možné posoudit, které dvojice se liší tzv. Neményivu metodou vícenásobného porovnání ve výpočtu rozdílů Ti-Tj s kritickou hodnotou. Nastane-li případ, že Ti-Tj kritické hodnotě, zamítáme nulovou hypotézu o shodnosti středních hodnot srovnané dvojice. Postup se opakuje pro všechna k(k-1)/2 dvojic Ti-Tj. [6, s ]; [9] 16

19 2.1.5 Shluková analýza Během zkoumání je často třeba v souboru rozlišit jaké skupiny (shluky) jsou si na základě vstupních hodnot podobné více či méně. Závislost může nastat mezi skupinami, ale také mezi samotnými faktory. Předlohou pro metody shluku je uspořádán algoritmus vstupních jednotek do symetrické matice n x n, kde tyto prvky vyjadřují pro každou dvojici jednotek míru podobnosti. Jsou si tedy ve výsledku blízké či vzdálené. V obou předešlých případech se jedná o hieararchické shlukování, nejčastěji používané aglomerativní, kdy na začátku je každá kategorie sama o sobě shlukem a postupně se vždy dvě kategorie s nejvyšší podobností spojí. Tento postup se opakuje, dokud nejsou všechny kategorie zařazeny do jednoho shluku. Pro vstup utváření kategorií shluku je tedy kontingenční tabulka, výstup se dá označit jako identifikace jednotlivých skupin dle podobnosti. Využitím matice vzdáleností (nepodobností) je vždy u každé dvojice přiřazeno číslo do jaké míry jsou si podobné. Obecně tedy platí čím blíže je daná hodnota 0, tím větší podobnost nastává. [4, s ] K objasnění principu jednorozměrného shlukování se využívají dvě míry podobnosti a to chí-kvadrát a φ. Za předpokladu, že proměnná u které zjišťujeme podobnost, je řádková, pak na základě kontingence můžeme vytvořit dílčí tabulky s pouze dvěma řádky. Pro veškeré tabulky pak vypočteme Pearsonovu statistiky chíkvadrát či koeficientu φ. Užitečnou pomůckou jsou míry vzdálenosti (euklidovské, Mahalanobisovo a dalších), které využíváme k hodnocení podobnosti objektů a shluků. K samotnému shlukování se aplikuje řada metod, mezi ty nejznámější patří: - Wardova metoda, kde základ tvoří čtverec euklidovské vzdálenosti, jenž má nejvyšší rozptýlení mezi shluky. - Metoda nejbližšího souseda první v pořadí jsou zde objekty s nejbližší vzdáleností, ke kterým je přiřazen další shluk pomocí následujícího nejbližšího objektu. - Metoda nejvzdálenějšího souseda rozdíl oproti předchozí metodě je, že hledá objekty s naopak největší vzdáleností. - Centroidní metoda kde vzdálenost shluků je určena euklidovskou vzdáleností mezi čtverci či těžišti, souřadnice jsou pak vyjádřeny průměry hodnot znaků pro veškeré objekty shluku. V návaznosti se vypočítá vždy nová hodnota pro dané těžiště. [3, s ] Určení optimálního počtu shluků v dendogramu a interpretace Dendogram je druh grafického znázornění jednotlivých kroků shlukové analýzy, tedy proces shlukování ve formě stromu zobrazením blízkých pozorování. Problém zde nastává pouze v počtu shluků, který při nastavení zvolíme. Existují dva základní 17

20 přístupy, a to formální cesty a heuristické procedury. Heuristické procedury patří mezi ty nejpoužívanější a řadí se sem i výše zmiňovaný dendogram, kde počet shluků je dán počtem řezu čar vzdáleností. Míra věrohodnosti je posouzena Pearsonovým korelačním koeficientem mezi vzdálenostmi určených z dendogramu. Čím více se blíží výsledná hodnota koeficientu druhé, tím nastává lepší proložení. Výsledný graf nám říká, že objekty spojené nízko jsou si více podobné oproti objektů vysoko, kde je podobnost nízká. [4, s. 204] 2.2 Charakteristika kulturních rysů Pro správné pochopení a interpretaci výsledků zkoumání, kdy je populace šetření rozdělená do skupin různých národnostních celků s odlišnou kulturou, je třeba znát jisté předpoklady a vlivy působící na jedince. K bližšímu posouzení stanovené hypotézy můžeme potvrdit či zamítnou a přijít s novým unikátním tvrzením. Odlišné smýšlení kultur Svět kolem nás je plný střetů mezi národy, skupinami i samotnými lidmi, které vždy smýšlejí odlišně, však dá se říci, že do jisté míry mají podobné všední problémy, které vyžadují spolupráci s okolím. Okolí chápáno jako sociální, politické, ekologické či geografické prostředí nekončí v rozdělení státních útvarů pouze za hranicemi. Pochopení těchto rozdílů je předloha pro řešení. Nastudování rozmanitosti lidí na tomto světě nevede pouze k výsledkům jistého zkoumání, ale také k bližšímu pochopení a vzájemnému porozumění týkající se všech sociálních sfér. Projevy rozdílnosti kultur se dají lépe přiblížit na cibulovém diagramu: Obrázek 1: Cibulový diagram úrovní projevu kultury Zdroj: Hofstede, 2007, strana 17, upraveno Kde symboly prezentují nejpovrchnější a hodnoty nejzákladnější projevy kultury. Symboly znamenají v dané kultuře konkrétní význam a mohou to být gesta, 18

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl?

Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl? 1.1 Základní statistické pojmy a metody Sázíte-li v loterii, je to hazard. Hrajete-li poker, je to zábava. Obchodujete-li na burze, je to ekonomie. Vidíte ten rozdíl? 1 Co se dozvíte Co je to statistika

Více

Proces marketingového výzkumu - jednotlivé fáze, význam, stručná charakteristika. Výběr a formulace výzkumného problému. Vztahy mezi proměnnými.

Proces marketingového výzkumu - jednotlivé fáze, význam, stručná charakteristika. Výběr a formulace výzkumného problému. Vztahy mezi proměnnými. Proces marketingového výzkumu - jednotlivé fáze, význam, stručná charakteristika. Výběr a formulace výzkumného problému. Projekt. Jednotky analýzy. Proměnné. Vztahy mezi proměnnými. Téma č. 2 Cíle marketingového

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006

Competitivness in the EU Challenge for the V4 countries Nitra, May 17-18, 2006 ANALÝZA ROZPTYLU JAKO ZÁKLADNÍ METODA MNOHONÁSOBNÉHO POROVNÁVÁNÍ STŘEDNÍCH HODNOT V RŮZNÝCH SOFTWAROVÝCH PRODUKTECH ANALYSIS OF VARIANCE AS A PRIMARY METHOD OF MULTIPLE COMPARISON OF EXPECTED VALUES IN

Více

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í Vybrané metody posuzování dopadu záměrů na životní prostředí. ř Posuzování dopadu (impaktu) posuzované činnosti na životní prostředí

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

MATEMATIKA. Statistika

MATEMATIKA. Statistika MATEMATIKA Statistika Během těchto vyučovacích hodin změří žáci pomocí senzorů Pasco svoji klidovou tepovou frekvenci a tepovou frekvenci po námaze. Získané výsledky budou v další hodině zpracovávat do

Více

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT PROKAZOVÁNÍ SHODY VÝROBKŮ část 3, díl 8, kapitola 4, str. 1 3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT Vyjadřování standardní kombinované nejistoty výsledku zkoušky Výsledek zkoušky se vyjadřuje v

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Cvičení ze statistiky - 3. Filip Děchtěrenko

Cvičení ze statistiky - 3. Filip Děchtěrenko Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf

Více

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi Geografický seminář 30. března 2011 Pavel Bednář Výchozí stav Sebehodnocení práce s MS Excel studujícími oboru

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00 Seminární úkol č. 4 Autoři: Klára Čapková (406803), Markéta Peschková (414906) Zdroj dat: EU Kids Online Survey Popis dat Analyzovaná data pocházejí z výzkumu online chování dětí z 25 evropských zemí.

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

Matematická statistika

Matematická statistika Matematická statistika Daniel Husek Gymnázium Rožnov pod Radhoštěm, 8. A8 Dne 12. 12. 2010 v Rožnově pod Radhoštěm Osnova Strana 1) Úvod 3 2) Historie matematické statistiky 4 3) Základní pojmy matematické

Více

Projekt výzkumu v graduační práci

Projekt výzkumu v graduační práci Projekt výzkumu v graduační práci Základní manuál Prof. PhDr. Beáta Krahulcová, CSc. Fáze výzkumu Přípravná, teoretická fáze (výsledek kumulovaného poznání,precizace výzkumného úkolu, formulace vědecké

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy

Více

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak získat data?

Více

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;

Více

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Spokojenost se životem

Spokojenost se životem SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Sedm základních nástrojů řízení kvality Doc. RNDr. Jiří Šimek,

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu Metoda Monte Carlo a její aplikace v problematice oceňování technologií Manuál k programu This software was created under the state subsidy of the Czech Republic within the research and development project

Více

MOŽNOSTI A LIMITY VYUŽITÍ MODERNÍCH TECHNOLOGIÍ PŘI VÝUCE MATEMATIKY NA EKF VŠB-TUO

MOŽNOSTI A LIMITY VYUŽITÍ MODERNÍCH TECHNOLOGIÍ PŘI VÝUCE MATEMATIKY NA EKF VŠB-TUO MOŽNOSTI A LIMITY VYUŽITÍ MODERNÍCH TECHNOLOGIÍ PŘI VÝUCE MATEMATIKY NA EKF VŠB-TUO RNDr. Jana Hrubá Katedra matematických metod v ekonomice (K151) Institut inovace vzdělávání (K167) Ekonomická fakulta

Více

Základní analýza dat. Úvod

Základní analýza dat. Úvod Základní analýza dat literatura: Hendl, J. 2006: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. Praha: Portál. Macháček, J. 2001: Studie k velkomoravské keramice. Metody, analýzy

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

VLIV PODNIKOVÉ KULTURY

VLIV PODNIKOVÉ KULTURY VLIV PODNIKOVÉ KULTURY NA PRACOVNÍ SPOKOJENOST A EMOCIONÁLNÍ POHODU ZAMĚSTNANCŮ 1 Ing. Luiza Šeďa Tadevosyanová OSNOVA I. Teoretická část Základní pojmy Vliv podnikové kultury na organizaci Funkce podnikové

Více

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka 2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:

Více

Statistika. Semestrální projekt

Statistika. Semestrální projekt Statistika Semestrální projekt 18.5.2013 Tomáš Jędrzejek, JED0008 Obsah Úvod 3 Analyzovaná data 4 Analýza dat 6 Statistická indukce 12 Závěr 15 1. Úvod Cílem této semestrální práce je aplikovat získané

Více

Navrhování experimentů a jejich analýza. Eva Jarošová

Navrhování experimentů a jejich analýza. Eva Jarošová Navrhování experimentů a jejich analýza Eva Jarošová Obsah Základní techniky Vyhodnocení výsledků Experimenty s jedním zkoumaným faktorem Faktoriální experimenty úplné 2 N dílčí 2 N-p Experimenty pro studium

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Pondělí 16:40, C328 http://www.ms.mff.cuni.cz/~dechf7am Praktické zaměření Proč potřebuji statistiku, když chci dělat (doplň)?

Více