Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma

Rozměr: px
Začít zobrazení ze stránky:

Download "Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma"

Transkript

1 UK FHS Historická sociologie (LS 2011+) Analýza kvantitativních dat II. Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace ( ) Jiří Šafr, 2014

2 Kontingenční tabulky sestavujeme tak, aby vyjadřovaly naší pracovní hypotézu.

3 Asociace mezi znaky míra souvislosti znaků opakování

4 Základní možnosti pro vztah dvou proměnných A x B (opakování) Nominální A (kategoriální či kvalitativní proměnná) a nominální B procentní podíly (podmíněné pravděpodobnosti) kontingenční tabulka (+ chí kvadrát test), znaménkové schéma, koeficient kontingence Dtto ale ordinální dtto + pořadové korelace (Sperman, Tab-B) Nominální A x kardinální (číselná) průměry B v podskupinách A (+ T-test či One-way Anova, 95% konf. intervaly), koeficient asociace Eta = míra jednostranné závislosti kvantitativní vysvětlované proměnné na proměnné nominální

5 Kategoriální data (nominálními a ordinální znaky) 1. Celkový pohled na těsnost vztahů v kontingenční tabulce Koeficienty asociace (pořadové korelace) Většinou jim předchází test hypotézy o celkové nezávislosti/homogenitě (dvoudimenzionální Chíkvadrát test).

6 Míry asociace / korelace v kontingenční tabulce pro kategoriální znaky

7 Asociace nominálních znaků Vyjádření souvislosti pomocí koeficientu (ekvivalent ke korelaci)

8 Asociace nominálních znaků: Kontingenční koeficient (CC) Analogie korelačního koeficientu (ten je pro kardinální/ordinální znaky) míra těsnosti závislosti. Neurčuje směr. Výsledek není kontingenčních tabulkách v intervalu (0,1) existují různé korekce CC je rozšíření koef. Phi pro >2x2 tabulky. V SPSS: Analyze, Descriptive Statistics, Crosstabs; vložit Row a Column variables; Statistics; Contingency Coefficient / Phi & Cramer s V

9 Míry asociace v kontingenční tabulce Při interpretaci i měření souvislosti je důležité, zda jsou jedna nebo obě proměnné nominální nebo ordinální. Základním nástrojem analýzy jsou vždy procentní rozdíly. Navíc můžeme měřit míru těsnosti vzájemného vztahu pomocí: pro nominální znaky koeficientů asociace (Kontingenční koeficient, Cramérovo V, Lambda atd.). pro ordinální znaky navíc (kromě koeficientů asociace) koeficientů pořadové korelace (Spermanovo Rho, Gamma, Kendallovo Tau B,..). Zadání nominálních asociací a pořadových korelací v SPSS uvádíme dále; podrobně viz 2. Korelace a asociace: vztahy mezi kardinálními/ ordinálními znaky na Pokud máme výběrová data (vzorek z populace), pak bychom měli testovat statistickou významnost koeficientů asociace/korelace (to se naučíme v AKD II.). K jednoduché analýze kontingenční tabulky také používáme např.: odds ratio = poměry šancí ( vzájemně podmíněné pravděpodobnosti) Podrobně viz 5. Poměry šancí (Odds Ratio) míry rozptýlení, např. Index nepodobnosti (Δ) Viz 9. Míry variability: variační koeficient a další indexy

10 Míry asociace (pro nominální proměnné) Obecně pro koeficienty asociace platí: Mají rozpětí 0 = žádná souvislost až 1 = dokonalá souvislost mezi znaky. V principu říkají kolik jaký podíl variability jedné proměnné lze vysvětlit pomocí druhé. Ale pozor, vysvětlení je třeba chápat ve smyslu redukce statistického rozptýlení dat, nikoliv ve smyslu kauzální interpretace. [Řehák, Řeháková 1986: 250] Nevyjadřují směr asociace (jako tomu je v případě korelací, nicméně některé koeficienty asociace jsou asymetrické (directional), tj. musíme definovat, která proměnná je závislá a které nezávislá). Kontingenční koeficient C (CC) Nejjednodušší na výpočet. Ale nepoužívejte je, tam kde porovnáváte míru asociace mezi tabulkami s různým počtem kategorií. Cramér's V (CV nebo Cr) obecně ho lze doporučit (ale má také nedostatky) Pokud jsou obě proměnné dichotomické (2 2 tabulka) používáme Phi koeficient (pro 2 2 tabulku je stejný jako CV) Lambda Λ (symetrická/ asymetrická) měří procentní zlepšení odhadu jedné proměnné na základě hodnot jiné proměnné (oboustranné symetrická nebo pouze predikující závislou proměnnou asymetrická) Všechny tyto koeficienty jsou k dispozici v SPSS pomocí CROSSTABS (viz dále)

11 Pozor: pokud nenaměříme korelaci, mezi znaky stále ještě může být (nominální) asociace. Pokud není přítomná ordinální závislost korelace, tak to automaticky neznamená statistickou nezávislost. Znamená to pouze, že není ordinálně uspořádaný vztah (~ linearita). Stále mezi znaky ale může být asociace, tj. vzájemný spoluvýskyt hodnot je např. kumulován do jednoho políčka tabulky (nebo několika políček mimo diagonálu resp. bez jakéhokoliv jiného trendu ). Tuto situaci indikuje signifikantní koeficient asociace (např. Cramerovo V) zatímco ordinální korelace je přibližně nulová (např. Gamma). Pouze absence nominální závislosti asociace znamená (celkovou) statistickou nezávislost. (např. CV = 0) spočítejte oba typy koeficientů: asociace (Cramer s V atd.) i ordinální korelace (Gamma atd.) a porovnejte je.

12 Míry asociace v kontingenční tabulce a Elaborace Míry asociace/korelace využíváme také při elaboraci tj. v třídění dat 3. stupně (vč. popisných cílů analýz). Jsou asociace v podskupinách podle 3. kontrolní proměnné v zásadě stejné? A nebo se liší jejich intenzita, či dokonce v případě korelací i směr souvislosti?

13 Míry asociace v třídění (2) a 3. stupně v CROSSTABS V rámci CROSSTABS můžeme spočítat míry asociace a korelace pro proměnné Y x X (bivariátně) a navíc i odděleně v kategoriích kontrolního faktoru Z což nám pomůže rychle posoudit interakce a zhodnotit falešné vlivy. Pro nominální znaky (Y, X, Z-kontrolní faktor) koeficienty asociace (mají hodnoty 0-1): CROSSTABS var1 BY var2 BY var3-kontrolní /CELLS COL /STATISTICS CC PHI. Koeficienty asocice: CC = Kontingenční koeficient, PHI = Cramérovo V (+ ekvivalent pro dichotomické znaky Phi); jsou zde k dispozici i další koeficienty asociace a korelace (např. Lambda). Pro ordinální znaky (A, B) a nominální/ordinální kontrolní faktor (C) navíc krom asociací i pořadové korelace (hodnoty směr): CROSSTABS var1 BY var2 BY var3-kontrolní /CELLS COL /STATISTICS CC PHI GAMMA CORR BTAU. Korelační koeficienty: GAMMA = Goodman&Kruskalovo Gamma, BTAU = Kendaullovo Tau B, CORR = Spermanovo Rho (+ Pearsonův korel. koef. R pro kardinální znaky) Pozor, nenaměříme-li korelaci, neznamená to, že mezi znaky nemusí být silná závislost asociace. Navíc u ordinálních znaků nám porovnání korelací a koeficientů asociace může napovědět o (nelineární) povaze vztahu. Poznámka: v případě průměrů v podskupinách v MEANS lze počítat koeficient(y) Eta 2 (pro kardinální x nominální znak): MEANS var1-závislá-číselná BY var2-nezávislá-kateg. BY var3-kontrolní-kategoriální /CELLS MEAN STDDEV COUNT /STATISTICS ANOVA. Více o koeficientech asociace a korelace v 2. Korelace a asociace: vztahy mezi kardinálními/ ordinálními znaky na

14 Pořadové korelace pro ordinální znaky - třídění 2. stupně Pro výběrová data navíc musíme nejprve testovat statistickou hypotézu, že koeficient není roven nule (tj. je nenulový i v celé populaci a nejen v našem vzorku). O tom ale až v AKD II. [Zdroj: ISSP 2007, ČR] CROSSTABS prijem4 BY vzd4 /STATISTICS GAMMA BTAU.

15 Pořadové korelace pro ordinální znaky v třídění 3. stupně (odděleně pro muže a ženy) pohlaví [s30] je kontrolní faktor CROSSTABS prijem4 BY vzd4 BY s30 /STATISTICS GAMMA BTAU. U žen má vzdělání na příjem o něco větší efekt, ale celkově ženy vydělávají bez ohledu na vzdělání méně (viz též graf s průměry příjmu). [Zdroj: ISSP 2007, ČR] V AKD2 si dále ukážeme jako spočítat parciální pořadovou korelaci (GAMMA).

16 Pokud je min. jedna proměnná multi-nominální Princip je stejný jako u ordinálních znaků, ale nemůžeme počítat korelace, pouze koeficienty asociace (Kontingenční koeficient, Cramérovo V, Lambda atd.). Pokud je nominální pouze 3. kontrolní proměnná (a ostatní ordinální), pak korelace počítat a vzájemně je porovnávat lze. Při interpretaci procentních rozdílů u nominálních znaků musíme brát v úvahu všechny kategorie závislé proměnné i nezávislých proměnných. Jednodušší je to, pokud je alespoň některá ordinální. Ideální je, pokud máme závislou proměnnou dichotomickou nebo ordinální. Pokud je závislá proměnná dichotomická, tak jde o ekvivalent porovnávání průměrů v pod/podskupinách.

17 Typy kontingenčních tabulek se 3 proměnnými a míry asociace/korelace Vždy lze míru asociace vyjádřit pomocí koef. asociace (podobně 2 2 3n) všechny dichotomické koeficienty asociace a bodově biseriální korelace nebo tetrachorické korelace 2 3o 3n nebo 2 3o 2 závislá dichotomická, nezávislá ordinální, kontrolní nominální pořadové korelace ve skupinách kontrolního faktoru (bez možnosti posouzení trendu asociace/korelace). 2 3n 3o závislá dichotomická, nezávislá nominální, kontrolní ordinální pouze koeficienty asociace (lze posuzovat trend v asociacích mezi kategoriemi kontrolního faktoru) 3o 3o 3o (podobně i 2 2 3o) všechny ordinální pořadové korelace (lze posuzovat trend v korelacích mezi kategoriemi kontrolního faktoru) + koeficient parciální korelace Platí i pro více kategorií něž 3.

18 Příklady pro bivariátní asociace/korelace v konting. tabulce nominální 2 3ordinální 3o 3o Pro tabulky větší než 2x2 lze vždy Cramérovo V a Kontingenční koeficient.

19 Pozor na absolutní četnosti při třídění vyššího stupně Při třídění 3. a vyššího stupně vždy bedlivě kontrolujte absolutní počty v jednotlivých polích tabulky, zejména u malých souborů. CROSSTABS var1 BY var2 BY var3 /CELLS COL COUNT. Pokud jsou četnosti v tabulkách velmi malé, pak je jejich interpretace ze statistického i věcného hlediska v podstatě bezcenná.

20 Pro ordinální a kardinální (číselné) proměnné viz prezentaci Korelace a asociace: vztahy mezi kardinálními/ ordinálními znaky (AKD2_korelace.ppt) Pořadové (ordinální) korelační koeficienty: Spearmanovo Rho, Kendaulovo Tau B, Gama,

21 A ZNOVU a znovu Asociace (korelace) a kauzalita Asociace (korelace) neznamená automaticky kauzální vztah Podmínky kauzality (připomenutí podruhé): 1. Naměřená korelace (asociace A-B) 2. Časová souslednost (k A došlo před B) 3. Lze vyloučit vliv další proměnné/ných (A-B/C) Směr působení nám může pomoci určit silná teorie

22 Kategoriální data (nominálními a ordinální znaky) 2. Podrobný pohled dovnitř kontingenční tabulky. Testování odchylek četností v jednotlivých polích tabulky Znaménkové schéma Předchází test hypotézy o celkové nezávislosti/homogenitě (dvoudimenzionální Chíkvadrát test).

23 Nejprve viz presentaci Testování hypotéz (2) - zejména část o dvoudimenzionálním Chíkvadrát testu dobré shody homogenita v kontingenční tabulce

24 Krok 1. celkové zhodnocení (ne)závislosti dvou kategoriálních znaků Chíkvadrát test v kontingenční tabulce Vztahy dvou (a více) znaků v kontingenční tabulce Malé připomenutí - kopie z

25 Kontingenční tabulka Statistické míry a testování Nezávislost = oba znaky navzájem neovlivňují v tom, jakých konkrétních hodnot nabývají Homogenita (shodnost struktury) = očekávané četnosti jsou v políčcích každého řádku ve stejném vzájemném poměru bez ohledu na konkrétní volbu řádku test dobré shody = porovnání očekávaných četností v jednotlivých polích tabulky - za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí - a skutečných četností. Pokud hypotéza nezávislosti (resp. homogenity) platí, má testová statistika přibližně rozdělení chí kvadrát o (r-1)(s-1) stupních volnosti. Hodnota testové statistiky se tedy porovná s kritickou hodnotou (kvantilem) příslušné hladiny významnosti.

26 Chí-kvadrát testy: test dobré shody připomenutí Test pro homogenitu distribucí mezi kategoriemi znaku/ů test dobré shody = shody relativních četností ni/n a hypotetických pravděpodobností. Pro nominální znaky (i ordinální a kategorizované kardinální) Nevyžaduje znalost předchozího rozdělení znaku Očekávané frekvence: dle rozložení kategorií 1 znaku nebo v kontingenční tabulce vztah 2 znaků Odpovídá na otázku, zda jsou rozdíly mezi empirickými (pozorovanými -f O ) četnostmi a teoretickými (očekávanými -f E ) četnostmi náhodné nebo ne. Počet stupňů volnosti df = (r-1) (s-1) r = počet řádků s = počet sloupců v tabulce

27 Chí-kvadrát test nezávislosti Nulová hypotéza o nezávislosti odpovídá na otázku, zda jsou rozdíly mezi empirickými-pozorovanými a teoretickými četnostmi náhodné nebo ne. Očekávané četnosti lze získat z hodnot v populaci nebo porovnávat s teoretickou hodnotou, např. z jiného výzkumu. Nejčastěji třídíme údaje podle dvou nebo více znaků v kontingenční tabulce. Lze aplikovat na již existující agregovaná data (publikované tabulky apod.)

28 Princip testování vztahu 2 a více proměnných Většina statistických testů je založena na srovnání naměřené (empirické) distribuce pozorování do polí tabulky s distribucí, jakou bychom obdrželi, kdyby pozorování byla zařazena do polí tabulky náhodně (teoretická četnost).

29 Příklad: Čtení knih a vzdělání Očekávaná četnost pro dané políčko = násobek odpovídajících marginálních četností vydělíme celkovou sumou četností Např. pro f E 11 je 645*173/1202 = 92,8 Postup pro ruční výpočet Zdroj: data ISSP 2007, ČR (neváženo)

30 V SPSS: Očekávané četnosti (Expected count) a empirické (=absolutní) četnosti (Count) Příklad: Čtení knih a vzdělání Zdroj: data ISSP 2007, ČR (neváženo)

31 Příklad: Čtení knih a vzdělání df = (5-1)(3-1) = 8 při Alpha 0,05 naměřená hodnota χ 2 = 112,17 > χ 2 krit = 15,507 nemůžeme přijmout (zamítáme) H0 o nezávislosti, tj., že ve čtení nejsou rozdíly mezi vzdělanostními kategoriemi alespoň u jedné kategorie (buňce v tabulce) v porovnání s ostatními kategoriemi tabulky se liší očekávané od empirických četností (Test říká, že tuto skutečnost nalezneme s 95 % jistotou v celé populaci.) Místo porovnání hodnoty testovacího kritéria s kritickými tabulkovými hodnotami se pro rozhodování o nulové hypotéze používá také p-hodnota, či significance kterou zjistíme pomocí statistického software (princip viz dále). p < α zamítáme H0 p > α nelze zamítnout H0

32 Kontingenční tabulka a testy dobré shody pozor na: Prázdná pole a nízké četnosti v tabulce mohou zkreslit význam koeficientů měřících souvislost. Pro použití testů založených na testu dobré shody (test nezávislosti nebo homogenity) je třeba, aby se v tabulce vyskytlo méně než 20 % políček, v nichž by očekávané (teoretické) četnosti byly menší než 5. V případě, že se tak stane, můžeme zvážit transformaci sloučení některých méně obsazených kategorií (např. "ano" a "spíše ano").

33 Kontingenční tabulka -vyjádření vztahů kategorií Statistika Chí kvadrát nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa. Pro zjištění síly vztahu - koeficienty asociace (obdobné korelaci: CC), - znaménkové schéma adjustovaná residua - podíl šancí (OR), - u ordinálních veličin korelační koef. dle pořadí. Odlišné testy pro nominální a ordinální proměnné (jedna / obě).

34 Po provedení testu celkové závislosti dvou kategoriálních znaků bychom měli pokračovat analýzou vztahů uvnitř kontingenční tabulky. Test odchylky od nezávislosti v polích tabulky: Adjustovaná residua a znaménkové schéma

35 Test odchylky od nezávislosti v poli tabulky znaménkové schéma V případě zamítnutí hypotézy o celkové nezávislosti, tj. celkové homogenitě tabulky (např. pomocí Chíkvadrát testu) dále hledáme pole tabulky, kde je nezávislost porušena. skryté souvislosti uvnitř tabulky znaménkové schéma odhaluje pole, kde nastává významná závislost

36 Kontingenční tabulka: očekávané četnosti a znaménkové schéma (princip) Očekávané (teoretické) četnosti vyjadřují model rozložení četností, za předpokladu, že by mezi znaky nebyl žádný vztah. = součin marginálních četností (daného políčka) dělený celkovou četností Očekávaná četnost: fo 11 = 2121 * 452 / 3815 [Kapr, Šafář 1969: 186] Znaménka: Rozdíl mezi pozorovanou (absolutní) a očekávanou četností (k učení síly viz dále)

37 Znaménkové schéma Kritérium v daném políčku tabulky (Adjustované residuum) označuje statistickou významnost rozdílu mezi empirickým zjištěnou četností a teoretickou (očekávanou) četností. Umožňuje rychlou orientaci mezi dvěma znaky.

38 Adjustovaná residua (ASRESID) Znaménkové schéma v SPSS / PSPP v CROSSTABS: Adj. standardised (ASRESID) Adjustovaná residua = Residuum v daném políčku tabulky (= Pozorovaná (observed) minus Očekávaná (expected) hodnota) dělené odhadem vlastní standardní chyby. Standardizovaný residuál je vyjádřen v jednotkách směrodatné odchylky nad nebo pod průměrem. Znaménkové schéma jednoduchá vizualizace kde abs(z) >= 3.29 nahradíme +++ resp. --- abs(z) >= 2.58 nahradíme ++ resp. -- abs(z) >= 1.96 nahradíme + resp. Z-skóry ukazují na statistickou významnost odchylky empirických (naměřených) četností od očekávaných (teoretických) četností (viz Normované normální rozložení).

39 Znaménkové schéma měří statistickou významnost odchylek, nikoli jejich velikost. Vznikne na základě adjustovaných reziduí, ty porovnáme s hodnotami z (1,96; 2,58; ), které odpovídají hladinám významnosti 5% (-), 1% (--), 0,1% (---); hladina významnosti α = 0,05 (z >2) 5% riziko chyby našeho závěru; Např. α = 0,06 6% riziko chyby výsledek je statisticky nevýznamný, naznačuje určitou tendenci, ale nejsme schopni ji prokázat s konvenční hladinou spolehlivosti

40 Znaménkové schéma: Znaménka Struktura adjustovaných residuí může skrývat působení nějakých latentních faktorů, které jsou přímo neměřitelné, ale které se v dané asociační struktuře projevují. Jde o latentní vlivy, na které můžeme usuzovat pouze na základě takto zjištěného vnějšího projevu. V praxi je struktura charakterizována, např. tzv. znaménkovým schématem (s volbou hranic pro znaménka: -, + = významné na hladině 0,05; --, ++ = na 0,01; ---, +++ = na 0,001). Rozlišujeme: - simultánní inferenci, postihuje významnou strukturu toku jako celku (implementováno v SPSS v Asresid), - testování postupně všech jednotlivých polí struktura znamének označuje významnost těchto jednotlivých proudů. Zde je schéma znamének v tabulce bohatší, protože prokázat statistickou vlastnost jednoho dílčího proudu bez ohledu na chování ostatních vyžaduje podstatně méně odchylné skóry než přijetí statisticky prokazatelného závěru o šedesáti dílčích proudech současně, tj. přijetí pravděpodobnostně spolehlivého závěru o tom, že všechny označené proudy jsou statisticky významně specifické (slabší nebo silnější) a tudíž jejich struktura může být interpretována jako systematicky vznikající celistvý tok. ZS je běžná rutina československých sociologů, umožňuje názorně pracovat se strukturou asociací v kontingenční tabulce. Je logickým krokem v analýze interakčních vazeb mezi kategoriemi řádků a sloupců. [Řehák, Mánek 1991]

41 Korespondenční analýza jednoduchá pro rozkrytí asociací ve složitější dvourozměrné tabulce 0,32 0,24 0,16 Vstupní data: kontingenční tabulka s31 Typ bydlení 1 Rodinný 3 Menší by4 Větší byttotal 1 Praha Středočeský Jihočeský Plzeňský Karlovarský Ústecký Liberecký Královéhradec Pardubický Vysočina Jihomoravský Olomoucký Zlínský Moravskoslez _Pardubický 7_Liberecký 3_Jihočeský 3_Menší_bytový_dům_(max._6_bytů) 10_Vysočina Axis 2 0,08 6_Ústecký 14_Moravskoslezský 12_Olomoucký 8_Královéhradecký 0 11_Jihomoravský 4_Plzeňský 4_Větší_bytový_dům 1_Rodinný_domek -0,08-0,16 5_Karlovarský 1_Praha 2_Středočeský -0,24 13_Zlínský -0,8-0,6-0,4-0,2 0 0,2 0,4 0,6 Axis 1

42 jednoduchá Korespondenční analýza zde to ovšem není ideální příklad, protože kategorií v tabulce by mělo být alespoň 7x7. Ve verzi SPSS Base korespondenční analýza bohužel není, ale lze vložit kontingenční tabulku (absolutní četnosti) např. do freeware programu PAST. PAST lze si lze stáhnout z (a tento prográmek umí mnohem, mnohem víc...).

43 Opět příklad: Čtení knih a vzdělání: absolutní četnosti, sloupcová %, adjustovaná residua

44 Znaménkové schéma Čtení knih podle vzdělání Vzdělání (3k.) Jak často - Čtení knih ZŠ+VY SŠ VŠ 1 denně --- o několikrát týdně několikrát za měsíc o o o 4 několikrát za rok/ méně často +++ o nikdy

45 CROSSTABS: zadání Chíkvadrátu

46 CROSSTABS: zadání adjustovaných residuí pro znaménkové schéma Samotné znaménkové schéma musíme následně vytvořit ručně z tabulky (dle hodnot z ) a nebo použít skript

47 Procvičit v SPSS 0. kontrola absolutních četností v jednotlivých polích transformace (sloučení) 1. správně orientovaná procenta 2. Chíkvadrát test nezávislosti (tabulky jako celku) 3. adjustovaná residua a znaménkové schéma k detekování významných odchylek Úkol: Pohlaví a volil v 2006 Náboženské vyznání x Volil 2006 Náboženské vyznání x Velikost bydliště Náboženské vyznání x Velikost bydliště x Volil 2006

48 Načtení tabelárních dat v SPSS z agregované existující kontingenční tabulky ( vážení procenty) Věk 1 <49 2 >50 Věk 1 <49 2 >50 Vzdělání 1ZŠ+VY 2 SŠ+VŠ 1ZŠ+VY 2 SŠ+VŠ Volil 1 nevolil Pozice pole v tabulce Vzdělání 1 ZŠ+VY 2 SŠ+VŠ 1 ZŠ+VY 2 SŠ+VŠ Volil 1 nevolil volil volil ****nacteni kontingencni tabulky aneb sekundarni analyza (ČR, ISSP 2007). DATA LIST LIST/vek vzdel volil freq. VAL LAB vzdel 1 "ZŠ+VY" 2 "SŠ+VŠ" / vek 1 "<49" 2 ">50" / volil 1 "nevolil" 2 "volil". BEGIN DATA END DATA. Syntax: crosstab_data_input.sps FORMATS vek vzdel volil freq (f8). WEIGHT by freq. CROSS vzdel by volil by vek. CROSS vzdel by volil.

49 Poměr šancí - ODDS RATIO další možnost vyjádření asociací uvnitř kontingenční tabulky Viz prezentaci Poměr šancí - ODDS RATIO AKD2_odds_ratio.ppt (následuje kopie toho nejdůležitějšího)

50 Pomocí OR můžeme vyjádřit vztahy mezi kategoriemi v kontingenční tabulce VŠ - vzdělání 0 1 Total Volil ne ano Total OR _= f 11 f 22 / f 12 f 21 = f11 f12 f21 f22 OR = (424*68)/(19*674) = 2,25 U vysokoškoláků je v porovnání s ostatními 2,25x vyšší šance, že půjdou volit. V CROSSTABS v SPSS pozor na kódování kategorií (nelze nastavit, pouze překódovat).

51 Úkoly k procvičení v SPSS (data ISSP 2007) 2 x 2 tabulky: Pohlaví a Volil v 2006 Pohlaví a Vzdělání n x n tabulky: Velikost bydliště x Vzdělání sloučení nebo pro vybraná pole tabulky

52 S tříděním druhého stupně bychom se neměli spokojit. Třídění třetího (a vyššího) stupně a elaborace vztahů

53 Vyloučení a zhodnocení vlivu třetího jevu Elaborace vztahů Třídění 3 stupně Kontingenční tabulka A x B x C Příklad: Volil x VŠ x Pohlaví Další možnosti: Parciální asociace/korelace Standardizace podle kontrolního faktoru (převážení) Multivariační metody (je-li závislá proměnná kardinální-číselná např. regresní analýza (OLS), analýza rozptylu (ANOVA); když je kategoriální, např. logistická regrese, loglineární modely)

54 Elaborace Třídění 3 stupně aneb kontrola pro další faktor (opakování z AKD I.)

55 Připomenutí z AKD I. Vícerozměrná analýza: třídění třetího stupně Analyzujeme souběžně vztahy mezi několika proměnnými (nejčastěji více nezávislých vysvětlujících znaků). Princip je stejný jako u dvourozměrné analýzy.

56 Princip vícerozměrné analýzy: třídění 3. stupně (2x2x2 tabulka) Jak často navštěvujete bohoslužby? do 40 let nad 40 let muži ženy muži ženy Rozdíl 9 % bodů Rozdíl 16 % bodů týdně 21% 30% 34% 50% méně často % = (587) (746) (587) (746) Zdroj: General Social Survey, NORC. Závislá proměnná: Chození do kostela souběžně podle 2 nezávislých: Věk, Pohlaví Jak mezi muži tak ženami starší lidé chodí do kostela častěji než mladí (tj. s věkem roste religiozita). V každé věkové kategorii ženy navštěvují kostel častěji než muži. Podle tabulky, pohlaví má nepatrně větší efekt na chození do kostela než věk. Věk a pohlaví mají nezávislý vliv na chození do kostela. Uvnitř každé kategorie nezávislé proměnné odlišné vlastnosti té druhé přesto ovlivňují jednání. Podobně obě nezávislé proměnné mají kumulativní efekt na jednání: Starší ženy chodí do kostela nejčastěji, zatímco mladí muži nejméně často. Zdroj: [Babbie 1997: ] 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 79% 21% 70% 66% 30% 34% 50% 50% muži ženy muži ženy do 40 let týdně méně často nad 40 let

57 Zjednodušení předchozí tabulky: muži ženy do 40 let % méně často dopočet do 100 % (270) (332) nad 40 let (317) (414) Ukazujeme pouze pozitivní kategorie znaku ( do kostela chodí týdně). Při tom neztrácíme žádný údaj. Četnosti v závorkách uvádí procentní základ, z něj lze dopočítat podíl nezobrazené kategorie. Zdroj: [Babbie 1997: 391]

58 Příklad I.: Nepravá souvislost 1. bivariátní vztah (třídění 2.st.) Zdroj: [Disman 1993: ]

59 2. Při kontrole vlivu vzdělání (třídění 3 st.)

60 2. Při kontrole vlivu vzdělání (třídění 3 st.) Zdroj: [Disman 1993: ]

61 Příklad II.: Potlačená souvislost (nepravá nezávislost) 1. bivariátní vztah (třídění 2.st.) Zdroj: [Disman 1993: ]

62 2. s kontrolou pohlaví (třídění 3 st.) muži ženy Kontrola 3 faktoru odhalila potlačenou souvislost (nepravou nezávislost) mezi dvěma proměnnými Příčina zkreslení vztah mezi dvěma proměnnými existuje pouze v části populace

63 Testování/ kontrola vlivu dalšího faktoru Vytvořením samostatných tabulek podle kategorií třetí proměnné je testovaný faktor (třetí proměnná) udržován na konstantní hodnotě. souvislost mezi původními proměnnými je očištěna od zkreslujícího vlivu této další proměnné.

64 Testování vlivu dalšího faktoru Porovnáme intenzitu souvislosti v původní tabulce se souvislosti zjištěnou v nových tabulkách s kontrolou 3 faktoru. Když v nových tabulkách souvislost mezi původními daty zmizí/ je podstatně oslabena souvislost v původní tabulce je funkcí třetího faktoru

65 Třídění 3 st.: kontrola vlivu 3 proměnné: interpretace a uspořádání tabulky Souvisí účast ve volbách s věkem, i při kontrole vlivu vzdělání? Hypotetická data Základní vzdělání Střední vzdělání Vysokoškolské vzdělání < 39 let > 60 let < 39 let > 60 let < 39 let > 60 let Volil 18% 24% 32% 36% 34% 49% 40% 50% 70% Nevolil Celkem 100 % 100 % 100 % 100 % 100 % 100 % 100 % 100 % 100 % N (109) (202) (45) (97) (271) (139) (27) (62) (50) Rozdíly mezi krajními kategoriemi věku: Ptáme se: 14 % 13 % 30 % Zatímco v případě ZŠ a SŠ jsou rozdíly mezi nejmladšími a nejstaršími stejné, tak u VŠ je rozdíl větší. Vzdělání tedy do vztahu mezi volební účastí a věkem částečně intervenuje. 1. Nacházíme rozdíly v X (věk) a Y (volil) uvnitř kategorií kontrolní proměnné Z (vzdělání)? Porovnáme s tabulkou třídění 2. st. Pro X a Y. 2. Jsou rozdíly mezi krajními kategoriemi X (věk) v rámci kategorií kontrolní proměnné Z (vzdělání) stejné?

66 Pozor v SPSS tabulka vypadá jinak. Je možno jí upravit pomocí Pivot tables (v menu): Rozkliknout (2x klik) Pivot Trays a přesunout) Zdroj: data ISSP 2007, ČR (neváženo)

67 Interakční a aditivní efekt Efekt 1 na 2 proměnnou závisí na 3 proměnné Interakční efekt: Dvě proměnné navzájem interagují a vytváří u 3 proměnné jiný výsledek než by měla každá zvlášť Při absenci interakčního efektu lze uvažovat o aditivním efektu, kdy vlivy jsou v principu podobné ale podél kategorií 1 proměnné zesilují/ oslabují

68 Interakční a aditivní efekt Interakční efekt efekt jedné proměnné na druhou závisí na hodnotě třetí proměněné vzdělání Hypotetická data VOLIL ZŠ SŠ VŠ mladí starší Dopočet do 100 % je % Nevolil Odlišný vliv věku v kategoriích vzdělání: u Mladých žádný rozdíl, u Starších se % Volení zvyšuje s vyšším vzděláním. Nejvyšší volební účast je u starších vysokoškoláků. Aditivní efekt efekty obou proměnných se propojují navzájem vzdělání VOLIL ZŠ SŠ VŠ mladí Stejný rozdíl mezi katg. věku v katg. vzdělání starší Podobný vliv věku kategoriích vzdělání

69 Příklad: moderace pohlavím (2) [Bryman 2008: ] Využívá jiné možnosti k pravidelnému cvičení než tělocvičnu x Věk x Pohlaví Pozor absolutní četnosti! Vzorec odpovědí je pro muže a ženy jiný: muži jako celek, ženy nárůst s věkem

70 Interakce (statistická) vzájemný vliv dvou nebo více faktorů, který nastává pouze při jejich současném působení a projevuje se navíc nad samostatné působení jednotlivých faktorů a nad společné působení jen některých z nich. Podle počtu faktorů se hovoří o interakci druhého, třetího, k-tého řádu. Interakce se používá v modelech, ve kterých se hodnoty závisle proměnné vyjadřují jako součet (resp. součin) příspěvků dílčích vlivů nezávislých faktorů a jejich kombinací. Zdroj: [Řehák 1996: 441 (in Velký sociologický slovník)]

71 Odhalení vlivu 3. proměnné pomocí asociačních koeficientů Rychlou identifikaci vlivu 3. proměnné můžeme provést pomocí asociačních koeficientů spočítaných zvlášť v jejích kategoriích. pro nominální znaky: Lambda, Phi, Cramérovo V, Koeficient kontingence pro ordinální znaky: ordinální korelace (Kendaullovo Tau-B a Tau-C, Spermanův korelační koeficient, Gamma) (Viz první část presentace.)

72 Dalším krokem analýzy může být přímá standardizace (podle faktoru Z) Ukazujeme tzv. čistý vztah dvou proměnných očištěný o vliv třetí proměnné. Tabulku standardizujeme (převážíme) podle faktoru Z, tj. jako kdyby všichni v kategoriích X měli stejné podíly v kategoriích Z (např. stejné vzdělání). Jde o analogický postup k parciálním korelacím v případě tří kardinálních (ordinálních) znaků. Viz prezentaci Standardizace v kontingenční tabulce kontrola vlivu 3 faktoru

73 Vztahy mezi X-Y a (Z) podrobněji z hlediska kauzality Moderace a mediace úvod

74 Vztah X-Y a Z: moderace a mediace Mediátor (Z) propojuje příčinu a následek. Příčina ovlivňuje mediátorovou proměnnou a ta pak působí na závislou proměnnou Y. Moderátor (Z) modifikuje přímé působení nezávislé X na závislou proměnnou Y. Stálá vlastnost (např. kontextuální proměnná jako charakteristika okolí) modifikuje příčinnou závislost. [Hendl 2010].

75 Zdroj: [Hendl 2010: 3, 6] Vztah X-Y a Z: moderace a mediace Mediátor Moderátor

76 Literatura Disman, M. (1993): Jak se vyrábí sociologická znalost. Praha: Karolinum. Kapitola 9. Všechno je jinak aneb vícerozměrná analýza. (s ). Babbie, E. (1995). The Practice of social Research. 7th Edition. Belmont: Wadsworth Kapitola 16. Elaboration Model. (s ). Hendl, J Analýza působení mediátorových a moderátorových proměnných Informační Bulletin České statistické společnosti 21(1): Řehák, J., B. Řeháková Analýza kategorizovaných dat v sociologii. Praha: Academia. Treiman, D. J Quantitative data analysis: doing social research to test ideas. San Francisco: Jossey-Bass. Kapitola 2. More on Tables. (s ).

Analýza kvantitativních dat II. 2. Vztahy mezi kategorizovanými znaky v kontingenční tabulce

Analýza kvantitativních dat II. 2. Vztahy mezi kategorizovanými znaky v kontingenční tabulce UK FHS Historická sociologie (LS 2011) Analýza kvantitativních dat II. 2. Vztahy mezi kategorizovanými znaky v kontingenční tabulce Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 23.4. 2011

Více

ADDS cvičení 7. Pavlína Kuráňová

ADDS cvičení 7. Pavlína Kuráňová ADDS cvičení 7 Pavlína Kuráňová Analyzujte závislost věku obyvatel na místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji trávíte dovolenou) Analyzujte závislost

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza) ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza) Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje,

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Návod na statistický software PSPP část 2. Kontingenční tabulky

Návod na statistický software PSPP část 2. Kontingenční tabulky Návod na statistický software PSPP část 2. Kontingenční tabulky Jiří Šafr FHS UK poslední revize 31. srpna 2010 Logika kontingenčních tabulek... 2 Postup vytváření kontingenčních tabulek v PSPP (SPSS)....

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Spokojenost se životem

Spokojenost se životem SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Kontingenční tabulky analýza kategoriálních dat: Úvod. Třídění 2. stupně

Kontingenční tabulky analýza kategoriálních dat: Úvod. Třídění 2. stupně UK FHS Historická sociologie a Řízení a supervize (2011, 2012, 2013, 2014) Analýza kvantitativních dat I. & Praktikum elementární analýzy dat Kontingenční tabulky analýza kategoriálních dat: Úvod. Třídění

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr Kurz SPSS: Jednoduchá analýza dat Jiří Šafr vytvořeno 29. 6. 2009 Dva základní typy statistiky 1. Popisná statistika: metody pro zjišťování a sumarizaci informací grfy, tabulky, popisné chrakteristiky

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Příklad: Test nezávislosti kategoriálních znaků

Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz

Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz UK FHS Historická sociologie (LS 2010) Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz Jiří Šafr jiri.safr(zavináč)seznam.cz vytvořeno 29. 6. 2009, poslední aktualizace 25. 5. 2010

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Příprava souboru dat a analýza

Příprava souboru dat a analýza UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (LS 2007) Kvantitativní metody výzkumu v praxi PRAKTIKUM část 2 Příprava souboru dat a analýza Jiří Šafr jiri.safr@seznam.cz vytvořeno

Více

Analýza kvantitativních dat II. Testování hypotéz (1) a asociace mezi znaky v kontingenční tabulce

Analýza kvantitativních dat II. Testování hypotéz (1) a asociace mezi znaky v kontingenční tabulce UK FHS Historická sociologie Analýza kvantitativních dat II. Testování hypotéz (1) a asociace mezi znaky v kontingenční tabulce Jiří Šafr jiri.safr(at)seznam.cz Poslední aktualizace 26/1/2014 OBSAH 1.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 9: Úvod do induktivní statistiky Obsah Induktivní statistika... 2 Kdy můžeme zobecňovat?... 2 Logika statistické indukce... 3 Proč nelze jednoduše

Více

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Analýza kvantitativních dat II. Standardizace v kontingenční tabulce kontrola vlivu 3 faktoru

Analýza kvantitativních dat II. Standardizace v kontingenční tabulce kontrola vlivu 3 faktoru UK FHS Historická sociologie (LS 2013+) Analýza kvantitativních dat II. Standardizace v kontingenční tabulce kontrola vlivu 3 faktoru Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 13.1. 2015

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Excel mini úvod do kontingenčních tabulek

Excel mini úvod do kontingenčních tabulek UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (ZS 2005+) Kvantitativní metody výzkumu v praxi Excel mini úvod do kontingenčních tabulek (nepovinnáčást pro KMVP) Jiří Šafr jiri.safratseznam.cz

Více

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient PSY117/454 Statistická analýza dat v psychologii Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient Analýza vztahů mezi dvěma proměnnými Souvisí nějak? Výška a váha Známky u jednotlivých

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Návrhy dalších možností statistického zpracování aktualizovaných dat

Návrhy dalších možností statistického zpracování aktualizovaných dat Návrhy dalších možností statistického zpracování aktualizovaných dat Při zjišťování disparit ve fyzické dostupnosti bydlení navrhuji použití těchto statistických metod: Bag plot; Krabicové grafy a jejich

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky Vladimíra Hovorková Valentová Iva Nedomlelová 17. 6. 2010 Cíl příspěvku provedení analýz a dalších

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů. Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno ÚVOD DO LOGLINEÁRNÍHO MODELOVÁNÍ historie - až do 60. let se k analýze kontingenčních tabulek

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu. PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT Všichni žijeme v matrixu. V minulých dílech jsme viděli/y: Frekvence = četnosti Procenta =

Více

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více