ADDS cvičení 7. Pavlína Kuráňová



Podobné dokumenty
Analýza dat z dotazníkových šetření

Příklad: Test nezávislosti kategoriálních znaků

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

ADDS cviceni. Pavlina Kuranova

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Návod na statistický software PSPP část 2. Kontingenční tabulky

Testování hypotéz a měření asociace mezi proměnnými

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Analýza kvantitativních dat II. 2. Vztahy mezi kategorizovanými znaky v kontingenční tabulce

Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

12. cvičení z PST. 20. prosince 2017

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma

Statistické metody uţívané při ověřování platnosti hypotéz

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

4ST201 STATISTIKA CVIČENÍ Č. 7

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Analýza kvantitativních dat II. Testování hypotéz (1) a asociace mezi znaky v kontingenční tabulce

Seminář 6 statistické testy

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Seminář 6 statistické testy

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

1.1 Úvod Data Statistická analýza dotazníkových dat 8. Literatura 10

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Jana Vránová, 3. lékařská fakulta UK

Korelační a regresní analýza

Korelace. Komentované řešení pomocí MS Excel

Testy dobré shody TESTY DOBRÉ SHODY (angl. goodness-of-fit tests), : veličiny X, Y jsou nezávislé nij eij

Opakování: Nominální proměnná více hodnotová odpověď.

TECHNICKÁ UNIVERZITA V LIBERCI

Kontingenční tabulky, korelační koeficienty

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Aplikovaná statistika v R - cvičení 2

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

KGG/STG Statistika pro geografy

Testy. Pavel Provinský. 19. listopadu 2013

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Kontingenční tabulky, korelační koeficienty

Cvičení 12: Binární logistická regrese

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

F p Test. statistika p 13,9 <,001 Muž 249 <,001 Žena 281 <,001. T test t df p Průměrný rozdíl 5, ,48 <,001 4,56

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Opakování: Nominální proměnná více hodnotová odpověď.

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Přednáška X. Testování hypotéz o kvantitativních proměnných

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Regresní a korelační analýza

TECHNICKÁ UNIVERZITA V LIBERCI

4EK211 Základy ekonometrie

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Testování hypotéz. 4. přednáška

INDUKTIVNÍ STATISTIKA

= = 2368

Ilustrační příklad odhadu LRM v SW Gretl

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

TECHNICKÁ UNIVERZITA V LIBERCI

Vzorová prezentace do předmětu Statistika

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Neparametrické metody

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ČVUT FAKULTA DOPRAVNÍ

TECHNICKÁ UNIVERZITA V LIBERCI

Cvičení ze statistiky - 9. Filip Děchtěrenko

Fisherův exaktní test

Cvičení ze statistiky - 8. Filip Děchtěrenko

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Příloha č. 3. Kombinační třídění

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

LEKCE 7 ZÁKLADY BIVARIAČNÍ ANALÝZY

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

You created this PDF from an application that is not licensed to print to novapdf printer (

Statistika. Semestrální projekt

Transkript:

ADDS cvičení 7 Pavlína Kuráňová

Analyzujte závislost věku obyvatel na místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji trávíte dovolenou)

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: 1) Překódujeme proměnnou věk do skupin (respondenti 15-59 let; do 25-ti; 25 35, 35-45; nad 45 let ) Transform Visual Binning Jaký je Váš věk Vypisujeme hodnoty Value a popis Label Vizuální kontrola, přes tabulku četností Analyze Descriptive Statistics - Frequencies

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: Analyze Descriptive Statistics - CrossTabs

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: Analyze Descriptive Statistics CrossTabs položka Cells Observed i Expected a úprava tabulky přes pivotování

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: 2) Jaké hypotézy testujeme v kontingenční tabulce? Jaké testy k tomu požíváme? S jakými předpoklady?

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: 2) Jaké hypotézy testujeme v kontingenční tabulce? Jaké testy k tomu požíváme? S jakými předpoklady? hypotéza o shodnosti struktury (homogenity), hypotéza o nezávislosti, hypotéza o symetrii. Všechny hypotézy se matematicky formulují pomocí očekávaných četností, testuje se pomoc statistiky χ 2 nebo pomocí věrohodnostního poměru.

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: 2) Jaké hypotézy testujeme v kontingenční tabulce? Jaké testy k tomu požíváme? S jakými předpoklady? hypotéza o shodnosti struktury (homogenity), výpočet pomocí statistiky χ 2 Předpoklady:

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: 2) Jaké hypotézy testujeme v kontingenční tabulce? Jaké testy k tomu požíváme? S jakými předpoklady? hypotéza o shodnosti struktury (homogenity), výpočet pomocí statistiky χ 2 Předpoklady: Alespoň 80% očekávaných četností musí být větších než 5. Všechny očekávané četnosti musí být větší než 1.

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení:

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Řešení: Analyze Descriptive Statistics CrossTabs položka Statistics Chi-Square Můžeme pokračovat? Nějaký nápad na řešení?

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Závěr: Co jsem analyzoval jaká byla hypotéza a jaká alternativa?

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Závěr: Co jsem analyzoval jaká byla hypotéza a jaká alternativa? H 0 : Proměnné věk a místo kam nejraději cestujete jsou nezávislé. H A : Proměnné věk a místo kam nejraději cestujete jsou závislé..

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Závěr: Co jsem analyzoval jaká byla hypotéza a jaká alternativa? H 0 : Proměnné věk a místo kam nejraději cestujete jsou nezávislé. H A : Proměnné věk a místo kam nejraději cestujete jsou závislé.. Nezamítáme nulovou hypotézu o nezávislosti proměnných věk a místem, kam respondenti nejraději cestují.

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Další testy nezávislosti proměnných: Pearsonův kontingenční koeficient Koeficient φ Cramérovo V Analyze Descriptive Statistics CrossTabs položka Statistics Chi-Square Contingency Coefficient, Phi and Cramer s V

Analyzujte závislost věku obyvatel a místě kde nejčastěji tráví dovolenou. (dotazník stejný dovolená, sloupce Jaký je Váš věk a Kde nejčastěji cestujete) Další testy nezávislosti proměnných: Pearsonův kontingenční koeficient Koeficient φ Cramérovo V Na základě výsledků vidíme že nemůžeme zamítnout nulovou hypotézu o nezávislosti proměnných.

navíc adjustovaná rezidua? Adjustovaná residua???

navíc adjustovaná rezidua? Adjustovaná residua??? Residuum v daném políčku tabulky (= Pozorovaná (observed) minus Očekávaná (expected) hodnota) dělené odhadem vlastní standardní chyby. Standardizovaný residuál je vyjádřen v jednotkách směrodatné odchylky nad nebo pod průměrem. e ij A = n ij o ij o ij 1 p i+ 1 p +j Znaménkové schéma jednoduchá vizualizace, kde abs(z) >= 3.29 nahradíme +++ resp. --- abs(z) >= 2.58 nahradíme ++ resp. -- abs(z) >= 1.96 nahradíme + resp. -

navíc adjustovaná rezidua? Adjustovaná residua Znaménkové schéma jednoduchá vizualizace, abs(z) >= 3.29 nahradíme +++ resp. --- abs(z) >= 2.58 nahradíme ++ resp. -- abs(z) >= 1.96 nahradíme + resp. - Analyze Descriptive Statistics CrossTabs položka Cells Adjusted Standardized Z tabulky je patrné že doplníme jen + nebo jen -. Mezi proměnnými opravdu neexistuje významná závislost.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. (dotazník stejný dovolená, sloupce Jste a Máte děti) Řešení: Formulace H 0 a H A H 0 : Mezi pohlavím a počtem dětí neexistuje závislost. H A : Proměnné pohlaví a počet dětí jsou závislé.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. (dotazník stejný dovolená, sloupce Jste a Máte děti) Analyze Descriptive Statistics CrossTabs položka Cells Expected, Observed, Adjusted Standardized

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. (dotazník stejný dovolená, sloupce Jste a Máte děti) Všechny Expected Count jsou větší než 5, mohu pokračovat v testování.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. (dotazník stejný dovolená, sloupce Jste a Máte děti) Na hladině významnosti 1% i 5% zamítám nulovou hypotézu. Mezi proměnnými existuje významná závislost.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. Míry závislosti založené na Pearsonově chí-kvadrát Na hladině významnosti 1% i 5% zamítám nulovou hypotézu. Mezi proměnnými existuje významná závislost.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Viz příklad z předchozí hodiny. Míry závislosti založené na Pearsonově chí-kvadrát Doporučení: tabulky s alespoň jednou dichotomickou proměnnou Crameruv koecient; jinak korigovaný Pearsonuv koeficient; častěji se koeficienty kontingence používají pro porovnání intenzity závislosti.

Příklad 2. navíc adjustovaná rezidua? Adjustovaná residua Znaménkové schéma jednoduchá vizualizace, abs(z) >= 3.29 nahradíme +++ resp. --- abs(z) >= 2.58 nahradíme ++ resp. -- abs(z) >= 1.96 nahradíme + resp. - Analyze Descriptive Statistics CrossTabs položka Cells Adjusted Standardized Z tabulky je patrné že mezi proměnnými opravdu existuje významná závislost.

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Jaké další míry závislosti máme? Asymetrické míry: lambda Goddman - kruskalovo tau Koeficient neurčitosti

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Analyze Descriptive Statistics CrossTabs položka Statistics Lambda, Uncertainty Coefficient

Příklad 2. Analyzujte závislost proměnných pohlaví a počtu dětí. Formulace H 0 a H A H 0 : Mezi pohlavím a počtem dětí existuje jednostranná závislost. H A : H 0 Výsledek? Zamítám H 0 ve prospěch alternativy nebo nezamítáme H 0