Korelace. Komentované řešení pomocí MS Excel

Podobné dokumenty
KORELACE. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Lineární regrese. Komentované řešení pomocí MS Excel

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Popisná statistika. Komentované řešení pomocí MS Excel

Jednovýběrové testy. Komentované řešení pomocí MS Excel

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Pearsonův korelační koeficient

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testy nezávislosti kardinálních veličin

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Regresní a korelační analýza

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 9. Filip Děchtěrenko

Charakteristika datového souboru

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Tomáš Karel LS 2012/2013

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Aplikovaná statistika v R - cvičení 2

TECHNICKÁ UNIVERZITA V LIBERCI

Korelační a regresní analýza

Testování statistických hypotéz

Testování hypotéz a měření asociace mezi proměnnými

Statistická analýza jednorozměrných dat

= = 2368

Zápočtová práce STATISTIKA I

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

INDUKTIVNÍ STATISTIKA

TECHNICKÁ UNIVERZITA V LIBERCI

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Téma 9: Vícenásobná regrese

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

KGG/STG Statistika pro geografy

, Brno Hanuš Vavrčík Základy statistiky ve vědě

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Regresní a korelační analýza

Ilustrační příklad odhadu LRM v SW Gretl

Regresní a korelační analýza

Regresní a korelační analýza

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Jednostranné intervaly spolehlivosti

Kontingenční tabulky, korelační koeficienty

Tomáš Karel LS 2012/2013

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

6. Lineární regresní modely

Testy statistických hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistické testování hypotéz II

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Kontingenční tabulky, korelační koeficienty

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika (KMI/PSTAT)

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

NEPARAMETRICKÉ TESTY

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Stručný úvod do testování statistických hypotéz

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Vzorová prezentace do předmětu Statistika

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Inovace bakalářského studijního oboru Aplikovaná chemie

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Plánování experimentu

Cvičení 12: Binární logistická regrese

You created this PDF from an application that is not licensed to print to novapdf printer (

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Kanonická korelační analýza

Testování statistických hypotéz. Obecný postup

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

S E M E S T R Á L N Í

Transkript:

Korelace Komentované řešení pomocí MS Excel

Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne bodový graf, do kterého navíc přidáme graf regresní funkce (detailní postup tvorby viz. úloha lineární regrese) Z bodového grafu je patrné, že mezi docházku a počtem bodů je pozitivní lineární závislost. Tato závislost je však dosti slabá, o čemž svědčí i velmi malý koeficient determinace R 2 = 0,0687. Pomocí docházky by se nám tedy podařilo vysvětlit pouze necelých 7 % variability počtu bodů. Z převážné části jsou tedy bodové rozdíly jednotlivých studentů ovlivněny jinými faktory. Z bodového grafu je také vidět, že studenty lze rozdělit v zásadě do dvou skupin na ty, kteří chodí pravidelně (účast nad 70 %), těch je většina, a na ty, kteří nechodí skoro vůbec (účast pod 20 %).

Základní statistiky Abychom získali základní představu o studovaných datech, spočítáme si průměr (míra polohy), směrodatnou odchylku (míra variability) a Pearsonův korelační koeficient (síla lineární závislosti.

Postup: Histogram docházka Chceme-li použít test nenulovosti korelačního koeficientu, musíme nejdříve ověřit normalitu obou proměnných (ve skutečnosti bychom měli ověřit dvourozměrnou normalitu, to je však obtížné). K ověření (jednorozměrné) normality použijeme histogram a Q-Q graf. Tvorba obou grafů je detailně popsána v prezentaci k úloze na jednovýběrové testy. Interpretace výsledků Z histogramu je patrné, že empirické rozdělení docházky (modré sloupce) se výrazně liší od normálního rozdělení (červené sloupce). Empirické rozdělení je bimodální, čímž se potvrdila naše domněnka o existenci dvou skupin studentů, s pravidelnou účastí a s minimální účastí. Z výše uvedeného vyplývá, že normalitu v případě docházky předpokládat nemůžeme.

Histogram body Interpretace výsledků Ve srovnání s docházkou je rozdělení počtu bodů blíže normálnímu rozdělení. Ale i v případě počtu bodů jsou jisté rozdíl oproti normálnímu rozdělení patrné. Hlavní rozdíl je zjevné zešikmení empirického rozdělení, zatímco normální rozdělení je symetrické. Pro lepší představu se ještě podíváme na Q-Q graf (viz. další snímek).

Q-Q grafy Interpretace výsledků Q-Q grafy potvrzují naše předchozí zjištění. Rozdělení docházky se výrazně liší od normálního. Rozdělení bodů se více podobá normálnímu rozdělení, ale i tak je zde patrný systematický rozdíl. Předpoklad normality tedy přijmout nemůžeme a nadále tedy musíme s testem korelace pracovat jako s asymptotickým testem a výsledky musíme interpretovat opatrněji.

Postup Asymptotický test nezávislosti Dosazením do vzorce spočítáme testovou statistiku a jelikož nemáme předem zadánu požadovanou hladinu významnosti, dopočítáme p-hodnotu pro obě alternativy - oboustrannou pro úlohu A) a jednostrannou pro úlohu B). K tomu se použije funkce TDIST. Závěr Úloha A) Na základě spočítané p-hodnoty 0,0167 můžeme zamítnout na hladině významnosti 5 % nulovou hypotézu o nezávislosti ve prospěch oboustranné alternativy. Prokázali jsme tedy existenci lineární závislosti. Připomeňme ovšem, že na hladině významnosti 1 % už bychom nulovou hypotézu o nezávislosti nezamítali. Navíc spočítaná p-hodnota je jen přibližná, protože se jedná o asymptotický. Závěr o existenci lineární závislosti je tedy na hranici prokazatelnosti. Úloha B) V případě jednostranné alternativy vychází p-hodnota 0,0083. Tvrzení o existenci pozitivní lineární závislosti docházky a počtu bodů je tedy prokázáno i na hladině významnosti 1 %. I v tomto případě se však jedná pouze o přibližnou p-hodnotu. Prokázali jsme tedy, že dobrá docházka má pozitivní vliv na výsledky studentů v testech. Tento vliv je však relativně slabý.