Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.



Podobné dokumenty
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Statistické metody uţívané při ověřování platnosti hypotéz

Vzorová prezentace do předmětu Statistika

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Pearsonův korelační koeficient

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Jana Vránová, 3. lékařská fakulta UK

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statistické testování hypotéz II

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování hypotéz a měření asociace mezi proměnnými

Cvičení 12: Binární logistická regrese

KGG/STG Statistika pro geografy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Analýza dat z dotazníkových šetření

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Aplikovaná statistika v R - cvičení 2

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

ADDS cviceni. Pavlina Kuranova

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

, Brno Hanuš Vavrčík Základy statistiky ve vědě

KORELACE. Komentované řešení pomocí programu Statistica

Tomáš Karel LS 2012/2013

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Analýza dat na PC I.

Jednostranné intervaly spolehlivosti

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Jednofaktorová analýza rozptylu

Návod na vypracování semestrálního projektu

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Metodologie pro Informační studia a knihovnictví 2

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

= = 2368

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Korelace. Komentované řešení pomocí MS Excel

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz

Úvod do statistické metodologie

Zápočtová práce STATISTIKA I

Úvodem Dříve les než stromy 3 Operace s maticemi

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Tabulka 1. Výběr z datové tabulky

You created this PDF from an application that is not licensed to print to novapdf printer (

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

INDUKTIVNÍ STATISTIKA

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Cvičení ze statistiky - 9. Filip Děchtěrenko

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Ilustrační příklad odhadu LRM v SW Gretl

Kontingenční tabulky, korelační koeficienty

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Kontingenční tabulky, korelační koeficienty

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Korelační a regresní analýza

ADDS cvičení 7. Pavlína Kuráňová

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Testy. Pavel Provinský. 19. listopadu 2013

KGG/STG Statistika pro geografy

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Charakteristika datového souboru

MATEMATIKA III V PŘÍKLADECH

Porovnání dvou výběrů

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Neparametrické metody

STATISTICKÉ TESTY VÝZNAMNOSTI

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Transkript:

Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D.

OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní protokoly, statistické rozhodování a závislosti mezi proměnnými, test nezávislosti dvou kategoriálních znaků, t-testy, analýza rozptylu, základní neparametrické testy, korelační analýza, včetně příkladů použití.

Spuštění systému a vstupní tabulky Systém STATISTICA je možno spustit několika způsoby Okno aplikace STATISTICA má podobný vzhled jako jiné programy

Okno aplikace STATISTICA

Získávání vstupních dat Pokud jsou data již někde uložena, stačí je importovat do systému STATISTICA (seznam formátů, které mohou být v systému otevřeny lze najít v položce Soubory typu, dialogu Otevřít). V případě, že data shromažďujeme, můžeme tak činit prostřednictvím tabulky systému STATISTICA. Ukázka

Práce s daty ve vstupní tabulce Před analýzou dat je potřeba vždy ověřit, zda je datová tabulka v pořádku Ověřování dat (hodnoty/statistiky) Výběr podskupin dat

Zobrazování dat Výsečové grafy Výsečový graf z Pohlaví autoregulace_data 64v*708c Muž; 98; 14% Žena; 610; 86% Pohlaví

Výstupy, pracovní sešity a protokoly

Histogram a jiné grafy

Popisná statistika Statistika je nástroj, který slouží k popisu souboru dat a který napomáhá k odhalení zákonitostí mezi nimi. K dispozici musíme mít vždy nějaká měření. Typy vstupních znaků, se kterými statistika pracuje.

Typy dat Kategorizované proměnné (do jaké kategorie respondent nebo případ patří) - nominální (nemá smysl pořadí kategorií) - ordinální (uspořádání, které vychází z logiky kategorií, lze seřadit vzestupně nebo sestupně) Číselné proměnné (informace, kde se primárně ptáme na nějaké číslo) - intervalová - poměrová (vyjádřena číselně sama o sobě)

Míra závislosti mezi proměnnými Jestliže jsou obě proměnné nominální nebo ordinální, použijeme kontingenční tabulku (chí-kvadrát), např. rozdíly v postoji ke škole (pozitivní, negativní) podle jejich motivace (vnitřní, vnější). Jestliže je jedna proměnná nominální a druhá metrická (poměrová, intervalová), použijeme t-test, např. rozdíly v EQ u studentů prvních a posledních ročníků gymnázií. Jestliže je jedna proměnná metrická a druhá nominální s více kategoriemi (nebo ordinální), použijeme analýzu rozptylu, např. rozdíly v testu tvořivosti v různých věkových kategoriích. Jestliže jsou obě proměnné metrické nebo ordinální a zjišťujeme souvislost, použijeme test korelace.

Popisná statistika Datová tabulka určení typu dat (jak je nejvýhodněji zobrazit a popsat) Tabulky četností Kontingenční tabulky Popisné statistiky Popis né statistiky (autoregulace_data) Proměnná N platných Průměr Minimum Maximum Sm.odch. Motivační orientace 708 3,188912 1,000000 6,750000 1,092185 Osobní zdatnos t 708 4,652807 2,187500 6,812500 0,887921 Metakognitivní strategie 708 4,228006 1,000000 7,000000 1,166537 Smys luplnost s tudia 708 4,854520 1,000000 7,000000 1,138008

Statistická indukce Těžiště moderní statistiky nespočívá v popisné statistice. V praxi je daleko užitečnější statistická indukce. Soubor metod navržených pro situace, kdy nemáme k dispozici kompletní informace o všech zkoumaných jednotkách. Umožňují nám zobecnit výběrová data na celou populaci, samozřejmě s určitou pravděpodobností.

Testování hypotéz Při testování hypotéz formulujeme dvě vzájemně si odporující hypotézy. Nulová hypotéza vyjadřuje náš konzervatismus, že např. lék neměl žádný efekt, že změna je jen dílem náhody.

Postup Stanovení nulové a alternativní hypotézy. Volba matematicko-statistické metody vedoucí k rozhodnutí ve prospěch H 0 nebo H A. Volba spolehlivosti. Kritérium pro rozhodnutí (signifikance).

Spolehlivost Před samotným testováním volíme spolehlivost, s jakou budeme chtít pracovat. Standardně se stanovuje 95%. Povolujeme riziko max. 5%, že uděláme chybu.

Signifikance Nejpodstatnější hodnota. Pravděpodobnost toho, že zamítneme nulovou hypotézu, ačkoliv ona platí. Předem jsme si stanovili, že chceme pracovat s pravděpodobností 95%. Signifikance nám toto riziko vyčísluje. Hodnota mezi 0 a 1, označujeme ji písmenem p. p < 0,05 zamítám H 0 p > 0,05 nezamítám H 0 riziko by bylo větší než 5%

Test nezávislosti chí-kvadrát Rozdíly v úspěšnosti studenta ve škole podle jeho motivace. H 0 : Ú AM = Ú NM H A : Ú AM Ú NM p < 0,05, zamítáme nulovou hypotézu Zjistili jsme statisticky významný rozdíl v úspěšnosti u motivovaných a nemotivovaných studentů (p = 0,001).

Souhrnná tabulka Souhrnná tab.: Očekávané četnos ti (pracovni_s es it3) Četnost označených buněk > 10 Pearsonův chí-kv. : 24,1252, sv=1, p=,000001 ús pěšnost motivace A motivace N Řádk. součty A 12,50000 11,50000 24,00000 B 12,50000 11,50000 24,00000 Vš.skup. 25,00000 23,00000 48,00000

T-test Zda ženy dosahují stejného skóre v testu jako muži. H 0 : P M = P Ž (ženy dosahují stejných výsledků jako muži) H A : P M P Ž T- test nezávislé dle skupin p < 0,05, zamítáme nulovou hypotézu t-testy; grupováno: pohlaví (pracovni_ses it3) Skup. 1: M Skup. 2: Ž Průměr Průměr t sv p Poč.plat Poč.plat. Sm.odch. Sm.odch. F-poměr p Proměnná M Ž M Ž M Ž Rozptyly Rozptyly test 9,166667 15,11111-4,63412 46 0,000030 12 36 4,108380 3,762809 1,192112 0,655650

T-test Zda studenti udělali pokrok v úspěšnosti z testu (mezi testem v úvodu semestru a po skončení semestru). H 0 : P T = P T2 (ženy dosahují stejných výsledků jako muži) H A : P T P T2 T- test pro závislé vzorky p < 0,05, zamítáme nulovou hypotézu

ANOVA Zajímá nás vliv kategoriálních proměnných (více než dvě kategorie nezávisle proměnné) na kvantitativní proměnnou. H 0 mezi skupinami není statisticky významný rozdíl H A mezi skupinami je statisticky významný rozdíl Zda se úroveň autoregulace učení liší podle oboru, který student studuje. Analýza rozptylu (autoregulace_data) Označ. efekty jsou význ. na hlad. p <,05000 SČ SV PČ SČ SV PČ F p Proměnná efekt efekt efekt chyba chyba chyba Celkem 14,86296 3 4,954320 372,2932 700 0,531847 9,315303 0,000005

ANOVA 4,8 Kategoriz. krabicový graf: Celkem: =mean(v11:v50) 4,7 4,6 4,5 Celkem 4,4 4,3 4,2 4,1 4,0 3,9 filologie soc.ped. učitelství ošetřovatelství Obor_kategorieI Průměr Průměr±SmCh Průměr±1,96*SmCh

Post-hoc testy Obor_kategorieI 1 {1} 2 {2} 3 {3} 4 {4} LSD test; proměnná: Celkem (autoregulace_data) Označ. rozdíly jsou významné na hlad. p <,05000 {1} {2} {3} {4} M=4,0659 M=4,4038 M=4,5097 M=4,1994 0,000002 0,002173 0,175376 0,000002 0,434757 0,016708 0,002173 0,434757 0,042040 0,175376 0,016708 0,042040

Korelační analýza Korelační analýza zkoumá vzájemný vztah kvantitativních proměnných. Všechny proměnné mají stejné postavení a závislosti jsou považovány za oboustranné. Místo závislosti proto mluvíme o souvislost. K měření intenzity souvislosti se nejčastěji používá Pearsonův koeficient korelace označovaný písmenem r. Jde o charakteristiku, která nabývá hodnot mezi [-1, 1]. Záporné hodnoty značí nepřímou souvislost (když jedna veličina roste, druhá klesá), kladné hodnoty značí pozitivní souvislost (obě veličiny se pohybují stejným směrem). Je-li hodnota 0, znamená to, že mezi proměnnými neexistuje souvislost.

Korelační analýza Jaká je souvislost mezi oblastmi autoregulace učení studentů FHS? Proměnná Motivační orientace Osobní zdatnos t Metakognitivní strategie Smys luplnost s tudia Korelace (autoregulace_data) Označ. korelace js ou významné na hlad. p <,05000 N=708 (Celé případy vynechány u ChD) Průměry Sm.odch. Motivační Osobní Metakognitivní Smys luplnost orientace zdatnost strategie studia 3,188912 1,092185 1,000000 0,275658 0,364673 0,512013 4,652807 0,887921 0,275658 1,000000 0,254081 0,360801 4,228006 1,166537 0,364673 0,254081 1,000000 0,445250 4,854520 1,138008 0,512013 0,360801 0,445250 1,000000

Předpoklady použití testů Normalita dat (výběr pochází z normálního rozdělení) Statistika Základní statistiky Tabulky četností Normalita H 0 : Data pochází z normálního rozdělení H A : Data nepochází z normálního rozdělení Homogenita rozptylu (shodnost rozptylů) součástí t- testu a ANOVY (platí stejné hypotézy jako u normality)

Neparametrická statistika Pokud nejsou splněny předpoklady použití testů, musíme přistoupit k neparametrickému testování

Výběr neparametrického testu Jaké jsou rozdíly v úrovni autoregulace učení studentů mezi muži a ženami? Víme, že nejsou splněny požadavky pro použití testu. Systém nám nabízí možnosti použití testu.