TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

Podobné dokumenty
Zpracování chybějících dat a dat mimo rozsah

Textové popisky. Typ dat

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

ZÁKLADNÍ VYHODNOCENÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

KGG/STG Statistika pro geografy

Soutěž: Nejméně kliknutí

Zobrazení zdrojových dat u krabicového grafu

Tvar dat a nástroj přeskupování

Cvičení 12: Binární logistická regrese

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

INDUKTIVNÍ STATISTIKA

Úvod do statistické metodologie

StatSoft Jak poznat vliv faktorů vizuálně

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Korelace. Komentované řešení pomocí MS Excel

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Popisná statistika kvantitativní veličiny

4ST201 STATISTIKA CVIČENÍ Č. 7

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová Ing. Miloš Uldrich

Vzorová prezentace do předmětu Statistika

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Generování dat. Generování pomocí funkcí

Seminář 6 statistické testy

Slučování tabulek. Sloučení dvou tabulek

Analýza dat z dotazníkových šetření

ADDS cviceni. Pavlina Kuranova

StatSoft Jak vyzrát na datum

Tomáš Karel LS 2012/2013

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová

You created this PDF from an application that is not licensed to print to novapdf printer (

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. PORTÁL KUDY KAM. Manuál pro administrátory. Verze 1.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

TECHNICKÁ UNIVERZITA V LIBERCI

Export tabulky výsledků

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Příprava dat v softwaru Statistica

Jana Vránová, 3. lékařská fakulta UK

Testy. Pavel Provinský. 19. listopadu 2013

Diagnostika regrese pomocí grafu 7krát jinak

Statistické metody uţívané při ověřování platnosti hypotéz

Téma 9: Vícenásobná regrese

Hromadné vkládání multimédii k předmětu (přírůstku)

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Předpovídejte snadno a rychle

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

TECHNICKÁ UNIVERZITA V LIBERCI

Příklad: Test nezávislosti kategoriálních znaků

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Grafy opakování a prohloubení Při sestrojování grafu označíme tabulku a na kartě Vložit klikneme na zvolený graf

Import dat ve formátu txt

Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Excel tabulkový procesor

Manuální kroková regrese Newsletter Statistica ACADEMY

EXCEL IV. část. 7. Vzorce a funkceuložení, tisk a doplňky 8. Používané zkratky. Zpracoval: Ing. Pavel branšovský. pro potřebu VOŠ a SŠSE

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Návod na statistický software PSPP část 2. Kontingenční tabulky

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

4EK211 Základy ekonometrie

Návod na vypracování semestrálního projektu

Seminář 6 statistické testy

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

NEPARAMETRICKÉ TESTY

Pearsonův korelační koeficient

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Použijeme-li prostorový typ grafu, můžeme pro každou datovou zvolit jiný tvar. Označíme datovou řadu, zvolíme Formát datové řady - Obrazec

Konzervace, restaurování 2

Metodologie pro Informační studia a knihovnictví 2

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Tomáš Karel LS 2012/2013

3 Testy shody, závislost dvou kategoriálních veličin

KAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

Neparametrické metody

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Tabulka 1. Výběr z datové tabulky

Tabulkový kalkulátor. Tabulkový kalkulátor. LibreOffice Calc 12.část

Vytvoření uživatelské šablony

Manuál: Editace textů v textovém editoru SINPRO Úprava tabulek a internetových odkazů, řádkování

Kontingenční tabulky, korelační koeficienty

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Pravidla pro tvorbu tabulek a grafů v protokolech z laboratoří fyziky

Excel 2007 praktická práce

Testování statistických hypotéz

KORELACE. Komentované řešení pomocí programu Statistica

LIMITY APLIKACE STATISTICKÝCH TESTŮ VÝZNAMNOSTI V PEDAGOGICKÉM VÝZKUMU: SEMINÁŘ PRO NESTATISTIKY

Transkript:

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

Copyright StatSoft CR s.r.o. 2014 Dell Information Management Group, Dell Software Ringhofferova 115/1 155 21 Praha 5 Zličín tel.: +420 233 325 006 fax: +420 233 324 005 e-mail: info@statsoft.cz www.statsoft.cz Všechna práva vyhrazena. Kopírování, rozmnožování, publikování nebo přenos jakékoli části této publikace elektronickou, mechanickou, magnetickou, optickou, fotografickou nebo jakoukoli jinou cestou je zakázán bez písemné dohody se StatSoft CR (Dell Software Group).

OBSAH: 1. GRAFY 4 2. TABULKY ČETNOSTÍ (RELATIVNÍ ČETNOST) 5 3. TESTOVÁNÍ HYPOTÉZ O NEZÁVISLOSTI 2 ZNAKŮ 6 1

1 ÚVOD Cílem manuálu je seznámení s postupem vyhodnocení závislosti 2 kategoriálních znaků v programu Statistica a rychle se zorientovat. Editor textových hodnot Dvojklikem na záhlaví každé proměnné můžeme vyvolat dialog konkrétní proměnné a v části Textové hodnoty se lze podívat, jestli se zde nějaký text (kterému by software přiřadil číselnou reprezentaci) nevyskytuje: Textový popisek má od softwaru přiřazenu číselnou reprezentaci, pokud je proměnná typu Double, lze se na tuto reprezentaci v Editoru textových hodnot podívat. Pokud je proměnná typu Text, přiřazení čísel proběhne automaticky až v případě využití proměnné k analýze. Máteli v softwaru kategorické proměnné, které budou vstupovat do analýz jako grupovací proměnné (faktory), doporučujeme mít všechny tyto proměnné jako číselný typ Double s právě zmíněnými textovými popisky. Číselnou reprezentaci si mohu libovolně překódovat (v Editoru textových hodnot) na vlastní hodnoty (vhodné a využitelné například u pořadí sloupcových grafů nebo při řazení případů číselně, apod.). Změnu z Text na Double provedeme buď jednotlivě ve specifikaci jednotlivých 2

proměnných nebo hromadně ve specifikaci všech proměnných, tedy po kliknutí na tlačítko Všechny specif. v dialogu kterékoli proměnné. Vlastní překódování bychom potom provedli individuálně, například takto: Poznámka: Textové popisky jsou vlastně přiřazení textu jakékoli číselné hodnotě, což je vhodné především pro přehlednost souboru, kde můžeme vidět buď textové popisky, nebo číselnou reprezentaci. Pozn.: Pro vlastní tvorbu kontingenční tabulky a vlastní test nezávislosti znaků není změna Text na Double nutná. KONTINGENČNÍ TABULKY Ty umožňují dát do souvislosti 2 kategoriální proměnné, zatímco tabulky četností obsáhnou informace pouze o jedné proměnné (soubor pacienti.sta) Podívejme se, jak taková kontingenční tabulka vypadá, zvolíme Statistika - Základní statistiky/tabulky - Kontingenční tabulky, 3

ve Specif. tabulky označíme v proměnné, které chceme vůči sobě vyhodnocovat, v našem případě znak stupeň kouření a stupeň vzdělání : Ten znak, který je na posledním Listu2 bude zobrazen v tabulce ve sloupci. Lze zaškrtnout pouze odpovídající proměnné a software vybere pouze kategorické proměnné. Dialog analýzy: 1.GRAFY 4

2.TABULKY ČETNOSTÍ (RELATIVNÍ ČETNOST) 67,53 % základoškoláků jsou silnými kuřáky, což je 25,49 % ze všech údajů v tabulce (ze všech pacientů). 5

3.TESTOVÁNÍ HYPOTÉZ O NEZÁVISLOSTI 2 ZNAKŮ (SOUBOR PACIENTI.STA) a. Předpoklad: U tabulky 2x2: Podmínku očekávaných četností je nutné ověřit v případě, že rozsah výběrového souboru je menší než n < 40 hodnot. V případě, že je soubor větší než 40, není nutné předpoklad ověřovat. U jiné než 2x2 tabulky (2x3; 3x5 apod.) zkontrolujeme předpoklad vždy. Tabulky 2x2 lze definovat přímo přes neparametrické statistiky: 6

Test nezávislosti dvou znaků Zaškrtneme testy Chí-kvadrát a analýzu spustíme na záložce Detailní výsledky: P (0,0163) < 0,05 => H0 zamítáme prokazujeme Ha Platí Ha (H1) test je statistiky významný = výsledek je signifikantní Na 5% hladině významnosti zamítáme nulovou hypotézu o nezávislosti znaku stupeň kouření a vzdělání. Prokázali jsme závislost, tj. vzdělání má vliv na kouření. Pozn.: Pro analýzu využijeme Pearsonův Chí-kvadrát test. 7

Pozn.: Při rozsáhlých průmyslových souborech bude test významný i v situaci, kdy jsou rozdíly ve skutečnosti velmi malé (pro praxi nevýznamné). S rozsahem výběru roste významnost, resp. test dokáže detekovat i drobné odchylky, které ale nejsou pro praxi často významné. Čím větším souborem disponujeme, tím menší rozdíly můžeme detekovat. Jinými slovy, čím menší rozdíly chceme detekovat, tím větší soubor potřebujeme. V případě velkých souborů doporučujeme test opakovat na stratifikovaném vzorku o velikosti cca. n>100 and n<200. Náhodný výběr z původního souboru provedeme v záložce data: Výsledkem je nový soubor (n=189) stejného rozložení jako původní (n=9485), na kterém provedeme stejnou analýzu. 8