A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21

Podobné dokumenty
STATISTICA Téma 7. Testy na základě více než 2 výběrů

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

ADDS cviceni. Pavlina Kuranova

Statistika, Biostatistika pro kombinované studium. Jan Kracík

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Jednofaktorová analýza rozptylu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Cvičení 9: Neparametrické úlohy o mediánech

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Cvičení 12: Binární logistická regrese

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

TECHNICKÁ UNIVERZITA V LIBERCI

Jednostranné intervaly spolehlivosti

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Lineární regrese. Komentované řešení pomocí MS Excel

Úvod do analýzy rozptylu

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Vzorová prezentace do předmětu Statistika

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

You created this PDF from an application that is not licensed to print to novapdf printer (

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Návod na vypracování semestrálního projektu

= = 2368

Plánování experimentu

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Statistická analýza jednorozměrných dat

Testování statistických hypotéz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Tomáš Karel LS 2012/2013

Téma 9: Vícenásobná regrese

TECHNICKÁ UNIVERZITA V LIBERCI

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Matematická statistika Zimní semestr

Ilustrační příklad odhadu LRM v SW Gretl

INDUKTIVNÍ STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Technická univerzita v Liberci

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Porovnání dvou výběrů

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

TECHNICKÁ UNIVERZITA V LIBERCI

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Korelační a regresní analýza

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

KGG/STG Statistika pro geografy

Neparametrické metody v systému STATISTICA

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

PYTHAGORAS Statistické zpracování experimentálních dat

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Stručný úvod do testování statistických hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklad: Test nezávislosti kategoriálních znaků

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

PRAVDĚPODOBNOST A STATISTIKA

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Jednofaktorová analýza rozptylu

Testy statistických hypotéz

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

4ST201 STATISTIKA CVIČENÍ Č. 7

Inovace bakalářského studijního oboru Aplikovaná chemie

Regresní a korelační analýza

Testování hypotéz. 4. přednáška

ANALÝZA ROZPTYLU (ANOVA)

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Vysoká škola ekonomická v Praze

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Testy nezávislosti kardinálních veličin

KGG/STG Statistika pro geografy

Transkript:

Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8 9 10 11 12 13 Výrobce B C C A B D D C A B B D C Pořadí 14 15 16 17 18 19 20 21 22 23 24 25 26 Výrobce D C B C A C D D C C A C A Na základě těchto údaů posuďte, zda původ výrobků má vliv na eho akost. Řešení. Zkoumaná vlastnost - akost výrobků - není vyádřena spoitým znakem, ale znakem pouze ordinálním (pořadím), nemůže ít proto o výběry z normálního rozdělení. Všechny čtyři výběrové soubory sou nezávislé. Vliv původu výrobků na eho akost budeme tedy ověřovat Kruskal - Wallisovým testem. Výrobce Pořadí A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21 H 0 : akost výrobků nezávisí na původu výrobků resp. všechny výběry pocházeí z téhož rozdělení H A : non H 0 Data uložíme v programu STATISTICA ako pro analýzu rozptylu, to znamená do dvou proměnných, které pomenueme např. VÝROBCE a POŘADÍ. Každá z těchto dvou proměnných bude mít 26 pozorování. Kruskal - Wallisův test nademe v nabídce modulu Nonparametrics / Distrib.. Nezávisle proměnnou e VÝROBCE a závisle proměnnou e POŘADÍ. Procedura Kruskal-Wallis ANOVA, median nabízí dvě výstupní tabulky, nás zaímá en ta druhá Kruskal-Wallis ANOVA by Ranks (bývá schovaná pod výstupní tabulkou, která přísluší mediánovému testu). Výstupní tabulka v programu STATISTICA pro Kruskal - Wallisův test v příkladu 1 Kruskal-Wallis ANOVA by Ranks (neparam.sta) Independent (grouping) variable: VÝROBCE Kruskal-Wallis test: H ( 3, N= 26) = 2,924212 p =,4035 Valid Sum of Code N Ranks A 100 5 81 B 101 5 43 C 102 10 147 D 103 6 80 Z výstupní tabulky lze např. vyčíst, že hodnota testového kritéria e 2,924. Pro nás e ale důležité, že nemenší hladina významnosti e rovna 0,4035. Nemenší hladina významnosti, pro kterou lze zamítnout nulovou hypotézu, e větší než 0,05. Nepodařilo se prokázat, že původ výrobků má vliv na eho akost (s 95%-ní spolehlivostí). Tím e úloha vyřešena.] Doplňuící úkol k příkladu 1: Ověřte pro výrobce A a B, že ve výstupní tabulce z Kruskal- Wallisova testu sloupec označený Sum of Ranks obsahue součty pořadí hodnot. Dále ověřte, že hodnota testového kritéria H e opravdu 2,924. 2 2 2 2 12 81 43 147 80 [ H = 3 27 = 2, 924 26 27 + + + 5 5 10 6 ] Autor: RNDr. Marie Kletečková 1

Doplňuící úkol (en pro ty nechytřeší a nebo nepilněší!): Ověřte, že nemenší hladina významnosti pro zamítnutí nulové hypotézy v příkladu 1 e opravdu 0,4035. Nápověda: Při stanovení nemenší hladiny významnosti vydeme z toho, že při platnosti nulové hypotézy v Kruskal- 2 χ 3. Kritický obor e vymezen ocasem napravo Wallisově testu v příkladu 1 má testové kritérium H rozdělení ( ) 2 v grafu hustoty rozdělení χ ( 3). Obr. 1 Ověření hodnoty nemenší hladiny významnosti pro zamítnutí H 0 v příkladu 1 Příklad 2 Bylo sledováno procento niklu v tavební analýze legované oceli. Analýza se prováděla u 4 pecí a u každé pece bylo odebráno 5 vzorků. Má se zistit, zda procento niklu e u všech pecí stené nebo zda se některé pece od sebe liší. Data sou uvedena v následuící tabulce. Tab. % Ni v tavební analýze legované oceli 1. pec 2. pec 3. pec 4. pec 4,15 4,38 4,23 4,41 4,26 4,40 4,16 4,31 4,10 4,29 4,20 4,42 4,30 4,39 4,24 4,37 4,25 4,45 4,27 4,43 Použite Kruskal-Wallisův test. (O normalitě údaů mnoho nevíme, podle Bartlettova testu nelze vyloučit homoskedasticitu, neboť p = 0,570776 > 0,05. Pravděpodobně e zde možné použít také analýzu rozptylu.) Autor: RNDr. Marie Kletečková 2

Řešení. Obr. 2 Uložení dat a nastavení proměnných v Kruskal-Wallisově testu pro příklad 2 Ve výstupní tabulce Kruskal-Wallisova testu zistíme: nemenší hladina významnosti pro zamítnutí nulové hypotézy, že procento niklu e u všech pecí stené, e 0,0032. Zamítáme tedy nulovou hypotézu s 95%-ní i 99%-ní spolehlivostí (s maximální spolehlivostí 99,68 %). Podařilo se prokázat, že procento niklu není u všech pecí stené.zaímá nás proto, které pece se od sebe liší. Pro další rozbor použieme Neményiho metodu mnohonásobného srovnávání nezávislých výběrů. Tu program STATISTICA nedělá, musíte i provést sami. Neprve sestavíme tabulku hodnot Ti T. Při eím sestroování využieme toho, že výstupní tabulka Kruskal- Wallisova testu obsahue potřebné součty pořadí T i. Tab. T i T i 2 3 4 1 46 2 50* 2 48 4 3 52* Nademe ve statistických tabulkách 5%-ní kritickou hodnotu pro tyto rozdíly. Kritická hodnota e 48,1. V tabulce označíme symbolem * ty hodnoty, které sou na hladině 5 % významné. Neményiova metoda tedy prokazue významnou odlišnost v procentu niklu mezi 1. a 4. pecí a mezi 3. a 4. pecí. (Také máte ako á vztek, že program STATISTICA neprovádí Neményiho metodu pro mnohonásobné porovnávání u Kruskal - Wallisova testu?) Pro zaímavost se můžete přesvědčit, k akým závěrům dospěeme, použieme-li k řešení úlohy analýzu rozptylu. Pomocí analýzy rozptylu dodeme k závěru, že procento niklu není u všech pecí stené (p = 0,000139). Pomocí Tukeyovy metody prokážeme statisticky významnou odlišnost 1. a 3. pece od 2. a 4. pece. Autor: RNDr. Marie Kletečková 3

Tab. Výstupní tabulka pro mnohonásobné porovnání středních hodnot Tukeyho metodou Tukey HSD test; variable NIKL (andel231.sta) Homogeneous Groups, alpha=,05 MAIN EFFECT: PEC Mean 1 2 1 {1} 4,212 xxxx 3 {3} 4,220 xxxx 2 {2} 4,382 xxxx 4 {4} 4,388 xxxx Příklad 3 Byl sledován vliv tří preparátů na srážlivost krve. Kromě iných ukazatelů byl zišťován tzv. trombinový čas. U každé osoby byl stanoven neprve kontrolní úda (K), který udává trombinový čas před zaháením pokusu. Pak byly aplikovány preparáty A, B, C, a to každý dostatečně dlouho po odeznění účinku těch předchozích. Údae o 10 sledovaných osobách sou uvedeny v následuící tabulce. Tab. Trombinový čas Preparát Osoba Kontrola A B C A 11,3 11,2 11,4 11,0 B 11,9 12,1 11,8 9,5 C 11,8 13,2 12,0 11,1 D 12,1 12,8 12,0 12,5 E 11,2 13,5 11,5 8,4 F 11,3 12,5 11,5 9,0 G 10,8 10,7 10,9 9,7 H 12,0 13,8 11,6 12,2 I 11,5 12,9 11,3 10,3 J 11,7 11,9 11,3 8,2 Závisí velikost trombinového času na tom, aký byl použit preparát? Řešení. Výběrové soubory nelze pokládat za nezávislé, protože se edná vždy o stené osoby. Úlohu nebudeme řešit analýzou rozptylu nebo Kruskal Wallisovým testem, ale Friedmanovým testem. H 0 : trombinový čas nezávisí na druhu preparátu H A : non A Data uložíme do 4 sloupců, resp. do 4 proměnných. Nazvěme e třeba KONTROLA, A, B, C. Test provedeme v modulu Nonparametrics/Distrib. V nabídce modulu vybereme proceduru Friedman ANOVA & Kendall s concordance. V proceduře Friedman ANOVA & Kendall s concordance pomocí tlačítka Variables označíme všechny čtyři proměnné, eichž rozdělení hodnot se má porovnávat. Z výstupní tabulky vyčteme, že testové kritérium Q nabývá hodnoty 14,52 a nemenší hladina významnosti, pro kterou lze eště zamítnout nulovou hypotézu, e 0,00228. P<0,01 zamítáme hypotézu trombinový čas nezávisí na preparátech KONTROLA, A, B, C. Podařilo se prokázat, že velikost trombinového času není stená pro všechny preparáty. Autor: RNDr. Marie Kletečková 4

Výstupní tabulka procedury Friedman ANOVA & Kendall s concordance pro příklad 3 Friedman ANOVA and Kendall Coeff. of Concordance (neparam.sta) ANOVA Chi Sqr. (N = 10, df = 3) = 14,52000 p <,00228 Coeff. of Concordance =,48400 Aver. rank r =,42667 Average Sum of Rank Ranks Mean Std.Dev. KONTROLA 2,5 25 11,56 0,411501 A 3,6 36 12,46 0,992416 B 2,5 25 11,53 0,340099 C 1,4 14 10,19 1,496997 Jednotlivá ošetření porovnáme Neményiho metodou pro závislé výběrové soubory. Zistíme, které z preparátů se od sebe svým účinkem statisticky významně liší pro hladinu významnosti 5 %. Program STATISTICA bohužel neprovádí Neményiho metodu pro závislé výběrové soubory. Při sestroování tabulky využieme toho, že hodnoty potřebných součtů pořadí T i sou obsaženy ve výstupní tabulce Friedmanova testu. Tab. Hodnoty T T i i 2 3 4 1 11 0 11 2 11 22* 3 11 Ze statistických tabulek zistíme, že kritická hodnota pro absolutní hodnoty rozdílů činí 14,8. Z toho plyne, že hypotézu o shodném účinku preparátů č. 2 a č. 4 (t. preparátů A a C) zamítneme na hladině 5 %. Významnou odlišnost iných dvoic preparátů nelze na základě zištěných výsledků pomocí Neményiovy metody prokázat. Autor: RNDr. Marie Kletečková 5