Jednovýběrové testy. Komentované řešení pomocí MS Excel

Transkript

1 Jednovýběrové testy Komentované řešení pomocí MS Excel

2 Vstupní data V dalším budeme předpokládat, že tabulka se vstupními daty je umístěna v oblasti A1:C23 (viz. obrázek)

3 Základní statistiky vložíme vzorce pro výpočet výběrového průměru, výběrové směrodatné odchylky (S) a počtu měření (n) Vzorce zkopírujeme i do sloupce C. Vidíme, že průměrná koncentrace v obou potrubích je menší než 10 µg/l. Budeme testovat, zda je tento rozdíl statisticky významný. Variabilita koncentrací v prvním potrubí je menší než variabilita ve druhém potrubí.

4 Postup: Ověření předpokladů střední hodnoty K tabulce přidáme sloupec s limitními hodnotami 10 (D3:D23) pro zobrazení čáry odpovídající limitu. Označíme oblast s měřeními včetně hlavičky a přidaného limitu (B2:D23) otevřeme kartu Vložení klikneme na Spojnicový (panel Grafy ) a vybereme spojnicový se značkami. Pro větší přehlednost: Upravíme formát datové řady představující limit 10 a odstraníme jí z legendy, Přidáme názvy os a název grafu. Interpretace výsledků V grafu vývoje naměřených koncentrací není patrný žádný trend. Lze tedy předpokládat, že střední hodnoty jednotlivých měření jsou v případě obou potrubí konstantní (tj. nezávisí na čase). Dále můžeme pozorovat, že naměřená koncentrace olova u obou potrubí v některých případech překročila limitní mez 10 µg/l. U potrubí 2 došlo k překročení častěji a o větší hodnoty než u potrubí 1.

5 Postup: Ověření předpokladů rozptyly Pro každé potrubí spočítáme rezidua (e = X i X) v nové tabulce: vložíme vzorec =B3-B$25 do buňky I29 a rozkopírujeme do celé oblasti I29:J49 Označíme oblast s rezidui včetně hlavičky (I28:J49) otevřeme kartu Vložení klikneme na Sloupcový (panel Grafy ) a vybereme Skupinový sloupcový Pro větší přehlednost: Na kartě Návrh klikneme na Zaměnit řádek za sloupec a na téže kartě změníme styl grafu na jednobarevný, Odebereme legendu, přidáme název svislé osy a název grafu. Interpretace výsledků V grafech vývoje vypočítaných reziduí jednotlivých potrubí není patrný žádný systematický vývoj tedy nedochází ani k výraznému růstu ani poklesu absolutních hodnot reziduí. Můžeme tedy předpokládat, že rozptyly jednotlivých měření jsou v případě obou potrubí konstantní (tj. nezávisí na čase). Rezidua se jeví velmi náhodně a nesystematicky, což je důležité pro aplikaci jednovýběrových testů.

6 Ověření normality histogramy 1 Postup: Měření musíme rozdělit do intervalů. Počet intervalů (k) určíme podle Yuleova pravidla: k = 2,5*n 1/4 Šířka intervalu bude d = (Max Min)/k, kde s ohledem na předpokládanou normalitu volíme Max = Prumer + 2*S, a Min = Prumer - 2*S Nyní sestavíme intervaly: (0,Min),(Min, Min+d),,(Max d, Max), (Max, 100) a spočítáme středy intervalů (střed prvního a posledního intervalu volíme jako příslušná krajní hodnota ± d/2). Spočítáme relativní četnosti měření v jednotlivých intervalech (počet měření v daném intervalu / celkový počet měření) pomocí funkce COUNTIF Pro srovnání dopočítáme očekávané pravděpodobnosti v jednotlivých intervalech za předpokladu normality (pomocí distribuční funkce normálního rozdělení NORMDIST, kde zvolíme µ = Prumer, a σ = S. Kromě funkce COUNTIF by se tabulka četností dala sestrojit také pomocí nástroje Kontingenční tabulka.

7 Ověření normality histogramy 2 Postup: Z tabulek relativních četností (viz. předchozí slide) dále vytvoříme sloupcové grafy. Postup pro oba grafy je podobný. Označíme tabulku s relativními četnostmi a očekávanými pravděpodobnostmi (K58:L65) Karta Vložení Sloupcový (panel Grafy ) vybereme Skupinový sloupcový Pro přehlednost přidáme název grafu, název vodorovné osy a do popisků vodorovné osy vložíme středy intervalů. Interpretace výsledků: U Potrubí 2 jsou rozdíly mezi relativními četnostmi a očekávanými pravděpodobnostmi (za předpokladu normality) poměrně malé a předpoklad normality je tedy oprávněný. V případě Potrubí 1 jsou tyto rozdíly větší, ovšem vzhledem k relativně malému počtu pozorování to ještě nemusí nutně znamenat, že rozdělení koncentrací není normální. Potvrzují se naše předchozí zjištění o tom, že koncentrace v Potrubí 2 jsou ve srovnání s Potrubím 1 o trochu vyšší a více rozptýlené. Výsledná podoba histogramu může být velmi citlivá na volbu intervalů (jsou-li naměřené hodnoty blízko hranicím intervalů, může i při malé změně hranic dojít k zásadní změně v histogramu). Protože je předpoklad normality klíčový, ověříme jej ještě pomocí tzv. Q-Q grafů.

8 Postup: Ověření normality Q-Q grafy 1 Naměřené hodnoty v jednotlivých potrubích musíme nejdříve vzestupně uspořádat: Zkopírujeme naměřené hodnoty do nové oblasti (jinak bychom ztratili původní uspořádání). Označíme koncentrace pro Potrubí 1 (vč. hlavičky), tj. I88:I109. Karta Data Seřadit (panel Seřadit a filtrovat ) vybereme Pokračovat s aktuální oblastí stiskneme Seřadit ponecháme nastavení Seřadit podle: Potrubí 1; Řazení: Hodnoty; Pořadí: Od nejmenšího k největšímu. Podobně postupujeme pro Potrubí 2. Dále dopočítáme kumulativní pravděpodobnosti s korekcí na spojitost (pro i-tou nejmenší hodnotu je to (i-0,5)/n, příslušné teoretické kvantily normovaného normálního rozdělení N(0,1), tedy u i = Φ -1 [(i-0,5)/n], a to pomocí funkce NORMSINV, Pro každé potrubí zvlášť: standardizované hodnoty uspořádaných koncentrací, tj. Y=(X Prumer)/S, které představují skutečné (napozorované) kvantily.

9 Ověření normality Q-Q grafy 2 Postup: Označíme oblast dat s teoretickými kvantily N(0,1) a standardizovanými uspořádanými koncentracemi (L89:M109). Karta Vložení Bodový (panel Grafy ) vybereme Bodový pouze se značkami. Přidáme novou řadu (diagonálu): Karta Návrh Vybrat data Přidat (Položky legendy(řady)) Hodnoty X řad: vložíme oblast s kvantily N(0,1), tedy L89:L109; Hodnoty Y řad: vložíme totéž (L89:L109 ). Upravíme formát nově přidané řady (pravým tlačítkem klikneme na příslušnou řadu v grafu): Možnosti značek = vybereme žádné, Barva čáry = vybereme plná čára a zvolíme červenou barvu. Pro přehlednost přidáme název grafu a odebereme legendu. Interpretace výsledků: Q-Q graf vykresluje teoretické (očekávané) kvantily (osa X) vůči empirickým (naměřeným) kvantilům (osa Y). Čím blíže jsou jednotlivé body červené ose 1.a 3. kvadrantu, tím lépe empirické rozdělení odpovídá tomu teoretickému. Na rozdíl od histogramu zde nedochází ke zkreslení kvůli zařazení dat do intervalů, na druhou stranu Q-Q graf neznázorňuje polohu ani variabilitu pozorování. V obou případech (Potrubí 1 i Potrubí 2) jsou jednotlivé body velmi blízko červené ose 1. a 3. kvadrantu, což indikuje, že empirické rozdělení odpovídá rozdělení teoretickému. Můžeme tedy oprávněně předpokládat, že naměřené koncentrace u obou potrubí pochází z normálního rozdělení. To není velkým překvapením, protože chyby v měření se velmi často řídí normálním rozdělením.

10 Test o střední hodnotě (úloha A) Postup (podrobný popis a vzorce viz. teorie-jednovyberovy test.pdf): Nastavíme střední hodnotu pro nulovu hypotézu (µ 0 = 10). Spočítáme testovou statistiku. Podle alternativní hypotézy (H 1 : µ<µ 0 ) a hladiny významnosti spočítáme kritickou hodnotu a to pomocí funkce TINV. Pozor, TINV není inverzní funkce k distribuční funkci t-rozdělení, je to spíše inverzní funkce k oboustranné funkci přežití tohoto rozdělení, tedy je-li x=tinv(p,k), potom p = P( X > x), kde X~t(k). Více viz. nápověda k této funkci. Porovnáním testové statistiky s kritickou hodnotou vyhodnotíme test. Pro přesnější představu o průkaznosti výsledků spočítáme p-hodnotu pomocí funkce TDIST. Pozor, ani TDIST není distribuční funkce t-rozdělení, nýbrž funkce přežití (buď jednostranná nebo oboustranná dle nastavení parametru strany ), tedy TDIST = P( X>x ) nebo TDIST = P( X > x). Více viz. nápověda k této funkci. Interpretace výsledků (obecný popis viz. teorie-jednovyberovy test.pdf): V případě Potrubí 1. zamítáme H 0 : µ=µ 0 a přijímáme alternativní hypotézu H 1 : µ<µ 0. To znamená, že naměřené koncentrace prokázaly, že střední koncentrace olova je nižší než stanovený limit 10µg/l. Pravděpodobnost chybného závěru je dána hl. významnosti, tj. 5 %. Spočítaná p-hodnota (minimální hl. významnosti pro zamítnutí H 0 ) je hluboko pod 5 %, takže naměřené výsledky jsou opravdu velmi průkazné. V případě Potrubí 2. nulovou hypotézu H 0 : µ=µ 0 nezamítáme. Naměřené výsledky jsou tedy neprůkazné a střední koncentrace olova nemusí být nižší než stanovený limit 10µg/l. To ovšem nemusí znamenat, že střední koncentrace je vyšší než limit (vždyť naměřený průměr je 9,88, což je stále pod limitem). To pouze znamená, že nemůžeme učinit žádný přesvědčivý závěr. Dosažená p-hodnota výrazně převyšuje 5%, tudíž výsledky jsou opravdu velmi neprůkazné. Ve srovnání s Potrubím 1.jsou totiž naměřené hodnoty koncentrace o něco vyšší (průměr je blíže limitu) a je zde i vyšší variabilita naměřených dat, což zvyšuje míru nejistoty ohledně skutečné střední hodnoty.

11 Test o rozptylu (úloha B) Postup (podrobný popis a vzorce viz. teorie-jednovyberovy test.pdf): Pro lepší představu odhadneme variační koeficient (V) z dat. Spočítáme mezní směrodatnou odchylku odpovídající nulové hypotéze (σ 0 = 0,08*Prumer). Spočítáme testovou statistiku. Protože nemáme zadanou požadovanou hladinu významnosti, nebudeme počítat kritický obor. Spočítáme p-hodnotu pomocí funkce CHIDIST. Pozor, CHIDIST není distribuční funkce χ 2 -rozdělení, nýbrž funkce přežití tohoto rozdělení, tedy CHIDIST = P( X>x ). Více viz. nápověda k této funkci. Interpretace výsledků (obecný popis viz. teorie-jednovyberovy test.pdf): V případě Potrubí 1. jsme dosáhli velmi nízké p-hodnoty = 0,013. Můžeme tedy zamítnout H 0 : σ= σ 0 ve prospěch H 1 : σ< σ 0 a to i pro hl. významnosti 1,3%. Na základě naměřených koncentrací tedy můžeme se spolehlivostí vyšší než 98% (tj. s pravděpodobností chyby méně než 2 %) tvrdit, že předložený výběr je získán s přesností lepší než 8 %. Toto tvrzení lze tedy považovat za prokázané. Tomu odpovídá i odhadnutá hodnota variačního koeficientu 5,26%, což je výrazně pod požadovanými osmi procenty. V případě Potrubí 2. vychází velmi vysoká p-hodnota = 0,751. Pro zamítnutí H 0 : σ= σ 0 ve prospěch H 1 : σ< σ 0 by hl.významnosti musela být alespoň 76 %. Tvrdit, že předložený výběr je získán s přesností lepší než 8 % můžeme tedy pouze se spolehlivostí mensí než 25% (tj. s pravděpodobností chyby více než 75 %). Toto tvrzení tedy rozhodně nelze považovat za prokázané. Tomu odpovídá i odhadnutá hodnota variačního koeficientu 8,74%, což je dokonce více než požadovaných osm procent. Pozor, nemusí to ještě automaticky znamenat, že výběr je získán s přesností horší než 8 %. Toto můžeme tvrdit se spolehlivostí cca 75 % (tj. pravděpodobností chyby 25 %), což je běžně považováno za neprůkazné.