Jednovýběrové testy. Komentované řešení pomocí MS Excel
|
|
- Radomír Sedláček
- před 5 lety
- Počet zobrazení:
Transkript
1 Jednovýběrové testy Komentované řešení pomocí MS Excel
2 Vstupní data V dalším budeme předpokládat, že tabulka se vstupními daty je umístěna v oblasti A1:C23 (viz. obrázek)
3 Základní statistiky vložíme vzorce pro výpočet výběrového průměru, výběrové směrodatné odchylky (S) a počtu měření (n) Vzorce zkopírujeme i do sloupce C. Vidíme, že průměrná koncentrace v obou potrubích je menší než 10 µg/l. Budeme testovat, zda je tento rozdíl statisticky významný. Variabilita koncentrací v prvním potrubí je menší než variabilita ve druhém potrubí.
4 Postup: Ověření předpokladů střední hodnoty K tabulce přidáme sloupec s limitními hodnotami 10 (D3:D23) pro zobrazení čáry odpovídající limitu. Označíme oblast s měřeními včetně hlavičky a přidaného limitu (B2:D23) otevřeme kartu Vložení klikneme na Spojnicový (panel Grafy ) a vybereme spojnicový se značkami. Pro větší přehlednost: Upravíme formát datové řady představující limit 10 a odstraníme jí z legendy, Přidáme názvy os a název grafu. Interpretace výsledků V grafu vývoje naměřených koncentrací není patrný žádný trend. Lze tedy předpokládat, že střední hodnoty jednotlivých měření jsou v případě obou potrubí konstantní (tj. nezávisí na čase). Dále můžeme pozorovat, že naměřená koncentrace olova u obou potrubí v některých případech překročila limitní mez 10 µg/l. U potrubí 2 došlo k překročení častěji a o větší hodnoty než u potrubí 1.
5 Postup: Ověření předpokladů rozptyly Pro každé potrubí spočítáme rezidua (e = X i X) v nové tabulce: vložíme vzorec =B3-B$25 do buňky I29 a rozkopírujeme do celé oblasti I29:J49 Označíme oblast s rezidui včetně hlavičky (I28:J49) otevřeme kartu Vložení klikneme na Sloupcový (panel Grafy ) a vybereme Skupinový sloupcový Pro větší přehlednost: Na kartě Návrh klikneme na Zaměnit řádek za sloupec a na téže kartě změníme styl grafu na jednobarevný, Odebereme legendu, přidáme název svislé osy a název grafu. Interpretace výsledků V grafech vývoje vypočítaných reziduí jednotlivých potrubí není patrný žádný systematický vývoj tedy nedochází ani k výraznému růstu ani poklesu absolutních hodnot reziduí. Můžeme tedy předpokládat, že rozptyly jednotlivých měření jsou v případě obou potrubí konstantní (tj. nezávisí na čase). Rezidua se jeví velmi náhodně a nesystematicky, což je důležité pro aplikaci jednovýběrových testů.
6 Ověření normality histogramy 1 Postup: Měření musíme rozdělit do intervalů. Počet intervalů (k) určíme podle Yuleova pravidla: k = 2,5*n 1/4 Šířka intervalu bude d = (Max Min)/k, kde s ohledem na předpokládanou normalitu volíme Max = Prumer + 2*S, a Min = Prumer - 2*S Nyní sestavíme intervaly: (0,Min),(Min, Min+d),,(Max d, Max), (Max, 100) a spočítáme středy intervalů (střed prvního a posledního intervalu volíme jako příslušná krajní hodnota ± d/2). Spočítáme relativní četnosti měření v jednotlivých intervalech (počet měření v daném intervalu / celkový počet měření) pomocí funkce COUNTIF Pro srovnání dopočítáme očekávané pravděpodobnosti v jednotlivých intervalech za předpokladu normality (pomocí distribuční funkce normálního rozdělení NORMDIST, kde zvolíme µ = Prumer, a σ = S. Kromě funkce COUNTIF by se tabulka četností dala sestrojit také pomocí nástroje Kontingenční tabulka.
7 Ověření normality histogramy 2 Postup: Z tabulek relativních četností (viz. předchozí slide) dále vytvoříme sloupcové grafy. Postup pro oba grafy je podobný. Označíme tabulku s relativními četnostmi a očekávanými pravděpodobnostmi (K58:L65) Karta Vložení Sloupcový (panel Grafy ) vybereme Skupinový sloupcový Pro přehlednost přidáme název grafu, název vodorovné osy a do popisků vodorovné osy vložíme středy intervalů. Interpretace výsledků: U Potrubí 2 jsou rozdíly mezi relativními četnostmi a očekávanými pravděpodobnostmi (za předpokladu normality) poměrně malé a předpoklad normality je tedy oprávněný. V případě Potrubí 1 jsou tyto rozdíly větší, ovšem vzhledem k relativně malému počtu pozorování to ještě nemusí nutně znamenat, že rozdělení koncentrací není normální. Potvrzují se naše předchozí zjištění o tom, že koncentrace v Potrubí 2 jsou ve srovnání s Potrubím 1 o trochu vyšší a více rozptýlené. Výsledná podoba histogramu může být velmi citlivá na volbu intervalů (jsou-li naměřené hodnoty blízko hranicím intervalů, může i při malé změně hranic dojít k zásadní změně v histogramu). Protože je předpoklad normality klíčový, ověříme jej ještě pomocí tzv. Q-Q grafů.
8 Postup: Ověření normality Q-Q grafy 1 Naměřené hodnoty v jednotlivých potrubích musíme nejdříve vzestupně uspořádat: Zkopírujeme naměřené hodnoty do nové oblasti (jinak bychom ztratili původní uspořádání). Označíme koncentrace pro Potrubí 1 (vč. hlavičky), tj. I88:I109. Karta Data Seřadit (panel Seřadit a filtrovat ) vybereme Pokračovat s aktuální oblastí stiskneme Seřadit ponecháme nastavení Seřadit podle: Potrubí 1; Řazení: Hodnoty; Pořadí: Od nejmenšího k největšímu. Podobně postupujeme pro Potrubí 2. Dále dopočítáme kumulativní pravděpodobnosti s korekcí na spojitost (pro i-tou nejmenší hodnotu je to (i-0,5)/n, příslušné teoretické kvantily normovaného normálního rozdělení N(0,1), tedy u i = Φ -1 [(i-0,5)/n], a to pomocí funkce NORMSINV, Pro každé potrubí zvlášť: standardizované hodnoty uspořádaných koncentrací, tj. Y=(X Prumer)/S, které představují skutečné (napozorované) kvantily.
9 Ověření normality Q-Q grafy 2 Postup: Označíme oblast dat s teoretickými kvantily N(0,1) a standardizovanými uspořádanými koncentracemi (L89:M109). Karta Vložení Bodový (panel Grafy ) vybereme Bodový pouze se značkami. Přidáme novou řadu (diagonálu): Karta Návrh Vybrat data Přidat (Položky legendy(řady)) Hodnoty X řad: vložíme oblast s kvantily N(0,1), tedy L89:L109; Hodnoty Y řad: vložíme totéž (L89:L109 ). Upravíme formát nově přidané řady (pravým tlačítkem klikneme na příslušnou řadu v grafu): Možnosti značek = vybereme žádné, Barva čáry = vybereme plná čára a zvolíme červenou barvu. Pro přehlednost přidáme název grafu a odebereme legendu. Interpretace výsledků: Q-Q graf vykresluje teoretické (očekávané) kvantily (osa X) vůči empirickým (naměřeným) kvantilům (osa Y). Čím blíže jsou jednotlivé body červené ose 1.a 3. kvadrantu, tím lépe empirické rozdělení odpovídá tomu teoretickému. Na rozdíl od histogramu zde nedochází ke zkreslení kvůli zařazení dat do intervalů, na druhou stranu Q-Q graf neznázorňuje polohu ani variabilitu pozorování. V obou případech (Potrubí 1 i Potrubí 2) jsou jednotlivé body velmi blízko červené ose 1. a 3. kvadrantu, což indikuje, že empirické rozdělení odpovídá rozdělení teoretickému. Můžeme tedy oprávněně předpokládat, že naměřené koncentrace u obou potrubí pochází z normálního rozdělení. To není velkým překvapením, protože chyby v měření se velmi často řídí normálním rozdělením.
10 Test o střední hodnotě (úloha A) Postup (podrobný popis a vzorce viz. teorie-jednovyberovy test.pdf): Nastavíme střední hodnotu pro nulovu hypotézu (µ 0 = 10). Spočítáme testovou statistiku. Podle alternativní hypotézy (H 1 : µ<µ 0 ) a hladiny významnosti spočítáme kritickou hodnotu a to pomocí funkce TINV. Pozor, TINV není inverzní funkce k distribuční funkci t-rozdělení, je to spíše inverzní funkce k oboustranné funkci přežití tohoto rozdělení, tedy je-li x=tinv(p,k), potom p = P( X > x), kde X~t(k). Více viz. nápověda k této funkci. Porovnáním testové statistiky s kritickou hodnotou vyhodnotíme test. Pro přesnější představu o průkaznosti výsledků spočítáme p-hodnotu pomocí funkce TDIST. Pozor, ani TDIST není distribuční funkce t-rozdělení, nýbrž funkce přežití (buď jednostranná nebo oboustranná dle nastavení parametru strany ), tedy TDIST = P( X>x ) nebo TDIST = P( X > x). Více viz. nápověda k této funkci. Interpretace výsledků (obecný popis viz. teorie-jednovyberovy test.pdf): V případě Potrubí 1. zamítáme H 0 : µ=µ 0 a přijímáme alternativní hypotézu H 1 : µ<µ 0. To znamená, že naměřené koncentrace prokázaly, že střední koncentrace olova je nižší než stanovený limit 10µg/l. Pravděpodobnost chybného závěru je dána hl. významnosti, tj. 5 %. Spočítaná p-hodnota (minimální hl. významnosti pro zamítnutí H 0 ) je hluboko pod 5 %, takže naměřené výsledky jsou opravdu velmi průkazné. V případě Potrubí 2. nulovou hypotézu H 0 : µ=µ 0 nezamítáme. Naměřené výsledky jsou tedy neprůkazné a střední koncentrace olova nemusí být nižší než stanovený limit 10µg/l. To ovšem nemusí znamenat, že střední koncentrace je vyšší než limit (vždyť naměřený průměr je 9,88, což je stále pod limitem). To pouze znamená, že nemůžeme učinit žádný přesvědčivý závěr. Dosažená p-hodnota výrazně převyšuje 5%, tudíž výsledky jsou opravdu velmi neprůkazné. Ve srovnání s Potrubím 1.jsou totiž naměřené hodnoty koncentrace o něco vyšší (průměr je blíže limitu) a je zde i vyšší variabilita naměřených dat, což zvyšuje míru nejistoty ohledně skutečné střední hodnoty.
11 Test o rozptylu (úloha B) Postup (podrobný popis a vzorce viz. teorie-jednovyberovy test.pdf): Pro lepší představu odhadneme variační koeficient (V) z dat. Spočítáme mezní směrodatnou odchylku odpovídající nulové hypotéze (σ 0 = 0,08*Prumer). Spočítáme testovou statistiku. Protože nemáme zadanou požadovanou hladinu významnosti, nebudeme počítat kritický obor. Spočítáme p-hodnotu pomocí funkce CHIDIST. Pozor, CHIDIST není distribuční funkce χ 2 -rozdělení, nýbrž funkce přežití tohoto rozdělení, tedy CHIDIST = P( X>x ). Více viz. nápověda k této funkci. Interpretace výsledků (obecný popis viz. teorie-jednovyberovy test.pdf): V případě Potrubí 1. jsme dosáhli velmi nízké p-hodnoty = 0,013. Můžeme tedy zamítnout H 0 : σ= σ 0 ve prospěch H 1 : σ< σ 0 a to i pro hl. významnosti 1,3%. Na základě naměřených koncentrací tedy můžeme se spolehlivostí vyšší než 98% (tj. s pravděpodobností chyby méně než 2 %) tvrdit, že předložený výběr je získán s přesností lepší než 8 %. Toto tvrzení lze tedy považovat za prokázané. Tomu odpovídá i odhadnutá hodnota variačního koeficientu 5,26%, což je výrazně pod požadovanými osmi procenty. V případě Potrubí 2. vychází velmi vysoká p-hodnota = 0,751. Pro zamítnutí H 0 : σ= σ 0 ve prospěch H 1 : σ< σ 0 by hl.významnosti musela být alespoň 76 %. Tvrdit, že předložený výběr je získán s přesností lepší než 8 % můžeme tedy pouze se spolehlivostí mensí než 25% (tj. s pravděpodobností chyby více než 75 %). Toto tvrzení tedy rozhodně nelze považovat za prokázané. Tomu odpovídá i odhadnutá hodnota variačního koeficientu 8,74%, což je dokonce více než požadovaných osm procent. Pozor, nemusí to ještě automaticky znamenat, že výběr je získán s přesností horší než 8 %. Toto můžeme tvrdit se spolehlivostí cca 75 % (tj. pravděpodobností chyby 25 %), což je běžně považováno za neprůkazné.
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VícePopisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VíceDvouvýběrové a párové testy. Komentované řešení pomocí MS Excel
Dvouvýběrové a párové testy Komentované řešení pomocí MS Excel Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci glukózy v
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceKONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica
KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica Vstupní data transformace před vložením Než data vložíme do tabulky ve Statistice, musíme si je předpřipravit. Označme si P Prahu, S Šumperk
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
VíceTestování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
VíceFrantišek Hudek. srpen 2012
VY_32_INOVACE_FH17 Jméno autora výukového materiálu Datum (období), ve kterém byl VM vytvořen Ročník, pro který je VM určen Vzdělávací oblast, obor, okruh, téma Anotace František Hudek srpen 2012 8. ročník
VíceLINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VíceExcel tabulkový procesor
Pozice aktivní buňky Excel tabulkový procesor Označená aktivní buňka Řádek vzorců zobrazuje úplný a skutečný obsah buňky Typ buňky řetězec, číslo, vzorec, datum Oprava obsahu buňky F2 nebo v řádku vzorců,
VíceTestování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
VíceSTATISTICA Téma 6. Testy na základě jednoho a dvou výběrů
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VícePOPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
VíceAproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
VíceTESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceTestování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceJarqueův a Beryho test normality (Jarque-Bera Test, JB test)
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceExcel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu
Excel - pokračování Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Př. Analýza prodeje CD základní jednoduché vzorce karta Domů Př. Skoky do dálky - funkce
VíceTestování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
VíceTestování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Více2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceProtokol č. 1. Tloušťková struktura. Zadání:
Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceFrantišek Hudek. červen 2012
VY_32_INOVACE_FH09 Jméno autora výukového materiálu Datum (období), ve kterém byl VM vytvořen Ročník, pro který je VM určen Vzdělávací oblast, obor, okruh, téma Anotace František Hudek červen 2012 8. ročník
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceFrantišek Hudek. červenec 2012
VY_32_INOVACE_FH14 Jméno autora výukového materiálu Datum (období), ve kterém byl VM vytvořen Ročník, pro který je VM určen Vzdělávací oblast, obor, okruh, téma Anotace František Hudek červenec 2012 8.
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VícePARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.
PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU
VícePřednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
VícePřednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceMATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ
MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceIntervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr
StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule
VíceOdhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára
Odhady parametrů základního souboru Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára Motivační příklad Mám průměrné roční teploty vzduchu z 8 stanic
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Více4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
VíceStatistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
VíceNáhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceVýsledný graf ukazuje následující obrázek.
Úvod do problematiky GRAFY - SPOJNICOVÝ GRAF A XY A. Spojnicový graf Spojnicový graf používáme především v případě, kdy chceme graficky znázornit trend některé veličiny ve zvoleném časovém intervalu. V
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceSimulace. Simulace dat. Parametry
Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VíceFrantišek Hudek. červenec 2012
VY_32_INOVACE_FH16 Jméno autora výukového materiálu Datum (období), ve kterém byl VM vytvořen Ročník, pro který je VM určen Vzdělávací oblast, obor, okruh, téma Anotace František Hudek červenec 2012 8.
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceTESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
VíceSAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY
SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Víceanalýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceVybraná rozdělení náhodné veličiny
3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.
VíceEpidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceFrantišek Hudek. červenec 2012
VY_32_INOVACE_FH15 Jméno autora výukového materiálu Datum (období), ve kterém byl VM vytvořen Ročník, pro který je VM určen Vzdělávací oblast, obor, okruh, téma Anotace František Hudek červenec 2012 8.
VíceČasové řady - Cvičení
Časové řady - Cvičení Příklad 2: Zobrazte měsíční časovou řadu míry nezaměstnanosti v obci Rybitví za roky 2005-2010. Příslušná data naleznete v souboru cas_rada.xlsx. Řešení: 1. Pro transformaci dat do
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
VíceJednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
VíceTestování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat
Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda
VíceSTATISTICA Téma 1. Práce s datovým souborem
STATISTICA Téma 1. Práce s datovým souborem 1) Otevření datového souboru Program Statistika.cz otevíráme z ikony Start, nabídka Programy, podnabídka Statistika Cz 6. Ze dvou nabídnutých možností vybereme
VícePearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
VíceZpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Př. : Stanovte jednotlivé četnosti a číselné charakteristiky zadaného statistického souboru a nakreslete krabicový graf:, 8, 7, 43, 9, 47, 4, 34, 34, 4, 35. Statistický soubor seřadíme vzestupně podle
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceKAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM
KAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM FILTROVÁNÍ DAT Po filtrování dat jsou zobrazeny pouze řádky, které splňují zadaná kritéria, a řádky, které nechcete zobrazit, jsou skryty. Filtrovat
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceVzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
VíceStatistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VíceCvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
VíceTECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
VíceNÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceTéma 9: Vícenásobná regrese
Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.
Více