t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Rozměr: px
Začít zobrazení ze stránky:

Download "t-test, Studentův párový test Ing. Michael Rost, Ph.D."

Transkript

1 Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D.

2 Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se setkat také se situací, ve které potřebujeme porovnat dva či více souborů navzájem. V případě dvou výběrů, můžeme použít, při splnění určitých předpokladů, dvouvýběrové t-testy. Postup je stejný:

3 Magdalena Rettigová doporučuje: 1. Zformulovat hypotézy: H 0 vs. H A.. Stanovit hodnotu α, nejčastěji voĺıme α = 0, 05 nebo α = 0, Zvolit adekvátní testové kritérium a stanovit hodnotu testového kritéria 4. Zjistit zda T K nebo zda p-value α 5. Závěr

4 Příklad - motivace U šestnácti pracovníků bez výcviku (n 1 = 16) a u deseti (n = 10) pracovníků, kteří absolvovali výcvik, byla sledována doba reakce na určitý podmět v sekundách. Původní datové soubory již nejsou k dispozici, nicméně jeden z psychologů si poznamenal tyto charakteristiky obou souborů: x 1 = 11, 8; s 1 =, 3. x = 10, 00; s =, 5. S 95 % spolehlivostí ověřte, zda výcvik vede ke zrychlení sledované reakce. Dobu reakce pracovníka, budeme pokládat za náhodnou veličinu s normálním rozdělením.

5 Testy hypotéz o shodě středních hodnot dvou normálních rozdělení Testujeme-li hypotézu o shodě středních hodnot dvou nezávislých normálních rozdělení, jejichž rozptyly neznáme, je způsob testu závislý na tom, zda můžeme předpokládat následující: rozptyly jsou shodné. rozptyly obou výběrů lze považovat za různé. Z tohoto důvodu je nutné nejprve provést test shody rozptylů.

6 Test shody rozptylů F -test Provádíme test hypotézy H 0 : σ1 = σ. proti alternativní hypotéze (ta může být levostranná, pravostranná, nebo oboustranná). Testovacím kritériem je statistika F : F = s 1 s, která má za platnosti nulové hypotézy rozdělení F (m 1, n 1). Symbolicky tedy F F (m 1, n 1).

7 Test shody rozptylů F -test Jednotlivé kritické obory jsou pak vymezeny následovně: H 0 H A K σ1 σ σ1 > σ {F : F F 1 α (m 1, n 1)} σ1 σ σ1 < σ {F : F F α (m 1, n 1)} σ1 = σ σ1 σ {F : F Fα(m 1, n 1) F F 1 α(m 1, n 1)}

8 Varianta a) shodné rozptyly - homoskedasticita Pokud tedy předpokládáme, na základě předchozího testu, že jsou oba rozptyly shodné, lze k testování nulové hypotézy o shodě středních hodnot H 0 : µ 1 = µ využít testovací statistiky: kde s = t = x 1 x s mn m + n, (m 1)s 1 + (n 1)s m + n.

9 Varianta a) shodné rozptyly - homoskedasticita Dle formulace alternativní hypotézy, pak používáme kritické obory uvedené v tabulce: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (m + n )} µ 1 µ µ 1 < µ {t : t t 1 α (m + n )} µ 1 = µ µ 1 µ {t : t t 1 α (m + n )}

10 Varianta b) neshodné rozptyly - heteroskedasticita V praxi se setkáváme i s případem, kdy nemůžeme předpokládat, že jsou rozptyly shodné. Výsledek předcházejícího testu na shodu rozptylů vedl zamítnutí nulové hypotézy H 0 : σ 1 = σ. V takovém případě jsme nuceni použít poněkud jiné testové statistiky: t = x 1 x s 1 m + s n

11 Varianta b) neshodné rozptyly - heteroskedasticita Tato statistika sleduje, za předpokladu platnosti nulové hypotézy, rozdělení t(f), kde (s 1m + s n ) f = ( ) ). 1 s 1 (s m 1 m + n 1 1 n Číslo f je zde nemusí být přirozeným číslem!

12 Varianta b) neshodné rozptyly - heteroskedasticita Dle alternativní hypotézy pak rozeznáváme následující kritické obory viz tabulka: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (f)} µ 1 µ µ 1 < µ {t : t t 1 α (f)} µ 1 = µ µ 1 µ {t : t t 1 α(f)}

13 Příklad pokračování Formulujeme hypotézy: H 0 : µ 1 µ vs. H A : µ 1 > µ. Nejprve musíme ověřit hypotézu o shodě rozptylů - homoskedasticitu. Formulujeme tedy pomocné hypotézy: H 0 : σ 1 = σ vs. H A : σ 1 σ. Použijeme testové kritérium F : F = s s 1 =, 5, 3 = 1,

14 Získanou hodnotu porovnáme s kritickým oborem: W α = {F : F Fα (n 1; n 1 1) F F 1 α (n 1; n 1 1)} = K = {F : F F 0,05 (10 1; 16 1) F F 1 0,05(10 1; 16 1)} = K = {F : F F 0,05 (9; 15) F F 0,975 (9; 15)} = K = {F : F 0, 6597; F 3, 171}. Vidíme, že testovací statistika F neleží v kritickém oboru. Lze tedy říci, že se nám nepodařilo, na základě pozorovaných

15 dat s 95% spolehlivostí zamítnout nulovou hypotézu. Lze tedy předpokládat, že rozptyly jsou shodné. Dále využijeme t-test za předpokladu: Pro test hypotézy X 1 N(µ 1, σ ) X N(µ, σ ) H 0 : µ 1 µ vs. H A : µ 1 > µ, použijeme tedy testové kritérium kde s = t = x 1 x s (n 1 1)s 1 + (n 1)s n 1 + n n1 n n 1 + n, = 15, 3 + 9, =, 37

16 a t = 11, 8 10, 16 10, = 1, 88. Hodnotu testového kritéria porovnáme s kritickým oborem K: a tedy K = {t : t t 1 α (n + n 1 )}, K = {t : t t 0,95 (4)} = 1, Vidíme, že naše testové kritérium leží v kritickém oboru a lze tedy říci, že s 95 % spolehlivostí se nám na základě pozorovaných dat podařilo zamítnout nulovou hypotézu o shodě dvou středních hodnot. Můžeme tedy usuzovat na to, že výcvik vede ke zkrácení doby reakce.

17 Testy hypotéz o shodě středních hodnot při závislých výběrech Jde o takzvaný Studentův párový t-test. V tomto případě lze převést nulovou hypotézu tvrdící, že náhodné výběry x 1 a x pocházejí z rozdělení se stejnými středními hodnotami na hypotézu H 0, která tvrdí, že náhodný výběr d = [d 1, d,, d n ], pochází z rozdělení jehož střední hodnota se rovná nule. Pro jednotlivé hodnoty d i, i = 1,,..., n platí: d i = d 1i d i.

18 Studentův párový t-test Testujeme tak hypotézu H 0 : µ d = µ 1 µ = 0. Testovým kritériem je statistika: t = d s d n. Kritické obory pro jednotlivé alternativní hypotézy udává tabulka: H 0 H A K µ d = µ 1 µ 0 µ d = µ 1 µ > 0 {t : t t 1 α (n 1)} µ d = µ 1 µ 0 µ d = µ 1 µ < 0 {t : t t 1 α (n 1)} µ d = µ 1 µ = 0 µ d = µ 1 µ 0 {t : t t 1 α(n 1)}

Úvod do statistiky (interaktivní učební text) - Řešené příklady. Martina Litschmannová

Úvod do statistiky (interaktivní učební text) - Řešené příklady. Martina Litschmannová Vysoká škola báňská Technická univerzita Ostrava Západočeská univerzita v Plzni Úvod do statistiky (interaktivní učební text) - Řešené příklady Martina Litschmannová 1. strana ze 159 1 Explorační analýza

Více

Masarykova univerzita Ekonomicko správní fakulta. Statistika II

Masarykova univerzita Ekonomicko správní fakulta. Statistika II Masarykova univerzita Ekonomicko správní fakulta Statistika II distanční studijní opora Marie Budíková Brno 2006 Tento projekt byl realizován za finanční podpory Evropské unie v rámci programu SOCRATES

Více

Statistické metody v ekonomii: Teoretická východiska, Jednofaktorová a dvoufaktorová analýza rozptlylu. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii: Teoretická východiska, Jednofaktorová a dvoufaktorová analýza rozptlylu. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii: Teoretická východiska, Jednofaktorová a dvoufaktorová analýza rozptlylu Ing. Michael Rost, Ph.D. Co je vlastně cílem? Cílem statistického zpracování dat je podání informace

Více

Biostatistika a matematické metody epidemiologie - stručné studijní texty

Biostatistika a matematické metody epidemiologie - stručné studijní texty Biostatistika a matematické metody epidemiologie - stručné studijní texty Bohumír Procházka, SZÚ Praha 1 Co můžeme sledovat Pro charakteristiku nebo vlastnost, kterou chceme sledovat zvolíme termín jev.

Více

Při statistickém zkoumání se snažíme udělat nějaký závěr ohledně vlastností celého statistického souboru

Při statistickém zkoumání se snažíme udělat nějaký závěr ohledně vlastností celého statistického souboru 0.1 Základy statistického zpracování dat 1 0.1 Základy statistického zpracování dat Statistika se zabývá shromažďováním, tříděním a popisem velkých souborů dat. Někdy se pod pojmem statistika myslí přímo

Více

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Testování hypotéz Biolog Statistik: Matematik: Informatik: Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé

Více

Jak správně interpretovat ukazatele způsobilosti a výkonnosti výrobního procesu

Jak správně interpretovat ukazatele způsobilosti a výkonnosti výrobního procesu Jak správně interpretovat ukazatele způsobilosti a výkonnosti výrobního procesu Jiří Michálek Ukazatele způsobilosti a výkonnosti C p, C pk, P p, P pk byly zavedeny ve snaze popsat stav výrobního procesu,

Více

Tvar dat a nástroj přeskupování

Tvar dat a nástroj přeskupování StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,

Více

Nesprávná užívání statistické významnosti a jejich možná řešení*

Nesprávná užívání statistické významnosti a jejich možná řešení* Nesprávná užívání statistické významnosti a jejich možná řešení* Petr Soukup** Institut sociologických studií Fakulta sociálních věd, Univerzita Karlova v Praze Improper Use of Statistical Significance

Více

Průzkumová analýza jednorozměrných dat (Teorie)

Průzkumová analýza jednorozměrných dat (Teorie) Míra nezaměstnanosti *%+ 211 Průzkumová analýza jednorozměrných dat (Teorie) Míra nezaměstnanosti *%+ (okres Opava, červen 21) Rozsah 77 Průměr 11,5 Minimum 5,5 Dolní kvartil 8,4 5 1 15 2 Medián 9,9 Horní

Více

ajejichaplikace Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174

ajejichaplikace Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174 Řešení krizových situací metody ajejichaplikace Katarína Jelšovská Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174 Inovace bakalářských studijních oborů se zaměřením

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Mirko Navara Centrum strojového vnímání katedra kybernetiky FEL ČVUT Karlovo náměstí, budova G, místnost 104a http://cmp.felk.cvut.cz/ navara/mvt http://cmp.felk.cvut.cz/

Více

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21 Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8

Více

StatSoft Jak se pozná normalita pomocí grafů?

StatSoft Jak se pozná normalita pomocí grafů? StatSoft Jak se pozná normalita pomocí grafů? Dnes se podíváme na zoubek speciální třídě grafů, podle názvu článku a případně i ilustračního obrázku vpravo jste jistě již odhadli, že půjde o třídu pravděpodobnostních

Více

JIHOČESKÁ UNIVERZITA, PEDAGOGICKÁ FAKULTA ÚVOD DO STATISTIKY. Tomáš MRKVIČKA, Vladimíra PETRÁŠKOVÁ

JIHOČESKÁ UNIVERZITA, PEDAGOGICKÁ FAKULTA ÚVOD DO STATISTIKY. Tomáš MRKVIČKA, Vladimíra PETRÁŠKOVÁ JIHOČESKÁ UNIVERZITA, PEDAGOGICKÁ FAKULTA ÚVOD DO STATISTIKY Tomáš MRKVIČKA, Vladimíra PETRÁŠKOVÁ ČESKÉ BUDĚJOVICE 2006 Recenzenti: prof. RNDr. Jindřich Klůfa, CSc., doc. RNDr. Pavel Tlustý, CSc. c Tomáš

Více

Obsah. 3 Testy 31 3.1 z test... 32 3.2 z test 2... 33 3.3 t test... 34 3.4 t test 2s... 35

Obsah. 3 Testy 31 3.1 z test... 32 3.2 z test 2... 33 3.3 t test... 34 3.4 t test 2s... 35 Obsah 1 Popisná statistika 4 1.1 bas stat........................................ 5 1.2 mean.......................................... 6 1.3 meansq........................................ 7 1.4 sumsq.........................................

Více

POROVNÁNÍ PŘESNOSTI MODELOVÁNÍ VÝNOSŮ PORTFOLIA PRO RŮZNÁ OBDOBÍ NA TRHU

POROVNÁNÍ PŘESNOSTI MODELOVÁNÍ VÝNOSŮ PORTFOLIA PRO RŮZNÁ OBDOBÍ NA TRHU POROVNÁNÍ PŘESNOSTI MODELOVÁNÍ VÝNOSŮ PORTFOLIA PRO RŮZNÁ OBDOBÍ NA TRHU Aleš Kresta Klíčová slova: modelování výnosů, kopula funkce, NIG model, VaR Key words: returns modelling, copula functions, NIG

Více

Ilustrační příklad odhadu SM v SW Gretl

Ilustrační příklad odhadu SM v SW Gretl Ilustrační příklad odhadu SM v SW Gretl Odhad simultánního modelu (SM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná studijní pomůcka MM2011 Úvodní obrazovka Gretlu

Více

Prognózování vzdělanostních potřeb na období 2008 až 2012 - stav modelu a aktuální prognóza

Prognózování vzdělanostních potřeb na období 2008 až 2012 - stav modelu a aktuální prognóza Prognózování vzdělanostních potřeb na období 2008 až 2012 - stav modelu a aktuální prognóza vypracováno pro část grantového projektu: Společnost vědění - nároky na kvalifikaci lidských zdrojů a na další

Více

Nástroje pro analýzu dat

Nástroje pro analýzu dat 7 Nástroje pro analýzu dat V té to ka pi to le: Ověřování vstupních dat Hledání řešení Řešitel Scénáře Citlivostní analýza Rychlá analýza Kapitola 7 Nástroje pro analýzu dat Součástí Excelu jsou nástroje

Více

Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady. Martina Litschmannová

Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady. Martina Litschmannová Vysoká škola báňská Technická univerzita Ostrava Západočeská univerzita v Plzni Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady Martina Litschmannová 1. strana ze 102 1

Více

Podkapitoly se doporučuje dělit na části typu úvod, hlavní část a souhrn. To přispívá k přehlednosti a dělá dobrý dojem při posuzování práce.

Podkapitoly se doporučuje dělit na části typu úvod, hlavní část a souhrn. To přispívá k přehlednosti a dělá dobrý dojem při posuzování práce. Struktura obsahu teoreticky zaměřené práce V tomto návrhu se vyžaduje od autora práce, aby prokázal vhodným návrhem řazení kapitol a subkapitol (i jejich označením), že dokáže podat téma a řešení přehledným

Více

Úvod do jazyka C. *.obj *.lis. Pomocí něj vytváříme a upravujeme zdrojový soubor (*.C, *.CPP).

Úvod do jazyka C. *.obj *.lis. Pomocí něj vytváříme a upravujeme zdrojový soubor (*.C, *.CPP). *.h *.lib ladění Editor Preprocesor Linker Debugger Compiler *.cpp *.obj *.lis *.exe spuštění Editor Preprocesor Pomocí něj vytváříme a upravujeme zdrojový soubor (*.C, *.CPP). Jedná se o součást překladače,

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

PŘEDBĚŽNÁ SOUHRNNÁ ZPRÁVA TESTOVÁNÍ ŽÁKŮ MATURITNÍCH ROČNÍKU STŘEDNÍCH ŠKOL

PŘEDBĚŽNÁ SOUHRNNÁ ZPRÁVA TESTOVÁNÍ ŽÁKŮ MATURITNÍCH ROČNÍKU STŘEDNÍCH ŠKOL SONDA MATURANT PO 11 LETECH PŘEDBĚŽNÁ SOUHRNNÁ ZPRÁVA TESTOVÁNÍ ŽÁKŮ MATURITNÍCH ROČNÍKU STŘEDNÍCH ŠKOL Tento materiál obsahuje stručnou charakteristiku projektu a souhrnné výsledky z testování Sonda maturant

Více

Statistické zpracování dat garant: Prof. Ing. Milan Palát, CSc.

Statistické zpracování dat garant: Prof. Ing. Milan Palát, CSc. Statistické zpracování dat garant: Prof. Ing. Milan Palát, CSc. OP Vzdělávání pro konkurenceschopnost Aktivita 02 Vícerozměrné statistické metody (podklady pro modul, další aplikace v systému UNISTAT a

Více

Doporučení pro určení odhadů nejistot výsledků měření/klinických testů v klinických laboratořích

Doporučení pro určení odhadů nejistot výsledků měření/klinických testů v klinických laboratořích Doporučení pro určení odhadů nejistot výsledků měření/klinických testů v klinických laboratořích Suchánek M. 1, Friedecký B. 2, Kratochvíla J. 2, Budina M. 2, Bartoš V. 3 1 VŠCHT Praha 2 SEKK Pardubice

Více

Přiřazení zdrojů. V té to ka pi to le:

Přiřazení zdrojů. V té to ka pi to le: 5 Přiřazení zdrojů V té to ka pi to le: Přiřazení pracovních zdrojů Přiřazení materiálových zdrojů Přiřazení nákladových zdrojů Přiřazení rozpočtových zdrojů Kapitola 5 Přiřazení zdrojů V minulých kapitolách

Více