Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Podobné dokumenty
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

12. cvičení z PST. 20. prosince 2017

Testy. Pavel Provinský. 19. listopadu 2013

PRAVDĚPODOBNOST A STATISTIKA

Přednáška X. Testování hypotéz o kvantitativních proměnných

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a aplikovaná statistika

Ing. Michael Rost, Ph.D.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PRAVDĚPODOBNOST A STATISTIKA

Cvičení ze statistiky - 8. Filip Děchtěrenko

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

= = 2368

Normální (Gaussovo) rozdělení

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Testování statistických hypotéz

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

4ST201 STATISTIKA CVIČENÍ Č. 7

y = 0, ,19716x.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Normální (Gaussovo) rozdělení

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

You created this PDF from an application that is not licensed to print to novapdf printer (

Stručný úvod do testování statistických hypotéz

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

15. T e s t o v á n í h y p o t é z

Poznámky k předmětu Aplikovaná statistika, 11. téma

TECHNICKÁ UNIVERZITA V LIBERCI

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Charakteristika datového souboru

2 ) 4, Φ 1 (1 0,005)

KGG/STG Statistika pro geografy

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

STATISTICKÉ HYPOTÉZY

Vzorová prezentace do předmětu Statistika

Definice spojité náhodné veličiny zjednodušená verze

STATISTICKÉ ZJIŠŤOVÁNÍ

Pravděpodobnost a matematická statistika

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Aproximace binomického rozdělení normálním

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Výběrové charakteristiky a jejich rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Náhodné veličiny, náhodné chyby

Přijímací zkouška na navazující magisterské studium 2014

15. T e s t o v á n í h y p o t é z

5 Parametrické testy hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

12. prosince n pro n = n = 30 = S X

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

KGG/STG Statistika pro geografy

Národníinformačnístředisko pro podporu jakosti

Jednofaktorová analýza rozptylu

Statistika, Biostatistika pro kombinované studium. Jan Kracík

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Testování statistických hypotéz

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Kontingenční tabulky a testy shody

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

Regresní analýza 1. Regresní analýza

5. Odhady parametrů. KGG/STG Zimní semestr

Technická univerzita v Liberci

Tomáš Karel LS 2012/2013

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

5. T e s t o v á n í h y p o t é z

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Návrh a vyhodnocení experimentu

Interval spolehlivosti velký výběr

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

4EK211 Základy ekonometrie

Transkript:

Ing. Michal Dorda, Ph.D.

Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce. Vlaků / h 0 3 4 5 6 7 n i 7 93 03 58 50 6 Na hladině významnosti 0,05 otestujte hypotézu, že počet přijíždějících vlaků za hodinu se řídí Poissonovým rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D.

Abychom byli schopni specifikovat nulovou a alternativní hypotézu, je nejdříve třeba odhadnout na základě výběru neznámý parametr Poissonovarozdělení λ. Odhad provedeme pomocí metody maximální věrohodnosti. Odvodili jsme si, že: n ˆ λ x n i v i n i 360 ( 0 7 + 93 +... + 7 ) &,30. Ing. Michal Dorda, Ph.D. 3

Máme proveden odhad parametru rozdělení, můžeme tedy specifikovat obě hypotézy: H 0 Náhodný výběr pochází z Poissonova rozdělení s parametrem λ,30. H Náhodný výběr nepochází z Poissonova rozdělení s parametrem λ,30. Ing. Michal Dorda, Ph.D. 4

Víme, že pro testovou statistiku platí: G ( ) k n i n 0, i χk h n i 0, i kde kv tomto případě představuje počet variant proměnné. Pozorované četnosti známe, zbývá nám tedy stanovit četnosti teoretické., Ing. Michal Dorda, Ph.D. 5

Teoretické relativní četnosti 0,i vypočítáme dosazením do pravděpodobnostní funkce:,30 0!,30!,30 4!,30 6!,30!,30 3!,30 5! 0 0, P 0, 0,3 0,5 0,7 6 P P P i,30,30 ( X 0) e & 0,00, P( X ) e & 0,3,,30 ( X ) e & 0,65, P( X 3),30 ( X 4) e & 0,7, P( X 5),30 ( X 6) e & 0,0, P( X 7) P( X < 7) 0, i & 0,009. 4 6 0,4 0,6 0,8,30 & 0,03, & 0,054, Ing. Michal Dorda, Ph.D. 6 3 5 e e,30

Třída Varianta Pozorovaná Teoretická relativní Teoretická proměnné v i četnost n i četnost 0,i četnost n 0,i 0 7 0,00 36,000 93 0,3 83,60 3 03 0,65 95,400 4 3 58 0,03 73,080 5 4 50 0,7 4,0 6 5 0,054 9,440 7 6 6 0,0 7,560 8 7 a více 0,009 3,40 360,000 360 Ing. Michal Dorda, Ph.D. 7

Z tabulky vidíme, že pro 8. třídu nemáme teoretickou četnost větší než 5, musíme ji teda sloučit se 7. třídou (dojde k poklesu o stupeň volnosti). Pozorovaná Teoretická ( ni n 0, i ) četnost n i četnost n n 0,i 0, i 7 36,000,50 93 83,60,64 03 95,400 0,605 58 73,080 3, 50 4,0,474 9,440 0,5 8 0,800 0,76 360 360 9,45686 x obs Ing. Michal Dorda, Ph.D. 8

Nyní je třeba stanovit kritickou hodnotu testu. Jelikož hladina významnosti α 0,05, po sloučení máme 7 tříd (k) a odhadovali jsme parametr rozdělení (h), dostáváme: xkrit χ( α ); k h χ0,95;5 CHIINV ( 0,05;5 ) &,07. Vidíme, že pozorovaná hodnota testové statistiky není vyšší než kritická hodnota testu, leží tedy v oboru přijetí, proto na hladině významnosti 0,05 nezamítáme nulovou hypotézu o tom, že počet přijíždějících vlaků za hodinu se řídí Poissonovým rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 9

Př. : V systému hromadné obsluhy bylo provedeno měření doby obsluhy v [min]. Získaný roztříděný statistický soubor je uveden v tabulce. Na hladině významnosti 0,0 otestujte hypotézu, že doba obsluhy se řídí exponenciálním rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 0

Třída Hranice Třídní znak Horní Pozorovaná třídy z i hranice h i četnost n i (0;3>,5 3 4 (3;6> 4,5 6 6 3 (6;9> 7,5 9 0 4 (9;> 0,5 9 5 (;5> 3,5 5 8 6 (5;8> 6,5 8 5 7 (8;> 9,5 3 8 (; ),5 5 70 Ing. Michal Dorda, Ph.D.

Abychom byli schopni specifikovat nulovou a alternativní hypotézu, je nejdříve třeba odhadnout na základě výběru neznámý parametr exponenciálního rozdělení μ. Odhad provedeme pomocí metody maximální věrohodnosti. Odvodili jsme si, že: ˆ µ x n n i n i z i n i n n i z i 70 4,5 +... + 5,5 & 0,. Ing. Michal Dorda, Ph.D.

Máme proveden odhad parametru rozdělení, můžeme tedy specifikovat obě hypotézy: H 0 Náhodný výběr pochází z exponenciálního rozdělení s parametrem μ 0,. H Náhodný výběr nepochází z exponenciálního rozdělení s parametrem μ 0,. Ing. Michal Dorda, Ph.D. 3

Než přistoupíme k výpočtu teoretických relativních četností, stanovme si hodnoty distribuční funkce exponenciálního rozdělení pro všechny horní hranice tříd h i : F F F F 0, 3 ( h ) e & 0,86, F( h ) 0, 9 ( h3 ) e & 0,636, F( h4 ) 0, 5 ( h5 ) e & 0,84, F( h6 ) 0, ( h ) e & 0,905, F( h ). 7 8 e e e 0, 6 0, & 0, 8 & 0,490, & 0,740, 0,867, Ing. Michal Dorda, Ph.D. 4

Teoretické relativní četnosti můžeme stanovit na základě znalosti hodnot distribuční funkce: 0, F( h ) 0,86, 0, F( h ) F( h ) 0,04, 0,3 F ( h3 ) F ( h ) 0,46, 0,4 F ( h4 ) F ( h3 ) 0,04,, 0,5 F( h5 ) F( h4 ) 0,074, 0,6 F( h6 ) F( h5 ) 0,053, F( h ) F( h ) 0,038, F( h ) F( h ) 0,095. 0,7 7 6 0,8 8 7 Ing. Michal Dorda, Ph.D. 5

Třída Hranice Třídní znak Horní Pozorovaná Hodnota distribuční Teoretická relativní Teoretická třídy z i hranice h i četnost n i funkce F(h i ) četnost 0,i četnost n 0,i (0;3>,5 3 4 0,86 0,86 0,00 (3;6> 4,5 6 6 0,490 0,04 4,80 3 (6;9> 7,5 9 0 0,636 0,46 0,0 4 (9;> 0,5 9 0,740 0,04 7,80 5 (;5> 3,5 5 8 0,84 0,074 5,80 6 (5;8> 6,5 8 5 0,867 0,053 3,70 7 (8;> 9,5 3 0,905 0,038,660 8 (; ),5 5,000 0,095 6,650 70,000 70 Z tabulky vidíme, že u tříd 6 a 7 nemáme teoretickou četnost větší než 5, proto provedeme sloučení příslušných tříd. Ing. Michal Dorda, Ph.D. 6

) Pozorovaná Teoretická ( ni n 0, i četnost n i četnost n 0,i n 0, i 4 0,00,80 6 4,80 0,07 0 0,0 0,005 9 7,80 0,406 8 5,80,535 8 6,370 0,47 5 6,650 0,409 70 70 4,7900 x obs Ing. Michal Dorda, Ph.D. 7

Nyní je třeba stanovit kritickou hodnotu testu. Jelikož hladina významnosti α 0,0, po sloučení máme 7 tříd (k) a odhadovali jsme parametr rozdělení (h), dostáváme: xkrit χ( α ); k h χ0,99;5 CHIINV ( 0,0;5 ) & 5,09. Vidíme, že pozorovaná hodnota testové statistiky není vyšší než kritická hodnota testu, leží tedy v oboru přijetí, proto na hladině významnosti 0,0 nezamítáme nulovou hypotézu o tom, že doba obsluhy se řídí exponenciálním rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 8