Ing. Michal Dorda, Ph.D.
Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce. Vlaků / h 0 3 4 5 6 7 n i 7 93 03 58 50 6 Na hladině významnosti 0,05 otestujte hypotézu, že počet přijíždějících vlaků za hodinu se řídí Poissonovým rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D.
Abychom byli schopni specifikovat nulovou a alternativní hypotézu, je nejdříve třeba odhadnout na základě výběru neznámý parametr Poissonovarozdělení λ. Odhad provedeme pomocí metody maximální věrohodnosti. Odvodili jsme si, že: n ˆ λ x n i v i n i 360 ( 0 7 + 93 +... + 7 ) &,30. Ing. Michal Dorda, Ph.D. 3
Máme proveden odhad parametru rozdělení, můžeme tedy specifikovat obě hypotézy: H 0 Náhodný výběr pochází z Poissonova rozdělení s parametrem λ,30. H Náhodný výběr nepochází z Poissonova rozdělení s parametrem λ,30. Ing. Michal Dorda, Ph.D. 4
Víme, že pro testovou statistiku platí: G ( ) k n i n 0, i χk h n i 0, i kde kv tomto případě představuje počet variant proměnné. Pozorované četnosti známe, zbývá nám tedy stanovit četnosti teoretické., Ing. Michal Dorda, Ph.D. 5
Teoretické relativní četnosti 0,i vypočítáme dosazením do pravděpodobnostní funkce:,30 0!,30!,30 4!,30 6!,30!,30 3!,30 5! 0 0, P 0, 0,3 0,5 0,7 6 P P P i,30,30 ( X 0) e & 0,00, P( X ) e & 0,3,,30 ( X ) e & 0,65, P( X 3),30 ( X 4) e & 0,7, P( X 5),30 ( X 6) e & 0,0, P( X 7) P( X < 7) 0, i & 0,009. 4 6 0,4 0,6 0,8,30 & 0,03, & 0,054, Ing. Michal Dorda, Ph.D. 6 3 5 e e,30
Třída Varianta Pozorovaná Teoretická relativní Teoretická proměnné v i četnost n i četnost 0,i četnost n 0,i 0 7 0,00 36,000 93 0,3 83,60 3 03 0,65 95,400 4 3 58 0,03 73,080 5 4 50 0,7 4,0 6 5 0,054 9,440 7 6 6 0,0 7,560 8 7 a více 0,009 3,40 360,000 360 Ing. Michal Dorda, Ph.D. 7
Z tabulky vidíme, že pro 8. třídu nemáme teoretickou četnost větší než 5, musíme ji teda sloučit se 7. třídou (dojde k poklesu o stupeň volnosti). Pozorovaná Teoretická ( ni n 0, i ) četnost n i četnost n n 0,i 0, i 7 36,000,50 93 83,60,64 03 95,400 0,605 58 73,080 3, 50 4,0,474 9,440 0,5 8 0,800 0,76 360 360 9,45686 x obs Ing. Michal Dorda, Ph.D. 8
Nyní je třeba stanovit kritickou hodnotu testu. Jelikož hladina významnosti α 0,05, po sloučení máme 7 tříd (k) a odhadovali jsme parametr rozdělení (h), dostáváme: xkrit χ( α ); k h χ0,95;5 CHIINV ( 0,05;5 ) &,07. Vidíme, že pozorovaná hodnota testové statistiky není vyšší než kritická hodnota testu, leží tedy v oboru přijetí, proto na hladině významnosti 0,05 nezamítáme nulovou hypotézu o tom, že počet přijíždějících vlaků za hodinu se řídí Poissonovým rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 9
Př. : V systému hromadné obsluhy bylo provedeno měření doby obsluhy v [min]. Získaný roztříděný statistický soubor je uveden v tabulce. Na hladině významnosti 0,0 otestujte hypotézu, že doba obsluhy se řídí exponenciálním rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 0
Třída Hranice Třídní znak Horní Pozorovaná třídy z i hranice h i četnost n i (0;3>,5 3 4 (3;6> 4,5 6 6 3 (6;9> 7,5 9 0 4 (9;> 0,5 9 5 (;5> 3,5 5 8 6 (5;8> 6,5 8 5 7 (8;> 9,5 3 8 (; ),5 5 70 Ing. Michal Dorda, Ph.D.
Abychom byli schopni specifikovat nulovou a alternativní hypotézu, je nejdříve třeba odhadnout na základě výběru neznámý parametr exponenciálního rozdělení μ. Odhad provedeme pomocí metody maximální věrohodnosti. Odvodili jsme si, že: ˆ µ x n n i n i z i n i n n i z i 70 4,5 +... + 5,5 & 0,. Ing. Michal Dorda, Ph.D.
Máme proveden odhad parametru rozdělení, můžeme tedy specifikovat obě hypotézy: H 0 Náhodný výběr pochází z exponenciálního rozdělení s parametrem μ 0,. H Náhodný výběr nepochází z exponenciálního rozdělení s parametrem μ 0,. Ing. Michal Dorda, Ph.D. 3
Než přistoupíme k výpočtu teoretických relativních četností, stanovme si hodnoty distribuční funkce exponenciálního rozdělení pro všechny horní hranice tříd h i : F F F F 0, 3 ( h ) e & 0,86, F( h ) 0, 9 ( h3 ) e & 0,636, F( h4 ) 0, 5 ( h5 ) e & 0,84, F( h6 ) 0, ( h ) e & 0,905, F( h ). 7 8 e e e 0, 6 0, & 0, 8 & 0,490, & 0,740, 0,867, Ing. Michal Dorda, Ph.D. 4
Teoretické relativní četnosti můžeme stanovit na základě znalosti hodnot distribuční funkce: 0, F( h ) 0,86, 0, F( h ) F( h ) 0,04, 0,3 F ( h3 ) F ( h ) 0,46, 0,4 F ( h4 ) F ( h3 ) 0,04,, 0,5 F( h5 ) F( h4 ) 0,074, 0,6 F( h6 ) F( h5 ) 0,053, F( h ) F( h ) 0,038, F( h ) F( h ) 0,095. 0,7 7 6 0,8 8 7 Ing. Michal Dorda, Ph.D. 5
Třída Hranice Třídní znak Horní Pozorovaná Hodnota distribuční Teoretická relativní Teoretická třídy z i hranice h i četnost n i funkce F(h i ) četnost 0,i četnost n 0,i (0;3>,5 3 4 0,86 0,86 0,00 (3;6> 4,5 6 6 0,490 0,04 4,80 3 (6;9> 7,5 9 0 0,636 0,46 0,0 4 (9;> 0,5 9 0,740 0,04 7,80 5 (;5> 3,5 5 8 0,84 0,074 5,80 6 (5;8> 6,5 8 5 0,867 0,053 3,70 7 (8;> 9,5 3 0,905 0,038,660 8 (; ),5 5,000 0,095 6,650 70,000 70 Z tabulky vidíme, že u tříd 6 a 7 nemáme teoretickou četnost větší než 5, proto provedeme sloučení příslušných tříd. Ing. Michal Dorda, Ph.D. 6
) Pozorovaná Teoretická ( ni n 0, i četnost n i četnost n 0,i n 0, i 4 0,00,80 6 4,80 0,07 0 0,0 0,005 9 7,80 0,406 8 5,80,535 8 6,370 0,47 5 6,650 0,409 70 70 4,7900 x obs Ing. Michal Dorda, Ph.D. 7
Nyní je třeba stanovit kritickou hodnotu testu. Jelikož hladina významnosti α 0,0, po sloučení máme 7 tříd (k) a odhadovali jsme parametr rozdělení (h), dostáváme: xkrit χ( α ); k h χ0,99;5 CHIINV ( 0,0;5 ) & 5,09. Vidíme, že pozorovaná hodnota testové statistiky není vyšší než kritická hodnota testu, leží tedy v oboru přijetí, proto na hladině významnosti 0,0 nezamítáme nulovou hypotézu o tom, že doba obsluhy se řídí exponenciálním rozdělením pravděpodobnosti. Ing. Michal Dorda, Ph.D. 8