Pravděpodobostí model doby setrváí miistra školství ve fukci Základí statistická iferece Data Zdro: http://www.msmt.cz/miisterstvo/miistri-skolstvi-od-roku-848. Ke statistickému zpracováí byla vzata pozorováí od roku (ástupu do fukce) 900 do 9.7.00. K datům elze mít odpovídaící statistické ámitky. Případé ámitky lze mít e z pohledu historického. Pro přepočet T doby trváí v rocích byl použit ásleduící vztah doba =, kde T e počet dů v postaveí 365,5 miistra bez posledího de. Případá překrytí (apř. de ástupu edoho e i dem ukočeí fukce druhého, ) byla elimiováa (východiskem e de ástupu). Jedotlivé pozorovaé doby lze chápat ako áhodý výběr. Vzhledem k charakteru dat elze teto předpoklad ai potvrdit a ai vyvrátit. Celkem bude zpracováváo 53 dob setrváváí ve fukci miistra školství, s uzemí působostí v ZEMÍCH KORUNY ČESKÉ. Data sou v [] a listu Vývo. Následuí základí výběrové statistiky a empirická distribučí fukce. Výběrová charakteristika Počet let ve fukci EDF distribuce X EDF doby setrváí ve fukci, hodoty Y Miimum 0,04 0 00 Průměr=,066,07 00 Mediá=,46,44 00 Maimum,578,578 00 StD,7,69 0,968 5% kvatil 0,630 0,595 0 75% kvatil,66,60 00 Průměrá abs. odchylka,496,494 0,547 Počet 53 54 54 Tabulka.: Výběrové charakteristiky dat a empirické distribučí fukce. 0,5 0,0 0,5 0,0 0,0 0,5,0,5,0,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 0,0 0,5,0,5,0 EDF doby setrváí ve fukci Průměr=,07; Mediá=,43 Obr..: Průběh empirické distribučí fukce. Na vodorové ose sou roky setrváí ve fukci.
Cíl zpracováí Cílem zpracováí e avrhout pravděpodobostí model, který by umožil v budoucosti předvídat dobu setrváí miistra ve fukci. Parametrické modely Epoeciálí model Protože se edá o ezáporou áhodou proměou (kterou e možo považovat za spoitou, při měřeí doby v rocích setrváí ve fukci) maící charakter trváí abízí se ituitivě klasické epoeciálí rozděleí s distribucí a hustotou: Pro toto rozděleí platí: E { } a { } F( ) = e a f ( ) = e () = σ =. Nelepším (vydatým) estraým odhadem parametru e průměr pozorováí, tedy ˆ = t i [], str. 88, kde t i e doba setrváí ve fukci i= i-tého miistra ve fukci. Takový odhad dává: ˆ=,066. Srováí modelové distribučí fukce a empirické distribučí fukce e a ásleduícím obrázku. Obr..: Průběh modelové a empirické distribučí fukce. Na vodorové ose sou roky setrváí ve fukci. Následue tabulka srováí výběrových a modelových parametrů. Pro výpočet mediáu a kvatilů byl p užit vztah e = p = lg( p) 0 p <. 0,5 0,0 0,5 0,0 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5 F() modelová, parametrický odhad; tau=,066 p EDF doby setrváí ve fukci. p=0,5;0,5;. Uvedeý vztah platí ale pro libovolé
Srováí výběrových a modelových parametrů Parametr Výběrový Modelov Diferece Diferece/M odelový ý Miimum 0,037 --- --- --- Průměr=,0657,0657 00 % Mediá=,464,438-54 -0,38% Maimum,5784 --- --- --- StD,73,0657 7 5,% 5% kvatil 0,697 0,5943 0,0354 5,96% 75% kvatil,66,8636 - -7,07% Průměrá abs. odchylka,4957,574-0,07 -,43% Počet 53 --- --- --- Tabulka.: Výběrové a modelové charakteristiky. Srováí u směrodaté odchylky a 5%, 75% kvatilů sou epřesvědčivá. Proto e ezbyté uskutečit ěaký test shody modelu a pozorovaých dat. Zvolíme χ test dobré shody [3]. Výsledek a výpočet takového testu e shrut v ásleduící tabulce. Požadueme ízkou hodotu chyby -ho druhu ve výši %. Obdobě viz i test, že se edá o id výběr (viz list id, souboru []). Itervaly kvatováí pro a chi- test dobré shody z z ) F ( p Výpočet kritéria 4,9333 z= 0,047 0,09434 0,09434 5 00 z= 0,439 0,8868 0,09434 4 0 3 z3= 0,6873 0,830 0,09434 6 0 4 z4= 0,9787 0,37736 0,09434 3 00 5 z5=,38 0,4770 0,09434 7 00 6 z6=,744 0,56604 0,09434 4 0 7 z7=,308 0,66038 0,09434 7 00 8 z8=,9030 47 0,09434 5 00 9 z9= 3,9059 0,84906 0,09434 3 00 0 z0= 5,930 0,94340 0,09434 7 00 z= + 000 660 0,3333 M ( p ) = p = 4,9333 M-= 0 α=,0% χ (M-)= 3,093 Tabulka 3.: Výpočet testu shody. Modelová středí absolutí odchylka se spočte a základě ásleduícího postupu. Měme áhodou veličiu ξ, která má epoeciálí η = ξ platí ( ) = P ( η < ) = P ( ξ < ) = P ( < ξ < + ) = F ( + ) F ( ) rozděleí s parametrem. Potom pro áhodou veličiu F η + ma = e 0, e ; 0. + Odtud E { η } = ( Fη ( )) d. Teto itegrál lze s přiatelou přesostí spočíst umericky pro daé. Viz list 0 Epoeciálí souboru [], sloupce Distribuce absolutí odchylky a Výpočet středí hodoty. ξ ξ =
Výpočet e v [], a listu Epoeciálí. Hodota kritéria leží mimo kritický oboru, proto hypotézu o tom, že se doba setrváí řídí rozděleím F( ) = e, ezamítáme pro odhaduté =,0657. Proto (hlavě pro výše uvedeé pochybosti u směrodaté odchylky a 5%, 75% kvatilů ), využieme zvoleého tvaru rozděleí avšak e pro bodový, ale itervalový odhad parametru. Využieme postup popsaý v [4]. Výpočet e v [], opět a listu Epoeciálí. Pro volbu koeficietu spolehlivosti -α, použieme rozklad -α=-(α +α ), kde α=0,0( %); α =5;α =5. Výpočet e shrut v tabulce 4. Itervalový odhad parametru = G t α = 0,5% α = 0,5% (,, α ) = 53 t=,0657 d =,4870 t = = 3,0306 (,, α ) h G Tabulka 4.: Výpočet itervalového odhadu pro parametr. Takovému itervalovému odhadu odpovídá pás distribučích fukcí zobrazeý a obr.3. Výpočet e v [], a listu Epoeciálí, tolerace. 0,5 0,0 0,5 0,0 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 F(,487;) F(,066;) F(3,03;) Obr.3.: Distribučí fukce pro d (čerá, plá), ˆ (červeá čárkovaá) a h (čerá tečkovaá). Skutečá, ale edostupá distribučí fukce leží s daou spolehlivostí (99%) mezi oběma čerými čarami. Při tomto poetí e výrok o budoucí době setrváí ve fukci statistickým výrokem o toleračím itervalu. Opět užieme metodiku z [4]. Výpočet e v [], a listu Epoeciálí. Výpočet e shrut v ásleduící tabulce 5. z e G (, ; ) = dz ( )! 0 z
P Itervalový odhad parametru = G Toleračí iterval pro dobu setrváí ve fukci t α = 0,5% α = 0,5% (,, α ) = 53 t=,0657 d =,4870 h G t = = 3,0306 (,, α ) β =,5% β =,5% V měsících lg ( ) ( β ) L,,..., = i i= G (,, α ) lg ( ) ( β) U,,..., i i= G (,, α) [ P { L(,..., ) doba U (,,..., )} ] 0, 99 [rok]= 0,038 0,5 = [rok]=,79 34,,,..., 53 doba 53 53 Tabulka 5.:Tabulka výpočtu toleračí doby setrváí ve fukci. Shruto: S pravděpodobostí alespoň 95% setrvá miistr školství ve fukci mezi 0,5 a 34 měsíci. Spolehlivost tohoto výroku (=pravděpodobost, že bude splě) e alespoň 99%. Podkladové soubory a zdroe [] miistri skolstvi-studie.ls [] Jaroslav Hátle, Jiří Likeš: Základy počtu pravděpodobosti a matematické statistiky. SNTL Praha 974. [3] Předáška SA- - Neparametrické metody - testy, rozděleí s kategoriálími proměými. Str.. [4] Předáška VSM-3 Itervalové odhady. Metody kostrukce itervalových odhadů.
Příloha.: Další empirické důvody pro volbu epoeciálího rozděleí Výpočetí schéma pro χ test dobré shody využieme k tomu, že se pokusíme alézt (metodou pokus-omyl) takové ˆ(a tři desetiá místa), které miimalizue hodotu pravděpodobosti chyby prvího druhu. Miimálí hodota kritéria= 00; í příslušá pravděpodobost chyby -ho druhu= 6% Miimálí ˆ pro takovou hodotu=,85 Maimálí ˆ pro takovou hodotu=,853 Tabulka výpočtu Tabulka výpočtu Modelová a empirická distribučí fukce Výpočet kritéria i z-i F(z-i) p-i -i 00 z-= 0,798 0,09434 0,09434 5 00 z-= 0,3795 0,8868 0,09434 4 0 3 z-3= 39 0,830 0,09434 4 0 4 z-4= 99 0,37736 0,09434 5 00 5 z-5=,58 0,4770 0,09434 5 00 6 z-6=,55 0,56604 0,09434 5 00 7 z-7=,960 0,66038 0,09434 5 00 8 z-8=,5507 47 0,09434 6 0 9 z-9= 3,439 0,84906 0,09434 5 00 0 z-0= 5, 0,94340 0,09434 6 0 z-= 000 660 3 00 Kritérium= 0,5 0,0 0,5 0,0 Itervaly kvatováí pro a chi- test dobré shody Jeho p-hodota= Počet stupňů volosti= alfa= Kritická hodota= 00 6% 0 0% 3,093 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 Itervaly kvatováí pro a chi- test dobré shody Modelová a empirická distribučí fukce Výpočet kritéria i z-i F(z-i) p-i -i 00 z-= 0,836 0,09434 0,09434 5 00 z-= 0,3874 0,8868 0,09434 4 0 3 z-3= 0,665 0,830 0,09434 4 0 4 z-4= 0,8779 0,37736 0,09434 5 00 5 z-5=,84 0,4770 0,09434 5 00 6 z-6=,5469 0,56604 0,09434 5 00 7 z-7=,00 0,66038 0,09434 6 0 8 z-8=,604 47 0,09434 5 00 9 z-9= 37 0,84906 0,09434 5 00 0 z-0= 5,3 0,94340 0,09434 6 0 z-= 000 660 3 00 Kritérium= 0,5 0,0 0,5 0,0 Jeho p-hodota= Počet stupňů volosti= alfa= Kritická hodota= 00 6% 0 0% 3,093 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 F() modelová, parametrický odhad; tau=,85 EDF doby setrváí ve fukci F() modelová, parametrický odhad; tau=,875 EDF doby setrváí ve fukci Pozámky. Používáme-li bodový odhad, e důležité akým kritériem ebo vlastostí budeme hodotit eho kvalitu, či k akému účelu ho budeme dál používat.. Kvalita bodového odhadu e při měřeí eho p-hodotou dáa kostrukcí daého testu. 3. Taková p-hodota e áhodou proměou (e dáa áhodými pozorováími). 4. Nestraost a vydatost parametrického odhadu emusí být pro ěkteré účely vhodým kritériem pro přietí takového odhadu. Výpočet pro popsaé empirické testy e v [] a listu Epoeciálí-ověřeí.