Pravděpodobnostní model doby setrvání ministra školství ve funkci

Podobné dokumenty
Odhady parametrů 1. Odhady parametrů

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Náhodný výběr 1. Náhodný výběr

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Intervalové odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

12. N á h o d n ý v ý b ě r

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Pravděpodobnostní modely

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

P2: Statistické zpracování dat

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

V. Normální rozdělení

Intervalové odhady parametrů některých rozdělení.

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

NEPARAMETRICKÉ METODY

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Deskriptivní statistika 1

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Popisná statistika. Zdeněk Janák 9. prosince 2007

8. Analýza rozptylu.

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

4. B o d o v é o d h a d y p a r a m e t r ů

13 Popisná statistika

14. B o d o v é o d h a d y p a r a m e t r ů

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

8. Odhady parametrů rozdělení pravděpodobnosti

VaR analýza citlivosti, korekce

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Elementární zpracování statistického souboru

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Přednášky část 7 Statistické metody vyhodnocování dat

PRAVDĚPODOBNOST A STATISTIKA

7. Odhady populačních průměrů a ostatních parametrů populace

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

Dynamická pevnost a životnost Statistika

17. Statistické hypotézy parametrické testy

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Národní informační středisko pro podporu jakosti

2 STEJNORODOST BETONU KONSTRUKCE

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

PRAVDĚPODOBNOST A STATISTIKA

Interval spolehlivosti pro podíl

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

PE 301 Podniková ekonomika 2. Garant: Eva KISLINGEROVÁ. Téma Metody mezipodnikového srovnávání. Téma 12. Eva Kislingerová

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

K čemu slouží regrese?

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Úloha III.S... limitní

Závislost slovních znaků

Testování statistických hypotéz

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Úloha II.S... odhadnutelná

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

3. Charakteristiky a parametry náhodných veličin

OVMT Přesnost měření a teorie chyb

1 ROVNOMĚRNOST BETONU KONSTRUKCE

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

vají statistické metody v biomedicíně

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

6. FUNKCE A POSLOUPNOSTI

2. Náhodná veličina. je konečná nebo spočetná množina;

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

6. P o p i s n á s t a t i s t i k a

Kvantily. Problems on statistics.nb 1

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

1 Základy Z-transformace. pro aplikace v oblasti

I. TAYLORŮV POLYNOM. Taylorovy řady některých funkcí: Pro x R platí: sin(x) =

HODNOCENÍ KVALITY MATERIÁLU PRI SÉRIOVÉ PRODUKCI ODLITKU Z NIKLOVÝCH SLITIN PRO NÁROCNÉ PROVOZNÍ PODMÍNKY

Obsah. skentest. 1. Úvod. 2. Metoda výpočtu Základní pojmy

1. Základy měření neelektrických veličin

Transkript:

Pravděpodobostí model doby setrváí miistra školství ve fukci Základí statistická iferece Data Zdro: http://www.msmt.cz/miisterstvo/miistri-skolstvi-od-roku-848. Ke statistickému zpracováí byla vzata pozorováí od roku (ástupu do fukce) 900 do 9.7.00. K datům elze mít odpovídaící statistické ámitky. Případé ámitky lze mít e z pohledu historického. Pro přepočet T doby trváí v rocích byl použit ásleduící vztah doba =, kde T e počet dů v postaveí 365,5 miistra bez posledího de. Případá překrytí (apř. de ástupu edoho e i dem ukočeí fukce druhého, ) byla elimiováa (východiskem e de ástupu). Jedotlivé pozorovaé doby lze chápat ako áhodý výběr. Vzhledem k charakteru dat elze teto předpoklad ai potvrdit a ai vyvrátit. Celkem bude zpracováváo 53 dob setrváváí ve fukci miistra školství, s uzemí působostí v ZEMÍCH KORUNY ČESKÉ. Data sou v [] a listu Vývo. Následuí základí výběrové statistiky a empirická distribučí fukce. Výběrová charakteristika Počet let ve fukci EDF distribuce X EDF doby setrváí ve fukci, hodoty Y Miimum 0,04 0 00 Průměr=,066,07 00 Mediá=,46,44 00 Maimum,578,578 00 StD,7,69 0,968 5% kvatil 0,630 0,595 0 75% kvatil,66,60 00 Průměrá abs. odchylka,496,494 0,547 Počet 53 54 54 Tabulka.: Výběrové charakteristiky dat a empirické distribučí fukce. 0,5 0,0 0,5 0,0 0,0 0,5,0,5,0,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 0,0 0,5,0,5,0 EDF doby setrváí ve fukci Průměr=,07; Mediá=,43 Obr..: Průběh empirické distribučí fukce. Na vodorové ose sou roky setrváí ve fukci.

Cíl zpracováí Cílem zpracováí e avrhout pravděpodobostí model, který by umožil v budoucosti předvídat dobu setrváí miistra ve fukci. Parametrické modely Epoeciálí model Protože se edá o ezáporou áhodou proměou (kterou e možo považovat za spoitou, při měřeí doby v rocích setrváí ve fukci) maící charakter trváí abízí se ituitivě klasické epoeciálí rozděleí s distribucí a hustotou: Pro toto rozděleí platí: E { } a { } F( ) = e a f ( ) = e () = σ =. Nelepším (vydatým) estraým odhadem parametru e průměr pozorováí, tedy ˆ = t i [], str. 88, kde t i e doba setrváí ve fukci i= i-tého miistra ve fukci. Takový odhad dává: ˆ=,066. Srováí modelové distribučí fukce a empirické distribučí fukce e a ásleduícím obrázku. Obr..: Průběh modelové a empirické distribučí fukce. Na vodorové ose sou roky setrváí ve fukci. Následue tabulka srováí výběrových a modelových parametrů. Pro výpočet mediáu a kvatilů byl p užit vztah e = p = lg( p) 0 p <. 0,5 0,0 0,5 0,0 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5 F() modelová, parametrický odhad; tau=,066 p EDF doby setrváí ve fukci. p=0,5;0,5;. Uvedeý vztah platí ale pro libovolé

Srováí výběrových a modelových parametrů Parametr Výběrový Modelov Diferece Diferece/M odelový ý Miimum 0,037 --- --- --- Průměr=,0657,0657 00 % Mediá=,464,438-54 -0,38% Maimum,5784 --- --- --- StD,73,0657 7 5,% 5% kvatil 0,697 0,5943 0,0354 5,96% 75% kvatil,66,8636 - -7,07% Průměrá abs. odchylka,4957,574-0,07 -,43% Počet 53 --- --- --- Tabulka.: Výběrové a modelové charakteristiky. Srováí u směrodaté odchylky a 5%, 75% kvatilů sou epřesvědčivá. Proto e ezbyté uskutečit ěaký test shody modelu a pozorovaých dat. Zvolíme χ test dobré shody [3]. Výsledek a výpočet takového testu e shrut v ásleduící tabulce. Požadueme ízkou hodotu chyby -ho druhu ve výši %. Obdobě viz i test, že se edá o id výběr (viz list id, souboru []). Itervaly kvatováí pro a chi- test dobré shody z z ) F ( p Výpočet kritéria 4,9333 z= 0,047 0,09434 0,09434 5 00 z= 0,439 0,8868 0,09434 4 0 3 z3= 0,6873 0,830 0,09434 6 0 4 z4= 0,9787 0,37736 0,09434 3 00 5 z5=,38 0,4770 0,09434 7 00 6 z6=,744 0,56604 0,09434 4 0 7 z7=,308 0,66038 0,09434 7 00 8 z8=,9030 47 0,09434 5 00 9 z9= 3,9059 0,84906 0,09434 3 00 0 z0= 5,930 0,94340 0,09434 7 00 z= + 000 660 0,3333 M ( p ) = p = 4,9333 M-= 0 α=,0% χ (M-)= 3,093 Tabulka 3.: Výpočet testu shody. Modelová středí absolutí odchylka se spočte a základě ásleduícího postupu. Měme áhodou veličiu ξ, která má epoeciálí η = ξ platí ( ) = P ( η < ) = P ( ξ < ) = P ( < ξ < + ) = F ( + ) F ( ) rozděleí s parametrem. Potom pro áhodou veličiu F η + ma = e 0, e ; 0. + Odtud E { η } = ( Fη ( )) d. Teto itegrál lze s přiatelou přesostí spočíst umericky pro daé. Viz list 0 Epoeciálí souboru [], sloupce Distribuce absolutí odchylky a Výpočet středí hodoty. ξ ξ =

Výpočet e v [], a listu Epoeciálí. Hodota kritéria leží mimo kritický oboru, proto hypotézu o tom, že se doba setrváí řídí rozděleím F( ) = e, ezamítáme pro odhaduté =,0657. Proto (hlavě pro výše uvedeé pochybosti u směrodaté odchylky a 5%, 75% kvatilů ), využieme zvoleého tvaru rozděleí avšak e pro bodový, ale itervalový odhad parametru. Využieme postup popsaý v [4]. Výpočet e v [], opět a listu Epoeciálí. Pro volbu koeficietu spolehlivosti -α, použieme rozklad -α=-(α +α ), kde α=0,0( %); α =5;α =5. Výpočet e shrut v tabulce 4. Itervalový odhad parametru = G t α = 0,5% α = 0,5% (,, α ) = 53 t=,0657 d =,4870 t = = 3,0306 (,, α ) h G Tabulka 4.: Výpočet itervalového odhadu pro parametr. Takovému itervalovému odhadu odpovídá pás distribučích fukcí zobrazeý a obr.3. Výpočet e v [], a listu Epoeciálí, tolerace. 0,5 0,0 0,5 0,0 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 F(,487;) F(,066;) F(3,03;) Obr.3.: Distribučí fukce pro d (čerá, plá), ˆ (červeá čárkovaá) a h (čerá tečkovaá). Skutečá, ale edostupá distribučí fukce leží s daou spolehlivostí (99%) mezi oběma čerými čarami. Při tomto poetí e výrok o budoucí době setrváí ve fukci statistickým výrokem o toleračím itervalu. Opět užieme metodiku z [4]. Výpočet e v [], a listu Epoeciálí. Výpočet e shrut v ásleduící tabulce 5. z e G (, ; ) = dz ( )! 0 z

P Itervalový odhad parametru = G Toleračí iterval pro dobu setrváí ve fukci t α = 0,5% α = 0,5% (,, α ) = 53 t=,0657 d =,4870 h G t = = 3,0306 (,, α ) β =,5% β =,5% V měsících lg ( ) ( β ) L,,..., = i i= G (,, α ) lg ( ) ( β) U,,..., i i= G (,, α) [ P { L(,..., ) doba U (,,..., )} ] 0, 99 [rok]= 0,038 0,5 = [rok]=,79 34,,,..., 53 doba 53 53 Tabulka 5.:Tabulka výpočtu toleračí doby setrváí ve fukci. Shruto: S pravděpodobostí alespoň 95% setrvá miistr školství ve fukci mezi 0,5 a 34 měsíci. Spolehlivost tohoto výroku (=pravděpodobost, že bude splě) e alespoň 99%. Podkladové soubory a zdroe [] miistri skolstvi-studie.ls [] Jaroslav Hátle, Jiří Likeš: Základy počtu pravděpodobosti a matematické statistiky. SNTL Praha 974. [3] Předáška SA- - Neparametrické metody - testy, rozděleí s kategoriálími proměými. Str.. [4] Předáška VSM-3 Itervalové odhady. Metody kostrukce itervalových odhadů.

Příloha.: Další empirické důvody pro volbu epoeciálího rozděleí Výpočetí schéma pro χ test dobré shody využieme k tomu, že se pokusíme alézt (metodou pokus-omyl) takové ˆ(a tři desetiá místa), které miimalizue hodotu pravděpodobosti chyby prvího druhu. Miimálí hodota kritéria= 00; í příslušá pravděpodobost chyby -ho druhu= 6% Miimálí ˆ pro takovou hodotu=,85 Maimálí ˆ pro takovou hodotu=,853 Tabulka výpočtu Tabulka výpočtu Modelová a empirická distribučí fukce Výpočet kritéria i z-i F(z-i) p-i -i 00 z-= 0,798 0,09434 0,09434 5 00 z-= 0,3795 0,8868 0,09434 4 0 3 z-3= 39 0,830 0,09434 4 0 4 z-4= 99 0,37736 0,09434 5 00 5 z-5=,58 0,4770 0,09434 5 00 6 z-6=,55 0,56604 0,09434 5 00 7 z-7=,960 0,66038 0,09434 5 00 8 z-8=,5507 47 0,09434 6 0 9 z-9= 3,439 0,84906 0,09434 5 00 0 z-0= 5, 0,94340 0,09434 6 0 z-= 000 660 3 00 Kritérium= 0,5 0,0 0,5 0,0 Itervaly kvatováí pro a chi- test dobré shody Jeho p-hodota= Počet stupňů volosti= alfa= Kritická hodota= 00 6% 0 0% 3,093 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 Itervaly kvatováí pro a chi- test dobré shody Modelová a empirická distribučí fukce Výpočet kritéria i z-i F(z-i) p-i -i 00 z-= 0,836 0,09434 0,09434 5 00 z-= 0,3874 0,8868 0,09434 4 0 3 z-3= 0,665 0,830 0,09434 4 0 4 z-4= 0,8779 0,37736 0,09434 5 00 5 z-5=,84 0,4770 0,09434 5 00 6 z-6=,5469 0,56604 0,09434 5 00 7 z-7=,00 0,66038 0,09434 6 0 8 z-8=,604 47 0,09434 5 00 9 z-9= 37 0,84906 0,09434 5 00 0 z-0= 5,3 0,94340 0,09434 6 0 z-= 000 660 3 00 Kritérium= 0,5 0,0 0,5 0,0 Jeho p-hodota= Počet stupňů volosti= alfa= Kritická hodota= 00 6% 0 0% 3,093 0,5,5,50,75,00,5,50,75 3,5 4,5 5,5 6,5 7,5 8,5 9,5 0,5,5,50,75 F() modelová, parametrický odhad; tau=,85 EDF doby setrváí ve fukci F() modelová, parametrický odhad; tau=,875 EDF doby setrváí ve fukci Pozámky. Používáme-li bodový odhad, e důležité akým kritériem ebo vlastostí budeme hodotit eho kvalitu, či k akému účelu ho budeme dál používat.. Kvalita bodového odhadu e při měřeí eho p-hodotou dáa kostrukcí daého testu. 3. Taková p-hodota e áhodou proměou (e dáa áhodými pozorováími). 4. Nestraost a vydatost parametrického odhadu emusí být pro ěkteré účely vhodým kritériem pro přietí takového odhadu. Výpočet pro popsaé empirické testy e v [] a listu Epoeciálí-ověřeí.