Analýza přežití čertic a čertů



Podobné dokumenty
STUDIE. Analýza přežívání čertic a čertů

KGG/STG Statistika pro geografy

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Tomáš Karel LS 2012/2013

6. T e s t o v á n í h y p o t é z

Regresní a korelační analýza

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Poznámky k předmětu Aplikovaná statistika, 9.téma

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Analýza rozptylu dvojného třídění

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

StatSoft Odkud tak asi je?

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Tomáš Karel LS 2012/2013

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE

Zápočtová práce STATISTIKA I

Statistické zkoumání faktorů výšky obyvatel ČR

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Porovnání dvou výběrů

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

y = 0, ,19716x.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pořízení licencí statistického SW

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

Materiály charakteristiky potř ebné pro navrhování

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Zpracování a vyhodnocování analytických dat

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Regresní a korelační analýza

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

České vysoké učení technické v Praze Fakulta dopravní

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

1. Pravděpodobnost a statistika (MP leden 2010)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Biostatistika a matematické metody epidemiologie- stručné studijní texty

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Teoretická rozdělení

Za hranice nejistoty(2)

Měnověpolitické doporučení pro 9. SZ 2005

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

VŠB Technická univerzita Ostrava

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Korelační a regresní analýza

Jak pracovat s absolutními hodnotami

KALIBRACE. Definice kalibrace: mezinárodní metrologický slovník (VIM 3)

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

Úvod do problematiky měření

Regresní a korelační analýza

Regresní a korelační analýza

Vybraná rozdělení náhodné veličiny

NEPARAMETRICKÉ TESTY

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček

Názory MSP na daňovou reformu

4ST201 STATISTIKA CVIČENÍ Č. 8

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Statistická analýza. jednorozměrných dat

Tomáš Karel LS 2012/2013

Semestrální práce z předmětu m6f. 2 test dobré shody

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

SRG Přírodní škola, o.p.s. Orientace v Přírodě. Bez kompasu

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

KALENDÁŘOVÉ ÚLOHY PRO TALENTY, vč. metodického listu. doc. PhDr. Marta Volfová, CSc.

Národníinformačnístředisko pro podporu jakosti

MATEMATIKA základní úroveň obtížnosti

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Drsná matematika IV 7. přednáška Jak na statistiku?

Příklady na testy hypotéz o parametrech normálního rozdělení

Spolehlivost a provozní vlastnosti kondenzátorů

Dynamické metody pro predikci rizika

Analýza výsledků testu čtenářské gramotnosti v PRO /11

Návrh a vyhodnocení experimentu

Biostatistika Cvičení 7

Analýza a vyhodnocení. zdravotního stavu. obyvatel. města TŘEBÍČ. Zdravá Vysočina, o.s. ve spolupráci se Státním zdravotním ústavem

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

4EK211 Základy ekonometrie

Ten objekt (veličina), který se může svobodně měnit se nazývá nezávislý.

Normální (Gaussovo) rozdělení

Transkript:

StatSoft Analýza přežití čertic a čertů Vzpomeňme si na pohádku s Čerty nejsou žerty. V ní Lucifer (dále jen Lůca) pověřil čerta Janka, aby přinesl Dorotu Máchalovou do pekla, poněvadž míra jejích hříchů přesáhla přípustnou hranici. Předtím než Janek vyrazil na cestu, dostal od Lůci zevrubný plán vesnice a následující varování: Pozor na peří a žádný alkohol. První varování bylo v příběhu náležitě vysvětleno a my nyní zkusíme odhadnout, proč to druhé. V ečer pátého prosince Mikuláš s andělem a čertem nebo nádhernou čerticí obcházejí domácnosti a rozdávají dětem dárky. Přiznejme si, čerti a čertice působí jako výchovný prvek. Na nejmenší ratolesti určitě, u náctiletých působí už poněkud jinak. Za přinesené dárky a výchovné působení často dostane návštěva z nebes i z pekla něco pro zahřátí na jejich další cestu. Stává se, že chudáci z pekla se někdy musí za někoho ze skupiny obětovat, například za anděla, a mohou jim nastat problémy při plnění jejich povinností. Byl proveden reálný průzkum se základním cílem odhadnout bezporuchovost čerta v závislosti na počtu přijatých odměn. Pro následnou analýzu bylo shromážděno třicet dva záznamů, viz tabulka níže, jedná se tedy o reálná data. Data Každá bytost byla požádána, aby uvedla nebo odhadla, kolik panáků je schopná vypít, když není v kondici (zkrátka jí to nesedne), potom byla požádána o údaj při jejím normálním stavu. Na závěr odhadla (nebo uvedla ze zkušenosti) extrémní množství odměn, které je schopna přežít a nepadnout za peklo. Pokud si nebyla bytost jistá svou výdrží, vyplnila alespoň počty, které jistě vydrží (takovéto pozorování bylo označeno jako cenzorované). Samozřejmě, někteří jedinci nechtěli uvést údaje, ale přesto se povedlo shromáždit malý soubor dat, v němž je možné zkusit nalézt určité informace. Pokud vás to bude zajímat, čertice byly sdílnější.

Popisná statistika Uvedené údaje obsahují určitou míru nejistoty, a proto je nutné použít metody statistické analýzy. Zvolíme neparametrické metody. Těm dáváme přednost při malém počtu dat, poněvadž není možné aplikovat centrální limitní větu na výběrový průměr. Dále můžeme předpokládat výrazně nenormální rozdělení. Zároveň se nám v záznamech vyskytuje cenzorovaný údaj. Program STATISTICA ve svém modulu Pokročilé lineární/nelineární modely nabízí skupinu metod spadající do oblasti Analýzy přežití (úvodní seznámení s tématem analýzy přežití může poskytnout jeden z našich minulých článků). Tyto metody začaly být poprvé používány v medicíně a biologii, velmi brzo však našly uplatnění i v technických oborech, například v oblasti spolehlivosti. Počet záznamů je velmi malý, v průzkumové analýze dat bude dostačující provést pouze jejich grafické zobrazení se zakreslenou křivkou aproximující normálního rozdělení. Na následujících grafech vidíte rozložení četností hodnot v souboru pro všechny 3 typy kondice (zatím neuvažujeme dělení podle pohlaví). Na vodorovné ose je počet panáků, při kterých je bytost ještě schopna si plnit své povinnosti. U posledního grafu (Extrémní výdrž) vidíme součet dvou různých rozdělení. Jejich oddělení by bylo možné pouze na základě nějakého atributu, např. oblast, pohlaví apod. Stále však musíme mít na paměti, že pracujeme s velmi malým počtem dat, tento předpoklad však při větším rozsahu záznamů nemusí platit nebo může být potvrzen.

Samozřejmě jsme už zvědaví na rozdíl mezi mužem a ženou. Proto udělejme i vykreslení s oddělením pohlaví čerta:

Analýza přežití Například v krabicovém grafu bychom lépe viděli odlehlé hodnoty nebo extrémy, ale vraťme se nyní k neparametrickým metodám. Program STATISTICA nabízí vpravo zobrazené metody z oblasti Analýzy přežití. Kaplan-Meierova Meierova metoda patří do skupiny neparametrických metod. Je upřednostňována před výpočty pomocí úmrtnostní tabulky vzhledem k jejím přesnějším výstupům. Obdobou Kaplan-Meierovy Kaplan metody je Nelson-Altschulerův Altschulerův odhad, jenž však dává lepší výsledky, než je skutečnost. Bez rozlišení pohlaví, státu, věku a za normální kondice čertovské bytosti získáme níže uvedené kvantily doby přežití. Dá se předpokládat, že padesát procent pracujících vydrží 6 naturálií v době mikulášských pochůzek. Vypočtené hodnoty jsou přehledněji zobrazeny v Kaplan-Meierově grafu. Porovnání skupin Zkusme zjistit, zda existuje statisticky významný rozdíl mezi zajištěním služeb v České republice a na Slovensku.

Při malém počtu dat a za předpokladu jejich proložení exponenciálním nebo Weibullovým rozdělením se doporučuje používat Coxův F-test, který má v těchto případech podstatně větší sílu testu jak obvykle používaný Gehanův-Wilcoxonův test. Za nulovou hypotézu je považováno tvrzení, které deklaruje žádný rozdíl. Tedy - jakýkoliv nalezený rozdíl mezi jednotlivými skupinami je způsoben přirozenou variabilitou dat. Hladina významnosti alfa je pravděpodobnost zamítnutí nulové hypotézy při její platnosti, standardně se volí hodnota 0,05. Podle vypočtené p-hodnoty > 0,05 je možné přijetí nulové hypotézy. Mezi oběma skupinami vzorků dat není statisticky významný rozdíl. Porovnejme nyní čerta a čertici v normální kondici bez přihlédnutí k jejich státní působnosti. Ačkoli zde je již rozdíl viditelný, test to nepotvrzuje. To je způsobeno malým počtem pozorování a také tím, že některé čertice mají pořádnou výdrž. Pokud bychom například v datech neměli poslední velmi odolnou čertici z Liptovského Mikuláše, pak bychom hypotézu o shodnosti výdrže čertů a čertic již zamítli.

Regresní model Velmi zajímavou informací bude posouzení vlivu věku na výdrž pro blíže specifikovanou bytost. Pro analýzu dat je použita metoda Coxovy regrese s proporcionálním rizikem, tedy s konstantními kovariátami. Opět k analýze jsou použity údaje o výdrži bytostí v normální kondici. Jako nezávislé proměnné (kovariáty) zvolíme věk, stát a pohlaví. V programu STATISTICA byl sestaven příslušný model a podle vložených hodnot je proveden grafický výstup. Takže slečny a paní, na základě analyzovaných dat můžete předpokládat, že 90 procent čertů ve věku 20 let bude pravděpodobně ještě v kondici při třech panácích. Padesát procent padesátiletých čertů po pěti až šesti panácích bude na své horní hranici nebo už bude mít poruchu. Se starším čertem pak budete muset trochu opatrněji nebo se z vás stane první pomoc. Co vy na to? Všimněme si, že v datech se nevyskytuje údaj o kvalifikaci osmdesátilétého čerta. Na základě sestaveného modelu můžeme provést alespoň odhad. Ověření předpokladů Při porovnávání dvou vzorků dat byl použit Coxův F-test s předpokladem aproximace dat Weibullovým rozdělením. Potvrďme daný předpoklad například pro kategorii čertů a čertic bez rozlišení věku, státní příslušnosti a za jejich standardní kondice. Program STATISTICA ve své nabídce průmyslových statistik nabízí metodu jak grafického, tak i numerického řešení odhadu parametrů Weibullova rozdělení a souvisejících statistik a výpočtů. Pro jednotlivé kategorie dat je provedeno ověření za pomoci Q-Q grafu.

Data jsou proložena přímkou. Z rozmístění bodů kolem přímky můžeme usuzovat na vhodnost aproximace dat Weibullovým rozdělením. Vypočtené parametry rozdělení jsou uvedeny v podnadpisu grafu. Numerické testy rovněž potvrzují shodu dat s předpokládaným Weibullovým rozdělením. Pro jednotlivé kategorie je zobrazen graf spolehlivosti čerta nebo čertice na době selhání (v našem případě počtu panáků) s vyznačeným 90ti procentním intervalem spolehlivosti. Co říci na závěr? Shrňme si základní informace. Analyzovaná data bylo možné aproximovat Weibullovým rozdělením nebo modelem Coxovy regresní analýzy s proporcionálním rizikem. Není statistický významný rozdíl mezi zajištěním služeb v České republice a na Slovensku ani mezi výdrží čertů a čertic. Předpokládáme ale, že s větším počtem dat by se již rozdíl mezi pohlavími prokázal. Pokud jsou bytosti v normální kondici, dá se předpokládat u čertic 50ti procentní výdrž při pěti zkonzumovaných naturáliích, u čertů přibližně 6 až 7. Budete-li se o Vánocích dívat na pohádku zmíněnou v úvodu článku, odhadněte věk a kondici čerta Janka. Použijte tyto údaje jako vstupní parametry zmíněné regresní analýzy a odhadněte, kolik kaprála stál otisk palce čerta Janka při odvodovém řízení v hospodě. Všem čerticím a čertům děkujeme za poskytnutá data, jim a čtenářům tohoto článku přejeme hezké prožití vánočních svátků, divokého Silvestra a do dalšího roku hodně zdraví, pohody a splněných přání.