Univerzita Pardubice Fakulta ekonomicko-správní METODY GRADUACE ÚMRTNOSTNÍCH TABULEK. Bc. Kateřina Andrysová
|
|
- Robert Sedláček
- před 6 lety
- Počet zobrazení:
Transkript
1 Univerzita Pardubice Fakulta ekonomicko-správní METODY GRADUACE ÚMRTNOSTNÍCH TABULEK Bc. Kateřina Andrysová Diplomová práce 00
2
3
4 Prohlašuji: Tuto práci jsem vypracovala samostatně. Veškeré literární prameny a informace, které jsem v práci využila, jsou uvedeny v seznamu použité literatury. Byla jsem seznámena s tím, že se na moji práci vztahují práva a povinnosti vyplývající ze zákona č. /000 Sb., autorský zákon, zejména se skutečností, že Univerzita Pardubice má právo na uzavření licenční smlouvy o užití této práce jako školního díla podle 60 odst. autorského zákona, a s tím, že pokud dojde k užití této práce mnou nebo bude poskytnuta licence o užití jinému subjektu, je Univerzita Pardubice oprávněna ode mne požadovat přiměřený příspěvek na úhradu nákladů, které na vytvoření díla vynaložila, a to podle okolností až do jejich skutečné výše. Souhlasím s prezenčním zpřístupněním své práce v Univerzitní knihovně. V Pardubicích dne Kateřina Andrysová
5 Poděkování Ráda bych touto cestou poděkovala vedoucí práce prof. RNDr. Viere Pacákové, Ph.D. za její odborné vedení, cenné připomínky, vstřícnost a čas strávený na konzultacích.
6 ANOTACE Tato diplomová práce se zabývá graduací úmrtnostních tabulek používaných v pojišťovnictví. Hlavní pozornost je zde věnována praktické aplikaci metod graduace a testování její přesnosti a hladkosti. Výpočty byly prováděny pomocí statistického programového balíku STATGRAPHICS Centurion XV a tabulkového procesoru MS EXCEL. KLÍČOVÁ SLOVA Graduace, úmrtnostní tabulky, hladkost, přesnost TITLE Graduation Methods of Mortality Tables ANNOTATION This thesis deals with the graduation of mortality tables used in the insurance industry Main attention is target to the practical application of methods of graduation and testing of its accuracy and smoothness. Calculations were performed using statistical software package STATGRAPHICS Centurion XV and MS EXCEL spreadsheet. KEYWORDS Graduation, life tables, smoothness, accuracy
7 OBSAH ÚVOD.... ÚMRTNOSTNÍ TABULKY A JEJICH VÝZNAM PRO ŽIVOTNÍ A DŮCHODOVÉ POJIŠTĚNÍ.... TYPY ÚMRTNOSTNÍCH TABULEK Generační úmrtnostní tabulky Průřezové úmrtnostní tabulky Podrobné úmrtnostní tabulky Zkrácené úmrtnostní tabulky ŽIVOTNÍ POJIŠTĚNÍ DŮCHODOVÉ POJIŠTĚNÍ KONSTRUKCE ÚMRTNOSTNÍ TABULKY UKAZATELE ÚMRTNOSTNÍCH TABULEK POLOŽKY ÚMRTNOSTNÍ TABULKY ZPŮSOBY KONSTRUKCE ÚMRTNOSTNÍ TABULKY Klasický přístup konstrukce úmrtnostních tabulek Moderní přístup konstrukce úmrtnostních tabulek GRADUACE VYHLAZOVÁNÍ ÚMRTNOSTNÍCH TABULEK METODY GRADUACE Grafická metoda Analytické parametrické metody graduace Graduace použitím Splinovy metody Neparametrické metody graduace TESTOVÁNÍ KVALITY GRADUACE ÚMRTNOSTNÍCH TABULEK OVĚŘOVÁNÍ HLADKOSTI GRADUOVANÝCH ÚDAJŮ TESTOVÁNÍ PŘESNOSTI GRADUOVANÝCH ÚDAJŮ Ověření normality APLIKACE METOD GRADUACE A TESTOVÁNÍ JEJÍ PŘESNOSTI A HLADKOSTI GRADUACE METODY GRADUACE Metoda klouzavých průměrů Wittsteinova metoda Spenserova metoda 5 bodová Spenserova metoda bodová Hendersonova metoda OVĚŘENÍ GRADUACE Ověření hladkosti Ověření přesnosti VYUŽITÍ TABULKOVÉHO PROCESORU EXCEL A STATISTICKÉHO PROGRAMOVÉHO BALÍKU STATGRAPHICS CENTURION XV TABULKOVÝ PROCESOR EXCEL STATGRAPHICS CENTURION XV Graduace vyhlazování Ověření normality rozdělení Z Testy hypotéz pro ověření přesnosti ZÁVĚR... 6 SEZNAM GRAFŮ SEZNAM OBRÁZKŮ LITERATURA SEZNAM PŘÍLOH... 66
8 ÚVOD V současné době v České republice roste zájem o životní aj neživotní pojištění. Podle objemu předepsaného pojistného stále převládá zájem o neživotní pojištění, na rozdíl od mnoha jiných vyspělých krajin Evropy a světa. V posledním období zájem o životní pojištění roste v důsledku více faktorů. Jedním z nich je současný důchodový systém, kterému hrozí kolaps v případě, že v blízké budoucnosti nenastane jeho transformace. Životní pojištění na dožití a důchodové pojištění v komerční pojišťovně se stává významnou a výhodnou formou dobrovolného šetření na důchod. Rizikové pojištění na úmrtí v kombinaci s připojištěním rizika dlouhodobé práceneschopnosti, invalidity, práceneschopnosti, případně dalších rizik je účinnou formou na minimalizaci rizika neschopnosti splácení úvěrů, hlavně hypotekárního, který se splácí dlouhou dobu. Uvedené skutečnosti potvrzují i číselné údaje, publikované na stánkách České asociace pojišťoven. Zatímco předepsané pojistné při neživotním pojištění vzrostlo loni jen o 0,6 %, při životním pojištění narostlo o 5, %. Rostou i pojistné částky, na které se životní pojištění uzavírají [6]. Podle zákona o pojišťovnictví musí mít každá pojišťovna tzv. odpovědného pojistného matematika, který zodpovídá za správnost výpočtu sazeb pojistného, výše technických rezerv, míry solventnosti. Na konkurenčním pojistném trhu roste význam správnosti všech pojistně-matematických výpočtů a používají se stále kvalitnější, ale aj náročnější metody. Aktuár pojišťovny na většinu výpočtů při produktech životního a důchodového pojištění nevyhnutelně potřebuje úmrtnostní tabulky. Ty jsou pro pojišťovny významným nástrojem, neboť přesnými mírami vystihují vymírání populace v jednotlivých věkových skupinách. Protože jsou úmrtnostní tabulky zkonstruované statisticky na základě údajů o populaci, tedy hodnoty pravděpodobnosti úmrtí a počet osob dožívajících se věku l se určují jako statistické odhady tzv. hrubá pozorování, vypočítané odhady kolísají okolo skutečných hodnot. Graf pravděpodobností úmrtí pak představuje křivku s nehladkými úseky s hrby. Praktické aktuárské výpočty, při životním a důchodovém pojištění vyžadují pravidelný vývoj při přechodu mezi sousedními věky. Proto je třeba tento negativní jev odstranit právě tzv. graduací vyrovnáváním, vyhlazováním úmrtnostních tabulek. [4], Cílem této diplomové práce je teoreticky popsat metody tvorby a graduace úmrtnostních tabulek, testování jejich přesnosti a hladkosti a aplikovat tyto metody na reálních datech pomocí statického programového balíku STATGRAPHIC Centurion XV a tabulkového procesoru MS Ecel.
9 . Úmrtnostní tabulky a jejich význam pro životní a důchodové pojištění Úmrtnostní tabulky life tables jsou nástrojem pro výpočet pojistného v životním a důchodovém pojištění. Představují informace o úmrtnosti v jednotlivých věkových skupinách. Každoročně jsou úmrtnostní tabulky vydávány Českým statistickým úřadem. První úmrtnostní tabulky byly sestaveny anglickým astronomem E. Halleym na přelomu 7. a 8. století. Vycházel z tzv. stacionární populace, tedy z konstantního počtu narozených v každém roce. [] Úmrtnostní tabulku life table tvoří řada ukazatelů viz obr., které kvantitativně charakterizují proces vymírání populace. Úmrtnostní tabulky vytvořené pro země nebo jiné geografické oblasti se používají především jako ukazatele zdravotního stavu obyvatelstva, neboť se do nich promítají určité návyky a kulturní tradice obyvatelstva, jeho životní úroveň a úroveň životního prostředí. Protože mezi úmrtnostními tabulkami mužů a žen bývají rozdíly, úmrtnostní tabulky se obvykle sestavují zvlášť pro obě pohlaví. [] Při výpočtech pojistného u životního pojištění se vychází z úmrtnostních tabulek. Pojišťovna při svých výpočtech počítá s tím, že smrt je náhodným jevem, který se pojišťuje. Úmrtnostní tabulky představují nejčastější způsob analýzy úmrtnosti. Přesnými mírami vystihují vymírání populace v jednotlivých věkových skupinách. Tradičně se používají při odhadování úmrtnosti v pojišťovnách, i když údaje v nich se zřejmě nikdy v budoucnu nebudou úplně opakovat. [3], [4], [7] Aktuár pojišťovny, na většinu výpočtů, při produktech životního a důchodového pojištění, nevyhnutelně potřebuje právě úmrtnostní tabulky. Pojistné smlouvy životního pojištění jsou uzavírány relativně zdravími jedinci s perspektivou dlouhého života, při kterých je pravděpodobnost úmrtí nižší než v celé populaci. Na druhé straně pojistné smlouvy na úmrtí jsou uzavírány také částí populace, pro kterou je vyšší pravděpodobnost úmrtí. [4], [7].
10 Obrázek Vzor úmrtnostní tabulky, muži v České republice v roce 999 [0]. Typy úmrtnostních tabulek Úmrtnostní tabulky se v základě dělí na: - generační úmrtnostní tabulky - průřezové úmrtnostní tabulky Dále je možné rozdělit úmrtnostní tabulky podle délky sledovaného věkového intervalu: - podrobné úmrtnostní tabulky - zkrácené úmrtnostní tabulky 3
11 .. Generační úmrtnostní tabulky Generační úmrtnostní tabulky představují záznam skutečného průběhu života vymírání konkrétní populace současně narozených jedinců od jejich narození až do smrti posledního z nich. Konstrukce těchto úmrtnostních tabulek je obtížná, neboť předpokládá mimo jiného statistické sledování populace v průběhu dlouhé doby sledovaná populace se v dlouhém časovém úseku zmenšuje nejen vymíráním, ale také migrací. Generační tabulky mají častější využití při sledování délky života zvířat např. sledují kmen bakterií, kde je průměrná délky života obvykle o mnoho kratší než u člověka. Generačním úmrtnostním tabulkám se často říká také kohortní úmrtnostní tabulky cohort life table, dynamic life table, protože pro generaci, tj. pro osoby narozené v jistém období se v demografii používá název kohorta. Je to všeobecnější označení pro skupinu osob, u kterých došlo k určité události ve stejném čase, resp. období skupina pacientů podstupujících současně nějakou terapii. [].. Průřezové úmrtnostní tabulky Běžné úmrtnostní tabulce se někdy říká průřezová či okamžiková current life table, period life table, static life table. Tato tabulka je založena na hypotetickém sledování současně narozených osob, na něž se aplikují pravděpodobnosti úmrtí podle věku dané populace z krátkého období většinou ročního, např. pravděpodobnosti úmrtí mužů z České republiky v roce 999. Tyto tabulky se obyčejně publikují ve statistických ročenkách a jejich ukazatele se mezinárodně porovnávají. Používají se častěji než generační tabulky. []..3 Podrobné úmrtnostní tabulky Podrobné úmrtnostní tabulky, které pracují s věkovým intervalem jeden rok 0-, -, -3,... V životním pojištění se jim dává přednost před průřezovými úmrtnostními tabulkami. [4]..4 Zkrácené úmrtnostní tabulky Zkrácené úmrtnostní tabulky, které pracují s věkovým intervalem delším než jeden rok, zpravidla se volí věkový interval 5-ti let -5, 5-0, 0-5,... Věk do jednoho roku je vyčleněn kvůli své specifické zákonitosti procesu úmrtí častá jsou úmrtí již do 8 dnů po narození, v porovnání s ostatními nízkými věkovými skupinami kde jsou úmrtí rozložena rovnoměrně v průběhu roku. [4] 4
12 . Životní pojištění Kapitola. je zpracována dle [5], []. Životní pojištění zajišťuje pojistnou ochranu pojištěnému. U tohoto typu pojištění jsou kryta dvě základní rizika, a to riziko úmrtí a riziko dožití. V současné době je možné do krytí v rámci produktů životního pojištění také zahrnout formou připojištění různá rizika neživotního charakteru invalidita, úraz, vážné nemoci apod.. Výše pojistných plnění je dána velikostí pojistné částky, kterou pojistník sjednal, a tato výše pojistné částky má podle jeho představ a možností příslušné riziko pokrýt. Pojištění pro případ úmrtí kryje pouze riziko úmrtí, tedy sjednaná pojistná částka v případě realizace rizika je vyplacena osobě určené pojistníkem obmyšlenému osobě uvedené v pojistné smlouvě. Sjednání krytí rizika úmrtí a především výše pojistné částky má značný význam nejen pro pojištěného, ale také pro jeho rodinu, je-li jejím živitelem. V případě pojistné události je snížen příjem finančních prostředků rodiny. Vyplacené pojistné plnění pak z části nebo úplně nahradí původní finanční příjmy. Účelem výplaty pojistného plnění je obvykle zabezpečení pozůstalých pojištěné osoby, dále může být úhrada závazků pojištěného, úhrada nákladů v souvislosti s úmrtím a pohřbem apod. Pojištění pro případ úmrtí bývá také označováno termínem rizikové životní pojištění. Při stanovování výše pojistné částky je třeba brát v úvahu nejen finanční závazky pojištěného, ale také počet a věk nezaopatřených dětí a také nezbytné náklady rodiny na život, v případě živitele rodiny. Výše pojistné částky by měla být stanovena tak aby v případě pojistné události pokryla alespoň nezbytné finanční náklady po dobu snížení finančních příjmů. Při krytí rizika dožití je pojistnou událostí dožití se sjednaného věku pojištěným. Je snahou uplatňovat životní pojištění jako jeden z nástrojů kryjících potřeby lidí ve stáří. Životní pojištění tak plní funkci nejen vlastního krytí rizik ale také funkci úspornou. Životní pojištění tedy může být chápáno jako spořící a investiční instrument, neboť v rámci životního pojištění jsou vytvářeny specifickým způsobem úspory. 5
13 .3 Důchodové pojištění Jeho smyslem je doplňovat důchody poskytované jako dávky sociálního zabezpečení. Pojištění základního důchodu vytváří, pro pojištěného, nárok na to, aby od prvého dne následujícího měsíce po měsíci, ve kterém dosáhl sjednaného věku věku odchodu do důchodu, mu byl vyplácen další důchod v předem dohodnutých lhůtách po dobu života pojištěného. Tarif pojištění je kalkulován zvlášť pro muže a zvlášť pro ženy a závisí na vstupním věku pojištěného. [3], [] 6
14 . Konstrukce úmrtnostní tabulky Následující kapitola je zpracována dle [4], [], [9]. Princip konstrukce úmrtnostních tabulek je založen na vstupních datech, ze kterých specifickými matematickými výpočty vytvoříme jednotlivé ukazatele úmrtnostní tabulky položky úmrtnostní tabulky. Ukazatele úmrtnostních tabulek položky úmrtnostní tabulky Úmrtnostní tabulku life table tvoří řada ukazatelů, které kvantitativně charakterizují proces vymírání populace: - vyjadřuje věk osoby, pro {0,, ω }, přičemž ω je předpokládaný nejvyšší věk, kterého může osoba sledovaného souboru D - počet zemřelých osob ve věku S počet žijících osob ve věku někdy také označováno jako střední stav obyvatelstva - vyjadřuje pravděpodobnost toho, že letá osoba se nedožije věku. Jedná se tedy o pravděpodobnost úmrtí ve věku a nazývá se roční míra úmrtnosti. Je základním ukazatelem úmrtnostní tabulky. Platí: p = e m p = p vyjadřuje pravděpodobnost toho, že letá osoba se dožije věku a nazývá se roční míra dožití. Tato pravděpodobnost je doplňkovou pravděpodobností ke. Platí : p = 3 7
15 Z klasické definice pravděpodobnosti vyplývá platnost následujících vztahů: l = 4 p l l l = 5 l l vyjadřuje počet osob dožívajících se věku. Počáteční hodnota l 0 vyjadřuje počáteční počet osob modelovaného souboru a nazývá se kořen úmrtnostní tabulky. Je to hodnota, kolik jedinců vstupuje do tabulky. Libovolná další hodnota l představuje počet jedinců z kořene l 0, kteří se { ω 0 dožijí věku. Konečná posloupnost l } je nerostoucí, tj. l l... l 0 ω a nazývá se posloupnost žijících neboli funkce přežití. d vyjadřuje tabulkový počet jedinců, kteří zemřeli ve věku. Někdy též označován jako řád vymírání. Platí zde vztahy: d = l 6 d = l 7 d = l l 8 l ω = d ω 9 L vyjadřuje očekávaný počet let, prožitých osobami ve věku, tj. celkový počet člověkoroků, které ještě prožijí osoby ve věku, tj. které ještě prožije počet osob l. Pro tuto hodnotu platí L = l a d 0 protože každý z l dožívajících přispěje do L jedním rokem, zatímco každý z d osob, které zemřeli ve věku, přispěje v průměru hodnotou a. Pokud je například a = 0,5, potom dostaneme 8
16 L = l 0,5d = 0,5 l l T vyjadřuje počet zbývajících roků života všech osob ve věku generaci, tedy Při praktickém výpočtu postupujeme od spodu tabulky, tedy na posledním řádku kde T ω = L ω. Dále počítáme T = L T a postupujeme výpočty směr nahoru. T = L L... L ϖ 0 - e vyjadřuje střední délku života osoby ve věku, tj. průměrný počet roků, kterých se ještě dožije jedinec ve věku. 0 T e = l 3 m vyjadřuje specifickou míru úmrtnosti. Je to úmrtnost dle věku věkově specifická úmrtnost. Je to tedy počet zemřelých ve věku vztažený k počtu obyvatel střední stav. Je základním stavebním prvkem při konstrukci úmrtnostní tabulky. Platí: D m = S 4 d = l l 5 d = l 6 l ω = d ω 7 a vyjadřuje délku části posledního roka života jedinců, kteří zemřeli ve věku. Jde o průměrný počet let prožitých ve věkovém intervalu <, těmi d jedinci, kteří v tomto věkovém intervalu zemřeli. Hodnoty a se v některých úmrtnostních tabulkách neuvádějí, protože mají jen pomocný charakter. 9
17 . Způsoby konstrukce úmrtnostní tabulky Kapitola. je zpracována dle [6], [0], [4]. Úmrtnostní tabulku je možné zkonstruovat buď klasickým deterministickým přístupem nebo přístupem moderním stochastickým... Klasický přístup konstrukce úmrtnostních tabulek Klasický přístup konstrukce podrobné úmrtnostní tabulky je deterministický, na základě diskrétní aproimace času pracuje se středními hodnotami středními stavy. Postup konstrukce Vstupní data, která jsou tvořena počty zemřelých v daném věku D a věkovou strukturou a počty žijících daného věku S umožňují spočítat ukazatel pravděpodobnosti úmrtí pomocí vztahu. Pomocí pravděpodobnosti úmrtí můžeme přejít od skutečné reálné populace k tabulkové fiktivní. Za základ tabulkové populace považujeme tzv. tabulkový počet narozených l v podstatě jde o počet jedinců v přesném věku 0. Položíme l 0 = tento údaj volíme libovolně, nejčastěji se však používá hodnota Aplikaci reálných pravděpodobností úmrtí na tabulkovou populaci násobením základu tabulkové populace a pravděpodobnosti úmrtí dostaneme tabulkový počet zemřelých. Vypočítáme tedy d a l pomocí vzorců: d = l 8 l = l d = 0,,..., ω- 9 Vypočítáme L pomocí 0 a vztahu: Vypočítáme T dle vztahu Vypočítáme e 0 pomocí 3 L = ω l ω m ω Uvedenými výpočty se dostáváme k důležitému ukazateli úmrtnostní tabulky, kterým je střední délka života e viz obr., definovaná jako průměrný počet let, které zbývá osobě ve věku 0
18 ještě prožít. Nejčastěji se tento ukazatel uvádí ve věku 0 let a je označován jako střední délka života při narození neboli naděje dožití ve věku 0. Obdobný postup aplikujeme i na ostatní věky a analogicky výsledkem jsou naděje dožití v příslušném věku. Obrázek - úmrtnostní tabulka [6].. Moderní přístup konstrukce úmrtnostních tabulek Moderním přístupem konstrukce úmrtnostní tabulky je stochastický přístup, kde se uvažuje délka života jako náhodná proměnná a za náhodnou proměnnou se považuje také počet úmrtí. Hodnoty v jednotlivých sloupcích úmrtnostní tabulky pokládáme potom za hodnoty funkcí spojité proměnné. Spojitý přístup nám umožňuje pracovat s další důležitou veličinou µ, která se nazývá intenzita úmrtnosti a charakterizuje úmrtnost v přesném věku. Pro intenzitu úmrtnosti platí vztah µ = lim h h 0 h 0 Je to klíčový pojmem v stochasticky podňaté analýze přežívání a je spojitou analogií pravděpodobnosti úmrtí osoby přesně -leté před dovršením věku roku.
19 Z definice intenzity úmrtnosti dopiš pod čáru definici intenzity úmrtnosti pro malé hodnoty h vyplývá h µ h oh kde oh je tzv. Funkce řádu 0, blíží se k nule rychleji než h a je zanedbatelná, jestliže platí o h lim h 0 h = 0 Vztah 0 můžeme podle 6 a 7 přepsat do tvaru µ = l l h l dl lim = h 0 l h l d 3 Jestli se na poslední vztah podíváme jako na diferenciální rovnici, potom je její řešení ve tvaru µ ydy 0 l = l0 e 4 Odtud vyplývají následující vztahy: n p = e µ µ y dy 5 n = p = e n µ µ y dy 6 n n d = ly µ ydy 7 Konečně vztah pro n L n n L = l y dy 8
20 Nejdůležitější úlohu při stochastickém přístupu konstrukce úmrtnostní tabulky je znovu výpočet n pomocí n m, tedy výpočet integrálu n µ y dy 9 Jestliže předpokládáme, že pozorovaná populace v časovém intervale délky n nemění svoji věkovou strnutu tj. zůstane v tomto intervale stacionární, můžeme při výpočtu vztah 6. Podle 7 a 8 dostaneme m n využít n m n y n d = = n n L ly l µ dy y dy 30 Když navíc předpokládáme, že intenzita úmrtnosti je konstantní ve věkovém intervalu <,n, potom podle přecházejícího vztahu platí µ y = nm < n 3 Podle vztahu n l l n = n p = l, který vyjadřuje pravděpodobnost toho,že - letá osoba se nedožije věku n, má základní ukazatel n úmrtnostní tabulky tvar n p n n m = e 3 3
21 3. Graduace vyhlazování úmrtnostních tabulek Kapitola 3 je zpracována dle [7], [4], [8]. Pojem graduace se objevil v pracích anglických a amerických matematiků a demografů koncem 9. století Woolhouse, W. S. B , Ackland, T. G. - 88, Higham, J. S. - 88, 883, Hardy, G. F Graduací rozumíme vyrovnávání vyhlazování úmrtnostních tabulek. Vyrovnávání vyhlazování úmrtnostních tabulek je procedura, kterou se z odhadovaných pravděpodobnostních úmrtí eliminují nesystematické nepravidelnosti. Tyto nepravidelnosti nemají racionální vysvětlení a vznikli v důsledku toho, že hladké teoretické pravděpodobnosti úmrtí odhadujeme statistickými postupy z reálných dat. Protože úmrtnostní tabulky jsou zkonstruované statisticky na základě údajů o populaci hodnoty a l se se určují jako statistické odhady, vypočítané odhady kolísají okolo skutečných hodnot podléhají náhodnému kolísání. Proto je vhodné oprostit tyto veličiny od nahodilých výkyvů, které nemají racionální vysvětlení. Někdy, vzhledem k nešťastné shodě okolností při výběru dat, mohou být značné odchylky vypočítaných hodnot od skutečných. Tento negativní jev se dá odstranit právě tzv. Graduací vyrovnáváním, vyhlazováním úmrtnostních tabulek. Postup graduace se řídí snahou, aby se jeho realizací v grafu pravděpodobností odstranili nehladké úseky s hrby bez racionálního vysvětlení, které pravděpodobně vznikly důsledkem náhodné konfigurace použitých výběrových dat. Vyrovnáváním se také mimo jiné docílí věkový růst pravděpodobností úmrtí, tam kde je na místě a nejedná se o lokální maima spojená s oprávněným věkovým poklesem těchto pravděpodobností. To se pak promítá do monotonie pojistných sazeb, kdy např. pojištěný uzavírající pojištění pro případ smrti ve věku 40 by měl platit za jinak srovnatelných podmínek méně, než pojištěný uzavírající takové pojištění ve věku 4. Vyrovnávání úmrtnostních tabulek se doporučuje hlavně tehdy, když si pojišťovna či penzijní fondy vytvářejí své vlastní úmrtnostní tabulky, které jsou vytvořeny centrálními statistickými institucemi, jsou publikované obyčejně ve vyrovnaném tvaru. 4
22 Se zdokonalující se prenatální péčí začíná posloupnost dat vyššími hodnotami, které jsou mnohonásobně vyšší než pozdější dětská úmrtnost. Absolutní minimum dosahuje uvažovaná posloupnost při vstupu do puberty a potom rychle roste až do začátku třetí desítky, kde obvykle vykazuje mírné lokální maimum, neboť potom po určitou dobu slabě klesá. Jako důvody lokálního maima jsou uváděny smrtelné úrazy při automobilových nehodách a značná kumulace sebevražd v tomto věku. Po překročení 30. roku života roste už posloupnost dat eponenciálně. Statistické odhady míry pravděpodobnosti nebo intenzity úmrtnosti µ pro jednotlivé roky, které dostaneme ze známých statistických modelů binomický model úmrtnosti, Poissonův model úmrtnosti se nazývají hrubé pozorování. Uvedené odhady nebo µ mají nasledující vlastnosti: každý odhad je jen jednou z možných hodnot výběrové charakteristiky a je zatížený výběrovou chybou, hrubé pozorování se nerovnoměrně mění z roku na rok v důsledku náhodnosti, jsou nepravidelné; křivka, kterou dostaneme jejich spojením úsečkami není hladká. Graduace spočívá v nalezení přijatelně hladké křivky v posloupnosti hrubých odhadů nebo µ, přičemž využíváme všechny statistické informace. Takto upravené odhady se nazývají graduované míry a označují se a µ. Graduace je postup vyrovnávání, který zmenšuje náhodné chyby odhadnutých měr úmrtnosti. Cílem graduace Vyrovnat v úmrtnostních tabulkách hrubé pozorování dostatečně hladkou křivkou, vhodnou na praktické aktuárské výpočty při životním a důchodovém pojištění, kde se vyžaduje pravidelný vývoj při přechodu mezi sousedními věky Využít informace z odhadů, získaných při sousedních věkách na zdokonalení odhadů v každém věku. 5
23 3. Metody graduace Metody graduace úmrtnostních tabulek můžeme rozdělit do následujících skupin:. Grafická metoda. Analytické parametrické vyrovnávání 3. Splinové metody 4. Mechanické neparametrické vyrovnávání 3.. Grafická metoda Grafická metoda spočívá v nalezení hladké křivky v grafu vypočítaných hodnot resp. µ grafickými metodami. Patří mezi nejrozšířenější techniky graduace. Její předností je to, že je jednoduchá a poskytuje dobré výsledky i tehdy, když jsou neúplné údaje. Posloupnost hrubých měr úmrtnosti se zpřesní vyrovnáním pomocí diferencí, čímž získáme graduované míry, které spolehlivě splňují hladkost a pravdivost údajů. Tento proces se v angličtině nazývá hand polishing. Míry úmrtnosti se počítají z dostupných údajů a graficky se znázorňují pomocí bodů. Načrtneme hladkou křivku, jejíž sklon naznačuje poloha bobů, co nejvíc přiblíženou k daným bodům tak, aby se přitom zachovala posloupnost daných měr. Potom můžeme z dané křivky včíst vyhlazené míry úmrtnosti. Při grafické graduaci úmrtnostních dat je vhodné naznačit do grafu také 95%-ní interval spolehlivosti pro pozorované hodnoty v každém věku. Při počítání těchto hranic obyčejně nepotřebujeme úplnou přesnost, protože je použijeme jen jako přibližné vodítko. Předpokládáme, že počet úmrtí v každém věku není menší než deset. Potom hranice 95%-ních intervalů spolehlivosti pro odhad a µ získáme pomocí vztahů: D & ± resp. E D µ& ± 33 E Spojnice pozorovaných hodnot s příslušnou horní a dolní hranicí nám poskytuje vhodný návod pro konstrukci hladké křivky pro graduace. Křivka hladkosti by neměla přečnívat přes hranice intervalu spolehlivosti víckrát než jednou za 0 pozorování tj. 5% hodnot. Těsný úsek mezi intervaly spolehlivosti naznačuje velké hodnoty E, které mají největší vliv na hladkost křivky. 6
24 3.. Analytické parametrické metody graduace Analytická metoda spočívá v použití matematické funkce křivky. Může eistovat analytická funkce, jejíž všeobecný tvar odpovídá reálným údajům, které mají být graduovány vyrovnány. Taková křivka bude spojitá a hladká. V tomto případě tedy není otázkou, zda je křivka dostatečně hladká, ale zda tvar zvolené křivky dostatečně vyhovuje reálným údajům. Nejznámější postupy graduace matematickou funkcí Gompertzova křivka Gompertz, B. 85 ukázal na fyzilologických základech, že intenzita úmrtnosti má konstantní růst ve věkových intervalech,. Pro míru mrtnosti proto navrhnul eponenciální růst podle vztahu = B c kde B > 0, c > jsou parametry 34 Makehamova křivka Makeham, 3.M. 860 zobecnil Gompertzův vzorec. Zavedl další parametr A > 0 a eponenciálně rostoucí složku intenzity úmrtnosti na zdůraznění dvou rozdílných způsobů úmrtí náhodného a přirozeného. = A B c Graduace použitím Splinovy metody Při použití této metody rozdělíme interval trvaní lidského života na několik úseků a pro každý úsek použijeme na graduaci vyrovnávání polynom nižšího stupně. Hladná funkce vznikne spojením dílčích funkcí z jednotlivých úseků. Dostatečná hladkost v bodech spojitosti se zabezpečí požadavkem na eistenci oboustranných derivací příslušného stupně jednotlivých funkcí tedy v bodech, v kterých se funkce spojuje, se musí derivaci do příslušného stupně funkce zleva rovnat derivaci funkce zprava. Systém STATGRAPHICS Plus neobsahuje proceduru na aplikaci této metody graduace Neparametrické metody graduace Pro tyto metody graduace se v literatuře používá také pojem mechanické vyrovnávání úmrtnostních tabulek. Pro svoji výpočtovou jednoduchost patří k nejpoužívanějším metodám graduace. Graduovanou míru úmrtnosti & resp. µ& pro daný věk získáme vytvořením průměrných hrubých měr úmrtnosti z vhodně zvoleného okolí věku. Přitom většinou jde o vážený průměr, který přikládá zprůměrovaným hodnotám tím menší váhu, čím jsou vzdálenější od věku, tj. od středu příslušného okolí. Váhy jsou obyčejně symetrické okolo svého středu a jejich součet je vždy rovný 7
25 8 hodnotě. Tyto metody jsou založeny na principu metody klouzavých průměrů. Wittsteinova metoda Je to jedna z nejpoužívanějších metod tohoto typu, kdy se vyrovnaná hodnota počítá jako vážený průměr: [ ] = w & 36 Vyrovnávání podle tohoto vzorce je ekvivalentní postupu, při kterém se dvakrát za sebou alikuje jednoduché aritmetické průměrování délky 5 tvaru 5 37 Spenserova metoda 5bodová Graduace pomocí této metody je vlastně aplikace metody vážených klouzavých průměrů délky m = 5, kde vyrovnanou hodnotu míry úmrtnosti pro věk dostaneme podle vztahu: = S & 38 Spenserova metoda bodová Pomocí této metody je pro vyrovnávání měr úmrtnosti použitá metoda vážených klouzavých průměrů délky = m.vyrovnanou hodnotu míry úmrtnosti pro věk dostaneme dle vztahu = S & 39 Hendersonova metoda Při této neparametrické metodě se váhy klouzavých průměrů hledají pomocí optimalizace. Nechť
26 { },..., ω 0 0 =, n n a nechť & { &, & & } označuje sloupcový vektor odhadnutých pravděpodobností úmrtí délky,..., = n Metoda spočívá v optimalizační proceduře n min wk k = 0 0 označuje hledaný vektor vyrovnaných měr úmrtnosti. } nd d & k k g & k k = 0 pomocí které hledáme vektor & vyrovnáním původního vektoru metodou nejmenších čtverců s přihlídnutím ke stupni hladkosti vyrovnaných hodnot vyjádřených pomocí součku čtvercových d-tých diferencí d d d d d i & k = & k & k =... = & k i 4 i= 0 i Pritom w w,..., w 0, n jsou předem zvolené kladné váhy např. typu: w k = n L j= 0 k 0 L j 0 4 kde L k 0 je uvažovaný počet 0 k-letých v daném pojistném kmeni a g je další předem zvolený kladný koeficient, který řídí stupeň hladkosti vyrovnaných hodnot. 9
27 4. Testování kvality graduace úmrtnostních tabulek Kapitola 4 je zpracována dle [7], [4], [8]. Přijatelná graduace musí být dostatečně hladká a přesná. Dostatečně hladká graduace je taková, při které se vyrovnané hodnoty měr úmrtnosti málo liší v okolí věku, se kterým se pracuje. Při dostatečně přesné graduaci se vyrovnané hodnoty míry úmrtnosti přijatelně ne příliš liší od hrubé míry úmrtnosti v každém věku. Na ověření toho, zda je graduace přijatelná, tedy zda je dostatečně hladká a přesná, se používají statistické postupy a testy. Výklad níže použitých testů obsahují mnohé učebnice statistiky a také programové statistické balíky. 4. Ověřování hladkosti graduovaných údajů Podle přesné matematické definice hladkosti se vyžaduje eistence derivací libovolného řádu vyrovnávající funkce. Tato definice však připouští graduace, které jsou nepřijatelné z praktického hlediska, tedy polynomy vyššího než třetího stupně. Základním kriteriem hladkosti je to, aby třetí derivace graduovaných odhadů byla co nejmenší a její průběh byl pravidelný. Označme symboly: graduovaný odhad míry úmrtnosti µ graduovaný odhad intenzity úmrtnosti µ. Na posouzení hladkosti graduace, např. měr vypočítáme: první diferenci druhou diferenci třetí diferenci = - = - 3 = - Definitivní závěr o dostatečné hladkosti graduace se nedá jednoznačně určit, protože posouzení skutečnosti, zda jsou třetí diference dostatečně malé a dostatečně pravidelné je značně subjektivní. Proto se třetí diference využívají častěji při porovnávání výsledků graduace pomocí více metod. Vypočítají se součty absolutních hodnot třetích diferencí graduovaných měr 0
28 3 & pomocí každé zvolené metody a nejlepší graduace z hlediska posouzení hladkosti je ta, která má tuto sumu minimální. 4. Testování přesnosti graduovaných údajů Při testování přesnosti graduovaných údajů se v prai často využívá binomický model pro údaje Poissonův model pro hodnoty µ. Při testování dostatečného přiblížení se graduovaných odhadů hrubým odhadům měr úmrtnosti se ptáme, zda je počet pozorovaných zemřelých D v každé věkové skupině blízký očekávanému počtu na základě graduace. To znamená, že se např. při binomickém modelu zkoumají odchylky = D E. & Při dostatečně velkém počtu pozorovaných osob na základě Moivre-Laplaceovy centrální limitní věty 3 mají pozorování D přibližně normální rozdělení. Normovaná proměnná Z má potom normované normální rozdělení se střední hodnotou E D = E a rozptylem V D = E p. Jestliže pro odhad použijeme graduovanou hodnoty proměnná Z má tvar Z &, normovaná D E & = a platí Z E & & ~ N0, Ověření normality Na ověření normality rozdělení Z můžeme použít test normality. Základním testem na ověření nulové hypotézy o dostatečné shodě mezi graduovanými a hrubými odhady je χ test. Při testování přesnosti graduace se využívá χ statistika daná vztahem D E & χ = E & & 44 která má rozdělení n 8 χ, kde počet stupňů volnosti n je počet všech věkových skupin n. Graduaci na hladině významnosti α nepovažujeme za dostatečně přesnou, jestliže χ - statistika Binomický model umožňuje odhadnout pravděpodobnost že nastane určitý počet úmrtí tedy, jestliže je známa pravděpodobnost úmrtí, případně přežití -. Tímto modelem je možné odhadovat průměrný počet úmrtí ve výběrovém souboru velkého počtu osob, v kterém všechny životy mají stejný věk. 3
29 překročí kritickou hodnotu, kterou je χ α kvantil χ rozdělení. Vypočítanou hodnotu χ statistiky nejčastěji porovnáváme s kvantilem χ 0, 95. χ - test přesnosti graduace je možné počítat také jiným způsobem. Využijeme Pearsonovu χ - statistiku pro test dobré shody empirického počtu zemřelých D a očekávaného počtu zemřelých D & pro každý věk. Očekávaný počet zemřelých D & dostaneme vynásobením počtu L -tých osob, které se dožili věku a graduované míry úmrtnosti &. Testovací statika D& D = χ D& 45 má χ rozdělení s počtem stupňů volnosti n, který se rovná počtu věkových skupin, pro které jsou vyhlazené pravděpodobnosti úmrtí. Vypočítanou hodnotu porovnáme s kvantilem χ α n, nejčastěji χ 0,95 n, resp. χ 0,99 n. Jestliže platí, že na hladině významnosti α za dostatečně hladkou. χ < χ α, potom považujeme graduaci Posouzení nedostatků graduace χ - test není vždy dostatečný na určení, zda je graduace vyhovující. Některé vzniklé defekty nemusí odhalit. Jde například o tyto případy: - levostranné nebo pravostranné zešikmení rozdělení, - nadměrné seskupení pozitivních nebo negativních odchylek, - velký počet velmi malých odchylek a malý počet velmi velkých odchylek, což zpochybňuje nezávislost odchylek Na odhalení těchto možných defektů je třeba využít dodatečné testy. Jestliže je výsledkem χ - testu zamítnutí předpokladu normality rozdělení, resp. Z, důvodu může být několik: - eistence několika velmi velkých odchylek, nevyvážených velkým počtem malých odchylek - vysoká kumulativní odchylka buď části nebo celého věkového intervalu - přebytek velkých kladných nebo záporných odchylek v části nebo v celém věkovém intervalu - nadměrné seskupení odchylek stejného znaménka
30 Pro odhalení nedostatků graduace jsou užitečné tyto testy: - Znaménkový test - Test kumulativních odchylek - Test změny znamének - Stevensův test seskupení znamének Znaménkový test Tento test odhaluje nedostatky graduace v důsledku velkého počtu kladných, resp. záporných odchylek Z. Jestliže normované odchylky Z nejsou levostranně ani pravostranně zešikmené, potom libovolná hodnota odchylky Z by měla být kladná s pravděpodobností 0,5 a záporná též s pravděpodobností 0,5. Celkový počet Z kladných odchylek Z má tedy binomické rozdělení Bin;0,5, kde n je počet věkových skupin. Graduaci na zvolené hladině významnosti α nepovažujeme za přijatelnou, jestliže hodnota Z překročí kritické hodnoty, tedy,5% - ní interval a 97,5%-ní kvantil rozděleni Bin;0,5. Test kumulativních odchylek Test kumulativních odchylek odhaluje nepřijatelnost graduace v důsledku velkých kumulativních odchylek v části nebo v celém věkovém intervalu. Jestliže odchylky mají přibližně normální rozdělení se střední hodnotou E = 0 a rozptylem V = E & &, potom kumulativní odchylky = D E & mají přibližně = D E & normální rozdělení N 0 ; E & &. Parametry rozdělení kumulativních odchylek dostaneme z vlastností střední hodnoty v rozptylu součtu nezávislých náhodných proměnných. Výsledky graduace na hladině významnosti α považujeme za přijatelné, jestli absolutní normované kumulativní odchylky nepřesáhnou hodnoty kvantilu Z α, tedy D E & z z E & & α α 46 3
31 Test změny znamének Jestliže jsou normované odchylky Z nezávislé a mají normální rozdělení N0;, potom s pravděpodobností 0,5 znaménko odchylky s pořadím bude stejné jako znaménko -té odchylky. Celkový počet znaménkových změn bude mít potom rozdělení Bin-;0,5. Stevensův test seskupení znamének Tento test odhaluje nadměrné seskupení stejných znamének odchylek = D E &. Předpokládá, že z odchylek předpokládá, že eistuje t skupin kladných znamének. je n kladných a n záporných, přičemž n n = n. Dále se Potom počet způsobů, kterými je možné rozdělit n kladných znamének do t skupin je n t mezi n záporných znamének se dá umístit t kladných skupin počtem způsobů n t celkový počet způsobů uspořádání n kladných a n záporných znamének je n n potom výslednou hypergeometrickou pravděpodobnost toho, že dostaneme t skupin kladných znamének při počtu n kladných a n záporných znamének vyjadřuje vztah n t n n t n n Stevensova statistika je suma pravděpodobností 3..5 přes všechny možné hodnoty t. Graduaci nepovažujeme za přijatelnou, jestliže Stevensova statistika nepřesáhne hodnotu 0,05: 47 t n n t t 0,05 n n 48 4
32 S výjimkou případu, že počty n a n jsou velmi malé, výpočet podle vztahu 3..6 je velmi zdlouhavý. V takovém případě používáme hypergeometrické tabulky. Střední hodnota M a rozptyl V počtu g seskupení kladných znamének má tvar: M = n n n 49 V n = n 3 n přičemž n n = n 50 Rozhodnutí pomocí Stevensonova testu potom můžeme na hladině významnosti α přibližně udělat porovnáním hodnoty testovacího kritéria g M G = 5 V a kvantilem α z normovaného normálního rozdělení. Jestliže platí G z α, graduace na hladině významnosti α není přijatelná. Tento test odhaluje nedostatky graduace, spočívající v nadměrném seskupení odchylek stejného znaménka. 5
33 5. Aplikace metod graduace a testování její přesnosti a hladkosti Cílem této kapitoly je ukázka aplikace metod graduace a ověření jejich přesnosti a hladkosti. Aplikace je provedena na úmrtnostních datech pro interval věku let. Graduace se provádí na datech specifické míry úmrtnosti m, která je vypočítána ze vstupních dat úmrtnostní tabulky. Pro nalezení dostatečně hladké křivky, která vyrovnává hrubá pozorování v úmrtnostních tabulkách, bylo použito 6 metod graduace. Všechny použité metody graduace je třeba ověřit z hlediska jejich přesnosti a hladkosti. Na základě výsledků ověření přesnosti a hladkosti je možné vybrat metodu graduace, která nejlépe vyrovnává nehladké úseky s hrby v grafu pravděpodobností. S takto vyhlazenými údaji se dále pracuje a jsou použity pro konstrukci úmrtnostní tabulky. [vlastní] Vstupní data úmrtnostní tabulky Vstupními daty úmrtnostní tabulky je věková struktura, počet zemřelých osob ve věku D a počet žijících osob ve věku S. Na základě těchto vstupních dat se dále vypočítá Specifická míra úmrtnosti m. Tuto míru získáme podílem počtu zemřelých osob a počtu žijících osob viz 4. Vstupní data byla negraduovaná, jedná se o populaci žen z roku 007 na území Slovenské republiky viz obr. 3. [vlastní] Obrázek 3 - Vstupní data: ženy 007, SR [vlastní] 5. Graduace Metody graduace byly aplikovány na vzorku let. Rozmezí tohoto vzorku bylo vybráno na základě výsledků průzkumu veřejnosti Jak si lidé v České republice pojišťují život? a na základě věku odchodu do důchodu. [vlastní] 6
34 Průzkum, Jak si lidé v České republice pojišťují život? uvádí, že 58% osob ve věku let má sjednáno životní pojištění. Tento průzkum dále uvádí, že 8% osob ze všech osob, které mají sjednáno životní pojištění, má sjednáno životní pojištění do 60 let věku a 0% nad 60 let věku. Průzkum byl proveden v prosinci 009, na vzorku 043 respondentů se zohledněním relevance více sociálních a demografických kritérií. [3] Dle údajů České správy sociálního zabezpečení ČSSZ je věk odchodu do důchodu stanoven u žen v rozmezí let a u mužů let. Jedná se o osoby narozené v roce 936 a později. [4], [vlastní] 5. Metody graduace Na vybraném vzorku žen bylo aplikováno 6 metod, metoda klouzavých průměrů vyrovnání pro 3 období, pro 9 období a pro 9 období, dále Wittsteinova metoda a Spenserova metoda 5 bodová a bodová. Pro aplikaci uvedených metod byl použit program MS Ecel a Statgraphics. Centurion [vlastní] 5.. Metoda klouzavých průměrů Metoda klouzavých průměrů tzv. mechanické vyrovnání je založena na výpočtu klouzavých průměrů. Tato metoda nevyžaduje žádné předpoklady o trendu řady hodnot, no nelze jí vyrovnávat krajní hodnoty řady ani provádět etrapolaci 4. Vzorec pro výpočet klouzavých průměrů, resp. jeho tvar závisí na tom, kolik hodnot je zahrnuto do průměru a zda se jedná o průměr prostý nebo vážený. Zpravidla se jedná o lichý počet hodnot, kterým se vyrovnává prostřední hodnota. Váhy pro vážený průměr lze volit libovolně, jejich součet však musí být vždy roven jedné. [] Vyrovnání pro 3 období Nejjednodušším klouzavým průměrem je prostý průměr ze tří hodnot. Výpočet byl proveden dle vzorce ~ 3 m m m m =, pro 3; z Matematicky přibližný výpočet hodnot funkce v bodě ležícím vně intervalu z hodnot funkce v krajních, příp. i některých vnitřních bodech intervalu 7
35 kde z je nejvyšší věk, pro který je vypočtena specifická míra úmrtnosti. Aplikace vzorce 5 je znázorněna viz obr. 4. Vyrovnaná hodnota se tedy vypočítá průměrem specifických měr úmrtnosti osob o rok mladších, osob v daném věku a osob o rok starších. Obrázek 4 - Vyrovnání metodou klouzavých průměrů pro 3 období [vlastní] Výše uvedený výpočet je doplněn o grafické znázornění graduace viz graf. Z grafu je patrné, že aplikovaná metoda sice eliminuje vliv náhodných chyb, ale křivka vyrovnaných hodnot není hladká. [] [vlastní] Graf - Vyrovnání metodou klouzavých průměrů pro 3 období [vlastní] 8
36 Vyrovnání pro 9 období Vzhledem k výsledku vyrovnání prostým průměrem v předchozí metodě, byl pro tuto metodu zvolen výpočet pomocí váženého průměru. Hodnoty vah jsou symetrické kolem bodu, v němž je vyrovnání provedeno, a lineárně klesající směrem od tohoto bodu. Nejvyšší váhu má tedy míra úmrtnosti v daném věku, o něco nižší váhu míra úmrtnosti osob o rok mladších, resp. o rok starších atd. Vyrovnání opět provádíme na datech nevyrovnaných na empirických datech. Pro výpočet byl použit vzorec m~ 9 = 0, m 0,08 m 0,6 m 3 m 3 m 0,04 m 0, m 4 m 4 m 6;z4, 53 kde je z nejvyšší věk, pro který je vypočtena specifická míra úmrtnosti. Aplikace vzorce 53 je znázorněna obrázkem 5. [], [vlastní] 9
37 Obrázek 5 - metodou klouzavých průměrů pro 9 období [vlastní] Výše uvedený výpočet je doplněn o grafické znázornění graduace viz graf. Z grafu je patrné, že vyrovnání klouzavým průměrem z devíti hodnot je mnohem hladší než pro vyrovnání průměrem ze tří hodnot. Nevýhodou tohoto vyrovnání je však skutečnost, že má tendenci nadhodnocovat hodnoty měr úmrtnosti. [], [vlastní] Trend hodnot měr úmrtnosti má totiž od třicátého věku života osoby charakter eponenciální funkce, která je funkcí ryze konvení. Tendence nadhodnocování funkčních hodnot je způsobeno tím, že jsou na hodnoty ryze konvení funkce5 aplikována vyrovná klouzavým průměrem s kladnými vahami symetrickými kolem bodu v němž je vyrovnání provedeno. [] Graf - Vyrovnání metodou klouzavých průměrů pro 9 období [vlastní] 5 Z vlastností ryze konvení funkce plyne, že hodnota každého prostého průměru dvojice funkčních hodnot v bodech symetrických kolem daného bodu je větší než funkční hodnota v daném bodě. 30
38 3 Vyrovnání pro 9 období Za předpokladu, že by byly vyrovnávány specifické míry úmrtnosti celé úmrtnostní tabulky, nejen určitého vzorku, byla by použita metoda kombinací výpočtu průměru prostého a váženého. Pro věk do 9 dokončených let včetně by byl pro vyrovnání použit vážený klouzavý průměr z devíti hodnot a pro osoby starší pak klouzavým průměrem z devatenácti hodnot. Pro zkoumaný vzorek let věku osoby bude použit jen výpočet váženého klouzavého průměru z devatenácti hodnot podle vzorečku: 0,003 0,0096 0,044 0,08 0,0336 0,0848 0,39 0,84 0, ~ = m m m m m m m m m m m m m m m m m m pro 9 ; 30 z 54 kde z je nejvyšší věk, pro který je vypočtena specifická míra úmrtnosti. Aplikace vzorce 54 je znázorněna v obrázku 6. []
39 Obrázek 6 - Vyrovnání metodou klouzavých průměrů pro 9 období [vlastní] Výše uvedený výpočet je doplněn o grafické znázornění graduace viz graf 3. Z grafu je patrná podobnost jako v případě grafu, kde byl také pro výpočet použit klouzavý vážený průměr. [] Graf 3 - Vyrovnání metodou klouzavých průměrů pro 9 období [vlastní] 3
40 Wittsteinova metoda Tato metoda je jednou z nejpoužívanějších metod tohoto ty, kdy se vyrovnaná hodnota počítá jako vážený průměr podle výrazu: [ ] = w & 55 Vyrovnání podle tohoto vzorce je ekvivalentní vzorci 56 a také postupu, při kterém se dvakrát za sebou aplikuje jednoduché aritmetické průměrování délky 5 ve tvaru ,04 0,08 0, 0,6 0, = w & Ze vzorce 55 je vidět, že váhy u jednotlivých pravděpodobností jsou souměrné kolem svého středu tj. kolem. Čím dále je počítána hodnota od věku, tím jsou váhy menší. Aplikace vzorce 55 je znázorněna na obrázku 7. Uvedený výpočet je doplněn o grafické znázornění graduace viz graf 4. [4], [vlastní]
41 34 Obrázek 7 - Wittsteinova metoda [vlastní] Graf 4- Wittsteinova metoda] 5..3 Spenserova metoda 5 bodová Graduace pomocí této metody je vlastně aplikace metody vážených klouzavých průměrů délky m = 5, kde je vyrovnaná hodnota míry úmrtnosti pro věk počítána podle vztahu = S & 58 Aplikace vzorce 58 je znázorněna na obr. 8. Tuto praktickou ukázku také doplňuje grafické znázornění graduace viz graf 5. [4], [vlastní]
42 Obrázek 8 - Spenserova metoda 5 bodová [vlastní] Graf 5 - Spenserova metoda 5 bodová [vlastní] 35
43 Ruční výpočet metod Spenserovy 5 bodové a bodové je komplikovanější než u předchozích výpočtů. Pro kontrolu správnosti výpočtu je uveden grafický i tabulkový výstup z programu Statgraphics viz obr. 9, viz graf 6. [vlastní] Data Table for m_pro_s5 First smoother: Spencer's 5-term moving average Second smoother: none Period Data Smooth Rough 3,0 0,000 4,0 0, ,0 0, ,0 0, ,0 0, ,0 0,0003 9,0 0,000 30,0 0, , , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0,0006 0, , ,0 0, , , ,0 0,0008 0, , ,0 0, , , ,0 0,0008 0, , ,0 0, , , ,0 0,00 0, , ,0 0,0045 0, , ,0 0,0054 0, , ,0 0,0076 0, , ,0 0,0087 0, , ,0 0,0006 0, , ,0 0,0057 0, , ,0 0,0083 0, , ,0 0,0086 0, , ,0 0, , , ,0 0, , , ,0 0,0038 0, , ,0 0, , , ,0 0,004 0,0049 0, ,0 0,0039 0, , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0, ,0 0,008 6,0 0, ,0 0, ,0 0,0 64,0 0,005 65,0 0,04 Obrázek 9 - Spenserova metoda 5bodová STATGRAPHIC [vlastní] 36
44 37 Graf 6 - Spenserova metoda 5bodová STATGRAPHIC [vlastní] 5..4 Spenserova metoda bodová Pomocí této metody je pro vyrovnání měr úmrtnosti použita metoda vážených klouzavých průměrů délky m =. Vyrovnaná hodnota míry úmrtnosti pro věk je počítána dle vztahu = S & 59 Aplikace vzorce 59 znázorňuje obr. 0. Tuto praktickou ukázku také doplňuje grafické znázornění graduace viz graf 7. [4], [vlastní]
45 Obrázek 0 - Spenserova metoda bodová [vlastní] 38
46 Graf 7 - Spenserova metoda bodová [vlastní] 39
47 Data Table for m_pro_s First smoother: Spencer's -term moving average Second smoother: none Period Data Smooth Rough 0,0 0,000,0 0,0008,0 0,0008 3,0 0,000 4,0 0, ,0 0, ,0 0, ,0 0, ,0 0,0003 9,0 0,000 30,0 0, , , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0,0006 0, , ,0 0, , , ,0 0,0008 0, , ,0 0, , , ,0 0,0008 0, , ,0 0, , , ,0 0,00 0,0069-0, ,0 0,0045 0, , ,0 0,0054 0, , ,0 0,0076 0, , ,0 0,0087 0, , ,0 0,0006 0, , ,0 0,0057 0, , ,0 0,0083 0, , ,0 0,0086 0, , ,0 0, , , ,0 0, , , ,0 0,0038 0, , ,0 0, , , ,0 0,004 0, , ,0 0,0039 0, , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0, , , ,0 0,0069 0, , ,0 0,008 0, , ,0 0, , , ,0 0,0090 0, , ,0 0,0 0, , ,0 0,005 0, , ,0 0,04 0,0075 0, ,0 0,053 67,0 0, ,0 0,065 69,0 0,003 70,0 0,0959 7,0 0,096 7,0 0,057 73,0 0, ,0 0, ,0 0,03779 Obrázek - Spenserova metoda bodová STATGRAPHIC [vlastní] 40
48 Graf 8 - Spenserova metoda bodová - vyhlazení STATGRAPHIC [vlastní] 5..5 Hendersonova metoda Tato metoda graduace se řadí mezi neparametrické metody. Principem je nalezení vah klouzavých průměrů pomocí optimalizace viz 40. Pomocí této optimalizace hledáme vektor & vyrovnáním původního vektoru I metodou nejmenších čtverců s přihlédnutím ke stupni hladkosti vyrovnaných hodnot, vyjádřených pomocí součtu čtverců d-tých diferencí viz 4. Výsledek aplikace této metody znázorňuje graf, ze kterého je patrné, že vyhlazení není příliš hladké, křivka má stále hrby. [4], [vlastní] Graf 9 - Hendersonova metoda - vyhlazení STATGRAPHIC [vlastní] 4
49 5.3 Ověření graduace V kapitole 3. je teoreticky popsáno ověření hladkosti a přesnosti graduovaných údajů. Na základě této teorie bylo provedeno praktické ověření hladkosti a přesnosti graduace všech šesti výše použitých metod graduace. Posouzení hladkosti je založeno na výpočtu tří diferencí vyrovnaných hodnot. První tři použité metody Metoda klouzavých průměrů pro 3, 9 a 9 období počítají graduované údaje z empirických dat. Z těchto vyrovnaných dat je poté třeba vypočítat vyrovnanou hodnotu jak je znázorněno v tabulce. Další tři použité metody graduace Wittsteinova metoda, Spenserova metoda 5bodová a bodová počítají graduované údaje již z hodnoty. Obr. ukazuje, že to tabulky byla dosazena data již z vypočítaných graduací. [vlastní] & Obrázek - Vyrovnané hodnoty. [vlastní] 5.3. Ověření hladkosti Ověřování hladkosti se provádí pomocí tří diferencí vyrovnaných hodnot & u každé z použitých metod. První diference se vypočítá z vyrovnaných hodnot. Druhá a třetí diference se počítá z předchozí vypočítané diference. Absolutní hodnoty třetí diference sečteme. viz obr. 3 a obr. 4. Tento postup se provádí u všech použitých metod graduace. [vlastní] 43
50 Obrázek 3 - Ověření hladkosti_metoda klouzavých průměrů [vlastní] 44
51 Obrázek 4 - Ověření hladkosti_ostatní metody [vlastní] 45
52 Metoda graduace, jejíž součet absolutních hodnot třetích diferencí je nejmenší, tedy nejbližší nule, nejlépe vyhlazuje hrubá pozorování. Pro nalezení takové minimální hodnoty byla sestavena souhrnná tabulka viz obr. 5, kde jsou uvedeny vypočtené hodnoty každé z metod graduace. Hledání minima zajistí funkce min v programu Microsoft Ecel. [vlastní] Obrázek 5 - Výsledky ověření hladkosti graduace [vlastní] Vybranou metodu, která nejlépe vyhlazuje hrubá pozorování je třeba ověřit také z hlediska její přesnosti. [vlastní] 5.3. Ověření přesnosti Ověření přesnosti graduace je delší a náročnější proces než předchozí ověřování hladkosti Jestliže pro odhad použijeme graduovanou hodnoty &, normovaná proměnná Z má tvar viz 43. Pro ověření přesnosti je třeba také ověřit rozdělené této normované proměnné Z Ověření normality rozdělení Z Ověření je provedeno v programu Statgraphic Centrurion, jehož výstupem je kompletní test s příslušným komentářem vypočítaných hodnot. Na ověření normality rozdělení Z byl použit Kolmogorov-Smirnovov test, dále test Šikmosti, Špičatosti, Shapiro-Wilkův test a Chíkvadrát test [vlastní]. U těchto testů je rozhodující hodnota P-value, tedy pravděpodobnost, že testovaná statistika bude alespoň tak etrémní jako pozorovaná hodnota. P-value je nejvyšší hladina významnosti, na níž nezamítá nulovou hypotézu a zároveň je nejnižší hladinou významnosti, na níž nulovou hypotézu zamítáme [5]. U všech prováděných testů je hodnota P-value větší než 0,05. Žádný z provedených testů nezamítá nulovou hypotézu H 0. Lze tedy tvrdit, že normovaná proměnná Z pochází z normálního rozdělení pravděpodobností se spolehlivostí 0,95%. Výsledky testů jsou doplněny grafickým znázorněním viz obr. 6 a graf 0 [5]. [vlastní] 46
53 Obrázek 6 - Ověření normality rozdělení Z [vlastní] Graf 0 - Ověření normality rozdělení Z [vlastní] 47
54 χ test přesnosti graduace Samotné ověření přesnosti graduace je provedeno χ testem, který je základním testem na ověření nulové hypotézy o dostatečné shodě mezi graduovanými a hrubými odhady. Testovací kriterium se počítá dle vztahu 44. Dílčí výpočty jsou znázorněny tabulkou 6. Dále je třeba učit kritickou hodnotu KH. Ta je počítána pomocí funkce CHIINV0,05;36. [vlastní] Obrázek 7 - Dílčí výpočty χ testu [vlastní] Testovací kriterium:, Kritická hodnota: 49,8 Kritická oblast: TK>KH H0: testujeme hypotézu o dostatečné shodě mezi graduovanými odhady a hrubými odhady. Hodnota testovacího kritéria padla do oblasti přípustných hodnot, hypotézu H0 nezamítáme. Na základě tohoto testu byla potvrzena dostatečná shoda mezi graduovanými a hrubými odhady. χ test není vždy dostatečný a nemusí odhalit některé defekty viz kapitola 4. Proto byly ještě použity další tři testy. [vlastní] 48
55 Znaménkový test Znaménkový test byl proveden v programu Statgraphic Centurion. Tímto testem nebyly zjištěny nedostatky graduace v důsledku velkého počtu kladných resp. záporných odchylek Z. Hodnota P-value je rovna jedné, je tedy větší než α = 0,05, tedy hypotézu H 0 nezamítáme. Výsledek je opět doplněn obrázkem a grafickým znázorněním viz obr. 8. [vlastní] Obrázek 8 - Znaménkový test - výstup STATGRAPHIC [vlastní] Graf - Znaménkový test - výstup STATGRAPHIC [vlastní] 49
56 Test změny znamének Obrázek 9 - Test změny znamének - výstup STATGRAPHIC [vlastní] Na základě výsledku tohoto testu viz obrázek 9 nelze přijmou graduaci na hladině významnosti α. Hodnota P-value je menší než hodnota 0,05, hypotéza H 0 byla zamítnuta. [vlastní] Graf - Test změny znamének - výstup STATGRAPHIC [vlastní] 50
57 Stevensův test Posledním testem pro ověření přesnosti graduace, který je aplikován, je Stevensův test, který odhaluje nedostatky graduace, spočívající v nadměrném seskupení odchylek stejného znaménka. Výpočet je proveden dle vzorce 5. Jednotlivé kroky výpočtů jsou uvedeny v elektronické příloze. g... počet skupin kladných znamének M... střední hodnota V... rozptyl n... počet kladných hodnot n... počet záporných hodnot n = 9 M =,63 n = 6 V =,6 g = G = 0,89 n = 35 Z 0,95 =,64 TK = G = 0,89 KH = Z 0,95 =,64 TK > KH... hodnota testovacího kriteria padla do oblasti přípustných hodnot. Hypotézu H 0 nezamítáme na hladině 0,05. [vlastní] 5
58 6. Využití tabulkového procesoru Ecel a statistického programového balíku STATGRAPHICS Centurion XV Pro účely této práce byl využit tabulkový procesor Ecel a statistický programový balík STATGRAPHICS Centurion XV. 6. Tabulkový procesor Ecel Tento program byl využit pro aplikaci metod graduace která spočívá v množství výpočtů a použití funkcí. Pro jednodušší výpočty vzorců byly použity základní matematické operace, jako je sčítání, odčítání, násobení a dělení. Použitými funkcemi byla především funkce POWER umocnění čísla na zadanou mocninu, ODMOCNINA, PRŮMĚR aritmetický průměr, SUMA, ABSabsolutní hodnota čísla, dále také EXP výpočet mocniny při základu e, MINminimální hodnota množiny buněk, CHIINVhodnota funkce inverzní k distribuční funkci jednostranné pravděpodobnosti rozdělení chí-kvadrát a NORMSINVinverzní funkce k distribuční funkci standardního normálního součtového rozdělení, které má střední hodnotu rovnou 0 a směrodatnou odchylku. Výstupy výpočtů a funkcí jsou znázorněny pomocí grafů a tabulek. Výše uvedené grafy jsou spojnicové, které zachycují trend za určitou dobu nebo různé kategorie. V grafech byly dále voleny výrazné barvy pro zdůraznění rozdílu křivek. Každý graf obsahuje název, popisky os a legendu. Další formou výstupu jsou již uvedené tabulky, které jsou nástrojem pro výpočty, dále slouží k záznamu a znázornění výpočtů. Také byly, pro svou jednoduchost a přehlednost, využity k prezentaci jednotlivých a souhrnných výstupů. [vlastní] 6. STATGRAPHICS Centurion XV Jako další nástroj pro statistické výpočty a výstupy byl použit programový balík STATGRAPHICS Centurion XV. Tento program byl využit především pro výpočty statistických testů a k jejich prezentaci a dále ke graduaci vyhlazování. [vlastní] 5
59 6.. Graduace vyhlazování Graduace byla provedena pomocí funkce Smoothing viz obrázek 0, kde jsou dále vybrána data, která mají být graduována viz obr.. [vlastní] Obrázek 0 - Funkce Smoothing STATGRAPHIC [vlastní] Obrázek - Vybraná data pro vyhlazení [vlastní] 53
60 Následující okno Smoothing Options nabízí výběr metody graduace viz obrázek V tomto případě byla vybrána metoda Spencer s Term MA Spenserova bodová. Další okno Tables and Graph slouží k výběru výstupů viz obr. 3. [vlastní] Obrázek Výběr metody garuace - Smoothing Option [vlastní] Obrázek 3 Výběr výstupů - Tables and Graphs [vlastní] 54
61 6.. Ověření normality rozdělení Z Ověření normality rozdělení Z je provedeno funkcí Fitting Uncensored Data viz obr. 4 na vybraných datech Z_S_ pro Spenserovu metodu bodovou viz obr. 5. Další nabídka Distribution Fitting Options umožní výběr rozdělení, které má být ověřeno. [vlastní] Obrázek 4 Funkce Fitting uncensored Data STATGRAPHIC [vlastní] Obrázek 5 - Vybraná data pro ověření normality [vlastní] V tomto případě bylo třeba ověřit normální rozdělení viz obr. 6. Následující okno Tables and Graphs opět nabízí možnost výběru výstupu viz obr. 7. [vlastní] 55
62 Obrázek 6 - Výběr ověřovaného rozdělení [vlastní] Obrázek 7 - Výběr výstupu výpočtů [vlastní] Pro ověření normality Kolmogorovým-Sminovovým testem byla vybrána položka Goodnessof-Fit Tests. Výstup tohoto testu je prezentován obrázkem 8. Pro ověření normality dalšími testy byla vybrána položka Tests for normality, jejíž výstup je prezentován obrázkem 9. Výběr dalších testů normality byl provenen výběrem položky Pane Options po stisku pravého tlačítka v čáti Tests for normality for Z_S. [vlastní] 56
63 Obrázek 8 - Výstup dalších testu pro ověření normality [vlastní] Obrázek 9 - Výstup Kolmogorova-Smirnovova testu [vlastní] 57
64 6..3 Testy hypotéz pro ověření přesnosti Tento program byl dále využit na ověření hladkosti prostřednictvím dvou statistických testů. K testování hypotéz nabízí program funkci Hypothesis Tests viz obr. 30, kde byla postupně vybrána možnost Normal Mean pro Test změny znamének a možnost Binomial Proportion pro Znaménkový test. [vlastní] Obrázek 3 - Ověření hladkosti - funkce Hypothesis Tests [vlastní] Obrázek 3 - Výběr testu změny znamének [vlastní] Obrázek 30 - Výběr znaménkového testu [vlastní] 58
65 U obou testů byla zadána velikost vzorku Sample size, nulová hypotéza Null Hypothesis a v případě Testu změny znamének také výběrový průměr Sample Mean viz obr. 3 a obr. 3. V další nabídce Hypothesis Tests Options bylo zadáno, že se alternativní hypotéza nebude rovnat hladině významnosti α viz obr. 33. Výstup Testu změny znamének a Znaménkového testu jsou prezentovány viz obr. 34 a obr. 35. [vlastní] Obrázek 33 - Hypothesis Tests Options [vlastní] Obrázek 34 - Výstup testu změny znamének [vlastní] 59
Pojistná matematika. Úmrtnostní tabulky, komutační čísla a jejich použití. Silvie Kafková
Úmrtnostní tabulky, komutační čísla a jejich použití 2015 Osnova 1 Délka života 2 Intenzita úmrtnosti 3 Úmrtnostní Tabulky 4 Komutační čísla Obsah 1 Délka života 2 Intenzita úmrtnosti 3 Úmrtnostní Tabulky
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Výpočet pojistného v životním pojištění. Adam Krajíček
Výpočet pojistného v životním pojištění Adam Krajíček Dělení životního pojištění pojištění riziková - jedná se o pojištění, u kterých se předem neví, zda dojde k pojistné události a následně výplatě pojistného
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
POJIŠŤOVNICTVÍ. Mezi složky současného pojišťovnictví patří. ekonomie a finance, pojistné právo pojistná matematika.
POJIŠŤOVNICTVÍ Pojištění se historicky považuje za formu přesunu rizika negativních dopadů nahodilostí, z ekonomického nebo jiného subjektu na speciální instituce- pojišťovnu. Jde o zvláštní odvětví ekonomiky
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Diskrétní náhodná veličina
Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné
7. Funkce jedné reálné proměnné, základní pojmy
, základní pojmy POJEM FUNKCE JEDNÉ PROMĚNNÉ Reálná funkce f jedné reálné proměnné je funkce (zobrazení) f: X Y, kde X, Y R. Jde o zvláštní případ obecného pojmu funkce definovaného v přednášce. Poznámka:
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Vybraná rozdělení náhodné veličiny
3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =
Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní
Monotonie a lokální extrémy. Konvexnost, konkávnost a inflexní body. 266 I. Diferenciální počet funkcí jedné proměnné
66 I. Diferenciální počet funkcí jedné proměnné I. 5. Vyšetřování průběhu funkce Monotonie a lokální etrémy Důsledek. Nechť má funkce f) konečnou derivaci na intervalu I. Je-li f ) > 0 pro každé I, pak
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.
Modelování dynamických systémů Matematické modelování dynamických systémů se využívá v různých oborech přírodních, technických, ekonomických a sociálních věd. Použití matematického modelu umožňuje popsat
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
ÚMRTNOST OBYVATELSTVA ČESKÉ A SLOVENSKÉ REPUBLIKY; NÁVRH KONSTRUKCE NOVÝCH ÚMRTNOSTNÍCH TABULEK
ÚMRTNOST OBYVATELSTVA ČESKÉ A SLOVENSKÉ REPUBLIKY; NÁVRH KONSTRUKCE NOVÝCH ÚMRTNOSTNÍCH TABULEK Boris Burcin 1, Klára Hulíková 1, David Kománek 2 1 Katedra demografie a geodemografie, Přírodovědecká fakulta
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování
KATEDRA ANALYTICKÉ CHEMIE FAKULTY CHEMICKO TECHNOLOGICKÉ UNIVERSITA PARDUBICE - Licenční studium chemometrie LS96/1 SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování Praha, leden 1999 0 Úloha
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
součást systému tabulek života, které charakterizují řád reprodukce populace
ÚMRTNOSTNÍ TABULKY součást systému tabulek života, které charakterizují řád reprodukce populace logický systém statistických ukazatelů, které charakterizují dekrementní řád, tj. proces postupného vymírání
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Ukazatele zdravotního stavu. Martin Horváth Kateřina Ivanová
Ukazatele zdravotního stavu Martin Horváth Kateřina Ivanová 1 Subjektivní hodnocení zdraví Zdroj 2 Střední délka života při narození a její část prožitá bez zdravotního omezení, muži, 2003 emě, které byly
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Téma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
Popisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
Řešení. Označme po řadě F (z) Odtud plyne, že
Úloha Nechť ~ R(, ) a Y = Jinak řečeno, Y je odmocnina čísla vybraného zcela náhodně z intervalu (, ) Popište rozdělení veličiny Y a určete jeho modus, medián, střední hodnotu a rozptyl Řešení Označme
2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
Vliv věku a příjmu na výhodnost vstupu do důchodového spoření (II. pilíře)
Vliv věku a příjmu na výhodnost vstupu do důchodového spoření (II. pilíře) Následující analýza výhodnosti vstupu do II. pilíři vychází ze stejné metodologie, která je popsána v Pojistněmatematické zprávě
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
STATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
10. Předpovídání - aplikace regresní úlohy
10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
Demografie V. Sňatečnost a rozvodovost
Demografie V Sňatečnost a rozvodovost 5.1 SŇATEK A SŇATEČNOST 5.2 HLUBŠÍ ANALÝZA SŇATEČNOSTI 5.3 TABULKY SŇATEČNOSTI 5.4 ROZVOD A ROZVODOVOST 5.5 KOHORTNÍ ANALÝZA ROZVODOVOSTI Sňatek a sňatečnost Hrubá
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
Neparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.
Tomáš Cipra: Pojistná matematika: teorie a praxe. Ekopress, Praha 2006 (411 stran, ISBN: 80-86929-11-6, druhé aktualizované vydání) 1. ÚVOD...
Tomáš Cipra: Pojistná matematika: teorie a praxe. Ekopress, Praha 2006 (411 stran, ISBN: 80-86929-11-6, druhé aktualizované vydání) OBSAH I. POJIŠŤOVNICTVÍ A FINANCE 1. ÚVOD... 13 2. POJIŠTĚNÍ JAKO OCHRANA
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
S E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.
5. Náhodná veličina Poznámka: Pro popis náhodného pokusu jsme zavedli pojem jevového pole S jako množiny všech možných výsledků a pravděpodobnost náhodných jevů P jako míru výskytů jednotlivých výsledků.
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy