REGRESNÍ MODEL PRO PREDIKCI BUDOUCÍCH POČTŮ POJIŠTĚNCŮ VZP ČR Anoace V příspěvku 1 [1] byl předsaven zv. mechanizmový model pro predikci budoucích počů pojišěnců VZP ČR, založený na adiivních dopočech exrapolovaných kvarálních přeregisračních sald (mezi zdravoními pojišťovnami) a muliplikaivních korekurách vzhledem k akualizovaným varianám demografické projekce ČSÚ (z r. 2013). V omo příspěvku bude popsán regresní model, kerý odhaduje regresní paramery meodou nejmenších čverců v zobecněném lineárním modelu, kde váhy rerospekivních pozorování jsou přímo úměrné exponenciálně klesajícím diskonním fakorům (koeficienům α) jako u exponenciálního vyhlazování (běžné pro jednodušší polynomiální modely). Nově předsavený model rozšiřuje původní mechanizmový o čyři opimalizované nezávisle proměnné (přeregisrační a demo proměnnou, a dále o formální absoluní a lineární člen, poslední dva kumulaivně překvalifikované na lineární a kvadraický). Kalibrace modelu (volba diskonu α) byla provedena zvlášť pro každou z 18i pěileých věkových skupin na základě maximalizace nelineárního průběhu procena rozpylu vysvělovaného modelem. Vizuální porovnávání výsledků predikce pro ři variany možného vývoje přeregisrací pojišěnců je operacionalizováno v rámci uživaelské aplikace v prosředí MS Excel. Diskonovaný regresní model umožňuje jednodušší rozpoče exrapolovaných varian predikce pro sysém všech 14i krajů ČR do r. 2032. Vzhledem k rychle se měnící dynamice poču pojišěnců ve sávajícím období je ale zapořebí nasavení paramerů regresního modelu rok od roku operaivně přepočíáva. Klíčová slova odvozené demografické projekce, zobecněné lineární modely, exponenciální vyrovnávání, koeficien deerminace, odhad meodou nejmenších čverců Vývoj řešené problemaiky Úlohu predikce budoucích počů pojišěnců můžeme považova za klíčovou pro kalkulaci budoucí profiabiliy pojišťovny. Ve všeobecné zdravoní pojišťovně se ao úloha radičně řeší za účelem vorby ročních zdravoně pojisných plánů meodikou experního sanovení budoucích meziročních změnových indexů ve srovnání s minulým obdobím. Tuo heurisickou meodu lze úspěšně 1 Běláček J.: Predikce budoucích počů pojišěnců VZP ČR daa, meodika a výsledky. In.: Sborník příspěvků MEDSOFT 2018. Hoel Academic, Rozoky u Prahy, 20. 21.3.2018, vyd.: Creaive Connecions ve spolupráci s Zeihamlová Milena Agenura Acion M, Praha, ISSN 1803-8115, 2018, sr.7 19 7
použí i pro predikci počů pojišěnců v pěileých věkových skupinách, nikoli však pro delší časové období. Důvodem jsou zářezy ve věkové srukuře obyvaelsva ČR, keré se vizualizují i v ročních časových řadách počů pojišěnců VZP ČR, když jejich průběhy zobrazíme v rámci jednolivých věkových skupin. Pokud máme navíc k dispozici rerospekivní údaje o vývoji průměrných příjmů a průměrných výdajů v příslušných věkových skupinách, může bý kalkulace celkových příjmů a výdajů zdravoní pojišťovny schůdnou záležiosí i ve sřednědobém výhledu (řekněme pro období budoucích 3 5 le). Predikce počů pojišěnců pro sřednědobý horizon musíme ale založi na sofisikovanějších algorimech než na indexování. Jeden z nich vycházející z meodiky zv. odvozených demografických projekcí byl použi např. pro odhady budoucích demografických srukur pacienů ZZ AGEL v kraji Olomouckém, Moravskoslezském a v Praze (zde ale pro málo reprezenaivní vzorek pacienů). Výsledky byly poprvé prezenovány na IX. Sympoziu AGEL v Olomouci v říjnu 2015 (viz [1]) a publikačně shrnuy v následujících dvou leech (viz [2 3]). Pro demograficky reprezenaivnější počy budoucích pojišěnců VZP ČR byl eno model aplikován a posléze rozšířen ješě o časové řady počů pojišěnců získaných z daabáze přeregisrací (edy pojišěnců migrujících mezi zdravoními pojišťovnami). Pro verzi ročních časových řad byl předsaven v příspěvku [4] jako zv. mechanizmový model predikce poču pojišěnců VZP ČR (pro kvarální verzi je eno model předsaven ve sai 2.1). Paralelně s mechanizmovým modelem byly na sejné daové bázi prováděny experimeny se zobecněnými lineárními modely (obecně viz [6], sr. 233), když váhy rerospekivních pozorování byly voleny přímo úměrné exponenciálně klesajícím diskonním fakorům α (0<α 1) vzorce ve sai 2.2. Pro formálně jednodušší polynomiální regresní modely eno přísup koresponduje s meodikou zv. exponenciálního vyhlazování (viz [6], sr. 57 72), kde pro kalibraci α na bázi zv. in-sample přepočů lze využí explicině odvozených sofisikovaných vzorců. (Zcela obecně bylo in-sample ověřování zv. fi regresních modelů pro obdobnou problemaiku použio pro modelování budoucích příjmů ze zdravoního pojišění, nezávisle na věku pojišěnců viz [5], sr. 2). V rámci uživaelské aplikace vyvořené ve VZP ČR pod MS Excel však nebylo jednoduché oo provés při kalibraci α právě v případě zobecněných lineárních modelů; namíso oho byla edy α ve všech 18i věkových skupinách kalibrována na základě maximalizace nelineárního průběhu procena rozpylu vysvěleného regresním modelem (podrobněji ve sai 3. a 4.). 2 Meodika 2.1 Mechanizmový model Mechanizmový model pro predikci poču pojišěnců VZP ČR (na anuální bázi pro každé čvrleí) byl předsaven v příspěvku [4]. S ohledem na pozdější ranskripci da do unifikované kvarální verze můžeme budoucí počy pojišěnců P x pro každou věkovou skupinu x (= 0-4,, 85+ ) generova na základě předpisu = ( -1 + S x ). (D x /D x -1 ), = 1, 2,. (1) kde 0 P x 0 značí známé vsupní počy pojišěnců ve věku x v prahovém čase =0 (ke konci vsupního čvrleí), D x je sřední sav žijících osob (nebo souče zdravoních pojišěnců v ČR ve věkové skupině x ) přepočený k émuž kvarálu jako a S x značí saldo přeregisrací předpokládané (nebo exrapolované) pro období mezi roky -1 a. Při speciální volbě S x = 0 pro všechny budoucí časy se model (1) redukuje na běžný model odvozené demografické projekce. (Při sávající dynamice pojisného kmene VZP ČR dokonce eno předpoklad může bý pro nejbližší období i jedním z reálných scénářů pro nejbližší budoucí vývoj.) Ale můžeme uvažova i alernaivu pouze čisé projekce kumulaivních přeregisrací, kerou získáme formální volbou D x /D x -1 = 1 pro všechny budoucí časy. Přesože eno druhý scénář vlasně pro žádnou věkovou skupinu x není reálný, může bý dobře využi při účely posuzování možného vzájemného i synergického vlivu obou vysvělujících komponen j. demografické a přeregisrační na budoucí vývoj počů pojišěnců. Z hlediska formálního vyjádření (1) je zahrnuí obou vysvělujících složek mechanizmového modelu zjevně nesymerické. Muliplikaivní demografický index (D x /D x -1 ) v rámci ohoo výpočeního předpisu umožňuje operaivní přenos dynamiky demografie ČR homogenně na celý pojisný kmen VZP ČR (ve věkových skupinách); en se ale bez zahrnuí přeregisrační složky již dříve ukázal jako ne zcela posačující. Adiivní přeregisrační složka S x se v rámci vzorce (1) adapuje na složku demografickou odpovídajícím způsobem ale přeregisrovaní pojišěnci by se samozřejmě nemuseli řídi sejnými homogenizačními demografickými předpoklady jako celý pojisný kmen. (Na omo mísě je řeba si uvědomi, že zaímco demografická složka reflekuje celorepublikové procesy úmrnosi, migrace obyvaelsva a v nejnižší věkové skupině aké porodnosi; přeregisrační složka se ýká pouze meziročního přerozdělování pojišěnců mezi zdravoními pojišťovnami. Formálně jde edy o nezávislé komponeny.) Symerie obou vysvělujících proměnných v modelu bychom dosáhli například formálním přepisem (1) do varu = ( -1 + S x ) + ( -1 + S x ). (D x /D x -1-1), = 1, 2,. (1a) kde celý druhý sčíanec můžeme považova za kvarální saldový přírůsek poču pojišěnců, kerý spadá na kono celorepublikového demografického vývoje. Muliplikaivní člen ve vzorci (1a) má inerpreaci relaivního přírůsku spadajícího na kono demografie ČR mezi sousedními kvarály. Tako koncipovaný model má přínos pro porozumění smysluplnosi zobecněného regresního modelu popsaného ve sai 2.2. Máme-li pro věkové skupiny k dispozici i rerospekivní kvarální údaje o počech pojišěnců, j. P x pro = -1,, -T, a rovněž údaje o demografii a o minulých přeregisracích, lze výše uvedený rekurenní vzorec formalizova rovněž 8 9
rerospekivně. Vyjdeme-li z éhož prahového času =0, můžeme generova analogickou posloupnos modelových hodno směrem do minulosi předpisem = ( +1 + S x ). (D x /D x -1 ), = -1, -2,, -T. (2) Ukázka finální aplikace modelů (1) a (2) vysčíaných z věkových skupin pro úroveň celkových počů pojišěnců VZP ČR je pro sřední varianu exrapolace hodno S x do budoucnosi prezenována na Grafu č. 1. Graf 1 Vývoj kvarálních počů pojišěnců VZP ČR za období 03/2002 12/2017 a časové řady jejich eoreických počů generovaných rekurenními mechanizmovými modely (pro sřední varianu exrapolace přeregisračního salda do roku 2032) 2.2 Zobecněný lineární model Při značení jako v čási 2.1 lze základní zobecněný lineární regresní model vyjádři ve formě Δ(P x ;θ) = b x + c x. + d x. S x + e x. Δ(D x ) + ε(0, w. σ x2 ), = 1,., 0,, T (3) kde Δ(P x ;θ) (P x - P x -1 ) značí rerospekivní diference poču pojišěnců mezi konci sousedících kvarálů, θ (b x,c x,d x,e x ) vekor lineárních regresních paramerů, 0 práh projekce a ε(0, w. σ x2 ) označuje chybu měření (s nulovou sřední hodnou a rozpylem ve varu součinu w. σ x 2 pro vahový fakor w funkcionálně nezávislý na sysémovém parameru σ x2 ). Výraz Δ(D x ) reprezenuje kvarální diference absoluního přírůsku pojišěnců příslušných demografické složce. Ve vzorci (3) jsme použili prospekivní (pro > 0 ) i rerospekivní (pro < 0 ) aproximace ypu Δ(D x ) -1. (D x /D x -1-1) zn. jako v mechanizmovém modelu, jen oproi druhému sčíanci v (1a) zanedbáváme rozpoče demografického fakoru na přeregisrační člen S x ; ím se do jisé míry zbavujeme nadbyečné kolineariy mezi S x a Δ(D x ). Za důležiou považujeme vlasnos, že všechny členy na pravé sraně v (3) jsou nyní součásí sandardizovaného adiivního regresního modelu, kerý zahrnuje dřívějších mechanizmové modely jako svůj speciální případ (při fixní volbě b x =c x =0 a d x =e x =1). Odhady ^θ vekoru paramerů θ v modelu (3) získáváme minimalizací váženého souču čverců =0,,-T w. [Δ(Px ;θ) - (b x + c x. + d x. S x + ex. Δ(D x ))] 2 (4) Graf 1 Skuečné kvarální počy pojišěnců VZP ČR (v isících) jsou zobrazeny černými čverci jako časová řada mfpojišěnci, hodnoy generované kvarálním mechanizmovým modelem (1) a (2) jsou vyobrazeny zelenými rojúhelníky (řada Q_Model+Demo ). Modelovou řadu lze dále rozloži na souče čisě demografické složky (řada Q_Demo žluá kolečka) vyvořené jednoduchým indexováním (meodika odvozené demografické projekce) a složky čisě přeregisrační (řada Q_Model modré kosočverečky) při hypoeickém nulovém kvarálním saldu demografie. Kvarální demografické komponeny modelu byly získány inerpolací ze sředních savů obyvaelsva ČR v pěileých věkových skupinách (viz porál ČSÚ) a ze sřední variany demografické prognózy ČSÚ z r. 2013. Hisorická kvarální salda přeregisrací pro pojišěnce VZP ČR pro období 03/2002 12/2017 byla převzaa z inerních daabází VZP a z regisru pojišěnců ČR; pro období 03/2018 12/2032 jsou na grafu budoucí přeregisrační salda reprezenována sřední varianou exrapolace z ročních časových řad 2012 17. (Tao variana předpokládá rvale mírný logarimický nárůs salda přeregisrací pro celou dobu predikovaného období podrobněji v [4] v ods. 5.3). Na grafu 1 zobrazené modelové řady vznikly jako souče meodicky sejně odvozených křivek pro 18 pěileých věkových skupin dohromady. jako zv. Aikenův odhad (viz v [6], sr. 233). Váhy ve vzorci (4) jsou v daném případě definovány jako w α x - pro diskonní fakory α x (0<α x 1) o znamená, že s posupným vzdalováním od prahové hodnoy (v čase =0) dosávají hisorická daa exponenciálně se snižující vliv. (Pouze při α x =1 odhady ^θ vekoru paramerů θ korespondují s klasickou neváženou lineární regresí, kdy všechny minulé hodnoy časové řady mají sejnou váhu.) Dosazením opimalizovaných odhadů do vzorce (4) získáme odhady pro rozpylový paramer σ x2, jehož prosřednicvím kvalifikujeme saisickou významnos paramerů v zobecněných lineárních modelech a odhadnou pásy spolehlivosi kolem predikovaných regresních přímek pro každou věkovou skupinu x (= 0-4,, 85+ ) zvlášť. Pro účely finální predikce počů pojišěnců nakonec použijeme kumulaivní přepoče = -l + Δ( ;^θ) = P x 0 + l=0,, Δ(1 ;^θ) = = P x 0 + l (^b x + ^c x. l + ^d x. S x l + ^e x. Δ(D xl )) = = P x 0 + ^b x. + ^c x. (+1)/2 + ^d x. S x + ^e x. Δ(D x ), = 0 +1,, T (5) kde Δ( ;^θ) jsou hodnoy sřední hodnoy regresní funkce z (3) edy výrazu na pravé sraně rovnice (3) bez posledního členu ε(0, w. σ x2 ) v bodě ^θ (^b x,^c x,^d x,^e x ) v budoucích časech. Hodnoa P x 0 (vsupní poče pojišěnců v prahovém čase projekce) ve výpočením předpisu (5) figuruje jako absoluní 10 11
člen (a x ) pěiparamerické lineární kumulaivní regresní funkce, kerý v rámci minimalizace souču čverců ad (4) není zapořebí odhadova. Tímo posupem se dosáhne spojiého napojení regresní funkce na poče pojišěnců v prahovém čase 0, což má význam zejména pro krákodobé prognózování. Rovnice (3) resp. (5) reprezenuje ovšem v každé věkové skupině hned několik lineárních regresních modelů, když někeré z paramerů b x, c x, d x nebo e x uvažujeme jako rovné nule. Nejefekivnější (nepřeparamerizované) regresní modely bychom získáme hierarchickým esováním hypoéz o jejich nulových hodnoách prosřednicvím normálních saisických esů (zde máme na mysli esy založené na předpokladu normálního.j. Gaussovského rozdělení chybových členů ε(0, w. σ x2 ) v rovnici (3)). Jelikož ale o významu demografické a přeregisrační proměnné v podsaě nemáme (po experimenech s mechanizmovými modely) pochybnosi, zajímá nás ponejvíce esování hypoézy H 0 : c x =0 ověřující legiimiu kvadraického členu u časové proměnné. Diskusi k éo problemaice, kde se ukázala jako nejpodsanější volba diskonního parameru α x, provádíme v závěrečné sai 3. 3 Výsledky Více než echnologie odhadu paramerů v regresních modelech výše je důležiá věrohodnos predikčních křivek ve vzahu k jejich skuečnému budoucímu vývoji. Spolehlivos predikčních odhadů můžeme měři např. porovnáním modelových hodno s rerospekivním vývojem v minulosi. Pokud máme k dispozici dosaečně flexibilní řídu predikčních odhadů, můžeme se pokusi predikovanou časovou řadu v dané řídě paramerických odhadů opimalizova. Takovou možnos nemáme v případě mechanizmových modelů předsavených v rámci sai 2.1; naopak u zobecněných regresních modelů umožňuje volba váhových-diskonních fakorů α x až nečekaně variabilní a senziivní scénáře budoucího vývoje pojišěnců VZP ČR. Pouze čásečně indikují možné problémy údaje v Tabulce 1, kde jsou uvedeny důležié paramery pro dva nejobecnější predikční modely abcde (plně odhadnuý čyřparamerický regresní model (5) s kvadraickým členem u časové proměnné) a abde (říparamerický model s kvadraickým členem fixně definovaným jako nula). V Tabulce 1 jsou pro oba modely uvedena procena vysvěleného rozpylu (R 2 ), keré pro normální regresní modely již samy osobě předsavují klíčovou charakerisiku pro posouzení vhodnosi výběru regresních proměnných. V případě zobecněných lineárních modelů se ale koeficieny deerminace (R 2 ) ukázaly jako silně závislé na volbě diskonního parameru α x (0<α x 1). Vzhledem k spojiě-nelineárním průběhům procena vysvěleného rozpylu v jednolivých věkových skupinách byly edy za opimální považovány obvykle y volby α x, kde R 2 dosáhl svého maxima. Jak vyplývá z údajů v Tabulce 1, v řadě případů odpovídala maxima hodnoám α x =1 (edy modelům nevážené lineární regrese), ale u několika věkových skupin byla v rozpěí prakicky aplikovaelných hodno α x (0,65<α x ) shledána i hodnoově srovnaelná lokální maxima dvě akže finální výběr α x byl učiněn až po pečlivějších experizních (a vizualizačních) analýzách. Graf 2 Vývoj kvarálních počů pojišěnců VZP ČR za období 03/2002 12/2017 a časové řady jejich eoreických počů generovaných dvěma alernaivami regresních modely (pro sřední varianu exrapolace přeregisračního salda do roku 2032) ve srovnání s mechanizmovým modelem a pásy spolehlivosi Graf 2 Hisorické kvarální počy pojišěnců VZP ČR (v isících) jsou zobrazeny černými čverci (časová řada mfpojišěnci ). Pro plně paramerizovaný regresní model z (3) označme jej formálně abcde opimalizovaný v rámci kumulaivních vzorců (5) a vysčíaný z úrovně všech 18 věkových skupin je na Grafu 2 znázorněný černými křížky. Jednodušší alernaivní model abde (odhadnuý nezávisle při volbě c x=0) je zobrazen plnými ležaými (červenými) kosočverci. Na obrázku jsou vyznačeny rovněž 95%ní pásy spolehlivosi (v oblasi vymezené křivkami HCI95(op abde ) a LCI95(op abde ), což jsou horní a dolní meze pro model abde odhadnuý účelově pro jedinou součovou skupinu 0+ ). Termínem opimalizované míníme modely, keré zaznamenaly co možná nejvyšší % vysvěleného rozpylu (R 2 ) při sysemaických změnách diskonního parameru αx (0<α x 1), zvlášť v rámci každé pěileé věkové skupiny podrobněji viz Tabulka 1. Procena (68,804% resp. 66,224%) uvedená pro oba alernaivní modely v Legendě na obrázku byla vyčíslena jako prosý průměr v rámci všech 18i věkových skupin ( x = 0-4,, 85+ ). Pro vizuální porovnání výsledků je na Grafu 2 zobrazena i časová řada hodno predikovaných mechanizmovým modelem (1) a (2) z Grafu 1 (řada Q_Model+Demo zelené rojúhelníky). Již z údajů v Tabulce 1 jasně vyplývá, že na věšině řádků se výsledky pro oba srovnávané modely příliš neliší. To znamená, že ani přírůsek R 2 evidovaný ve prospěch čyřparamerického modelu abcde není saisicky významný. Teno fak bychom povrdili i na úrovni indikací saisické významnosi individuálních paramerů ohoo modelu, kerých by v celkovém souhrnu ani nebylo více než pro redukovaný model abde. (Saisicky významné koeficieny c x u kvadraických členů modelu abcde jsme shledali pouze ve skupinách 5 9 12 13
a 35 39 proo yo údaje z úsporných důvodů ani deailně neuvádíme). Naopak saisická významnos formálních paramerů v redukovaném modelu abde (viz indikace hvězdičkami v prosředních sloupcích Tabulky 1) jasně vypovídá o významu lineárního členu (zejména ve všech vyšších věkových skupinách, počínaje 45+, ale aké u 0 4 a 10 19 ). Význanos přeregisračního členu je nejsilnější ve skupinách 5 9 (p=0,002), 10 14 (p=0,019) a v několika dalších. Ve všech pěileých věkových skupinách ale dominuje svojí saisickou významnosí adiivní člen demografický (p<0,001). Je důležié si všimnou, že na úrovni modelů odhadovaných marginálně pro celý pojisný kmen (uvažovaný jako agregání skupina 0+ ) vychází demografický člen d x jako nesignifikanní (na rozdíl od lineárního a přeregisračního). Tao skuečnos je způsobena nejen formálně nízkými proceny vysvěleného rozpylu na úrovni celkových počů, ale jednoduše i ím, že dřívější vysoké meziroční úbyky počů pojišěnců VZP fakicky nelze vysvělova dlouhodobě sabilizovaným vývojem celkových počů obyvaelsva ČR. To bylo základním kamenem úrazu již při hledání meodické koncepce vhodné řídy predikčních regresních, neboť demografická složka se výrazně uplaňuje až s přechodem k jednolivým věkovým skupinám. Ve řech věkových skupinách ( 15 19, 65 69, 80 84 ) byly za opimální diskonní fakory α x pro redukovaný model ( abde ) použiy hodnoy znaelně nižší než u úplného modelu. U skupiny 15 19 o vede dokonce k výrazně vyšším hodnoám R 2 ve prospěch redukovaného modelu (v siuaci éhož α x by ale musela plai opačná nerovnos). Ve skupině 5 9 byla hodnoa α x =0,69 (pro oba modely) vybrána až jako 2. lokální maximum shledané v rámci analýzy spojiého průběhu R 2, a o z důvodu jasně věrohodnějšího průběhu predikované regresní křivky. V obdobném smyslu bylo v pořadí až 2. lokální maximum u R 2 pro α x vybráno u skupin 5 9 a 80 84, proože v rámci regionálních rozpočů z ČR na 14 krajů ČR by hodnoy exrapolované pro 1. lokální maximum v individuálních regionech překračovaly rámec věrohodných budoucích krajských podílů VZP na rhu zdravoního pojišění. Tabulka 1 Základní paramery dvou nejvýznamnějších zobecněných regresních modelů ad (3) opimalizovaných za účelem predikce poču pojišěnců VZP ČR Celkem a v rámci pěileých věkových skupin (opimální diskonní fakory α x, % vysvěleného rozpylu a vyznačení saisické významnosi paramerů modelu abde, j. modelu odhadnuého za podmínky c x=0) "x" α( abde ) R 2 ( abde ) bx cx=0 dx cx=0 ex cx=0 α( abcde ) R 2 ( abcde ) '0+' 0,85 16,59% -13,16* 1,661 0,619* 1,00 13,28% '0 4' 1,00 27,44% 0,212 0,861*** 0,477 1,00 32,14% '5 9' 0,69 52,68% -0,674 1,335*** 0,895** 0,69 52,68% '10 14' 0,99 82,47% -1,03*** 1,217*** 0,623* 0,99 82,75% "x" α( abde ) R 2 ( abde ) bx cx=0 dx cx=0 ex cx=0 α( abcde ) R 2 ( abcde ) '15 19' 0,86 76,50% -0,961** 1,161*** 0,476* 1,00 64,91% '20 24' 1,00 39,75% -0,241 1,208*** 0,691 1,00 41,69% '25 29' 1,00 47,21% -0,288 1,04*** 0,231 1,00 49,12% '30 34' 1,00 66,04% 0,081 0,789*** 0,528 1,00 66,18% '35 39' 0,93 72,07% -0,619 0,719*** 0,159 0,94 73,45% '40 44' 0,99 49,01% -0,464 0,877*** 0,826 1,00 49,47% '45 49' 1,00 83,03% -1,079*** 1,109*** 0,683* 1,00 83,23% '50 54' 0,96 71,66% -1,006** 0,994*** 0,69 0,96 71,77% '55 59' 1,00 79,01% -0,77** 1,027*** 0,68* 1,00 79,09% '60 64' 1,00 79,93% -0,895** 1,039*** 0,408 1,00 79,98% '65 69' 0,75 85,02% -1,24*** 1,145*** 0,968* 1,00 83,65% '70 74' 1,00 93,05% -1,274*** 1,034*** -0,025 1,00 93,15% '75 79' 0,94 85,73% -0,654*** 0,898*** 1,613* 0,94 85,82% '80 84' 0,86 36,66% -0,568*** 1,235*** -0,42 1,00 82,29% '85+' 1,00 64,78% 0,397* 0,751*** 2,348 1,00 67,10% mean 0,943 66,225% 0,973 68,804% Legenda: V jednolivých sloupcích abulky jsou uspořádány: opimální diskonní fakory αx a % vysvěleného rozpylu pro dva nejdůležiější zobecněné lineární modely ( abde a abcde ) a odhadnué formální paramery modelu abde s vyznačením jejich saisické významnosi vůči eoreickým nulovým hodnoám (* resp. ** nebo *** značí saisickou významnos na hladině významnosi 0,001 resp. 0,01 nebo 0,05); na základě ěcho paramerizací byly vyvořeny predikční křivky regresních modelů zobrazených na Grafu 1. 4 Závěry V rámci excelovské aplikace vyvinué na půdě VZP v leech 2017 18 se auomaicky generují všechny časové řady predikované na základě mechanizmových i zobecněných regresních modelů, a o dokonce pro všechny hierarchické submodely, keré lze odvodi z modelu abcde pro libovolně zvolená α x (0<α x 1) v 18i pěileých věkových skupinách. Vizualizované průběhy predikčních křivek pro specifické regresní submodely umožňují srovnání s korespondujícími mechanizmovými predikčními modely (za korespondující lze považova nikoli pouze abde resp. abcde vs. Q_Model+Demo z Grafu 1, ale aké např. abd resp. abcd vs. Q_Demo z Grafu 1 zahrnující pouze demografickou složku 14 15
anebo analogicky regresní modely abe resp. abce vs. Q_Model akcepující pouze složku přeregisrační). Pro opimalizované paramery dvou nejvýznačnějších regresních modelů ( abde resp. abcde ) se agregání výsledky pro ČR rozpočíávají na úroveň 14i krajů ČR, kde má VZP již hisoricky vzešlé velmi rozdílné podíly na rhu zdravoního pojišění. Z ěcho úhlů pohledu edy predikce založené na zobecněných regresních modelech jasně překonávají dřívější modely mechanizmové, keré jsou zde nyní zahrnuy jako speciální případy. Složios sysemaického meodického zpracování éo predikční úlohy spočívá v om, že v jednolivých pěileých věkových skupinách se akuální dynamika vývoje poču pojišěnců nachází vždy v odlišné fázi růsu nebo poklesu kmene pojišěnců, kerá je podmíněna akuálními zářezy ve věkové srukuře obyvaelsva ČR. Navíc se v jednolivých věkových skupinách uplaňují lokální, ale spojié přeregisrační rendy odvíjené od specifické siuace na rhu zdravoního pojišění. Zobecněné regresní modely použié výše mají schopnos velmi senziivně formalizova demografickou i přeregisrační složku, u desei pěileých věkových skupin pověšinou ěch nejsarších je formálně nezbyné zahrnou do modelu i formální (sesupný) lineární rend, ve skupině 85+ se formální lineární rend indikuje saisicky významně jako vzesupný. Nejvěší problémy s použiím zobecněných lineárních modelů byly spojeny s kalibrací diskonních paramerů α x, keré byly v rámci řídy modelů abde a abcde opimalizovány v každé věkové skupině experním výběrem z nejvýše dvou hodno, kde procena vysvěleného rozpylu (R 2 ) nabývala svého lokálního maxima. Teno posup maximalizuje informaci obsaženou v rámci demografické a přeregisrační nezávisle proměnné. Další rozvoj modelu je možný korekurami výše sanovených kalibračních paramerů αx na základě znalosi budoucího kvarálního vývoje počů pojišěnců VZP ve skupinách. [6.] Cipra T.: Analýza časových řad s aplikacemi v ekonomii. Praha, SNTL/Alfa,1986 [7.] Projekce obyvaelsva ČR do r. 2100, ČSÚ, 2013; hps://www.czso.cz/csu/czso/projekce- -obyvaelsva-ceske-republiky-do-roku-2100-n-fu4s64b8h4 [8.] Věkové složení obyvaelsva ČR, ČSÚ, 2012,, 2016; hps://www.czso.cz/csu/czso/vekove-slozeni-obyvaelsva-2016 [9.] Projekce obyvaelsva v krajích ČR do r. 2050, hps://www.czso.cz/csu/czso/projekce- -obyvaelsva-v-krajich-cr-do-roku-2050-ua08v25hx9 Konak, RNDr., CSc. VZP ČR Orlická 4 130 00 Praha 3 e-mail: jaromir.belacek@vzp.cz Lieraura [1.] Běláček J, Fiala T, Parma M, Foks R: Civilizační nemoci, věkové sárnuí obyvaelsva a daa o pacienech ZZ AGEL. IX. Symposium AGEL, Olomouc 1. 2.10. 2015, poser [2.] Běláček J, Fiala T, Parma M, Foks R, Muringerová K: Projekce nemocnosi v konexu sárnuí obyvaelsva a poskyováných zdravoních služeb v ČR 2012 14. Forum Saisicum Slovacum 4/2015, 120 128, Slovenská Šaisická a Demografická Společnos, Eds.: Chajdiak J, Luha J, Madarász Š, Rev.: Chajdiak J, Luha J, Koróny S [3.] Běláček J, Fiala T, Parma M, Michna P, Lukeš K, Muringerová K: Projekce budoucí pořeby a spořeby zdravoní péče z perspekivy sárnuí ambulanních pacienů ZZ AGEL 2012-14. In.: Sborník příspěvků MEDSOFT 2017, 4 18. Hoel Academic, Rozoky u Prahy, 21. 22.3.2017 [4.] Běláček J.: Predikce budoucích počů pojišěnců VZP ČR daa, meodika a výsledky. In.: Sborník příspěvků MEDSOFT 2018, 7 19. Hoel Academic, Rozoky u Prahy, 20. 21.3.2018 [5.] Bělohradský A-Šolc Z: Predikce příjmů veřejného zdravoního pojišění. Meodické compendium. Minisersvo financí České republiky, 2018, hp://www.mfcr.cz/sudie 16 17