Vysoká škola ekoomcká v Praze Fakulta formatky a statstky Vyšší odborá škola formačích služeb v Praze Lukáš Kleňha egresí aalýza acetovy rogrese o rví hostalzac s CHOPN 0
Prohlášeí Prohlašuj, že jsem bakalářskou rác a téma egresí aalýza acetovy rogrese o rví hostalzac s CHOPN zracoval samostatě a oužl ouze zdrojů, které ctuj a uvádím v sezamu oužté lteratury. V Praze de 5. sra 0 Lukáš Kleňha - 3 -
Aotace Pomocí regresí metody vyočítávám vyhlídky aceta o rví hostalzac s emocí CHOPN. Získaé rovce osují stav ve sádové oblast Nemocce Tábor a.s., kde byla data shromážděa. Tyto rovce osují závslost dvou měřeých faktorů a osují odhadutelé vyhlídky aceta s touto emocí. Aotato Usg regresso aalyss I am redctg atece s lfe after frst hostalzato for COPD. ecevg questos are descrbg status rego of Tábor s Hostal, where the data had bee collected. These equatos are descrbg of two measured arameters ad these equatos are descrbg redctable vews of atet wth ths dsease. - 4 -
OBSAH Úvod... 6 Teoretcký úvod... 7. CHOPN a její léčba... 7.. Defce CHOPN a atologe... 8.. CHOPN stáda a léčba... 9. egresí aalýza... 0.. Úvod do statstky... 0.. Aalýza dvou roměých.....3 Parametry regresí fukce.....4 Nejčastější tyy regresích fukcí... 3..5 Používaé regresí fukce... 3..6 egresí fukce a její kvalta... 4.3 Využtý software a ostu výočtu regresí fukce... 5 Praktcká část... 9. Sběr dat... 9.. Základí soubor dat..... Můj sběr dat... 8. Postu výočtu regresí fukce k BMI... 9.. Počet hostalzací... 30.. Délka hostalzací... 33..3 Celková doba oemocěí... 38..4 Celkové shrutí rovc s BMI... 4.3 Postu výočtu regresí fukce k balíčkorokům... 4.3. Počet hostalzací... 4.3. Délka hostalzací... 45.3.3 Celková doba dožtí aceta... 48.3.4 Shrutí výsledých rovc s očtem balíčkoroků... 5 3 Závěr... 5 4 Sezam oužtých zdrojů... 53 5 Sezam oužtých tabulek... 55 6 Sezam oužtých grafů... 56 7 Sezam oužtých obrázků... 57-5 -
Úvod Cílem mé bakalářské ráce a téma egresí aalýza acetovy rogrese o rví hostalzac s CHOPN je osat omocí regresí aalýzy emoc, která se jmeuje CHOPN. Data, která oužívám, byla získáa v Nemocc Tábor, a.s a Plcím odděleí aalýzou dokumetace. Pomocí regresí aalýzy vytvářím rovce, které modelují vztah mez jasě měřtelým faktory. Cíleě se zaměřuj a aamestcké faktory ovlvňující výskyt choroby u aceta. Sleduj rzkové faktory (kouřeí, obezta a další) které se vyskytují u acetů s CHOPN. Díky tomuto modelu ředvádím, kterým rzkovým faktorům by se měl člověk vyvarovat, aby v říadě tohoto závažého oemocěí, měl co ejdelší sokojeý žvot. Potřebá data jsem získal od Plcího odděleí Nemocce Tábor a.s., které racuje a stud orovávající délku žvota aceta s ejtěžším stádem CHOPN v českém okresím městě a jeho sádové oblast. Je statstcky rokázáo výzamé rodloužeí délky žvota aceta v českých odmíkách vůč zahračím. V rámc zachováí korektost stude eí uvede řesý ty odávaých léčv, je záma ouze účá látka daých léčv, která jsou ředesáa acetům. Dále je ředokládáo, že acet lí okyy doktora a dodržuje dooručeé léčebé okyy a ředsy. Další ředoklady řeším íže v mé bakalářské rác. - 6 -
Teoretcký úvod V teoretckém úvodu vysvětluj termíy uté ro ochoeí mé bakalářské ráce. Teto úvod je rozděle do dvou větších celků, které jsou výzamově sojeé, a mešího celku. V meším celku vysvětluj oužtý software a ostu výočtu regresích fukcí. V rvím celku vymezím lékařské termíy a odmíky souvsející s chorobou CHOPN. Dále vysvětlím základí termíy sojeé s léčbou uté ro ochoeí roblému, zde se sažím o jedoduché vysvětleí, aby byl tet ochotelý ro čteáře ezalého medcíské termologe. V druhé část vysvětlím základí ojmy z regresí aalýzy, které se vztahují k daému roblému a je uté, je oužít ro řešeí roblému. V této část tet síše vysvětluje matematcké termíy uté ro ochoeí tématu a oužté statstcké metody. Tato část se bude týkat vyhodoceí získaý dat a vytvořeých rovc. V osledím meším celku stručě zdůvodňuj oužtí mou vybraého softwaru, který oužívám ř řešeí bakalářské ráce. S tímto vysvětleí osuj také samotý ostu výočtu regresí fukce.. CHOPN a její léčba V této část se zaměřím a vysvětleí medcíské část, vysvětlím základí řízaky emoc a základí zůsoby její léčby. V této část bakalářské ráce vycházím z ublkace Světová stratege dagostky, léčby a revece CHOPN, tato ublkace je ejovějším řekladem Global strategy for dagoss, maagmet ad reveto of chroc obstructve ulmoary dsease 006, kterou vydalo GOLD Global Itatve for Chroc Obstructve Lug Dsease, tato ublkace je dostuá a www.goldcod.com, česká verze je a www.co.cz. Tato ublkace dokoale vysvětluje chorobu a její vzk. CHOPN je zkratka termíu chrocká obstrukčí lcí emoc, ebo také [] COPD - Chroc Obstructve Pulmoary Dsease, teto zdroj vysvětluje ázev emoc. Choroba atří mez ejzávažější emoc, je 4. ejčastější říča úmrtí ldí a světě odle WHO [], kdy umírá ročě 3, mlou ldí, což je 5, % všech úmrtí. Podle WHO se očet acetů trící touto chorobou eustále zvyšuje a během 0 až 0 let se očekává, že se dostae a 3. místo mez říčam úmrtí a světě. Tyto výsledky řadí CHOPN mez ejzávažější choroby, kterým může člověk trět. Tabulka uvedeá íže ukazuje úmrtost ldí a světě, tato tabulka je řevzata a grafcky uravea z webu WHO []. CHOPN se řadí mez ejzávažější emoc, jako jsou aříklad emoc srdce, mozku. - 7 -
World Deaths mllos % of deaths Coroary heart dsease 7.0. Stroke ad other cerebrovascular dseases 5.7 9.7 Lower resratory fectos 4.8 7. Chroc obstructve ulmoary dsease 3. 5. Darrhoeal dseases.6 3.7 Tabulka Nejzávažější choroby odle WHO CHOPN sdružuje dříve zámé emoc jako je záět růdušek a rozedma lc, které byly dříve osováy jako rozdílé emoc, v deší době se lékařská termologe sjedotla. V této část bakalářské ráce vycházím z ublkace Světová stratege dagostky, léčby a revece CHOPN... Defce CHOPN a atologe Defcí emoc můžeme ajít v lteratuře ěkolk, vybírám jedoduší a srozumtelou defc, která stačí ro základí ochoeí emoc jako celku. CHOPN je léčbou ovlvtelý chorobý stav charakterzovaý chrockým efekčím záětem růdušky a růdušce vedoucí k chrockému omezeí růtoku vzduchu v dolích dýchacích cestách, které eí lě reverzblí o adekvátí léčbě. K vysvětleí ojmů, které mohou být čteářem ejedozačě chááy, oužívám lékařského slovíku, te je ole. Následující termíy volě vysvětluj odle [3]. chrocký vleklý, chrocká oemocěí robíhají méě rudce ež akutí, jejch řízaky jsou řítomé trvalé, ěkdy může astat trvalé vymzeí řízaků, jdy může dojít ke zhoršeí stavu efekčí eřeosé mez acety Vdechováím škodlvých látek vzká u vímavých jedců CHOPN. Mez škodlvy očítáme zečštěý vzduch a hlavě látky vdechovaé ř kouřeí. Chorobě se dá ředcházet, zásadím roblémem ř jejím vzku je kouřeí a zečstěé žvotí rostředí. Nemoc se rojevuje sížeím tělesé zdatost, kašlem, vykašláváím hleu a dušostí. Tyto symtomy jsou zůsobey oškozeím lc, které je zůsobeo chrockým záěty v oblast růdušek, růdušc a hlavě v erferích oblastech lc. Tyto záěty zůsobují změy ve struktuře tkáě lc. Záěty zůsobují sížeí rychlost rouděí vzduchu v dýchacích cestách. Záěty osthují také lcí sklíky, kde dochází k výměám lyů, jedak záěty oškozují schoost absorce a také oškozují kalárí cévy vedoucí k lcím sklíkům. Poškozeí těchto drobých cév může vést až k lcí hyertez, kterou se v tetu ezabývám, jedá se o další závažou chorobu. Dušostí myslíme adměré zadýcháváí se aceta ř tělesé zátěž, v koečých - 8 -
stádích choroby v kldu... CHOPN stáda a léčba Průběh emoc je u každého člověka rozdílý, ale obecě můžeme ředokládat, že robíhá ve čtyřech fázích. Každý acet emusí rojít všem stu, může dojít k řeskočeí ěkterých stádí. Jedotlvá stáda jsou vysvětlea v tabulce, která je řesáa z [4], tyto arametry jsou zvoley a základě srometrckého (srometre metoda určeá k vyšetřeí dechových fukcí lc) vyšetřeí aceta. Hodota FEV uvádí uslový výdech za s, FVC je uslová vtálí kaacta. Chrocké resračí selháí zameá, že arcálí tlak kyslíku v teě je méě ež 8,0 kpa ř dýcháí vzduchu za tlaku ř hladě moře. Stádum I: Lehké FEV /FVC < 0,70 FEV 80%.h. Stádum II: Středě těžké FEV /FVC < 0,70 50% FEV < 80%.h. Stádum III: Těžké FEV /FVC < 0,70 30% FEV < 50%.h. Stádum IV: Velm těžké FEV /FVC < 0,70 FEV < 30%.h., ebo FEV < 50%.h. + chrocké resračí selháí Tabulka Tyy tíže CHOPN V mé bakalářské rác řeším stavy acetů ve Stádu II, III a IV, kdy žvot acetů je jž velm eohodlý a dokoce emoc výrazě omezuje acety v jejch ormálím žvotě, aříklad ejsou scho vykoávat svoje ovoláí, ejsou scho žádé áročější fyzcké aktvty. V tomto stádum emoc je utá hostalzace aceta a lůžkovém odděleí v emocc, hostalzace astává obvykle vícekrát do roka (hostalzace stav kdy je uté, aby acet ležel v emocc od odborým lékařským dohledem). Tato choroba osthuje stále větší možství oulace, kouří eustále velké možství ldí. Podle [5] kouří v Č více ež 30 rocet mužů a více ež 0 rocet že. Jedá se o celosolečesky velm závažé oemocěí, rotože léčba ředevším vyšších stadí je esmírě drahá a acety zároveň valdzuje, takže ejsou scho výdělečé čost. - 9 -
. egresí aalýza Cílem regresí aalýzy je určeí vztahů mez statstckým zaky. Statstcké závslost vychází ze statstckých údajů. Statstcký soubor o ozorováích se získává obvykle ěkolka zůsoby ozorováí. Pozorujeme statstcké jedotky za evě vymezeých odmíek rostorových a časových. Údaje se získávají ozorováím jedotek v časových tervalech ebo okamžcích. Díky těmto -ásobým ozorováím určtého děje získáme statstcký soubor. Cílem regresí aalýzy je tedy vytvořeí dealzovaé matematcké fukce, která osuje vztahy mez jedotlvým statstckým zaky. Tato dealzovaá fukce se azývá regresí fukcí. Přesě tedy [6] Cílem regresí aalýzy je co ejleší řblížeí emrcké (vyočítaé) regresí fukce k hyotetcké regresí fukc. Tedy ze souboru vybraých dat vytváříme model, který vytváří růběh hodot v závslost a měřeí. Co je tedy říosem regresí aalýzy? egresí fukce ám umoží odhadout růměré hodoty roměé. Př odhadu oužíváme hodoty z tervalu měřeí tedy terolace. Hodoty mmo terval měřeí se oužívají k etraolačímu odhadu, tyto etraolačí odhady jsou eřesé... Úvod do statstky Pro otřeby mé ráce uvádím řehled základích statstckých termíů. Tyto termíy jsou základí a ro jejch leší ochoeí je vhodé zalstovat v kze Statstka ro ekoomy od rof. charda Hdlse [6]. Z té khy jsem čeral v ásledujících částech své ráce. Základím ojmem je statstcký soubor. Statstcký soubor je moža jedotek u které zkoumáme statstcké zaky. U souboru můžeme zkoumat jede a více statstckých zaků, každý zak má svojí kvaltu. Základí soubor je soubor všech jedotek, a kterých rovádíme měřeí. Pokud rovádíme výběr ze základího, získáme výběrový soubor. Výsledkem měřeí získáváme možství dat, která jsou eřehledá. Proto musíme jedotlvé aměřeé hodoty roztřídt. Tříděím získáme soubory dat, ze kterých vykou secfcké zaky, které otřebujeme k dalšímu zracováí. Pro statstcké soubory hledáme určté formace, které jedoduše shrují daý soubor. Středí hodoty všech statstckých souborů se azývají růměry. Základím růměrem je artmetcký růměr, ozačíme. Z hodot,,,, kde je očet ozorováí. - 0 -
= = Průměr shruje ouze středí hodoty. Nezáme okolí středí hodoty, roto hledáme míry varablty souboru. oztyl je míra, která měří varabltu hodot kolem růměru a varabltu odchylek jedotlvých zaků. oztyl začíme s = = ( ) Varablta se může sočítat také omocí směrodaté odchylky, která je odmocou z roztylu. s = s = = ( ) Tyto základí ojmy využívám dále ve své rác... Aalýza dvou roměých Př regresí aalýze vycházíme z aalýzy roměých, vždy volíme jedu ezávslou roměou a k í závslou roměou. Tedy ro ezávslou roměou oužjeme a ro závslou roměou y. Proto edůležtějším a také ejobtížějším krokem regresí aalýzy je staoveí regresí fukce, tedy vztahu mez roměým v matematcké odobě. Základím tyem staoveí regresí fukce je grafcká metoda, kdy závslost roměých je zobrazea bodovým grafem. Teto bodový graf vytváříme a stadardí Kartézské souřadc. Každá dvojce ozorováí tvoří jede bod v grafu. Z tohoto grafckého výstuu odhadujeme vhodou odobu regresí fukce římku, arabolu, eoecelu...3 Parametry regresí fukce ozlšujeme mez dvěma základím regresím fukcem teoretckou a emrckou regresí fukcí. Teoretcká, ebo také hyotetcká, regresí fukce je eozorovatelá a také eměřtelá. Teoretcké regresí fukce edosáheme žádým řesým výočty. Emrcká, také výběrová, regresí fukce je výočtem z emrckých údajů. Je tedy růměrem z aměřeých hodot, který se má co ejvíce řblížt teoretcké regresí fukc. Teoretckou regresí fukc ovažujeme za model, který vysvětluje růběh roměé y v závslost a. Emrcká fukce, azveme y, je odhadem modelu teoretckou regresí fukc azveme η, který se lší o eatrý rozdíl azveme ε. Pak - - s.
tedy latí: y= η + ε Kde ozačují -té hodoty vysvětlovaých roměých ebo fukcí. ε má fukc áhodé velčy, která vyvažuje celý model. Tedy ε ezkresluje hodoty y a středí hodota ε je ulová. Ozačujeme arametry regresí fukce β 0, β,, β, ak f ( η= ; β 0; β ;... β) A tedy emrckou regresí fukc s odhadutým arametry b 0,b,, b ak je emrcká regresí fukce ve tvaru: Y = f ( ; b0, b,..., b) Y vyjadřuje -tou hodotu emrcké regresí fukce a je odhadem teoretcké hodoty η odovídající. Postu tvorby regresí fukce A) Navržeí obecých tyů regresích fukcí, které řadají v úvahu B) Odhadutí arametrů teoretcké regresí fukce a z í získáme emrckou regresí fukc C) Posouzeí odhadu se skutečým y vůč Y D) V říadě esokojeost s C) avrhout alteratvy k regresí fukc Předokládám zvoleý ty regresí fukce η a odhaduj kokrétí tvar Y. Naříklad ty fukce Y jako leárí fukc, tedy odhaduj ouze ty fukce. Odhaduj ouze arametry regresí fukce a odhaduj ekoečě moho fukcí. Účelem aalýzy je alezeí, co ejvhodější fukce z tohoto ekoeča fukcí. Proto vytvářím odmíku o ε rové ule, tedy: = ( y Y) = = e = 0 Kde e je rezduum odhad hodoty áhodé složky ε. Tato odmíka eomezuje dostatečě řešeí, fukcí je stále ekoečě moho. Proto kladu odmíku a omezeí součtu čtverců chyb ε byl mmálí. Q= e y = = = ( η ) m Tato metoda se zámá jako metoda ejmeších čtverců. - -
- 3 -..4 Nejčastější tyy regresích fukcí Nejčastější fukce jsou leárí z hledska arametrů, zasují se ve tvaru: ) (... ) ( 0 f f β β β η + + + = Kde β 0, β,, β jsou ezámé arametry a f,f,,f jsou zámé arametry fukce ezávslé roměé. Př oužtí metody ejmeších čtverců uvažuj fukc ve tvaru: Nechť b j jsou odhady arametrů βj, ak rovce je mmálí rávě tehdy, když všechy rví arcálí dervace odle βj jsou rovy ule. Tím vzká soustava rovc, které se azývají ormálové. V té soustavě ahrazuj βj za odhady b j, kde j =,,, = = f b f b b y 0 0 ) )}( (... ) ( { = = f f b f b b y 0 0 )} ( )}{ (... ) ( { = = f f b f b b y 0 0 )} ( )}{ (... ) ( { Uraveím rovc získáme tyto tvary rovc v ormálím tvaru. = = = = + + + + = f b f b f b b y 0 ) (... ) ( ) ( = = = = = + + + + = f f b f f b f b f b y f 0 ) ( ) (... ) ( ) ( )] ( [ ) ( ) ( = = + = f b y f 0 ) ( ) ( + + =... ) ( ) ( f f b = f b )] ( [ Tímto řešeím je možé získat obecé tvary regresích fukcí...5 Používaé regresí fukce Pro běžé oužtí se využívají ásledující regresí fukce. Tyto fukce dostaeme o dosazeí do tvaru: ) (... ) ( 0 f f β β β η + + + = Ozačeí jako tvar A Př dosazeí za f () = do tvaru A
η = β 0+ β Jedá se o římkovou regres. Př dosazeí za f () =, f () = do tvaru A 0+ β β η = β + Jedá se o arabolckou regres. Př obecém dosazeí tvaru za f () =, f () =,, f () = η = β 0 + β + β +... + β Jedá se o olyomckou regres -tého stuě. Př dosazeí za f () = - β η = β 0+ Jedá se o hyerbolckou regres rvího stuě. Př dosazeí za f () = log η = β 0+ β log Jedá se o logartmckou regres. Všechy dosavadí fukce jsou leárí z hledska arametrů. Pro otřebu této ráce uvádím fukc, která eí leárí v arametrech. Touto fukcí je eoecálí regresí fukce. η= β β β f ( ) f ( ) 0... Př dosazeí za f () = η= β 0β β f( ) Jedá se o eoecálí regres. Výčet těchto fukcí je dostatečí ro moj rác. Můžeme alézt další možé regresí fukce, ale jejch oužtí eí reálé ro říady řešeé íže...6 egresí fukce a její kvalta Úkolem regresí aalýzy je určeí regresí fukce a oté také její kvalty. egresí fukce je kvaltí, když jsou aměřeá data v její těsé blízkost. Naoak jestl jsou aměřeá data vzdáleá od odhaduté regresí fukce, ak je její kvalta mzvá. Proto volíme ásledující ukazatele jako míry kvalty fukce: roztyl emrckých hodot, teoretcký roztyl a rezduálí roztyl. V této katole jsem čeral kromě [6] a také [7]. oztyl emrckých hodot y, tedy roztyl aměřeých hodot: s y = ( y y) Teoretcký roztyl Y, - 4 -
s Y = ( Y y) ezduálí roztyl s ( y Y ) = ( y Y y Y ) = ( y Y) Víme, že vztah: s y = s + s ( y Y ) Y y = Y a roto Y y=. Díky metodě ejmeších čtverců latí ásledující oztyl emrckých hodot je součtem roztylu vyrovaých hodot a roztylu rezduálích hodot. Kdyby byla římá fukčí závslost mez roměým, y, astala by zvláští stuace. oztyl emrckých hodot by se roval roztylu vyrovaých hodot. Tím můžeme uvažovat s = 0 a vzorec získává odobu = ( y Y ) Kdyby byla úlá ezávslost hodot ro, y ak by roztyl rezduálích hodot byl ulový a latlo by s y = s( y Y ) Z těchto dvou tvrzeí vylývá tzv. de determace. Ide determace je oměr mez teoretckým roztylem a eckým roztylem. s y s Y I = y s s Y y Př hodotě ůjde o fukčí závslost a odhad regresí fukce se mamálě odařl. Čím více se bude de blížt 0, tím více jde o ekvaltí odhad regresí fukce. Pro vybráí vhodých arametrů regresí fukce vybírám uraveý de determace, který také abývá mamálí hodoty : = ( ) Kdy je očet měřeí, je očet arametrů, je de determace. je vhodý ro rozhodutí ř volbě očtu arametrů. římkou a arabolou. Př rozhodováí rozhoduje výše vyšší. Proto vždy vybírám fukc s ejvyšším řeší aříklad roblém rozhodutí mez - 5 -, čím je vyšší tím je těsost. Teto de je ctová z [8] V této část mé ráce jsem vysvětll uté termíy z oblast statstky ro bakalářskou rác..3 Využtý software a ostu výočtu regresí fukce V této část vysvětlím, jaký software oužívám a a říkladech vysvětlím ostu
výočtu regresí fukce. Pro moj bakalářskou rác otřebuj základí software a rováděí výočtů. Používám Mcrosoft Ecel 003, z důvodu mé zalost tohoto softwaru. Teto software jsem oužíval v rámc mého bakalářského studa během výuky statstky a dalších ředmětů. Pro zracováí tématu je vhodým ástrojem, umožňuje řehledou tvorbu regresích rovc. Software vytváří grafy z aměřeých hodot a je vhodým ástrojem ro řešeí regresí aalýzy. Jako zdroje v této katole oužívám formačí ortál Mcrosoftu [8] a základí učebc v ecelu [9]. Ve své rác oužívám MS Ecel ke tvorbě regresí fukcí a deů determace. Po suštěí MS Ecel a volý lst vložíme aměřeá data. Jako říklad uvádím tvorbu regresí rovce, kdy Body mass de (BMI) tvoří ezávslou roměou a závslá roměá y je očet hostalzací. Ozačíme vstuí data a z abídky vybíráme možost Vložt a dále Graf. Z abídutých grafů vybíráme bodový graf, který je vhodý ro výočet regresí fukce. Obrázek Vložeí grafu Na obrázku vdíme modře orámovaou oblast zdroje dat. Slouec BMI tvoří datový odklad ro osu. Druhý slouec je zakrytý abídkou Vložt s výběrem Graf, v tomto slouc jsou hodoty očtu hostalzací, které jsou odkladem osy y. Po získáí bodového grafu, klkeme levým tlačítkem myš a jede bod, tím se ám - 6 -
ozačí všechy body. Pak tlačítkem ravé klkeme do grafu. Z ásledující abídky vybereme možost Přdat sojc tredu. Ukázáo a ásledujícím obrázku. Obrázek Přdáí sojce tredu Po klkutí a Přdat sojc tredu se ám objeví ová abídka. V abídce Ty vybíráme tvar regresí fukce, odle ašeho odhadu. V další abídce Možost zatrheme Zobrazt rovc regrese a Zobrazt hodotu solehlvost. Vše otvrdíme tlačítkem Ok. Vzklý graf zobrazuje sojc tredu. Obrázek 3 Zobrazeí rovce regrese a solehlvost Po otvrzeí této abídky získáme graf, kde je zázorěa křvka. Tato křvka je sojcí tredu ro daá data. Tato sojce tredu a tvar fukčího ředsu, který je - 7 -
regresí fukcí. 7 6 y = 0,069 + 0,668 = 0,08 5 4 3 0 5,00 0,00 5,00 30,00 35,00 Graf Příklad grafu Díky Zobrazeí regresí rovce se zobrazuje rovce ve tvaru y =, která je regresí rovcí ro zadaá data. Zatržeím Zobrazt hodotu solehlvost získáváme hodotu solehlvost, která je rová deu determace, zde ve tvaru =. Následě musíme z možých rovc vybrat srávou regresí fukc. U vybraých rovc s zjstíme de determace. Z deu determace sočítáme odle vzorce úlý de determace. Fukce s mamálím úlým deem determace je aší hledaou fukcí. - 8 -
Praktcká část Cílem mé bakalářské ráce je osat omocí metody regresí aalýzy emoc, která se odborě azývá CHOPN. Data, která oužívám, jsem získal v Nemocc Tábor, a.s a Plcím odděleí. Výsledkem mé ráce je výočet regresích rovc, které ukazují vlv faktorů a délku oemocěí. Příklad faktoru je kouřeí vůč době hostalzace aceta, výsledá rovce osuje vztah mez kouřeím a očtem dí, které strávl acet v emocc. Moje bakalářská ráce je tyem emrcké, která se zabývá statstckou aalýzou emoc CHOPN. Práce zkoumá faktory ovlvňující délku acetova žvota. Nesaží se detalí rozbor daé emoc, ale ukazuje, které faktory mají výzamý vlv a které kolv.. Sběr dat Data ro mojí rác jsem získal od Plcího odděleí Nemocce Tábor. Získaá data byla jedoduše zracovaá jako soubor v MS Ecelu. Tyto data byla získáa ro rojekt, který se zabývá srováím délky žvota aceta s CHOPN v českých odmíkách orot léčbě v zahračí. Data obsahovala údaje o 85 acetech a jejch zůsobech léčby. Z těchto acetů je větša žvá, ěkteří zemřel a já oemocěí a ěkteří a CHOPN a jeho důsledky. Data byla sebráa v období od roku 004 do roku 009. Získaá data byla obsáhlejší a řešla jý roblém sojeý s délkou žvota aceta týkající se rzka úmrtí acetů. Moje bakalářská ráce řeší, jaké faktory ovlvňují délku acetova žvota. ozhodl jsem se data uravt a zjedodušt ro oužtí v této rác. V této část vysvětlím, jaká data mám k dsozc a jaká oužívám. Jak jsou data dělea. Základem jsou data demografcká jaké acety léčíme, tedy věk, ohlaví. Aamestcká data jaké důvody mohl vést k acetově emoc (aaméza ředchorobí, lékař se dotazuje aceta a stavy řed chorobou, které mohl vést k oemocěí). Srometrcká vyšetřeí se týkají hodot vetlace, tedy měřeí objemů a rychlost rouděí vzduchu u aceta. V dalších jsou uvedeé hodoty týkající se krevího tlaku a saturace acetovy krve kyslíkem. Mortaltí data uvádí údaje o úmrtí aceta. Přesé vysvětleí měřeých dat je v ásledující tabulce. - 9 -
Demogratcká data číslo ac. Udává číslo aceta v rámc stude datum ar. je ve tvaru DD.MM. Pohlaví Pro muže je zvoleo, ro žey 0 fekčí AE tíže cho Secfkace AE Uvádí stueň tíže emoc. Aamestcká data Kuřák Pro Ao, e 0 sto kuřák Pro Ao, e 0 ekouří jž. Počet let kolk acet ekouří Balíčkoroky Vysvětluj íže v tetu Nekuřák Pro Ao, e 0 rofesoálí halace Pro Ao, e 0 bydlště město Pro Ao, e 0 bydlště vekov Pro Ao, e 0 BMI Ide určující jestl má acet deálí hmotost Mortaltí data datum smrt Datum úmrtí aceta. úmrtí ř.hos. Pro Ao, e 0 úmrtí ř dalších hos. Pro Ao, e 0 úmrtí doma Pro Ao, e 0 říča smrt Udává římou říču úmrtí ke 3.XII 09 dosud žje Pro Ao, e 0 Icály Icály acetů Výška Uvedeá v metrech Váha Uvedeá v klogramech Tabulka Tyů dat Některá data jsou ro moj rác adbytečá, rotože mě zajímají hlavě údaje, které mohly vést ke vzku choroby. Údaje, které byly sebráy během léčby, ejsou ro me odstaté. Proto aříklad eoužívám data obsahující řesé údaje o stavu tlaku kyslíku v acetově krv, rotože se jedá o údaje sledovaé během emoc. Další adbytečé údaje se většou týkají rogrese choroby a jsou ro rác evýzamá. Podstaté údaje jako jsou aříklad údaje o kouřeí acetů, jak moc acet kouřl, toto bylo řevedeo a balíčkoroky, jestl stále ještě kouří, ebo jestl byl asvím kuřákem, jestl měl áročé zaměstáí z hledska vdechováí ebezečých látek. Následují hodoty, jestl acet bydlí a vekově, ebo ve městě. Tato data jsem řevzal, mojí rací bylo dolt údaje o jedotlvých hostalzacích a o tom budu sát íže. Za základí soubor dat, který obsahoval 85 acetů, jsem s vybral 9 acetů, kteří rokazatelě zemřel a slňoval moje ožadavky, které jsem s zvoll. Jsou to tato omezeí: A) Předokládám stejé zalost lékařů, který léčl aceta, tedy acet byl léče stejým rostředky a bez jakýchkolv rozdílů. - 0 -
ozdíly v léčbě aceta byly zůsobey je jeho stavem a e vějším odmíkam. Toto omezeí bylo důležté z hledska ředokladu, že každý acet dostává stejou úroveň éče. B) Pacet ukočl léčbu a stejém racovšt, jako jí začal. Nedocházelo ke změě racovšť, kde se jeho léčba odehrávala. Tímto omezeím jsem omezl acety, kteří byl léče s CHOPN mmo racovště, ze kterých mám data. Hlavím důvodem tedy bylo, že emám řístu k datům, která dolňuj v rámc své ráce. A dalším eslěí bodu A. C) Dalším omezeím je, že acet zemřel rokazatelě a CHOPN ebo jeho římé důsledky. Tímto omezeím jsem omezl další acety, kteří trěl dalším závažým oemocěím a a tato oemocěí zemřel. Toto omezeí omezlo skuu acetů ejvíce... Základí soubor dat Za základí soubor ovažuj data, která jsem omezl defovaým odmíkam. Získaá data jsem s rozděll do ěkolka tabulek, zvoleé rozděleí je síše ro řehledost, když tvoří logcké celky. Proto data o 9 acetech uvádím v ásledujících tabulkách: A) Tabulka demografe a aamézy Tato tabulka uvádí řehled hodot, které byly získáy dotazováím aceta, a roto je uté ř jejch osuzováí brát vždy možost, že acet lže. Důvodem je, že se za sebe stydí ebo má jé důvody eříkat ravdu ebo také acet může evědomě lhát. Pacet ouze uvádí svůj odhad reálého stavu věcí a to hlavě očtu balíčkoroků a očtu let kdy ekouří. B) Tabulka srometrcký výsledků a dalších výsledků Tato tabulka uvádí řesě změřeá data, jsou výsledkem měřeí řístrojů. Tato data jsou ro moj rác evýzamá. C) Tabulka mortaltí dat Tato data jsou oět relevatí, jde o statstcká data v o úmrtí acetů. Tato data jsou řesá s mmálí chybovostí. Proto shrutí těchto tří bodů. Jasě lye, že data C jsou řesá. Ale data A mají jstou edefovatelou eřesost. Dále, ale ve své rác ovažuj data za řesá, rotože ovažuj odle [6] Svojí odstatou je ε áhodou velčou. Je výhodé ředokládat, že chyba ε ezkresluje hodoty y systematckým zůsobem, ebol že její středí hodota je ulová. Tedy ovažuj data A za srává, rotože ěkteří acet uvádí žší údaje a aoak jí vyšší. Tedy chyba eí systémová, ale týká se ouze jedců. A - -
roto ovažuj jejch středí hodotu lhaí za ulovou. A) Tabulka demografe a aamézy V této tabulce uvádím základí data o každém acetov z ohledu demografe a aamézy. Z 9 acetů s CHOPN je mužů a 7 že, odovídá 75,8 % zastoueí mužů ve zkoumaém souboru. Myslím s, že část tabulky ohlaví eí otřeba dále vysvětlovat. ok arozeí, zde euvádím kvůl řehledost, je ro ředstavu jak starý byl acet ř rví hostalzac. Dále euvádím, kdy řesě acet byl orvé hostalzová. Proto to uvádím slově. Pacet byl orvé hostalzová v roce 004, acet 3 byl v roce 005 (tedy 0 acetů) a acet 3 9 byl v roce 006 (tedy 7 acetů). Dále koho cháeme jako kuřáka. Z hledska mého vzorku jde o člověka, který dlouhodobě deě kouří větší možství cgaret. Takto to cháou lékař, kteří sbíral data. A toto byla jejch odověď a to kdo je kuřák, tedy ejde o subjektví hodoceí acetů. Zde eí roblém se statstckou chybou, rotože ldé se většou estydí za svůj ávyk a řzají ho lékař bez roblémů. Ve vzorku acetů bylo 4 kuřáků, to je 8,8 %, a 5 acetů byl ekuřác. Z těchto 9 ldí je mužů z ch jsou ekuřác, tedy 90,9% mužů s CHOPN z ašeho souboru kouřlo. Ze 7 že jsou 3 ekuřačky, jde o 57,% že ze vzorku. V dalším slouečku jsou ldé, kteří řestal dlouhodobě kouřt, tvrdí, že teto ávyk emají, teto údaj je uvede v letech. Ve vzorku máme tedy ldí, kteří řestal kouřt řed rví hostalzací s CHOPN. Ale toto číslo je výrazě zkresleé, rotože lékař berou člověka jako ekuřáka až o 6 měsících kdy ekouří, a roto acet s číslem 0 a 3 se těžko mohou ovažovat za ekuřáky, acet uvedl, že ekouří 0,5 roku. Pacet číslo 3 uvedl, že ekouří 0, roku, toto je časová doba, která byla řečea acety. Pacet 3 řestal kouřt de facto řed říchodem do emocce. Můžu se dohadovat, že teto acet ocítl závažé zhoršeí svého stavu, a roto to ejdříve řešl omezeím kouřeí a až o té vyhledal odborou omoc. Podle těchto důvodů ovažuj tyto dva acety stále jako kuřáky. Jejch časový horzot, kdy ekouří je velm malý, ro lékaře eslňují dobu kdy už ejsou kuřáky. Ostatí acet ekouří jž dlouhodobě, ěkteří déle jak 0 let. A roto z těchto hodot evyvozuj žádé závěry, rotože acet tyto roky uvádějí jako svoje tvrzeí. Nevědí řesě, kdy řestal kouřt, ale už dlouho ekouří, kokrétě acet,, 3, 9. Následující odstavec volě ctuj z []. Balíčkoroky je jedotka sloužící k určeí tezty kouřeí aceta. Jede balíčkorok zameá, že acet kouřl o celý rok jede balíček cgaret deě. V jedom balíčku očítáme 0 cgaret. Tedy jede - -
balíčkorok se rová řblžě 7300 cgaretám za rok. Pokud tedy acet vykouří 40 cgaret deě, tedy 4 600 cgaret za rok, očítáme, že acet má balíčkoroky. Sloucem ekuřák jsem se zabýval výše, ale slouec rofese ještě ebyl lě vysvětle. V tomto slouc se uvádí, jestl byl/je acet vystavová, během své racoví doby, halac (halace - vdechováí) ežádoucích látek. Teto slouec je velm řesý, rotože ldé ve své rác emají důvod lhát. Lékař dokáže a základě svých zkušeostí osoudt ebezečost acetova ovoláí, aříklad rzkem může být ráce v zakouřeém rostředí - v restaurac, ebo ve velm rašém rostředí oblá sla. Z mého vzorku bylo 7 acetů vystaveo těmto ebezečějším racovím odmíkám, ze 7 těchto ldí byl ekuřác (acet 7 a 8). V dalších sloucích máme oložky město a vekov, tyto dvě hodoty se avzájem vylučují, řesá hrace mez městem a vekovem defováa eí, ale hodota bývá odvozea od místa acetova bydlště, kdy lékař a základě místí zalost rozhodl, jestl jde o vekov ebo město. Tyto hodoty jsou řesé, acet uvádí své bydlště lékař a emá důvod ho účelě mět. V odstatě jde o orováí, jestl acet žje v čstém žvotím rostředí ebo ve zečštěém. Vekov se zde ovažuje jako leší ež město, ve městě ldé obvykle halují více zečštěý vzduch ež a vekově. V mém vzorku bylo 6 ldí z vekova a 3 z města, 79,3 % ldí ze vzorku žlo ve horším žvotím rostředí ež zbývajících 0,7%. Posledím sloucem této tabulky je BMI. Teto de je vysvětle ásledující ctací: Body mass de je hodota vyočteá odle vzorce: váha v kg děleá výškou v metrech a druhou.[] V mé rác se teto BMI se vyočte v době, kdy acet řšel a rví hostalzac, jde o jede z lékařských ukazatelů, který uvádí kategor aceta z oblast výžvy. Hodoty ro ormu byl v této stud ovažováy jako rozmezí mez čísly 9 a 5. Méě ež 9 je odváha, více jak 5 je adváha. Průměrá hodota z mého vzorku acetů je 4,86. Zde rozdělím acety do tří sku odle úrově BMI,. ldé s odváhou,. s ormálím stavem a 3. skua ldí s adváhou. - 3 -
Demogratcká data ohlav číslo ac. í kuřá k sto ekouř í Aamestcká data ekuřá rofes balíčkoroky k e - 4 - měst o veko v 0 0 45 0 0 0 0 45 0 0 0 3 0 0 9 0 0 0 4 0 0 0 30 0 0 5 0 0 0 0 0 0 6 0 0 60 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 9 3 50 0 0 0 0.5 4 0 0 0 4 70 0 0 0 0 0 5 0 0 0 3 30 0 0 0 0 4 0 7 35 0 0 0 5 0 0 60 0 0 0 6 0 0 00 0 0 0 7 0 0 0 0 0 0 0 8 8 40 0 0 9 0 0 35 0 0 0 0 0 80 0 0 0 3 40 0 0 0 0 0 0 0 0 0 3 0, 60 0 0 0 4 0 0 60 0 0 0 5 0 0 0 0 0 6 0 0 45 0 0 0 7 0 0 0 0 0 0 BMI 30,3 9 7,4 4 4,8 4 5,5 3,3 7 5,3 9 6,3 6 4,6 9 7,7 8 4,6 9 3,5 7 9,4 5,0 6 3,8 3 4,3 6,8 6 3,7 9 33, 4,4 7 5,9 9 30,8 0, 5 3,6 5 8,9 3 9,0 3 7,7 3,