Logistic regression a tool for discrimination in surgery

Rozměr: px
Začít zobrazení ze stránky:

Download "Logistic regression a tool for discrimination in surgery"

Transkript

1 VŠB Techcká uverzta Ostrava Fakulta elektrotechky a formatky Katedra aplkovaé matematky Logstcká regrese jako ástroj pro dskrmac v lékařských aplkacích Logstc regresso a tool for dscrmato surgery 9 Pavlía Kuráňová

2 Prohlašuj, že jsem tuto dplomovou prác vypracovala samostatě. Uvedla jsem všechy lterárí pramey a publkace, ze kterých jsem čerpala. V Ostravě de 7. květa 9

3 Na tomto místě bych ráda poděkovala za ceé rady, užtečé formace a příkladé vedeí př tvorbě dplomové práce svému vedoucímu doc.ig. Radmu Brš, Csc. a své rodě a blízkým za trpělvost, kterou se mou během této doby měl.

4 Abstrakt Práce se vestgatvě zabývá aalýzou lékařských dat pocházejících z chrurgckých zákroků kolorekta z let -6. Tato data byla ejdříve trasformováa do podoby operačích faktorů a fysologckých faktorů a posléze použta pro účely geerace logstckého regresího modelu, který byl verfková stadardím statstckým, jakož doplňkovým referečím verfkačím techkam. Jako doplňková verfkačí techka byla použta expoecálí aalýza s vylepšeím, která byla zalgortmzováa. Získaé logstcké regresí modely byly kofrotováy s dodaým referečím modelem. Nalezeé logstcké regresí modely jsou posléze využty pro účely dskrmačí aalýzy, která spočívá v možost zařazeí paceta s ezámou příslušostí do jedé ze dvou skup podle operačích komplkací. Na vzorku dodaých dat je provedea progóza operačích komplkací s vyhodoceím chyby správost zařazeí. Nalezeý postup pro toto zařazováí pacetů včetě vyhodoceí chyb je algortmcky zpracová v prostředí MATLAB. Klíčová slova: dskrmačí aalýza, logstcká regrese, morbdta, lékařská data, expoecálí aalýza, metoda maxmálí věrohodost. Abstract Ths thess s vestgatvly egaged aalyss of medcal data dervable from surgcal terveto colectomy years 6. These data was frst trasformed to form of surgcal factors ad physologcal factors ad fally these data was used for geerato of logstc regresso model purposes that was verfed by stadard statstcal by way of supplemetary referece verfcatos techque. As a supplemetary verfcatos techque was used a expoetal aalyses mprovemet, whch were algorthmzed. Obtaed logstc regressve models were cofroted by suppled referetal model. Foud logstcs regressve models are fally utlzed for dscrmatg aalyss purposes that cosst possblty of ukow pertece of patet whch s formate to oe of two groups accordg to surgcal complcatos. I the sample of delvered data s performed progoss of surgcal complcatos wth errors evaluato of formattg correctess. The process foud for ths patet formattg cludg mstake evaluato s algorthmc processed MATLAB. Keywords: dscrmatg aalyss, logstcs regresso, morbdty, medcal data, expoetal aalyss, maxmum lkelhood estmators.

5 Sezam použtých zkratek a symbolů F POSSUM PS OS - fsherovo dskrmačí krtérum - Physologcal ad Operatve Severy for eumerato of Mortalty ad Morbdty - fysologcké skóre - operačí skóre S ( X) - regresí fukce l Σ χ - přrozeý logartmus - kovaračí matce - chí-kvadrát L θ - parcálí dervace L podle parametru θ

6 OBSAH Obsah Úvod 4 Skórovací systémy a aalýza dat 5. Skórovací systémy. 5. POSSSUM Aalýza dodaých chrurgckých dat. 7 3 Dskrmačí aalýza Kaocká dskrmačí aalýza 8 3. Dskrmačí fukce, dskrmace mez dvěma skupam. 9 4 Logstcká regrese 4. Statstcké rozhodovací fukce 4. Logstcká regrese Logstcká regrese jako ástroj pro dskrmac Metoda maxmálí věrohodost Vícerozměrá metoda maxmálí věrohodost Metoda maxmálí věrohodost pro logstckou regres 6 5 Testováí modelů 8 5. Testováí hypotéz Čstý test výzamost Alteratví hypotézy Staoveí testové statstky Pearsoův χ test dobré shody Pearsoůvχ test pro logstckou regres 6 Geerováí ového modelu 4 6. Logstcké rovce modelů Testováí vytvořeých logstckých rovc 7 7 Algortmcké zpracováí ových regresích modelů 3 7. Využtí modelů pro predkc morbdty Expoecálí aalýza a její modfkace Expoecálí aalýza Vylepšeá expoecálí aalýza Aplkace expoecálí a vylepšeé expoecálí aalýzy Závěr 39 Sezam použté lteratury 4 Sezam příloh. 4

7 SEZNAM OBRÁZKŮ Sezam obrázků Obr. : Rozhodovací oblast dle P 9 Obr. : Zázorěí datového souboru (-6).. 5 Obr. 3: Výsledý model (-6)... 6 Obr. 4: Grafcké zázorěí zařazeí pacetů ze všech dat (364).. 3 Obr. 5: Grafcké zázorěí zařazeí pacetů z roku 6 (36). 3 Obr. 6: Zázorěí počtu komplkací v modelu M-POSSUM. 35 Obr. 7: Zázorěí počtu komplkací v modelu z let Obr. 8: Zázorěí počtu komplkací v modelu z let

8 SEZNAM TABULEK 3 Sezam tabulek Tab. : Možost výsledku testu hypotéz... Tab. : Tabulka odhadutých četostí Tab. 3: Tabulka emprckých četostí 3 Tab. 4: χ test modelu z dat z let -6 7 Tab. 5: χ test modelu z dat z let -5 7 Tab. 6: Modely testováy a všech datech z let -6 (364).. 3 Tab. 7: Modely testováy je a datech z roku 6 (36). 3 Tab. 8: Expoecálí aalýza a vylepšeá expoecálí aalýza využtím modelu M-POSSUM 35 Tab. 9: Expoecálí aalýza a vylepšeá expoecálí aalýza s využtím rovce z dat Tab.: Expoecálí aalýza a vylepšeá expoecálí aalýza s využtím rovce z dat

9 ÚVOD 4 Úvod Počátkem 9.let. století způsobl ástup mvazvích techk v chrurg převraté změy a výzamě ovlvl další směry vývoje chrurge. Tyto změy v růzé míře zasáhly praktcky všechy oblast chrurge a ečekaě rychle ahrazují klascké otevřeé operačí postupy.obecě je mvazví chrurge spojováa s meším operačím stresem a přízvějším pooperačím průběhem. Tato skutečost je opakovaě uváděa v řadě publkací věovaých laparoskopcké chrurg v oblast kolorekta. Krátkodobé výsledky mvazví chrurge kolorekta jsou v lteratuře ejčastěj uváděy formou procetuálě vyjádřeé morbdty a časé mortalty (mortalta do 3-t dů od operace). Tyto výsledky jsou pak srováváy s výsledky souborů pacetů operovaých v rámc radomzovaých studí. Teto způsob hodoceí sebou ese určtá rzka. Exstují jž sce statstcky dobře kotrolovaé stude, zatím je jch však málo a obsahují je meší soubory pacetů. Navíc u mohých studí je epřesě vymeze výklad pojmu morbdta. Výsledá čísla se pak pohybují v šrokém rozmezí. Sažme se tedy o vytvořeí sofstkovaého matematckého modelu, který umoží srováí aktuálí a predkovaé morbdty. Vypracováí skórovacích systémů prošlo a stále prochází vývojem. Výsledkem je velké možství ejrůzějších systémů. V posledí době často testovaým jsou POSSUM (Physologcal ad Operatve Severty Score for eumerato of Mortalty ad Morbdty) a jeho modfkace. Tato práce se zaměřuje a vytvořeí objektvího skórovacího systému vytvořeého z kokrétích lékařských dat. Ty jsou porováváy s modelem POSSUM převzatým z aglckého časopsu R POSSUM l = 5,9+ (,6 PS) + (,9 OS), R který popsuje rzko morbdty. Je sestave z výsledků pacetů, kteří se podrobl operacím v aglckých emoccích. Cílem práce bylo vytvořt model a základě vícerozměré logstcké regrese, dle dat z dodaého datového souboru. Soubor pochází z Fakultí emocce Ostrava-Poruba z chrurgcké klky a obsahuje velčy: PS (předoperačí skóre), OS (operačí skóre) a velču morbdta ( ebo ). Hlavím cílem této práce bylo využtí takto geerovaého modelu pro účely co ejefektvějšího zařazeí paceta s ezámou příslušostí do jedé ze dvou skup klasfkovaé morbdty ( ebo ). Dalším cílem byla algortmzace tohoto procesu. Verfkačí část práce se věuje expoecálí aalýze a její modfkac. Zabývá se vzájemým srováím a ověřeím vytvořeých modelů modelu POSSUM.

10 SKÓROVACÍ SYSTÉMY A ANALÝZA DAT 5 Skórovací systémy a aalýza dat Zde vysvětlujeme pojmy vyskytující se v lékařské prax, zejméa týkající se kolorektálí chrurge. V druhé část kaptoly jsou popsáy velčy vyskytující se v datovém souboru.. Skórovací systémy [] Jedou z možostí objektvího hodoceí dosažeých krátkodobých výsledků (časé mortalty, morbdty) a jejch porováváí je stratfkace pacetů v souboru podle rzk založeých a predkc dvduálí pravděpodobost komplkací. Předpokladem tohoto přístupu je robustí a ověřeý matematcký model vycházející z fukčího skórovacího systému, umožňující objektví přřazeí rzka jedotlvým pacetům. Obecě mohou být chrurgcké skórovací systémy také klasfkováy jako předoperačí, které se saží o kvatfkac rzk pacetů podstupujících operačí výko a fysologcké hodotící závažost stavu ebo oemocěí, vycházející z odpověd orgasmu a emoc ebo poraěí (včetě operace), sažící se o progózu průběhu a výsledku. Tyto systémy se často výzamě překrývají. Skóre vztahující se a dvduálího paceta určuje jeho dvduálí progózu. Získaý výsledek tak může ovlvt rozhodováí o rozsahu vyšetřováí, o způsobu a agresvtě léčby, o rozsahu výkou a předoperačí přípravě. Může se takto podílet a racoalzac ákladů. Skórovací systémy aplkovaé a skupy pacetů dovolí smysluplou aalýzu dosažeých výsledků morbdty. Umoží stratfkac pacetů podle závažost stavu, podle jejch rzk a pravděpodobost komplkací. Pouze takto lze objektvě srovávat dosažeé výsledky. Skórovací systémy se tak mohou stát objektvím ástrojem zhodoceí kvalty chrurgcké péče... Předoperačí skóre Je kvattatví charakterstka paceta, která se saží předoperačě staovt rzka jedotlvého paceta, který podstupuje operac. Vzhledem k tomu, že ejčastější pooperačí komplkace jsou kardorespračí a zároveň jsou tyto komplkace častou příčou smrt, zaměřují se ěkteré systémy právě a predkc těchto rzk. Např. - Amerca Socety of Aesthesologsts (ASA), kde je pacet zařaze do jedé z pět kategorí a základě aamézy a jedoduchého vyšetřeí - Cardac Rsk Idex (CRI) je systém, který je zaměře a staoveí rzka kardálích komplkací - Progostc Nutrtoal Idex (PNI) je avrhut pro staoveí rzk komplkací chrurgckých pacetů ve vztahu k utrčímu stavu.. Fysologcké skóre Fysologcké skóre závažost stavu je kvattatví charakterstka paceta, vycházející z fysologcké odpověd orgasmu a emoc ebo poraěí. Většou bylo toto skóre zaměřováo a skupy krtcky emocých s tedecí progózovat spíše pro skupu pacetů ež pro jedotlvce. Mohou se však podílet a rozhodováí a evetuálí změě rozsahu resusctačí péče u pacetů v krtckém stavu.

11 SKÓROVACÍ SYSTÉMY A ANALÝZA DAT 6 Např.: - Acute Physology ad Chroc Health Evaluto (APACHE), jehož cílem je klasfkace pacetů a základě závažost stavu - APACHE II, je osvědče pro použtí u pacetů s trobřší sepsí, dskutováa je jeho spolehlvost u traumatologckých pacetů s vysokým ebo aopak ízkým rzkem - Z dalších jsou to apříklad: APACHE III., SAPS, AOSF apod...3 Morbdta a Mortalta Morbdta a časá mortalta jsou v chrurg velm často publkovaé krátkodobé výsledky, které jsou pak ásledě vyhodocováy a srováváy. Pro laparoskopcké operace v oblast kolo se morbdta pohybuje v šrokém tervalu 7 8 % a mortalta v rozmezí 3 %. Morbdta u laparoskopckých operací rekta se pohybuje ještě v šrším pásmu 7 44 % a mortalta u laparoskopckých operací karcomu rekta je udáváa v rozmezí - 7 %. Pojem morbdta je často edostatečě ebo epřesě defová, což přspívá k omezeé možost srováváí výsledků. Mortalta představuje objektvější charakterstku ež morbdta. Pro tyto účely byla zvolea časá mortalta, tedy mortalta do 3 dů od operace. Výsledá morbdta a mortalta ezohledňuje odlšost v jedotlvých souborech pacetů. Často jsou vylučováí pacet s výrazou komodtou, pacet s epřízvým lokálím álezem ebo aopak jsou zařazováí pouze přesě defováí pacet.. POSSUM Hrubá čísla uvádějící morbdtu jsou často zavádějící a zkresleá eboť ezohledňují varabltu zdravotího stavu hodoceého souboru pacetů, stav v okamžku operace, obecý zdravotí stav populace a apříklad a zavedeou chrurgckou prax. Neumožňují tak objektví srováí dosažeých výsledků a problematcké je hodoceí ově zavedeých postupů. Skórovací systém POSSUM byl vyvut Copeladem a kol. [] počátkem 9. let. Původě měl sloužt jako ástroj pro srováváí výsledků mez jedotlvým sttucem zvláště v případech s výrazým rozdíly v morbdtě a mortaltě. POSSUM vzkl z potřeby jedoduchého skórovacího systému, který by byl použtelý apříč celým spektrem chrurgckých výkoů. Retrospektví leárí multvaratí dskrmačí aalýzou bylo staoveo ezávslých faktorů závažost fysologckého stavu a 6 ezávslých faktorů závažost operačího výkou (každý faktor s možostí čtyř expoecálích koefcetů,, 4 a 8), které se sgfkatě podílí a pooperačí mortaltě a morbdtě. Logstcká regresí aalýza a hladě výzamost α =, vyjádřla rzko morbdty ásledově: Rzko morbdty (R): R l = 5,9+ (,6 PS) + (,9 OS), R kde PS zameá fysologcké skóre a OS zameá operačí skóre.

12 SKÓROVACÍ SYSTÉMY A ANALÝZA DAT 7 POSSUM byl ověřová a řadě chrurgckých pacetů a byl srovává s jým skórovacím systémy. Byl použt ke srováí výsledků kolorektálí chrurge, jak mez růzým pracovšt, tak mez jedotlvým chrurgy..3 Aalýza dodaých chrurgckých dat V datovém souboru máme tyto skupy dat: rok, OS, PS, morbdta, POSSUM a skupy dat ozačey exp(), exp(), exp(possum), a těchto datech je využta expoecálí a vylepšeá expoecálí aalýza pro jejch pozdější zařazeí do tabulek. Expoecálí aalýza je detalě popsaá v kaptole Skupy OS a PS Parametr fysologckého skóre (PS) se vztahuje k přjetí paceta ebo k okamžku bezprostředě předcházejícímu operac. Parametr operačí skóre (OS) lze doplt po operačím výkou. Potřebá data jsou lehce dostupá a lze je získat retrospektvě u většy chrurgckých pacetů..3. Skupa morbdta Parametr abývající pouze dvou hodot ebo. Charakterzuje ám výsledek operace a pooperačí průběh léčeí paceta. Hodota zameá, že pacet eměl žádé pooperačí komplkace. Naopak hodota, hodotí stav, kdy došlo k jakýmkolv komplkacím. Komplkace jsou přesě defováy a hodocey lékař dle daých tabulek.

13 3 DISKRIMINAČNÍ ANALÝZA 8 3 Dskrmačí aalýza Problémem souvslost skupy kvattatvích a jedé alteratví č vícehodotové omálí proměé se zabývá, mmo jé také dskrmačí aalýza. Prmárě její úlohou bylo zkoumat schopost sledovaých proměých přspět k odlšeí jedotlvých skup jedotek v souboru (jak j formuloval R.A.Fsher). Dskrmačí aalýza velm často směřuje ke klasfkac jedotek s ezámou skupovou příslušostí (jejíž zařazeí se kupříkladu týká ějaké budoucí událost). Kokrétí podoby klasfkačí pravdlo abývá a základě hodot souboru kvattatvích proměých a skupové příslušost u těch jedotek, u chž jsou všechy potřebé údaje k dspozc. Použje se pak k tříděí ezařazeých jedotek. 3. Kaocká dskrmačí aalýza [3] Základem Fsherova pojetí dskrmačí aalýzy je alézt takovou leárí kombac p sledovaých proměých, tedy Y T T = b x, kde b = b, b, K, b ] je vektor parametrů, aby lépe ež [ p jakákolv já leárí kombace separovala uvažovaých H skup, tak aby její vtroskupová varablta byla co ejmeší a mezskupová varablta co ejvětší. Jestlže celkovou varabltu původích sledovaých proměých vyjádříme matcí T : T H h = h= = ( x x)( x x) T h h, rozložme j a součet matce E vyjadřující vtroskupovou varabltu, E H h = h= = a matce B vyjadřující mezskupovou varabltu, H ( x x )( x x ) T h H T ( x x)( x x) = ( x x)( x x) T h B= h h h= = h= tedy E B= T Y Q E Y, představují míru mezskupové a vtroskupové varablty pro ovou velču Y, lze zapsat jako +, pak součty čtverců Q B ( ) a ( ) Q T T B ( Y) = b Bb a Q ( Y) b Eb h h h h h E =. Největší mezskupové a ejmeší vtroskupové varablty velčy Y dosáheme př maxmálím podílu T QB( Y) b Bb F = = T Q Y b E ( ) Eb, h,

14 3 DISKRIMINAČNÍ ANALÝZA 9 T zámém jako Fsherovo dskrmačí krtérum. Pro staoveí velčy Y = b x, která by posthovala odlšost mez skupam, je tedy třeba určt prvky vektoru b tak, aby maxmalzoval dskrmačí krtérum F. Nalézt vektor b zameá položt parcálí dervace dskrmačího krtéra podle prvků vektoru b rovy ule. Po provedeí parcálích dervací lze rovce spojt a matcově zapsat jako: ( E) b= B λ, resp. ( I) b= ; E BE λ. Soustava rovc má etrválí řešeí, pokud charakterstcký polyom BE λi je rove ule. Tato charakterstcká rovce má r řešeí, kterým jsou charakterstcká čísla λ, λ, K, λr matce BE ( λ > λ > K> λ r ). Největšímu z těchto charakterstckých čísel λ odpovídá charakterstcký vektor b, který maxmalzuje dskrmačí krtérum F. Charakterstcká rovce BE λi ovšem eurčuje vektor b jedozačě, ale pouze staovuje poměr mez jeho prvky. Kokrétí hodoty prvků vektoru b, tedy koefcety pro hledaou leárí kombac, lze získat apříklad tak, že volíme b, tak aby b H T Eb= T (vtroskupovou varabltu ové velčy Y = b x vyjadřuje jedotkový rozptyl). Za tohoto předpokladu lze Fsherovo dskrmačí krtérum F zapsat jako F T = b Bb, H A tedy příslušé charakterstcké číslo λ vyjadřuje míru mezskupové varablty velčy Y. Leárí kombace Y se ozačuje jako prví dskrmat. Geometrcky j lze chápat jako projekc bodů reprezetujících jedotlvé jedotky v p-rozměrém prostoru a přímku, do začé míry zachovávající rozdílost skup, do chž jsou jedotky roztříděy. Umístěí jedotek a této přímce vyjadřuje jejch dskrmačí skóre. Středí hodota tohoto skóre je podstatou formací o tom akolk jsou skupy pomocí dskrmatu odlšey. 3. Dskrmačí fukce, dskrmace mez dvěma skupam [3] Alteratvím použtím dskrmačí aalýzy je klasfkace objektů ezámého původu do dvou ebo ěkolka možých skup. Dskrmačí krtérum pro zařazováí ezámých objektů do skup je přtom fukce původích proměých odhadutá a základě výběrového souboru jedotek se zámou příslušostí ke skupám. Předpokládejme, že populace je rozdělea do dvou skup (v ašem případě morbdta ebo ) a rozděleí vícerozměré áhodé velčy x ve dvou skupách je vícerozměré ormálí s vektory

15 3 DISKRIMINAČNÍ ANALÝZA středích hodot µ a µ a shodým kovaračím matcem Σ. Charakterstcký vektor b, který maxmalzuje Fsherovo dskrmačí krtérum F, lze v tomto případě vyjádřt jako b = kσ ( µ µ ) a b= a=σ ( µ µ ), k kde k je lbovolá kostata. Pokud b T Eb /( H) =, je T [( µ µ ) Σ ( µ )] k = µ a k >. Dskrmačí fukce T T x a= x Σ ( µ µ ) má ve skupách ormálí rozděleí se středím hodotam T T T a = µ Σ ( µ ) a µ = µ Σ ( µ ) µ µ T a µ, jejíchž vzdáleost T T T µ a µ a = µ µ Σ µ ( ) ( ) ( )] [ µ je tedy vzdáleost dvou skup. Střed mez těmto středím hodotam lze zapsat jako c= T T ( µ a+ µ a) = ( µ + µ ) Σ ( µ µ ) Pokud x T a> c, má klasfkovaá jedotka blíže k prví skupě, v opačém případě má blíže ke druhé skupě. Dskrmačí pravdlo tedy vypadá takto T T x Σ ( µ µ ) > ( µ + µ ) Σ ( µ µ ) skupa ; T T x Σ ( µ µ ) < ( µ + µ ) Σ ( µ µ ) skupa. Lze ukázat, že za předpokladu vícerozměré ormalty společou kovaračí matcí toto krtérum zařazuje x do skupy, pokud f ( x) / f ( x) >, jak do skupy. f ( x) a f ( x) jsou zde hustoty pravděpodobost vícerozměrých ormálích rozděleí pro skupu, resp.. V předchozích uvedeých krtérích předpokládáme stejé zastoupeí z obou skup v populac, tedy stejou pravděpodobost mylého zařazeí jedotky pocházející z prví skupy do druhé a aopak. Skupy, ale stejě velké být emusí. Předpokládejme, že π, resp. π, je rozsahu skupy odpovídající aprorí pravděpodobost příslušost jedotky k určté skupě. Na základě hodot p velč zjštěých u ěkteré jedotky můžeme uvažovat podmíěou aposterorí pravděpodobost této příslušost a podle Bayesova vzorce j vyjádřt jako π h f h ( x), h=,. π f x + π f x ( ) ( ).

16 3 DISKRIMINAČNÍ ANALÝZA Jedotka ezámého původu by pak zřejmě měla být zařazea do skupy s vyšší aposterorí pravděpodobostí. Tedy do skupy, pokud ( x) / f ( x) >π π f, (*) / v opačém případě do skupy. Toto pravdlo, ale může vést k chybému zařazeí jedotky z prví skupy do skupy druhé, a aopak, s pravděpodobostm f( x) dx, resp. f ( x) dx, Ω kde Ω, resp. Ω jsou dvě epřekrývající se oblast všech možých výsledků x (je-l x z Ω, zařadíme jedotku do prví skupy, je-l z Ω, do druhé). Celkovou pravděpodobost mylé klasfkace lze vyjádřt jako π f x + π f. Ω ( ) ( ) x Ω Ω Lze ukázat, že pravdlo (*) celkovou pravděpodobost mylé klasfkace mmalzuje.

17 4 LOGISTICKÁ REGRESE 4 Logstcká regrese V této kaptole se zabýváme teoretckým základem logstcké regrese jejím odvozeím a využtím pro dskrmac. V další část kaptoly je aformulováa metoda maxmálí věrohodost a její použtí pro logstckou regres. 4. Statstcké rozhodovací fukce [4] Jedotlvé dskrmačí procedury jsou odvozey a základě teore statstckých rozhodovacích fukcí. K alezeí optmálího rozhodovacího pravdla je využto bayesovského přístupu. Rol Y ;, která ezámého parametru, o jehož hodotě chceme rozhodout, hraje áhodá velča { } má pravděpodobostí fukc q ( y). Rozhodutí je prováděo a základě hodoty áhodého vektoru p X R, jež má hustotu r ( x). Podmíěou hustotu X za podmíky y r x y. Y = ozačíme ( ) Nechť δ : R p { ;} je rozhodovací fukce a H je moža všech fukcí : R p { ;} Ztrátovou fukc zavedeme jako Rzková fukce je defováa jako Baysovské rzko se určí jako L ( Y, δ ( X) ) (, ) E L( Y, δ( X) ), pokud Y = δ =, jak ( X) [ Y] = L( Y ( x) ) r( x y) d x R Y δ =, δ ρ p R ( δ) = ER( Y, δ) = R( y, δ) q( y) y= Optmálí rozhodovací fukc δ potom dostaeme jako δ = arg m δ H ρ( δ) Ozačme podmíěou pravděpodobostí fukc Y za podmíky p ( x) = P( Y = X = x) = π( x) a p( x) P( Y = X = x) = π( x). p x R ( x) arg m E L( Y, δ( X) ) δ H δ. X = x jako p ( y x). Nechť = Exstuje-l pro všecha [ X = x] = L( Y, δ( x) ) p( y x) δ = y=,

18 4 LOGISTICKÁ REGRESE 3 Lze sado pomocí Bayesovy věty ukázat, že δ =δ.přímým výpočtem lze dále alézt vyjádřeí rzkové fukce a bayesovského rzka: ( ) R(, δ) = Pδ( X) = Y =, R(, δ) = P( δ( X) = Y = ), ( δ) = P( δ( X) =, Y = ) + P( δ( X) =, Y = ) ρ. Vdíme tedy, že bayesovské rzko lze v této stuac terpretovat jako pravděpodobost špatého rozhodutí o hodotě Y, tj. o zařazeí daého objektu do skupy. Dále budeme bayesovské rzko azývat jako pravděpodobost chyby. 4. Logstcká regrese [5] Logstckou regresí rozumíme takový model, kde ezávslá proměá Y je kódováa pouze hodotam a. Hodota udává, že daá pozorovaá stuace eastala a hodota představuje, že x = x, x,, a závslou daý pozorovaý jev astal. Nezávslou proměou ozačíme vektor ( K x ) proměou ozačíme y a píšeme g( x) kde, β =,, K p jsou koefcety g y=. Hledaý vícerozměrý logstcký model má tvar: ( x) = β + β x + β x + L+ β x x =,, K p jsou ezávslé proměé Výsledý logstcký regresí model, pak bude mít tvar: g e π ( x) = + g( x) e Hledaé koefcety β, =,, K p odhademe pomocí metody maxmálí věrohodost. ( x) v tom, že ( x) π je tzv. logtová trasformace, která je domatí př logstcké regres. Její důležtost spočívá g má mohé žádaé vlastost leárího regresího modelu. Logt g ( x) je leárí, v závslost a x. v parametrech, může být spojtý a může se pohybovat v tervalu ( ) ( x) 4.3 Logstcká regrese jako ástroj pro dskrmac [4] Vychází z teore dskrmačí aalýzy popsaé v kaptole 3.. Logstcká regrese ebyla původě vytvořea pro dskrmac, ale lze j pro úspěšě použít. Model logstcké regrese, který je upraveý pro účely dskrmace, je defová ásledově. Nechť Y, K,Y je posloupost ezávslých áhodých velč s alteratvím rozděleím, jehož parametr splňuje:

19 4 LOGISTICKÁ REGRESE 4 kde ( β, β ) je ezámý ( +) p rozměrý parametr a X, K, X je posloupost ezávslých áhodých velč. Teto model má tzv. učící fáz, ve které záme u každého objektu jak hodoty X, tak hodoty Y (tj. víme, do které skupy te který objekt patří). Na základě této zalost odhademe parametry β, β a poté dostaeme odhad ~ π ( x) fukce π ( x), kde π [ ]. ( β β x) ( x) = P( Y = X = x) = + e Další objekt, u kterého ezáme jeho zařazeí a u ěhož jsme aměřl hodotu X pomocých zaků, přřadíme do jedé ze dvou skup podle hodoty rozhodovací fukce. Zde sce ezáme aprorí hustotu velčy Y a podmíěou hustotu áhodé velčy X ze podmíky Y = y, ale pro výpočet optmálí rozhodovací fukce ám postačí zalost podmíěé hustoty Y za podmíky E P( Y P( Y X = x, která je určea hodotou fukce π ( x). Pokud [ L( Y, δ ( X) ) X = x] = L y, δ( x) = X = X = x ) = ) = ( ) p( y x) = L( y, j) p( y x) y= y= = x ( β ) β x [ + e ], ( β ) + β x [ + e ], = δ ( x ) = j, je totž L ( j, j) p( j x) π = π ( x), ( x), j=, j=. Tedy m E δ D [ L( Y, δ( X) ) X = x] = mπ( x), π( x) { }. Toto mmum exstuje P x R a tudíž můžeme psát δ ( x) = arg m L( j, j) p( j x). j=, Tedy objekt, a ěmž jsme aměřl hodotu X pomocých zaků, zařadíme do prví skupy, pokud π β ( X) π( X) + β X Tudíž objekt zařadíme do prví skupy, pokud S( X) a do ulté skupy, pokud ( X) < S. < můžeme objekt zařadt do lbovolé skupy, až bychom zvýšl hodotu pravděpodobost chyby., tj. Přtom S( x) = β + β x. Pokud S ( X) =, tj. π( X) =,

20 3 LOGISTICKÁ REGRESE 5 K vlastí dskrmac však musíme použít odhad S ~ ( x) fukce S ( x) ~ parametry β, β ahrazey odhady β, ~ β, tedy ~ ~ ~ S x = β + β. ( ) x, ve kterém jsou ezámé Hlaví výhodou tohoto modelu je fakt, že eklade žádé podmíky a rozděleí áhodých vektorů. X, K, X. 4.4 Metoda maxmálí věrohodost [4] Odhady získaé touto metodou se všeobecě vyzačují dobrým statstckým vlastostm. Metoda maxmálí věrohodost je prcpelě jedoduchá metoda pro kostrukc odhadů ezámých parametrů zámých rozděleí pravděpodobost, která je založea a maxmalzac věrohodostí fukce. Nechť ( t,,t ) T parametr. Nyí alezěme fukc věrohodost daou K je áhodý výběr z rozděleí s hustotou f ( t;θ) L ; = ( t, K, t ; Θ) = f( t, Θ) f( t, Θ) K f( t, Θ) = f( t Θ) a z í získejme Θ tak, aby ˆ =Θˆ ( t, K, t ) sdružeá hustota pravděpodobost -ezávslých proměých ( t,, ), kde Θ je ezámý Θ bylo ejlepším odhadem pro Θ. Pravá straa rovce je t K se stejým rozděleím. Tedy L je fukcí ezámého parametru Θ, který je odhadová, metoda maxmálí věrohodost je založea a získáí takové hodoty Θ, která maxmalzuje L. Př praktckých výpočtech se ukázalo jako výhodější maxmalzovat spíše fukc l L, amísto L. Což je možé, protože obě operace jsou ekvvaletí. Rovc tedy zlogartmujeme, položíme rovu a vypočteme ezámé parametry Θ. l L, Θ ( t K, t ) = 4.5 Vícerozměrá metoda maxmálí věrohodost Mějme vektor ezámých koefcetů Θ = ( Θ, Θ,, ) proměých X ( x, x,, ) =. K Abychom alezl vektor ezámých Θ = ( Θ, Θ,, ) x Θ p K a vektor ezávslých Θ p K, řešíme soustavu rovc: ( x, x, K, t ) l L Θ =, =,, K, p.

21 4 LOGISTICKÁ REGRESE Metoda maxmálí věrohodost pro logstckou regres [5] Metodu maxmálí věrohodost pro logstckou regres provedeme pro dvě ezávslé proměé x, x a pro závslou proměou y. Počet hledaých koefcetů je p +, kde p je počet závslých proměých. V ašem případě budeme hledat tř koefcety β, β, β pro dvě ezávslé proměé. Pro logstckou regres bude mít věrohodostí fukce tvar: kde a L = = y ( x, x ; β ) π( x ) [ π( x )] π ( x ) g e = + e ( x ) g ( x ) ( x) = β + β x + β x g y a kde ( β, β β ) β = je vektor ezámých koefcetů., Po zlogartmováí dostaeme tuto rovc: l L Po úpravě dostaeme tuto rovc: kde l L = y ( x, x ; β ) = l π( x ) [ π( x )] y ( x, x; β ) = { y l[ π( x) ] + ( y) l[ π( x) ]} = π ( x ) g e = + e ( x ) g ( x ) a ( x) = β + βx + β x g a kde ( β, β β ) β =.,

22 4 LOGISTICKÁ REGRESE 7 Abychom alezl věrohodostí fukc budeme řešt soustavu tří rovc o třech ezámých: = = = [ y π( x )] x x [ y π( x )] [ y π( x )] = = = Z této soustavy vypočteme odhady ezámých parametrů β, β, β. Po alezeí koefcetů bude mít regresí model tvar: g x = β β + β. + x x kde ( ) g( x) e π ( x) g( x), = + e

23 5 TESTOVÁNÍ MODELŮ 8 5 Testováí modelů V této kaptole jsou popsáy metody testováí hypotéz, defováí správé hypotézy, použtí vhodého testovacího modelu a alezeí hodoty P. Dále se zabýváme teoretckým testováím modelu, tedy rozhodujeme o pravdvost hypotéz. V tomto rozhodovacím procesu prot sobě stojí ulová a alteratví hypotéza a aším cílem je rozhodout, zda data z výběrového souboru odpovídají hypotéze. 5. Testováí hypotéz Statstcké hypotézy jsou takové doměky o populac, jejchž pravdvost lze ověřovat prostředctvím statstckých testů výzamost. Testy výzamost postupy č procedury, které a základě áhodého výběru objektvě rozhodou, zda má být ověřováa hypotéza zamítuta č kolv. Nulová hypotéza H - ověřováa hypotéza, o jejímž zamítutí rozhoduje test výzamost. Alteratví hypotéza H A - hypotéza, kterou přjímáme, zamíteme-l ulovou hypotézu. 5. Čstý test výzamost [6] Čstý test výzamost zodpovídá otázku, zda získaý áhodý výběr X (jeho pozorovaé hodoty) je č eí extrémí s ohledem a ějakou testovaou hypotézu o populac. Čstý test výzamost se skládá z ásledujících kroků:. Nulová hypotéza ( H ) vyjadřuje doměku o povaze populace. Musí být specfkovaá dostatečě přesě, aby defovala tzv. pravděpodobostí míru a populac.. Staoveí testové statstky T ( X) - je ějaká fukce áhodého výběru, odvozea z populace. Výběr fukce je determová charakterstkam pravděpodobostího rozděleí z ěhož populace pochází a jehož se zároveň týká ulová hypotéza. 3. Staoveí tzv. ulového pravděpodobostího rozděleí F ( x) P T( X) ( x ) H = <. : H Přtom H musí být specfkováa atolk přesě, aby toto pravděpodobostí rozděleí bylo jedozačě určeo. 4. Výpočet pozorovaé hodoty testové statstky: t = xobs a statstky zvaé P. Pozorovaou hodotu této statstky P vypočteme v závslost a kotextu ulové

24 5 TESTOVÁNÍ MODELŮ 9 hypotézy, avšak terpretace této hodoty je vždy stejá. Pokud H platí, pak se dá ukázat, že rozděleí statstky P je uformí (rovoměré). Tedy: ( P ( X) p H ) p P = < Proto P má stejou terpretac pro všechy ulové hypotézy ezávslé a ulovém rozděleí. Je jasé, že čím meší P, tím extrémějších hodot abývá testová statstka s ohledem a ulové rozděleí, tedy tím slější je výpověď áhodého výběru prot ulové hypotéze. Jestlže váha výpověd prot ulové hypotéze roste př klesajícím P, bylo by erozumé ozačt ějaké P jako mez, pod kterou už budou ulové hypotézy zamítáy, a aalogcky, ad kterou budou tyto hypotézy akceptováy. Proto vymezíme pro P tzv. erozhodou oblast (terval), oddělující oblast zamítutí od oblast přjetí. 5. Rozhodutí a základě P P <, zamítáme H, P <,5 erozhodá oblast < P >,5 ezamítáme H Obr. : Rozhodovací oblast dle P. 5.3 Alteratví hypotézy [6] Z defce P je jasé, že čstý test výzamost pro účely testováí hypotéz vyžaduje eje přesou specfkac ulové hypotézy, ale také kometář k tomu, která alteratví hypotéza může být správá, v případě, že ulová hypotéza je zamítuta. Tato alteratví hypotéza ovšem emusí být specfkováa atolk přesě, jako ulová hypotéza. Př volbě vhodé defce P je uto zát pouze to, v jakém vztahu je alteratví hypotéza vzhledem k ulové hypotéze. Staoveí alteratví hypotézy však musí být v souladu s pozorovaou hodotou testové statstky.

25 5 TESTOVÁNÍ MODELŮ Tyto hodoty testové statstky, které mají malé P př platost H by měly mít tedec k většímu P př platost alteratvy a aopak. (Velká P př platost H by měla odpovídat malým P př platost alteratvy.) 5.4 Staoveí testové statstky [6] Pro rozhodutí zda testovaou ulovou hypotézu přjmeme ebo zamíteme použjeme testovou statstku. Statstcký test rozhode zda data z výběrového souboru ( X ) odpovídají ulové hypotéze. Pro logstckou regres se apříklad používají: - Pearsoůvχ test - Test ulovost koefcetů - Hosmer-Lemeshowovy testy Jelkož př rozhodováí o ulové hypotéze vycházíme z výběrového souboru, který emusí dostatečě přesě odpovídat vlastostem základího souboru, můžeme se př rozhodováí dopustt druhů chyb. Chyba I. druhu Chyba II. druhu - vzká, je-l ulová hypotéza ve skutečost platá a my j přesto zamíteme, pravděpodobost, že k této chybě dojde začíme α - je ezamítutí ulové hypotézy v případě, že je platá hypotéza alteratví, pravděpodobost této chyby začíme β Abychom mohl tyto chyby blíže determovat, musíme vyjít z tzv. teoretckého modelu pro testováí hypotéz. V ěmž se zvolí pevé číslo α hlada výzamost, což bývá ejčastěj hodota,5 (popř.,). Rozhodováí pak probíhá dle ásledujícího klíče: Pokud P <α zamítáme H P >α ezamítáme H

26 5 TESTOVÁNÍ MODELŮ V ásledující tabulce jsou popsáy všechy stuace, které mohou př rozhodováí vzkout: SKUTEČNOST ZAMÍTÁME H NEZAMÍTÁME H Platí H Platí H A chyba I.druhu, pravděpodobost: α správé rozhodutí, pravděpodobost: β správé rozhodutí, pravděpodobost: α chyba II.druhu, pravděpodobost:β Tab. : Možost výsledku testu hypotéz 5.5 Pearsoův χ test dobré shody [7] Pearsoůvχ test dobré shody se používá k testováí hypotézy o procetím rozděleí v základím souboru ebo o pravděpodobostím rozděleí áhodé velčy. Je to jedoduchý test založeý a rozdílu mez pozorovaým (emprckým) a očekávaým (teoretckým) četostm. Na předem zvoleé hladě výzamost budeme testovat ulovou hypotézu H, že áhodá velča (základí soubor) má určté rozděleí př alteratví hypotéze H A, že áhodá velča (základí soubor) má rozděleí jé ež to, které je specfkováo ulovou hypotézou. Chceme-l zjstt, jak dobře se pozorovaé a očekávaé četost shodují, zkoumáme je pomocí rozdílu těchto četostí. Pro pozorovaé (emprcké) četost v rámc daého testu platí = dsjuktích tříd. k =, kde k, je počet Výrazy ( p ) se azývají v rámc daého testu očekávaé (teoretcké) četost a platí p =. Je-l ulová hypotéza pravdvá, pak pozorovaé a očekávaé četost by měly být zhruba stejé a statstka bude mít malou hodotu. Jým slovy velké hodoty poskytují argumety prot ulové hypotéze. Obecý tvarχ statstky: = ( p ) χ =. p k =

27 5 TESTOVÁNÍ MODELŮ Proč testovat předpoklady modelů? Logstcký model sce eklade žádé zvláští požadavky a rozděleí áhodých velč X, K, X, ale zato předpokládá specfcký tvar pravděpodobost ( β β x) ( Y = X x). Skutečost, že opravdu platí P( Y = X = x) = + e P = ověřt ejlépe pomocí ějakého statstckého testu. [ ], bychom měl 5.6 Pearsoův χ test pro logstckou regres [4] Naměřeé hodoty I je počet růzých hodot velč X, K, X se mohou opakovat, tedy emusejí být utě áhodé. Nechť X,, X K v učící skupě a x, K, x jsou tyto hodoty. Celý model logstcké regrese pracuje totž s podmíěým rozděleím velč Y, K,Y za podmíky X = x, K, X = x. Hodoty Y, K,Y vyjadřující zařazeí -tého objektu do jedé ze dvou skup přezačme Y, j, =, K, I, j =, K, m, kde m je počet objektů s hodotou vysvětlujících zaků X a Y, j =,, m ozačuje zařazeí objektu, u chž mají vysvětlující zaky hodotu, j K I m I m X = x. Dále ozačujeme = Y, j = ( Y, j) = j=,. = j= ~ Metodou maxmálí věrohodost získáme odhady β, ~ β parametrů β, β. Pomocí těchto odhadů spočítáme odhady logstckých pravděpodobostí ~ ( ) ( ) ~ ~ β ~ O β x z věrohodostích rovc plyou vztahy = I m Y, j = = j= = I [ + ] π x = π = e I m I ( Y, j) = m( ~ ) m ~ π, = π = j= =. Přímo Celou stuac lze popsat kotgečí tabulkou typu I s daým margálím sloupcovým četostm. Přtom -tý sloupec tabulky reprezetuje bomcké rozděleí s parametry m, π ( x ) = π. Tabulka odhadutých četostí: Y X x K xi m ~ π K m ~ Iπ I ~ π m ~ π m ( ) K ( ) m K mi I I Tab. : Tabulka odhadutých četostí

28 5 TESTOVÁNÍ MODELŮ 3 Tabulka emprckých (pozorovaých) četostí: Y Y X x K xi Y K I Y m K I Y I m K mi m Tab. 3: Tabulka emprckých četostí Jelkož máme dáy margálí sloupcové četost, jsou hodoty v aší tabulce vázáy I podmíkam ( m π + m ( π ) = m,, m π + m ( π ) = m ) K I I I I I. Teto údaj budeme potřebovat pro výpočet stupňů volost v Pearsoově testové statstce, která má tvar: Z = I I ( Y m ~ π ) ( m Y m( ~ π ) ) + m ~ π m ( ~ π ) = = = I = ( Y m ~ π ) m ~ π ( ~ π ) Pomocí této statstky můžeme testovat shodu dat v pozorovaé tabulce s tabulkou teoretckou, která je v ašem případě založea a modelu logstcké regrese. Př hypotéze H : platí logstcký model, má statstka počtem stupňů volost: Z asymptotcky rozděleí. χ s ásledujícím Velkost kotgečí tabulky počet vazeb v teoretcké tabulce počet odhadutých parametrů = Tedy př platost = I I ( p+ ) = I ( p+ ). H je Z χ ( I ( p+ ) ). Nuté je splt podmíku > ( p+) I.

29 6 GENEROVÁNÍ NOVÉHO MODELU 4 6 Geerováí ového modelu Pro vytvořeí ového modelu použjeme metodu logstcké regrese vz kaptola 4. Naše obecá regresí rovce bude mít tvar: kde OS je operačí skóre a PS je fyzologcké skóre. S ( x) β + β S+ PS = β Z poskytutých lékařských dat z Fakultí emocce Ostrava-Poruba z chrurgcké klky vytvoříme model logstcké regrese pomocí programu Statgraphcs. Kostrukce geerováí ového modelu: - ačteme data z datového souboru data.xls do programu Statgraphcs, ezávslé proměé OS, PS a závslou proměou morbdta - pomocí vícerozměré logstcké regrese sestavíme model - výsledý model logstcké regrese zobrazuje závslost mez dvěma ezávslým proměým OS a PS a mez závslou proměou morbdta

30 6 GENEROVÁNÍ NOVÉHO MODELU 5 6. Logstcké rovce modelů Rovce jsou sestavey z poskytutých dat z Fakultí emocce Ostrava-Poruba z chrurgcké klky: a) pro data z let 6 Výsledá rovce: R l =,9973+,54864 * OS+,7576* PS R () Kde PS je parametr fysologckého skóre a OS je parametr operačího skóre. Zázorěí datového souboru z let 6 a obrázku. Obr. : Zázorěí datového souboru(-6)

31 6 GENEROVÁNÍ NOVÉHO MODELU 6 b) pro data z let 5 Výsledá rovce: R l =,33399+,7439 * OS+,63789 * PS R () Kde PS je parametr fysologckého skóre a OS je parametr operačího skóre. Zázorěí datového souboru z let 5 a obrázku 3. Obr. 3: Zázorěí datového souboru(-5)

32 6 GENEROVÁNÍ NOVÉHO MODELU 7 6. Testováí vytvořeých logstckých rovc Zde se budeme zabývat tím, zda je výsledý model kompaktí s daty a jestl jsou koefcety OS a PS statstcky výzamé a zda model a těchto datech závsí ebo e. 6.. χ test dobré shody modelu Teto test ověřuje hypotézu o tom, zda jsou ové logstcké regresí fukce adekvátí s pozorovaým daty. a) pro data z let -6 (vz rovce ()) Morbdta Morbdta Třída Logtový terval Pozorováo Predkce Pozorováo Predkce < -, , ,36 -,63556 až -, , , ,43333 až -, , ,7 4 -,493 až, , ,46 5 >, , ,84 Celkem Tab. 4: χ test modelu z dat z let -6 χ = 3,8865 počet stupňů volost = 3 P =,7457 b) pro data z let -5 (vz rovce ()) Morbdta Morbdta Třída Logtový terval Pozorováo Predkce Pozorováo Predkce < -, , ,4657 -, až -, , , ,47794 až -, , ,74 4 -,98337 až -, , , > -, ,3 9 8,8689 Celkem Tab. 5: χ test modelu z dat z let -5 χ =,44 počet stupňů volost = 3 P =, Jelkož hodota P je u obou modelů (rovce () rovce ()) větší ež,, eí důvod zamítat vhodost použtého modelu pravděpodobost a 9% hladě výzamost.

33 6 GENEROVÁNÍ NOVÉHO MODELU χ test devace koefcetů Provádí se pro účely testováí ulovost koefcetů. Zkoumáme ulovost koefcetů OS a PS. Bude-l kterýkolv z ch ozače za ulový, ebude výsledý model a tomto koefcetu závset a bude ho možo z modelu vyloučt. Testujeme koefcety OS a PS: - ulová hypotéza: H : β = - alteratví hypotéza: H : β a) pro data z let -6 (vz rovce ()) Zde se β ( β, ) S β PS A =, β,54864, β, 7576 S = PS = χ testy devace: OS: - χ statstka : χ = 4, 44 - počet stupňů volost = - P =, 43 PS: - χ statstka : χ = 7, počet stupňů volost = - P =, 5 b) pro data z let -5 (vz rovce ()) Zde se β ( β, ) =, β,7439, β, S β PS S = PS = χ testy devace: OS: - χ statstka : χ = 6, počet stupňů volost = - P =, 3

34 6 GENEROVÁNÍ NOVÉHO MODELU 9 PS: - χ statstka : χ = 5, počet stupňů volost = - P =, 4 Jelkož vždy u parametrů OS PS vyšly P meší ež hlada výzamost α =, 5, zamítáme ve všech případech ulovou hypotézu H o ulovost koefcetů. Přjímáme alteratví hypotézu H A, oba koefcety v obou rovcích jsou statstcky výzamé a 95% kofdečí úrov a emůžeme je z modelu odstrat. Po provedeí testů bylo zjštěo, že aše modely jsou kompaktí s daty z Fakultí emocce Ostrava-Poruba a můžeme je dál využít.

35 7 ALGORITMICKÉ ZPRACOVÁNÍ NOVÝCH REGRESNÍCH MODELŮ 3 7 Algortmcké zpracováí ových regresích modelů Pomocí logstcké regrese jako ástroje pro dskrmac jsme sestavl program morbdta.m a výpočet predkce morbdty pacetů. Dle metodky uvedeé v kaptole 4.3, kdy regresí rovce v ašem případě vypadá takto: S ( x) β + β S+ PS = β Tedy objekt bude zařaze do prví skupy (morbdta=), pokud S ( X) (morbdta=), pokud S ( X) <.. Do ulté skupy 7. Využtí modelů pro predkc morbdty Na ově vytvořeé modely použjeme program morbdta.m a otestujeme ho a příslušých datech. Výsledky predkce morbdty ( ebo ) porováme se skutečým sloupcem morbdta v ašem datovém souboru data_ova.xls. Na závěr vypočteme proceto chyby modelu. Všechy výsledky jsou přehledě zazameáy v ásledujících tabulkách. Jedotlvé sloupce zameají: - Model: jsou vytvořeé modely - Správě zařazeo: zde je počet správě zařazeých hodot ( ebo ), dle testovacího souboru data.xls, tz. program správě spočítal hodotu ebo jako byla uvedea v testovacím souboru a stejém místě - Špatě zařazeo: zde jsou ty hodoty, které byly určey špatě tz. program spočítal hodotu (respektve ) a v testovacím souboru byla uvedea (respektve ) - Predkovaý počet : je součet všech, které program určl pro pacety s daým PS a OS - Skutečý počet : součet všech jedček v daé skupě podle testovacího souboru - Proceto chyby: udává jaká je možost toho, že daý pacet byl zařaze do esprávé skupy, vypočte se jako podíl Špatě zařazeo / počet všech pacetu ve skupě

36 7 ALGORITMICKÉ ZPRACOVÁNÍ NOVÝCH REGRESNÍCH MODELŮ 3 Model Rovce () POSSUM celkový Rovce () Správě zařazeo Špatě zařazeo Skutečý počet Predkovaý počet Proceto chyby % ,% ,3% Tab. 6: Modely testováy a všech datech z let -6 (364) Rovce () POSSUM celkový Rovce () 34% 33% 3% 66% 67% 69% Obr. 4: Grafcké zázorěí zařazeí pacetů ze všech dat (364) Model Rovce () POSSUM 6 Rovce () Správě zařazeo Špatě zařazeo Skutečý počet Predkovaý počet Proceto chyby ,3% 5 5 3,5% 6 7,7% Tab. 7: Modely testováy je a datech z roku 6 (36)

37 7 ALGORITMICKÉ ZPRACOVÁNÍ NOVÝCH REGRESNÍCH MODELŮ 3 Rovce () POSSUM celkový Rovce () 33% 3% 8% 67% 69% 7% Obr. 5: Grafcké zázorěí zařazeí pacetů z roku 6 (36) Z výsledků je patré, že ejefektvější progózu morbdty poskytuje model sestaveý z dat z let -5. V obou případech testováí u ěj vychází ejmeší proceto špatého zařazeí paceta.

38 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE 33 8 Expoecálí aalýza a její modfkace Nyí data získaá z Fakultí emocce Ostrava-Poruba aalyzujme ještě pomocí verfkačí metody expoecálí aalýzy popsaé v [8]a vylepšeé expoecálí aalýzy vz. [9]. Expoecálí aalýzu a vylepšeou expoecálí aalýzu budeme aplkovat a model POSSUM a a ám vytvořeé modely, daé rovcem () a () pro predkc morbdty. 8. Expoecálí aalýza Expoecálí aalýza byla poprvé provedea v [8] pro účely porováí očekávaé a skutečě se vyskytující morbdty a mortalty. Algortmus expoecálí aalýzy:. Jedotlvé pacety rozdělíme do skup a základě aktuálích hodot PS a OS, které vyjádříme v procetech.. Celou aalýzu provádíme od skupy 9 a postupě zvyšujeme terval po deset procetech až do doby, kdy bude vyhovovat podmíce, aby předpovídaý počet pacetů s pooperačím komplkacem měl vzrůstající tedec (ebo byl stejý) vzhledem k předchozí skupě. 3. Aalýzu provádíme zdola ahoru. 4. Dojde-l k porušeí podmíky, aalýza se zastaví a skupa, u které došlo k porušeí podmíky se do aalýzy epočítá. Pokračuje se dále aalýzou shora dolů. 5. Důležtá je posledí skupa aalýzy zdola ahoru u které edošlo k porušeí podmíky. Její dolí hrace určuje horí hrac skupy u aalýzy shora dolů. 6. predkovaý počet = počet pacetů v daé skupě * dolí hrace této skupy / 8. Vylepšeá expoecálí aalýza [8] Vylepšeá expoecálí aalýza stejě jako původí expoecálí aalýza dělí pacety do skup, dle aktuálího PS a OS a provádí jejích aalýzu. Ale místo bodu 6 v původím algortmu je využta věta o úplé pravděpodobost. Ozačme x modelem předpokládaý počet komplkací ve skupě (a,b), která obsahuje pacetů a P(A) pravděpodobost, že áhodě vybraý pacet ze skupy (a,b) bude mít komplkace. Potom: x=. P( A) Jestlže se ve skupě (a,b) vyskytlo r růzých pravděpodobostí komplkací p,..., p r a je počet pacetů s pravděpodobostí komplkace p, pak můžeme psát :

39 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE 34 r x= p = tedy x = r = p. Pokud provedeme přezačeí a každému (-tému) pacetov ze skupy (a,b) přřadíme pravděpodobost komplkace p, pak je zřejmé, že x = p =. 8.3 Aplkace expoecálí a vylepšeé expoecálí aalýzy Pomocí programu tabulka.m porováme výsledky jedotlvých aalýz a zhodotíme výsledky. Jedotlvé slupce tabulky popsují: skupa udává tervaly pro morbdtu pacetů v procetech počet pacetů udává, kolk pacetů daé skupy mělo skutečě pooperačí komplkace předpovězeý počet udává předpovídaý počet pacetů s pooperačím komplkacem, dle vztahu: předpovídaý počet = počet pacetů * dolí hrace skupy /, až a prví skupu, která začíá hodotou %, jelkož by emělo smysl ásobt určí se predkovaý počet jako medá z dat ve skupě použjeme středí hodotu vypočítaého rzka předpovězeý počet u -t % pásma a touto hodotou budeme ásobt počet pacetů poměr udává poměr mez skutečým a předpovídaým počtem pacetů, kteří měl pooperačí komplkace předpovězeý počet modfkovaý - udává předpovídaý počet pacetů s pooperačím komplkacem, dle vztahu: x = r = p poměr modfkovaý - udává poměr mez skutečým a předpovídaým počtem pacetů, kteří měl pooperačí komplkace, dle modfkovaé expoecálí aalýzy

40 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE 35. Model POSSUM M R POSSUM l = 5,9+ 9 R (,6 PS) + (, OS) skupa (%) počet pacetů skutečý počet předpovězeý počet poměr předpovězeý počet vylepšeý poměr vylepšeý Tab. 8: Expoecálí aalýza a vylepšeá expoecálí aalýza využtím modelu M-POSSUM 4 k o m l k a c e tervaly skutečý počet predkovaý počet vylepšeý predkovaý počet Obr. 6: Zázorěí počtu komplkací v modelu M-POSSUM

41 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE 36. Rovce () skupa (%) R l =,9973+,54864 * OS+,7576* PS R počet pacetů skutečý počet předpovězeý počet poměr předpovězeý počet vylepšeý poměr vylepšeý NaN NaN 8 - NaN NaN 9 - NaN NaN Tab 9: Expoecálí aalýza a vylepšeá expoecálí aalýza s využtím rovce z dat - 6 k o m p l k a c e tervaly skutečý počet predkovaý počet vylepšeý predkovaý počet Obr. 7: Zázorěí počtu komplkací v modelu z let -6

42 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE Rovce () R l =,33399+,7439 * OS+,63789 * PS R skupa (%) počet pacetů skutečý počet předpovězeý počet poměr předpovězeý počet vylepšeý poměr vylepšeý NaN NaN 8 - NaN NaN 9 - NaN NaN Tab. : Expoecálí aalýza a vylepšeá expoecálí aalýza s využtím rovce z dat k o m p l k a c e tervaly skutečý počet predkovaý počet vylepšeý predkovaý počet Obr. 8: Zázorěí počtu komplkací v modelu z let -5

43 8 EXPONENCIÁLNÍ ANALÝZA A JEJÍ MODIFIKACE 38 Z dosažeých výsledků, reprezetovaých tabulkam, je vdtelé, že vylepšeá expoecálí aalýza poskytuje reálější výsledky ež-l původí. Výsledé poměry jsou blízké číslu, což je pro ás deálí. Jsou-l poměry vyšší ěž jeda, zameá to, že predkce je přílš optmstcká, tedy počet predkovaých jedček je výrazě meší ež skutečost. Naopak, jsou-l poměry výrazě žší ež jeda, predkce předpovídá více pacetů s komplkacem ež je skutečost.

44 9 ZÁVĚR 39 9 Závěr Cílem práce bylo avrhout algortmus rozhodovacího procesu pro zařazeí objektu, s ezámou příslušostí, do jedé ze dvou skup pomocí logstcké regrese. Pomocí programu Statgraphcs byly vytvořey ové logstcké modely a ty testováy. Testováí bylo prováděo pomocí logstcké regrese jako ástroje pro dskrmac a pomocí expoecálí aalýzy a její modfkace. Testováím a základě referečího postupu zvaého expoecálí aalýza bylo zjštěo, že v lteratuře uváděý model POSSUM eí ejvhodější pro predkc morbdty př těchto operacích. Podobé výsledky progózy přesl model sestaveý ze všech dat z let -6. Nejefektvější výsledky progózy s ejmeší chybou fálě přesl až model sestaveý z dat z let -5. Z výsledků je patré, že chrurgcká data pocházející z roku 6, byla zřejmě získáa po aplkac ovatvích postupů. Model sebou esl velké odlšost způsobeé vývojem staoveí velč OS, PS a morbdta. Nejlepším se ukázal model z dat z let -5 a jeho testováí a datech z roku 6. Díky dostatku asbíraých dat se stal teto model vyhovujícím všem použtým stadardím statstckým testům modelu. Navíc vyhověl poěkud etradčí verfkac daé expoecálí aalýzou. Na datech z roku 6 ukázal chybu pouhých 7%. Výsledý model má tvar: R l =,33399+,7439 * OS+,63789 * PS R Jedotlvé koefcety byly alezey metodou vícerozměré metody maxmálí věrohodost. Důležtou součástí modelu je také testováí a eulovost koefcetů. Toto bylo provedeo testem chí-kvadrát. Dle tohoto modelu můžeme s velkou pravděpodobostí predkovat ohodoceí morbdty pacetů, pouze s využtím dostupých parametrů OS a PS. Tedy zda pacet po provedeí operace budou mít komplkace č kolv. Expoecálí aalýza dat ukazuje poměr mez předpovězeým a reálým počtem pacetů s komplkacem. Zde je vdět, že modfkovaá expoecálí aalýza, která byla v rámc této práce zalgortmzováa, mohem přesěj a reálěj popsuje skutečost ěž-l původí. Zatímco původí expoecálí aalýza je př vyhodocováí počtu pacetů s komplkacem velm optmstcká (tedy určí jch zpravdla méě ež jch ve skutečost je). Modfkovaá expoecálí aalýza dává výsledky mohem reálější (výsledý poměr je velm blízký číslu ). Př porováí modelů je patré, že hodoty jedotlvých koefcetů u ám vytvořeých modelů se přílš elší, ale model POSSUM má hodoty velm odlšé.důvodem je odlšost dat. Naše modely byly vytvořey a základě kokrétího datového souboru z Fakultí emocce Ostrava-Poruba. Původí model byl vytvoře a základě dat získaých po operacích v aglckých emoccích. Pavlía Kuráňová

45 SEZNAM POUŽITÉ LITERATURY 4 Sezam použté lteratury [] L. Martíek: Aplkace specalzovaých skórovacích systémů pro objektvzac morbdty laparoskopckých operací kolorekta, OSTRAVA 6 [] Copelad, G.P., Joes, D., Walters, M.: POSSUM: a scorg system for surgcal audt. Br. J. Surg., 99 [3] P.Hebák, J. Hustopecký, E. Jarošová, I. Pecáková: Vícerozměré statstcké metody (), Praha 4 [4] R.Brš, M.Ltschmaová: STATISTIKA II., OSTRAVA 7 [5] R.Brš: MODELOVÁNÍ RIZIKA MORBIDITY LAPAROSKOPICKÝCH OPERACÍ POMOCÍ LOGISTICKÉ REGRESE [6] R.Brš, M.Ltschmaová: STATISTIKA I. pro kombovaé a dstačí studum, OSTRAVA 4 [7] J.Novovčová: Pravděpodobost a matematcká statstka, skrptum 6 [8] Wjesghe, L.D., Mahmood, T., Scott, D.J.A., Berrdge, D.C., Ket, P.J., Kester, R.C.: Comparso of POSSUM ad the Portsmouth predctor equato for predctg death followg vascular surgery, 998 [9] P.Jahoda: Zpřesěá expoecálí aalýza, OSTRAVA Použtý software: MatLab, Excel, Word, Statgraphcs.

46 SEZNAM PŘÍLOH 4 Sezam příloh A Příloha CD se zdrojovým kódy

Testování statistických hypotéz

Testování statistických hypotéz Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím

Více

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D. Odhady parametrů základího souboru Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt celou populac, provádíme

Více

Metody zkoumání závislosti numerických proměnných

Metody zkoumání závislosti numerických proměnných Metody zkoumáí závslost umerckých proměých závslost pevá (fukčí) změě jedoho zaku jedozačě odpovídá změa druhého zaku (podle ějakého fukčího vztahu) (matematka, fyzka... statstcká (volá) změám jedé velčy

Více

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D. Odhady parametrů základího souboru Ig. Mchal Dorda, Ph.D. Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl σ atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt

Více

a další charakteristikou je četnost výběrového souboru n.

a další charakteristikou je četnost výběrového souboru n. Předáška č. 8 Testováí rozptylu, testy relatví četost, testy dobré shody, test ezávslost kvaltatvích zaků Testy rozptylu Testy se používají k ověřeí hypotézy o určté velkost rozptylu a k ověřeí vztahu

Více

Generování dvojrozměrných rozdělení pomocí copulí

Generování dvojrozměrných rozdělení pomocí copulí Pravděpodobost a matematcká statstka eerováí dvojrozměrých rozděleí pomocí copulí umbelova copule PRAHA 005 Vpracoval: JAN ZÁRUBA OBSAH: CÍL PRÁCE TEORIE Metoda verzí trasformace O copulích Sklarova věta

Více

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i : ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru

Více

, jsou naměřené a vypočtené hodnoty závisle

, jsou naměřené a vypočtené hodnoty závisle Měřeí závslostí. Průběh závslost spojtá křvka s jedoduchou rovcí ( jedoduchým průběhem), s malým počtem parametrů, která v rozmezí aměřeých hodot vsthuje průběh závslost, určeí kokrétího tpu křvk (přímka,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA Matematka IV PRAVDĚPODOBNOT A TATITIKA Lbor Žák Matematka IV Lbor Žák Regresí aalýza Regresí aalýza zkoumá závslost mez ezávslým proměým X ( X,, X k a závsle proměou Y. Tato závslost se vjadřuje ve tvaru

Více

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC 5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC V této kaptole se dozvíte: jak je defováa fukce přrozeá odmoca v kompleím oboru a jaké má vlastost včetě odlšostí od odmocy v reálém

Více

VŠB Technická univerzita Ostrava DISKRIMINAČNÍ ANALÝZA JAKO NÁSTROJ PRO HODNOCENÍ CHIRURGICKÝCH RIZIK

VŠB Technická univerzita Ostrava DISKRIMINAČNÍ ANALÝZA JAKO NÁSTROJ PRO HODNOCENÍ CHIRURGICKÝCH RIZIK VŠB Techcká uverzta Ostrava Fakulta elektrotechky a formatky DISKRIMINAČNÍ ANALÝZA JAKO NÁSTROJ PRO HODNOCENÍ CHIRURGICKÝCH RIZIK Dzertačí práce Studjí obor: Školtel: Doktoradka: Výpočetí a aplkovaá matematka

Více

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A Nejstoty měřeí Pro každé přesé měřeí potřebujeme formac s jakou přesostí bylo měřeí provedeo. Nejstota měřeí vyjadřuje terval ve kterém se achází skutečá hodota měřeé velčy s určtou pravděpodobostí. Nejstota

Více

9. Měření závislostí ve statistice. 9.1. Pevná a volná závislost

9. Měření závislostí ve statistice. 9.1. Pevná a volná závislost Dráha [m] 9. Měřeí závslostí ve statstce Měřeí závslostí ve statstce se zývá především zkoumáím vzájemé závslost statstckých zaků vícerozměrých souborů. Závslost přtom mohou být apříklad pevé, volé, jedostraé,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP4 Přpomeutí pojmů PRAVDĚPODOBNOST A STATISTIKA SP4 Přpomeutí pojmů SP4 Přpomeutí pojmů Pravděpodobost Náhodý jev: - základí prostor - elemetárí áhodý jev A - áhodý jev, - emožý jev, jstý jev podjev opačý

Více

Spolehlivost a diagnostika

Spolehlivost a diagnostika Spolehlvost a dagostka Složté systémy a jejch spolehlvost: Co je spolehlvost? Vlv spolehlvost kompoetů systému Návrh systému z hledska spolehlvost Aplkace - žvotě důležté systémy - vojeské aplkace Teore

Více

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností 4.2 Elemetárí statstcké zpracováí Výsledkem statstckého zjšťováí (. etapa statstcké čost) jsou euspořádaá, epřehledá data. Proto 2. etapa statstcké čost zpracováí, začíá většou jejch utříděím, zpřehleděím.

Více

Mendelova univerzita v Brně Statistika projekt

Mendelova univerzita v Brně Statistika projekt Medelova uverzta v Brě Statstka projekt Vypracoval: Marek Hučík Obsah 1. Úvod... 3. Skupové tříděí... 3 o Data:... 3 o Počet hodot:... 3 o Varačí rozpětí:... 3 o Počet tříd:... 4 o Šířka tervalu:... 4

Více

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs. Předáška V. Úvod do teore odhadu Pojmy a prcpy teore odhadu Nestraé odhady Metoda mamálí věrohodost Průměr vs. medá Opakováí výběrová dstrbučí fukce Sestrojíme výběrovou dstrbučí fukc pro výšku a váhu

Více

11. Časové řady. 11.1. Pojem a klasifikace časových řad

11. Časové řady. 11.1. Pojem a klasifikace časových řad . Časové řad.. Pojem a klasfkace časových řad Specfckým statstckým dat jsou časové řad pomocí chž můžeme zkoumat damku jevů v čase. Časovou řadou (damcká řada, vývojová řada) rozumíme v čase uspořádaé

Více

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014. Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95

Více

12. Neparametrické hypotézy

12. Neparametrické hypotézy . Neparametrcké hypotézy V této část se budeme zabývat specálí částí teore statstckých hypotéz tzv. eparametrckým hypotézam ebo jak řečeo eparametrckým statstckým testy. Neparametrcké se azývají proto,

Více

Lineární regrese ( ) 2

Lineární regrese ( ) 2 Leárí regrese Častým úolem je staoveí vzájemé závslost dvou (č více) fzálích velč a její matematcé vjádřeí. K tomuto účelu se používají růzé regresí metod, pomocí chž hledáme vhodou fuc f (), apromující

Více

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013. Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95

Více

Úvod do korelační a regresní analýzy

Úvod do korelační a regresní analýzy Úvod do korelačí a regresí aalýz Bude ás zajímat, jak těsě spolu souvsí dva sledovaé jev Příklad: vztah mez rchlostí auta a brzdou dráhou vztah mez věkem žáka a rchlostí v běhu a 60 m vztah mez spotřebou

Více

Chyby přímých měření. Úvod

Chyby přímých měření. Úvod Chyby přímých měřeí Úvod Př zjšťováí velkost sledovaé velčy dochází k růzým chybám, které ovlvňují celkový výsledek. V pra eestuje žádá metoda měřeí a měřcí zařízeí, které by bylo absolutě přesé, což zameá,

Více

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru Lekce Normálí rozděleí v rově V této lekc se udeme věovat měřeí korelačí závslost dvojce áhodých velč (dvousložkového áhodého vektoru) Vcházet udeme z ormálího rozděleí pravděpodoost áhodého vektoru v

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOT A TATITIKA Přpomeutí pojmů,, P m θ, R θ R - pravděpodobostí prostor - parametrcký prostor - parametrcká fukce,, T - áhodý vektor defovaý a pravděpodobostím prostoru,, P θ s hustotou f x,

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2 SP3 Neparametrcké testy hypotéz PRAVDĚPODOBNOST A STATISTIKA Neparametrcké testy hypotéz čast Lbor Žák SP3 Neparametrcké testy hypotéz Lbor Žák Neparametrcké testy hypotéz - úvod Neparametrcké testy statstckých

Více

8 NELINEÁRNÍ REGRESNÍ MODELY

8 NELINEÁRNÍ REGRESNÍ MODELY 8 NELINEÁRNÍ REGRESNÍ MODELY 8 Tvorba eleárího regresího modelu Postup tvorby eleárího regresího modelu se dá rozčlet do těchto kroků: Návrh regresího modelu Obvykle se jako eleárí regresí model používá

Více

Úvod do teorie měření

Úvod do teorie měření Uverzta Jaa Evagelsty Purkyě v Ústí ad Labem Přírodovědecká fakulta Úvod do teore měřeí Prof. Chlář emář 0 Průměr, rozptyl a směrodatá odchylka X = X = ( X X ) = = = Výpočty pomocí vzorců a pomocí statstckých

Více

Odhady parametrů 1. Odhady parametrů

Odhady parametrů 1. Odhady parametrů Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě:

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP esty dobré shody PRAVDĚPODOBNOS A SAISIKA Lbor Žá SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Chí-vadrát testem terý e založe a tříděém statstcém souboru. SP esty

Více

12. N á h o d n ý v ý b ě r

12. N á h o d n ý v ý b ě r 12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých

Více

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna. 6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola

Více

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě. 3. Hodoceí přesost měřeí a vytyčováí. Odchylky a tolerace ve výstavbě. 3.1 Úvod o měřeí obecě 3.2 Chyby měřeí a jejch děleí 3.2.1 Omyly a hrubé chyby 3.2.2 Systematcké chyby 3.2.3 Náhodé chyby 3.3 Výpočet

Více

Univerzita Karlova v Praze Pedagogická fakulta

Univerzita Karlova v Praze Pedagogická fakulta Uverzta Karlova v Praze Pedagogcká fakulta SEMINÁRNÍ PRÁCE Z OBECNÉ ALGEBRY DĚLITELNOST CELÝCH ČÍSEL V SOUSTAVÁCH O RŮZNÝCH ZÁKLADECH / Cfrk C. Zadáí: Najděte pět krtérí pro děltelost v jých soustavách

Více

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz: Ig. Marta Ltschmaová Statstka I., cvčeí 1 TESTOVÁNÍ NEPARAMETRICKÝCH HYPOTÉZ Dosud jsme se zabýval testováím parametrcký hypotéz, což jsou hypotézy o parametrech rozděleí (populace). Statstckým hypotézám

Více

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat 4. Korelace 4. Teoretcké základy korelace 4. Způsoby měřeí závslostí pro růzé typy dat Př prác se statstckým údaj se velm často setkáváme s daty, která jsou tvořea dvojcem, trojcem hodot. Složky takovýchto

Více

Intervalové odhady parametrů některých rozdělení.

Intervalové odhady parametrů některých rozdělení. 4. Itervalové odhady parametrů rozděleí. Jedou ze základích úloh mtematické statistiky je staoveí hodot parametrů rozděleí, ze kterého máme k dispozici áhodý výběr. Nejčastěji hledáme odhady dvou druhů:

Více

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění Předáška č. 0 Aalýza roztylu ř jedoduchém tříděí Aalýza roztylu je statstcká metoda, kterou se osuzuje romělvost oakovaých realzací áhodého okusu tj. romělvost áhodé velčy. Náhodá velča vzká za relatvě

Více

[ jednotky ] Chyby měření

[ jednotky ] Chyby měření Chyby měřeí Provedeme-l určté měřeí za stejých podmíek vícekrát, jedotlvá měřeí se mohou odlšovat (z důvodu koečé rozlšovací schopost měř. přístrojů, áhodých vlvů apod.). Chyba měřeí: e = x x x...přesá

Více

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n Regrese Aproxmace metodou ejmeších čtverců v v ( ) = f x v v x x x x Je dáo bodů [x, ], =,,, předpoládáme závslost a x a chceme ajít fuc, terá vsthuje teto tred - Sažíme se proložt fuc = f x ta, ab v =

Více

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu Cvičeí 6: Výpočet středí hodoty a rozptylu, bodové a itervalové odhady středí hodoty a rozptylu Příklad 1: Postupě se zkouší spolehlivost čtyř přístrojů Další se zkouší je tehdy, když předchozí je spolehlivý

Více

S1P Popisná statistika. Popisná statistika. Libor Žák

S1P Popisná statistika. Popisná statistika. Libor Žák SP Popsá statstka Popsá statstka Lbor Žák SP Popsá statstka Lbor Žák Základí zdroje : skrpta Mateatka IV - doc. RNDr. Z. Karpíšek, CSc. ateatka o le - http://athole.fe.vutbr.cz/ Základ ateatcké statstk

Více

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc. Metody statstcké aalýzy doc. Ig. Dagmar Blatá, CSc. Bakoví sttut vysoká škola, a.s. Praha 0 METODY STATISTICKÉ ANALÝZY Autor: Recezet: Vydal: Tsk: Vydáí: doc. Ig. Dagmar Blatá, CSc. doc. Ig. Jří Trešl,

Více

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2 Iterpolace pomocí sple křvky dáo: bodů v rově úkol: alézt takovou křvku, která daým body prochází y f f 2 f 0 f x0 x... x 2 x x Iterpolace pomocí sple křvky evýhodou polyomálí terpolace změa ěkterého z

Více

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou 4. Testováí statistických hypotéz Úvod Při práci s daty se mohdy spokojujeme s itervalovým či bodovým odhadem parametrů populace. V mohých případech se však uchylujeme k jiému postupu, většiou jde o případy,

Více

KVALITA REGRESNÍHO MODELU Radek Fajfr

KVALITA REGRESNÍHO MODELU Radek Fajfr UNIVERZITA PARDUBICE FAKULTA EKONOMICKO-SPRÁVNÍ KVALITA REGRESNÍHO MODELU Radek Fajfr Bakalářská práce 00 Prohlášeí Tuto prác jsem vypracoval samostatě. Veškeré lterárí pramey a formace, které jsem v

Více

1. Základy měření neelektrických veličin

1. Základy měření neelektrických veličin . Základ měřeí eelektrckých velč.. Měřcí řetězec Měřcí řetězec (měřcí soustava) je soubor měřcích čleů (jedotek) účelě uspořádaých tak, ab blo ožě splt požadovaý úkol měřeí, tj. získat formac o velkost

Více

Statistika - vícerozměrné metody

Statistika - vícerozměrné metody Statstka - vícerozměré metody Mgr. Mart Sebera, Ph.D. Katedra kezologe Masarykova uverzta Fakulta sportovích studí Bro 0 Obsah Obsah... Sezam obrázků... 4 Sezam tabulek... 4 Úvod... 6 Pojmy... 7 Náhodé

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresí a korelačí aalýza Závslost příčá (kauzálí). Závslostí pevou se ozačuje případ, kdy výskytu jedoho jevu utě odpovídá výskyt druhé jevu (a často aopak). Z pravděpodobostího hledska jde o vztah, který

Více

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady SP Bodové a tervalové odhady PRAVDĚPODOBNOST A STATISTIKA Bodové a tervalové odhady Lbor Žák SP Bodové a tervalové odhady Lbor Žák Bodové a tervalové odhady Nechť je áhodá proměá, která má dstrbučí fukc

Více

Náhodný výběr 1. Náhodný výběr

Náhodný výběr 1. Náhodný výběr Náhodý výběr 1 Náhodý výběr Matematická statistika poskytuje metody pro popis veliči áhodého charakteru pomocí jejich pozorovaých hodot, přesěji řečeo jde o určeí důležitých vlastostí rozděleí pravděpodobosti

Více

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti. 10 Cvičeí 10 Statistický soubor. Náhodý výběr a výběrové statistiky aritmetický průměr, geometrický průměr, výběrový rozptyl,...). Bodové odhady parametrů. Itervalové odhady parametrů. Jedostraé a oboustraé

Více

Náhodné jevy, jevové pole, pravděpodobnost

Náhodné jevy, jevové pole, pravděpodobnost S Náhodé jevy pravděpodobost Náhodé jevy jevové pole pravděpodobost Lbor Žák S Náhodé jevy pravděpodobost Lbor Žák Základí pojmy Expermet česky též vědecký pokus je soubor jedáí a pozorováí jehož účelem

Více

2. Vícekriteriální a cílové programování

2. Vícekriteriální a cílové programování 2. Vícerterálí a cílové programováí Úlohy vícerterálího programováí jsou úlohy, ve terých se a možě přípustých řešeí optmalzuje ěol salárích rterálích fucí. Moža přípustých řešeí je přtom defováa podobě

Více

Testování statistických hypotéz

Testování statistických hypotéz Testováí statstckých hyotéz Př statstckých šetřeích se často setkáváme s roblémy tohoto druhu () Máme zjstt, zda dva daé vzorky ocházejí z téhož ZS. () Máme rozhodout, zda rozdíly hodot růměrů (res. roztylů)

Více

8. Analýza rozptylu.

8. Analýza rozptylu. 8. Aalýza rozptylu. Lieárí model je popis závislosti, který je využívá v řadě disciplí matematické statistiky. Uvedeme jeho popis a tvrzeí, která budeme využívat. Setkáme se s ím jedak v aalýze rozptylu,

Více

P1: Úvod do experimentálních metod

P1: Úvod do experimentálních metod P1: Úvod do epermetálích metod Chyby a ejstoty měřeí - Každé měřeí je zatížeo určtou epřesostí, která je způsobea ejrůzějším egatvím vlvy, vyskytujícím se v procesu měřeí. - Výsledek měřeí se díky tomu

Více

Deskriptivní statistika 1

Deskriptivní statistika 1 Deskriptiví statistika 1 1 Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 1145/2004. Základí charakteristiky souboru Pro lepší představu používáme k popisu vlastostí zkoumaého jevu určité charakteristiky

Více

VY_52_INOVACE_J 05 01

VY_52_INOVACE_J 05 01 Název a adresa školy: Středí škola průmyslová a umělecká, Opava, příspěvková orgazace, Praskova 399/8, Opava, 74601 Název operačího programu: OP Vzděláváí pro kokureceschopost, oblast podpory 1.5 Regstračí

Více

Optimalizace portfolia

Optimalizace portfolia Optmalzace portfola ÚVOD Problémy vestováí prostředctvím ákupu ceých papírů sou klasckým tématem matematcké ekoome. Celkový výos z portfola má v době rozhodováí o vestcích povahu áhodé velčy, eíž rozložeí

Více

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu Cvičeí 6: Bodové a itervalové odhady středí hodoty, rozptylu a koeficietu korelace, test hypotézy o středí hodotě při zámém rozptylu Příklad : Bylo zkoumáo 9 vzorků půdy s růzým obsahem fosforu (veličia

Více

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu Vědeckotechcký sorík ČD č. 3/0 Leka Zahradíková Model poptávky po železčí osoí dopravě Českých drah, a. s. a tuzemském přepravím trhu Klíčová slova: poptávka, osoí doprava, České dráhy, regresí aalýza,

Více

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky Téma 6.: Základí pojmy matematické statistiky Vlastosti důležitých statistik odvozeých z jedorozměrého áhodého výběru: Nechť X,..., X je áhodý výběr z rozložeí se středí hodotou μ, rozptylem σ a distribučí

Více

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesé výchovy VYBRANÉ NEPARAMETRICKÉ STATISTICKÉ POSTUPY V ANTROPOMOTORICE Zdeěk Havel Davd Chlář 0 VYBRANÉ NEPARAMETRICKÉ

Více

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE Praha 8 Pavel Třasák ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ

Více

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor 1 Měřeí závlot tattckých zaků 1.1 Dvourozměrý tattcký oubor Př aalýze ekoomckých kutečotí á čato ezajímají jedotlvé velč jako takové, ale vztah mez m. Ptáme e, jak záví poptávka a ceě produktu, plat zamětaců

Více

14. B o d o v é o d h a d y p a r a m e t r ů

14. B o d o v é o d h a d y p a r a m e t r ů 4. B o d o v é o d h a d y p a r a m e t r ů Na základě hodot áhodého výběru z rozděleí určitého typu odhadujeme parametry tohoto rozděleí, tak aby co ejlépe odpovídaly hodotám výběru. Formulujme tudíž

Více

Jednoduchá lineární regrese

Jednoduchá lineární regrese Jedoduchá leárí regrese Motvace: Cíl regresí aalýz - popsat závslost hodot velč Y a hodotách velč X. Nutost vřešeí dvou problémů: a) jaký tp fukce se použje k popsu daé závslost; b) jak se staoví kokrétí

Více

11. Popisná statistika

11. Popisná statistika . Popsá statstka.. Pozámka: Př statstckém zkoumáí ás zajímají hromadé jevy a procesy, u kterých zkoumáme zákotost, které se projevují u velkého počtu prvků. Prvky zkoumáí azýváme statstcké jedotky. Př

Více

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor SP Náhodý vektor PRAVDĚPODOBNOS A SAISIKA Náhodý vektor SP Náhodý vektor Náhodý vektor Náhodý vektor slouží k popsu výsledku pokusu kdy měříme více údaů o procesu. Před provedeím pokusu eho výsledek a

Více

Testování hypotéz. 3.1 Základní pojmy a obecný postup při testování

Testování hypotéz. 3.1 Základní pojmy a obecný postup při testování Lekce 3 Testováí hypotéz Vlajkovou lodí matematcké statstky jsou techky testováí hypotéz. Formulace hypotéz a jejch ověřováí jsou základím mechasmem postupu ldského pozáí. Pokud jsou formace, potřebé k

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 6. KAPITOLA CENTRÁLNÍ LIMITNÍ VĚTA 6.11.2017 Opakováí: Čebyševova erovost příklad Pravděpodobost vyrobeí zmetku je 0,5. Odhaděte pravděpodobost,

Více

1.1 Definice a základní pojmy

1.1 Definice a základní pojmy Kaptola. Teore děltelost C. F. Gauss: Matematka je královou všech věd a teore čísel je králova matematky. Základím číselým oborem se kterým budeme v této kaptole pracovat jsou celá čísla a pouze v ěkterých

Více

APLIKOVANÁ STATISTIKA

APLIKOVANÁ STATISTIKA VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA MANAGEMENTU A EKONOMIKY VE ZLÍNĚ APLIKOVANÁ STATISTIKA FRANTIŠEK PAVELKA PETR KLÍMEK ZLÍN 000 Recezoval: Haa Lošťáková Fratšek Pavelka, Petr Klímek, 000 ISBN 80 4

Více

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE KATEDRA FYZIKY LABORATORNÍ CVIČENÍ Z FYZIKY Jméo: Petr Česák Datum měřeí:.3.000 Studjí rok: 999-000, Ročík: Datum odevzdáí: 6.3.000 Studjí skupa: 5 Laboratorí skupa:

Více

4. B o d o v é o d h a d y p a r a m e t r ů

4. B o d o v é o d h a d y p a r a m e t r ů 4. B o d o v é o d h a d y p a r a m e t r ů Na základě hodot áhodého výběru z rozděleí určitého typu odhadujeme parametry tohoto rozděleí, tak aby co ejlépe odpovídaly hodotám výběru. Formulujme tudíž

Více

Přednáška č. 2 náhodné veličiny

Přednáška č. 2 náhodné veličiny Předáša č. áhodé velčy Pozámy záladím pojmům z počtu pravděpodobost Pozáma 1: Př výpočtu pravděpodobost áhodého jevu dle lascé defce je uté věovat pozorost způsobu formulace vybraého jevu. V ásledující

Více

Doc. Ing. Dagmar Blatná, CSc.

Doc. Ing. Dagmar Blatná, CSc. PRAVDĚPODOBNOST A STATISTIKA Doc. Ig. Dagmar Blatá, CSc. Statsta statstcé údaje o hromadých jevech čost, terá vede zísáí statstcých údajů a jejch zpracováí teore statsty - věda o stavu, vztazích a vývoj

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017 Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí

Více

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení. MATEMATICKÁ STATISTIKA - a základě výběrových dat uuzujeme a obecější kutečot, týkající e základího ouboru; provádíme zevšeobecňující (duktví) úudek - duktví uuzováí pomocí matematcko-tattckých metod je

Více

SP2 Korelační analýza. Korelační analýza. Libor Žák

SP2 Korelační analýza. Korelační analýza. Libor Žák Korelačí aalýza Přpomeutí pojmů áhodá proměá áhodý vetor áhodý vetor Náhodý výběr: pro áhodou proměou : pro áhodý vetor : pro áhodý vetor : Přpomeutí pojmů - ovarace Kovarace áhodých proměých ovaračí oefcet

Více

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor SP Náhodý vektor PRAVDĚPODOBNOS A SAISIKA Náhodý vektor Lbor Žák SP Náhodý vektor Lbor Žák Náhodý vektor Náhodý vektor slouží k popsu výsledku pokusu kdy měříme více údaů o procesu. Před provedeím pokusu

Více

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů: Odhady parametrů polohy a rozptýleí pro často se vyskytující rozděleí dat v laboratoři se vyčíslují podle ásledujících vztahů: a : Laplaceovo (oboustraé expoeciálí rozděleí se vyskytuje v případech, kdy

Více

Lineární regresní model (VJ REGMOD-2)

Lineární regresní model (VJ REGMOD-2) eárí regresí model (VJ REGOD-) Základí formace V rámc této výukové jedotky s adefujeme leárí regresí model a sezámíme se s typy proměých využtelých jako predktory (vysvětlující proměé) v takovém modelu.

Více

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod . egresí aalýza Čas ke studu kaptoly: 6 mut Cíl Po prostudováí tohoto odstavce udete umět vysvětlt pojem oecý leárí model prcp leárího regresího modelu používat výsledky regresí aalýzy verfkovat regresí

Více

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

jsou varianty znaku) b) při intervalovém třídění (hodnoty x Výběr z eřeštelých příkladů ze zkouškových testů Jde o výběr z tpů příkladů, jejchž úspěšost řešeí u zkoušek se blíží ule. Itervalové versus bodové tříděí V tabulce je uvedeo rozděleí četostí a) př bodovém

Více

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací 3. Náhodý výběr Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých realizací

Více

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY Přírodovědecká fakulta ANALÝZA DAT. upraveé vydáí Josef Tvrdík OSTRAVSKÁ UNIVERZITA 008 OBSAH: Úvod... 3 Parametrcké testy o shodě středích hodot... 4. Jedovýběrový t-test...

Více

3. Lineární diferenciální rovnice úvod do teorie

3. Lineární diferenciální rovnice úvod do teorie 3 338 8: Josef Hekrdla lieárí difereciálí rovice úvod do teorie 3 Lieárí difereciálí rovice úvod do teorie Defiice 3 (lieárí difereciálí rovice) Lieárí difereciálí rovice -tého řádu je rovice, která se

Více

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL Difereciálí počet fukcí jedé reálé proměé - 6. - PRVNÍ DIFERENCIÁL TAYLORŮV ROZVOJ FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL PŘÍKLAD Pomocí věty o prvím difereciálu ukažte že platí přibližá rovost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Bodové a itervalové odhady Nechť X je áhodá proměá, která má distribučí fukci F(x, ϑ). Předpokládejme, že záme tvar distribučí fukce (víme jaké má rozděleí) a ezáme parametr

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP Záko velkých čísel, cetrálí lmtí věta PRAVDĚPODOBNOST A STATISTIKA Lbor Žák SP Záko velkých čísel, cetrálí lmtí věta Lbor Žák Kovergece podle pravděpodobost Posloupost áhodých proměých,,,, koverguje

Více

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky). Statstka. Základí pojmy Statstcký soubo - daá koečá, epázdá moža M předmětů pozoováí, majících jsté společé vlastost (událost, věc,.) Jedotlvé pvky této možy se azývají pvky statstckého soubou (statstcké

Více

Pravděpodobnostní modely

Pravděpodobnostní modely Pravděpodobostí modely Meu: QCEpert Pravděpodobostí modely Modul hledá metodou maimálí věrohodosti (MLE Maimum Likelihood Estimate) statistický model (rozděleí) který ejlépe popisuje data. Je přitom k

Více

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL Elea Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy POPISNÁ STATISTIKA V PROGRAMU MS EXCEL RYCHLÝ NÁHLED KAPITOLY Žádý výzkum se v deší době evyhe statistickému zpracováí dat. Je jedo,

Více

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby. ováí - Hru IV /6 ováí Hru IV Mila RůžR ůžička, Josef Jureka,, Zbyěk k Hrubý zbyek.hruby hruby@fs.cvut.cz ováí - Hru IV /6 ravděpodobostí úavové diagramy s uvažováím předpětí R - plocha ve čtyřrozměrém

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 3. ÚKOL JB TEST 3. Úkol zadáí pro statistické testy U každého z ásledujících testů uveďte ázev (včetě autora), předpoklady použití, ulovou

Více

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Přednáška VIII. Testování hypotéz o kvantitativních proměnných Předáška VIII. Testováí hypotéz o kvatitativích proměých Úvodí pozámky Testy o parametrech rozděleí Testy o parametrech rozděleí Permutačí testy Opakováí hypotézy Co jsou to hypotézy a jak je staovujeme?

Více