VŠB - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra aplikované matematiky. Diplomová práce Michal Běloch

Rozměr: px
Začít zobrazení ze stránky:

Download "VŠB - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra aplikované matematiky. Diplomová práce. 2014 Michal Běloch"

Transkript

1 VŠB - Techncká unverzta Ostrava Fakulta elektrotechnky a nformatky Katedra aplkované matematky Dplomová práce 204 Mchal Běloch

2 VŠB - Techncká unverzta Ostrava Fakulta elektrotechnky a nformatky Katedra aplkované matematky Vybrané statstcké nástroe pro verfkac logstckých regresních modelů Advanced statstcal tools for verfcaton of the logstc regresson models 204 Mchal Běloch - 2 -

3 - 3 -

4 Zadání dplomové práce Student: Studní program: Studní obor: Bc. Mchal Běloch N2647 Informační a komunkační technologe 03T03 Výpočetní matematka Téma: Vybrané statstcké nástroe pro verfkac logstckých regresních modelů. Advanced statstcal tools for verfcaton of the logstc regresson models. Zásady pro vypracování: Logstcká regrese e zvláštní zeména tím, že vysvětlovaná proměnná e zde bnární dskrétní proměnná. Nečastě e logstcká regrese využívána pro účely zpracování lékařských dat. Cílem této práce e vytvoření matematckého aparátu (zeména eho PC mplementace) pro posouzení vhodnost buď předpokládaných nebo nově generovaných logstckých regresních modelů. Postup práce:. Studum základů logstcké regresní analýzy. 2. Předběžné posouzení logstckého modelu pomocí lneární a exponencální analýzy, algortmzace. 3. Studum statstckých testů pro posouzení vhodnost modelů v logstcké regres. 4. Algortmcké zpracování a počítačová mplementace vybraných testů této kategore. 5. Provedení a vyhodnocení těchto testů na vzorku lékařských dat dle nstrukcí vedoucího práce. Seznam doporučené odborné lteratury:. Hosmer D.W., Lemeshow S., Appled Logstc Regresson, Wley 2000, ISBN Hebák P., Hustopecký J., Malá I., Vícerozměrné statstcké metody (2), INFORATORIUM 2005, ISBN

5 Prohlašu, že sem tuto dplomovou prác vypracoval samostatně. Uvedl sem všechny lterární prameny a publkace, ze kterých sem čerpal. V Ostravě dne 07. května

6 Rád bych zde poděkoval svému vedoucímu prof. Ing. Radmu Bršov, Csc. za poskytnutá data, lteraturu a odbornou pomoc a rovněž své rodně a přátelům za snahu pochopt vše, co dělám

7 Abstrakt První část této práce se zabývá tvorbou logstckých regresních modelů za účelem zhodnocení morbdty pacentů s rakovnou kolorekta. Druhá část se zaměřue na metody verfkace logstckých regresních modelů a ech algortmzac v programovacím azyce R. Klíčová slova exponencální analýza, lneární analýza, logstcká regrese, morbdta, R, verfkace modelu Abstract Frst part of ths work talks about logstc regresson and ts use n evaluaton of morbdty of colorectal cancer patents. Second part focuses on verfcaton methods for logstc regresson and creaton of algorthms n R programmng language. Keywords exponental analyss, lnear analyss, logstc regresson, morbdty, R, model verfcaton - 7 -

8 Seznam použtých symbolů a zkratek FNO MMV POSSUM Fakultní nemocnce Ostrava Poruba Metoda maxmální věrohodnost Physologcal and Operatve Severty Score for the enumeraton of Mortalty and Morbdty

9 Seznam obrázků obr. : Výstup algortmu pro exponencální analýzu v R obr. 2: Koláčový graf pro rozložení pohlaví datového souboru obr. 3: Koláčový graf pro způsob operace obr. 4: Krabcový graf zachycuící věkové rozložení pacentů obr. 5: Výskyt komplkací v závslost na FS a OS u pacentů operovaných laparoskopcky obr. 6: Výskyt komplkací v závslost na FS a OS u pacentů operovaných otevřenou metodou

10 Seznam tabulek tab. : Možnost př testování hypotéz... 6 tab. 2: Rozhodování na základě p-value... 6 tab. 3: Tabulka lneární analýzy tab. 4: Vzorek dat tab. 5: Příklad lneární analýzy pro vzorek dat tab. 6: Příklad exponencální analýzy pro vzorek dat tab. 7: Příklad vylepšené exponencální analýzy pro vzorek dat tab. 8: Rozložení velčn pro danou metodku tab. 9: Získání operačního skóre tab. 0: Získání fyzologckého skóre tab. : Lneární analýza pro pacenty operované laparoskopcky tab. 2: Lneární analýza pro pacenty operované otevřenou metodou tab. 3: Exponencální analýza pro pacenty operované laparoskopcky... 4 tab. 4: Exponencální analýza pro pacenty operované otevřenou metodou... 4 tab. 5: P-value pro ednotlvé testy tab. 6: Lneární analýza pro pacenty operované laparoskopcky tab. 7: Exponencální analýza pro pacenty operované laparoskopcky tab. 8: Vylepšená exponencální analýza pro pacenty operované laparoskopcky tab. 9: P-value pro ednotlvé testy tab. 20: Lneární analýza pro pacenty operované otevřenou metodou tab. 2: Exponencální analýza pro pacenty operované otevřenou metodou tab. 22: Vylepšená exponencální analýza pro pacenty operované otevřenou metodou.. 48 tab. 23: P-value pro ednotlvé testy

11 Obsah. Úvod Logstcká regrese Testování hypotéz Testové krtérum Chyba I. a II. druhu Čstý test významnost Metoda maxmální věrohodnost Jednorozměrná logstcká regrese Testování významnost koefcentů Vícerozměrná logstcká regrese Testování významnost koefcentů Verfkace modelu Lneární analýza Exponencální analýza Vylepšená exponencální analýza Pearsonova statstka a devance Hosmer Lemeshowy testy Pops algortmů R Požadavky na vstup Lneární a exponencální analýza Funkce vraceící p-value Zpracování dodaných dat Datový soubor Operační a fyzologcké skóre, model POSSUM Aplkace známých modelů Vytvoření nového modelu Verfkace nového modelu Verfkace modelu pro laparoskopckou operac Verfkace modelu pro otevřenou operac

12 6. Závěr Lteratura a reference

13 Úvod. Úvod Rakovna kolon a rekta, obvykle souhrnně označována ako rakovna kolorekta, patří do pětce nečastěších rakovnových onemocnění ak u nás, tak ve světě. Z tohoto důvodu e tomuto typu rakovny věnována vysoká pozornost většny lékařských zařízení. Obrovský pokrok medcíny na přelomu tsícletí vedl k vyvnutí léčebných postupů, které umožňuí úspěšnou léčbu této zákeřné choroby. Jednou takovou metodou e laparoskopcká operace. Tato moderní operační metoda s postupně získala značnou oblbu hlavně proto, že přnáší nemenší zátěž pro organsmus pacenta. V případě operací nás v konečném důsledku zaímaí dvě hodnoty: mortalta a morbdta. Z hledska mortalty e obvykle sledována časná mortalta, obvykle do třcet dnů od provedení operace. Sledování morbdty e obvykle komplkovaněší. Komplkací, které se mohou vyskytnout, e šroké spektrum a ne vždy musí být přímo způsobeny chrurgckým zásahem. Zřemě z tohoto důvodu se procentuální výskyt komplkací u provedených operací vyskytue v rozmezí od 4 % až po 26 %. Pro lékaře by byl velm užtečný nástro, který by byl schopen určt rzko výskytu komplkací. Mnoho lékařských pracovšť se touto problematkou zabývá a ž došlo k vytvoření mnoha skórovacích systémů. Jedním z takovýchto systémů e POSSUM (Physologcal and Operatve Severty Score for the enumeraton of Mortalty and Morbdty). Tento model byl vytvořen ž v roce 99 a e využíván neen pro odhad rzk u operací kolorekta, ale u ných typů zákroků, a e honě aplkován zeména ve Velké Brtán

14 Logstcká regrese 2. Logstcká regrese Logstcká regrese e dnes velce populární metoda. Přes skromné počátky v epdemologckém výzkumu se postupně dostala do dalších odvětví a v současnost se s ní můžeme setkat v bomedcíně, ekonomce, krmnalstce, ekolog a socolog. V této kaptole nadefnueme ednorozměrnou logstckou regres, kterou pak dále rozšíříme na vícerozměrnou verz. Rovněž se zde zaměříme na testování významnost ednotlvých koefcentů. Protože budeme dále používat testování hypotéz a metodu maxmální věrohodnost, nadefnueme nedříve tyto pomy. 2.. Testování hypotéz Statstckou hypotézou rozumíme výrok o rozdělení pozorované náhodné velčny. Tato hypotéza může poednávat o parametrech rozdělení náhodné velčny nebo o vlastnostech náhodné velčny. Test statstcké hypotézy mplkue rozhodovací proces, kdy na základě výběrového souboru rozhodueme o nezamítnutí nulové hypotézy, nebo o zamítnutí nulové hypotézy ve prospěch alternatvní hypotézy. Nulová hypotéza H 0 vyadřue nulovost sledovaného efektu. Obvykle e vyádřena rovností mez testovaným parametrem θ a eho očekávanou hodnotou θ 0. H : θ = θ 0 0 Alternatvní hypotéza H A e nám vybraná tak, aby popírala tvrzení dané nulové hypotézy. To nám tedy dává celkem čtyř možnost ak zformulovat alternatvní hypotézu. ) ) ) ) H : θ = θ A 2 H : θ θ A 3 H : θ < θ A H : θ > θ A 0-4 -

15 Logstcká regrese 2... Testové krtérum Obor hodnot testovaného parametru θ se dělí na dvě dsunktní množny. První e obor přetí V pro testovanou hypotézu H 0, druhý se nazývá krtcký obor W pro zamítnutí hypotézy H 0. Tento krtcký obor stanovueme tak, aby pravděpodobnost výskytu pozorované hodnoty testovaného parametru θ v něm byla velm malá. Hranc mez krtckým oborem a oborem přetí nazýváme krtcká hodnota testu t krt. Padne-l pozorovaná hodnota testovaného parametru θ do oboru přetí V, nulovou hypotézu H 0 nezamítáme. Padne-l do krtckého oboru W, pak nulovou hypotézu H 0 zamítáme ve prospěch alternatvy H A. Krtcký obor W lze popsat pomocí krtckého oboru W* testového krtéra T ( X ). Testové krtérum T ( X ) e výběrová charakterstka, která má vztah k nulové hypotéze H 0. Za předpokladu platnost nulové hypotézy H 0 známe rozdělení tohoto krtéra. Následně padne-l pozorovaná hodnota testového krtéra T ( X ) do krtckého oboru W*, zamítáme nulovou hypotézu H 0. V opačném případě H 0 nezamítáme Chyba I. a II. druhu Př testování hypotéz mohou nastat čtyř různé případy. Ke správnému rozhodnutí dospěeme tehdy, platí-l nulová hypotéza a my nezamítáme, nebo platí alternatvní hypotéza a my nulovou hypotézu zamítneme. V prvním případě hovoříme o spolehlvost testu a značíme α. Výhodou e, že s tuto hladnu určueme sam, a e nám tedy předem známa. Hodnotu α obvykle volíme 0,05, což nám dává spolehlvost 95%. Ve druhém případě hovoříme o síle testu, značíme β. Chyb se dopouštíme v případě zamítnutí nulové hypotézy tehdy, e-l ve skutečnost platná. Tuto chybu nazýváme chyba I. druhu, dopouštíme se í s pravděpodobností α a nazýváme hladna významnost. Chybou II. druhu značíme rozhodnutí, kdy nulovou hypotézu nezamítáme přesto, že ve skutečnost platí alternatva. Této chyby se dopouštíme s pravděpodobností β. Žádná z těchto chyb nelze zcela elmnovat, proto se snažíme postupovat tak, abychom se dopouštěl co nemenší chyby. Bohužel pokud snížíme β, zvyšueme zároveň hladnu významnost a naopak. Musíme tedy naít deální poměr těchto chyb. Spolehlvost testu s volíme sam. Sílu testu můžeme zvýšt volbou vhodné testovací metody. Nelepším způsobem, ak snížt β e ale zvýšení rozsahu našeho výběrového souboru. V tomto případě snžueme chybu II. druhu, anž bychom zvyšoval chybu I. druhu

16 Logstcká regrese Naše zštění Nezamítáme H 0 Zamítáme H 0 Skutečnost Platí H 0 Neplatí H 0 Správně -α: spolehlvost testu Chyba II. druhu β Chyba I. druhu α: hladna významnost Správně -β: síla testu tab. : Možnost př testování hypotéz Čstý test významnost Př testování hypotéz můžeme využít dvou přístupů. Prvním e klascký test, který e však v moderních aplkacích nahrazen druhým přístupem, čstým testem významnost. U klasckého testu e součástí vstupu hladna významnost α, zatímco u čstého testu tuto hodnotu a pror znát nemusíme. Postup př čstém testu významnost e: ) Formulace H 0 a H A 2) Volba testového krtéra T ( X ) 3) Výpočet pozorované hodnoty x obs testové statstky T ( X ) 4) Výpočet p-value 5) Rozhodnutí na základě p-value P-value e číselná hodnota, která nám říká, aká e nenžší hladna významnost, na které můžeme nulovou hypotézu H 0 zamítnout, a zároveň nevyšší hladna významnost, na níž se už nulová hypotéza H 0 nezamítá. S klesaící hodnotou p-value roste výpověď náhodného výběru prot nulové hypotéze H 0. K rozhodování tedy využíváme následuící schéma: P-value Rozhodnutí < α Zamítnutí H 0 ve prospěch H A > α Nezamítnutí H 0 tab. 2: Rozhodování na základě p-value 2.2. Metoda maxmální věrohodnost MMV e ednoduchá metoda používaná pro konstrukc odhadů neznámých parametrů známých rozdělení pravděpodobnost. Př MMV maxmalzueme věrohodnostní funkc, která představue sdruženou hustotu pravděpodobnost daného náhodného výběru, chápanou ako funkc neznámých parametrů. Odhady získané touto metodou se obvykle vyznačuí dobrým statstckým vlastnostm

17 Logstcká regrese Nechť ( t t ) e náhodný výběr z rozdělení s hustotou ( ; ),..., T n parametr. Snažíme se naít tzv. věrohodnostní funkc danou a z ní získat ˆΘ tak, aby ( t t ) n L t,..., t ; f t ; f t ;... f t ; f t ; f t Θ, kde Θ e neznámý ( Θ ) = ( Θ) ( Θ) ( Θ ) = ( Θ) n 2 n = ˆ ˆ,..., n Θ = Θ bylo co nelepším odhadem pro Θ. Pravá strana rovnce e sdružená hustota pravděpodobnost n-nezávslých proměnných ( t,..., t n ) se steným rozdělením. Věrohodnostní funkce L e funkcí neznámého parametru Θ, který e odhadován. Metoda maxmální věrohodnost e založena na nalezení takové hodnoty Θ, aby hodnota věrohodnostní funkce L byla maxmální. Praktcké aplkace ukázaly, že e výhodněší maxmalzovat funkc ln L. Maxmálně věrohodným odhadem parametru Θ nazveme hodnotu parametru získanou z této rovnce: ( ) ln L t,..., t n ; Θ = Θ 0. Pokud e hledaných parametrů více, přede výše uvedená rovnce na soustavu rovnc ( tn p ) ln L t,..., ; Θ,..., Θ = 0 pro =,2,..., p a eím vyřešením získáme hledané parametry Θ Θ, Θ2,..., Θ p Jednorozměrná logstcká regrese Cílem modelování e vždy nalézt model, který nelépe popsue zdroová data a ech vztah ke konkrétní vysvětlované velčně. V logstcké regres e vysvětlovaná (závslá, outcome) velčna bnární, nečastě nabývaící hodnot 0 a, ev nenastal, nebo nastal. Měme vzorek n nezávslých dvoc (, ) x y, =, 2,..., n, kde y označue bnární závslou proměnnou a x e hodnota nezávslé proměnné pro -tý obekt. Model pro logstckou regres vypadá následovně: π ( x) β0 + βx e = β0 + βx. + e V logstcké regres navíc využíváme tzv. logtovou transformac, která e defnována: - 7 -

18 Logstcká regrese ( ) g x ( x) ( x) π = ln = β0 + βx. π Tato transformace má řadu příemných vlastností, které sdílí s lneární regresí. Logt g ( x ) e lneární ve svých parametrech, může být spotý a v závslost na rozsahu x může nabývat hodnot od až po +. Pro naplnění logstckého modelu potřebueme znát hodnoty parametrů β0, β. Pro ech nalezení se v případě logstcké regrese používá metoda maxmální věrohodnost. Pokud Y nabývá hodnot 0 a, dává výraz pro π ( x) podmíněnou pravděpodobnost P( Y = x). Odtud snadno plyne, že výraz π ( x) dává pravděpodobnost P( Y = 0 x). Tedy pro dvoce ( x, y ), kde y =, e přínos k věrohodnostní funkc ( ) y =, e přínos π ( x ) kde 0. Tento fakt můžeme ednoduše zapsat do vztahu y ( x ) π ( x ) y π. x π a pro dvoce, Protože předpokládáme nezávslost ednotlvých dvoc, dostaneme fnální věrohodnostní funkc ako součn výše uvedeného výrazu: n y. y ( β, β ) = π ( ) π ( ) l 0 x x = Pro maxmalzac použeme funkc: y ( β, β ) ln ( β, β ) ln π ( ) π ( ) L l x x n = = = 0 0 = n n β0 + βx β0 + βx e e = y ln π ( x ) + ( y ) ln π ( x ) = y ln ( y ) ln β0 + βx + = β0 + βx = = + e + e n y= β0 + βx β0 + βx ( ) ( ) ( ) = y β0 + βx ln + e y ln + e = y n y x e β β. = 0 + x ( β0 β ) ln ( ) =

19 Logstcká regrese Posledním krokem pro získání maxmálních věrohodných odhadů pomocí MMV e sestavení věrohodnostních rovnc a ech vyřešení. K tomu potřebueme příslušné parcální dervace podle hledaných parametrů β0, β : ( β, β ) n β0 + βx L n 0 e = y y π ( x β ) 0 + βx = β0 = e + = ( β, β ) n β + β x n L 0 x e = = 0 β = e + = 0 x y x x y π ( x β + β ). Příslušná soustava věrohodnostních rovnc e: n = n = ( x ) y π = 0 ( ) x y π x = 0 Obdržel sme nelneární soustavu dvou rovnc o dvou neznámých. K vyřešení této soustavy se obvykle používaí terační metody, které sou zpravdla ž mplementovány v příslušných statstckých balíčcích. My se těmto metodam zabývat nebudeme. Po vyřešení této soustavy dostaneme maxmálně věrohodný odhad β ( β, β ). =, který budeme značt ˆβ. Obdobně maxmálně věrohodný odhad π ( x ) bude značen ˆ ( x ) 0 π Testování významnost koefcentů Jakmle obdržíme odhad koefcentů, zaměří se naše pozornost na ednotlvé proměnné v modelu. To obvykle zahrnue formulac a testování statstcké hypotézy za účelem zštění, zda-l nezávslé proměnné v modelu maí významný vlv na vysvětlovanou proměnnou. Jeden z přístupů k testovaní významnost koefcentů klade otázku, řekne-l nám model, který obsahue danou proměnnou, o vysvětlované proměnné více než model, který tuto proměnnou neobsahue. Tuto otázku zodpovíme porovnáním pozorovaných hodnot závslé proměnné s dvěma predkovaným hodnotam z modelu s a bez proměnné, která nás zaímá. Pokud e předpovídaná proměnná v stém smyslu lepší nebo přesněší v modelu obsahuícím zkoumanou proměnnou než v modelu, který tuto proměnnou neobsahue, považueme tuto proměnnou za významnou

20 Logstcká regrese Metodkou tedy bude porovnání pozorovaných hodnot závslé proměnné s predkovaným hodnotam, které získáme z modelu obsahuící zkoumanou proměnnou, s modelem, který tuto proměnnou neobsahue. V logstcké regres e toto porovnání založeno na logartmcké věrohodnostní funkc (, ) L β β. Konceptuálně uvažueme o pozorovaných 0 hodnotách závslé proměnné ako o predkovaných hodnotách saturovaného modelu. Saturovaným modelem pak rozumíme model, který obsahue tolk parametrů β, kolk e v souboru pozorování. Toto porovnání pak zachycue tento vztah: věrohodnost naplňovaného modelu D = 2ln věrohodnost saturovaného modelu Hodnota uvntř závorek se nazývá věrohodnostní poměr. Použtím záporného dvonásobku logartmu obdržíme hodnotu se známým rozdělením vhodným pro testování hypotéz. Dosazením obdržíme: ( x ) ˆ π ˆ π D = 2 y ln + y ln ( x ) n ( ) = y y Statstce D se říká devance. Navíc věrohodnost saturovaného modelu e rovna, což ˆ y přímo plyne z defnce saturovaného modelu, kde ( x ) n = y y ( y ) y π = a pro věrohodnost platí =. Vztah pro devanc D tedy můžeme zednodušt: D = 2ln [ věrohodnost naplňovaného modelu ]. Pro zhodnocení významnost nezávslé proměnné porovnáme hodnotu devance D s a bez nezávslé proměnné v rovnc. Změnu v D pak vyádříme: [ model bez proměnné] [ model s proměnnou ] G = D D. Věrohodnost saturovaného modelu e obsažena v obou hodnotách D ve zmíněném rozdílu, proto můžeme vztah pro G zavést následovně: věrohodnost bez proměnné G = 2ln věrohodnost s proměnnou

21 Logstcká regrese Pro specální případ edné nezávslé proměnné se dá ukázat, že v případě absence proměnné v modelu e maxmálně věrohodný odhad β 0 roven ln n n, kde n = y, n ( y ) a predkovaná hodnota e konstantní = 0 n = 0 n. V tomto případě pro G platí: n n n0 n n0 n n G = 2ln = n y y ˆ π ( x ) ˆ π ( x ) = ( ) ( ) ˆ π ( ) [ ] = 2 y ln ˆ π x + y ln x 2 n ln n + n0 ln n0 n ln n Pokud testueme hypotézu 0 s edním stupněm volnost). β =, pak G χ 2 ( ) ( G má ch-kvadrát rozdělení Pokud používáme něaký statstcký software, e v něm obvykle stá forma testu významnost koefcentů mplementována a ako výstup obdržíme p-value. V případě programu Statgraphcs testueme hypotézu: H 0 : Výpověď testovaného parametru není dostatečně významná a daný parametr můžeme z modelu vynechat H A : Výpověď testovaného parametru e statstcky významná a měl by být ponechán Rozhodnutí pak učníme na základě obdržené p-value v souladu s postupem př čstém testu významnost Vícerozměrná logstcká regrese Měme p nezávslých proměnných vektorově zapsaných x ( x, x2,..., x p ) podmíněnou pravděpodobnost, že výstup nastal P( Y x) π ( x) logstckého regresního modelu má tvar: ( ) β0 β β β p p =. Označme = =. Logt vícerozměrného g x = + x + x + + x. Příslušný model logstcké regrese e pak ve tvaru: - 2 -

22 Logstcká regrese ( ) g x e π ( x) = g( x). + e Předpokládeme, že máme vzorek n nezávslých pozorování (, ) x y, =, 2,..., n. Steně ako v ednorozměrném případě potřebueme pro naplnění regresního modelu získat odhady vektoru β ( β0, β, β2,..., β p ) =. I ve vícerozměrném případě k ech získání využeme metodu maxmální věrohodnost. Věrohodnostní funkce bude v podstatě dentcká ako v ednorozměrném případě, edným rozdílem e nepatrně rozdílná defnce π ( x). Po dervování log věrohodnostní funkce vzhledem k p + parametrům obdržíme soustavu p + věrohodnostních rovnc, která vypadá následovně: n = n = ( ) ( x ) y π = 0 x y π x = 0, =, 2,..., p Řešení této soustavy e opět numercké povahy a příslušná metodologe e ž zabudována ve statstckých balíčcích. Označme řešení této soustavy ˆβ, získané hodnoty z modelu pro logstckou regres ˆ ( x ) π Testování významnost koefcentů Steně ako v ednorozměrné logstcké regres e prvním krokem po naplnění modelu zvážení významnost ednotlvých proměnných. Test věrohodnostního poměru pro celkovou významnost p koefcentů pro nezávslé proměnné modelu e prováděn naprosto steně a e založen na hodnotě G ako v ednorozměrném případě. V tomto případě hledané hodnoty ˆ π obsahuí vektor s p + parametry ˆβ. Stanovíme-l nulovou hypotézu tak, že p hodnot koefcentů zakřvení v modelu sou nulové, má G ch-kvadrát rozdělení s p stupn 2 volnost: G χ ( p)

23 Verfkace modelu 3. Verfkace modelu V předchozí kaptole sme vytvořl regresní model a rozhodl sme o tom, které proměnné sou statstcky významné. V této část se zaměříme, ak dobře model popsue vysvětlovanou proměnnou. Nedříve se podíváme na lneární a exponencální analýzu. Tyto metody nám dávaí zběžný pohled na to, ak dobře model predkue, anž bychom se musel zabývat testováním hypotéz. Použtí těchto metod bylo navrženo v [9]. Druhou skupnou budou verfkační metody, kde ž přkročíme k testování hypotéz, a tedy výpověď těchto metod bude slněší. V této kaptole předpokládáme, že logstcký regresní model ( x) k dspozc, tedy pro logtovou funkc ( ) 0... p p parametrů β0, β,..., β p. ( ) g x e π = máme g( x) + e g x = β + β x + + β x známe hodnotu všech 3.. Lneární analýza Lneární analýza e ednoduchá metoda, eíž výstup se dá neednoduše charakterzovat následuící tabulkou: Procentuální skupna [%] Počet pozorování ve skupně Počet výskytů sledovaného znaku ve skupně <0 n 0 9 n n n n 5 5 Předpovídaný počet výskytů sledovaného znaku ve skupně = 0, 045* v p n = 0,45* v p2 n2 = 0, 245* v p3 n3 = 0,345* v p4 n4 = 0, 445* v p5 n5 Poměr sledovaných znaků ku předpovídaným znakům v p v p 2 2 v p 3 v p v5 p

24 Verfkace modelu n n n n 9 9 >89 n 0 0 Celkem 0 n = n = = 0,545* v p6 n6 = 0, 645* v p7 n7 = 0, 745* v p8 n8 = 0,845* v p9 n9 = 0,945* v p0 n0 0 v = v = 0 p = p = v p 6 6 v p 7 7 v p 8 v p 8 9 v p v p tab. 3: Tabulka lneární analýzy První sloupec e pevně dán. Hodnoty ve druhém sloupc obdržíme tak, že dosadíme do modelu ( x) e ( ) g x π = hodnoty vysvětluících proměnných x + ( x, x2,..., x p ) ( ) = a podle g x e získaného výsledku zvedneme počítadlo n v příslušném řádku. Pokud navíc tato konkrétní realzace náhodného vektoru měla přítomný znak vysvětlované proměnné, zvedneme počítadlo ve třetím sloupc. V pátém sloupc nás zaímá poměr počtu skutečných výskytů a počtu predkovaného výskytu. Ideálně bychom s přál, aby na každém řádku bylo číslo blízké ednčce, tedy skutečnost se shodue s předpovědí. Číslo větší než edna značí optmstcký model, kdy výskyt vysvětlované proměnné e ve skutečnost vyšší, než náš model předpovídá. Hodnoty menší než edna pak značí pesmstcký model, kdy model předpovídá větší výskyt vysvětlované proměnné, než e skutečnost (předpokládáme, že přítomnost znaku u vysvětlované proměnné e negatvum, např. morbdta, mortalta atd.). Příklad: Měme danou logt funkc g ( x) =, ,025* FS + 0,054* OS a vzorek dat s vysvětlovanou proměnnou Pooperační komplkace: Fyzologcké skore FS Operační skore OS Pooperační komplkace π ( x)*00

25 Verfkace modelu tab. 4: Vzorek dat Tabulka pro lneární analýzu bude vypadat následovně: Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací Poměr komplkací ku předpovídaný < N > Celkem ,75 tab. 5: Příklad lneární analýzy pro vzorek dat Z příkladu vdíme, že v lneární analýze může nastat problém pro dělení nulou. V tomto případě budeme brát výraz 0 0 = a číslo 0 = N Exponencální analýza Podobně ako u lneární analýzy se u exponencální analýzy snažíme vytvořt procentuální skupny a porovnat počty výskytů vysvětlované proměnné s predkovaným hodnotam. Jednotlvá pozorování rozdělíme do skupn podle vypočtené hodnoty π ( x) na základě ednotlvých realzací vysvětluících proměnných, vyádřených v procentech. Analýza se provádí od skupny a postupně zvětšueme nterval po 0 procentech (80 00, atd.) až do doby, kdy bude vyhovovat podmínce, aby předpovídaný počet pacentů měl vzrůstaící tendenc (byl stený) vzhledem k předchozí skupně. Analýza e prováděna zdola nahoru. Jestlže dode k porušení podmínky, analýza zdola nahoru se zastaví a skupna, u které došlo k porušení podmínky, se do analýzy nepočítá. Pokračue se dále analýzou shora dolů. Pro tuto analýzu e důležtá poslední skupna analýzy zdola dolů, u které nedošlo

26 Verfkace modelu k porušení podmínky. Jeí dolní hrance bude určovat horní hranc skupn u analýzy shora dolů. Předpovídaný počet dostaneme následuícím způsobem: předpověď = počet ve skupně*dolní hrance skupny/00 Příklad: Použeme data z předchozího příkladu. Začínáme shora: Skupna [%] Rozšíříme nterval: Počet pozorování Počet komplkací Predkovaný počet komplkací Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací Takto pokračueme dále až obdržíme: Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací Vdíme, že u ntervalu došlo k porušení podmínky. Predkovaný počet komplkací e 2, avšak v předchozí skupně e predkovaný počet komplkací 3. Interval tedy do analýzy nebudeme počítat a začneme s novou horní mezí ntervalu 30: Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací

27 Verfkace modelu Opět pokračueme steným způsobem, až obdržíme: Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací Fnální tabulka exponencální analýzy vypadá následovně: Skupna [%] Počet pozorování Počet komplkací Predkovaný počet komplkací Poměr komplkací ku předpovídaný N N N , , Celkem tab. 6: Příklad exponencální analýzy pro vzorek dat Nepraktckou vlastností exponencální analýzy e nutnost několkerého přepočtu v případě porušení podmínky. Navíc se tento bod přepočtu lší soubor od souboru. Navíc e neasné, ak přstupovat k analýze ednotlvých podskupn. Pokud bychom například chtěl zstt poměr ve skupně 20 40, nemůžeme ednoduše sečíst hodnoty ve skupnách a 30 40, protože zde došlo k přepočtu a pásmo rovněž nemůžeme nezávsle

28 Verfkace modelu analyzovat vůč pásmu Druhým problémem e nutnost počítání a přepočítávání ednotek v daném pásmu. Jednotka, která e v oblast e započítána pro 80 00, až po 30 00, zatímco ná ednotka s pravděpodobností 35% e započtena ednou en v pásmu I přes tyto nedostatky a přes velm omezený datový soubor vdíme, že v celkovém součtu exponencální analýza predkovala trošku lépe, než lneární Vylepšená exponencální analýza U exponencální analýzy sme predkované hodnoty dostal takto: předpověď = počet ve skupně*dolní hrance skupny/00. Jedná se však o odhad, který nemusí dostatečně popsovat chování modelu. Alternatvou e použít větu o úplné pravděpodobnost pro výpočet predkované hodnoty. Označme x modelem predkovaný počet komplkací ve skupně ( a, b ), která obsahue n pacentů a P( A ) pravděpodobnost, že náhodně vybraný pacent ze skupny ( a, b ) bude mít komplkace. Potom x = np( A). Jestlže se ve skupně (, ) a b vyskytlo r různých pravděpodobností komplkací p, p2,..., p r a n e počet pacentů s pravděpodobností komplkace p, pak můžeme psát n x = n p = p n r r n = =. Pokud provedeme přeznačení a každému -tému pacentov ze skupny ( a, b ) přřadíme pravděpodobnost komplkace dostaneme: n x = p Počet predkovaných komplkací v dané skupně pacentů tedy určíme ako součet pravděpodobností komplkací ednotlvých pacentů této skupny. Příklad: Na předchozí příklad exponencální analýzy aplkueme vylepšenou exponencální analýzu: Skupna [%] Počet pozorování = Počet komplkací Predkovaný počet komplkací Poměr komplkací ku předpovídaný N N ,24 (0,2) N ,76 (2,7) 0, ,24 (2) 0,44 p, pak

29 Verfkace modelu () Celkem tab. 7: Příklad vylepšené exponencální analýzy pro vzorek dat V tabulce e uveden předpovídaný počet komplkací pomocí věty o úplné pravděpodobnost, v závorce sou hodnoty z původní analýzy. I když na tomto příkladu vypadá vylepšená exponencální analýza ako horší, musíme brát na vědomí extrémně nízký počet použtých dat. Data nebyla vybrána pro rozhodnutí nevhodněšího postupu, ale pro lustrac vytváření ednotlvých analýz Pearsonova statstka a devance V textu se dále obeví poem kovarační schéma. Tímto rozumíme ednoznačnou kombnac hodnot všech vysvětluích proměnných. Máme-l dvě vysvětluící proměnné kódované { 0, } a { 0, },bude kovarační schéma vypadat takto: {( ) ( ) ( ) ( )} Dále označíme J ako počet unkátních pozorovaných hodnot x = ( x, x2,..., x p ). Pokud 0,0, 0,,,0,,. některé subekty maí stené hodnoty x, platí J < n. Počet subektů s x = x označíme ako m pro =, 2,..., J. Je zřemé, že J m = n. Obvykle předpokládáme, že J n = očekáváme přítomnost alespoň edné spoté vysvětluící proměnné v modelu., elkož V logstcké regres e více způsobů, ak měřt rozdíl mez pozorovaným a vypočteným hodnotam. Pro zdůraznění, že vypočtené hodnoty sou v logstcké regres počítány pro každé kovarační schéma, označíme -té kovarační schéma ako y ˆ, kde a ˆ ( ) g x rozumíme odhadnutý logt. yˆ = m ˆ π = m gˆ ( x ) e ( ) + e gˆ x Pro konkrétní kovarační schéma e Pearsonovo resduum defnováno ako:

30 Verfkace modelu ( ˆ, π ) r y = ( y ˆ m π ) m ˆ ( ˆ π π ). Statstka založená na těchto resduích se nazývá Pearsonova chí-kvadrát statstka: (, ˆ ) 2 J 2 Χ = r y π. = Provádíme tedy součet resduí přes všechna kovarační schémata, která se nám vyskytuí v datech. Resdua devance defnueme: y m y d ( y, ˆ π ) = ± 2 y ln + ( m y ) ln m ˆ π m ( ˆ π ) znaménko před odmocnnou e shodné se znaménkem výrazu ( y ˆ m π ) schéma, kde by nastal případ, že y = 0 : ( ˆ ) ( ˆ, π = 2m ln π ) d y,. Pro kovarační a pro případ, že y = m : ( ˆ ) ( ˆ, π 2m ln π ) d y =. Součtová statstka založena na resduích devancí e devance J = (, ˆ ) 2 D = d y π. V případě, že J = n, se edná o stenou hodnotu, aká byla vyádřena pro devanc v kaptole

31 Verfkace modelu Rozdělení statstky předpokladech, e chí-kvadrát s J ( p ) 2 Χ a D za předpokladu, že získaný model e korektní ve všech + stupn volnost. Pokud však J n, vzrůstá počet parametrů steně rychle ako velkost souboru. Proto e p-value vypočtená pro tyto dvě 2 statstky v případě J n použtím rozdělení χ ( J p ) nesprávná. Jedním způsobem, ak se tomuto chybnému výpočtu vyhnout, e zavést určté seskupování. Na tom sou založeny testy v následuící kaptole Hosmer Lemeshowy testy Hosmer a Lemeshow v [] a [2] navrhl seskupování založené na hodnotách odhadnutých pravděpodobností. Předpokládeme J = n. Budeme předpokládat, že n sloupců odpovídá n hodnotám odhadnutých pravděpodobností, kde první sloupec náleží nemenší hodnotě a n-tý sloupec nevětší hodnotě. Byly navrženy dvě seskupovací stratege. V první rozdělíme tabulku podle percentlů odhadnutých pravděpodobností a v druhé rozdělíme podle pevných hodnot odhadnutých pravděpodobností. V první metodě př použtí deset skupn bude první skupna obsahovat n = n /0 subektů s nemenší hodnotou odhadnuté pravděpodobnost a poslední n 0 = n /0 subektů s nevyšší hodnotou odhadnuté pravděpodobnost. U druhé metody s volbou desít skupn dostaneme hranční body s hodnotam k /0, k =, 2,...,9, kde každá skupna obsahue hodnoty odhadnutých pravděpodobností mez dvěma hrančním body, tedy první skupna obsahue subekty, pro které e odhadnutá pravděpodobnost menší nebo rovna 0,, druhá hodnoty mez 0, a 0,2 a poslední obsahue hodnoty vyšší než 0,9. Pro řádky s y = dostaneme odhady očekávaných hodnot ako sumu odhadnutých pravděpodobností přes všechny subekty skupny. Pro řádky s y = 0 dostaneme odhad očekávaných hodnot součtem edna mnus odhadnutá pravděpodobnost pro všechny subekty ve skupně. Ať už použeme seskupování podle první č druhé metody, dostaneme statstku Ĉ pro Hosmer Lemeshowův test dobré shody výpočtem Pearsonovy chí-kvadrát statstky z tabulky g 2 pozorovaných a odhadnutých četností. Pro výpočet použeme vzorec: Cˆ = g 2 ( ok n kπ k ) n π ( π ), k = k k k - 3 -

32 Verfkace modelu kde n k e celkový počet subektů v k-té skupně, c k značí počet kovaračních schémat v k-tém declu, o k c k = y a π = = k c k = m ˆ π n aproxmováno chí-kvadrát rozdělením s 2 k. Rozdělení testové statstky pro Ĉ e dobře 2 g stupn volnost, C ˆ χ ( g 2 ). Podle [3] e doporučené používat seskupovací metodu založenou na percentlech 2 odhadovaných pravděpodobností z důvodu větší podobnost s ( g 2) χ. Rovněž se doporučue používat deset skupn g = 0. Tyto skupny se pak nazývaí decly rzk. V [4] autoř doporučuí k výše uvedené metodě použít metodu normální aproxmace dstrbuce Pearsonovy chí-kvadrát statstky poprvé popsané Osem a Roekem v [5]. Postup e následuící:. Získání a uložení vypočtených hodnot modelu ˆ π, =, 2,..., J. 2. Vytvoření proměnné v ˆ ( ˆ m π π ) 3. Vytvoření proměnné c =, =, 2,..., J. 2 ˆ π =, =, 2,..., J. v 4. Vypočtení Pearsonovy chí-kvadrát statstky ( y ˆ ) 2 m π J 2 Χ =. 5. Provedení vážené lneární regrese c na kovarátech modelu x s váham v. Odtud dostaneme resduální součet čtverců a označíme e RSS. 6. Vypočtení opravy pro rozptyl J A = 2 J. = m 2 Χ J + p + 7. Vypočtení statstky z =. A + RSS 8. Vypočtení oboustranné p-value z normovaného normálního rozdělení. = v Výše uvedené testy nám poskytly metodku, ak získat p-value. Tato obdržená hodnota nám umožní provést rozhodnutí pro takto stanovené hypotézy: H 0 : Nám získaný model dobře popsue naše data H A : Náš model popsue data špatně a e třeba vytvořt ný model přdáním č odebráním nezávslých proměnných, případně získáním většího množství dat

33 Pops algortmů 4. Pops algortmů V této kaptole budou popsány vytvořené algortmy, konkrétně ech požadovaný vstup a nterpretace ech výstupů. 4.. R Všechny funkce byly napsány v programovacím azyce a prostředí R. Jedná se o rozšíření komerčního produktu S, které e ovšem mplementováno pod svobodnou lcencí. Tento azyk e hlavně využívaný pro statstckou analýzu a rovněž obsahue funkce pro grafcké zobrazení těchto dat. V základní podobě e R v podstatě příkazový řádek, exstuí ovšem rozšíření přdávaící grafcké rozhraní (např. R Studo). Oblba tohota azyka vede eho obsažení v ných, někdy komerčních, aplkacích, akým sou SPSS a Open Offce. Popularta tohoto azyka e především dána možností vytvářet balíčky obsahuící funkce a procedury, které nesou v základní verz obsaženy. Tyto balíčky e možné stáhnout rovnou v základním rozhraní. Další výhodou R e možnost propoení s azyky C, C++, Java, nebo Python. x64. Všechny dále zmíněné funkce byly napsány ve verz R ( ) pro Wndows 4.2. Požadavky na vstup Všechny dále zmíněné funkce maí mnmálně dvě vstupní hodnoty. Datový soubor a vektor parametrů logstcké regrese β. R natvně nepodporue čtení dat z excelovského souboru.xls, má ovšem zabudovanou funkc pro čtení souborů s příponou.csv a MS Excel převod do tohoto formátu přímo umožňue. Pro načtení.csv souboru do R se pak používá funkce data=read.csv( nazev_souboru.csv,header=t,sep= ; ). Parametr header e bnární a má hodnotu T, pokud otevíraný soubor obsahue první řádek s popsky sloupců, nak má hodnotu F. Parametr sep e pro oddělovač, který v.csv souboru oddělue ednotlvé sloupce. MS Excel př převodu z.xls na.csv používá ako oddělovač středník ;, př použtí ných metod e nutno

34 Pops algortmů brát na tuto položku zřetel. Samotný datový soubor pak musí obsahovat všechny nezávslé (vysvětluící) proměnné a ako poslední sloupec závslou (vysvětlovanou) proměnnou. Parametry logstcké regrese β musí být na vstup přvedeny v podobě vektoru, neednoduše příkazem beta=c( β,, β n, β 0 ). Pořadí ednotlvých koefcentů musí být stené ako pořadí ednotlvých sloupců v datovém souboru, absolutní člen e uváděn ako poslední Lneární a exponencální analýza Funkce, pro získání lneární a exponencální analýzy sou tř. Pro lneární analýzu e to lnan.r, pro exponencální analýzu expan.r a pro vylepšenou exponencální analýzu enhexpan.r. Použtím příkazu source danou funkc načteme a pak můžeme zavolat. Hlavčky těchto funkcí: lnan=functon(betas,datas) expan=functon(betas,datas) enhexpan=functon(betas,datas) Všechny tř maí stené vstupní parametry. První e vektor koefcentů β a druhým sou načtená data. Výstupem e pak tabulka, která e vdět na obrázku obr.. obr. : Výstup algortmu pro exponencální analýzu v R

35 Pops algortmů 4.4. Funkce vraceící p-value Funkce, které vrací p-value, sou celkem čtyř a to pearson.r používaící Pearsonovu statstku, resdev.r založená na výpočtu resduí devance, osro.r používaící metodku navrženou Osem a Roekem a hoslem.r podle postupu Hosmera a Lemeshowa. Hlavčky těchto funkcí: pearson=functon(betas,datas,prntcov=false) resdev=functon(betas,datas,prntcov=false) OsRo=functon(betas,datas,prntcov=FALSE) HosLem=functon(betas,datas,prntcov=FALSE,groups=0) První vstupní parametr e opět pro hodnoty β, druhý pro vstupní data. Třetí parametr prntcov volaný s hodnotou TRUE způsobí vypsání kovaračních schémat vstupních dat. Čtvrtý parametr u funkce HosLem slouží k volbě počtu skupn. Všechny tyto funkce vrací hodnotu p-value tak, ak e popsáno v teoretcké část u ednotlvých metodk

36 Zpracování dodaných dat 5. Zpracování dodaných dat V této kaptole využeme všech teoretckých poznatků získaných v předchozích kaptolách. Použeme příslušný software pro získání modelů pro dostupná data a využeme vytvořených funkcí pro zhodnocení těchto modelů. 5.. Datový soubor K otestování našch algortmů nám byl poskytnut datový soubor z FNO. Tento soubor obsahue údae o operovaných pacentech s dagnózou rakovny kolon a rekta. Rozsah dodaného souboru čnl 666 pacentů, avšak čtyř záznamy musely být ze souboru vyřazeny kvůl chyběícím údaům. Tyto údae byly sbírány postupně v letech Základní charakterstky souboru zachycuí následuící grafy. Pohlaví 290; 44% 372; 56% muž žena obr. 2: Koláčový graf pro rozložení pohlaví datového souboru Z grafu e patrný vyšší počet pacentů mužského pohlaví. Tento nepoměr však pro nás neznamená žádné komplkace, skórovací systém pohlaví pacenta nezohledňue a tato nformace e zde uvedena pouze pro lepší lustrac dodaného souboru

37 Zpracování dodaných dat Metodka 358; 54% 304; 46% otevřeně laparoskopcky obr. 3: Koláčový graf pro způsob operace Operační metodka e pro nás důležtý úda. Model budeme vytvářet zvlášť pro pacenty operované laparoskopcky a zvlášť pro pacenty operované otevřenou metodou. Z grafu e patrné poměrně rovnoměrné rozložení obou skupn. obr. 4: Krabcový graf zachycuící věkové rozložení pacentů Na posledním grafu e zobrazeno věkové rozmezí pacentů. Nemenší věk e 7 let, nevětší 97. Průměrný věk v souboru e 63,4 let, medán 64 let. Hodnota prvního resp. třetího kvartlu e 57, resp. 73 let a směrodatná odchylka má hodnotu 3 let

38 Zpracování dodaných dat Pohlaví Komplkace Věk Laparoskopcky Otevřeně Mužů Žen Vyskytly 5 24 Nevyskytly Mnmum 8 7 Maxmum 97 9 Průměr 62,3 64, Směrodatná odchylka 3,2 2,7 Medán První kvartl 57 56,5 Třetí kvartl 7 74 tab. 8: Rozložení velčn pro danou metodku Protože budeme hledat modely odděleně pro laparoskopcké a otevřené operace, e rozdělení základních velčn rozepsáno v tabulce Operační a fyzologcké skóre, model POSSUM Jž v úvodu byl zmíněn model POSSUM, který slouží pro odhad výskytu komplkací u pacentů s rakovnou kolorekta. Na počátku stude bylo 62 rzkových faktorů, které se postupně zredukovaly na 8 nezávslých faktorů. Tyto faktory se dále dělí na 2 faktorů popsuících fyzologcký stav pacenta před operací a 6 faktorů samotného chrurgckého výkonu. Tyto dílčí faktory sou oceněny hodnotam,2,4 nebo 8, poté sou tyto hodnoty sečteny a výsledek e označený ako fyzologcké skóre pro 2 faktorů fyzologckého stavu pacenta a operační skóre pro 6 faktorů operačního zákroku. Následuící dvě tabulky převzaté z [6] a [7] popsuí získání těchto hodnot. Operační skóre Závažnost a rozsah operačního výkonu Vícečetné operace (v posledních 30 dnech) Celková ztráta krve (ml) Kontamnace pertoneální dutny Přítomnost malgnty Naléhavost operace Skóre malý střední velký komplexní, rozsáhlý 2 > žádná mnmální (serózní) lokálně hns žádná en prmární poztvní uzlny elektvní naléhavá, e možná příprava > 2hod, operace do 24 hod od přetí volný střevní obsah, hns, krev vzdálené metastázy naléhavá, výkon e nutný do méně než 2 hod tab. 9: Získání operačního skóre

39 Zpracování dodaných dat Fyzologcké skóre Skóre Věk (roky) duretka, dgoxn, Kardální příznaky sterody, perferní bez terape otoky, selhávání angny warfarn, pectors nebo hypertenze Rentgen srdce a plc Resprační příznaky Rentgen plc Systolcký krevní tlak (mm Hg) Tepová frekvence (mnutová) Glasgow coma score bez dušnost Hemoglobn (g/l) Leukocyty (.0 2 /l) 4-0 Urea v séru (mmol/l) Natrum v séru (mmol/l) Kalum v séru (mmol/l) Elektrokardogram námahová dušnost hranční kardomegale hranční dušnost (edno patro) zvýšený ugulární tlak kardomegale kldová dušnost, ( 30/mn) mírná střední CHOPCH CHOPCH fbroza nebo konsoldace ,-20,0 20, 3,-4,0 3,0 7,5 7,6-0 0,- 5,0 5, ,5-5,0 normální 3,2-3,4 2,9-3, 2,8 5,-5,3 5,4-5,9 6,0 fbrlace síní (60-90/mn) tab. 0: Získání fyzologckého skóre ný abnormální rytmus, 5 extrasystol /mn, Q vlny nebo změny ST/T vlny Aplkací logstcké regrese bylo rzko výskytu komplkace R vyádřeno vztahem R ln 5, 9 0,6 FS 0,9 OS R = + +, kde FS značí fyzologcké skóre a OS operační skóre Aplkace známých modelů Než vytvoříme model štý na míru našm datům, zkusíme na tato data aplkovat ž vytvořené modely. Prvním bude v předchozí kaptole zmíněný model POSSUM, druhým bude

40 Zpracování dodaných dat model popsaný v [3]. Druhý model e ve tvaru R ln 2, , FS 0, 0654 OS R = + +. Nedříve aplkueme algortmy pro lneární, exponencální a vylepšenou exponencální analýzu popsané v kaptole 4.3. Lneární analýza POSSUM Druhý model Skupna [%] Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr < , , , , , , , , , , , , ,9 tab. : Lneární analýza pro pacenty operované laparoskopcky Lneární analýza POSSUM Druhý model Skupna [%] Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr < , , , , , , , , , , , , , , tab. 2: Lneární analýza pro pacenty operované otevřenou metodou Tabulky lneární analýzy nám ukazuí, že model POSSUM není moc vhodný pro předpověď komplkací. Pro oba soubory e předpovídaný počet komplkací výrazně nžší, než skutečný. Pro druhý model máme obdobnou stuac, ovšem rozdíl není natolk výrazný

41 Zpracování dodaných dat Skupna [%] Exponencální analýza POSSUM Druhý model Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr , , , , , , , , , , , , , , , , tab. 3: Exponencální analýza pro pacenty operované laparoskopcky Skupna [%] POSSUM Pacentů Komplkací Předpověď Poměr Exponencální analýza Skupna [%] Druhý model Pacentů Komplkací Předpověď Poměr , , , , , , , , , , , ,57 tab. 4: Exponencální analýza pro pacenty operované otevřenou metodou Stuace u exponencální analýzy e obdobná ako v případě lneární analýzy. V tomto případě e předpověď ž výrazně horší, než-l e skutečnost. Ve srovnání modelu POSSUM a modelu, který byl vytvořen na geografcky obdobných datech, aká máme k dspozc, vychází druhý model ako výhodněší. Tabulka pro vylepšenou exponencální analýzu uvedena nebude, elkož dvě předchozí metody hovoří výrazně prot modelům. Přece en se ale edná o slabší metody, proto eště bude uvedena tabulka obsahuící p-value, které získáme pomocí metod uvedených v kaptole

42 Zpracování dodaných dat POSSUM Druhý model Laparoskopcky Otevřeně Laparoskopcky Otevřeně Resdua devancí 0, , , , Pearsonův test 0, , , , Hosmer-Lemeshow , Osus-Roek 0, , , , tab. 5: P-value pro ednotlvé testy V tab. 5 vdíme p-value pro ednotlvé typy testů. Zatímco model POSSUM můžeme zamítnout ako vhodný pro všechny provedené testy, druhý model se ukazue ako poměrně vhodný pro použtí na datech získaných z laparoskopckých operací. Vdíme, že dva testy vykazuí hodnoty blízké nule, ovšem další dva (Pearsonův a Osus-Roek) maí přesvědčvé hodnoty pro použtí modelu. Pro použtí tohoto modelu hovoří výsledek lneární analýzy, avšak exponencální analýza neudává přesvědčvý výsledek. Rovněž počet kovaračních schémat u obou skupn operovaných pacentů e výrazně menší než celkový počet dat, měl bychom proto brát hodnoty prvních dvou testů ako významněší. Použtí druhého modelu pro pacenty operované laparoskopcky tedy nemůžeme ednoznačně doporučt, ale an zamítnout Vytvoření nového modelu Protože předchozí modely nepřnesly uspokový výsledek, pokusíme se o vytvoření nových modelů pro pacenty, kteří podstoupl zákrok laparoskopcky, a pro pacenty, kteří podstoupl otevřený zákrok. U obou těchto skupn známe fyzologcké skóre a operační skóre, tyto dvě hodnoty budou sloužt ako nezávslé proměnné, a nformac o výskytu morbdty, která bude sloužt ako závslá (vysvětlovaná) proměnná. Hledaný model bude tedy R ve tvaru ln 0 FS 2 OS R = β + β + β

43 Zpracování dodaných dat obr. 5: Výskyt komplkací v závslost na FS a OS u pacentů operovaných laparoskopcky obr. 6: Výskyt komplkací v závslost na FS a OS u pacentů operovaných otevřenou metodou Použtím statstckého softwaru Statgraphcs dostaneme modely:

44 Zpracování dodaných dat R ln, , FS 0, 0628 OS R = + pro laparoskopcký zákrok R ln 2, 382 0, FS 0, OS R = + + pro otevřený zákrok. Dále se podíváme na významnost ednotlvých koefcentů. Využeme test věrohodnostního poměru, který e ve Statgraphcu mplementován. Koefcent 2 χ Stupně volnost p-value FS 0, ,8095 OS 5, ,088 Pro pacenty, kteří byl operován laparoskopcky, vdíme, že na hladně významnost 95% můžeme považovat koefcent u fyzologckého skóre FS za nulový. Až budeme provádět verfkac modelu, vyzkoušíme model, který tuto proměnnou obsahue, a model, který ne. Koefcent 2 χ Stupně volnost p-value FS 5,467 0,094 OS 5,577 0,0232 U pacentů operovaných otevřenou metodou můžeme prohlást, že na hladně významnost 95% považueme oba koefcenty ako významné Verfkace nového modelu Využeme nám vytvořené algortmy pro ověření vhodnost nově vygenerovaných modelů. Pro laparoskopcky operované pacenty budeme uvažovat model obsahuící velčnu FS a model bez této proměnné

45 Zpracování dodaných dat Verfkace modelu pro laparoskopckou operac Lneární analýza Model s FS Model bez FS Skupna [%] Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr < , , , , , , , ,98 tab. 6: Lneární analýza pro pacenty operované laparoskopcky Podle lneární analýzy náš model predkue velce dobře. Absence fyzologckého skóre má za následek drobného zvýšení počtu predkovaných komplkací, což ale z praktckého hledska není na škodu. Skupna [%] Exponencální analýza Model s FS Model bez FS Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr , , , , , , , ,4 tab. 7: Exponencální analýza pro pacenty operované laparoskopcky Exponencální analýza vykazue horší předpověď, komplkací určue výrazně méně, než nastalo. Rozdíl mez modelem obsahuícím fyzologcké skóre a modelem bez ně e téměř nulový

46 Zpracování dodaných dat Skupna [%] Vylepšená exponencální analýza Model s FS Model bez FS Pacentů Komplkací Předpověď Poměr Pacentů Komplkací Předpověď Poměr , , , , , , , , ,94 tab. 8: Vylepšená exponencální analýza pro pacenty operované laparoskopcky Vylepšená exponencální analýza ukazue téměř přesnou shodu skutečných a predkovaných hodnot. Vynechání fyzologckého skóre z modelu má za následek drobné zvýšení předpovídaných komplkací. Model s FS Model bez FS Resdua devancí 0 0 Pearsonův test 0,063 0,00507 Hosmer-Lemeshow 0 0 Osus-Roek 0, , tab. 9: P-value pro ednotlvé testy Ve skupně laparoskopcky operovaných pacentů máme celkem 358 záznamů, kovaračních schémat e 9. Pro tento model tedy neplatí J n a e vhodné používat spíše test na resdua devancí a Pearsonův test. Pokud se podíváme na test modelu, u kterého vyřadíme parametr fyzologckého skóre, vdíme, že oba testy shodně zamítaí vhodnost tohoto modelu. V případě, kdy fyzologcké skóre zahrneme, test na resdua model opět zamítá, ovšem hodnota Pearsonova testu na hladně významnost 99% model nezamítá, pro hladnu významnost 95% ale k zamítnutí ž dochází. Nacházíme se tedy v nerozhodné oblast. Výsledky lneární a exponencální analýzy rovněž poukazuí na vhodnost navrhovaného modelu. Protože náš model má za úkol pomoc lékařům př předpovídání operačních komplkací a v tomto případě očekáváme vyšší kvaltu modelu, e rozumné rozšířt datový soubor a vytvořt nový model na základě většího množství nformací

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

Vícekriteriální rozhodování. Typy kritérií

Vícekriteriální rozhodování. Typy kritérií Vícekrterální rozhodování Zabývá se hodnocením varant podle několka krtérí, přčemž varanta hodnocená podle ednoho krtéra zpravdla nebývá nelépe hodnocená podle krtéra ného. Metody vícekrterálního rozhodování

Více

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G.

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G. SÍŤOVÁ ANALÝZA Využívá grafcko-analytcké metody pro plánování, řízení a kontrolu složtých návazných procesů. yto procesy se daí rozložt na dílčí a organzačně spolu souvseící čnnost. yto procesy se nazývaí

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

EKONOMICKO-MATEMATICKÉ METODY

EKONOMICKO-MATEMATICKÉ METODY . přednáška EKONOMICKO-MATEMATICKÉ METODY Ekonomcko matematcké metody (též se užívá název operační analýza) sou metody s matematckým základem, využívané především v ekonomcké oblast, v oblast řízení a

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE Jana Valečková 1 1 Vysoká škola báňská-techncká unverzta Ostrava, Ekonomcká fakulta, Sokolská

Více

Metody vícekriteriálního hodnocení variant a jejich využití při výběru produktu finanční instituce

Metody vícekriteriálního hodnocení variant a jejich využití při výběru produktu finanční instituce . meznárodní konference Řízení a modelování fnančních rzk Ostrava VŠB-TU Ostrava, Ekonomcká fakulta, katedra Fnancí 8. - 9. září 200 Metody vícekrterálního hodnocení varant a ech využtí př výběru produktu

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

ŘEŠENÍ PROBLÉMU LOKALIZACE A ALOKACE LOGISTICKÝCH OBJEKTŮ POMOCÍ PROGRAMOVÉHO SYSTÉMU MATLAB. Vladimír Hanta 1, Ivan Gros 2

ŘEŠENÍ PROBLÉMU LOKALIZACE A ALOKACE LOGISTICKÝCH OBJEKTŮ POMOCÍ PROGRAMOVÉHO SYSTÉMU MATLAB. Vladimír Hanta 1, Ivan Gros 2 ŘEŠENÍ PROBLÉMU LOKALIZACE A ALOKACE LOGISTICKÝCH OBJEKTŮ POMOCÍ PROGRAMOVÉHO SYSTÉMU MATLAB Vladmír Hanta 1 Ivan Gros 2 Vysoká škola chemcko-technologcká Praha 1 Ústav počítačové a řídcí technky 2 Ústav

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

1. Úvod. Cílem teorie her je popsat situaci, která nás zajímá, jako hru. Klasickým případem

1. Úvod. Cílem teorie her je popsat situaci, která nás zajímá, jako hru. Klasickým případem Kvaternon 2/204, 79 98 79 MATICOVÉ HRY V INŽENÝRSTVÍ JAROSLAV HRDINA a PETR VAŠÍK Abstrakt. Následuící text pokrývá eden z cyklů přednášek předmětu Aplkovaná algebra pro nženýry (0AA) na FSI VUT. Text

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

APLIKACE MATEMATICKÉHO PROGRAMOVÁNÍ PŘI NÁVRHU STRUKTURY DISTRIBUČNÍHO SYSTÉMU

APLIKACE MATEMATICKÉHO PROGRAMOVÁNÍ PŘI NÁVRHU STRUKTURY DISTRIBUČNÍHO SYSTÉMU APLIKACE MATEMATICKÉHO PROGRAMOVÁNÍ PŘI NÁVRHU STRUKTURY DISTRIBUČNÍHO SYSTÉMU APPLICATION OF MATHEMATICAL PROGRAMMING IN DESIGNING THE STRUCTURE OF THE DISTRIBUTION SYSTEM Martn Ivan 1 Anotace: Prezentovaný

Více

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce

Více

Obsah přednášky 1. Bayesův teorém 6. Naivní Bayesovský klasifikátor (NBK)

Obsah přednášky 1. Bayesův teorém 6. Naivní Bayesovský klasifikátor (NBK) Obsah přednášky 1. Bayesův teorém 2. Brutální Bayesovský klasfkátor (BBK) 3. Mamální aposterorní pravděpodobnost (MA) 4. Optmální Bayesovský klasfkátor (OBK) 5. Gbbsův alortmus (GA) 6. Navní Bayesovský

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21 Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8

Více

1. Nejkratší cesta v grafu

1. Nejkratší cesta v grafu 08. Nekratší cesty. Úloha obchodního cestuícího. Heurstky a aproxmační algortmy. Metoda dynamckého programování. Problém batohu. Pseudopolynomální algortmy 1. Nekratší cesta v grafu - sled e lbovolná posloupnost

Více

Softwarová podpora matematických metod v ekonomice a řízení

Softwarová podpora matematických metod v ekonomice a řízení Softwarová podpora matematckých metod v ekonomce a řízení Petr Sed a Opava 2013 Hrazeno z prostředků proektu OPVK CZ.1.07/2.2.00/15.0174 Inovace bakalářských studních oborů se zaměřením na spoluprác s

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

Dopravní plánování a modelování (11 DOPM )

Dopravní plánování a modelování (11 DOPM ) Department of Appled Mathematcs Faculty of ransportaton Scences Czech echncal Unversty n Prague Dopravní plánování a modelování (11 DOPM ) Lekce 5: FSM: rp dstrbuton Prof. Ing. Ondře Přbyl, Ph.D. Ing.

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové. Příprava na cvčení č.1 Čísla a artmetka Číselné soustavy Obraz čísla A v soustavě o základu z: m A ( Z ) a z (1) n kde: a je symbol (číslce) z je základ m je počet řádových míst, na kterých má základ kladný

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

SIMULACE A ŘÍZENÍ PNEUMATICKÉHO SERVOPOHONU POMOCÍ PROGRAMU MATLAB SIMULINK. Petr NOSKIEVIČ Petr JÁNIŠ

SIMULACE A ŘÍZENÍ PNEUMATICKÉHO SERVOPOHONU POMOCÍ PROGRAMU MATLAB SIMULINK. Petr NOSKIEVIČ Petr JÁNIŠ bstrakt SIMULCE ŘÍZENÍ PNEUMTICKÉHO SERVOPOHONU POMOCÍ PROGRMU MTL SIMULINK Petr NOSKIEVIČ Petr JÁNIŠ Katedra automatzační technky a řízení Fakulta stroní VŠ-TU Ostrava Příspěvek popsue sestavení matematckého

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Matematický ústav Slezské univerzity v Opavě Učební texty k přednášce ALGEBRA II, letní semestr 2000/2001 Michal Marvan

Matematický ústav Slezské univerzity v Opavě Učební texty k přednášce ALGEBRA II, letní semestr 2000/2001 Michal Marvan Matematický ústav Slezské univerzity v Opavě Učební texty k přednášce ALGEBRA II, letní semestr 000/00 Michal Marvan 3. Matice lineárního zobrazení V této přednášce budeme používat indexy dvoího druhu:

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

MANAŽERSKÉ ROZHODOVÁNÍ

MANAŽERSKÉ ROZHODOVÁNÍ MANAŽERSKÉ ROZHODOVÁNÍ Téma 14 POSUZOVÁNÍ A HODNOCENÍ VARIANT doc. Ing. Monka MOTYČKOVÁ (Grasseová), Ph.D. Unverzta obrany Fakulta ekonomka a managementu Katedra voenského managementu a taktky Kouncova

Více

PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO

PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO PROBLEMATIKA INTELIGENTNÍHO AUTOMATICKÉHO MAPOVÁNÍ WEBOVÝCH STRÁNEK ŘIMNÁČ MARTIN 1, ŠUSTA RICHARD 2, ŽIVNŮSTKA JIŘÍ 3 Katedra řídcí technky, ČVUT-FEL, Techncká 2, Praha 6, tel. +42 224 357 359, fax. +

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

ČASOVÁ KOORDINACE SPOJŮ VEŘEJNÉ HROMADNÉ DOPRAVY NA ÚSECÍCH DOPRAVNÍ SÍTĚ

ČASOVÁ KOORDINACE SPOJŮ VEŘEJNÉ HROMADNÉ DOPRAVY NA ÚSECÍCH DOPRAVNÍ SÍTĚ ČASOVÁ KOORDINACE SPOJŮ VEŘEJNÉ HROMADNÉ DOPRAVY NA ÚSECÍCH DOPRAVNÍ SÍTĚ THE TIME COORDINATION OF PUBLIC MASS TRANSPORT ON SECTIONS OF THE TRANSPORT NETWORK Petr Kozel 1 Anotace: Předložený příspěvek

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regulární systém hustot Vychází se z: -,, P - pravděpodobnostní prostor -, R neprázdná množna parametrů - X X 1,, náhodný vektor s sdruženou hustotou X n nebo s sdruženou pravděpodobnostní

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

Validation of the selected factors impact on the insured accident

Validation of the selected factors impact on the insured accident 6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Valdaton of the selected factors mpact on the

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

2 ÚVOD DO TEORIE PRAVDĚPODOBNOSTI. 2.1 Náhodný jev. π, které je třeba co nejpřesněji a nejúplněji vymezit, a k nimž je třeba výsledky pokusu a

2 ÚVOD DO TEORIE PRAVDĚPODOBNOSTI. 2.1 Náhodný jev. π, které je třeba co nejpřesněji a nejúplněji vymezit, a k nimž je třeba výsledky pokusu a ÚVOD DO TEORIE PRAVDĚPODOBNOSTI.1 Náhodný ev Tato kaptola uvádí souhrn základních pomů a postupů teore pravděpodobnost, které se uplatňuí př rozboru spolehlvost stavebních konstrukcí a systémů. Výklad

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů.

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů. PROSTOROVÁ AUTOKORELACE V ANALYTICKÉ CHEMII JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, 46 7 Lberec MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Autokorelace

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

(Cramerovo pravidlo, determinanty, inverzní matice)

(Cramerovo pravidlo, determinanty, inverzní matice) KMA/MAT1 Přednáška a cvičení, Lineární algebra 2 Řešení soustav lineárních rovnic se čtvercovou maticí soustavy (Cramerovo pravidlo, determinanty, inverzní matice) 16 a 21 října 2014 V dnešní přednášce

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

Podmíněná pravděpodobnost, spolehlivost soustav

Podmíněná pravděpodobnost, spolehlivost soustav S1 odmíněná pravděpodobnost, spolehlvost soustav odmíněná pravděpodobnost, spolehlvost soustav Lbor Žák odmíněná pravděpodobnost Nechť,, 0, podmíněná pravděpodobnost evu vzhledem k evu : S akou pravděpodobností

Více

Klasifikace a predikce. Roman LUKÁŠ

Klasifikace a predikce. Roman LUKÁŠ 1/28 Klasfkace a predkce Roman LUKÁŠ 2/28 Základní pomy Klasfkace = zařazení daného obektu do sté skupny na základě eho vlastností Dvě fáze klasfkace: I. Na základě trénovacích vzorů (u nchž víme, do aké

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

Teorie her a ekonomické rozhodování. 10. Rozhodování při jistotě, riziku a neurčitosti

Teorie her a ekonomické rozhodování. 10. Rozhodování při jistotě, riziku a neurčitosti Teore her a ekonomcké rozhodování 10. Rozhodování př stotě, rzku a neurčtost 10.1 Jednokrterální dskrétní model Jednokrterální model rozhodování: f a ) max a Aa, a,..., a ( 1 2 f krterální funkce (zsk,

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

Mikroekonomický scoringový model úpadku českých podniků

Mikroekonomický scoringový model úpadku českých podniků Mkroekonomcký scorngový model úpadku českých podnků Jří VALECKÝ, Eva SLIVKOVÁ, VŠB-TU Ostrava Abstract The paper s devoted to the proposng a scorng model of frm s bankruptcy on the bass of logstc regresson

Více

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Přednáška č. 11 Analýza rozptylu při dvojném třídění Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více