LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC as studu: 9 ut Cíl: V této aptol s száít s todou lostcé rrs a s jjí užtí pro dsraí aalýzu VÝKLAD Úvod V prax js asto postav pd problé zaadt jsté objty do pd vyzých sup K touto úlu á dspozc aé urté zay a tchto objtch a aší úol j a zálad zalost hodot tchto za zaadt pdložý objt do tré supy K ší tohoto probléu lz pstupovat ola zpsoby Bud pdpoládat ž aždý objt patí do jdé z dvou sup (oza j a Problé dsrac bud št poocí odl lostcé rrs (L K sstaví rozhodovacího pravdla á dspozc obvyl tstovacích objt a trých á ay píslušé zay a o trých bu ví abo ví do tré supy patí (v závslost a zvolé odlu aé zay ch jsou rprztováy p-rozrý áhodý vtory X X a píslušost -tého objtu daé sup ch j vyjáda hodotou áhodé vly trá abývá hodot bo podl toho do tré supy daý objt álží U ového objtu trý chc zaadt a zálad vytvoého rozhodovacího pravdla ch jsou aé zay rprztováy p- rozrý áhodý vtor X a rozhodutí hodotou áhodé vly Statstcé rozhodovací fuc Jdotlvé dsraí procdury budou odvozy a zálad tor statstcých rozhodovacích fucí trou a toto íst stru ppo K alzí optálího rozhodovacího pravdla bud využto baysovsého pístupu ol záého paratru o jhož hodot chc rozhodout bud hrát áhodá vla ; trá á pravdpodobostí fuc q(y ozhodutí bud provádo a zálad { } hodoty áhodého vtoru X x y r ch { } oža všch fucí δ : p { ; } podíy y ozaí ( p jž á hustotu r(x Podíou hustotu X za δ : p ; j rozhodovací fuc a Η j Ztrátovou fuc zavd jao 43
( δ ( X L zová fuc j dfováa jao Baysovsé rzo s urí jao LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC ( E L( δ ( X ( X poud δ v opapa pípad [ ] L( δ ( x r( x y δ ρ Optálí rozhodovací fuc p ( δ E( δ ( y δ q( y y δ poto dosta jao δ ar δ H ρ( δ Oza podíou pravdpodobostí fuc za podíy Xx jao p ( y x p( x P( X x ( x a p( x P( X x ( x x p ˆ δ ( x ar E L( δ ( X δ H lz sado s poocí Baysovy vty uázat ž vyjádí rzové fuc a baysovsého rza: d x ch Exstuj-l pro všcha [ X x] L( δ ( x p( y x ( δ P δ ( X ( δ P δ ( X y ˆ δ δ Píý výpot lz dál alézt ( ( ( δ P( δ ( X + P( δ ( X ρ Vdí tdy ž baysovsé rzo lz v této stuac trprtovat jao pravdpodobost špatého rozhodutí o hodot tj o zaazí daého objtu do supy Dál bud baysovsé rzo azývat jao pravdpodobost chyby Lostcá rrs U lárího odlu trý js s doposud zabýval byla vysvtlovaá proá spojtá yí s pousí vysvtlt chováí - vly trá odluj výsyt výsyt sldovaého jvu Stj jao u lárího odlu bud vyjadovat stdí hodotu vysvtlovaé proé jao fuc závsl proých Ttorát bud tato stdí hodota rova pravdpodobost jdy tdy pravdpodobost výsytu sldovaého jvu 44
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Tvar závslost Uvažuj závslé áhodé vly s altratví rozdlí s paratry µ Stí hodoty jsou totožé s pravdpodobost µ ty ohou závst a jaých áhodých doprovodých vlách x J zjé ž platí D µ ( µ To j prví podstatý rozdíl v porováí s orálí lárí odl d byl rozptyl ostatí Poud bycho pdpoládal jao v lárí odlu závslost tvaru µ E x bud problé s trprtací protož lz zarut ž pro lbovolé v trvalu ( ; x bud µ lžt Hldj tdy jý trprtovatlý tvar závslost a otvac hldj v odhadch axálí vrohodost Pravdpodobost dvou ožých hodot a lz souhr psát jao j j ( j ( j P µ µ Loartcou vrohodostí fuc lz tdy zapsat ( µ l µ ( µ ( l µ + ( l( µ µ l + µ ( µ Ja j vdt pozorovaé áhodé vly s v loartcé vrohodostí fuc projvují lo µ Podíl pouz v souch s výrazy ( ( ω µ ( x l ( x ( µ P x µ P á bzprostdí trprtac Porovává pravdpodobost jdy (výsyt sldovaého jvu a uly (výsyt jvu Pro tto podíl s v alt používá výraz odds Tou η l µ µ s íá lot odpovídá sý trí šac Saoté fuc ( ( Pdpoládj spcál ž lot pravdpodobost j lárí fucí záých paratr 45
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC ( x η dy s v toto obcé zápsu systatcy uvádí absolutí l protož ja uvdí vždy jj bud schop odhadout Pa s ísto rrsí atc X uvádí atc ( X Stdí hodotu pa v aš odlu ž vyjádt v tvaru µ ( η ( + + x + η ( x x což zaruí ž platí µ < a odstraí ta jd z azaých problé < 3 Odhad paratr aza jšt odhad paratr todou axálí vrohodost Protož platí l η η η ( µ l ( + a loartcou vrohodostí fuc js upravl a tvar η µ η + ( η ( + l µ ( ( jsou parcálí drvac loartcé vrohodostí fuc rovy η η ( µ ( 9 x ( Po alé úprav zjstí ž soustava orálích rovc (lárí v lz psát Sado zjstí ž platí ( µ ( X ( odud dosta µ η η η ( + µ µ µ ( µ ( µ x Když zavd daoálí atc rozptyl jdotlvých pozorováí ( da { µ ( µ µ ( } D µ ž Fshrovu foraí atc (vzhld ( zapsat jao 46
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC ( X D( µ X ( ( µ ( x x Vzhld tou ž atc D j poztv dftí j Fshrova foraí atc pjší poztv sdftí a v pípad úplé sloupcové hodost atc X dooc poztv dftí Tato sutost usaduj traí ší soustavy orálích rovc Oza ší orálí rovc ( ( jao b Asyptotcou varaí atcí j vrzí atc Fshrov foraí atc V prax p jjí výpotu za záé paratry do J dosadí odhady todou axálí vrohodost tré jsou ozsttí taž taé ( J ( b j ozsttí odhad J ( Vš s ž a rozdíl od lárího odlu v asyptotcé atc vystupuj paratr íta (rozptyl σ a druhé stra ja js upozorl závsí rozptyl odhad a odhadovaých paratrch 4 tprtac paratr Vuj s trprtac paratr v odlu η + x Bárí závsl proá Pdpoládj ž jdorozrá vla x abývá práv dvou hodot Bz újy a obcost to jsou hodoty a taž x j ulá proá dvouhodotovéu fatoru a vyjaduj pítoost pítoost jaého jvu Pro x jsou šac rovy: ω ( ( ( P P + + Paratr j tdy rov lotu pravdpodobost výsytu sldovaého jvu pro x: Pro x j odpovídající šac rova ( ( P l P ω ( + + + + + + 47
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Por šací (odds rato pro dv hodoty x j pa rov ω ω ( ( + taž paratr j rov loartu por šací Poud pravdpodobost sldovaého jvu a hodot x závsí j por šací rov jdé tdy Když zá odhad b paratru jho asyptotcý rozptyl σ (oza V ( J ( b b s ády a sloupc íslovaý od uly ž tstovat ulovou hypotézu H poocí statsty : b σ Z trá á za platost ulové hypotézy asyptotcy orovaé orálí rozdlí ( ; tré statstcé paty zd pdpoládají studtovo rozdlí s ( stup volost - t Pro x a j oza zjštou tost jao j Cl tdy á + pozorováí s hodotou x Hldaé odhady jsou V pípad bárího x alz odhady b b sado pío z odhad šací ω ( ω ( Odtud sado dosta ˆ ( ω ˆ ( ω b l b l Pous s xplct vyjádt rozptyl b D b á pouz dvojí daoálí prvy prv s odhad rozptylu pro x a prv s odhad rozptylu pro x Zíé odhady rozptylu závsl proé jsou rovy x x x Odhad Fshrovy foraí atc á tdy tvar σ Daoálí atc ( + J ( b b 48
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Protož dtrat této atc j rov ( (vpravo dol atc V ( J ( b b jao dosta píslušý prv σ + + + šý pílad ásldující data podávají forac o to zda ata ojla své dít jšt v 4 týdu Zabývj s otázou zda tato sutost závsí a to zda bylo thotství pláováo Pla Koj4 35 6 36 Z tabuly dosta sado píslušé tost J zjé ž u pláovaých thotství ojlo v 4 týdu žvota dítt rlatv víc at ž u thotství pláovaých Prov xplctí výpoty: 35 6 36 6 b l l 764 35 35 b l l 7 6 36 σ H + + + + + + 35 6 36 H A : : 68 Z σ b 7 68 453 p valu 4 Zaítá hypotézu o to ž ojí v 4 týdu závsí a pláováí thotství 49
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC 5 Tstováí pododlu poocí rozdíl dvací K tstováí pododlu lz použít tst daý rozdíl dvací založý a odhadch b v odlu a b v pododlu Tst s provádí prostdctví tzv dvací tré yí zavd Uvažuj jprv jhorší ožý odl trý á práv tol paratr ol j pozorováí tdy Pléhavjší odl (s vtší hodotou vrohodostí fuc xstuj Tto jbohatší odl s azývá saturovaý Oza axálí hodotu vrohodostí fuc v saturovaé odlu sybol ax Každý jý pdstavtlý odl j pododl saturovaého odlu Pléhavost bžého odlu ž posoudt poocí dvac D b b ( ( ( ax í j áš odl é pléhavý tí j hodota dvac D vtší podob jao j vtší rzduálí sout tvrc v lárí odlu pro é výstžý odl Poj dvac js zd zavdl zjéa proto ž s používá v souvslost s lostcou rrsí by j zd hodota ax trválí Saturovaý odl á paratr µ µ Odhad stdí hodoty µ j v pípad lostcé rrs pío taž j ( l + ( l ( ax Ozaí-l odhady pravdpodobost jdy v bžé odlu jao µ ( x v odlu lostcé rrs vyjádí jao ( l + ( D b ( l ˆ µ + ( l ( ˆ µ ˆ µ l ˆ µ µ dvac Vra s obcé stuac V aš bžé odlu t uvažuj jaý pododl apílad po vylouí ást rrsor Tstovou statstu daou rozdíl dvací odlu a pododlu (s odhady paratr b b vyjádí ásld: D ( b D( b Tato tstová statsta (rozdíl dvací á (za platost tstovaého pododlu asyptotcé rozdlí χ ( f d f j rovo rozdílu potu závslých paratr v porovávaých odlch Hypotézu H a podobé hypotézy o ulovost jdé : složy vtoru lz tstovat práv títo tst rozdílu dvací 5
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Podobost dvac rzduálíu soutu tvrc vdla saz rozšít poj ofctu dtrac taé a lostcou rrs K touto úlu jprv zavd poj ulového odlu Jd o odl d jsou všchy stdí hodoty µ E shodé Hodotu vrohodostí fuc dvac ozaí rsp D Hodotu loartcé vrohodostí fuc orálího lárího odlu lz vyjádt jao d ( b ( + l ( l l SS ( SS ˆ σ Kofct dtrac v lárí odlu lz vyjádt jao SS SS ( l( b l ( D( b D V uvdé vztahu j uvd ávod výpotu pro pípad lostcé rrs Pléhavjší odl ž j saturovaý alézt lz Dvac saturovaého odlu j ja ví rova ul taž ofct ž prot hodotu ax D Po dosazí do vztahu pro D dosta: D + l l l bo pro všcha j odhad stdí hodoty rlatví tost jd totž ( alr (99 proto avrhl upravt dfc zobcého ofctu dtrac a ax 5
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC ( D( b D D 6 Modfovaá lostcá rrs ástroj pro dsrac Lostcá rrs byla pvod vytvoa pro úly dsrac al ja s uáž lz j pro s úspch použít Modl lostcé rrs trý j upravý pro úly dsrac j dfová ásldov ch j posloupost závslých áhodých vl s altratví rozdlí jhož paratr spluj d ( [ ] [ ] ( x ( X x + ( + x ( X x + P P j záý (p+ rozrý paratr a X X j posloupost závslých áhodých vl Tto odl á tzv uící fáz v tré zá u aždého objtu ja hodoty X ta hodoty (tj ví do tré supy t trý objt patí a zálad této zalost odhad paratry x x d a poté dosta odhad ( fuc ( [ ] ( x ( x P( X x + Další objt u trého zá jho zaazí a u hož js al hodotu X poocých za padí do jdé z sup podl hodoty rozhodovací fuc Zd sc zá aprorí hustotu vly a podíou hustotu áhodé vly X za podíy y al pro výpot optálí rozhodovací fuc á postaí zalost x Poud podíé hustoty za podíy Xx trá j ura hodotou fuc ( δ ( x j j totž E [ L( δ ( X X x] L y δ ( x ( p( y x L( y j p( y x y y L ( j j p( j x ( x ( x j j Tdy [ L( δ ( X X x] { ( x ( x } E δ D Toto u xstuj P x a tudíž ž psát 5
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC ( x ar L( j j p( j x δ j Tdy objt a ž js al hodotu X poocých za zaadí do prví supy poud ( X ( X + X tj Tudíž objt zaadí do prví supy poud S ( X a do ulté supy poud S ( X < Pto S( x + x Dodj ž poud S ( X tj ( X ž objt zaadt do lbovolé supy až bycho zvýšl hodotu pravdpodobost chyby K vlastí dsrac vša usí použít odhad S ( x fuc S ( x v tré jsou záé paratry ahrazy odhady Poocí tody aptoly 3 tdy S ( x + x Hlaví výhodou tohoto odlu j fat ž lad žádé podíy a rozdlí áhodých vtor X X Pozáy: V rrsích odlch bývají obvyl vly X X jž jsou ay a objtch uící supy áhodé rsp jjch hodoty jsou astavy xprtátor Mž s taé stát ž v pípad spojtého rozdlí vl X X s tré z aých hodot X X opaují c z práv uvdého vša í a závadu Stál ž a vly X X pohlížt jao a áhodé Pro urí tortcé dsraí fuc potbuj zát hustotu vl X X postauj á zalost podíé hustoty vl za podíy X x Prosptví stud Ja j uvdo ohou s aé hodoty X X opaovat a být astavy xprtátor tj ohou být áhodé (tzv prosptví stud ch j pot rzých hodot vl X X v uící sup a x x jsou tyto hodoty ch yí j j vyjadují zaazí objt do sup Pto j pot objt s hodotou vysvtlujících za x clový pot objt j tdy yí rov ch j Jstlž jsou hodoty vysvtlujících vl áhodé a j áhodá jsou ísla l bycho p hldáí axál vrohodých odhad paratr a axalzovat sdružou hustotu vl za podíy X x X x ozdlí vl za podíy X x j bocé s paratry Uvdá podíá sdružá hustota j poto rova a ( x 53
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC f y ( y ( y y x x ( x ( x y Loartcá vrohodostí fuc j tdy rova + X ( + [ ( + l X l ( + ] l + + X [ ( + j X l ( + ] j Vztah pro loartcou vrohodost s tdy od vztahu uvdého v aptol 3 lší pouz o l l trý závsí a a a Tudíž ob tyto fuc abývají svého axa v stjé bod 7 Ovováí pdpolad lostcé rrs Pro tstovat pdpolady odl? Lostcý odl sc lad žádé zvláští požadavy a rozdlí áhodých vl X X al zato pdpoládá spcfcý tvar P X x Sutost ž opravdu platí pravdpodobost ( ( x P( X x + tstu [ ] bycho l ovt jlép poocí jaého statstcého Dál uvd tré tsty dobré shody pro odl lostcé rrs Záladí tsty dobré shody pro odl lostcé rrs Pro pops tst dobré shody použj zaí zavdé v rác pozáy Tj ch uící supa obsahuj objt ch j pot rzých hodot vl X X v uící sup a x x jsou tyto hodoty Ja jž bylo dív o vly X X usjí být ut áhodé (obvylý jv rrsích odl Mohou s tdy tré z hodot X X opaovat dyž jsou vly X X spojt rozdlé Clý odl lostcé rrs pracuj totž s podíý rozdlí vl za podíy X x X x Hodoty vyjadující zaazí -tého objtu do jdé z dvou sup pza a j j d j pot objt s hodotou vysvtlujících za X a j j ozauj zaazí objt u chž ají vysvtlující zay hodotu X x Dál oza j j ( j j 54
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Mtodou axálí vrohodost zísá odhady paratr Poocí tchto [ + ] odhad spoítá odhady lostcých pravdpodobostí ( ( x z vrohodostích rovc plyou vztahy j j Popíš tst dobré shody založý a Parsoov x ( j ( j χ statstc Pío Clou stuac lz popsat otí tabulou typu x s daý arálí sloupcový tost Pto -tý sloupc tabuly rprztuj bocé rozdlí s paratry ( x Tabula odhadutých tostí á tvar: X x x ( ( Tabula prcých (pozorovaých tostí j tvaru: X x x Protož á dáy arálí sloupcové tost jsou hodoty v aší tabulc vázáy podía ( + ( + ( Tto údaj bud potbovat pro výpot stup volost v Parsoov tstové statstc trá á tvar Z ( ( ( + ( ( ( Poocí této statsty lz tstovat shodu dat v pozorovaé tabulc s tabulou tortcou trá j v aš pípad založa a odlu lostcé rrs P hypotéz H : platí lostcý odl á statsta Z asyptotcy rozdlí χ s ásldující pot stup volost: vlost otí tabuly pot vazb v tortcé tabulc pot odhadutých paratr (p+ (p+ Tdy p platost H j p + > p + Z χ ( ( Saozj usí být spla podía ( 55
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Ppo vša jd problé trý j spoj s použtí výš uvdého tstu dobré shody ozdlí tstové statsty j zísáo asyptotcy pro a v pratcých stuacích (obzvlášt v pípadch dy alspo jda složa vysvtlujících áhodých vtor X X á spojtý charatr j Tdy s rozsah výbru rost též pot stup volost tstových statst McCullah a ldr (989 uvdl ž pro j p platost H EZ < ( p + V roc 989 vša Hosr a Lshow provdí rozsáhlých sulací potvrdl ž aproxac stdí hodoty statsty Z výraz ( p + j pratcy použtlá Další problé trý j spoj s použtí Parsoovy Z statsty j požadav a dostat vlé tortcé tost ap 5 ( 5 trý též bud obvyl spl poud Oba výš uvdé probléy lz vyšt poud bud < pvé Popíš s tstovou statstu avržou jž zíý Hosr a Lshow trá j založa práv a této yšlc Hosrovy-Lshowovy tsty Statsty vhodé pro tsty dobré shody avržé Hosr a Lshow jsou založy a ssupí trých sloupc otí tabuly uvdé v aptol 6 jprv zvolí < pot požadovaých sloupc otí tabuly Pozorováí pzaí ta aby platlo Výsld ssupí jsou sloupc obsahující pblž stjý pot pozorováí Do prvího sloupc zaadí pblž pozorováí trý álží jší odhaduté pravdpodobost aší sahou j aby bylo co ožá jblíž hodot Postup vytváí další sloupc až o v -té sloupc j pblž pozorováí t t trý álží jvtší odhaduté pravdpodobost t t + pto ozaují poty rzých hodot vysvtlujících vl X X v jdotlvých sloupcích (tdy platí j j ch t t v jdotlvých sloupcích tdy splují vztahy a ch jsou poty pozorováí t t Saží s aby + bylo co jblíž hodot J-l azývají s hodoty odhadutých pravdpodobostí jž oddlují jdotlvé sloupc jao dcly rza Saoté sloupc otí tabuly bud v aší prác azývat dclový supa Pro ovou otí tabulu typu x yí spoítá odhaduté tortcé a prcé tost Odhadutá tortcá tost pro ád a -tý sloupc j O dclch s luví v stuacích dy í v aždé sloupc ps dsta všch pozorováí 56
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC c t pro ád a -tý sloupc j + t t c t t ( Eprcá tost pro ád a -tý sloupc j + o j pro ád a -tý sloupc j t + j o t ( j t + j j odhad pravdpodobost P X { x t x } t c Dál ch ( + t Tabula odhadutých tortcých tostí á tdy tvar: t + X sloupc -tý sloupc ( ( Tabula prcých (pozorovaých tostí j tvaru: X sloupc -tý sloupc o o o o Tstová statsta Hosrova-Lshowova tstu pro ovováí shody s odl lostcé rrs á tvar bžé Parsoovy χ statsty pro ovováí shody tortcé a prcé tabuly tdy Cˆ ( o ( o ( + ( o ( Užtí rozsáhlých sulací bylo uázáo ž pro Ĉ pblž rozdlí ( á p platost hypotézy H statsta χ o (- stupích volost Podl Hosra a Lshowa lz p platost H dob aproxovat rozdlí statsty volost též v stuac dy Ĉ rozdlí χ o (- stupích 57
LOGSTCKÁ EGESE A JEJÍ UŽTÍ PO DSKMAC Aby bylo ožé použít výš uvdou statstu l bycho jšt ovt 5 ( 5 í-l tato podía spla l bycho slout tré sloupc tabuly a tdy sížt hodotu ísla Auto vša tvrdí ž poruší této podíy í pílš a závadu Hosr a Lshow dál doporuují volt 6 bo pro > 6 j jž statsta Ĉ álo ctlvá a rozdíly z tortcý a prcý tost a té vždy duj shodu s odl Otázy u s v statstc íá dsrac? Srovjt lostcý a orálí lárí rrsí odl 3 Vysvtlt pojy šac a lot 4 Vysvtlt ja s tstují pododly poocí dvací 5 Ja s využívá lostcá rrs pro dsrac? 6 Jaé pdpolady j tba tstovat u lostcé rrs? 7 Prcp Hosr-Lshowových tst 58