ASYMPTOTICKÉ TESTY HYPOTÉZ V MODELECH S RUŠIVÝMI PARAMETRY

Podobné dokumenty
4. B o d o v é o d h a d y p a r a m e t r ů

Náhodný výběr 1. Náhodný výběr

14. B o d o v é o d h a d y p a r a m e t r ů

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

3. Lineární diferenciální rovnice úvod do teorie

8. Analýza rozptylu.

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Pavel Pejřimovský. Katedra pravděpodobnosti a matematické statistiky

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

12. N á h o d n ý v ý b ě r

Intervalové odhady parametrů některých rozdělení.

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

n-rozměrné normální rozdělení pravděpodobnosti

Pravděpodobnost a aplikovaná statistika

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Definice obecné mocniny

Kapitola 4 Euklidovské prostory

Pravděpodobnost a aplikovaná statistika

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Odhady parametrů 1. Odhady parametrů

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Kapitola 5 - Matice (nad tělesem)

Intervalové odhady parametrů

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

MATICOVÉ HRY MATICOVÝCH HER

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Komplexní čísla. Definice komplexních čísel

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

17. Statistické hypotézy parametrické testy

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

Správnost vztahu plyne z věty o rovnosti úhlů s rameny na sebe kolmými (obr. 13).

2. Náhodná veličina. je konečná nebo spočetná množina;

NMAF061, ZS Zápočtová písemná práce VZOR 5. ledna e bx2 x 2 e x2. F (b) =

8. Odhady parametrů rozdělení pravděpodobnosti

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

3. Charakteristiky a parametry náhodných veličin

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

PRAVDĚPODOBNOST A STATISTIKA

ŘADY Jiří Bouchala a Petr Vodstrčil

n=0 a n, n=0 a n = ±. n=0 n=0 a n diverguje k ±, a píšeme n=0 n=0 b n = t. Pak je konvergentní i řada n=0 (a n + b n ) = s + t. n=0 k a n a platí n=0

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

7. Odhady populačních průměrů a ostatních parametrů populace

Testování statistických hypotéz

1 Uzavřená Gaussova rovina a její topologie

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Úloha II.S... odhadnutelná

NMAF063 Matematika pro fyziky III Zkoušková písemná práce 17. ledna 2019

5. Posloupnosti a řady

Testy homoskedasticity v lineárním modelu

Matematika I, část II

8.2.1 Aritmetická posloupnost

Deskriptivní statistika 1

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

Úloha III.S... limitní

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Masarykova univerzita Přírodovědecká fakulta

6. Posloupnosti a jejich limity, řady

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

NMAF063 Matematika pro fyziky III Zkoušková písemná práce 25. ledna x 1 n

NEPARAMETRICKÉ METODY

Abstrakt. Co jsou to komplexní čísla? K čemu se používají? Dá se s nimi dělat

Zformulujme PMI nyní přesně (v duchu výrokové logiky jiný kurz tohoto webu):

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Znegujte následující výroky a rozhodněte, jestli platí výrok, nebo jeho negace:

c) Pomocí Liouvillovy věty dokažte, že Liouvillovo číslo je transcendentí. xp 1 (p 1)! (x 1)p (x 2) p... (x d) p e x t f(t) d t = F (0)e x F (x),

NMSA331 Matematická statistika 1

Číselné charakteristiky náhodných veličin

1 Trochu o kritériích dělitelnosti

PoznÁmky k přednášce

Přednáška 7, 14. listopadu 2014

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

z možností, jak tuto veličinu charakterizovat, je určit součet

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

V. Normální rozdělení

8.2.1 Aritmetická posloupnost I

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

je číselná posloupnost. Pro všechna n položme s n = ak. Posloupnost

11. přednáška 16. prosince Úvod do komplexní analýzy.

2.4. INVERZNÍ MATICE

Spojitost a limita funkcí jedné reálné proměnné

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

NMAF061, ZS Zápočtová písemná práce skupina A 16. listopad dx

PRAVDĚPODOBNOST A STATISTIKA

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

P. Girg. 23. listopadu 2012

Matematika 1. Ivana Pultarová Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D Posloupnosti

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Cvičení 1.1. Dokažte Bernoulliovu nerovnost (1 + x) n 1 + nx, n N, x 2. Platí tato nerovnost obecně pro všechna x R a n N?

Číselné řady. 1 m 1. 1 n a. m=2. n=1

definované pro jednotlivé řády takto: ) řádu n nazýváme číslo A = det( A) a a a11 a12

Kvantily. Problems on statistics.nb 1

Zimní semestr akademického roku 2015/ listopadu 2015

Iterační metody řešení soustav lineárních rovnic

Transkript:

ROBUST 2000, 25 34 c JČMF 200 ASYMPTOTICKÉ TESTY HYPOTÉZ V MODELECH S RUŠIVÝMI PARAMETRY MICHAL KULICH Abstrakt. We discuss likelihood ratio, Wald ad Rao test statistics for testig several parameters i a fiite-dimesioal model with uisace parameters. A proof of their asymptotic χ 2 distributio is preseted. Three examples o the use of the Rao score statistic are icluded. Rezme: Eta stat zaimaet s kriteriem otoxei pravdopodobi, kriteriem Va da i kriteriem Rao dl proverki esko ka parametrov v koeqomeryq modelq s mexasqimi parametrami. Pokazyvaec dokazate stvo iq prede ogo χ 2 raspredelei. Primeeie akopleoj statistiki Rao illstrirovao trem primerami.. Úvod Uvažujme pozorováí X,...,X,kdeX i jsou měřitelá zobrazeí Ω, A X, B. Pro jedoduchost zde budeme předpokládat, že pozorováí jsou ezávislá a stejě rozděleá, ale teto předpoklad eí obecě utý. Necht je dáa možia pravděpodobostích měr P = {P θ ; θ Θ} a Ω, A a echt rozděleí každého X i jest P 0 = P θ0 pro ějaké θ 0 Θ. Možiu P budeme azývat model a budeme vyžadovat, aby pro libovolé parametry θ, θ Θ takové, že θ θ, platilo P θ P θ. V tomto čláku se omezíme a Θ R d,takžeθ je vektor o d složkách. Záme-li skutečý parametr θ 0 ebo umíme-li jej dobře odhadout, víme vše o rozděleí každého X i. V řadě praktických případů ás však ezajímá celé rozděleí každého pozorováí, ale je ějaký jeho aspekt. Představme si tedy, že každý parametr θ Θmůžeme rozdělit a dvě části, θ o m složkách a θ 2 o d m složkách, takže θ T =θ T, θ T 2. Parametr θ echt obsahuje vše, co ás zajímá o rozděleí X,...,X počet jeho složek m je obvykle malý, a parametr θ 2 echt zahruje zbytek. Nazývejme θ cílový parametr a θ 2 rušivý parametr. Stejýmzpůsobem rozdělíme skutečý parametr θ 0 a θ 0 a θ 02. Chceme testovat hypotézu, že cílový parametr θ 0 je rove ějaké hypotetické hodotě θ H. Vzhledem k modelu, s ímž pracujeme, se vlastě jedá o test složeé hypotézy H 0 : θ 0 Θ H, kde Θ H = {θ Θ; θ = θ H } proti alterativě H : θ 0 Θ H. Teto přehledový čláek pojedává o testech takovýchto složeých hypotéz a podává souhr teoretických výsledků, a ichž jsou založey. V kapitole 2 krátce shreme teorii maximálě věrohodých odhadů parametru θ a zavedeme začeí. V kapitole 3 defiujeme testové statistiky pro testováí hypotézy H 0 a odvodíme jejich 2000 Mathematics Subject Classificatio. Primary 62F03. Klíčová slova. Test Raovy, Waldovy a věrohodostím poměrem, rušivé parametry. Teto čláek vzikl za podpory výzkumého záměru MSM 3200008 Matematické metody ve stochastice.

26 Michal Kulich asymptotické rozděleí. Kapitola 4 bude věováa příkladům a kapitola 5 zobecí předchozí výklad a jié ež maximálě věrohodé odhady. 2. Odhady metodou maximálí věrohodosti Vzhledem k formulaci problému, jak jsme ji popsali v předchozí kapitole, se jako vhodý ástroj k řešeí jeví teorie maximálě věrohodých odhadů. Proto si zde zavedeme vhodé začeí a krátce shreme její základí výsledky, které budeme potřebovat. Budeme odhadovat celý parametr θ a základě pozorováí X,...,X za předpokladu, že platí model P. Necht px; θ je hustota rozděleí P θ vzhledem k ějaké σ-koečé míře µ. Defiujme L θ = px i ; θ, θ Θ, l θ =ll θ = l px i ; θ. Fukci L azýváme věrohodostí fukce. Defiice. Vektor θ Θ se azývá maximálě věrohodý odhad parametru θ v modelu P, právě když L θ L θ θ Θ. Nyí předpokládejme, že px; θ je dostatečě hladká fukce θ v ějakém okolí θ 0, a defiujme ásledující vektory a matice odboré termíy pro tyto objekty, existují-li, jsou uvedey v závorkách. Začeí. Uθ X i = l px i; θ skórová fukce, θ U θ = Uθ X i skórová statistika, Iθ X i = 2 l px i ; θ θ θ T, I θ = Iθ X i výběrová iformačí matice, Iθ =E θ Iθ X i Fisherova iformačí matice. O Fisherově iformačí matici předpokládáme, že existuje a je positivě defiití v okolí θ 0.Původí defiice maximálě věrohodého odhadu je z praktického hlediska poěkud ešiková a proto budeme adále pracovat s upraveou defiicí. Defiice. Vektor θ Θ se azývá maximálě věrohodý odhad parametru θ v modelu P, právě když řeší věrohodostí rovici U θ =0. Pro platost asymptotických výsledků teorie maximálí věrohodosti potřebujeme mít splěy podmíky regularity, které zaručují dostatečou hladkost a rozumé chováí věrohodostí fukce v okolí θ 0. Možou formulaci těchto podmíek lze alézt apříklad v kize Lehma 983, kap. 6.4. At už jsou však tyto podmíky formulováy jakkoli, vždy zaručují, že platí E θ0 Uθ 0 X i =0 a var θ0 Uθ 0 X i =Iθ 0 > 0.

Asymptotické testy hypotéz v modelech s rušivými parametry 27 Za platosti podmíek regularity lze dokázat větu o existeci a kosisteci maximálě věrohodého odhadu viz Lehma, 983, věta 6.4. a také ásledující tvrzeí. Tvrzeí. Necht jsou splěy podmíky regularity a echt θ p θ0.pak i U θ 0 d N d 0, Iθ 0, ii θ θ 0 = I θ 0 U θ 0 +o P d N d 0, I θ 0. Uvažujme yí jedoduchou hypotézu H 0 : θ 0 = θ H pro ějaké θ H Θ. Zaved me ejprve tři testové statistiky pro testováí H 0 proti oboustraé alterativě. Defiice. i Statistika λ = L θ L θ H se azývá věrohodostí poměr Neyma a Pearso, 928. ii Statistika W = θ θ H T Î θ θ θ H se azývá Waldova statistika Wald, 943. iii Statistika R = U θ H T Î θ H U θ H se azývá Raova skórová statistika Rao, 947. Matice Î, jež se vyskytuje v defiici Raovy a Waldovy statistiky, představuje bud přímo Fisherovu iformačí matici I aebo její jakýkoliv kosistetí odhad, apříklad I. Přibližé kritické hodoty pro všechy tři statistiky lze získat z kvatilů χ 2 rozděleí o d stupích volosti, ebot za platosti H 0 máme 2lλ W R d χ 2 d. U W a R teto výsledek plye rovou z předchozího tvrzeí, u 2 l λ je třeba vhodým způsobem rozviout logaritmus věrohodosti v Taylorovu řadu. 3. Testy s rušivými parametry Nyí se vrat me k problému testováí složeé hypotézy. Rozdělili jsme každý parametr a dvě části θ T =θ T, θt 2, kde prví část má m složek. Podobě rozdělíme skutečý parametr θ T 0 =θt 0, θt 02, maximálě věrohodý odhad θ T = θ T, θ T 2, skóre a iformačí matici U θ I θ I U θ =, Iθ = 2 θ. U 2 θ I 2 θ I 22 θ Zde I je matice typu m m, I 2 je matice typu m d m atd. Chceme testovat hypotézu H 0 : θ 0 Θ H,kdeΘ H = {θ Θ; θ = θ H }.Tato hypotéza se často epřesě zapisuje jako H 0 : θ 0 = θ H, což svádí k ásledujícímu aivímu přístupu, který igoruje přítomost rušivých parametrů. Jelikož ezáme θ 02, odhademe jej maximálě věrohodým odhadem θ 2, jež jest kosistetí. Motivovái tímto faktem adále předstíráme, že θ 02 je přesě rovo θ 2 afakticky

28 Michal Kulich přejdeme k m-rozměrému submodelu P = {P θ ; θ Θ, θ 02 = θ 2 }.Totoovšem eí korektí přístup, ebot θ 2 je áhodá veličia. Dále používáme teorii maximálí věrohodosti, jak byla popsáa výše, aplikovaou a submodel P,tj.se skórovou statistikou U a iformačí maticí I. Ozačíme-li hodotu parametru za hypotézy v submodelu P jako θ θh H =, θ 2 dostaeme testové statistiky i ii iii λ = L θ L θ H, W = θ θ H T Î θ θ θ H, R = U θ H T Î θ HU θ H. Bohužel, tyto statistiky za platosti hypotézy obecě emají očekávaé χ 2 m rozděleí. Testy s požadovaou hladiou takto dostaeme je v ěkterých speciálích případech. Například je-li hustota pozorováí ormálí, testovaý parametr je středí hodota a rušivý parametr je rozptyl, pak limití rozděleí testových statistik vskutku ezávisí a tom, zda rozptyl je zám či ikoli. Teto fakt je všeobecě zám již z úvodích statistických předášek, což v praxi může svádět k slepému používáí aivího přístupu i tam, kde eí oprávěý. Jak tedy dostaeme správé testové statistiky v přítomosti rušivých parametrů? Předpokládejme, že hypotéza H 0 platí a zkoumejme submodel P H = {P θ ; θ Θ, θ = θ H }.TotojearozdílodP opravdu submodel modelu P, atod m- rozměrý. Ozačme θ maximálě věrohodý odhad parametru θ 0 v submodelu P H.Platí θh θ =, kde θ θ θh 2 řeší U 2 = 0. 2 θ 2 Odtud U 2 θ = 0, ale U θ 0.Platí-lisubmodelP H, tj. hypotéza H 0,dostaeme aplikací tvrzeí z předchozí kapitoly U 2 θ 0 d N d m 0, I 22 θ 0, θ θ 0 = 0 I 22 θ 0U 2 θ 0 +o P d 0 N d m 0, I 22 θ 0. 2 Asymptotický rozptyl θ 2 θ 02 v submodelu P H je tedy I 22 θ 0. Co je však asymptotický rozptyl θ 2 θ 02 vmodelup? Použijme ásledující lemma, které se sado dokáže rozásobeím matic. I I Lemma. Necht I = 2 je regulárí bloková matice a blok I I 2 I je čtvercový. 22 Potom I I I = 2 I 2 I 22,

Asymptotické testy hypotéz v modelech s rušivými parametry 29 kde I = I.2, I2 = I.2 I 2I 22, I.2 = I I 2 I 22 I 2, I 22 = I 22., I2 = I 22. I 2I, I 22. = I 22 I 2 I I 2. Takže asymptotický rozptyl θ 2 θ 02 jei 22 I 2 I I 2 I 22. Odečteý souči tří maticje daň za ezalost parametru θ 0 vmodelup. Tutoúvahumůžeme obrátit a vidíme, že asymptotický rozptyl θ θ 0 za ezalosti rušivého parametru θ 02 je I I 2 I 22 I 2, zatímco kdybychom rušivý parametr zali přesě, rozptyl by byl I.PokudmaticeI 2 eí ulová, tyto rozptyly ejsou stejé a aiví přístup proto selhává. Nyí můžeme defiovat testové statistiky pro testováí hypotézy H 0 : i Věrohodostí poměr λ = L θ L θ, ii Waldova statistika W = θ θ H T Î.2 θ θ θ H, iii Raova skórová statistika R = U θ T Î θ U θ = U θ T Î.2 θ U θ. Waldova statistika pro test H 0 : θ 0 =0přim = je vlastě druhou mociou podílu odhadu parametru a jeho odhaduté směrodaté odchylky. Vzhledem k tomu, že tyto podíly tiskou takřka všechy statistické programy, je Waldova statistika v praxi ejpoužívaější. Nyí defiovaé statistiky již mají očekávaé limití rozděleí: Věta. Jsou-li splěy podmíky regularity, pak za platosti H0 i ii iii 2lλ W R d χ 2 m. Tvrzeí ii je triviálí, ale důkaz i a iii eí jedoduché ve statistické literatuře ajít. Tvrzeí i je dokázáo apříklad v kihách Rao 978, oddíl 6e.3 a Serflig 980, oddíl 4.4.4. Serfligův důkaz však obsahuje chybu. Proto zde tvrzeí i a iii dokážeme. Důkaz. Dokažme ejprve i. Rozvojem l θ v Taylorovu řadu kolem bodu θ dostaeme l θ =l θ +U θ T θ θ + 2 θ θ T [ I θ ] θ θ, kde θ leží a přímce mezi θ a θ. Za platosti H 0 tedy I θ p Iθ 0. Jelikož U θ = 0, platí 2lλ =2[l θ l θ ] = θ θ T Iθ 0 θ θ +o P. Zaproximacípro θ θ 0 a θ θ 0 uvedeých v a 2 ihed plye, že θ θ = [ I θ 0 Bθ 0 ] U θ 0 +o P,

30 Michal Kulich kde 0 0 Bθ 0 = 0 I 22 θ 0 je matice d d. Limití rozděleí 2 l λ je tudíž totožé s rozděleím áhodé veličiy Z T AZ, kdez N d 0, I a A I BII B =I B. Argumet θ 0 jsme u matic B a I pro zjedodušeí přestali psát. Ježto AIje idempotetí matice, Z T AZ χ 2 trai. Zbývá určit trai=rai=ria I. Ale sado se ověří, že I.2 0 IA I =. 0 0 Takže hledaý počet stupňů volostijeria I = m. Nyí přistupme k důkazu iii. Za platosti H0 máme Î θ p I θ 0. Víme, že U 2 θ = 0 a Taylorovým rozvojem dostaeme U θ = U θ 0 + U θ θ θ T θ 0, kde θ p θ 0 a U θ p I θ θ T 0, I 2 θ 0. Z aproximace 2 pro θ θ 0 plye U θ = U θ 0 +I 2 θ 0 I 22 θ 0 U 2 θ 0 +o P. d Jelikož /2 U θ 0 N d 0, Iθ 0, limití rozděleí U θ jem-rozměré ormálí s ulovou středí hodotou. Sado se spočte, že asymptotický rozptyl je rove I.2 θ 0. Ozačíme-li Z libovolý áhodý vektor s rozděleím N m 0, I.2 θ 0, hed vidíme, že limití rozděleí R je totožé s rozděleím áhodé veličiy Z 0 T I θ 0 Z 0 =ZT I θ 0 Z = Z T I.2 θ 0Z a Z T I.2 θ 0Z χ 2 m. Všechy tři testové statistiky tedy mají za hypotézy stejé limití rozděleí. Jsou však mezi imi jié rozdíly. Za prvé, k výpočtu Raovy skórové statistiky stačí odhadout parametr je za platosti hypotézy, tedy v často mohem jedodušším submodelu P H. Pro Waldovu statistiku potřebujeme odhad v obecém modelu P a pro věrohodostí poměr odhady oba. Tyto dvě statistiky jsou tedy výpočetě áročější. Za druhé, je rozšíře ázor, že Waldova statistika koverguje ke svému limitímu rozděleí mohem pomaleji ež skórová statistika ebo poměr věrohodostí a proto při běžých rozsazích výběru testy založeé a Waldově statistice často edodržují požadovaou hladiu. Toto tvrzeí vychází z praktických zkušeostí odboríků, kteří tyto testy používají, je však obtížé ajít pro ě teoretické zdůvoděí ve statistické literatuře. 4. Příklady V této kapitole uvedeme ěkolik příkladů testových statistik, které lze odvodit jako Raovy skórové statistiky v modelech s rušivými parametry.

Asymptotické testy hypotéz v modelech s rušivými parametry 3 Příklad. Zamékový test. Aděl 999 ukazuje odvozeí testové statistiky pro zamékový test doplěý testem a pořadí, kterou publikovali Rayer a Best 997. Máme dvě ošetřeí A a B. Prví skupia osob vyzkouší ejprve A a pak B a zazameá, kterému ošetřeí dává předost. Druhá skupia složeá z jiých 2 osob testuje ošetřeí v opačém pořadí a také zazameá své preferece. Chceme rozhodout, zda je mezi oběma ošetřeími ějaký rozdíl. Aděl 999 předpokládal, že = 2, ale my tuto podmíku klást ebudeme. Ozačme N k počet lidí z k-té skupiy, kteří preferovali ošetřeí A a N k2 počet lidí z k-té skupiy, kteří preferovali B. Necht dálen j + N 2j = N j, j =, 2a + 2 =. Situacimůžeme popsat ásledujícím modelem: Máme dva ezávislé biomické výběry, N Bi,p an 2 Bi 2,p 2. Parametr p k vyjadřuje pravděpodobost, že člověk z k-té skupiy preferuje ošetřeí A. Chceme testovat hypotézy H 0 :p + p 2 /2 =/2 ah 0 : p = p 2. Hypotéza H 0 zameá, že eí rozdíl mezi ošetřeími a hypotéza H 0 zameá, že ezáleží a pořadí, v jakém byla ošetřeí testováa. Vzhledem k těmto hypotézám zavedeme ové parametry φ a ξ tak, že p =/2+ξ + φ a p 2 =/2+ξ φ. Hypotézy ted můžeme psát H 0 : ξ =0 ah 0 : φ =0. Sestavme yí skórový test hypotézy H 0 : ξ = 0. Máme parametr θ =ξ,φ T a parametrický prostor Θ = {ξ,φ T /2, /2 2 : ξ + φ < /2, ξ φ < /2}. Cílový parametr je ξ, jeho dimese je m = a rušivý parametr je φ. Logaritmus věrohodosti je, až a kostatu, l θ = N l 2 + ξ + φ+n 2 l 2 ξ φ+n 2 l 2 + ξ φ+n 22 l 2 ξ + φ. Derivováím podle ξ apodleφ spočítáme skóre N U θ = 2 + ξ + φ N 2 2 ξ φ + N 2 2 + ξ φ N 22 2 ξ + φ, N U 2 θ = 2 + ξ + φ N 2 2 ξ φ N 2 2 + ξ φ + N 22 2 ξ + φ. Odhadem Fisherovy iformačí matice je výběrová iformace děleá : 4 / Î θ =Î22θ = 4ξ + φ 2 + 4 2 / 4ξ φ 2, 4 / Î 2 θ =Î2θ = 4ξ + φ 2 4 2 / 4ξ φ 2. Nyí potřebujeme odhad φ rušivého parametru φ za platosti H 0 : ξ =0.Víme, že φ řeší U 2 0, φ = 0, což dává φ =N + N 22 N 2 N 2 /2. Zbývá spočítat U 0, φ aî.20, φ. Po úpravě dostaeme U 0, φ N N 22 = + N 2 N 2 N + N 22 N 2 + N 2 a Î.2 0, φ 4 2 / = N + N 22 N 2 + N 2. Všiměme si, že je-li = 2, pak za platosti hypotézy I 2 = I 2 =0.Vtakovém případě I.2 0, φ =I 0, φ a tudíž zde ezáleží a tom, zda rušivý parametr φ je zám či ikoli.

32 Michal Kulich Raova skórová statistika po úpravě vyjde R = U 2 0, φ Î.20, φ = + N N 2 N 2 N 22 2 2 N + N 22 N 2 + N 2. Její limití rozděleí je χ 2 avpřípadě = 2 je totožá se statistikou, kterou uvádí Aděl 999. Stejým způsobem se odvodí statistika pro test hypotézy H 0 : φ =0. Příklad 2. Test expoeciality proti weibullovské alterativě. Necht jsou dáa ezávislá a stejě rozděleá pozorováí X,...,X. Chtěli bychom vědět, zda mají expoeciálí rozděleí, a jako alterativu budeme uvažovat rozděleí Weibullovo. Každé X i tedy má hustotu px;,β= β [ x β ] x β exp, x > 0,,β > 0. Parametr je θ =,β T a parametrický prostor Θ = R + 2. Chceme testovat hypotézu H 0 : β =,ebot za její platosti mají X i rozděleí Exp/ se středí hodotou. To je rušivý parametr. Skórový vektor má složky U θ = U 2 θ = β β [ Xi β ], [ β Xi +l Fisherova iformačí matice má po úpravě tvar Iθ = β 2 2 γ [ π 2 β 2 γ β Xi l 6 + γ2 ] ] β Xi. kde γ =0.5772. je Eulerova kostata. Za platosti H 0 : β = sado odhademe jako = X = X i.dále spočítáme U 2, = + l X i X X i l X i, a [ ] π 2 I 22., = + γ2 γ 2 / 2 6 / 2 = π2 6. Takže skórová statistika má tvar [ ] 2 R = U 2, 2 I 22., = 6 π 2 + l X i X X i l X i a její limití rozděleí je χ 2.Vtomtopříkladěmůžeme je oceit, že jsme emuseli počítat odhady parametrů obecého Weibullova rozděleí. Tabulka. Délky telefoích hovorů prof.xmi:sec 0:8 3:42 0:48 0:48 0:54 0:8 :48 3:24 :42 0:2 0:36 :2 2:00 0:42 4:06 3:42 2:00 0:30 2:54 3:42 2:06 0:36 2:2 3:36 :06 2:30 2:2 2:54 2:8 0:06 :54 :24 :2 3:24

Asymptotické testy hypotéz v modelech s rušivými parametry 33 V tabulce jsou uvedey délky výchozích telefoích hovorů ejmeovaého zaměstace KPMS za jede měsíc =34.Přesvědčmesespomocíašískórové statistiky, zda tato data eodporují obecému přesvědčeí o expoeciálím rozděleí doby telefoího hovoru. Sado spočítáme, že v tomto případě R =, 58, což je mohem meší ež 3, 842, 95% kvatil χ 2 rozděleí. Nemůžeme tedy zamítout expoecialitu ve prospěch Weibullova rozděleí. Příklad 3. Test expoeciality proti gama alterativě. Opět máme ezávislá a stejě rozděleá pozorováí X,...,X a chceme testovat, zda mají expoeciálí rozděleí. Za alterativu tetokrát vezmeme gama rozděleí. Hustota X i má tedy tvar fx; a, p = ap Γp xp e ax, x > 0, a,p > 0. Parametr je θ =a, p T a parametrický prostor Θ = R + 2. Chceme testovat hypotézu H 0 : p =. Za platosti H 0 mají X i rozděleí Expa se středí hodotou /a. Rušivý parametr je a. Skórový vektor má složky U θ = p a X i, U 2 θ = l a Γ p Γp + l X i. a Fisherova iformačí matice jest p Iθ = a 2 a a ψ, p [ ] kde ψ p = d2 l Γp dp = Γ p 2 Γp Γ p 2. Γp Za platosti H 0 : p = odhademe a jako ã =/ X. Jelikož Γ =, Γ = γ aγ = π 2 /6+γ 2, sado zjistíme, že U 2 ã, = γ + l X i X a I 22. ã, = π2 6. Raova skórová statistika má tvar 2 R = U 2 2 ã, I 22. ã, = 6 π 2 γ + l X i l 6 X a její limití rozděleí je opět χ 2. Spočítáme-li tuto statistiku z dat uvedeých v tabulce, dostaeme,509. I to je hluboko pod kritickou hodotou a expoecialitu tedy emůžeme zamítout ai ve prospěch gama rozděleí. 5. Zobecěí Maximálě věrohodý odhad samozřejmě eí jediá možost, jak odhadout parametry modelu P. Často se používají i jié odhady, založeé a kvazivěrohodosti ebo obecěji a ějaké rovici odhadu U θ =0, kdeuθ = ψθ X i již eí skóre odvozeé z ějaké věrohodostí fukce, ale obecá fukce parametrů a pozorováí. Budeme ji azývat pseudoskóre. Do této třídy odhadů spadají apříklad mohé M-odhady, parciálě věrohodý odhad zavedeý Coxem 972 pro model proporcioálího risika, Wedderburův 974 kvazivěrohodostí odhad pro

34 Michal Kulich zobecěé lieárí modely, zobecěé rovice odhadu GEE Liaga a Zegera 986 pro korelovaá data, pseudověrohodostí odhad Breslowa a Claytoa 993 pro zobecěé lieárí modely s áhodými efekty a řada dalších důležitých odhadů. Aby řešeí θ rovice U θ =0 mělo aději být kosistetím odhadem, musí platit E θ0 ψθ 0 =0. Na rozdíl od maximálě věrohodého odhadu však yí obecě ψθ 0 var θ0 ψθ 0 E θ0 θ T. Ozačme tedy levou strau této erovosti rozptyl pseudoskóre Σ a pravou strau mius derivace pseudoskóre D. Oběmaticetypud d rozdělíme a čtyři bloky odpovídající cílovým a rušivým parametrům. Budeme předpokládat, že odhad θ je slabě kosistetí a že /2 Uθ 0 je asymptoticky ormálí s ulovou středí hodotou a rozptylovou maticí Σ. Z toho již plye, že θ θ 0 d N d 0, D ΣD T. Jak je to s testováím složeé hypotézy H 0 : θ 0 = θ H v tomto případě? Je zřejmé, že test poměrem věrohodostí eí možé zavést zcela obecě. Waldův test je zato díky asymptotické ormalitě θ sado aplikovatelý. Raovu skórovou statistiku je uté upravit: kde θ je odhad parametru za hypotézy, V = I m R = U θ T V U θ, D 2 D 22 Σ I m D 22 DT 2 a I m zde představuje jedotkovou matici typu m m. Stejý postup, jakým jsme odvodili limití rozděleí Raovy statistiky v předchozí kapitole, ám ukáže, že i tato statistika má asymptoticky rozděleí χ 2 m. Literatura Aděl, J. 999 Asymptotické testy. Iformačí Bulleti ČSS, roč. 0, č. 3, 0 2. Breslow, N. E. a Clayto, D. G. 993 Approximate iferece i geeralized liear mixed models. JASA, 88, 9 25. Cox, D. R. 972 Regressio models ad life-tables with Discussio. JRSS B, 34, 87 220. Lehma, E. L. 983 Theory of Poit Estimatio. New York: Wiley. Liag, K.-Y. a Zeger, S. L. 986 Logitudial data aalysis usig geeralized liear models. Biometrika, 73, 3 22. Neyma, J. a Pearso, E. S. 928 O the use ad iterpretatio of certai test criteria for purposes of statistical iferece. Biometrika, 20A, 75 240 a 263 294. Rao, C. R. 947 Large sample tests of statistical hypotheses cocerig several parameters with applicatios to problems of estimatio. Proc. Comb. Phil. Soc., 44, 50 57. Rao, C. R. 978 Lieárí metody statistické idukce a jejich aplikace. Praha: Academia. Rayer, J. C. W. a Best, D. J. 997 How order affects the sig test. Biometrics, 53, 46 42. Serflig, R. J. 980 Approximatio Theorems of Mathematical Statistics. New York: Wiley. Wald, A. 943 Tests of statistical hypotheses cocerig several parameters whe the umber of observatios is large. Tras. Amer. Math. Soc., 54, 426 482. Wedderbur, R. W. M. 974 Quasi-likelihood fuctios, geeralized liear models, ad the Gauss-Newto method. Biometrika, 6, 439 447. UK MFF, KPMS, Sokolovská 83, 86 75 Praha 8 E-mail: kulich@karli.mff.cui.cz