Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE. Josef Jílek. Skupinově sekvenční testy v klinických studiích

Podobné dokumenty
ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

1. Úvod do základních pojmů teorie pravděpodobnosti

Using a Kalman Filter for Estimating a Random Constant Použití Kalmanova filtru pro výpočet odhadu konstantní hodnoty

4. Třídění statistických dat pořádek v datech

7. ZÁKLADNÍ TYPY DYNAMICKÝCH SYSTÉMŮ

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

Simulační metody hromadné obsluhy

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

MATEMATIKA. O paradoxech spojených s losováním koulí

Agregace vzájemné spojování destabilizovaných částic ve větší celky, případně jejich adheze na povrchu jiných materiálů

2.4. DISKRÉTNÍ SIGNÁLY Vzorkování

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

NUMP403 (Pravděpodobnost a Matematická statistika I)

5 ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÉ NÁHODNÉ VELIČINY

Lineární regrese ( ) 2

χ 2 testy. Test nekorelovanosti.

POROVNÁNÍ MEZI SKUPINAMI

teorie elektronických obvodů Jiří Petržela syntéza a návrh elektronických obvodů

Neparametrické metody

Metoda konjugovaných gradientů

HODNOCENÍ DODAVATELE SUPPLIER EVALUATION

1. Házíme hrací kostkou. Určete pravděpodobností těchto jevů: a) A při jednom hodu padne šestka;

Testování hypotéz. December 10, 2008

Buckinghamův Π-teorém (viz Barenblatt, Scaling, 2003)

Hodnocení přesnosti výsledků z metody FMECA

3.3.4 Thaletova věta. Předpoklady:

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

Finanční matematika. Téma: Důchody. Současná hodnota anuity

15 Mletí. I Základní vztahy a definice. Oldřich Holeček (aktualizace v roce 2014 Michal Přibyl & Marek Schöngut)

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

SPOTŘEBITELSKÝ ÚVĚR. Na začátku provedeme inicializaci proměnných jejich vynulováním příkazem "restart". To oceníme při opakovaném použití dokumentu.

Regresní a korelační analýza

7.3.9 Směrnicový tvar rovnice přímky

APLIKACE MATEMATICKÉHO PROGRAMOVÁNÍ PŘI NÁVRHU STRUKTURY DISTRIBUČNÍHO SYSTÉMU

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

Úvod do Kalmanova filtru

Doc. Ing. Dagmar Blatná, CSc.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PST. 20. prosince 2017

Cvičení ze statistiky - 8. Filip Děchtěrenko

Přibližné řešení algebraických rovnic

Teoretické modely diskrétních náhodných veličin

You created this PDF from an application that is not licensed to print to novapdf printer (

Osově namáhaný prut základní veličiny

(iv) D - vybíráme 2 koule a ty mají různou barvu.

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně

4ST201 STATISTIKA CVIČENÍ Č. 7

BAYESŮV PRINCIP ZDENĚK PŮLPÁN

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Normální (Gaussovo) rozdělení

3. Mocninné a Taylorovy řady

7.3.9 Směrnicový tvar rovnice přímky

Kombinace s opakováním

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

symetrická rovnice, model Redlich- Kister dvoukonstantové rovnice: Margules, van Laar model Hildebrandt - Scatchard mřížková teorie roztoků příklady

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

( ) Příklady na otočení. Předpoklady: Př. 1: Je dána kružnice k ( S ;5cm)

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

1 Gaussova kvadratura

1.5.7 Prvočísla a složená čísla

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

REGRESNÍ ANALÝZA. 13. cvičení

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

6 5 = 0, = 0, = 0, = 0, 0032

f (k) (x 0 ) (x x 0 ) k, x (x 0 r, x 0 + r). k! f(x) = k=1 Řada se nazývá Taylorovou řadou funkce f v bodě x 0. Přehled některých Taylorových řad.

Teoretické modely diskrétních náhodných veličin

Kombinace s opakováním

8.1.2 Vzorec pro n-tý člen

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Závislost indexů C p,c pk na způsobu výpočtu směrodatné odchylky

4 všechny koeficienty jsou záporné, nedochází k žádné změně. Rovnice tedy záporné reálné kořeny nemá.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Konstrukce trojúhelníků II

Neparametrické metody

Model IS-LM Zachycuje současnou rovnováhu na trhu zboží a služeb a trhu peněz.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Normální (Gaussovo) rozdělení

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY. Disertační práce Ing. Jan Fábry

MODELOVÁNÍ A SIMULACE

ŘEŠENÍ VYBRANÝCH PŘEPRAVNÍCH ÚLOH 1

Reprezentace přirozených čísel ve Fibonacciho soustavě František Maňák, FJFI ČVUT, 2005

Vkládání pomocí Viterbiho algoritmu

7. TRANSFORMÁTORY. 7.1 Štítkové údaje. 7.2 Měření odporů vinutí. 7.3 Měření naprázdno

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

MOMENT SETRVAČNOSTI. Obecná část Pomocí Newtonova pohybového zákona síly můžeme odvodit pohybovou rovnici pro rotační pohyb:

Jana Vránová, 3. lékařská fakulta UK

8.1.2 Vzorec pro n-tý člen

Základy finanční matematiky

( ) Další metrické úlohy II. Předpoklady: Př. 1: Najdi přímku rovnoběžnou s osou I a III kvadrantu vzdálenou od bodu A[ 1;2 ] 2 2.

Automatizace generování stopslov

5 Parametrické testy hypotéz

Matematické modelování turbulence

ANALÝZA PRODUKCE OLEJNIN ANALYSIS OF OIL SEED PRODUCTION. Lenka Šobrová

Jednofaktorová analýza rozptylu

Stavový model a Kalmanův filtr

Transkript:

Unverzta Karlova v Praze Matematco-fyzální faulta BAKALÁŘSKÁ PRÁCE Josef Jíle Supnově sevenční testy v lncých studích Katedra pravděpodonost a matematcé statsty Vedoucí aalářsé práce: Mgr. Mchal Kulch Studjní program: Matemata Studjní oor: Oecná matemata Praha 0

Zde ych chtěl poděovat panu docentu Mchalu Kulchov za odornou pomoc př onzultacích této práce.

Prohlašuj, že jsem tuto aalářsou prác vypracoval(a) samostatně a výhradně s použtím ctovaných pramenů, lteratury a dalších odorných zdrojů. Beru na vědomí, že se na moj prác vztahují práva a povnnost vyplývající ze záona č. /000 S., autorsého záona v platném znění, zejména sutečnost, že Unverzta Karlova v Praze má právo na uzavření lcenční smlouvy o užtí této práce jao šolního díla podle 60 odst. autorsého záona. V Praze dne.5.0 podps 3

ázev práce: Supnově sevenční testy v lncých studích Autor: Josef Jíle Katedra / Ústav: Katedra pravděpodonost a matematcé statsty Vedoucí aalářsé práce: Mgr. Mchal Kulch, Katedra pravděpodonost a matematcé statsty, Matematco-fyzální faulta, Unverzta Karlova v Praze Astrat: Supnově sevenční testy jsou důležtou statstcou metodou. Analýzy dat jsou zde prováděny průěžně, což posytuje možnost uončt test dříve než jsou nasírána všechna pozorování. Tyto testy nacházejí uplatnění napřílad v medcíně. Př testování nových léů a procedur tato metoda přnáší fnanční úspory a etcé výhody. Exstuje mnoho přístupů provádění supnově sevenčních testů s různým vlastnostm. a záladě prostudované lteratury jsou v předložené aalářsé prác představeny záladní poročlejší typy supnově sevenčních testů. Je zde podroně vysvětlen jejch prncp a jsou posytnuty příslušné přílady. Díy těmto nformacím je tedy možné navrhnout a případně provést onrétní test. U jednotlvých metod jsou srovnány jejch výhody a nevýhody př použtí v reálných stuacích. Výsledem je pa přehledná šála různých testů, ze terých je možné vyrat onrétní test pro danou stuac. Klíčová slova: Supnově sevenční testy Ttle: Group Sequental Tests n Clncal Trals Author: Josef Jle Department: Department of Proalty and Mathematcal Statstcs Supervsor: doc., Mgr. Mchal Kulch, Department of Proalty and Mathematcal Statstcs, Faulty of Mathematcs and Physcs, Charles Unversty Prague Astract: Group sequental tests are an mportant statstcal method. The analyss of data are performed contnuously, whch allows us to termnate the test efore all oservatons are collected. For example these tests are used n medcne. When testng new drugs or procedures, ths method rngs aout fnancal savngs as well as ethcal advantages. There are many ways of conductng group sequental tests wth dfferent qualtes. Based on the perused lterature, oth asc and more complex types of group sequental tests are ntroduced n ths paper. t dscres ther prncple and respectve examples are provded. Wth ths nformaton t s possle to desgn and conduct a partcular test. t s merts and demerts are compared for every method n real stuatons. The result s a taular scale of dfferent tests, from whch t s possle to select a partcular test for a gven stuaton. Keywords: Group sequental tests 4

Osah Úvod 6. Záladní typy supnově sevenčních testů 9.. Klascý test s jednou analýzou 9.. Dvoustranné supnově sevenční testy 0.3. Pococův test.4. O Brenův & Flemngův test 5.5. Porovnání Pococova a O Brenova & Flemngova Testu 8.6. Wangovy & Tsatsovy Testy.7. Hayttleův-Petoův Test 5.8. Zoecnění záladních typů supnově sevenčních testů 7. Specální typy supnově sevenčních testů 3.. nformační hladny 3.. Testy s vntřním línem 34.3. Testy se spotření funcí 38.4. umercý výpočet rtcých hodnot 45 Závěr 49 Seznam použté lteratury 50 5

Úvod Tato práce se zaývá použtím supnově sevenčních testů. Prncp této metody je taový, že se provede více analýz místo pouze jedné, ja je tomu v lascém případě. Tyto analýzy se provádějí vždy na záladě všech dat, terá se nám do té doy podařlo shromáždt. ulová hypotéza tedy může ýt uď zamítnuta neo přjmuta mnohem dřívě než dyychom provedl jednu rozsáhlou analýzu dat. V tomto případě je ale složtější určt vlastnost zvoleného testu. Zajímá nás hlavně pravděpodonost chyy. a. druhu. V této prác předládám různé metody, jejchž pomocí lze tyto testy onstruovat. U aždé metody dále proírám vlastnost testu, teré potřeujeme znát. Supnově sevenční testy jsou v prax hojně využívány. Jedná se hlavně o medcínsé oory, dy se testují nové léy, nové léčené metody a vedlejší účny nových léů. U aždé metody tedy předládám a vysvětluj různé důvody, proč y právě tato metody mohla ýt vhodná a v jaých případech ude doré j použít. Testování nových procedur v léařství Supnově sevenční testy nacházejí uplatnění v mnoha oorech, de je nutné posuzovat efetvtu nově zavedeného výrou č postupu. Patří sem napřílad různé oory průmyslu, de je důležté otestovat funčnost nových součáste. Supnově sevenční testy se ve velé míře uplatňují v různých oorech medcíny, de se testují nově vyvnuté léčené postupy (jedna ze stěžejních nh, terá se zaývá supnově sevenčním testy a ze teré jsem čerpal většnu nformací, se jmenuje Group Sequental Methods wth Applcatons to Clncal Trals Supnově sevenční testy s aplacem v lncých studích). Sám považuj tuto olast za velm důležtou. Ve své prác proto uvádím přílady z olast medcíny a různé typy sevenčních testů porovnávám hlavně z hledsa medcínsého použtí. Pro porozumění prolému zde systém testování nových procedur v léařství stručně popíš. Před ofcálním přjetím nového léu proíhají 4 fáze testování.. fáze je pouze výzumná. Léař se ěhem ní snaží určt napřílad správnou dávu.. fáze testování, teré se jž zúčastní více pacentů, se jž zaývá otázam ezpečnost a účnnost. Ovšem jao hlavní je považována. fáze testování. Této fáze se zúčastní taové množství pacentů, ay výsledy mohly ýt považovány za směrodatné. Pacent trpící určtou choroou jsou náhodně rozřazen pro podávání nové procedury a prot tomu pro podávání dosud používané neo jné procedury, se terou chceme srovnávat (napřílad placeo). Tato fáze testování je stěžejní v procesu přjímání nové procedury. Právě tady je důležté uplatňovat přesně určené statstcé testy. Touto. fází a testy pro n určeným se udu v této prác zaývat. aonec následuje V. fáze, terou jde označt jao dodatečné sledování nové procedury. 6

Proč supnově sevenční metody? Představme s stuac, dy testujeme nový lé na raovnu a srovnáváme jeho účny s dosud používaným léem, terý má určtý poztvní efet. Ay měly výsledy našeho testu velou váhu a mohly ýt přjaty léařsou omuntou, musíme testování provést na poměrně velém vzoru ldí, teří trpí raovnou. Řeněme 000 ldí. Rozdělíme pacenty náhodně do dvou supn a začneme testovat; aždé supně podáváme jeden typ léu. Dejme tomu, že účny léu se projevují velm rychle. Jž první stáda testování mohou jasně naznačt určté tendence. V různých případech mohou vyvstat následující důvody pro rzé uončení testu:. Etcé důvody: V případě, že jž na začátu testu má jeden z léů výrazně horší účny, je žádoucí, ay tento horší lé neyl pacentům dále podáván a test yl uončen. Tímto způsoem y se dalo zaránt úmrtím pacentů.. Admnstratvní důvody: Poud y nový lé jž v rané fáz testování vyazoval špatné výsledy, ještě y to nemuselo znamenat, že lé je špatný. Důvod y mohl ýt třea ten, že yla špatně zvolena dáva léu neo yly opomenuty určté ontrandace. V tomto případě y ylo vhodné test přerušt a dále se věnovat výzumu tohoto léu. 3. Fnanční: Provádění testů pro porovnání nových metod ývá často fnančně náročné. Poud je jž zpočátu vdět, že účny nového léu jsou podoné neo stejné neo naopa vdtelně odlšné od účnů původního léu, vyvstává otáza, jestl y neylo výhodnější test přerušt a ušetřené zdroje věnovat napřílad na testování jných slnějších metod. ejedná se zde pouze o fnance. množství pacentů, teří se mohou testování účastnt je omezené. Je taé třea poznamenat, že y ylo možné data posuzovat souvsle. Tedy ta že y se analýza prováděla po aždém novém výsledu. Ovšem tento způso je techncy většnou neprovedtelný neo fnančně náročný a používá se jen výjmečně. Hstore supnově sevenčních metod V nze Jennsona & Turnulla (000, aptola.3) je jao první užvatel supnově sevenčních metod oe a jeho opaované vypouštění holuce ze svojí archy. Testoval tím lízou přítomnost pevnny. Důležtým popudem je v této olast studum pravděpodonost v 7. a 8. století, ale formální výzum sevenčních metod začíná až ve 0. létech 0. století. Dodge & Romg defnují dvoufázový experment pro testování součáste v roce 99. Dalším osonostm, teří přspěl vývoj sevenčních testů, jsou napříld Aram Wald, George Barnard, Wolfowtz a Armtage, terý začal zavádět sevenční testy v léařsé olast. Hlavní popud pro používání sevenčních metod v medcíně pa přšel od Pococa (977), O Brena & Flemnga (979) a Lan & DeMetse (989). Ve svých pracích navrhují odlšné postupy př tvorě supnově sevenčních testů a dohromady tvoří jejch práce teoretcý zálad v této olast. 7

Zdroje Ve své prác jsem vycházel ze článů Pococa(977), O Brena & Flemnga (979) a Emersona & Flemnga (989). Stěžejním zdrojem je nha Group Sequental Methods wth Applcatons to Clncal Trals (Jennson & Turnull, 000). V této nze jsou shrnuty práce různých autorů a jsou zde porovnány různé typy sevenčních testů. Z této nhy přejímám mnoho taule. ve značení jsem se pro přehlednost držel této nhy. Osnova ejdříve popsuj lascý test s jednou analýzou. Je to vhodné pro lustrac a pro porovnání se sevenčním testy. V další část práce se zaývám záladním typy sevenčních testů: Pococův test, O Brenův & Flemngův test, Wangův & Tsatsův test a Hayttleův-Petoův test. Jedná se o zálad teore sevenčních testů. Jejch podstata je v tom, že dovolují rzé uončení testu se závěrem, dy se zamítá nulová hypotéza, terá říá, že dvě procedury mají stejnou efetvtu. ásleduje část věnovaná testům s tzv. vntřním línem. Jedná se o testy, de je navíc možné rzé uončení testu s přjmutím nulové hypotézy o evvalenc efetvty. aonec popsuj testy založené na tzv. spotření func. Jejch přínos je v tom, že nám dávají velou volnost a varaltu ve výěru časů, dy provádět analýzy ěhem testu. 8

Kaptola Záladní typy supnově sevenčních testů. Klascý test s jednou analýzou Tato práce se zaývá supnově sevenčním testy. Začneme ale představením lascého testu, terý se sládá pouze z jedné analýzy (dále jen -A Test test s jednou analýzou). Pomůže nám to př představení s prolému a rovněž zde zavedeme důležté onstanty, teré pozděj využjeme. Uvažujme populace: A a B. Každý testovaný sujet vydá po provedení procedury číselný výslede: X A a X B Tyto výstupy jsou navzájem nezávslé a mají normální rozdělení se známým rozptylem Tedy X A ~ ( A, ) pro =,,, a X B ~ ( B, ) pro =,,. Označme: A - B a uvažujme prolém, dy testujeme nulovou a alternatvní hypotézu H 0 : = 0, H A : 0 s pravděpodoností chyy. druhu a sílou př A- B Pro aždou proceduru je aloováno n vzorů. Potom naše testová statsta vypadá tato: Z = n n í n í n X A X n X A í n X B í n X A X B B a platí: ~ (n A, n ), ~ (n B, n ), ~ (n( A - B ), n ), Z ~ ( A B n, ). Poud platí H 0, pa Z ~ ( 0, ). Zamítáme H 0, jestlže Z > /. Poud platí H A :, potom Z ~ ( n, ). Aychom vyhověl požadavu na sílu, musí platt: P r : = [ Z > / ] = P r : = - [ Z > / ] = - Z této rovnost odvodíme ja velý potřeujeme počet sujetů n, aychom dosáhl požadované síly. P r : = [ Z > / ] P r : = [ Z > / ] = - P r : = [ Z n > / n ] = - 9

[ / n ] = - n = / / n f ( ) = [ / Tedy n f ( ) je číslo, teré značí potřený počet sujetů. Přílad -A Test: yní přejdeme e onrétním hodnotám pro zísání lžší představy o zavedeném testu. Položme Potom platí X A ~ ( A, ), X B ~ ( B, ). Budeme testovat na hladně = 0.05 a se sílou -= 0.9 př A - B = n f ( ) = [ / 4 [ 0.05 zaorouhlíme na celé číslo nahoru, ay síla yla alespoň 0.9Test tedy proíhá ta, že naměříme hodnoty X A, a X B pro =,,n a H 0 zamítáme, jestlže 85 85 A í 85 85 X 85 A í X B.96 X X 5..K tomuto příladu se udeme pozděj vracet a různé B sevenční testy udeme porovnávat právě s ním. Konvence V tomto lustračním příladu jsme uvažoval sujety, teré mají normální rozdělení se známým rozptylem. Tohoto zjednodušení udeme užívat dále. Pozděj uvdíme, že testy zonstruované tímto způsoem mohou ýt použty na data, teré mají jná rozdělení. Dále jsme uvažoval dvoustranný test (tj. test s dvoustrannou alternatvou H A : A - B 0). V celé prác se udu pro přehlednost držet této varanty testu. Metody, teré udu popsovat, se samozřejmě dají aplovat na případ jednostranných testů.. Dvoustranné supnově sevenční testy yní jž přejdeme e supnově sevenčním testům. Uvažujeme, že ěhem testu provedeme celem analýz. Pro aždou analýzu održíme m pozorování. Tedy m sujetů podstoupí proceduru A a m sujetů proceduru B. X A ~ ( A, ) pro =,,,m, X B ~ ( B, ) pro =,,,m. Označíme A - B a testujeme H 0 : = 0 prot alternatvě H A : 0. Po aždé analýze (-té analýze) dostaneme testovou statstu: 0

X A í Z = í X A X ~ ( A, ), í X A X B B X B í, =,,, ~ ( B, ), ~ (( A - B ), ), Z ~ ( ( ) A B, ). Test ude proíhat tato: Zamítáme H 0, jestlže Z c pro nějaé =,, ezamítáme H 0, jestlže Z < c pro všechny =,, Poud ychom neznal rozptyl pozorovaných dat, musel ychom v testové statstce Z nahradt odhadem rozptylu. aše testová statsta y potom měla asymptotcy normální rozdělení. Tomuto případu se více věnuj v aptole.8. yní vyvstává otáza ja zvolt rtcé hodnoty: c, c,, c ta, ay yla zachována hladna Je zřejmé, že špatným řešením y ylo aplovat pro aždou analýzu rtcou hodnotu spočítanou pro test s jednou analýzou. To y vedlo pravděpodonost chyy. druhu mnohem větší než. V prác Jennsona & Turnulla (000, aptola.4.) je uveden tento přílad: V případě pět analýz a 0.05 y pravděpodonost, že Z přeročí.96 pro alespoň jedno, =,,5 je 0.4, tedy soro trojnásoe požadované hladny hladny. Tedy c musíme určt jna. ásledující typy testů uazují různé způsoy, ja c volt ta, ay pravděpodonost chyy. druhu yla rovna.3 Pococův Test Prncp Pococova testu (dále jen P-Testu) je v tom, že rtcé hodnoty c jsou onstantní pro všech analýz. Tedy zamítáme H 0 Z C P (,) pro nějaé =,,. C P (K,) je pomocí numercých výpočtů vyráno ta, ay výsledná hladna yla : (tj. P r: A B = 0[Zamítáme H 0 pro nějaé =,,] = ). Detalním způsoem výpočtu onrétních rtcých hodnot se věnuj v aptole.4. Pro výpočet se používá numercých softwarů. Konrétní hodnoty, teré nás zajímají a mohou nám posytnout dorou představu př tvorě příladů, zde předládám v taulách, teré jsem přejal z nhy Jennsona & Turnulla (000). Taula zachycuje onrétní hodnoty C P (,) pro případ, dy chceme zachovat výslednou pravděpodonost chyy. druhu (hladnu) V této taulce v dalších jsem se pro přehlednou lustrac prolému omezl na případ dvoustranného testu, dy, a. Těchto hodnot se držím v lustračních příladech.

Taula. Hodnoty C P (,) pro = 0.05 a různé počty analýz. C P (,).960.78 5.43 0.555 Formálně tedy vypadá P-Test tato: po =,,- supnách : poud Z C P (,) : zamítáme H 0 jna : jd na + po = té supně : poud Z C P (,) : zamítáme H 0 jna : uončujeme test s tím, že nezamítáme H 0 Tato defnovaný test má hladnu pro jaouolv velost m. Číslo m určíme podle požadavu na sílu : P r : = [ Zamítáme H 0 ] = Maxmální počet jednců m, teré potřeujeme otestovat, aychom dosáhl sílu závsí na,poměru nf ( ), počet jednců, teré potřeujeme v testu s jednou analýzou, aychom dosáhl sílu - taé závsí na Tedy můžeme m zavést hodnoty R P (,) = jao poměr maxmální populace (,,, ) n f potřené pro supnově sevenční P-test u maxmální populac potřené pro test s jednou analýzou. Tyto hodnoty udou platt pro všechny. Taé hodnoty R P (,) jsou počítány numercy. ěteré hodnoty R P (,) jsou zorazeny v Taulce Taula. Hodnoty R P (,) pro = 0.05, = 0.9 a různé počty analýz. R P (,).000.00 5.07 0.7

Tedy maxmální velost populace pro jednu proceduru (m), terou potřeujeme pro sílu př = je rovna m = R P (,) n f (). Potřený počet jednců v R P (,a, n f, supně je m =. Výsledné číslo m zaorouhlujeme nahoru. Potom výsledná síla testu ude alespoň Přílad P-Test: Pro předvedení P-Testu uvažujme opět prolém X A ~ ( A, ), X B ~ ( B, ), A- B, H 0 : = 0, H A : 0, = 0.05, -= 0.9 př A - B = Rozhodneme se pro počet analýz =5. Potom můžeme spočítat n f () = 84., R P (5, 0.050.) =.07, m = R P (,) n f () =.0784. = 0.5, R P (,a, n f, 0.5 m = = = 0.3 5 Tedy potřený počet jednců v jedné supně je a celový počet jednců v testu je 5 = 0 (Pro jednu analýzu potřeujeme m sujetů a máme 5 analýz). Vdíme, že maxmální potřená populace pro P-Test (0) je větší než maxmální potřená populace pro test s jednou analýzou (85 = 70). Výhoda P-Testu je ta, že má menší očeávanou velost populace, terou ude třea testovat (v případě testu s jednou analýzou je to zřejmě 70, protože v tomto případě udeme testovat vždy 70 sujetů). áš test tedy ude mít tuto formu: Zamítáme H 0, jestlže Z = í C P (5, 0.05) =.43 D = í X A X X A X B B = 4 í X A X C P (5, 0.05) 4 = 3.8, pro =,, 5. Poud H 0 neyla zamítnuta pro =,, 5, potom uončujeme test a nezamítáme H 0. Grafy a zorazují rtcé hodnoty tohoto testu pro Z a D. B 3

Graf. Krtcé hodnoty P-Testu pro testovou statstu Z. 3 Z (P-Test) 0-3 4 5 - -3 Graf. Krtcé hodnoty P-Testu pro testovou statstu D. 80 60 D (P-Test) 40 0 0-0 3 4 5-40 -60-80 notace Ve své prác se držím značení používané v nze Jennsona & Turnulla (000). Krtcé hodnoty se zde vztahují testové statstce Z. Ve článu Pococa (977) se místo toho pracuje s nomnálním hladnam a v tomto článu jsou v taulách uvedeny hodnoty pro tyto nomnální hladny. Vztah mez těmto hladnam a našem C P hodnotam je následující. Platí: Zamítáme H 0, jestlže Z C P (,) Z ) C P (,) ) Z ) C P (,) ) [ Z )] C P (,) )] P Tedy poud známe naše C P, potom = C P (,) )]. V dalších testech, de c nejsou onstatní, se nomnální hladny vypočítají analogcy: = c )]. 4

.4 O Brenův & Flemngův Test astavt všechny hodnoty c jao jednu onstantu (P-Test) je nejjednodušší řešení, ale ne vždy deální. yní představíme další varantu, terou předvedl O Bren & Flemng (979). Dále jen B-Test. Jm navržený test vypadá formálně tato: po =,,- supnách : poud Z C B (,) : zamítáme H 0 jna : jd na + po = té supně : poud Z C B (,) : zamítáme H 0 jna : uončujeme test s tím, že nezamítáme H 0 Tedy c = C B (,) a rtcé hodnoty pro testovou statstu Z lesají. Opět platí, že hodnoty C B (,), zorazené v Taulce 3, jsou numercy vypočítány ta, ay zajstly výslednou hladnu. Jedná se o stejný numercý výpočet jao u Pococova testu, terý popsuj v aptole.4. Taula 3. Hodnoty C B (,) pro = 0.05 a různé počty analýz. C B (,).960.977 5.040 0.087 Stejně jao jsme u P-Testu zavedl hodnoty R P (,), ta pro B-Test zavádíme hodnoty R B (,) jao poměr maxmální populace potřené pro supnově sevenční B-test u maxmální populac potřené pro test s jednou analýzou. Vyrané hodnoty jsou v Taulce 4. Pro onrétní B-Test potom potřeujeme m = R P (,a, n f a, R B (,) n f () a m =. 5

Taula 4. Hodnoty R B (,) pro = 0.05, = 0.9 a různé počty analýz. R B (,).000.007 5.06 0.037 Je vdět, že hodnoty R B jsou pro dané,a menší než hodnoty R P. Tedy B-Testu stačí na dosažení síly menší celový počet testovaných jednců. Přílad 3 B-Test: Opět se vraťme prolému defnovanému jao: X A ~ ( A, ), X B ~ ( B, ), A - B, H 0 : = 0, H A : 0, = 0.05, -= 0.9 př A - B = Volme opět =5. Potom pro určení hodnot potřených testování počítáme n f () = 84., R B (5, 0.050.) =.06, m = R P (,) n f () =.0684. = 86.3, R B (,a, n f, 86.3 m = = = 7.3 Tedy potřený počet jednců 5 v jedné supně je 8 a celový počet jednců v testu je 58 = 80. Výsledný B-Test pa ude vypadat tato: Zamítáme H 0, jestlže Z = C B (5, 0.05) D = 8 í í 5 4.56 = X A X X A X 8 B B = 36 8 í 8 X A X C B (5, 0.05) 5 36 = 54.74, pro =,, 5 Poud H 0 neyla zamítnuta pro =,, 5, potom uončujeme test s tím, že nezamítáme H 0. Grafy a zorazují rtcé hodnoty tohoto testu pro Z a D. B 6

Graf 3. Krtcé hodnoty B-Testu pro testovou statstu Z. 6 4 Z (B-Test) 0-3 4 5-4 -6 Graf 4. Krtcé hodnoty B-Testu pro testovou statstu Z. 80 60 40 0 0-0 -40-60 -80 D (B-Test) 3 4 5 Vdíme, že zatímco P-Test je navržený ta, aychom dostal onstantní rtcé hodnoty pro testovou statstu Z, B-Test nám dává onstantní rtcé hodnoty pro D 8 X A í 8 X B (chí-vadrát) notace Pococ ve svém článu provádí testování pomocí nomnálních hladn. Ve článu O Brena & Flemnga (979) se testování používá testová statsta ch-vadrat. aše testová statsta Z má za platnost H 0 normální rozdělení (0,). Krtcá hodnota pro test s jednou analýzou je tedy vantl standardního normálního rozdělení (pro více analýz se jž rtcé hodnoty počítají numercy). Poud ychom místo Z uvažoval naš testovou statstu jao Z, potom za platnost H 0 má tato statsta rozdělení o jednom stupn volnost. Analogcy poud ychom počítal rtcou hodnotu pro test s jednou analýzou, potom ychom použl vantl chí-vadrát rozdělení. Poud známe rtcou hodnotu c pro testovou statstu Z, potom rtcou hodnotu pro testovou statstu Z dostaneme jao c. 7

.5 Porovnání Pococova a O Brenova & Flemngova Testu P-Test a B-Test jsou dva záladní typy supnově sevenčních testů. V této aptole porovnáme jejch vlastnost. Všechny vlastnost testů, teré zde zoumáme, udeme porovnávat s testem s jednou analýzou popsaným na začátu. Samozřejmě je důležté vždy porovnávat testy se stejným záladním parametry. Taula 5 převzatá z práce Jennsona & Turnulla (000, aptola.6.) se týá testů popsaných v příladech, a 3. Jedná se o testy, teré mají sílu 0.9 př A - B Taula osahuje hodnoty pro střední počet sujetů nutných testování. V prvé řadě vdíme, že pro -A Test je to vždy 70. V tomto případě proěhne jedna velá analýza za aždých oolností. evýhodou P-Testu B-Testu je to, že střední počet sujetů je vysoý, poud platí H 0. Pro P-Test je toto číslo nejvyšší (04.8). Tato stuace odpovídá případu, dy jsou podávány dva stejně valtní léy. Poud y tedy platla H 0, musel ychom př použtí sevenčních testů počítat s větším počtem testovaných vzorů. Tento fat může ýt důvodem pro použtí testu s jednou analýzou. V pulac Jennsona & Turnulla (000, aptola.6.3) je uveden přílad, dy se zoumá léčení určté vzácné choroy. Sujety vstupují do léčení s frevencí 40 za ro. Maxmální doa trvání -A Testu je 4.5 rou, pro B-Test 4.5 a pro P-Test 5.5. Díy nžšímu střednímu počtu sujetů y sce mohlo ýt výhodnější použít sevenční test, ovšem -A Test dává jstotu dřívějšího uončení, což může ýt důležté z důvodů přesného plánování. Z hledsa etcých důvodů jsou ale důležté především střední hodnoty počtu sujetů pro případy dy jsou střední hodnoty dost vzdálené. V této stuac pozorujeme velé snížení středního počtu pro oa sevenční testy. Hodnoty P-Testu jsou ozvláště nízé pro velé hodnoty A - B. Taula 5. Porovnání: -A Testu, P-Testu a B-Testu pro = 5, 0.05, - 0.9 př A - B =. Pozorování jsou normální s E [Počet pozorování] A - B = 0.0 70.0 04.8 78.7 0.5 70.0 8.3 67.9.0 70.0 6.9 9.8.5 70.0 70. 94.4 Pro podronější nformac o očeávaném počtu sujetů jsou v Taulce 6 a Taulce 7 vypsány rozdělení pro počet sujetů potřených otestování pro P-Test a B-Test 8

Taula 6. Pravděpodonost velost zoumané populace pro P-Test. = 5, 0.05, - 0.9 př A - B =. Pozorování jsou normální s Rozdělení počtu zoumaných jednců 4 84 6 68 0 A - B = 0.0 0.06 0.0 0.009 0.007 0.956 0.5 0.055 0.07 0.075 0.076 0.73.0 0.4 0.68 0.0 0.38 0.7.5 0.507 0.35 0.0 0.05 0.006 Taula 7. Pravděpodonost velost zoumané populace pro B-Test. = 5, 0.05, - 0.9 př A - B =. Pozorování jsou normální s Rozdělení počtu zoumaných jednců 36 7 08 44 80 A - B = 0.0 0.000 0.00 0.008 0.07 0.974 0.5 0.000 0.05 0.078 0.34 0.773.0 0.00 0.34 0.354 0.8 0.9.5 0.00 0.47 0.45 0.089 0.03 Stejně ta, jao typ testu, musíme př testování dvou procedur předem vyrat počet analýz, teré provedeme (). Pro různé hodnoty opět dostáváme odlšné střední počty sujetů potřených testování. Pro případ, dy 0.05 a síla - 0.9 př A - B = jsou tyto hodnoty pro P-Test a B-Test zorazeny v taulách 8 a 9. Čísla v taulách odpovídají 00- násou poměru maxmálního a očeávaného počtu sujetů u n f ( ) počtu sujetů nutných pro test s jednou analýzou. Čísla ve sloupc maxmální velost populace nejsou celá díy tomu, že jsme neprováděl zaorouhlení jao v dřívějších příladech. Vdíme, že poud zvyšujeme počet analýz, stoupá maxmální velost populace. Je třea uvážt, že vyšší počet analýz může ýt velou admnstratvní zátěží. Je zajímavé, že pro P-Test očeávaný počet sujetů roste př A - B =, zatímco v případě B-Testu tyto hodnoty jž lesají. Ovšem dyž je rozdíl středních hodnot větší, potom předpoládané počty sujetů pro P-Test lesají rychlej než u B-Testu. Poud porovnáváme hodnoty pro = 5 a 0, vdíme, že rozdíly nejsou přílš velé. Většnou tedy není vhodné volt větší počet analýz než 9

pět. Admnstratvně y to ylo dvojnásoně náročné a přtom přínos v podoě snížení středního počtu sujetů y yl jž malý. Taula 8. P-Test: Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př A - B = 00.0 00.0 00.0 00.0 00.0 0.0 08.4 00.9 77.6 59. 5 0.7 7.7 05. 68.5 4. 0 7. 3.4 09.0 66.6 36.7 Taula 9. B-Test: Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př A - B = 00.0 00.0 00.0 00.0 00.0 00.7 00.5 98. 85. 63.3 5 0.6 0.9 96. 75.0 54.8 0 03.7 0.8 95.6 7.8 50.8 yní můžeme výhody a nevýhody supnově sevenčního P-Testu a B-Testu shrnout tato. P-Test má menší rtcé hodnoty pro první analýzy a naízí tedy možnost velm rzého uončení testu, poud neplatí H 0. Toto poztvum je ompenzováno velým maxmálním počtem sujetů a velým očeávaným počtem sujetů, poud platí H 0 neo poud je rozdíl středních hodnot malý. V případě B-Testu jsou rtcé hodnoty nžší v onečných analýzách. B-Test tedy nenaízí ta velou možnost uončt test raných stádích. To může ýt považováno za poztvní, protože rané fáze testu mohou ýt ovlvněny techncým prolémy a výsledy založené na velm nízém počtu sujetů mohou ýt považovány za málo směrodatné. Maxmální 0

velost populace pro B-Test je nžší než pro P-Test, ovšem poud je rozdíl středních hodnot velý, potom snížení očeávaného počtu sujetů není pro B-Test ta velé..6 Wangovy & Tsatsovy Testy Testy zavedené Wangem & Tsatsem (dále jen WT-Testy) je supna testů charaterzovaná parametrem. P-Test je pa specálním případem pro 0.5 a B- Test specálním případem pro 0. Exstují ještě další typy sevenčních testů, teré navrhl Wang & Tsats. Jejch pops lze najít napřílad ve článu Emersona & Flemng (989) neo v pulac Jennsona & Turnulla (000, aptola ). Formálně proíhá WT-Test tato: po =,,- supnách : poud Z C WT (,) K / : zamítáme H 0 jna : jd na + po = té supně : poud Z C WT (,) : zamítáme H 0 jna : uončujeme test s tím, že nezamítáme H 0. Stejně jao u P-Testu a B-Testu, jsou zde hodnoty C WT (,) numercy vypočítány ta, ay yla zachována pravděpodonost chyy. druhu Odoně jsou spočítány hodnoty R WT (,), teré určují velost populace nutnou pro dosažení předepsané síly. Pro porovnání jsou v taulách zahrnuty hodnoty pro případy spec. případ evvalentní B-Testua (spec. případ evvalentní P-Testu). Díy tomu, že P-Test a B-Test jsou specální případy WT-Testů, platíc WT (,) = C B (,), C WT (,) = C P (,), R WT (,) = R B (,) a R WT (,) = R P (,).

Taula 0. Hodnoty C WT (,) pro použtí v WT-Testech pro = 0.05, různé počty analýz a různé hodnoty 0.0 (B-Test) 0. 0.5 0.4 0.5 (P-Test).960.960.960.960.960.977.994.038..78 5.040.068.36.67.43 0.087.0.99.355.555 Taula. Hodnoty R WT (,) pro použtí v WT-Testech pro = 0.05, = 0.9, různé počty analýz a různé hodnoty 0.0 (B-Test) 0. 0.5 0.4 0.5 (P-Test).000.000.000.000.000.007.04.034.068.00 5.06.037.066.9.07 0.037.050.083.59.7 Přílad 4 WT(0.5)-Test: Uvažujeme opět X A ~ ( A, ), X B ~ ( B, ). Položíme A- B a testujeme H 0 : = 0 prot H A : 0. = 0.05, -= 0.9 př A - B = Volíme opět =5. n f () = 84., R WT (5, 0.050., 0.5) =.066, m = R WT (,)n f ( ) =.06684. = 89.7, R B (,a, n f, 89.7 m = = = 7.94 5 Tedy potřený počet sujetů v jedné supně je 8 a maxmální počet sujetů potřených pro test je 58 = 80. Zamítáme H 0, jestlže

Z = 0.5) 5 D = 0.5 8 í í X A X = 3.9 -/4 X A X 8 B B = 36 8 í C WT (5, 0.05, 0.5) 5 8 X A X 0.5 B C WT (5, 0.05, 36 = 38.33 /4 pro =,, 5. Poud H 0 neyla zamítnuta pro =,, 5, potom uončujeme test s tím, že nezamítáme H 0. V taulce jsou onrétní rtcé hodnoty pro 3 testy, teré jsme onstruoval v příladech. Vždy platí, že rtcé hodnoty u WT-Testu (0<) leží mez rtcým hodnotam pro B-Test a P-Test ať se jedná o případ, dy rtcá hodnota P-Testu je vyšší neo nžší než rtcá hodnota B-Testu. Taula. Krtcé hodnoty pro WT-Testy pro a Typ Testu c c c 3 c 4 c 5 (B-Test).43.43.43.43.43 3.94.686.47.59.36 (P-Test) 4.56 3.6.634.8.040 pro supnu WT-Testů předládám tauly s maxmální potřenou velostí populace a předpoládaným velostm populace pro různé hodnoty A - B. Maxmální potřená velost populace je pro P-Test vyšší než pro B-Test. Oecně lze vysledovat, že pro rostoucí se maxmální populace zvyšuje. Dále jž víme, že P- Test dává velm nízé hodnoty očeávané velost populace pro velé rozdíly středních hodnot. zde vdíme,že poud je velé, pa pro rostoucí se předpoládané velost populace snžují. 3

Taula 3. WT() Test: Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př 00.0 00.0 00.0 00.0 00.0 0.4 0.0 97.9 8.5 6.0 5 03.7 0.8 96. 73. 5.0 0 05.0 03.9 95.8 70.0 47.9 Taula 4. WT() Test: Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př B = 00.0 00.0 00.0 00.0 00.0 03.4 0.6 98.0 79.5 59.0 5 06.6 05.3 97.0 70.4 47.3 0 08.3 06.7 96.9 67. 43.3 4

Taula 5. WT() Test: Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př 00.0 00.0 00.0 00.0 00.0 06.8 05.5 99.3 77.8 58.7 5.9 0.8 00. 68.4 4.9 0 5.9 3.4 0. 65.5 38.8 V předchozí část jsme popsal výhody a nevýhody P-Testu a B-Testu. Díy zoecnění pomocí supny WT-Testů je nyní možné vyrat vhodný test ta, ay se v něm ve vhodném poměru omnovaly výhody P-Testu a B-Testu..7 Hayttleův-Petoův Test Posledním záladním testem, terý zde představím je Hayttleův-Petoův Test (dále jen HP-Test). Jeho autory jsou Hayttle (97) a Peto (976). Tento test je popsán v prác Jennsona & Turnulla (000, aptola.7.). Prncp tohoto testu je, že rtcé hodnoty c, =,, - jsou zvoleny jao určtá onstanta HP (napřílad 3) a poslední rtcá hodnota c = C HP (,) je dopočítána ta, ay celová hladna testu yla. Formálně tento test proíhá tato: po =,,- supnách : poud Z HP : zamítáme H 0 jna : jd na + po = té supně : poud Z C HP (,) : zamítáme H 0 jna : uončujeme test s tím, že nezamítáme H 0. Pro rtcé hodnoty tedy platí c = c = = c - = HP, c = C HP (,). Je třea poznamenat, že onstantu HP nelze volt úplně lovolně: apřílad poud ychom voll HP =3 a 7, potom za platnost H 0 : A- B : pravděpodonost zamítnutí H 0 ěhem prvních šest analýz je 0.007 a tedy není možné dosáhnout 5

celové hladny Ovšem pro naše případy, dy 0.05, udeme dále uvažovat HP =3. Taula 6 zorazuje numercy spočítané hodnoty C HP (,) pro případ dy HP =3. V taulce 7 jsou uvedeny hodnoty R HP (,), teré určují velost populace potřenou testování. Taula 6. Hodnoty C HP (,) pro použtí v HP-Testech pro = 0.05 a různé počty analýz. C HP (,).960.967 5.990 0.0 Taula 7. Hodnoty R HP (,) pro použtí v HP-Testech pro = 0.05, = 0.9 a různé počty analýz. R HP (,).000.00 5.07 0.7 Hodnota K HP ývá volena dost vysoo, ay pravděpodonost uončení testu ěhem prvních analýz yla malá a došlo ní pouze v případě, dy jedna procedura proazuje výrazně horší výsledy. Závěrečná hodnota HP-Testu je pa velm lízá rtcé hodnotě -A testu. To může ýt pratcé díy tomu, že na onc testování málody vznne stuace, dy sevenční test hypotézu nezamítá, zatímco -A Test y hypotézu zamítal. V taulce 8 opět předládám hodnoty pro maxmální velost populace a předpoládané velost populace pro různé hodnoty. Tyto hodnoty jsou samozřejmě ovlvněny volou rtcých hodnot K HP. HP-Test nám dává další možnost př volě testu. V určtém stuac to může ýt právě HP-Test, terý ude splňovat požadované vlastnost testu, co se týče napřílad předpoládané velost populace. 6

Taula 8. HP-Test( HP =3 ): Maxmální a předpoládaná velost zoumané populace pro různé počty analýz, 0.05 a sílu - 0.9 př A - B = Hodnoty jsou vyjádřeny v procentech vzhledem populac -A Testu: n f ( ). Maxmální velost populace Předpoládaná velost populace př 00.0 00.0 00.0 00.0 00.0 00.3 00. 98.7 88. 66.6 5 0.4 00.9 97.6 78.8 50.8 0 03.0 0. 97.6 74.5 44.7 Graf 5 zorazuje rtcé hodnoty čtyř výše popsaných testů pro případ zoumaný v příladech a HP( HP =3)-Test pro počet analýz =5. Graf 5. Porovnání rtcých hodnot pro P-Test, B-Test, WT(0.5)-Test a HP( HP =3)-Test. P-Test B-Test 4,3 WT(0.5)-Test HP-Test 3,8 3,3,8,3,8 3 4 5.8 Zoecnění záladních typů supnově sevenčních testů Až dosud jsme uvažoval supnově sevenční testy, dy v aždé analýze přchází stejný počet otestovaných sujetů a dy testované hodnoty X A a X B mají normální rozdělení se známým rozptylem. Oecně s těmto podmínam nemůžeme počítat. 7

V této část, ale uážeme, že testy zonstruované za těchto podmíne jdou aplovat v oecnějších stuacích. Předpolad rovnoměrného rozložení příchozích pozorování Dosud jsme uvažoval, že př aždé analýze udeme mít dspozc m nových pozorování z aždé populace. Krtcé hodnoty testů pa yly počítány ta, ay zajstly hladnu a sílu pro tento případ. Vzná otáza, ja y vypadaly rtcé hodnoty v případě, dy y nová pozorování nepřcházely tímto způsoem. Pococ (977) ve svém článu tomuto prolému uvádí, že poud přísun nových testování se pouze lehce odchyluje od plánovaného příjmu, potom zůstanou vlastnost testu přlžně stejné. Pococ představuje onrétní přílad, dy se příjem nových pozorování řídí Possonovým procesem s ntenztou ta, ay střední hodnota nově příjmutých pozorování v aždé supně yla rovna té plánované. Původní plánovaný test je onstruovaný ta, ay měl hladnu 0.05 a sílu 0.9. a záladě 500 smulací pa dostáváme odhad pro sutečnou hladnu testu 0.056 a sílu 0.888. To jsou hodnoty dostatečně lízé těm požadovaným. V pulac Jennsona & Turnulla (000, aptola 3.3) se tímto prolémem zaývají podroněj. Taula 9, terá je přejatá z této nhy, uazuje, jaá je sutečná hladna a síla testů v případě, dy pozorování přcházejí v různých sevencích. Testy se vztahují pozorování dvou supn pomocí pět analýz ( = 5), jejchž sujety mají normální rozdělení s rozptylem 4. Př testování se používají rtcé hodnoty spočítané ta, ay test, ve terém pozorování přcházejí rovnoměrně, měl hladnu a sílu 0.9. Tomuto případu vždy odpovídá první řáde pro aždý typ testu. Taula 9. P-Test: Hladna a síla dosažená supnově sevenčním testy v případě, dy příjem nově napozorovaných dat neproíhá podle plánu. Dosažené hodnoty jsou spočítány pro testy původně plánované pro rovnoměrný příjem nových pozorování plánované ta, ay měly hladnu, sílu 0.9. P-Test Sevence Hladna testu Síla př,4,63,84,05 0.050 0.90 8,36,54,7,90 0.050 0.860 3 3,46,69,9,5 0.050 0.934 4 30,50,55,86,05 0.046 0.909 5,3,57,8,05 0.054 0.909 6 3,4,56,78,99 0.05 0.89 7 6,40,63,96,0 0.049 0.93 8

Taula 0. B-Test: Hladna a síla dosažená supnově sevenčním testy v případě, dy příjem nově napozorovaných dat neproíhá podle plánu. Dosažené hodnoty jsou spočítány pro testy původně plánované pro rovnoměrný příjem nových pozorování plánované ta, ay měly hladnu, sílu 0.9. B-Test Sevence Hladna testu Síla př 8,36,54,7,90 0.050 0.9 6,3,48,64,80 0.050 0.877 3 0,40,60,80,00 0.050 0.937 4 6,39,50,76,90 0.049 0.9 5 0,7,55,66,90 0.05 0.9 6,38,59,65,83 0.049 0.888 7 7,40,57,73,96 0.05 0.98 Taula. WT()-Test: Hladna a síla dosažená supnově sevenčním testy v případě, dy příjem nově napozorovaných dat neproíhá podle plánu. Dosažené hodnoty jsou spočítány pro testy původně plánované pro rovnoměrný příjem nových pozorování plánované ta, ay měly hladnu, sílu 0.9. WT()- Test Sevence Hladna testu Síla př 8,36,54,7,90 0.050 0.90 6,3,48,64,80 0.050 0.864 3 0,40,60,80,00 0.050 0.99 4 6,39,50,76,90 0.049 0.90 5 0,7,55,66,90 0.05 0.90 6,38,59,65,83 0.048 0.875 7 7,40,57,73,96 0.050 0.99 Taula osahuje taové sevence, dy onečný počet pozorování se lší od plánovaného celového počtu pozorovaných sujetů. Vdíme, že dosažená síla testu se od hodnoty 0.9 lší nejvíce právě v případech, dy onečný počet pozorování se hodně lší od toho plánovaného. Těmto případům vždy odpovídají řády a 3 9

(plánovaný počet pozorovaní pro jednu supnu je 05 pro P-Test, 90 pro B-Test a 90 pro WT-Test). Řády 6 a 7 odpovídají náhodně zvoleným sevencím. Ve všech případech jsou dosažené hodnoty lízo těm původně navrženým. Může se ovšem stát to, že příjem pozorování se od plánového odchyluje natol, že vlastnost testu se změní ta, že to jž není možné zanedávat. Řešení může přnést použtí tzv. spotření funce. Tomuto tématu je věnována poslední aptola. Předpolad normalty Doposud jsme předpoládal, že napozorované hodnoty mají normální rozdělení se známým rozptylem. Pomocí centrální lmtní věty lze uázat, že testy onstruované pro tento případ lze použít pro jná rozdělení. V případě normálních rozdělení se známým rozptylem má za platnost H 0 testová statsta Z = í X A X B přesně normální rozdělení (0,). Poud X A a X B mají jné rozdělení, platí tento vztah asymptotcy. Tedy poud jsou naše populace dostatečně velé a my pro naše testování použjeme rtcé hodnoty, teré yly numercy spočítány pro případ normálního rozdělení, výsledné testy udou mít dosaženou hladnu a sílu velm lízé hodnotám spočítaným pro normální rozdělení. Pococ (977) popsuje přílad, dy velčny X A a X B mají alternatvní rozdělení s parametry respetve. Tento případ je ozvláště důležtý. Této stuac odpovídá mnoho reálných stuací (napřílad poud se u testovaného léu jasně projeví, že uď funguje neo nefunguje). Př -té analýze máme z oou populací celem pozorování, r A ladných pozorování z populace A a r B ladných pozorování z populace B. Za platnost H 0 : platí, že ˆ = í = X A X = r A r B = pˆ( pˆ) B r A r vâr A r B r B r r r A r B A r A B r B X A r A r B = U. r A r B má přlžně (0,) rozdělení. Potom můžeme provádět P-Testy testy se statstou U ta, že použjeme rtcé hodnoty spočítané pro specální případ normálního rozdělení se známým rozptylem. Pococ se ve článu odvolává na provedení smulací pro různé hodnoty, m,, a. Poud je m dostatečně velé, což lze pro 30

testovací účely předpoládat, uazují smulace, že dosažená hladna síla testu jsou lízé původním hodnotám. 3

Kaptola Specální typy supnově sevenčních testů. nformační hladny Ve všech příladech jsme až do této chvíle pracoval se specálním případem, dy naše pozorování mají normální rozdělení se známým rozptylem a přcházejí rovnoměrně. Pro vysvětlení dalších typů testů je ale vhodné zavést následující oecný přístup, se terým se pracuje v nze Jennsona & Turnulla (000, aptola 3.): Předpoládejme, že v našem supnově sevenčním testu održíme sevenc testových statst {Z,, Z }. Říáme, že tyto statsty mají anoncé sdružené rozdělení s nformačním hladnam {,, } poud platí: ().) (Z,, Z ) má sdružené normální rozdělení.) E(Z ) =, =,, 3.) Cov(Z,Z ) =, Hodnota nformační hladny nám udává, ol nformací, na jejchž záladě můžeme rozhodovat o zamítnutí č přjmutí nulové hypotézy, jsme jž shromáždl. V případě, terým jsme se zaýval v mnulých aptolách, dy uvažujeme prolém: A - B = H 0 : = 0H A : 0a testové statsty Z = y yla naše nformační hladna = var ^ ^ A B = í var 3 X A X í X A B X Platí : Z ~ ( ( ) A B, ) = (, ) = Cov(Z, a Cov(Z,Z ) = Cov(Z, = Cov(Z, í í B, =. X A X B ) X A X X B X B ) A í í í í X A X B + í X A X B ) í í

= Cov(Z, = = Cov(Z, Z + Z ) + Cov(Z, Cov(Z,Z ) + X A X B ) í í Cov(Z, X A X B ) í í X A X B ) í í = Cov(Z,Z ) + 0 =. nformační hladny pro případ -A Testu yní je opět třea vrátt se případu -A Testu, tedy lascému testu s jednou analýzou, hladnou, sílou. Opět zde popíšeme onstanty, teré udeme používat pro supnově sevenční testy. V tomto testu máme statstu Z ~ (, ). Poud dosažená nformační hladna ude alespoň f, = ( / ) ( nformační hladny pro případ sevenčních testů ) máme zaručeno, že síla testu ude př Poud přstupujeme e supnově sevenčním testům z hledsa nformačních hladn, musíme stanovt maxmální nformační hladnu ( max ), teré chceme dosáhnout ěhem testu ta, ay výsledný test měl sílu. Poládáme max = R. f, de R > a záleží na, a typu testu, terý používáme. Poud jsou nformační hladny stejnoměrně rozmístěny (to znamená, že mez jednotlvým analýzam ěhem testu održíme vždy stejné množství nformací), pa R platí: = max = R.f, ( / ) ( ) =. Hodnoty R P (,), R B (,), R WT (,), R HP (,), teré jsme používal pro dosud zoumané testy, se dají aplovat jao zde použté R, dyž yly defnovány jao podíl potřené velost populace příslušného testu u potřené velost populace -A Testu. yní jsme tedy schopn pohlížet na prolematu supnově sevenčních testů s použtím termnologe nformačních hladn. ejdříve vyereme test, určíme jeho statstcé vlastnost a počet analýz. Určíme testovou statstu Z a nformační hladnu. Podle typu testu najdeme R a určíme max jao nformační hladnu, teré je třea dosáhnout. Dále poud udeme přjímat nové nformace 33

rovnoměrně, položíme = testování. max a spočteme velost populace potřenou. Testy s vntřním línem První část práce yla věnována supnově sevenčním testům, teré je možné předčasně uončt se závěrem, že zamítáme nulovou hypotézu. Tím je možné předejít zejména etcým, prolémům. Zároveň může ještě před sěrem všech pozorování nastat stuace, dy nám dosud napozorovaná data ndují, že nulová hypotéza platí. Poud ychom používal dosud popsané testy, musel ychom pro příjmutí nulové hypotézy poračovat až do -té analýzy. V této aptole popíš způso, ja je možné onstruovat testy de je navíc možné rzé přjetí nulové hypotézy (dále jen W-Testy nner Wedge Testy, Testy s vntřním línem). Tyto testy jsou popsány v prác Jennsona & Turnulla (000, aptola 5). Tyto testy jsou charaterzovány rtcým hodnotam a a, de 0 a <, pro =,,- a a =. Formálně: po =,,- supnách : poud Z : zamítáme H 0 poud Z < a : uončujeme test s tím, že nezamítáme H 0 jna : jd na + po = té supně : poud Z : zamítáme H 0 poud Z < a : uončujeme test s tím, že nezamítáme H 0. Pro aždý test platí, že a = a tedy je zaručeno, že test sončí nejpozděj př -té analýze. Dále poznamenejme, že často platí a = = a = 0. Tedy nulová hypotéza může ýt přjata nejdříve př analýze s číslem +. Termín vntřní lín se zde používá proto, že př zorazení v grafu tvoří rtcé hodnoty a tvar přpomínající lín. Gould & Pecore (98) navrhl testy, ve terých a = a, = pro =,,. Hlavním důvodem pro onstruc testů s rzým přjetím H 0 je snížení předpoládané velost testované populace. Ovšem tato navržené testy nejsou v tomto směru přílš efetvní. My se udeme věnovat supně testů popsanou ve článu Pampallony & Tsatse (994). Tyto testy jsou charaterzovány parametrem. Uvdíme, že co se týče reduce předpoládané velost testované populace, jsou poměrně úspěšné. Defnce W()-Testů Budeme provádět supnově sevenční test, ve terém př aždé analýze udeme mít statsty Z a nformační hladny, pro teré platí anoncé sdružené rozdělení (. Budeme testovat H 0 : = 0 prot H A : 0 př hladně a síle testu př 34

A - B = Tyto testy jsou onstruovány pro rovnoměrně rozložený příjem nformací. Tedy =, =,,. Opět zde máme onstanty C W a C W, teré nezávsí na a jsou numercy vypočítány ta, ay zajstly hladnu a sílu. Položíme onečnou nformační CW (,,, ) CW (,,, ) hladnu = a rtcé hodnoty udeme počítat jao = C W (,,, ) /, a = - - = C W (,,, ) C W = ( C W CW ) - = C W C + CW C 35 C W / / / / W W = / W / Krtcé hodnoty a a jsou zvoleny ta, ay yla dosažena požadovaná hladna testu. Konstanty C W a C W určují a tedy poměr maxmální nformační hladny u nformační hladně nutné pro -A Test: R W (,) = f, C W(,,, ) CW (,,, ) = C ( / ) ( ) V taulce jsou uvedeny tyto onstanty pro onrétní případy. Dále pomocí tauly můžeme posuzovat efetvnost těchto testů díy spočítaným předpoládaným velostem testované populace. Vdíme, že testy splňují požadave, s terým jsou onstruovány, totž, že předpoládaná velost populace je nžší pro nízé hodnoty A - B. Vdíme, že R W se zvyšuje s rostoucím V prác Jennsona & Turnulla (000) nejsou uvedeny W-Testy pro > 0.5, protože v tomto případě je nutné přjmout velou maxmální velost populace a snížení v předpoládané velost populace je jž nepatrné. dyž tato supna testů dosahuje velm dorých výsledů pro všechny hodnoty A - B, v Emerson,Flemng(989) se uvádí, že tyto testy neývají přílš často používány. Hlavním motvací pro provádění supnově sevenčních testů jsou etcé důvody: horší lé y neměl ýt dále podáván. Brzé přjmutí nulové hypotézy pa zamezuje spíše eonomcým ztrátám...

Taula. W()-Testy: CW, CW, RW, * značí číslo první analýzy, dy je možné přjmout H 0. Předpoládané velost populace př A - B = avyjádřeny jao procento odpovídající populace př -A Testu. Hodnoty platí pro supn, 0.05. Jedná se o test, terý má sílu - 0.9 př A - B = C W C W R W * Předpoládaná velost populace př A - B = = -0.5.960.8.000 00.0 00.0 00.0.960.8.000 00.0 99.9 97.4 5.95.36.03 3 80.3 87. 8.0 0.958.35.04 6 76.9 84. 78. = -0.5.960.8.000 00.0 00.0 00.0.957.94.006 95.6 97. 9. 5.960.35.043 3 77. 84.8 78.5 0.975.379.07 5 74.7 8.0 74.8 = 0.0.960.8.000 00.0 00.0 00.0.958.336.03 85.4 9. 84.8 5.990.385.084 3 75.8 8.9 74. 0.03.48.7 5 7.6 79.4 70.6 = 0.5.960.8.000 00.0 00.0 00.0.003.398.00 79.3 87. 79.4 5.073.477.99 7.4 79.7 69.3 0.9.5.6 4 68.6 76.8 65.6 36

Přílad 5 W(0.0, 0.5)-Test: Pro oa následující přílady udeme uvažovat následující prolém (stejný jao v předešlých příladech): X A ~ ( A, ), X B ~ ( B, ), A- B. Testujeme H 0 : = 0 prot H A : 0, = 0.05, -= 0.9 př A - B = volíme =5. Potom n f () = 84.. Př 5 -.) W-Test s parametrem = 0.0 Z tauly dostáváme C W (5,0.050.0.0) =.990, C W (5,0.050.0.0) =.385, RW n f.08484. R W (5,0.050.0.0) =.084. Potom m = = = 8. = = 9. 5 Maxmální populace potřená pro testování tedy je m. = 90 Z = í X A X B = 9 4 9 í 9 X A X B, = C W (,,, ) / =.99 5 = 4.45, CW CW C a = / W / Zde jsou vypočítané hodnoty a a : 3 4 5 4.45 3.5.57.3.99 a -.59-0.06 0.83.47.99 =.5 3.0. Vdíme, že a a a vychází jao záporná čísla. Potom poládáme a = a = 0 a přjmutí nulové hypotézy je možné nejdříve př třetí analýze. Graf 5 zorazuje rtcé hodnoty pro tento W(0.0)-Test. 37

Graf 6. Krtcé hodnoty pro W(0.0)-Test. 5 4 3 0 - - -3-4 -5 Z (B-Test) 3 4 5 a Př 5 -.) W-Test s parametrem = 0.5 Z tauly dostáváme C W (5,0.050.0.5) =.073, C W (5,0.050.0.5) =.477, RW n f.9984. R W (5,0.050.0.5) =.99. Potom m = = = 0. = =. 5 Maxmální populace je m. = 0. Z = 4 í X A X B, = C W (,,, ) /.073 5 = / 4 / 4 3.0 = / 4, CW CW C a = / W / Zde jsou opět onrétní číselné hodnoty: 3 4 5 3.0.6.36.9.07 a -0.6 0.39.07.6.07. =.59 / 4. Uončení testu s přjmutím nulové hypotézy je tedy možné nejdříve př druhé analýze..3 Testy se spotření funcí Zatím jsme pracoval s případy, dy nformace přcházejí relatvně rovnoměrně. Uázal jsme, že poud nastane určté malé odchýlení od předem plánovaného příjmu nformací, stále je možné použít původní rtcé hodnoty s tím, že výsledné vlastnost testu zůstanou relatvně doře zachovány. Prolém nastává v případě, že 38

odchyla od plánovaného příjmu nformací přeročí určtou hranc neo v případě, že počet analýz není dopředu znám. V této aptole popíš přístup e supnově sevenčním testům, terý nám v těchto případech zaručí předem danou hladnu. Pro reálné stuace je tento typ onstruce testů velm důležtý. V případě testování v medcíně ývají předem vyrány časy, ve terých udou proíhat analýzy, ale není dopředu známé ol pozorování ude v tu chvíl dostupných. Testy zde popsané se označují jao Error spendng Tests (testy spotřeovávající chyu, dále jen LD-Testy). Tato metody yla rozvnuta hlavně v pracích od Lana & DeMetse (989). Ty se dále dělí na dva typy: Testy maxmální nformace ve terých se předem určí cílová nformační hladna, teré je třea dosáhnout a test poračuje až do doy, dy je načerpán požadovaný počet pozorování. Konečná nformační hladna je vyrána ta, ay yl splněn požadave na sílu testu. Vedle toho je možné používat testy maxmálního trvání, př terých se určí časová déla testu. Test pa v tento moment sončí nezávsle na množství nasíraných nformací. Testy tohoto typu tedy nezaručují dosažení požadované síly. Slud & We Metoda Metoda spotřeovávání chyy je doře popsatelná na přístupu, terý ve své práce navrhl Slud and We (98). V tomto případě je předem určeno a chya. druhu je rozdělena mez těchto analýz:. Hodnota se označuje jao chya spotřeovaná př analýze. Krtcé hodnoty c jsou následně vypočítány ta, ay () : P r: [Z c,, Z- c -, Z c ] =, pro =,..., Zřejmě je tedy zachována celová hladna testu. Slud&We metoda sce naízí nejjednodušší přístup testům spotření chyy, ale pro pratcé použtí je nevhodná. Prolémy Slud&We metody jsou: je předem dáno a tím je způso testování značně lmtován jsou předem dány. V prax je ovšem pratcé měnt v závslost na množství dosud přjatých nformací. apřílad v případě, dy zpočátu přchází málo nformací, je lepší položt velm malé (malé množství nformací nám přnese malé zvýšení síly testu) a ponechat více z pro pozdější analýzy Testy maxmální nformace Př použtí těchto testů je chya.druhu rozdělena pomocí spotření funce (spendng functon, use functon) f(t). Tato funce je nelesající, f(0) = 0 a f(t) = pro t. Hodnota f(t) vyjadřuje množství z teré je spotřeováno ve chvíl, dy je přjmuto t*00 procent z očeávané maxmální nformace max. Test sončí ve chvíl, dy je dosažena maxmální nformační hladna max. 39

Před začátem testu je tedy třea vyrat spotření func f(t) a najít maxmální nformační hladnu, teré chceme př testování dosáhnout ta, ay yl splněn požadave na sílu. Potom př -té analýze počítáme hodnoty tímto způsoem: f f max, f, pro =,3,. max max Hodnoty c jsou následně vypočítány ta, ay vyhovovaly (). Počet analýz není předem znám. Celý test ončí ve chvíl, dy je načerpána potřená nformační hladna. Tedy je taové nejmenší číslo, pro teré je max. Otázou nyní je, ja volt spotření func f(t): f(t) = mn{ z / t, }, z = (-), dává hodnoty c lízé hodnotám B-Testu v případě, že nformace jsou přjímány rovnoměrně. f(t) = mn{log[ + (e)t)], } dává hodnoty c lízé hodnotám P- Testu f(t) = e /e pro 0 t, pro = 0 je další možností. f(t) = mn{t, } je často používaná supna spotřeních funcí, terou se udeme dále zaývat. V dalším textu včetně příladu se všechny hodnoty udou vztahovat testům, dy volíme taovouto spotření func. LD()-Testy se spotření funcí f(t) = mn{t, } Motvace pro onstruc testů tímto způsoem je sce taová, ay je ylo možno použít pro případy, dy počet analýz není předem známý a není známé an to, jaým způsoem udou přcházet napozorovaná data. Ovšem pro názornost a pro porovnání vlastností s jným testy je vhodné předpoládat maxmální počet analýz a dále, že příjem nformací ude rovnoměrně rozložený (tj. = max ). Analogcy jao v dosud popsaných testech zavádíme hodnoty R LD (,), pomocí nchž spočítáme maxmální nformační hladnu, teré ude třea dosáhnout pro dosažení síly. Tyto hodnoty jsou zorazeny v taulce 3 (Jensson & Turnull, 000, aptola 7.). max = R LD (,). f,. nyní není předem známo. Pro výpočet max proto používáme očeávanou hodnotu. Díy tomu, že max se s rostoucím zvyšuje, je jstější př odhadu volt vyšší hodnoty. 40