ANALÝZA SÍLY VYBRANÝCH KLASICKÝCH A ROBUSTNÍCH TESTŮ NORMALITY PROTI BIMODÁLNÍMU ROZDĚLENÍ

Podobné dokumenty
Pravděpodobnost a aplikovaná statistika

Deskriptivní statistika 1

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Pravděpodobnost a aplikovaná statistika

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Náhodný výběr 1. Náhodný výběr

Odhady parametrů 1. Odhady parametrů

Pravděpodobnostní modely

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Pravděpodobnost a aplikovaná statistika

12. N á h o d n ý v ý b ě r

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

P2: Statistické zpracování dat

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

NEPARAMETRICKÉ METODY

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

14. B o d o v é o d h a d y p a r a m e t r ů

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

VaR analýza citlivosti, korekce

Intervalové odhady parametrů některých rozdělení.

Teorie chyb a vyrovnávací počet. Obsah:

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Závislost slovních znaků

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Intervalové odhady parametrů

VYUŽITÍ DISTRIBUČNÍCH A KORELAČNÍCH TESTŮ PRO TESTOVÁNÍ HYPOTÉZY EFEKTIVNOSTI ČESKÉHO KAPITÁLOVÉHO TRHU

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Popisná statistika. Zdeněk Janák 9. prosince 2007

THE USING OF EMBRYOTRANSFER IN DAIRY CATTLE HERD UPLATNĚNÍ EMBRYOTRANSFERU VE STÁDĚ DOJENÉHO SKOTU

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

2. Náhodná veličina. je konečná nebo spočetná množina;

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

4. B o d o v é o d h a d y p a r a m e t r ů

13 Popisná statistika

3. Charakteristiky a parametry náhodných veličin

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Pravděpodobnostní model doby setrvání ministra školství ve funkci

7. Odhady populačních průměrů a ostatních parametrů populace

vají statistické metody v biomedicíně

Úloha III.S... limitní

Integrace hodnot Value-at-Risk lineárních subportfolií na bázi vícerozměrného normálního rozdělení výnosů aktiv

17. Statistické hypotézy parametrické testy

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

Kvantily. Problems on statistics.nb 1

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Testování statistických hypotéz

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Michaela Kurková. Katedra pravděpodobnosti a matematické statistiky

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

6. Posloupnosti a jejich limity, řady

8 Průzkumová analýza dat

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

8. cvičení 4ST201-řešení

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

Úloha II.S... odhadnutelná

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Testování statistických hypotéz

Mendelova univerzita v Brně Statistika projekt

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

8. Analýza rozptylu.

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

IAJCE Přednáška č. 12

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Backtesting of VaR estimation for investment into foreign stock index

Vzorový příklad na rozhodování BPH_ZMAN

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Dynamická pevnost a životnost Statistika

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

TECHNICKÝ AUDIT VODÁRENSKÝCH DISTRIBUČNÍCH

10.3 GEOMERTICKÝ PRŮMĚR

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Neparametrické metody

Uni- and multi-dimensional parametric tests for comparison of sample results

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Testování vybraných modelů odhadu hodnoty VaR

2 STEJNORODOST BETONU KONSTRUKCE

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PoznÁmky k přednášce

Transkript:

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročík LVII 6 Číslo 6, 009 ANALÝZA SÍLY VYBRANÝCH KLASICKÝCH A ROBUSTNÍCH TESTŮ NORMALITY PROTI BIMODÁLNÍMU ROZDĚLENÍ L. Střelec Došlo: 6. červa 009 Abstract STŘELEC, L.: Aalysis of power of the classical ad robust ormality tests agaist bimodal distributio. Acta uiv. agric. et silvic. Medel. Bru., 009, LVII, No. 6, pp. 53 60 The aim of this paper is to compare the power of selected ormality tests to detect a bimodal distributio. We use some classical ormality tests (the Shapiro-Wilk test, the Lilliefors test, the Aderso- Darlig test, the classical Jarque-Bera test ad the Jarque-Bera-Urzua test), some robust ormality tests (the robust Jarque-Bera test ad the Medcouple test) ad the modified Jarque-Bera tests, where the media istead of the mea is used i the classical Jarque-Bera test statistic. The results of simulatio study show that the Aderso-Darlig ad the Shapiro-Wilk tests outperform the others, especially i small sample sizes. O the other had the classical Jarque-Bera, the Jarque-Bera-Urzua ad robust Jarque-Bera tests are biased, especially i small sample sizes agai. Fially, the modificatio of the Jarque-Bera test leads to icrease of power agaist bimodal distributio. tests of ormality, robust tests, Mote Carlo simulatio, power compariso, bimodal distributio V současé době existuje velké možství odboré literatury, která se věuje testům ormality a jejich statistickým vlastostem (apř. Thode, 00). Mimo klasických formálích testovacích procedur určeých k testováí ormality existují rověž metody založeé a grafickém posouzeí či testy testující odlehlé hodoty či jié odchylky od ormality. Přesto však ejvíce používaými metodami jsou formálí testovací procedury, které doplňují prvotí posouzeí ormality vycházející z grafických metod. Všeobecě ejběžěji využívaým omibus testem je Shapiro-Wilkův test (Shapiro a Wilk, 965), v ekoomii či fiacích je aopak ejvíce využívaý Jarque-Bera test (Jarque a Bera, 980). V posledí době se mimo klasických testů objevují také ové testy ormality, které jsou založey a robustích charakteristikách a které dokážou částečě elimiovat problémy s odlehlými hodotami. Jako příklad lze uvést robustí Jarque-Bera test (viz Gelová a Gastwirth, 009), který vykazuje vyšší sílu testu proti těžkochvostým alterativám ež klasický Jarque-Bera test, dále pak testy ormality založeé a medcouple charakteristice jako robustí charakteristice šikmosti (viz Brys et al., 004 a 008) či třídu robustích RT testů, kde speciálími případy jsou jak klasický Jarque-Bera test, tak i robustí Jarque- Bera test (viz Střelec a Stehlík, 009a). Cílem práce je komparace a aalýza síly vybraých testů ormality (zahrující jak klasické, tak i robustí testy ormality) proti bimodálím alterativám, především se zaměřeím a vylepšeí síly klasického Jarque-Bera testu, který proti těmto alterativám a pro malé rozsahy souborů vykazuje ulovou sílu. Práce je rozdělea do čtyř hlavích částí. V prví jsou charakterizováy modifikace Jarque- Bera testu ormality a směsi ormálích rozděleí. Ve druhé části jsou prezetováy výsledky provedeé komparačí aalýzy síly testů. Ve třetí části jsou diskutováy dosažeé výsledky především s ohledem a porováí síly klasických, robustích a vybraých testů pocházejících z RT třídy testů ormality. Čtvrtá část obsahuje souhr ejdůležitějších výsledků. MATERIÁL A METODY Pro potřeby komparačí aalýzy bude sledováa síla vybraých klasických testů ormality, kokrétě Aderso-Darligova testu (AD), Shapiro-Wilkova testu (SW), Lilliefors (Kolmogorov-Smirovova) 53

54 L. Střelec i= testu (LT), Jarque-Bera testu (JB), vybraých robustích testů ormality, kokrétě robustího Jarque- Bera testu (RJB) a medcouple testu (MC-LR), a modifikovaých Jarque-Bera testů, jako speciálích případů třídy RT testů defiovaé v [Střelec a Stehlík, 009a, b]. Modifikovaé Jarque-Bera testy jsou testy využívající mediáu jako odhadu středí hodoty místo aritmetického průměru v klasické testové statistice Jarque-Bera testu. Nechť μ k = E(X E(X)) k je k-tý teoretický momet rozděleí pro všechy pozitiví hodoty k, echť ˆμ k X ) k je jeho em- pirická variata a echť ˆm k M )k je jeho i= robustí variata, kde X i pro i,, je výběr z iid áhodé proměé, X je výběrový odhad prvího obecého mometu (aritmetický průměr) a M je výběrový mediá. Obecě pak můžeme zavést odhad empirického mometu M i,k = (X m M (i) ) k, m= kde i {0, } začí buď aritmetický průměr M (0) = X ebo mediá M () = M. Třídu modifikovaých JB testů lze pak zapsat jako M i,3 M i3,4 MJB (i,i,i 3,i 4 ) 3/ C M i C,3 M i3. (),4 C a C jsou kostaty, které mají jié hodoty ež v případě klasického Jarque-Bera testu. Tyto kostaty lze získat a základě Mote Carlo simulací (viz íže). Blíže k uvedeým modifikovaým testům viz Střelec a Stehlík, 009a,b. Klasická Jarque-Bera testová statistika tak je speciálím případem této obecé třídy, kdy ji lze zapsat jako MJB (0,0,0,0). Testová statistika tak má tvar (Jarque a Bera, 980) ˆμ 3 ˆμ 4 JB = MJB (0,0,0,0), () 3/ 6 ˆμ 4 ˆμ 3/ kde ˆμ 3 /ˆμ je výběrový odhad šikmosti rozděleí a ˆμ 4 /ˆμ je výběrový odhad špičatosti rozděleí. Jak již bylo uvedeo výše, jedotlivé variaty modifikovaých Jarque-Bera testů se od sebe odlišují kostatami C a C. Kostaty pro všechy variaty MJB (i,i,i 3,i 4 testů, kde i {0, } začí buď využití aritmetického průměru M (0) ) = X, ebo mediáu M () = M, jsou uvedey v Tab I. a II. Z uvedeých výsledků simulace kostaty C je patré, že její hodota je závislá a použité charakteristice šikmosti. Naopak v případě kostaty C jsou její asymptotické hodoty shodé. Z výsledků lze rověž posoudit rychlost kovergece k teoretické hodotě, kdy v případě charakteristiky šikmosti ejrychleji koverguje výběrová charakteristika 3/ ˆμ 3 /ˆμ a v případě charakteristiky špičatosti výběrová charakteristika ˆm 4 /ˆμ. Získaé teoretické (asymptotické) hodoty kostat C a C jsou pak využity při vlastí kostrukci modifikovaých testů ormality MJB. Např. testovou statistiku MJB (,0,,0) lze zapsat ˆm 3 ˆm 4 MJB (,0,,0) 3/ 8 ˆμ 4 ˆμ. (3) Všechy MJB testy mají stejě jako klasický Jarque-Bera test asymptoticky chí-kvadrát rozděleí se dvěma stupi volosti (blíže viz Střelec a Stehlík, 009a, b). Pro všechy sledovaé testy bude využito exaktích kritických hodot získaých a základě Mote Carlo simulací, které pro malé a středě velké rozsahy souborů v případě Jarque-Bera testu, robustího Jarque-Bera testu, modifikovaých Jarque-Bera testů a medcouple testů v porováí s aproximací chí-kvadrát rozděleím věrohoději zachycují rozděleí testových statistik těchto testů ormality. Jako alterativy jsou zvoley vybraé směsi ormálích rozděleí zajišťující bimodálí rozděleí. Směs dvou ormálích rozděleí lze obecě zapsat fukcí: F = ( p)n(μ,σ ) + pn(μ,σ ), (4) kde 0 p. Fukce F uvedeá v (4) může být iterpretováa ásledově: s pravděpodobostí ( p) pocházejí hodoty z ormálího rozděleí se středí hodotou μ a rozptylem σ a s pravděpo- I: Výsledky simulace kostaty C pro růzé rozsahy souborů 5 50 75 00 00 500 000 3/ ˆμ 3 /ˆμ 4,7 5,40 5,38 5,69 5,9 6,00 5,98 6 3/ ˆμ 3 /ˆm 4,3 5,5 5, 5,55 5,83 5,97 5,97 6 3/ ˆm 3 /ˆμ 5,66 6,36 6,8 6,67 6,87 7,7 7,3 8 3/ ˆm 3 /ˆm 3,5 5,8 5,44 6,0 6,53 7,03 7,6 8 Počet Mote Carlo simulací je 0 000. II: Výsledky simulace kostaty C pro růzé rozsahy souborů 5 50 75 00 00 500 000 ˆμ 4 /ˆμ 3,0 8,46 9,9,08 3,07 3,9 3,3 4 ˆμ 4 /ˆm,9 8,7 9,5 0,95 3,0 3,84 3,3 4 ˆm 4 /ˆμ 9,09,05,6 3,8 4,0 4,4 3,54 4 ˆm 4 /ˆm 5,8 9,98 0,9,04 3,55 4,5 3,4 4 Počet Mote Carlo simulací je 0 000.

Aalýza síly vybraých klasických a robustích testů ormality proti bimodálímu rozděleí 55 dobostí p pocházejí hodoty z ormálího rozděleí se středí hodotou μ a rozptylem σ. V komparačí aalýze budou kokrétě předpokládáy ásledující hodoty jedotlivých parametrů a to za účelem aalýzy bimodálích rozděleí: μ = 0, σ, μ {3, 5}, σ a p = 0,50. K porováí síly sledovaých testů proti uvedeým alterativám bude využito Mote Carlo simulací (počet Mote Carlo simulací je 0000). VÝSLEDKY V Tab. III a a Obr. je zachycea síla sledovaých klasických (AD, JB, JBU, LT, SW) a robustích (RJB a MC-LR) testů ormality proti bimodálímu rozděleí vycházející ze směsi dvou ormálích rozděleí s fukcí F = 0,5N(0; ) + 0,5 N(3; ). Z výsledků je patré, že ejsilějším testem je Aderso-Darligův test (AD) a to pro všechy sledovaé rozsahy souborů. Naopak ejslabšími testy pro malé a středě velké rozsahy souborů ( 00) jsou klasický Jarque-Bera test (JB), Urzuova verze Jarque- Bera testu (JBU) a robustí Jarque-Bera test (RJB), které apř. pro rozsah souboru = 4 považují daé bimodálí rozděleí za rozděleí ormálí v téměř 00 % případů (síla testu je ve všech třech případech velmi blízká ule). Důvodem je, že daé rozděleí je symetrické, přičemž jeho špičatost pro je,04 (viz Tab. IV), avšak pro malé rozsahy souboru eí špičatost výzamě odlišá od špičatosti ormálího rozděleí, což způsobuje, že uvedeé testy mají prakticky ulovou sílu. V případě vybraých modifikovaých Jarque-Bera testů je však patré jisté zlepšeí. Výsledky Mote III: Síla sledovaých klasických a robustích testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 3 a σ 4 50 74 00 00 AD 0,44 0,43 0,6359 0,804 0,994 JB 0,0009 0,00 0,040 0,8 0,897 JBU 0,0008 0,0000 0,0086 0,053 0,849 LT 0,05 0,877 0,4555 0,60 0,9456 MC-LR 0,077 0,8 0,55 0,935 0,3689 RJB 0,0003 0,0000 0,0000 0,008 0,890 SW 0,9 0,3497 0,5590 0,7334 0,9837 Zvýrazěy jsou testy s ejvyšší silou. Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0,0 4 50 74 00 00 AD JB JBU LT RJB SW MC-LR : Síla sledovaých klasických a robustích testů ormality pro růzé rozsahy proti alterativě bimodálího rozděleí s parametry μ = 3 a σ Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05. IV: Charakteristiky šikmosti β a špičatosti β pro vybraé směsi ormálích rozděleí σ μ 0 3 4 5 β 0,00 0,00 0,00 0,00 0,00 0,00 β 3,00,9,50,04,7,5

56 L. Střelec Carlo simulace síly modifikovaých Jarque-Bera testů jsou zachycey v Tab. V a a Obr.. Nejvyšší sílu pro všechy sledovaé rozsahy souborů vykazuje MJB (,,0,) test, který v porováí s téměř ulovou silou klasického Jarque-Bera testu MJB (0,0,0,0) pro malé rozsahy souborů ( < 75) vykazuje sílu srovatelou s robustím medcouple MC-LR testem. Pro větší rozsahy souborů ( 00) je síla uvedeého testu již vyšší ež síla medcouple MC-LR testu a je srovatelá dokoce s LT testem. Zajímavé je i rozpětí síly modifikovaých Jarque- Bera testů, kdy apř. pro středě velký rozsah souboru ( 00) je jejich síla v rozmezí itervalu (0,04; 0,4), tj. lze alézt test (kokrétě MJB (0,0,,0) ), který má sílu přibližě srovatelou se zvoleou hladiou výzamosti α = 0,05, a rověž test (kokrétě MJB (,,0,) ), jehož síla je vyšší ež síla klasického JB testu, JBU testu a obou sledovaých robustích testů ormality (RJB, MC-LR), ale zároveň ižší ež síla klasických testů ormality (AD, LT a SW). Jedá se tedy o test, který představuje kompromis mezi robustostí testu a jeho silou. Obdobých výsledků je dosažeo i v případě síly sledovaých testů ormality proti bimodálímu rozděleí vycházející ze směsi dvou ormálích rozděleí s fukcí F = 0,5N(0; ) + 0,5N(5; ). Z vý- V: Síla modifikovaých Jarque-Bera testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 3 a σ 4 50 74 00 00 MJB (0,0,0,0) 0,0009 0,00 0,040 0,8 0,897 MJB (0,0,0,) 0,0043 0,060 0,059 0,3030 0,9094 MJB (0,0,,0) 0,00 0,000 0,0009 0,0368 0,785 MJB (0,0,,) 0,00 0,000 0,006 0,0903 0,8475 MJB (0,,0,0) 0,0008 0,004 0,056 0,409 0,8959 MJB (0,,0,) 0,0069 0,036 0,94 0,3376 0,938 MJB (0,,,0) 0,003 0,000 0,00 0,0439 0,7900 MJB (0,,,) 0,00 0,000 0,008 0,030 0,859 MJB (,0,0,0) 0,09 0,068 0,44 0,3395 0,966 MJB (,0,0,) 0,0400 0,0986 0,860 0,377 0,95 MJB (,0,,0) 0,0037 0,008 0,007 0,098 0,8694 MJB (,0,,) 0,0037 0,0084 0,056 0,39 0,8980 MJB (,,0,0) 0,078 0,0754 0,797 0,384 0,99 MJB (,,0,) 0,0474 0,77 0,0 0,409 0,99 MJB (,,,0) 0,009 0,000 0,0077 0,04 0,8779 MJB (,,,) 0,000 0,003 0,065 0,577 0,9058 Zvýrazěy jsou testy s ejvyšší silou. Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0,0 4 50 74 00 00 MJB(0,0,0,0) MJB(0,0,0,) MJB(0,0,,0) MJB(0,0,,) MJB(0,,0,0) MJB(0,,0,) MJB(0,,,0) MJB(0,,,) MJB(,0,0,0) MJB(,0,0,) MJB(,0,,0) MJB(,0,,) MJB(,,0,0) MJB(,,0,) MJB(,,,0) MJB(,,,) : Síla modifikovaých Jarque-Bera testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 3 a σ Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.

Aalýza síly vybraých klasických a robustích testů ormality proti bimodálímu rozděleí 57 sledků zachyceých v Tab. VI a Obr. 3 je patré, že ejsilějším testem je opět AD test, ásledová SW testem a LT testem. Naopak ulovou sílu pro malý rozsah souboru ( = 4) vykazuje klasický JB test, JBU test a robustí JB test. V případě klasického JB testu a JBU testu je jejich síla srovatelá s ostatími testy až pro rozsah souboru 74, pro RJB test až pro rozsah souboru 00. Je tedy patré, že tyto testy jsou, především pro malé rozsahy souborů, vychýleé, tj. edokážou sledovaé bimodálí rozděleí odlišit od rozděleí ormálího. Důvodem je opět symetrie rozděleí a také pro malé rozsahy souborů evýzamý rozdíl mezi hodotou špičatosti daého rozděleí, která je,5 pro (viz Tab. IV), a špičatostí ormálího rozděleí. Jedou z možostí, jak zlepšit sílu Jarque-Bera testu, je opět využít jeho modifikace, kdy MJB (,,0,) test vykazuje pro rozsah souboru = 4 sílu 0,07 v porováí s ulovou silou klasického JB testu (viz Tab. VII a Obr. 4). Nejvyššího rozpětí modifikovaých testů je dosažeo při rozsahu souboru = 50, kdy ejslabším testem je MJB (0,0,,0) test s téměř ulovou silou a ejsilějším testem je MJB (,,0,0) test se sílou 0,78. Pro středě velké a velké rozsahy souborů ( 00) je již síla těchto modifikovaých testů srovatelá s klasickými omibus testy ormality. Využitím kombiace mediáu a aritmetického průměru v klasické Jarque-Bera statistice tak lze dosáhout zvýšeí síly testu proti bimodálím rozděleím, avšak uvedeé zvýšeí síly eplatí obecě. Naopak lze rozlišit skupiu modifikovaých testů, jejichž síla je prakticky shodá s klasickým Jarque-Bera testem, jež je v Tab. VII ozačeý jako MJB (0,0,0,0) kokrétě se jedá o skupiu testů MJB (0,0,,0), MJB (0,0,,), MJB (0,,0,0), MJB (0,,,0), MJB (0,,,), MJB (,0,,0), MJB (,,,0) a MJB (,,,) a skupiu modifikovaých testů, jejichž síla i pro malé rozsahy souborů je v porováí s klasickým Jarque-Bera testem či robustím Jarque-Bera testem relativě vysoká, což umožňuje jejich praktické využití kokrétě se jedá o skupiu testů MJB (0,0,0,), MJB (0,,0,), MJB (,0,0,0), MJB (,0,0,), MJB (,,0,0) a MJB (,,0,), přičemž ejsilější z ich je posledě jmeovaý, tj. test, jehož testová statistika má podobu ˆm 3 ˆμ 4 MJB (,,0,) 8 ˆm 3/ 4 ˆm, (5) VI: Síla sledovaých klasických a robustích testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 5 a σ 4 50 74 00 00 AD 0,883 0,9995,0000,0000,0000 JB 0,0000 0,4336 0,9755 0,9993,0000 JBU 0,0000 0,093 0,8987 0,998,0000 LT 0,78 0,9905,0000,0000,0000 MC-LR 0,0694 0,479 0,338 0,35 0,606 RJB 0,0000 0,0000 0,0003 0,967,0000 SW 0,837 0,9983,0000,0000,0000 Zvýrazěy jsou testy s ejvyšší silou. Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0,0 4 50 74 00 00 AD JB JBU LT RJB SW MC-LR 3: Síla sledovaých klasických a robustích testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 5 a σ Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.

58 L. Střelec a který má stejě jako klasický Jarque-Bera test asymptoticky chí-kvadrát rozděleí se dvěma stupi volosti, tj. ormalitu zamítá v případech, kdy MJB (,,0,) > χ α (). DISKUSE Jak vyplývá z výše uvedeých výsledků provedeé simulačí komparačí aalýzy, ejsilějším testem z aalyzovaých testů proti bimodálímu rozděleí je Aderso-Darligův test (Aderso a Darlig, 95) ásledovaý Shapiro-Wilkovým testem (Shapiro a Wilk, 965) a Lillieforsovým testem (Lilliefors, 967). Naopak testy založeé a mometových charakteristikách, jako je klasický Jarque-Bera test, Urzuova verze Jarque-Bera testu (Urzua, 996) či robustí Jarque-Bera test zkostruovaý Gelovou a Gastwirthem, 009, vykazují pro malé rozsahy souborů ulovou sílu, a což již v případě klasického Jarque-Bera testu upozorili Thadewald a Büig, 007. Uvedeá ulová síla testu pro malé rozsahy souborů však eplatí pro všechy testy, které jsou založey a mometových charakteristikách apř. D`Agostiův test založeý a trasformovaých charakteristikách šikmosti a špičatosti (blíže k testu VII: Síla modifikovaých Jarque-Bera testů ormality pro růzé rozsahy souborů proti alterativě bimodálího rozděleí s parametry μ = 5 a σ 4 50 74 00 00 MJB (0,0,0,0) 0,0000 0,4336 0,9755 0,9993,0000 MJB (0,0,0,) 0,0044 0,6390 0,989 0,9995,0000 MJB (0,0,,0) 0,0000 0,004 0,5556 0,963 0,9993 MJB (0,0,,) 0,0000 0,0598 0,8068 0,9903,0000 MJB (0,,0,0) 0,0000 0,54 0,987 0,9995,0000 MJB (0,,0,) 0,066 0,7363 0,997 0,9995,0000 MJB (0,,,0) 0,0000 0,0065 0,5984 0,99 0,9993 MJB (0,,,) 0,0000 0,0 0,8337 0,995,0000 MJB (,0,0,0) 0,053 0,674 0,987 0,9994,0000 MJB (,0,0,) 0,0333 0,657 0,9877 0,9994,0000 MJB (,0,,0) 0,000 0,08 0,848 0,9979,0000 MJB (,0,,) 0,0005 0,568 0,967 0,999,0000 MJB (,,0,0) 0,0437 0,7803 0,9937 0,9995,0000 MJB (,,0,) 0,0693 0,7704 0,9933 0,9996,0000 MJB (,,,0) 0,0000 0,0449 0,87 0,998,0000 MJB (,,,) 0,0000 0,4366 0,98 0,999,0000 Zvýrazěy jsou testy s ejvyšší silou. Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0,0 4 50 74 00 00 MJB(0,0,0,0) MJB(0,0,0,) MJB(0,0,,0) MJB(0,0,,) MJB(0,,0,0) MJB(0,,0,) MJB(0,,,0) MJB(0,,,) MJB(,0,0,0) MJB(,0,0,) MJB(,0,,0) MJB(,0,,) MJB(,,0,0) MJB(,,0,) MJB(,,,0) MJB(,,,) 4: Síla modifikovaých Jarque-Bera testů ormality pro růzé rozsahy proti alterativě bimodálího rozděleí s parametry μ = 5 a σ Počet Mote Carlo simulací je 0000, hladia výzamost α = 0,05.

Aalýza síly vybraých klasických a robustích testů ormality proti bimodálímu rozděleí 59 viz D`Agostio a Stephes, 986) vykazuje proti alterativě bimodálího rozděleí přibližě stejou či dokoce epatrě vyšší sílu ež Aderso- Darligův test (viz Střelec a Stehlík, 009b). Dalším příkladem eulové síly testu založeém a mometových charakteristikách proti alterativě bimodálího rozděleí jsou vybraé výše vymezeé modifikovaé Jarque-Bera testy kombiující aritmetický průměr a mediá v odhadech cetrálích mometů klasické Jarque-Bera testové statistiky. Modifikovaé Jarque-Bera testy sice edosahují síly Aderso-Darligova testu, ale v porováí s klasickým Jarque-Bera testem, Urzuovou verzí Jarque- Bera testu či robustím Jarque-Bera testem dosahují relativě vysoké síly testu. Kokrétím příkladem může být MJB (,,0,) test. Vybraé modifikovaé testy tak lze úspěšě využít při testováí proti alterativám bimodálího rozděleí, eboť představují kompromis mezi robustostí a silou testu (apř. medcouple test (Brys et al., 004 a 008), který lze považovat za velmi robustí test, vykazuje v porováí s vybraými modifikovaými testy ižší sílu). Modifikovaé testy lze použít i pro testováí proti jiým alterativám ež je bimodálí rozděleí. Např. je lze využít pro testováí proti alterativám těžkochvostých rozděleí jako je Cauchyho, Laplaceovo či Studetovo t-rozděleí se třemi stupi volosti či pro testováí proti alterativám lehkochvostých rozděleí jako je expoeciálí či logormálí rozděleí. Např. MJB (,,,) test vykazuje vyšší sílu ež klasický Jarque-Bera test či robustí Jarque-Bera test proti alterativám zešikmeým s lehkými chvosty, avšak v případě těžkochvostých rozděleí vykazuje MJB (,,,) test v porováí s klasickým Jarque-Bera testem a robustím Jarque-Bera testem stejou či ižší sílu (viz Střelec, 008). Modifikovaé MJB (i,i,i 3,i 4 ) testy tak poskytují velkou škálu testů, které je uté podrobit dalšímu výzkumu a to především v porováí s klasickými a robustími testy ormality, eboť představují třídu testů, které využívají klasických i robustích mometových charakteristik. SOUHRN Čláek se zabývá srováím síly vybraých klasických omibus testů ormality (Shapiro-Wilkova testu, Lilliefors (Kolmogorov-Smirovova) testu, Aderso-Darligova testu, klasického Jarque-Bera testu a Jarque-Bera-Urzua testu), robustích testů ormality (robustího Jarque-Bera testu, medcouple testu) a modifikovaých Jarque-Bera testů proti bimodálímu rozděleí. Na základě Mote Carlo simulací bylo zjištěo, že ejsilějším testem proti alterativě bimodálího rozděleí je Aderso-Darligův test a Shapiro-Wilkův test. Naopak klasický Jarque-Bera test, Urzuova verze Jarque-Bera testu a robustí Jarque-Bera test vykazují pro malé rozsahy souborů ulovou sílu. V těchto případech vykazují vyšší sílu vybraé modifikovaé Jarque-Bera testy, které kombiují mediá a aritmetický průměr ve výběrových odhadech k-tých cetrálích mometů. Nejsilější z těchto modifikací je modifikovaý Jarque-Bera test MJB (,,0,), jehož testová statistika má podobu ˆm 3 ˆμ 4 MJB (,,0,) 3/ 8 ˆm 4 ˆm, kde ˆμ k X ) k a ˆm k M )k jsou výběrové odhady k-tého cetrálího mometu pro i= i= všechy pozitiví hodoty k, X i pro i,, je výběr z iid áhodé proměé, X je výběrový odhad 3/ prvího obecého mometu (aritmetický průměr), M je výběrový mediá, ˆm 3 / ˆm je výběrový odhad šikmosti rozděleí a ˆμ 4 / ˆm je výběrový odhad špičatosti rozděleí, a která má stejě jako klasická Jarque-Bera testová statistika asymptoticky chí-kvadrát rozděleí se dvěma stupi volosti, tj. ormalitu zamítá v případech, kdy MJB (,,0,) > χ (). α V porováí s Aderso-Darligovým a Shapiro-Wilkovým testem vykazuje MJB (,,0,) test pro malé a středě velké rozsahy souboru ižší sílu, avšak v porováí s ulovou silou klasického Jarque-Bera testu je zde patré zlepšeí apř. proti alterativě bimodálího rozděleí, které vzike jako směs dvou ormálích rozděleí s fukcí F = 0,5N(0; ) + 0,5N(5; ) pro rozsah souboru = 4 vykazuje MJB (,,0,) test sílu 0,07, Jarque-Bera test sílu 0,00 a Aderso-Darligův test sílu 0,88, a pro rozsah souboru = 50 vykazuje MJB (,,0,) test sílu 0,77, Jarque-Bera test sílu 0,43 a Aderso-Darligův test sílu téměř,00. testy ormality, robustí testy, Mote Carlo simulace, komparace síly testů, bimodálí rozděleí Příspěvek vzikl za podpory programu AKTION Česká republika Rakousko, spolupráce ve vědě a vzděláí, projektu č. 5p7 s ázvem Robust testig for the ormality ad its applicatios for the ecoomy, sports ad Basel II. SUMMARY This paper deals with compariso of the power of selected classical omibus ormality tests (the Shapiro-Wilk test, the Lilliefors test, the Aderso-Darlig test, the classical Jarque-Bera test ad

60 L. Střelec the Jarque-Bera-Urzua test), the robust ormality tests (the robust Jarque-Bera test, the Medcouple test) ad the modified Jarque-Bera ormality tests to detect a bimodal distributio. O the basis of the Mote Carlo simulatios we ca coclude that the Aderso-Darlig ad the Shapiro-Wilk tests outperform the other tests icludig the Lillierfors test ad medcouple test for bimodal alterative distributio, especially i small sample sizes. O the other had the classical Jarque- Bera, the Jarque-Bera-Urzua ad the robust Jarque-Bera tests are biased, especially i small sample sizes agai. For these cases selected modified Jarque-Bera tests show a higher power tha the classical Jarque-Bera test. These tests combie the media ad the arithmetic mea for the k-th populatio cetral momet estimatio. Cosequetly, the highest power show MJB (,,0,) test with test statistic ˆm 3 ˆμ 4 MJB (,,0,) 3/ 8 ˆm 4 ˆm, where ˆμ k X ) k ad ˆm k M )k are sample estimates of the k-th populatio cetral i= i= momet for ay positive iteger k, X i for i,, is a sample of idepedet ad idetically dis tribu ted radom variables, X is the sample estimate of first populatio momet (sample mea), M is 3/ the sample media, ˆm 3 / ˆm is the sample estimate of the skewess ad ˆμ 4 / ˆm is the sample estimate of the kurtosis. MJB (,,0,) test statistic follows the same asymptotically distributio as the classical Jarque- Bera test statistic, i.e. the chi-square with two degrees of freedom. Therefore, the implied oe-sided rejectio regio is reject H 0 : ormality, if MJB (,,0,) > χ (). α The MJB (,,0,) test shows a lower power tha the Aderso-Darlig ad the Shapiro-Wilk tests, especially i small sample sizes. O the other had the MJB (,,0,) test shows a higher power tha the classical Jarque-Bera test e.g. MJB (,,0,) test shows power 0,07 agaist the bimodal distributio with mixture of ormal distributios fuctio F = 0,5N(0; ) + 0,5N(5; ) ad sample size = 4 (i cotrast, the classical Jarque-Bera test is biased (the power is zero) ad power of the Aderso-Darlig test is 0.88) ad for sample size = 50 MJB (,,0,) test shows power 0.77 (i cotrast, power of the classical Jarque-Bera test is 0.43 ad power of the Aderso-Darlig test is early.00). Research was supported by Project 5p7 AKTION Czech Republic-Austria: Robust testig for the ormality ad its applicatios for the ecoomy, sports ad Basel II. LITERATURA ANDERSON, T. W., DARLING, D. A., 95: Asymptotic theory of certai goodess-of-fit criteria based o stochastic processes. Aals of Mathematical Statistics, 3(). p. 93. BRYS, G., HUBERT, M., STRUYF, A., 004: A robustificatio of the Jarque-Bera test of or mali ty. COMPSTAT 004, Proceedigs i Computatioal Statistics, ed. J. Atoch, Spriger, Physica Verlag, p. 753 769. BRYS, G., HUBERT, M., STRUYF, A., 008: Goodess-of-fit tests based o a robust measure of skewess. Computatioal Statistics, 3(3). p. 49 44. D'AGOSTINO, R., STEPHENS, M., 986: Goodessof-fit Techiques. Marcel Dekker, New York. GEL, Y. R., GASTWIRTH, J. L., 009: A robust modificatio of the Jarque-Bera test of ormality. Ecoomics Letters, 99(), p. 30 3. JARQUE, C. M., BERA, A. K., 980: Efficiet tests for ormality, homoscedasticity ad serial idepedece of regressio residuals. Ecoomics Letters, 6(3). p. 55 59. LILLIEFORS, H., 967: O the Kolmogorov-Smirov test for ormality with mea ad variace ukow. Joural of the America Statistical Associatio, 6(38). p. 399 40. SHAPIRO, S. S., WILK, M. B., 965: A aalysis of variace test for ormality (complete samples). Biometrika, 5(3 ad 4). p. 59 6. STŘELEC, L., 008: Compariso of power of modified Jarque-Bera ormality tests ad selected tests of ormality. Acta Uiversitatis Agriculturae et Silviculturae Medeliaae Bruesis: Acta of Medel Uiversity of Agriculture ad Forestry. sv. LVI, č. 6, s. 37 48. ISSN -856. STŘELEC, L., STEHLÍK, M., 009a: O robust testig for ormality. Proceedigs of the 6th St. Petersburg Workshop o Simulatio. St. Petersburg: VVM com. Ltd., Ed. by S. M.Ermakov, V. B. Melas ad A. N. Pepelyshev, 009, p. 755 760. STŘELEC, L., STEHLÍK, M., 009b: Some properties of robust tests for ormality ad their applicatios. IFAS research report. URZUA, C. M., 996: O the correct use of omibus tests for ormality. Ecoomics Letters, 53(3), p. 47 5. THADEWALD, T., BÜNNING, H., 007: Jarque- Bera test ad its competitors for testig ormality a power compariso. Joural of Applied Statistics, 34(). p. 87 05. THODE, H. C., 00: Testig for Normality. Marcel Dekker, New York. Adresa Ig. Luboš Střelec, Ústav statistiky a operačího výzkumu, Medelova zemědělská a lesická uiverzita v Brě, 63 00 Bro, Česká republika, xstrelec@ode.medelu.cz