Nobelova cena za fyziku v roce 2016 تح podivné jevy v plochém světě
|
|
- Dalibor Čermák
- před 6 lety
- Počet zobrazení:
Transkript
1 Nobelova cena za fyziku v roce 2016 تح podivné jevy v plochém světě Joanna Rose Abstrakt. Laureáti Nobelovy ceny za fyziku v roce 2016 otevřeli dveře do neznámého světa, v němž hmota existuje v podivných stavech. Nobelova cena za fyziku byla udělena z jedné poloviny Davidu J. Thoulessovi z Washingtonské univerzity v Seattlu a z druhé poloviny společně F. Duncanovi M. Haldanovi z univerzity v Princetonu a J. Michaelovi Kosterlitzovi z Brownovy univerzity v Providence. Jejich objevy představují významný průlom do teoretického chápání tajemství hmoty a do vývoje nových materiálů. David Thouless, Duncan Haldane a Michael Kosterlitz (obr. 1) využili pokročilých matematických metod k vysvětlení podivných jevů v neobvyklých fázích (či stavech) hmoty, jakými jsou supravodivost, supratekutost nebo tenké magnetické vrstvy. Kosterlitz a Thouless studovali jevy, které vznikají v plochém světě na površích nebo uvnitř nesmírně tenkých vrstev, které mohou být považovány za dvourozměrné. Haldane se také zabýval hmotou ve formě vláken tak tenkých, že mohou být považována za jednorozměrná. Fyzika v plochém světě je velice odlišná od té, kterou známe ze světa kolem nás. Ačkoli je tenká vrstva hmoty složena z miliónů atomů a ačkoli se vlastnosti každého atomu dají vysvětlit zákony kvantové fyziky, tyto atomy vykazují zcela jiné vlastnosti, pokud se spojí dohromady. V plochém světě jsou stále objevovány nové kolektivní jevy a fyzika kondenzovaného stavu je jednou z nejživějších oblastí fyziky. Obr. 1. David J. Thouless, F. Duncan M. Haldane, J. Michael Kosterlitz ( c The Royal Swedish Academy of Sciences, photo Markus Marcetic) c Johan Jarnestad/The Royal Swedish Academy of Sciences. Z anglického originálu Popular Science Background: Strange phenomena in matter s flatlands přeložil Miloš Rotter. Publikováno se svolením The Royal Swedish Academy of Sciences. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 1 Strana 1 (verze )
2 Obr. 2. Fáze hmoty. Nejobvyklejší fáze hmoty jsou plynná, kapalná a pevná fáze. Avšak v extrémně vysokých nebo nízkých teplotách se může hmota nacházet i v jiných exotičtějších fázích. Laureáti ve své práci použili znalosti z topologie, které byly pro jejich objevy rozhodující. Topologie je odvětví matematiky popisující vlastnosti, které se mění skokově. Využitím moderní topologie dosáhli laureáti překvapivých výsledků, které otevřely nová pole výzkumu a vedly k vytváření nových a důležitých konceptů v řadě oblastí fyziky. Kvantová fyzika se při nízkých teplotách stává viditelnou Při velmi nízkých teplotách se veškerá hmota řídí zákony kvantové fyziky. Plyny, kapaliny a pevné látky jsou fáze hmoty, v nichž jsou kvantové jevy často potlačeny chaotickým pohybem atomů. Avšak v oblasti extrémního chladu v blízkosti absolutní nuly ( 273 C) přechází hmota do nových podivných fází a chová se neobvyklým způsobem. Kvantová fyzika, která obvykle působí v mikrosvětě, se náhle stává viditelnou (obr. 2). 2 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 2 (verze )
3 přeměně dochází například v ledu, jenž je složen z dobře uspořádaných krystalů. Při zahřívání led taje a mění se ve vodu, chaotičtěji uspořádanou fázi hmoty. U hmoty v plochém světě ovšem nacházíme i fáze, které dosud nebyly zcela prozkoumány. Při nízkých teplotách mohou nastávat podivné jevy. Může například náhle vymizet odpor, který působí na všechny pohybující se částice. K tomu dochází třeba v supravodiči, v němž teče elektrický proud bez odporu, nebo v supratekuté kapalině, v níž víry rotují bez útlumu. Prvním, kdo se již v třicátých letech dvacátého století systematicky zabýval supratekutostí, byl ruský fyzik Petr Kapica. Ochladil helium 4, které se nachází ve vzduchu, na teplotu 271 C a zjistil, že helium teče vzhůru po stěně nádoby. Jinými slovy, chová se jako supratekutá kapalina, jejíž viskozita zcela vymizela. Kapica získal v roce 1978 Nobelovu cenu za fyziku a od té doby se v laboratořích podařilo demonstrovat řadu jiných příkladů supratekutého chování. Vedle supratekutosti helia jsou to jevy v tenkých vrstvách magnetických materiálů nebo v elektricky vodivých nanovláknech to je pouze několik příkladů z mnoha nových fází materiálů, které jsou nyní intenzivně studovány. Řešení poskytly dvojice vírů Vědci dlouho věřili tomu, že tepelné fluktuace zničí jakékoli uspořádání hmoty v plochém, dvourozměrném světě, dokonce i při absolutní nule. Neexistují-li uspořádané fáze, nemůže dojít k fázovým přechodům. Avšak na počátku sedmdesátých let se v Birminghamu ve Velké Británii sešli David Thouless a Michael Kosterlitz a zpochybnili dosavadní teorie. Pustili se společně do řešení problému fázových transformací v plochém prostoru (první ze zvědavosti a druhý z nevědomosti, jak sami prohlásili). Jejich spolupráce vyústila ve zcela nové chápání fázových transformací, které je považováno za jeden z nejvýznamnějších objevů fyziky kondenzovaných látek ve dvacátém století. Jedná se o teorii přechodů KT (Kosterlitzovy Thoulessovy přechody) nebo též přechodů BKT, kde písmeno B označuje příspěvek Vadima Berezinského, již zesnulého moskevského teoretického fyzika, který přišel s podobnými myšlenkami. Topologický fázový přechod není obvyklým přechodem, k jakému dochází mezi ledem a vodou. Zásadní roli v topologickém přechodu hrají malé víry v plochém materiálu. Při nízkých teplotách vytvářejí pevně svázané dvojice. Při vzrůstající teplotě dochází k fázové transformaci: víry se náhle od sebe oddělí a pohybují se materiálem samostatně (obr. 3). Úžasné na této teorii je to, že může být použita na různé typy materiálů s nízkou dimenzí transformace KT má univerzální charakter. Stala se užitečným nástrojem nejen ve světě kondenzovaných látek, ale také v jiných oblastech fyziky, jako např. v atomové fyzice nebo statistické mechanice. Teorie, jíž se řídí transformace KT, byla nejen rozvíjena svými tvůrci a dalšími vědci, ale byla též experimentálně potvrzena. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 3 Strana 3 (verze )
4 Obr. 3. Fázové přechody. Obvykle k nim dochází, když se jedna fáze látky mění v druhou, např. když taje led a mění se ve vodu. Kosterlitz a Thouless popsali topologické fázové přechody v tenkých vrstvách velmi chladných materiálů. Při nízkých teplotách víry vytvářejí dvojice, které se při teplotě fázového přechodu náhle rozdělí. Jedná se o jeden z nejvýznamnějších objevů ve fyzice kondenzovaných látek ve dvacátém století. Tajemné kvantové skoky Fyzikální experimenty vedly k objevu nových stavů hmoty, které vyžadovaly vysvětlení. V osmdesátých letech David Thouless spolu s Duncanem Haldanem zveřejnili novou přelomovou teoretickou práci, která zpochybnila dosavadní teorie, mj. i kvantověmechanickou teorii elektrické vodivosti. Tato teorie byla původně vyvinuta ve třicátých letech a o několik desetiletí později byla považována za plně pochopenou. Bylo tedy velkým překvapením, když v roce 1983 David Thouless dokázal, že předchozí teorie byla neúplná, a že při nízkých teplotách a v silných magnetických polích je třeba použít jiný typ teorie založený na topologickém přístupu. Zhruba v téže době došel Duncan Haldane k podobnému a podobně neočekávanému závěru při analýze řetízků magnetických atomů. Jejich práce posloužila jako nástroj v následujícím dramatickém vývoji teorie nových fází hmoty. Tajemný jev, který David Thouless teoreticky popsal s využitím topologie, je kvantový Hallův jev. Byl objeven německým fyzikem Klausem von Klitzingem, který za něj získal Nobelovu cenu za fyziku v roce Klitzing studoval tenké vodivé vrstvy mezi dvěma polovodiči, v nichž ochladil elektrony na několik kelvinů nad absolutní nulou a působil na ně silným magnetickým polem. Ve fyzice není neobvyklé, že při snížení teploty dochází k některým drastickým jevům. Mnohé materiály se například stávají magnetickými, poněvadž všechny malé atomové magnety v materiálu se náhle otočí stejným směrem a vznikne tak silné magnetické pole, které může být změřeno. Avšak kvantový Hallův jev je k pochopení mnohem složitější. Ukazuje se, že elektrická vodivost ve vrstvách může nabývat pouze určitých hodnot, které jsou nesmírně přesné, což je jinak ve fyzice neobvyklé. Měření poskytují naprosto tytéž výsledky, 4 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 4 (verze )
5 Obr. 4. Topologie. Toto odvětví matematiky se zabývá vlastnostmi, které se mění stupňovitě, jako počet otvorů na zobrazených objektech. Topologie představuje klíč k objevům, které učinili laureáti Nobelovy ceny. Vysvětluje, proč se elektrická vodivost uvnitř tenkých vrstev mění po celočíselných skocích. i když se mění teplota a magnetické pole nebo množství příměsí v polovodiči. Změní-li se dostatečně magnetické pole, změní se rovněž vodivost vrstvy, avšak jen ve skocích. Při snižování intenzity magnetického pole vzroste elektrická vodivost přesně dvakrát, poté třikrát, pak čtyřikrát atd. Tyto celočíselné skoky nebylo možno vysvětlit na základě tehdejších znalostí, David Thouless však nalezl řešení této záhady pomocí topologie. Řešení pomocí topologie Topologie popisuje vlastnosti, které zůstávají neměnné, i když je objekt natažen, zkroucen nebo zdeformován. Topologicky náleží koule a miska do stejné kategorie, poněvadž kus jílu ve tvaru koule může být vytvarován do misky. Šálek na kávu s ouškem nebo bagel (donut či anuloid) s otvorem uprostřed patří do jiné kategorie, ale mohou být deformovány tak, že tvar jednoho přejde v druhý. Topologické objekty mohou obsahovat jeden otvor, dva či jiný celočíselný počet otvorů. To může být užitečné při popisu elektrické vodivosti zjištěné v kvantovém Hallově jevu, která se může měnit pouze po skocích, jež jsou přesné násobky celých čísel (obr. 4). Při kvantovém Hallově jevu se elektrony pohybují relativně volně a vytvářejí něco, čemu se říká topologická kvantová kapalina. Podobně jako se často objevují nové vlastnosti, když se shromáždí mnoho částic, tak i elektrony v topologické kvantové kapalině vykazují překvapivé vlastnosti. Stejně jako nemůžeme zjistit, zda je v kávovém šálku otvor, zkoumáme-li jen jeho malou část, nelze ani určit, tvoří-li elektrony topologickou kvantovou kapalinu, pozorujeme-li pouze několik z nich. Vodivost však popisuje kolektivní pohyb elektronů a v důsledku topologie se mění po skocích, je kvantovaná. Další Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 5 Strana 5 (verze )
6 zajímavostí topologické kvantové kapaliny jsou neobvyklé vlastnosti jejího okraje. Ty byly předpověděny nejprve teoreticky a později potvrzeny experimentálně. Dalším milníkem se stal rok 1988, kdy Duncan Haldane zjistil, že topologické kvantové kapaliny podobné té, která vzniká při kvantovém Hallově jevu, se mohou vytvářet v tenkých polovodičových vrstvách i bez přítomnosti magnetického pole. Prohlásil, že nikdy nesnil o tom, že by se jeho teoretický model mohl potvrdit experimentálně. K tomu došlo v roce 2014 při experimentu, v němž byly použity atomy ochlazené téměř k absolutní nule. Nové topologické materiály Duncan Haldane ve své starší práci z roku 1982 vyslovil předpověď, která překvapila i odborníky. V teoretické studii řetízků magnetických atomů, které se vyskytují v některých materiálech, objevil, že tyto řetízky mají zásadně odlišné vlastnosti v závislosti na charakteru atomových magnetů. V kvantové fyzice existují dva typy atomových magnetů, liché a sudé. Haldane ukázal, že řetízky vytvořené ze sudých magnetů jsou topologické, zatímco řetízky z lichých magnetů jimi nejsou. Podobně jako u topologických kvantových kapalin nelze určit, zda je řetízek atomů topologický, pouhým zkoumáním jeho malé části. A tak jako v případě kvantové kapaliny se topologické vlastnosti projevují na okrajích řetízku v tomto případě na jeho koncích, poněvadž kvantová vlastnost známá jako spin se zde půlí. Zpočátku Haldanovým úvahám o atomových řetízcích nikdo nevěřil; vědci byli přesvědčeni, že těmto objektům již dokonale rozumějí. Ukázalo se však, že Haldane objevil první příklad nového druhu topologických materiálů, jejichž studium je nyní předmětem výzkumu ve fyzice kondenzovaných látek. Kvantové Hallovy kapaliny i magnetické atomové řetízky jsou součástí nové skupiny topologických stavů. Později výzkumníci objevili několik jiných neočekávaných topologických stavů hmoty, a to nejen v řetízcích nebo v tenkých hraničních vrstvách, ale i v běžných trojrozměrných materiálech. V současnosti se diskutuje např. o topologických izolátorech, topologických supravodičích a topologických kovech. To jsou příklady oblastí, které se v posledních desetiletích staly předmětem výzkumu ve fyzice kondenzovaných látek, v neposlední řadě i kvůli naději, že topologické materiály budou použitelné pro novou generaci elektronických zařízení a supravodičů nebo pro budoucí kvantové počítače. Současný výzkum odkrývá tajemství hmoty v exotickém plochém prostoru, který objevili laureáti Nobelovy ceny za rok Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 6 (verze )
7 Stručný průvodce statistickými intervaly Martin Otava, Beerse Abstrakt. Statistické intervaly představují rozšířenou metodu k popisu nejistoty, avšak jejich přesná interpretace může být pro laika obtížná. Následující článek se zabývá třemi typy intervalů konfidenčními, predikčními a tolerančními intervaly. Každý z nich má jinou funkci a má smysl ho používat jen v jistém kontextu. Téma je představeno spíše neformálně a poskytuje čtenáři základní přehled jednotlivých typů intervalů. Důraz je kladen především na správnou interpretaci a pochopení nejčastějších chyb spojených s používáním statistických intervalů. Vlastnosti jednotlivých typů intervalů jsou demonstrovány na příkladech z farmaceutické výroby tablet. 1. Úvod Statistika je velmi často neodbornou veřejností chápána jako deskriptivní statistika popisující vlastnosti sebraného datového souboru, například pozorované maximum či napozorovaný aritmetický průměr. Popis napozorovaných dat je však jen malou částí statistiky jako disciplíny. Pokud data, která máme k dispozici, nereprezentují celou populaci (celá populace může být dostupná například v případě národního censu), pak je obvyklým cílem statistika vyhodnotit, co můžeme vyvodit o celé populaci na základě omezeného datového souboru. Příkladem mohou být nejrůznější průzkumy veřejného mínění či volebních preferencí. Takový postup vždy vyžaduje jisté předpoklady (např. skutečnost, že náš vzorek dobře reprezentuje celkovou populaci) a jakákoli tvrzení o celé populaci jsou nevyhnutelně zatížena chybou. Statistika nám umožňuje tuto nejistotu popsat a vyjádřit kvantitativně. Statistické intervaly jsou velice užitečným nástrojem při vyjadřování nejistoty. Existuje několik různých typů intervalů a každý se hodí k odpovědi na jiné otázky. Pro laika tak může být jejich interpretace obtížná. V tomto příspěvku se seznámíme s konfidenčními, predikčními a tolerančními intervaly a vysvětlíme si, jaké jsou mezi nimi rozdíly a jak je správně používat. Ukážeme, jakým způsobem konfidenční intervaly vyjadřují nejistotu při odhadu parametrů rozdělení, zatímco predikční a toleranční intervaly se zabývají předpovědí budoucích pozorování. Další rozdíl spočívá v tom, že predikční intervaly se soustředí na předpovědi pro jediné budoucí pozorování a toleranční intervaly jsou vhodné pro velké počty budoucích pozorování. Jako příklad pro demonstraci vlastností jednotlivých typů intervalů nám poslouží farmaceutická výroba tablet. Přestože bude nutné zavést několik pojmů, omezíme se na jejich neformální vysvětlení za účelem zjednodušení výkladu; přesné definice lze najít v [1]. Mgr. Martin Otava, Ph.D., Janssen Pharmaceutica, Turnhoutseweg 30, 2340 Beerse, Belgie, motava@its.jnj.com Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 7 Strana 7 (verze )
8 f(x) 0,0 0,1 0,2 0,3 0,4 f(x) 0,00 0,05 0,10 0,15 0, x x Obr. 1. Příklady hustot spojitých náhodných veličin: normální rozdělení (vlevo), bimodální rozdělení (vpravo) 2. Základní pojmy 2.1. Náhodná veličina a její vlastnosti Mezi základní pojmy statistiky patří náhodné veličiny a jejich rozdělení. Náhodná veličina reprezentuje jev, o který se zajímáme, a rozdělení pak udává, jaké jsou přípustné hodnoty pro náhodnou veličinu a jaká je pravděpodobnost těchto hodnot. Příkladem nám bude farmaceutická výroba hypotetické 550 mg tablety s obsahem účinné látky 500 mg. Zakoupíme-li balení v lékárně a změříme obsah účinné látky v laboratoři, je rozumné předpokládat, že skutečná hodnota obsažená v každé tabletě bude přibližně 500 mg, ale nemělo by nás překvapit, že nemusí být přesně 500 mg. Výsledek měření tablety je pak právě náhodnou veličinou, neboť jeho hodnota není předem známa. Rozdělení této veličiny udává, jaké výsledky můžeme očekávat (a s jakou pravděpodobností). V našem případě může například z rozdělení vyplývat, že obsah účinné látky mezi 490 a 510 mg je mnohem pravděpodobnější než obsah nižší než 100 mg. Označme náhodnou veličinu jako X a její napozorovanou hodnotu jako x. Pokud měříme N = 10 tablet, výsledky měření jsou označeny x 1,..., x 10. Rozdělení spojité náhodné veličiny (jakou je právě obsah účinné látky) je reprezentováno hustotou f, tj. funkcí, jejíž integrál od a do b vyjadřuje pravděpodobnost, že veličina X má hodnotu v intervalu (a, b): P (a < X < b) = b a f(x) dx. (1) Integrál funkce na celém oboru reálných čísel se pak rovná jedné, neboť reprezentuje pravděpodobnost P ( < X < ). Příklady hustot, které by mohly reprezentovat rozdělení obsahu účinné látky, můžeme vidět na obr Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 8 (verze )
9 Střední hodnota značená µ = E(X) neformálně řečeno reprezentuje průměrnou hodnotu veličiny X a v případě spojité náhodné veličiny je opět vyjádřena integrálem E(X) = xf(x) dx. Musíme být opatrní s interpretací, neboť střední hodnota ne vždy reprezentuje hodnotu typickou či nejčastější. Obě hustoty na obr. 1 vedou ke střední hodnotě rovné 500 mg, ale v případě pravého panelu je jen velmi malá pravděpodobnost, že náhodně vybraná tableta bude mít obsah účinné látky přibližně 500 mg; mnohem pravděpodobnější jsou hodnoty kolem 498 či 502 mg. Rozptyl náhodné veličiny var(x) = E(X E(X)) 2 reprezentuje průměr z druhých mocnin odchylek realizací náhodné veličiny od její střední hodnoty. Přestože tedy obě hustoty na obr. 1 mají stejnou střední hodnotu, hustota na pravém panelu by vedla k mnohem většímu rozptylu, neboť její hodnoty se typicky nacházejí dále od střední hodnoty E(X). Hustotu na pravém panelu nazýváme bimodální, neboť má dva mody, tj. dvě lokální maxima. Jako rozdělení veličiny X pro náš příklad s obsahem účinné látky v tabletách zvolíme tzv. normální rozdělení. Hustota tohoto rozdělení má daný tvar, až na dva neznámé parametry: střední hodnotu µ = E(X) a rozptyl σ 2 = var(x), ( ) f(x; µ, σ 2 1 ) = 2σ2 π exp (x µ)2 2σ 2. (2) Známe-li parametry µ a σ 2, můžeme spočítat pravděpodobnost pro jakýkoli interval ze vzorce (1). Hustota pro µ = 500 a σ 2 = 1 je znázorněna v levé části obr. 1. Další užitečnou charakteristikou náhodné veličiny jsou její kvantily. Pro κ (0, 1) definujme 100κ% kvantil tak, že 100κ % možných hodnot veličiny X je menších než tento kvantil. Formálně je tedy kvantil z κ veličiny X taková hodnota, že P (X z κ )=κ. Dodejme, že definici v této formě lze použít pouze v případě spojitých náhodných veličin Odhady parametrů Statistická teorie odhadu se zaměřuje na odhadování parametrů rozdělení, které jsou nám neznámé. Volba konkrétního rozdělení pro popis daného jevu (tedy v našem případě volba normálního rozdělení pro obsah účinné látky) je většinou založena na nějaké předchozí zkušenosti s daným jevem a na vlastnostech náhodné veličiny X. Existují způsoby, jak ověřit, zda volba rozdělení dává smysl, či odhadnout hustotu rozdělení přímo na základě dat. Ve spoustě praktických případů jsme schopni vybrat vhodné rozdělení, ovšem jen velmi zřídka máme představu o hodnotách jeho neznámých parametrů. Ty pak musíme odhadnout na základě dat. Budeme pokračovat v našem příkladě, tedy uvažovat situaci, kdy se veličina X řídí normálním rozdělením s hustotou f(x; µ, σ 2 ), viz (2), a ani jeden z parametrů µ a σ 2 neznáme předem. Abychom byli schopni pracovat se vzorcem (1), je nutné odhadnout neznámé parametry µ a σ 2 na základě datového souboru, který máme k dispozici. Tato situace je v praxi velmi obvyklá, i když v některých případech můžeme mít o rozptylu dobrou představu na základě historických dat či pilotních studií. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 9 Strana 9 (verze )
10 Uvažujme, že máme možnost změřit N tablet. Každé měření je tedy nezávislou realizací veličiny X, jehož výsledky označíme jako x 1,..., x N. V jistém smyslu optimálním odhadem µ je pak aritmetický průměr ˆµ = X = 1 N N i=1 x i. Optimalitou je zde míněna nestrannost, konzistence odhadu a maximální věrohodnost odhadu. Neformálně řečeno nestrannost implikuje, že odhadujeme v průměru správnou hodnotu, konzistence znamená, že čím větší máme datový soubor, tím přesnější náš odhad bude, a maximální věrohodnost reprezentuje skutečnost, že odhadnutá hodnota je nejpravděpodobnější hodnotou parametru při daném datovém souboru. Zdůrazňujeme neformálnost tohoto vysvětlení a pro formální definice odkazujeme na [1]. Dodejme, že aritmetický průměr je velmi přirozeným odhadem střední hodnoty, neboť odpovídá její neformální interpretaci. Odhad ˆµ nazýváme bodovým odhadem, neboť pro konkrétní datový soubor odhadujeme hodnotu µ jedním číslem. Nicméně by nemělo být překvapení, že při opakování experimentu (tedy s jiným balením N tablet) dostaneme jinou hodnotu odhadu ˆµ, neboť závisí na tom, jaká konkrétní pozorování x 1,..., x N jsme naměřili. Vzhledem k výše zmíněné konzistenci pak také bude přesnější odhad, který vychází z dat s N = 100 tabletami, než odhad pro N = 5. Bodový odhad tedy žádným způsobem neposkytuje informace o nejistotě, kterou máme při odhadování µ. Jak uvidíme níže, tato nejistota souvisí jak s velikostí datového souboru N, tak s hodnotou rozptylu σ 2. Zcela obdobně přistupujeme k odhadu rozptylu s 2 = ˆσ 2 = 1 N N 1 i=1 (x i ˆµ) 2. Všimněme si N 1 namísto N ve jmenovateli, což zajišťuje nestrannost odhadu a souvisí s faktem, že k odhadnutí rozptylu nejprve potřebujeme odhadnout střední hodnotu. Na druhou stranu tento odhad není maximálně věrohodným odhadem rozptylu. 3. Konfidenční interval Konfidenční interval je nástroj, který umožňuje kvantifikovat nejistotu, kterou máme při odhadování parametru. Soustředíme se na interval pro µ, nicméně postup pro σ 2 by byl obdobný. Namísto jediné hodnoty ˆµ sestrojíme interval, který s pravděpodobností 1 α obsahuje skutečnou hodnotu µ. Hladinu 1 α stanovíme předem sami na základě toho, jakou nejistotu chceme v odhadu ponechat. Měříme-li obsah účinné látky v tabletách, tento interval nám poskytne informaci o nejistotě v odhadu střední hodnoty obsahu účinné látky. Dejme tomu, že změříme deset tablet a získáme bodový odhad ˆµ = 480 mg. Sice jsme odhadli, že v průměru máme o 20 mg účinné látky méně, než bychom mít měli, ale nevíme s jakou jistotou. Je pak velký rozdíl, máme-li konfidenční interval na hladině 1 α = 0,95 roven (475; 485) či (450; 510); v prvním případě máme důkazů pro menší obsah látky v tabletách výrazně více než v případě druhém, kdy interval zahrnuje i hodnoty větší než 500 mg. V případě normálního rozdělení s neznámým rozptylem lze dokázat (viz [1]), že veličina ( X µ) N/s 2 má tzv. Studentovo rozdělení s N 1 stupni volnosti. Odsud ihned plyne, že konfidenční interval sestrojíme podle vzorce [ ( X t N 1 1 α ) s 2 2 N ; X + tn 1 (1 α ) s 2 2 N ], (3) kde t N 1 (1 1 2α) je kvantilem Studentova rozdělení s N 1 stupni volnosti. Počet stupňů volnosti je jediným parametrem hustoty Studentova rozdělení, takže dosazením 10 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 10 (verze )
11 N 1 je kvantil t N 1 (1 1 2α) jednoznačně určen. Všimněme si, že interval je centrován kolem našeho bodového odhadu ˆµ a že bude tím širší, čím větší je poměr odhadu rozptylu k počtu pozorování. Také bude tím širší, čím vyšší hladiny 1 α chceme dosáhnout. To dává smysl, neboť chceme-li zvýšit pravděpodobnost, že náš interval bude obsahovat skutečnou střední hodnotu (při stejném datovém souboru) řekněme na 99 % namísto 95 %, tak bude přirozeně výsledný interval širší. Všimněme si, že µ není v tomto případě náhodné, je to parametr s jednou skutečnou hodnotou, kterou chceme odhadovat. Náhodné jsou meze našeho intervalu, neboť ty závisí na pozorovaném datovém souboru. Platí tedy sice, že P ( µ [ ( X t N 1 1 α ) s 2 2 N ; X + tn 1 (1 α ) s 2 2 N ]) = 1 α, ale zmíněná pravděpodobnost 1 α se vztahuje k opakovanému použití metody konstrukce konfidenčního intervalu a ne k jednomu určitému intervalu. To znamená, že budeme-li pro různé datové soubory počítat konfidenční intervaly na hladině 1 α = 0,95, v 95 % případů budou tyto intervaly obsahovat i skutečnou hodnotu µ. Ve zbývajících 5 % případů může být skutečná hodnota µ velmi daleko od hranic konfidenčního intervalu. Je proto třeba být opatrný a nesklouzávat k mylným interpretacím, že skutečná hodnota µ bude poblíž středu intervalu. Porozumění odstavci výše je klíčové pro správné použití konfidenčního intervalu. Demonstrujme jeho důsledky na našem příkladě. Předpokládejme, že skutečná hodnota je µ = 499 mg a že budeme měřit tisíc balení tablet. Z každého balení vezmeme N = 10 tablet, změříme obsah účinné látky a vypočítáme konfideční interval na hladině 1 α = 0,95; budeme tedy mít tisíc intervalů, jeden pro každý datový soubor deseti tablet. Očekáváme potom, že přibližně 950 intervalů (tj. 95 %) bude obsahovat skutečnou hodnotu µ = 499 mg. Zbývajících 50 intervalů tuto hodnotu nebude obsahovat a může být od ostatních intervalů velmi daleko. Stejný výsledek bychom očekávali pro jakoukoli hodnotu N. S rostoucí hodnotou N bude příslušný konfidenční interval užší, neboť je konstruován tak, aby vždy obsahoval skutečnou hodnotu µ pouze v 95 % případů. Pro všechna reálná x platí vztah lim N t N 1 (x) = z x, kde z je kvantil normálního rozdělení se střední hodnotou 0 a rozptylem 1. Ze vzorce (3) vyplývá, že s N jdoucím do nekonečna konvergují oba krajní body intervalu k hodnotě µ (kvantil Studentova rozdělení konverguje ke konstantě, stejně tak s 2 ). Velmi důležitým postřehem je fakt, že konfidenční interval sestrojujeme pro parametry rozdělení, jako jsou rozptyl σ 2 či střední hodnota µ. Nedává nám ovšem žádnou informaci o individuálních napozorovaných hodnotách veličiny jako takových. Například konfidenční interval pro µ bychom v případě tablet rádi viděli okolo 500 mg, což je požadovaný obsah. I kdyby však byl tento interval (499; 501), neznamená to, že pacienti budou dostávat kvalitní produkt, neboť obsah v jednotlivých tabletách je náhodná veličina s normální hustotou, která závisí na obou parametrech µ a σ 2, a pokud by měla velký rozptyl, může být obsah účinné látky velmi daleko od střední hodnoty. Tato skutečnost je jasná při pohledu na levou část obr. 1. Konfidenční interval (499; 501) by byl soustředěn velmi blízko okolo skutečné hodnoty µ = 500 mg, ale obsahoval by jen velmi malou část hustoty, tj. jen velmi málo budoucích pozorování. Čím je konfidenční interval přesnější, tím méně budoucích pozorování je v něm obsa- Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 11 (verze )
12 ženo. Pokud by navíc rozdělení účinné látky v tabletách mělo hustotu podobnou té v pravé části obr. 1, byl by nám přesný odhad střední hodnoty ještě méně užitečný, pokud bychom se zajímali o jednotlivá pozorování z tohoto rozdělení. Zatímco střední hodnota je rovna 500 mg, jednotlivá pozorování účinné látky jsou soustředěna kolem 498 a 502 mg. Pokud se budeme zajímat o typické hodnoty obsahu účinné látky v jednotlivých tabletách, musíme pracovat s predikčním intervalem, který se zaměřuje na celou hustotu, nejen na jednotlivé parametry. 4. Predikční interval Predikční interval obsahuje s danou pravděpodobností 1 α jedno příští pozorování veličiny X. Budoucí pozorování x N+1 je opět realizací veličiny X s neznámými parametry µ, σ 2, které odhadujeme pomocí pozorování x 1,..., x N. Predikční interval vezme v úvahu nejistotu odhadu parametrů obdobným způsobem jako konfidenční interval; výsledkem je interval, který bude obsahovat příští pozorování veličiny X s požadovanou jistotou. Na rozdíl od konfidenčního intervalu, který popisuje vlastnost napozorovaného souboru (odhaduje skutečnou střední hodnotu), predikční interval předpovídá budoucí pozorování. V případě tablet by predikční interval pomohl vyřešit následující otázku: jakou dávku účinné látky bude mít příští tableta (například ta, kterou se chystáme podat pacientovi jako lék) na základě souboru těchto deseti naměřených tablet? Tato otázka je velmi důležitá, neboť mnoho analytických testů je destruktivních. To znamená, že nemůžeme přímo změřit tabletu, kterou se chystáme podat pacientovi, ale o její kvalitě můžeme uvažovat pouze nepřímo. V případě normálního rozdělení s neznámým rozptylem lze dokázat (viz [1]), že veličina (X N+1 X) N/(s 2 (N + 1)) má Studentovo rozdělení s N 1 stupni volnosti. Odtud plyne, že predikční interval pro µ sestrojíme dle vzorce [ ( X t N 1 1 α ) s s2 N ; X + tn 1 (1 α ) s s2 N ]. (4) Všimněme si podobnosti se vzorcem (3); jediným rozdílem je přičtení odhadu rozptylu s 2 pod odmocninou. Neformálně řečeno tedy sestrojíme konfidenční interval pro střední hodnotu a pak interval rozšíříme na základě odhadnutého rozptylu tak, aby obsahoval jednotlivá pozorování. Dodejme, že interval je opět centrován kolem bodového odhadu střední hodnoty ˆµ = X a bude tím širší, čím větší je s 2 a čím méně máme pozorování N. Pro predikční interval sestrojený na hladině 1 α pak platí P ( X N+1 [ ( X t N 1 1 α ) s s2 N ; X + tn 1 (1 α ) s s2 N ]) = 1 α. Na rozdíl od konfidenčního intervalu krajní body predikčního intervalu nekonvergují k jediné hodnotě, ale s přibývajícím počtem pozorování se blíží k hodnotám kvantilů normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Tedy např. pro 1 α = 0,95 konverguje interval k takovým hodnotám, mezi kterými se integrál hustoty rovná 0,95 12 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 12 (verze )
13 a které jsou symetrické vzhledem ke střední hodnotě. Tento fakt vede k časté mylné interpretaci predikčního intervalu v tom smyslu, že obsahuje 95 % budoucích pozorování. Tuto vlastnost predikční interval bohužel nemá a vždy musí být interpretován pouze pro jedno budoucí pozorování. Pro 1 α = 0,95 pak vychází pravděpodobnost 95 %, obdobně jako u konfidenčního intervalu, z opakovaného použití metody a ne z kvantilu rozdělení. Interpretujeme ji tak, že máme 95% pravděpodobnost, že napozorujeme soubor x 1,..., x N, x N+1 takový, že sestrojíme-li interval na základě prvních N pozorování, bude obsahovat i pozorování poslední. Tato interpretace je patrná ze vzorce na předchozí straně. Ve zbývajících 5 % pak buď nastává situace, že x N+1 je odlehlé pozorování, nebo situace, že prvních N pozorování vedlo ke konstrukci intervalu, který je daleko od skutečných kvantilů (tedy obdobně jako 5 % konfidenčních intervalů neobsahuje skutečnou střední hodnotu). Takový špatně zkonstruovaný interval bude přirozeně obsahovat jen velmi málo budoucích pozorování. Obecně nejčastější mylná interpretace intervalů je právě nepochopení vztahu mezi 1 α a opakovaným použitím metody. Demonstrujme proto použití intervalu na hypotetické situaci. Předpokládejme opět, že skutečná hodnota µ = 499 mg a že budeme měřit tisíc balení tablet. Z každého balení vezmeme jedenáct tablet a pro N = 10 tablet změříme obsah účinné látky a vypočítáme predikční interval na hladině 1 α = 0,95; budeme tedy mít tisíc intervalů, jeden pro každý datový soubor deseti tablet. Poté změříme jedenáctou tabletu a ověříme, zda se bude nacházet v daném predikčním intervalu. Očekáváme, že přibližně 950 intervalů (tj. 95 %) bude obsahovat hodnotu jedenácté tablety x 11. Zbývajících 50 intervalů tuto hodnotu neobsahuje a může být od této hodnoty velmi daleko. Obdobný výsledek bychom očekávali pro jakoukoli hodnotu N. Z výše uvedeného vyplývá, že můžeme predikční interval použít v případě, kdy se zajímáme pouze o jednu konkrétní tabletu, kterou chceme v budoucnu použít. Přístup však může být rozšířen a můžeme sestrojit i predikční intervaly pro k budoucích tablet. V případě, že bychom uvažovali velký počet budoucích pozorování, vede takové rozšíření k tolerančnímu intervalu. 5. Toleranční interval Toleranční intervaly jsou rozšířením predikčních intervalů pro velký počet budoucích pozorování. Typickou aplikací je farmaceutická výrobní linka, která produkuje miliony tablet, a nás zajímá, jestli bude mít dostatečný počet budoucích tablet odpovídající kvalitu. Cílem je sestrojit takový interval, který bude obsahovat 100β % budoucích pozorování, pro předepsané β (0, 1) s danou pravděpodobností 100(1 α) %. Například tedy konstruujeme interval, který s 95% jistotou bude obsahovat 99 % budoucích pozorování. Obdobně jako v předchozích případech je 95% jistota interpretována v opakovaném použití metody, zatímco 99 % opravdu znamená odpovídající podíl budoucích pozorování. Pokud tedy metodu budeme používat opakovaně, v 95 % případů použití metody bude výsledný toleranční interval obsahovat 99 % budoucích pozorování. Toleranční interval je řešen sestrojením konfidenčních intervalů na hladině 1 α pro kvantily, které mezi sebou obsahují 100β % pozorování. Hodnota α pak vyjadřuje nejistotu v odhadu těchto kvantilů. Odhadování kvantilů není jednoduchou záležitostí, neboť přesnost odhadu je velice nízká, pokud nemáme opravdu velké množství pozoro- Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 13 (verze )
14 vání. Proto jsou toleranční intervaly často velice široké a konvergují ke kvantilům jen velmi pomalu. Problém je, že přesnost odhadu kvantilů klesá, čím blíže je β k jedné. Právě vysoké hodnoty β jsou ovšem v praxi nutné, neboť obvykle požadujeme záruku ohledně kvality vysokého podílu produktů. Sestrojit oboustranný toleranční interval není jednoduché ani pro normální rozdělení. Konstrukce totiž vychází ze dvou konfidenčních intervalů na hladině 1 α pro 1 β/2 a β/2 kvantily (které mezi sebou podle definice mají 100β % pozorování). Tyto dva konfidenční intervaly musíme nějakým způsobem spojit v jeden toleranční interval. Řešení takového problému není jednoznačné a i pro toleranční interval symetrický kolem odhadu střední hodnoty X existují pouze přibližná řešení. V případě normálního rozdělení s neznámou střední hodnotou a rozptylem lze toleranční interval odhadnout dle [3] jako [ X z1 β/2 s2 k; X + z1 β/2 s2 k], (5) kde k = (N 1 + N 1 N ) χ N 3 χ2 1 α,n 1 1 α,n 1 2(N + 1) 2. (6) Povšimněme si, že vzorec se výrazně liší od vzorců (3) a (4). Prvním rozdílem je přítomnost z 1 β/2 kvantilu normálního rozdělení namísto Studentova rozdělení. Všimněme si však, že kvantil je zde závislý na β (a nikoliv na α) a souvisí tedy s tím, že budoucí pozorování pochází z normálního rozdělení. Hodnota α se ve vzorci objevuje u dalšího kvantilu, tentokrát χ 2, tzv. chí-kvadrát rozdělení, které souvisí s rozdělením odhadu rozptylu normálního rozdělení. Ze vzorce (5) vidíme, že centrovanost kolem bodového odhadu střední hodnoty zůstává. Při bližším prozkoumání vzorce (6) by pak bylo zřejmé, že pro dané β bude interval tím širší, čím vyšší bude odhadnutý rozptyl s 2 a požadovaná hladina 1 α a čím menší bude počet pozorování N použitých k sestrojení intervalu. Uvažujme toleranční interval s mezemi označenými A, B. Tyto meze jsou náhodnými veličinami, neboť sestrojení intervalu jakoukoli metodou bude záviset na napozorovaných hodnotách X 1,..., X N, a jejich plný zápis by byl A(X 1,..., X N ) a B(X 1,..., X N ). Platí pak, že při opakovaném použití dané metody k sestrojení tolerančního intervalu, bude 100β % pozorování obsaženo v tolerančním intervalu s pravděpodobností 1 α: ( ) B P (P (X [A; B]) β) = P f(x; µ, σ 2 )dx β = 1 α. (7) Interval sestrojený dle vzorce (5) splňuje tuto rovnici jen přibližně, neboť se jedná o aproximaci. Dodejme, že v praxi se vzorec (5) využívá zřídka, neboť díky numerickým metodám lze získat přesnější aproximaci tolerančního intervalu řešením rovnice (7). Detaily o tomto přesnějším řešení lze nalézt v [4]. Podobně jako krajní body predikčního intervalu konvergují krajní body tolerančního intervalu s přibývajícím počtem pozorování k hodnotám kvantilů normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Avšak na rozdíl od predikčního intervalu, jehož krajní body konvergují ke kvantilům odpovídajícím hladině 1 α, krajní body A 14 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 14 (verze )
15 tolerančního intervalu konvergují ke kvantilům odpovídajícím požadované proporci populace β. Toleranční intervaly totiž vychází z 100(1 α)% konfidenčních intervalů 100β/2% a 100(1 β/2)% kvantilů; jak již bylo uvedeno výše, konfidenční intervaly konvergují k jedinému číslu, tj. v tomto případě k příslušnému kvantilu. Použijme následující hypotetickou situaci k demonstrování interpretace tolerančního intervalu. Uvažujme, že máme tisíc datových souborů z normálního rozdělení a pro každý datový soubor sestrojíme toleranční interval s jistotou 95 % pro 99 % budoucích pozorování. Poté vygenerujeme tisíc nových hodnot pro každý datový soubor a zkontrolujeme, kolik z nich se nachází v příslušném tolerančním intervalu. Přibližně 950 intervalů by mělo obsahovat alespoň 990 nových pozorování. Předpokládejme nyní, že budeme mít k dispozici 1010 tablet pro každý ze sto výrobních dní. Pro prvních N = 10 tablet změříme obsah účinné látky a vypočítáme toleranční interval na hladině 1 α = 0,95 a pro β = 0,99; budeme tedy mít sto intervalů, jeden pro každý datový soubor deseti tablet z jednoho výrobního dne. Poté změříme zbývajících tisíc tablet v každém dni a ověříme, kolik hodnot se nachází v příslušném tolerančním intervalu. Očekáváme, že přibližně 95 intervalů (tj. 95 %) bude obsahovat alespoň 990 (tj. 99 %) tablet. Zbývajících 5 intervalů bude obsahovat nižší počet budoucích tablet. Obdobný výsledek bychom očekávali pro jakoukoli hodnotu N. 6. Diskuze Ukázali jsme tři druhy statistických intervalů, které se používají k vyjádření nejistoty při odhadování náhodné veličiny na základě datového souboru. Je důležité si uvědomit, že tři prezentované intervaly se liší v konstrukci a v tom, jakému slouží účelu. Konfidenční intervaly dávají informace o nejistotě při odhadu parametrů rozdělení. Predikční intervaly kvantifikují nejistotu v předpovědi jedné budoucí napozorované hodnoty a toleranční intervaly rozšiřují předpověď na velké množství budoucích pozorování. Na příkladu obsahu účinné látky v tabletách konfidenční intervaly vyjadřují nejistotu v odhadu střední hodnoty a rozptylu normálního rozdělení, kterým se hodnoty v tabletách řídí. Predikční intervaly pomohou popsat nejistotu ohledně obsahu účinné látky v tabletě, kterou se chystáme podat pacientovi. Konečně, toleranční intervaly vyjadřují, jakou nejistotu máme o obsahu účinné látky v jednotlivých tabletách při výrobě velkého množství tablet. Nesprávné použití těchto intervalů je bohužel častým jevem a může vést k velmi zavádějícím výsledkům. Pro 95% konfidenční intervaly je důležité si pamatovat, že sice v 95 % skutečnou hodnotu µ obsahují, ale že ve zbývajících 5 % mohou být zcela špatně. Predikční intervaly je pak třeba vždy interpretovat ve vztahu k jednomu jedinému budoucímu pozorování. Pro toleranční intervaly je dobré mít na paměti, že mohou být velmi široké jen kvůli tomu, že odhad kvantilů byl velmi nepřesný (především pokud chceme hodnotu β blízko jedné) a že je třeba mít pro jejich přesný odhad mnohem víc pozorování N, než v případě konfidenčních a predikčních intervalů. Náhodná veličina uvažovaná v tomto příspěvku měla normální rozdělení. Samozřejmě veškeré prezentované intervaly lze zkonstruovat pro jakákoli rozdělení. V případě spojitých veličin bude přístup obdobný, ovšem v případě diskrétních veličin může být situace výrazně složitější a některé prezentované definice vyžadují úpravu (například definice kvantilů). Diskrétní veličiny jsou takové, které nabývají jedné z konečně či Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 15 (verze )
16 spočetně mnoha hodnot (například výsledek hodu mincí, počet dětí či počet přístupů na internetovou stránku). Samozřejmě, i pro tyto veličiny můžeme zkonstruovat výše popsané intervaly a jejich interpretace bude obdobná jako ve výše popsaném případě normálního rozdělení. Dále mohou být statistické intervaly rozšířeny pro vícerozměrný případ na tzv. statistické oblasti. Dodejme pro úplnost, že intervaly popisované v tomto příspěvku vychází z frekventistického pojetí statistiky. Bayesovská statistika umožňuje odhadnout intervaly obdobného typu, nicméně jejich interpretace se liší vzhledem k jinému pohledu na parametry a pravděpodobnost jako takovou. Při interpretaci výsledků mohou být rozdíly poměrně podstatné, ale jejich vysvětlení by bylo materiálem pro samostatný příspěvek, a proto jsme se bayesovskému přístupu v tomto článku nijak nevěnovali. Pro další studium problematiky statistických intervalů doporučujeme např. [2] a [4]. Poděkování. Autor děkuje za užitečné komentáře, které přispěly k výraznému vylepšení článku, RNDr. Jiřímu Dvořákovi, Ph.D., a Mgr. Čeňku Jirsákovi. Za korekturu patří poděkování Marii Staré. L i t e r a t u r a [1] Anděl, J.: Statistické metody. MatfyzPress, Praha, [2] Hahn, G. J., Meeker, W. Q.: Statistical intervals: a guide for practitioners. John Wiley, [3] Howe, W. G.: Two-sided tolerance limits for normal populations. J. Amer. Statist. Assoc. 64 (1969), [4] Krishnamoorthy, K., Mathew, T.: Statistical tolerance regions. John Wiley, New Jersey, Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 16 (verze )
17 Globální obálkové testy aneb jak otestovat vhodnost statistického modelu na základě funkcionální charakteristiky Tomáš Mrkvička, České Budějovice Abstrakt. Obálkové metody představují populární nástroj pro testování hypotéz o vhodnosti statistického modelu. Tyto testy graficky porovnávají funkci T : I R vypočtenou ze statistických dat s jejím protějškem získaným simulacemi. Chyba prvního druhu α, tj. pravděpodobnost zamítnutí platné hypotézy, je obvykle kontrolována pouze pro fixní hodnotu r I, zatímco funkce T je definována na intervalu hodnot I. V tomto článku představíme nový globální obálkový test, který umožňuje kontrolovat chybu prvního druhu současně pro všechny hodnoty z intervalu I pomocí tzv. globální obálky, která je přímo provázána s výslednou p-hodnotou testu. Použití obálkového testu ilustrujeme na příkladu zkoumání interakcí mezi částicemi v rovině. 1. Úvod Při analýze statistických dat se v současné době pracuje s velmi komplexními matematickými modely. Obvykle chceme otestovat, zda zvolený model skutečně odpovídá naměřeným datům. Abychom mohli takový test provést, musíme nejprve zvolit testovou statistiku, která je schopná identifikovat, zda naše data odpovídají modelu. V nejjednodušších případech se jako testová statistika používá jednorozměrná charakteristika (číslo spočtené z dat, např. testová statistika T u Studentova t-testu). Ta ovšem bývá v dnešní době často nedostačující, a proto je nutné uvažovat statistiky vícerozměrné (vektorové), nebo dokonce funkcionální (tj. funkce T : I R, kde I R d ). Při jejich použití se test vlastně skládá z řady samostatných jednorozměrných podtestů, které jsou vzájemně korelované (hovoří se o problému mnohonásobného porovnávání). V tomto článku shrneme některé metody, které řeší problém testování vhodnosti modelu při použití vícerozměrné nebo funkcionální charakteristiky jako testovací statistiky. Tyto metody navíc poskytují tzv. globální obálky, které umožňují grafickou interpretaci výsledku testu. V článku ukážeme, jak provádět globální obálkové testy na příkladu bodového procesu, tyto metody se ovšem dají využít v mnoha jiných oblastech, např. v časových řadách, v geostatistice, k testování modelů distribučních funkcí, v analýze funkcionálních dat atd. Bodovým procesem rozumíme náhodnou konfiguraci bodů v prostoru [4] Doc. RNDr. Tomáš Mrkvička, Ph.D., Katedra aplikované matematiky a informatiky, Ekonomická fakulta JU v Českých Budějovicích, Studentská 13, České Budějovice, mrkvicka.toma@gmail.com Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 17 (verze )
18 Obr. 1. Vzorek nitromembránových částic pozorovaný v okně velikosti pixelů (336 nm 336 nm) a pro jednoduchost budeme uvažovat jen rovinný bodový proces. Příklad realizace bodového procesu je na obr Jednorozměrný Monte Carlo test Obr. 1, který v dalším textu použijeme jako ilustrační příklad, ukazuje prostorové umístění nitromembránových částic mitochondrických membrán z HeLa buněk, a to konkrétně jednoho vzorku kontrolní skupiny převzatého ze studie [3]. HeLa buňky jsou nádorové buňky děložního hrdla. Otázka, která nás zajímá, je, zda částice mezi sebou interagují, případně jaký typ interakce vykazují. Jako model, který může tuto otázku zodpovědět, zvolíme Poissonův bodový proces, který popisuje body, jež jsou úplně náhodně rozmístěné v prostoru. To znamená, že počet bodů v libovolné podmnožině B uvažované oblasti má Poissonovo rozdělení s parametrem daným jako λ-násobek obsahu množiny B, kde λ je tzv. intenzita procesu (vyjadřuje střední počet bodů v množině o jednotkovém obsahu). Dále platí, že počet bodů v množině B je nezávislý na počtu bodů v jiných, disjunktních množinách. Tento model nevykazuje žádné interakce mezi částicemi. Nulová hypotéza, kterou budeme testovat, je, zda uvedená data mohou být modelována Poissonovým bodovým procesem. Nejpoužívanější funkcionální charakteristikou bodových procesů je tzv. Ripleyho K-funkce, K(r) = E(N r )/λ, kde N r je počet bodů do vzdálenosti r od náhodného bodu, E označuje střední hodnotu a λ je intenzita procesu. Normovaná, centrovaná K-funkce se označuje jako L-funkce a je definována vztahem L(r) = K(r)/π r. Pro Poissonův proces platí L(r) 0. Jestliže pro malá r je L(r) > 0, pak lze ve vzorku identifikovat shluky bodů. Pokud naopak pro malá r platí L(r) < 0, pozorujeme ve vzorku odpuzující chování bodů. 18 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 18 (verze )
19 5 L(r) r Obr. 2. Čárkovaně je zobrazena hranice obálky, tj. maximum a minimum spočtené z 99 simulací L-funkce. Plná čára zobrazuje L-funkci spočtenou z dat na obrázku 1. Jako jednorozměrnou testovou statistiku můžeme použít např. hodnotu L(R) pro konkrétní vzdálenost R. Monte Carlo test pak proběhne tak, že nasimulujeme s Poissonových bodových procesů a z nich spočteme s testových statistik L 1 (R),..., L s (R). Patří-li pak L(R) mezi 2,5 % největších nebo 2,5 % nejmenších hodnot, zamítneme nulovou hypotézu na hladině významnosti 5 % (tj. s chybou prvního druhu 5 %). V uvedeném příkladě je zjevným nedostatkem fakt, že bereme v úvahu pouze jednu vzdálenost R. Vezmeme-li v úvahu více hodnot R, nastane problém s vícenásobným porovnáváním. A právě řešení tohoto problému se budeme dále věnovat. Na obr. 2 je pro úplnost zobrazena průzkumná metoda, jež se často používala před zavedením globálních obálek. Hranici obálky zde tvoří maximum a minimum z 99 funkcí L získaných simulacemi Poissonova procesu. Pro pevně zvolené R platí, že pokud L(R) neleží v intervalu určeném obálkou, pak můžeme zamítnout nulovou hypotézu na hladině významnosti α = 2 % (dle jednorozměrného Monte Carlo testu spočteného na základě 99 simulací). Problém nastává, jestliže se graf pozoruje jako celek a ze skutečnosti, že L(r) je mimo zobrazenou obálku pro nějaké r I, se vyvozují závěry o zamítnutí nulové hypotézy. Takové tvrzení může mít hladinu významnosti α značně velikou; konkrétní příklady ukazují, že α může narůst až přes 60 %. Toto zjištění rozpoutalo vlnu studií, které vedly k zavedení globálních obálek. 3. Pořadový obálkový test Pořadový obálkový test zavedený poprvé v [1] poskytuje globální obálku a zároveň p-hodnotu testu. Globální obálka vytvořená v rámci ilustračního příkladu je zobrazena na obr. 3. Vidíme zde testovou funkci spočtenou na základě zkoumaných dat (plná čára) a 95% globální obálku spočtenou ze simulací testové funkce za předpokladu nulové hypotézy. Jestliže funkce spočtená z dat vystupuje z globální obálky, dostáváme Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 19 (verze )
20 důkaz o neplatnosti nulové hypotézy na hladině významnosti 5 %. Navíc zde můžeme pozorovat, pro které hodnoty argumentu r jsou data mimo globální obálku. Pořadový obálkový test je plně neparametrický, tudíž není senzitivní na změny rozdělení v testové statistice T (r) pro různá r I (kde I je množina hodnot r, které vstupují do testu). Všechny hodnoty r, které bereme v potaz, mají v testu stejnou váhu. Tato vlastnost umožňuje konstrukci testu na základě několika testových funkcí zároveň, jak bylo navrženo v článku [2]. V tomto spojeném testu mají všechny testové funkce stejnou váhu, což vede k mnoha zajímavým aplikacím testu. Popišme nyní v krátkosti zmíněný test. Detaily je možné dohledat v originálních publikacích. Předpokládejme, že máme testovou funkci T 1 : I R, která je spočtená z dat, a soubor simulací T 2,..., T s+1 : I R získaných za předpokladu nulové hypotézy. Definujme k-tou horní a dolní pořadovou obálku jako T (k) low (r) = mink i=1,...,s+1t i (r), T (k) upp(r) = max k i=1,...,s+1t i (r), k = 1,..., s/2, kde min k a max k označují k-té nejmenší a největší hodnoty. Potom extrémní pořadí R i je největší k takové, že T (k) low (r) T i(r) T (k) upp(r) pro všechna r I. Velká hodnota R i říká, že funkce T i je centrální funkcí v souboru {T 1,..., T s+1 }, zatímco malá hodnota R i znamená extrémnost. Přesné pořadí R 1 mezi všemi hodnotami R 1,..., R s+1 nemůžeme vždy určit, neboť některé hodnoty se mohou shodovat. Můžeme ale definovat nejmenší p-hodnotu, označovanou jako liberální, a největší p-hodnotu, označovanou jako konzervativní (symbol 1 označuje indikátorovou funkci): p = 1 s+1 1(R i < R 1 ) a p + = 1 s+1 1(R i R 1 ). s + 1 s + 1 i=1 Výsledkem testu pak není jediná p-hodnota, ale p-interval (p, p + ]. Pro hladinu spolehlivosti α p + dojde k zamínutí nulové hypotézy, zatímco pro α < p k jejímu nezamítnutí (viz níže). 100 (1 α)% globální obálka se konstruuje následovně: Nechť t k je počet simulací T i, upp(r) pro všechna r I. Pak i {1,..., s + 1}, pro které T (k) low (r) T i(r) T (k) 100 (1 α)% globální obálka je dána kritickými hranicemi T (kα ) upp a T (kα ) low, kde kα je největší k, pro něž t k /(s + 1) 1 α. Grafická interpretace testu, která odpovídá interpretaci dané p-intervalem, je následující: Jestliže se graf T 1 nebo jeho část nachází mimo 100 (1 α)% globální obálku, potom p + α a nulová hypotéza je zamítnuta na předepsané hladině testu α. Jestliže graf T 1 leží uvnitř 100 (1 α)% globální obálky a nedotýká se její hranice, potom p > α a nulová hypotéza není zamítnuta. Jestliže graf T 1 leží uvnitř obálky a dotýká se její hranice, potom p α < p + a rozhodnutí je v šedé zóně. i=1 20 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 20 (verze )
21 5 L(r) r Obr. 3. Pořadový obálkový test nulové hypotézy odpovídající tvrzení, že Poissonův proces je vhodným modelem pro nitromembránová data. Test byl proveden na základě 4999 simulací. Šedá oblast ukazuje 95% globální obálku. Jeden možný přístup k řešení problému šedé zóny je založen na zjemnění výše definovaného extrémního pořadí R i ; detaily lze najít v [1]. Obr. 3 ukazuje grafický výsledek pořadového obálkového testu, zkoumajícího vhodnost Poissonova modelu pro data z obr. 1. Vhodnost modelu je jednoznačně zamítnuta, jelikož testová funkce spočtená z dat je mimo globální obálku. Navíc ovšem získáváme informaci o tom, že částice se odpuzují pro velmi malé vzdálenosti (což je zřejmě způsobeno fyzickou velikostí částic) a naopak tvoří shluky v mezičásticových vzdálenostech okolo 75 pixelů. Tyto výsledky jsme prokázali na hladině významnosti α = 5 %, což je globální hladina svazující významnost všech podtestů reprezentovaných jednotlivými hodnotami r. 4. Složená hypotéza Pořadový obálkový test dosahuje přesně přednastavené hladiny α v případě, že nulová hypotéza je jednoduchá, tj. nezávisí na parametrech nebo jsou tyto parametry známy. Výše testovaná nulová hypotéza je ovšem složená, jelikož v rámci testování Poissonova modelu odhadujeme parametr intenzity λ. Provedený test tudíž nemá přesně zvolenou hladinu významnosti 5 %, ale je lehce konzervativní. Můžeme říci, že je pouze lehce konzervativní, jelikož procedura pro odhad parametru intenzity (počet pozorovaných bodů vydělený obsahem pozorovaného okna) je pouze slabě korelovaná s procedurou testu založenou na L-funkci, která sleduje počet sousedů typického bodu normovaný právě intenzitou. Tuto konzervativnost testu buď můžeme akceptovat, nebo provedeme tzv. upravený pořadový obálkový test [1], který tento problém vyřeší. Problém tohoto řešení ovšem spočívá v tom, že testová procedura obsahuje dvojnásobný Monte Carlo test, neboli Monte Carlo test vytvořený pro každou simulaci Monte Carlo testu. Taková procedura vyžaduje s 2 simulací, a tudíž je značně výpočetně náročná. Obr. 4 ukazuje grafický výsledek upraveného pořadového obálkového testu vhodnosti Poissonova modelu pro zkoumaná data. Výsledky jsou ve shodě s neupraveným Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 21 (verze )
22 5 L(r) r Obr. 4. Upravený pořadový obálkový test nulové hypotézy odpovídající tvrzení, že Poissonův proces je vhodným modelem pro nitromembránová data. Test byl proveden na základě simulací. Šedá oblast ukazuje 95% upravenou globální obálku. testem, jelikož rozdíl mezi oběma variantami je v tomto případě mizivý. Na druhou stranu v případě, že korelace mezi procedurou odhadu a procedurou testu je větší, může být rozdíl mezi oběma variantami testu značný. 5. Diskuze Pro některé (zejména složené) nulové hypotézy můžou simulace vyžadované testem trvat příliš dlouho. V takovém případě je možné použít aproximace pořadového testu zavedené také v článku [1], které jsou částečně parametrické a aproximují obálky pomocí kvantilů rozdělení T (r). Tento test pak vyžaduje minimálně s = 99 simulací, zatímco u pořadového testu je doporučováno alespoň s = 2499 simulací. Simulační studie provedené v článku [1] dále ukazují, že pořadový obálkový test je značně stabilní vzhledem ke změně délky intervalu I, který v testu uvažujeme. Je doporučováno zvolit za I široký interval, který pokryje celou oblast zájmu. Někdy můžeme vybrat konkrétní testovou funkci, jež je citlivá na konkrétní alternativní model, vůči kterému chceme nulovou hypotézu testovat. Nicméně častěji alternativní model není znám, tudíž neexistuje a priori nejlepší testová funkce dané nulové hypotézy. V takovém případě můžeme testy založit na více testových funkcích, jak bylo ukázáno v článku [2]. Pořadový obálkový test může být použit pro kombinaci několika testových funkcí zároveň, přičemž vrátí jednu globální p-hodnotu a kombinovanou globální obálku pro všechny funkce. Navíc simulační studie ukazují, že kombinovaný pořadový test má jen o málo menší sílu (pravděpodobnost zamítnutí neplatné nulové hypotézy) než pořadový test založený na jedné nejsilnější testové funkci, která ovšem může být určena pouze po provedení konkrétních simulačních studií. Poděkování. Autor byl finančně podporován Grantovou agenturou České republiky (projekt S). 22 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 22 (verze )
23 L i t e r a t u r a [1] Myllymäki, M., Mrkvička, T., Seijo, H., Grabarnik, P., Hahn, U.: Global envelope tests for spatial processes. J. R. Statist. Soc. B (2016), v tisku, doi: /rssb [2] Mrkvička, T., Myllymäki, M., Hahn, U.: Multiple Monte Carlo testing with applications in spatial point processes. Stat. Comput. (2016), v tisku, doi: /s [3] Schladitz, K., Särkkä, A., Pavenstädt, I., Haferkamp, O., Mattfeldt, T.: Statistical analysis of intramembranous particles using freeze fracture specimens. J. Microsc. 211 (2003), [4] Stoyan, D., Kendall, W. S., Mecke, J.: Stochastic geometry and its applications. 3. vydání, John Wiley, Chichester, Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 23 (verze )
24 Na stopě nebeské mechaniky v N-částicovém jádře Mléčné dráhy Jaroslav Haas, Praha Abstrakt. Studium dynamiky soustav vzájemně gravitačně interagujících objektů představuje velmi důležitý obor astronomie. Jednou z přirozeně používaných metod je přímé N-částicové modelování, tedy numerická integrace příslušných pohybových rovnic bez nutnosti zavádění dodatečných předpokladů o vnitřním uspořádání soustavy. Tento velice univerzální přístup je však zatížen numerickými chybami, které mohou do výsledků vnášet nežádoucí artefakty. U soustav s vhodným vnitřním uspořádáním je ale možné využít poruchových metod klasické nebeské mechaniky a nalézt pro pozorovaný vývoj N-částicových modelů fyzikální vysvětlení. Soustavy tohoto typu se ve vesmíru nacházejí v jádrech galaxií, u kterých se usuzuje na přítomnost velice hmotných černých veleděr v jejich středech. V tomto článku uvedený přístup demonstrujeme na příkladu dvou jevů popsaných pro hvězdokupu pozorovanou v jádře naší Galaxie. 1. Problém N těles Na první pohled si lze jen těžko představit jednodušší fyzikální systém, než jakým je soustava N hmotných bodů, které se vzájemně neovlivňují jinak než svou gravitační přitažlivostí. A je to právě takovýto systém, který hraje zcela zásadní roli napříč celým vesmírem na všech jeho škálách. Počínaje planetami a jejich měsíci, planetkami či celými planetárními systémy v gravitačních polích svých mateřských hvězd, přes různě rozlehlé hvězdné asociace či hvězdokupy čítající od několika desítek po miliony hvězd, až po galaxie, jejich kupy či jim ještě dále nadřazené celky. Ve všech těchto případech lze při studiu jejich dynamiky považovat jednotlivé objekty v prvních přiblíženích právě za hmotné body a celý systém se tak stává problémem N těles (byť slovo těleso navozuje dojem prostorové rozlehlosti, jedná se o ustálený název i pro případ hmotných bodů). V průběhu staletí se problém N těles stal nejprve předmětem zájmu vědní disciplíny nazývané nebeská mechanika. Přes svou poetičnost je to název velmi prostý, jelikož označuje obor zabývající se pohyby těles pozorovaných na nebi a jejich příčinami. V počátcích bylo snahou nebeských mechaniků vysvětlit pohyby těles sluneční soustavy (planet, komet či planetek), protože tyto pohyby bylo i tehdejšími přístroji možné dostatečně přesně měřit. To přirozeně ovlivnilo využívané matematické metody, včetně předpokladů podmiňujících jejich použitelnost. Tím hlavním je obvykle jistá hierarchičnost studovaného systému, kdy jedna jeho část představuje pouze malou poruchu k druhé, dominantní části, která je jednodušší a snadněji řešitelná. Příkladem může být pohyb planetky v gravitačním poli Slunce za poruchového působení planet, např. Jupiteru. Bez tohoto působení by dráha planetky byla pouze notoricky známou, RNDr. Jaroslav Haas, Ph.D., Astronomický ústav UK, Matematicko-fyzikální fakulta UK, V Holešovičkách 2, Praha 8, haas@sirrah.troja.mff.cuni.cz 24 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 24 (verze )
25 neměnnou Keplerovou elipsou se Sluncem v ohnisku. Přitažlivost Jupiteru však může vést k pomalým (vzhledem k oběžné době planetky kolem Slunce), ale systematickým tzv. sekulárním změnám tvaru a orientace dráhy planetky, které po určité době mohou být velmi výrazné. Jiným, vícečásticovým (další běžné označení pro pohybující se tělesa) příkladem je pak vzájemné poruchové působení planet při jejich oběhu kolem Slunce, které rovněž vede k sekulárním změnám jejich drah. Se zlepšujícími se pozorovatelskými možnostmi bylo však postupně možné nahlédnout do N-částicových systémů, které se od těch v hledáčku klasické nebeské mechaniky poněkud odlišují do hvězdokup. Rozdíl tkví obvykle především v absenci dominantního centrálního tělesa (jako je Slunce v případě sluneční soustavy) a v řádově větším počtu vzájemně interagujících těles (hvězd) se srovnatelnou hmotností, která se pohybují na velmi složitých a vzájemně se protínajících drahách. Díky tomu se jednotlivé hvězdy často dostanou velmi blízko k sobě a po určitou dobu vliv jejich vzájemné interakce na podobu jejich drah zcela dominuje nad vlivem zbytku systému. Někdy mohou vytvořit trvalejší pár či dokonce vícenásobný systém, ale v naprosté většině případů pokračují po velmi krátké době v nezávislých pohybech, avšak již na více či méně pozměněných drahách. Vzhledem k neuspořádanosti pohybů hvězd ve hvězdokupách dochází k těmto setkáním náhodně a vývoj jednotlivých drah je velmi složitý, s vysokou mírou náhodnosti (stochastický). Těmito systémy se zabývá hvězdná (stelární) dynamika, která se tak musí spoléhat na popis metodami statistické fyziky. 1 Dynamický vývoj obou uvedených typů systémů lze v principu studovat analyticky. To však bývá obvykle úkol značně nesnadný a je zapotřebí provést mnohá zjednodušení, aby bylo možné nalézt řešení příslušných rovnic v plné obecnosti existuje přesné analytické řešení pohybových rovnic pouze pro dvě tělesa. Druhou, a velmi přirozenou, možností je však přímá numerická integrace přesných pohybových rovnic bez ohledu na počet částic či jejich uspořádání (přímé N-částicové modelování), pro kterou existuje celá řada různých algoritmů. Podrobnější diskuze spolehlivosti a fyzikální důvěryhodnosti N-částicových výpočtů je poměrně složitá a přesahuje rámec tohoto článku (více informací např. v práci [2]), ale je potřeba zmínit, že možné problémy jsou v principu dva a velmi úzce spolu souvisí. Prvním je fyzikální podstata N-částicového systému, u kterého již malá změna počátečních podmínek vede poměrně rychle k velkým rozdílům v jeho vývoji (systém je ljapunovsky nestabilní). Druhou potíží jsou pak numerické chyby ve výpočtech (zaokrouhlování způsobené konečným počtem uchovávaných desetinných míst, diskretizace času), které slouží v jistém smyslu právě jako neustálý zdroj změn počátečních podmínek, což vede k nárůstu rozdílu řešení numerického od řešení skutečného. Obecně uznávaným (a v mnohém otestovaným) závěrem však je, že i přes (po jisté době zásadní) nepřesnosti v konkrétních polohách či rychlostech dané částice jsou výsledky statisticky správné, tj. statisticky vyhodnocené charakteristiky souboru skutečných řešení a řešení získaných numericky jsou stejné. Jedná se však i dnes, přes 300 let od objevu Newtonova gravitačního zákona, o téma vědecky živé, ačkoli mnohdy tak trochu opomíjené. Je tedy více než vhodné výsledky N-částicového modelování vždy podrobit kritické analýze a podepřít je dalšími argumenty. Jednu z možných cest se pokusíme demonstrovat v tomto článku. 1 Poznamenejme ještě, že hranice mezi nebeskou mechanikou a hvězdnou dynamikou je značně neostrá a oba obory se vzájemně v mnohém překrývají. Zrovna tak existují i další spřízněné obory, jako je např. galaktická dynamika, které nesou znaky obou již zmíněných disciplín, ale zároveň mají i svá jasná specifika. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 25 (verze )
26 Pro systémy ležící kdesi na pomezí nebeské mechaniky a stelární dynamiky, které při N-částicovém modelování vykazují vedle přirozené stochastičnosti i značnou míru sekulárního vývoje, je užitečné nalézt zjednodušený systém, který prochází stejným sekulárním vývojem, ale skládá se z co nejmenšího počtu vhodně uspořádaných částí. Pro něj již mohou být použitelné poruchové metody nebeské mechaniky, které tak mohou tento sekulární vývoj vysvětlit, a tím pádem poskytnout i hledaný podpůrný argument pro numericky vysledované chování zkoumaného N-částicového systému. Zcela přirozeně lze tato zjednodušení provádět především u systémů s vhodnými symetriemi a hierarchickým uspořádáním. Jak naznačují pozorování, právě takové lze ve vesmíru nalézt v jádrech galaxií, která obsahují černou veledíru o hmotnosti řádu milionů až miliard hmotností našeho Slunce, schopnou vnášet řád do jinak zběsile bublajících jaderných hvězdokup Jádro naší Galaxie Nejbližším galaktickým jádrem je jádro naší Galaxie Mléčné dráhy, které leží ve vzdálenosti přibližně 8 kpc (26 tisíc světelných let) 2 od Slunce, na obloze v souhvězdí Střelce. Studiu jeho různých částí je věnováno nepřeberné množství odborných prací, my však pro účely tohoto článku pouze uvedeme několik základních pozorovatelských faktů o jeho nejvnitřnější oblasti s odkazem na dvě nejnovější přehledové práce [4] a [15]. V nich je možné nalézt detailnější informace, včetně odkazů na jednotlivé úžeji zaměřené publikace. V současnosti je již všeobecně přijímáno, že se v samotném středu naší Galaxie nachází černá veledíra, jejíž hmotnost se odhaduje na zhruba hmotností našeho Slunce. Označuje se obvykle Sgr A dle pozorovaného zdroje rádiového záření, se kterým se tato černá veledíra spojuje. Kolem ní se rozprostírá zhruba sféricky symetrická jaderná hvězdokupa s charakteristickým poloměrem přibližně 4 pc, která se skládá z velmi starých (cca 5 miliard let) hvězd a jejíž celková hmotnost se odhaduje na zhruba 2, slunečních hmotností. Přítomnost takovéto staré hvězdokupy v jádře naší Galaxie byla teoreticky očekávána a její pozorování tak nikoho nepřekvapila. Velmi překvapivým ovšem byl objev více než 100 velmi hmotných mladých (cca 5 milionů let) hvězd v její centrální části, méně než 0,5 pc od Sgr A. U zhruba pětiny těchto hvězd pozorování nasvědčují tomu, že obíhají kolem centrální černé veledíry v poměrně tenkém disku (všeobecně označovaném zkratkou CWS z anglického clockwise system) po eliptických drahách s typickou výstředností kolem 0,3. Odhady celkové hmotnosti tohoto hvězdného disku se pohybují v rozmezí od několika tisíc po několik málo desítek tisíc slunečních hmotností. Celý hvězdný systém tak svým uspořádáním poněkud připomíná obří planetární soustavu, ve které jsou planety nahrazeny hvězdami a centrální hvězda černou veledírou. V takovéto situaci je již matematický aparát nebeské mechaniky, za vhodných doplňujících předpokladů, velmi dobře použitelný, což si dále ukážeme na dvou konkrétních příkladech. 2. Sekulární vývoj drah v N-částicových hvězdných systémech Dříve než přistoupíme k popisu vybraných sekulárních jevů v jádře naší Galaxie, je vhodné si připomenout zavedení Keplerových dráhových elementů, které jsou velmi 2 1 parsek (pc) 3,26 světelného roku. 26 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 26 (verze )
27 Ω ω I Obr. 1. Význam úhlových Keplerových elementů. Šedou barvou vyplněná elipsa představuje referenční rovinu, vůči které se měří sklon dráhy I. Délka výstupného uzlu Ω se měří od vybraného referenčního směru v referenční rovině k průsečnici této roviny s rovinou dráhy. Převzato z práce [6]. názorným souborem parametrů pro popis hvězdných drah v systémech s dominantním centrálním tělesem. První dva elementy definují tvar dráhy a jsou jimi velká poloosa a a výstřednost či excentricita e, dobře známé z analytické geometrie. Dalšími dvěma jsou úhly popisující natočení roviny dráhy v prostoru: sklon či inklinace I a délka výstupného uzlu Ω. Posledním elementem je argument pericentra ω, který udává natočení dráhy v této rovině; střední anomálie udávající pozici hvězdy na dráze je totiž pro naše účely irelevantní. Význam úhlových Keplerových elementů je znázorněn na obr. 1. V obou následujících příkladech je ústřední zkoumanou složkou uvažovaného systému disk několika set až tisíců hvězd obíhajících kolem centrální černé veledíry, jejichž úhrnná hmotnost je rovna řádově desetinám procenta hmotnosti centra. Pro vlastní numerickou integraci pohybových rovnic byl použit volně dostupný program NBODY6 [1], který je založen na Hermiteově metodě čtvrtého řádu Vázaný vývoj drah z disku v poli vzdálené, osově symetrické poruchy Kromě již zmíněné hvězdné složky se v centru naší Galaxie rovněž pozorují různé plynné objekty. Jedním z nich je cirkumjaderný disk (zkratka CND z anglického circumnuclear disc). V prvním přiblížení jde o plynný torus s charakteristickým poloměrem zhruba 2 pc obepínající oblast mladých hvězd s černou veledírou Sgr A ve svém středu. Otázka jeho celkové hmotnosti je stále otevřená, ale v úvahu připadá řádové rozpětí slunečních hmotností, což z cirkumjaderného disku dělá možný významný zdroj poruchového gravitačního potenciálu pro dynamický vývoj disku mladých hvězd. Díky jeho rozměrům jej rovněž lze považovat za zdroj vzdálený, u kterého nedochází k blízkým setkáním s hvězdami disku, a tím pádem ani k narušení hierarchického uspořádání celého systému. Zahrnutí vzdáleného, osově symetrického gravitačního poruchového potenciálu do N-částicového modelu hvězdného disku kolem černé veledíry vede k vývoji znázorněné- Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 27 (verze )
28 Obr. 2. Vývoj prostorových orientací rovin drah hvězd disku v prostoru elementů Ω (horizontální osa) a I (vertikální osa) v N-částicovém modelu. Referenční rovinou je rovina kolmá na osu symetrie poruchy. Zobrazeny jsou jen dráhy nejhmotnějších hvězd z disku, jelikož i v centru Galaxie se doposud pozorují kvůli velké vzdálenosti pouze velmi hmotné hvězdy. Počáteční stav je označen prázdným kroužkem, křížky označují stav po několika milionech let dynamického vývoje (při škálování na parametry hvězdného systému kolem Sgr A ). Překresleno z výsledků práce [8]. mu na obr. 2. Na něm jsou jednotlivé dráhy z disku vyobrazeny v prostoru elementů Ω (horizontální osa) a I (vertikální osa) s referenční rovinou zvolenou kolmou k ose symetrie poruchy cirkumjaderného disku. Jinými slovy řečeno, obr. 2 ukazuje prostorové orientace rovin těchto drah. Jelikož v disku mají jednotlivé dráhy podobnou prostorovou orientaci svých rovin, tvoří takové dráhy v tomto zobrazení kompaktní skupinu, což je vidět především u počátečního stavu s typickým sklonem 70 (označen prázdným kroužkem). V průběhu vývoje disku dochází k tomu, že jeho vnitřní hustší části drží pohromadě a zvyšují svůj sklon k 90 [16], [8]. Naproti tomu ve vnějších částech sklon drah spíše klesá a disková struktura je postupně rozbíjena precesí Ω, jejíž rychlost je odlišná v různých částech disku (tzv. diferenciální precese). Vysvětlení popsaného N-částicového vývoje je možné nalézt pomocí zjednodušeného analytického modelu, který zahrnuje pouze dvě hvězdy z disku (na kruhových drahách) vzájemně gravitačně interagující v potenciálu centrální černé veledíry a vzdálené, osově symetrické poruchy [9]. V závislosti na relativní síle této interakce vůči vlivu poruchy (dáno separací jednotlivých částí systému a jejich hmotnostmi) mohou dráhy těchto hvězd procházet dvěma kvalitativně odlišnými typy vývoje. Pokud je interakce silná, výstupné uzly obou drah vázaně precedují v poli poruchy. Při slabé interakci je naopak tato precese nezávislá. V obou případech rovněž dochází k více či méně významným oscilacím sklonů drah. Při zobecnění tohoto modelu na libovolný počet hvězd v disku pak mohou různé hvězdy či skupiny hvězd vzájemně interagovat v odlišných režimech. To je znázorněno na obr. 3, který odpovídá případu se čtyřmi 28 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 28 (verze )
29 I Ω t(miliony let) t(miliony let) Obr. 3. Sekulární vývoj čtyř vzájemně interagujících drah v analytickém modelu. Vlevo je zobrazen vývoj sklonů jednotlivých drah vůči referenční rovině poruchy. Vpravo je pro stejné dráhy vykreslen vývoj délek výstupných uzlů. Plné křivky popisují vnitřní dvojici drah, čárkované vnější dvojici. Vzhledem k vázanosti precese výstupných uzlů v rámci každé dvojice leží příslušné křivky nerozlišitelně přes sebe. Časové jednotky odpovídají škálování problému na parametry hvězdného systému kolem Sgr A. Překresleno z výsledků práce [9]. hvězdami. Jak je vidět, jedná se o dvě dvojice silně interagujících hvězd, které spolu naopak interagují ve slabém režimu. Ve všech případech platí, že je to právě vnitřní hvězda (či skupina dvojice hvězd), tedy hvězda na dráze s menší velkou poloosou, která zpočátku sklon své dráhy vůči referenční rovině (rovině poruchy) zvyšuje. Získanými poznatky z analytického modelu lze tak již snadno vysvětlit vývoj N-částicového modelu z obr. 2. Poznamenejme ještě, že popsaný vývoj hvězdného disku v poruchovém gravitačním potenciálu plynného cirkumjaderného disku přirozeně vede k jejich vzájemné kolmosti prostorové orientaci, která je pro tyto objekty pozorována v jádře naší Galaxie Kozaiovy Lidovovy cykly jednotlivých drah v excentrickém disku V dosavadních modelech byla jedním ze zjednodušujících předpokladů počáteční kruhovost drah hvězd kolem černé veledíry. Z modelování procesu formování disků hvězd kolem černé veledíry však spíše vyplývá, že dráhy nově vzniklých hvězd by byly mírně excentrické [14]. Ačkoli v případě našeho N-částicového modelu docházelo díky přirozenému vývoji k postupnému zvyšování excentricity těchto drah, otázkou stále zůstává, jaký vliv na vývoj disku hvězd obíhajících černou veledíru by měla počáteční excentricita jejich drah. Dále se proto pro jednoduchost omezme na systém bez přítomnosti osově symetrické poruchy (plynného cirkumjaderného disku) a uvažujme pouze disk hvězd obíhajících černou veledíru po excentrických drahách, jejichž pericentra jsou na počátku natočena do stejného směru. Při takovém uspořádání je celkový gravitační potenciál disku na počátku rovněž excentrický. 3 Při N-částicovém modelování vývoje takového systému je možné pozorovat, na rozdíl od osově symetrických disků, nezanedbatelný počet hvězd dostávajících se do velmi těsné blízkosti centrální černé veledíry. To může nastat jen tehdy, pokud se 3 Uvědomme si, že při pericentrech s rovnoměrně rozděleným úhlem natočení by i přes nenulovou excentricitu jednotlivých drah byl celkový potenciál disku osově symetrický. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 29 (verze )
30 π π e, I π/2 π/ t(miliony let) t(miliony let) Obr. 4. Příklady sekulárního vývoje excentricity e (čárkovaně) a sklonu I (plně; v radiánech) jednotlivých vnitřních drah z excentrického disku hvězd kolem černé veledíry. V levém panelu je zobrazeno koplanární přetočení dráhy v průběhu excentrických Kozaiových Lidovových cyklů. Pravý panel ukazuje klasické Kozaiovy Lidovovy cykly s náhodným přetočením díky těsnému přiblížení jiné hvězdy v případě, kdy je disk zanořen do dodatečného sféricky symetrického gravitačního potenciálu. Časové jednotky odpovídají škálování problému na parametry hvězdného systému kolem Sgr A. Překresleno z výsledků práce [7]. jejich dráhy stanou prakticky radiálními, tj. pokud jejich excentricita dosáhne hodnot velmi blízkých 1. Ukazuje se, že tento nárůst excentricity je důsledkem sekulárního vývoje jednotlivých drah v celkovém excentrickém gravitačním potenciálu samotného disku [7], který tak slouží nejen jako rezervoár porušených drah, ale současně i jako zdroj poruchového potenciálu. Vývoj excentricity a sklonu pro dvě dráhy z vnitřních částí disku prodělávajících zřejmý sekulární vývoj je uveden na obr. 4. Dráha v levém panelu prochází tzv. koplanárním přetočením v rámci excentrických Kozaiových Lidovových cyklů, jevem poprvé nedávno popsaným pro hierarchický problém tří těles v práci [12] a majícím uplatnění především ve studiu dynamiky exoplanetárních systémů. Během tohoto přetočení se vlivem vzdálené excentrické poruchy skokově mění sklon dráhy z hodnoty I 0 na I 180 (π v radiánech) a její excentricita dosahuje extrémních hodnot e 1. V pravém panelu je vykreslen vývoj vnitřní dráhy z disku, který je navíc zanořen do dodatečného sféricky symetrického gravitačního potenciálu (pocházejícího např. od staré hvězdokupy v jádře Galaxie). Od času t 6 milionů let tato dráha prodělává vázané oscilace hodnot e a I v režimu klasických Kozaiových Lidovových cyklů, známých již více než půl století z dynamiky planetek sluneční soustavy [11], [13]. Zatímco v čisté podobě těchto cyklů v hierarchickém problému tří těles není možné překročit hranici I = 90 (π/2 v radiánech), u sledované dráhy toto nastane v čase t 11 milionů let. Je to umožněno působením N-částicového prostředí, tedy těsnými přiblíženími jiných hvězd, jejichž gravitace naruší sekulární cykly sledované dráhy. Obdobná narušení je možné pozorovat pro obě dráhy v podobě šumu na sekulárních křivkách v průběhu celého jejich vývoje. Zmiňme ještě, že Kozaiovy Lidovovy cykly nezávisí na násobnosti systému (počtu těles) obíhajících po sledované dráze. To znamená, že jsou stejným způsobem schopny dopravit do těsné blízkosti centrální černé veledíry i dvojhvězdu, která se vlivem jejího silného slapového působení může roztrhnout. Jedna složka obvykle zůstane na 30 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 30 (verze )
31 velmi těsně vázané dráze kolem černé veledíry, zatímco druhá je vymrštěna ze systému vysokou rychlostí, nezřídka přesahující únikovou rychlost nejen od černé veledíry, ale i z celé galaxie. Tento mechanismus byl poprvé popsán v práci [10] několik let před tím, než byly skutečně pozorovány příklady obou zmíněných skupin hvězd: tzv. S-hvězdy těsně vázané k černé veledíře Sgr A v centru naší Galaxie [5] a prchající hvězdy v jejím halu (hypervelocity stars; [3]). Z přímého N-částicového modelování excentrického hvězdného disku kolem černé veledíry pak vyplývá, že vymrštěné prchající hvězdy by měly být na obloze rozmístěny anizotropně [17], čemuž současná pozorování skutečně napovídají. 3. Závěr Na příkladu hvězdokupy pozorované v jádře naší Galaxie jsme v tomto článku demonstrovali existenci N-částicových astrofyzikálních systémů, které díky svému vhodnému vnitřnímu uspořádání vykazují ve svém dynamickém vývoji zřetelné stopy sekulárního vývoje jednotlivých hvězdných drah či jejich skupin. Ukázali jsme rovněž, že v případě prvotní identifikace těchto sekulárních trendů metodami přímého N-částicového modelování je možné k nalezení jejich fyzikálního vysvětlení s úspěchem využít poruchových metod klasické nebeské mechaniky. Tímto postupem lze velice efektivně minimalizovat riziko záměny numerických artefaktů, které se přirozeně vyskytují při numerickém modelování stochastických systémů, za reálné fyzikální procesy. Poděkování. Autor děkuje Ladislavu Šubrovi za diskuzi, která vedla k tématu tohoto článku, a rovněž Michalu Švandovi za cenné komentáře k předběžné verzi textu. Tento článek vznikl za podpory České fyzikální společnosti JČMF. L i t e r a t u r a [1] Aarseth, S. J.: Gravitational N-body simulations. 1st edition, Cambridge University Press, Cambridge, UK, [2] Boekholt, T., Portegies Zwart, S.: On the reliability of N-body simulations. Comput. Astrophys. Cosmol. [online] 2 (2015), paper No. 2. [3] Brown, W. R., Geller, M. J., Kenyon, S. J.: MMT Hypervelocity star survey III. The complete survey. Astrophys. J. [online] 787 (2014), paper No. 89. [4] Genzel, R., Eisenhauer, F., Gillessen, S.: The galactic center massive black hole and nuclear star cluster. Rev. Modern Phys. 82 (2010), [5] Ghez, A. M., Salim, S., Hornstein, S. D., et al.: Stellar orbits around the galactic center black hole. Astrophys. J. 620 (2005), [6] Haas, J.: Symmetries and dynamics of star clusters. 1st edition, Springer International Publishing, [7] Haas, J., Šubr, L.: Rich Kozai-Lidov dynamics in an initially thin and eccentric stellar disk around a supermassive black hole. Astrophys. J. [online] 822 (2016), paper No. 25. [8] Haas, J., Šubr, L., Kroupa, P.: The coupling of a young stellar disc with the molecular torus in the galactic centre. Monthly Notices Roy. Astronom. Soc. 412 (2011), [9] Haas, J., Šubr, L., Vokrouhlický, D.: Secular theory of the orbital evolution of the young stellar disc in the galactic centre. Monthly Notices Roy. Astronom. Soc. 416 (2011), Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 31 (verze )
32 [10] Hills, J. G.: Hyper-velocity and tidal stars from binaries disrupted by a massive galactic black hole. Nature 331 (1988), [11] Kozai, Y.: Secular perturbations of asteroids with high inclination and eccentricity. Astronom. J. 67 (1962), [12] Li, G., Naoz, S., Kocsis, B., et al.: Eccentricity growth and orbit flip in near-coplanar hierarchical three-body systems. Astrophys. J. [online] 785 (2014), paper No [13] Lidov, M. L.: The evolution of orbits of artificial satellites of planets under the action of gravitational perturbations of external bodies. Planet. Space Sci. 9 (1962), [14] Mapelli, M., Hayfield, T., Mayer, L., et al.: In situ formation of SgrA stars via disk fragmentation: parent cloud properties and thermodynamics. Astrophys. J. [online] 749 (2012), paper No [15] Mapelli, M., Gualandris, A.: Star formation and dynamics in the galactic centre. Lecture Notes in Phys. 905 (2016), [16] Šubr, L., Schovancová, J., Kroupa, P.: The warped young stellar disc in the galactic centre. Astronom. Astrophys. 496 (2009), [17] Šubr, L., Haas, J.: The properties of hypervelocity stars and S-stars originating from an eccentric disk around a supermassive black hole. Astrophys. J. [online] 828 (2016), paper No Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 32 (verze )
33 Reprezentovatelnost částek ve dvoumincových systémech Jan Hamáček, Praha Abstrakt. Máme-li neomezené množství mincí o předepsaných hodnotách, může se stát, že pomocí nich nelze složit některé částky. Pro jednoduchost se omezíme na případ, kdy máme k dispozici mince pouze dvou různých hodnot. V takovém případě je totiž možné poměrně snadno odvodit vzorce pro největší nereprezentovatelnou částku a zjistit počet všech takových částek. Ukážeme, jak lze ke stejnému cíli dospět různými postupy: nejprve odvodíme vzorec pro zjištění počtu všech nereprezentovatelných částek za pomoci rovinné geometrie. Ve druhé části dokážeme oba zmíněné vzorce užitím dělitelnosti. Ve třetí části použijeme ke stejnému účelu vytvořující funkce. Řekneme, že částka n N 0 je reprezentovatelná v systému mincí o hodnotách a, b N, pokud existují x, y N 0, pro která platí rovnost n = xa + yb. Jsou-li čísla a, b soudělná a d je jejich největší společný dělitel, pak v daném systému mohou být reprezentovatelné pouze násobky d. Konkrétně platí, že částka kd je reprezentovatelná v systému a, b právě tehdy, když částka k je reprezentovatelná v systému a/d, b/d. Bez újmy na obecnosti se tedy můžeme omezit na systémy mincí o nesoudělných hodnotách a, b. Ukážeme, že v takových systémech existuje pouze konečně mnoho nereprezentovatelných částek, a najdeme jejich počet a vzorec pro největší nereprezentovatelné číslo (tzv. Frobeniovo číslo). 1. Geometrické odvození Nejprve zjistíme počet nereprezentovatelných částek v systému mincí o dvou nesoudělných hodnotách a, b N. Čerpáme přitom z [3, kap. 13]. Počet reprezentací částky n v systému mincí o hodnotách a, b je roven počtu dvojic x, y N 0 takových, že n = xa + yb. Jednoduchými úpravami získáme ekvivalentní vyjádření y = a b x + n b, což je rovnice přímky protínající souřadnicové osy v bodech A = [n/a, 0] a B = [0, n/b]. Mgr. Jan Hamáček, Katedra softwaru a výuky informatiky, MFF UK v Praze, Malostranské náměstí 25, Praha 1, hamacekh@gmail.com Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 33 (verze )
34 Částka n je proto v systému mincí reprezentovatelná právě tehdy, když na úsečce AB leží bod s celočíselnými souřadnicemi [x, y]. Na obrázku 1 je příklad reprezentovatelné částky n = 19 v systému mincí s a = 5 a b = 7. Na úsečce AB leží jediný bod X s celočíselnými souřadnicemi [1, 2], neboť částku 19 lze reprezentovat jedině pomocí jedné mince o hodnotě 5 a dvou mincí o hodnotě 7. y B 2 X A 5 x Obr. 1. Příklad reprezentovatelné částky 19 v systému mincí a = 5, b = 7 Lemma 1. Leží-li bod X = [x, y] s celočíselnými souřadnicemi na přímce p : n = xa + yb, kde a, b N jsou nesoudělná, pak na stejné přímce leží i body Y 1 = [x + b, y a] a Y 2 = [x b, y +a]. Mezi body X a Y 1 ani mezi body X a Y 2 na přímce p neleží žádný další bod s celočíselnými souřadnicemi. Důkaz. Bod Y 1 leží na přímce p, protože a(x + b) + b(y a) = ax + ab + by ba = ax + by = n. Podobně bod Y 2 leží na přímce p, protože a(x b) + b(y + a) = ax + by = n. Druhou část tvrzení dokážeme sporem. Nechť mezi body X a Y 1 leží bod Q = [x + u, y v] s celočíselnými souřadnicemi. Konstanty u, v proto musí splňovat u, v N, 1 u < b a 1 v < a. Platí a(x + u) + b(y v) = ax + by + au bv = n. 34 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 34 (verze )
35 Dalšími úpravami této rovnice získáme n + au bv = n, a b = v u. Zlomek a b je v základním tvaru, protože a a b jsou nesoudělná. Všechny zlomky vyjadřující stejné racionální číslo jsou proto ve tvaru ma mb, kde m Z, m 0. Zlomek v u však v tomto tvaru není, neboť 1 v < a a 1 u < b. Stejným způsobem bychom mohli dokázat, že mezi body X a Y 2 na přímce neleží bod Q = [x u, y + v], kde opět u, v N, 1 u < b a 1 v < a. Víme-li, že na přímce p z lemmatu 1 leží alespoň jeden bod s celočíselnými souřadnicemi, pak opakovaným užitím tohoto lemmatu ověříme, že jich na přímce p leží nekonečně mnoho. Věta 2. Jsou-li a, b N nesoudělná a n N 0, pak na přímce p : n = xa + yb leží nekonečně mnoho bodů s celočíselnými souřadnicemi. Vzdálenost každých dvou sousedních bodů s celočíselnými souřadnicemi na přímce p je rovna s = a 2 + b 2. Důkaz. Nejprve dokážeme, že na přímce p leží alespoň jeden bod s celočíselnými souřadnicemi. Jelikož jsou a, b nesoudělná, existují na základě Bézoutovy věty [6, věta 3.3] celá čísla x, y Z taková, že ax + by = 1. Vynásobením této rovnosti číslem n N vznikne anx +bny = n. Bod [nx, ny ] proto leží na přímce p. Podle lemmatu 1 leží na přímce p nekonečně mnoho bodů s celočíselnými souřadnicemi v pravidelných intervalech. Vzdálenost dvou sousedních bodů X = [x, y] a Y 1 = [x + b, y a] je s = (x x b) 2 + (y y + a) 2 = a 2 + b 2. Ke stejnému závěru dojdeme i při volbě sousedních bodů X a Y 2 = [x b, y + a]. Na obrázku 2 je znázorněna přímka p odpovídající volbě n = 30, a = 5 a b = 7. Vyznačené body X 1, X 2 a X 3 na přímce p jsou tři po sobě jdoucí body s celočíselnými souřadnicemi. Jejich vzdálenosti jsou podle věty 2 X 1 X 2 = X 2 X 3 = = 74. Věta 3. Mějme systém mincí s nesoudělnými hodnotami a, b. Částka n = ab je v tomto systému reprezentovatelná dvěma způsoby. Všechny částky n > ab jsou reprezentovatelné. Částky n < ab jsou reprezentovatelné nejvýše jedním způsobem. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 35 (verze )
36 y 6 X X 2 x 2 4 X 3 6 Obr. 2. Přímka s vyznačenými body s celočíselnými souřadnicemi pro a = 5, b = 7 a n = 30 Důkaz. Pokud je úsečka AB s krajními body A = [n/a, 0] a B = [0, n/b] delší než a2 + b 2, pak na ní podle věty 2 leží alespoň jeden bod s celočíselnými souřadnicemi. Délka úsečky AB přitom roste s n lineárně, neboť pro n 0 platí AB = (n a ) 2 + ( n b ) 2 = n ( 1 a ) 2 + ( ) 2 1. b Pro n = ab je A = [b, 0], B = [0, a] a AB = a 2 + b 2. Podle věty 2 na této úsečce leží nejvýše dva body s celočíselnými souřadnicemi. Jsou právě dva a jsou jimi body A, B. Pro n > ab je odpovídající úsečka delší než vzdálenost sousedních bodů s celočíselnými souřadnicemi, leží na ní proto alespoň jeden z nich. Pro n < ab je odpovídající úsečka kratší než vzdálenost sousedních bodů s celočíselnými souřadnicemi, a proto na ní leží nejvýše jeden z nich. V následujících odstavcích popíšeme vztah mezi počtem bodů s celočíselnými souřadnicemi a počtem reprezentovatelných a nereprezentovatelných částek. Označíme body A = [b, 0], B = [0, a] a počátek O = [0, 0]. Body A a B jsou krajními body úsečky pro n = ab. Z věty 3 vidíme, že každé reprezentovatelné částce n menší než ab odpovídá úsečka s krajními body A = [n/a, 0] a B = [0, n/b], na které leží právě jeden bod s celočíselnými souřadnicemi. Odtud plyne, že reprezentovatelných 36 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 36 (verze )
37 částek n menších než ab je nejvýše tolik, jako bodů s celočíselnými souřadnicemi, které leží uvnitř trojúhelníku OA B nebo na jeho obvodu, nepočítáme-li body A a B. Počet reprezentovatelných částek by byl ostře menší než počet popsaných bodů, kdyby existoval bod s celočíselnými souřadnicemi, který neleží na žádné z úseček. V následující větě dokážeme, že tomu tak není. Počet bodů s celočíselnými souřadnicemi je proto roven počtu reprezentovatelných částek. Na obrázku 3 jsou na příkladu systému mincí s a = 5 a b = 7 znázorněny všechny úsečky odpovídající číslům n {1, 2,..., 5 7 = 35}. Úsečky, na kterých leží bod s celočíselnými souřadnicemi, a odpovídají tedy reprezentovatelným částkám, jsou znázorněny plnou čarou. Úsečky, na kterých žádný bod s celočíselnými souřadnicemi neleží, a odpovídají tedy nereprezentovatelným částkám, jsou znázorněny čárkovaně. y 5 B C O A x Obr. 3. Úsečky AB pro a = 5, b = 7 a n {0, 1,..., 35} Věta 4. Mějme nesoudělná a, b N. Pro každý bod X = [x, y] se souřadnicemi x, y N 0 existuje n N 0 takové, že X leží na úsečce s krajními body A = [n/a, 0], B = [0, n/b]. Důkaz. Výraz ax + by je jistě celočíselný. Zvolíme proto n = ax + by. (1) Pokud se na vztah (1) budeme dívat jako na rovnici přímky, snadno ověříme, že protíná Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 37 (verze )
38 osy v bodech A = [n/a, 0] a B = [0, n/b]. Bod X na této přímce leží. Leží i na úsečce AB, neboť se nachází v prvním kvadrantu. Věta 5. Počet všech nereprezentovatelných částek v systému mincí o nesoudělných hodnotách a, b N je (a 1)(b 1). 2 Důkaz. Počet všech částek menších než ab, včetně nuly, je ab. Zvolme A = [b, 0], B = [0, a], O = [0, 0] a C = [b, a]. Z vět 3 a 4 plyne, že počet reprezentovatelných částek menších než ab je roven počtu bodů s celočíselnými souřadnicemi, které leží uvnitř trojúhelníku OA B nebo na jeho obvodu, vyloučíme-li oba body A a B. Těch je polovina z počtu bodů s celočíselnými souřadnicemi ležících v obdélníku OA CB, vyloučíme-li oba body A a B. Počet reprezentovatelných částek menších než ab je proto (a + 1)(b + 1) 2. 2 Počet nereprezentovatelných částek menších než ab vypočítáme odečtením počtu reprezentovatelných od počtu všech: ab (a + 1)(b + 1) 2 2 = ab ab 2 a 2 b (a 1)(b 1) =. 2 Z věty 3 víme, že každá částka větší nebo rovná ab je reprezentovatelná, proto tyto částky neovlivní počet nereprezentovatelných částek. Počet všech nereprezentovatelných částek je tedy (a 1)(b 1) Počet nereprezentovatelných částek pomocí dělitelnosti V této části budeme nejprve hledat odpověď na stejnou otázku jako v části předchozí. Britský matematik James Joseph Sylvester použil k popisu problému známky dvou hodnot namísto mincí dvou hodnot. Náš postup vychází z jeho myšlenek. V literatuře proto můžeme problémy popsané v této kapitole nalézt pod názvem The Stamp Problem, viz např. [5]. V následujícím textu vycházíme z [4, kap. 6]. Otázka. Máme neomezené množství mincí o hodnotách a a b, přičemž čísla a, b jsou nesoudělná. Kolik různých částek menších než ab nedokážeme pomocí těchto mincí reprezentovat? Obecnější verze této otázky neobsahuje omezení na částky menší než ab. Ve větě 3 jsme však ukázali, že všechny částky větší nebo rovné ab jsou v systému mincí a, b reprezentovatelné; tuto skutečnost později odvodíme i pomocí dělitelnosti. Vytvoříme tabulku obsahující všechny reprezentovatelné částky menší než ab. Hodnotou v u-tém řádku a v-tém sloupci bude u b + v a. Pro hodnoty a = 5 a b = 9 takto vznikne tabulka Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 38 (verze )
39 v u Tab. 1. Reprezentovatelné částky pro hodnoty a = 5, b = 9 Definice 6. Mějme nesoudělná a, b N. Uvažujme matici o a + 1 řádcích a b + 1 sloupcích, kde pro u, v N 0, u a, v b, je prvek matice v u-tém řádku a v-tém sloupci roven u b + v a. Tuto matici označme A a,b. Prvek matice A a,b v u-tém řádku a v-tém sloupci budeme značit A a,b (u, v). Tabulka 1 podle této definice odpovídá matici A 5,9. Počet všech nereprezentovatelných částek menších než ab můžeme spočítat pomocí počtu všech reprezentovatelných. Platí totiž rovnost ( počet reprezentovatelných ) + ( počet nereprezentovatelných ) = ( počet všech ). (2) Zbývá zjistit, kolik je v tabulce (matici A a,b ) různých reprezentovatelných částek menších než ab. Tabulka 1 obsahuje tři části. V levé horní části jsou hodnoty menší než ab = 45. V pravé dolní části jsou hodnoty větší než 45. Ve zbylých dvou rozích jsou potom právě dvě hodnoty 45. Navíc platí, že hodnot menších než 45 je v tabulce stejný počet jako hodnot větších než 45. Ověříme, že uvedená tvrzení platí nejen pro hodnoty a = 5 a b = 9, ale i v obecném případě. Z následující věty plyne, že v matici A a,b je částek menších než ab stejně jako částek větších než ab. Věta 7. Nechť a, b N jsou větší než 1. Potom pro u, v N 0, u a, v b platí A a,b (u, v) + A a,b (a u, b v) = 2ab. Důkaz. Rozepsáním levé strany rovnosti pomocí definice 6 dostaneme tvrzení věty. Věta 8. Jsou-li čísla a, b N nesoudělná, pak se v matici A a,b žádná hodnota kromě ab nevyskytuje více než jednou. Hodnota ab se v matici vyskytuje právě dvakrát. Důkaz. Aby se hodnota n vyskytovala v matici A a,b více než jednou, musí se vyskytovat v řádku u 1 a sloupci v 1 a zároveň v řádku u 2 a sloupci v 2. Musí tedy existovat u 1, u 2, v 1, v 2 N 0 taková, že platí u 1, u 2 a, v 1, v 2 b a n můžeme vyjádřit dvěma způsoby n = u 1 b + v 1 a, n = u 2 b + v 2 a. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 39 (verze )
40 Bez újmy na obecnosti předpokládejme, že u 2 < u 1. Musí proto platit v 2 > v 1. Odečtením předchozích rovností dostaneme b (u 1 u 2 ) = a (v 2 v 1 ). (3) Odtud plyne, že a dělí b (u 1 u 2 ). Hodnoty a a b jsou nesoudělné. Platí proto, že a dělí u 1 u 2. To můžeme interpretovat tak, že čísla řádků u 1, u 2 se musí lišit o násobek a. Stejným způsobem z rovnosti (3) plyne, že b dělí a (v 2 v 1 ), tedy b dělí v 2 v 1. Čísla sloupců v 1, v 2 se proto musí lišit o násobek b. V matici A a,b jsou takové hodnoty pouze čtyři v rozích matice. Rozborem případů zjistíme, že jediné stejné hodnoty v matici jsou rovny ab a jsou to prvky A a,b (a, 0) a A a,b (0, b). Nyní můžeme využít vzorec (2) k určení počtu všech nereprezentovatelných částek menších než ab. Věta 9. Jsou-li a, b N nesoudělná, pak je počet všech nereprezentovatelných částek menších než ab roven (a 1)(b 1). 2 Důkaz. V matici A a,b je celkem (a + 1)(b + 1) hodnot. Dvě z nich jsou podle předchozí věty rovny ab. Polovina ze zbylých hodnot je podle věty 7 menší než ab. Tyto hodnoty jsou navíc podle věty 8 různé. Počet všech různých reprezentovatelných částek menších než ab je tedy (a + 1)(b + 1) 2 2 = ab + a + b 1. 2 Počet všech nereprezentovatelných částek menších než ab je proto ab ab + a + b 1 2 = (a 1)(b 1). 2 K tomuto závěru dospěl i Sylvester [4, str. 172]. Z předchozí části víme, že všechny větší částky jsou reprezentovatelné. Odtud plyne, že každá nereprezentovatelná částka je menší než ab. Nalezením největší z nich se budeme zabývat v následující kapitole. 3. Největší nereprezentovatelná částka pomocí dělitelnosti Nyní odvodíme vzorec pro výpočet Frobeniova čísla ve dvoumincovém systému pomocí dělitelnosti. Postup si nejprve ukážeme na konkrétním případě pro systém mincí o nesoudělných hodnotách a = 5, b = 9. Z tabulky 1 vypustíme poslední řádek a sloupec. Navíc od každého čísla většího než ab = 45 odečteme 45. Výsledkem bude tabulka 2. Tabulka 2 obsahuje všechna čísla mezi 0 a ab 1 včetně. Jsou v ní proto všechny reprezentovatelné i nereprezentovatelné částky menší než ab. Žádné číslo se v ní navíc neopakuje. V levé horní části tabulky (světle šedá pole) jsou všechny reprezentovatelné částky. V pravé dolní části tabulky (tmavě šedá pole) tedy musí být všechny nereprezentovatelné částky. Největší nereprezentovatelná částka menší než ab se nachází v pravém 40 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 40 (verze )
41 v u Tab. 2. Reprezentovatelné a nereprezentovatelné částky pro hodnoty a = 5, b = 9 dolním rohu. Je jí hodnota 31. Mezi 31 a ab = 45 je 14 reprezentovatelných částek. Přičtením vhodného násobku pěti k nějaké z nich tak můžeme reprezentovat libovolnou částku vyšší než 45. Nyní zopakujeme tento postup pro libovolný systém mincí o nesoudělných hodnotách a, b. Definice 10. Nechť a, b N jsou nesoudělná čísla. Uvažujme matici o a řádcích a b sloupcích, kde pro čísla u, v N 0 taková, že u < a a v < b, je prvek matice v u-tém řádku a v-tém sloupci roven { u b + v a pro u b + v a < ab, u b + v a ab pro u b + v a ab. Tuto matici budeme označovat A a,b. Hodnotu v jejím u-tém řádku a v-tém sloupci budeme značit A a,b (u, v). Matice A a,b odpovídá obsahu tabulky 2. Věta 11. Jsou-li a, b N nesoudělná, pak jsou v matici A a,b všechna čísla různá. Důkaz. Z věty 8 plyne, že v matici A a,b bez posledního řádku a sloupce jsou všechna čísla různá. Na pozicích (u, v), kde ub + va < ab, se matice A a,b od A a,b neliší. Žádná dvojice čísel z této části proto není stejná. Na pozicích (u, v), kde ub + va ab, je v matici A a,b hodnota ub + va ab = A a,b (u, v) ab. Žádná dvojice čísel z této části proto také není stejná. Zbývá zjistit, jestli nemůže existovat číslo z první části stejné jako číslo z druhé části. Takové číslo n by muselo být v první části na pozici (u 1, v 1 ) s reprezentací n = u 1 b + v 1 a. Zároveň by muselo být na pozici (u 2, v 2 ) v druhé části s reprezentací Odečtením těchto rovností dostaneme: n = u 2 b + v 2 a ab. (v 1 v 2 + b)a = (u 2 u 1 )b. (4) Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 41 (verze )
42 Vidíme, že a dělí (u 2 u 1 )b. Protože a, b jsou nesoudělná, a dělí u 2 u 1, řádkové indexy u 1 a u 2 se tedy liší o násobek a. Protože matice A a,b má a 1 řádků, musí být tento násobek roven 0, je tedy u 1 = u 2. Z rovnosti (4) také vidíme, že b dělí (v 1 v 2 +b)a. Protože a, b jsou nesoudělná, tak b dělí v 1 v 2 +b. Odtud b dělí v 1 v 2, sloupcové indexy v 1 a v 2 se tedy liší o násobek b. Protože matice A a,b má b 1 sloupců, musí být tento násobek roven 0, v 1 a v 2 jsou proto stejné. Oba prvky rovné témuž číslu n tedy leží v matici A a,b na stejné pozici, což je však ve sporu s předpokladem, že leží v různých částech matice. V matici A a,b proto nejsou dvě stejná čísla. Matice A a,b obsahuje ab čísel. Všechna jsou menší než ab. Podle věty 11 jsou navíc všechna čísla v matici různá. Matice A a,b proto obsahuje všechny reprezentovatelné i nereprezentovatelné částky menší než ab. Věta 12. Mějme a, b N nesoudělná. Částka na pozici (u, v) v matici A a,b je reprezentovatelná právě tehdy, když platí ub + va < ab. Důkaz. Na pozici (u, v) takové, že ub + va < ab, je částka ub + va, je proto reprezentovatelná. Ukážeme naopak, že žádná částka na pozici (u, v) splňující ub+va ab není reprezentovatelná. Matice A a,b obsahovala všechny reprezentovatelné částky menší než ab. Odebráním posledního řádku a sloupce jsme žádnou z nich neodstranili. Odečtením ab od hodnot ub + va ab jsme částky menší než ab nijak nezměnili. Matice A a,b proto stále obsahuje všechny reprezentovatelné částky menší než ab. Podle věty 11 jsou navíc v matici A a,b všechny hodnoty různé. Na pozicích (u, v), kde ub + va ab, proto nemůže být reprezentovatelná částka. Věta 13. V systému mincí o nesoudělných hodnotách a, b N je největší nereprezentovatelná částka menší než ab rovna ab a b. Důkaz. Největší nereprezentovatelná částka menší než ab je v pravém dolním rohu matice A a,b, tedy na pozici (a 1, b 1). Její hodnota je A a,b(a 1, b 1) = (a 1)b + (b 1)a ab = ab a b. Nyní jsme se dostali do stejné situace jako v předchozí části. Našli jsme řešení s omezením na částky menší než ab. Ve větě 3 jsme už dokázali, že všechny větší částky jsou reprezentovatelné. Pro zajímavost to dokážeme ještě jednou použitím poznatků z této části. Věta 14. V systému mincí o nesoudělných hodnotách a, b N jsou všechny částky větší nebo rovné ab reprezentovatelné. Důkaz. Mezi největší nereprezentovatelnou částkou ab a b a ab je a + b 1 reprezentovatelných částek. Přičtením vhodného násobku čísla b k některé z nich získáme reprezentaci libovolné částky větší nebo rovné ab. 42 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 42 (verze )
43 Příklad 15. Ve dvoumincovém systému mincí o hodnotách a, b, kde a < b, je 35 nereprezentovatelných částek, z nichž jedna je 58. Jaké jsou hodnoty a, b? [3, kap. 13] Řešení. Hodnoty a, b jsou nesoudělné. Kdyby tomu tak nebylo, pak by existovalo nekonečně mnoho nereprezentovatelných částek. Dále víme, že (a 1)(b 1) 2 = 35, (5) tedy (a 1)(b 1) = 70. Hledáme tedy čísla k, l N tak, aby platilo kl = 70 a k < l. Řešením úlohy je dvojice (a, b) taková, že a = k + 1 a b = l + 1, a, b jsou nesoudělná a částka 58 není reprezentovatelná v systému mincí o hodnotách a, b. Číslo 70 můžeme rozložit na součin dvou přirozených čísel pomocí rozkladu na součin prvočísel: 70 = Všechny dvojice přirozených čísel (a, b), pro které platí rovnice (5) a a < b, jsou tedy: (2, 71), (3, 36), (6, 15) a (8, 11). Dvojice (3, 36) a (6, 15) vyřadíme, neboť jde o dvojice soudělných čísel. Dvojici (2, 71) vyřadíme, neboť 58 = 2 29, částka 58 je tedy reprezentovatelná. V reprezentaci částky 58 v systému (8, 11) musíme použít sudý počet mincí 11, neboť jde o sudou částku. Rozborem všech možností zjistíme, že částka 58 je v systému (8, 11) nereprezentovatelná. Dvojice (8, 11) proto splňuje všechny požadavky a jediným řešením je a = 8 a b = Metoda vytvořujících funkcí V této části pomocí metody vytvořujících funkcí vyřešíme následující obecný problém: Pro libovolnou částku n zjistíme, kolika způsoby ji lze reprezentovat v systému dvou mincí. Jako důsledky pak opět získáme vzorce pro počet nereprezentovatelných částek a hodnotu největší z nich. Čerpáme přitom z [1, kap. 1]. Připomeňme, že vytvořující funkce posloupnosti {a n } n=0 je mocninná řada definovaná předpisem f(x) = a n x n. n=0 Pro systémy s jedinou mincí je zjištění posloupnosti {a n } n=0 počtu způsobů reprezentace částky n jednoduché. Posloupnost počtu způsobů, jak reprezentovat částky například pro systém s jedinou mincí o hodnotě 3, je (1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0,...). První jednička (nultý člen) přitom vyjadřuje, že částku 0 lze složit jediným způsobem. Obecně pro systémy s jedinou mincí o hodnotě c bude pro posloupnost počtu způsobů reprezentace {a n } n=0 platit { 1 pokud c dělí n, a n = 0 jinak. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 43 (verze )
44 Vytvořující funkce této posloupnosti je i=0 x ic = 1 1 x c. Mějme systém mincí o nesoudělných hodnotách a, b. Posloupnost počtu reprezentací částek pro tento systém mincí označíme {c n } n=0. K nalezení členů této posloupnosti využijeme součin vytvořujících funkcí posloupností jednomincových systémů s mincemi o hodnotách a, b. Označíme {a n } n=0 posloupnost počtu reprezentací částek v jednomincovém systému a. Analogicky označíme {b n } n=0 posloupnost počtu reprezentací částek v jednomincovém systému b. Počet způsobů, jak reprezentovat částku n ve dvoumincovém systému a, b je potom n c n = a i b n i. i=0 To odpovídá koeficientu u x n v součinu vytvořujících funkcí obou jednomincových systémů. Platí tedy: ( ) ( ) c n x n = a n x n b n x n 1 = (1 x a )(1 x b ). n=0 n=0 n=0 Nyní budeme hledat jednodušší vyjádření koeficientů c 0, c 1, c 2,... N 0. Nechť p N 0 je libovolné pevně zvolené číslo. Hledání koeficientu c p můžeme zjednodušit tak, že budeme hledat konstantní člen rozvoje funkce f(x) = 1 (1 x a )(1 x b )x p = c 0 x p + c 1 x p c p + c p+1 x + c p+2 x Začneme rozkladem na parciální zlomky. K nalezení rozkladu funkce f potřebujeme nejprve najít všechny kořeny polynomu (1 x a )(1 x b )x p v oboru komplexních čísel. Kořeny polynomu 1 x q jsou všechny q-té odmocniny z 1, tedy komplexní čísla 1, ξ q, ξq, 2..., ξq q 1, kde ξ q = cos 2π q + i sin 2π q. (6) Všechny kořeny polynomu (1 x a )(1 x b )x p a jejich násobnosti jsou tedy kořen x = 0 s násobností p, kořen x = 1 s násobností 2, kořeny ξ a, ξ 2 a,..., ξa 1 a s násobností 1, kořeny ξ b, ξ 2 b,..., ξb 1 b s násobností 1. Kořeny ξa k a ξl b jsou pro všechna k {1, 2,..., a 1} a l {1, 2,..., b 1} různé, protože a a b jsou nesoudělná čísla. Pro nalezení rozkladu funkce f na parciální zlomky hledáme konstanty A 1, A 2,..., A p, B 1, B 2, C 1, C 2,..., C a 1, D 1, D 2,..., D b 1 44 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 44 (verze )
45 takové, že 1 (1 x a )(1 x b )x p = A 1 x + A 2 x A p x p + B 1 x 1 + B 2 (x 1) C 1 x ξ a + C 2 x ξ 2 a + D 1 x ξ b + D 2 x ξ 2 b + + C a 1 x ξ a 1 + a + + D b 1 x ξ b 1. b Z rozvoje funkce f plyne, že platí A 1 = c p 1, A 2 = c p 2,..., A p = c 0. Uvidíme, že pro nalezení c p nejsou hodnoty těchto konstant podstatné. Najdeme konstantu B 2. Obě strany rovnosti (7) vynásobíme výrazem (x 1) 2, čímž získáme (x 1) 2 p (1 x a )(1 x b )x p = k=1 a 1 + A k (x 1) 2 k=1 x k + B 1 (x 1) + B 2 + C k (x 1) 2 x ξ k a Limita pravé strany pro x jdoucí k 1 je B 2. Platí proto B 2 = lim x 1 (x 1) 2 (1 x a )(1 x b )x p = b 1 D k (x 1) 2 + x ξb k. = lim x 1 (x 1) 2 (1 x)(1 + x + + x a 1 )(1 x)(1 + x + + x b 1 )x p = 1 ab. Konstantu B 1 získáme podobným způsobem. Obě strany rovnice (7) vynásobíme x 1, čímž získáme x 1 p (1 x a )(1 x b )x p = k=1 a 1 + k=1 A k (x 1) x k + B 1 + B 2 x 1 + k=1 C k (x 1) x ξ k a b 1 + k=1 D k (x 1) x ξb k. Po odečtení B 2 /(x 1) od obou stran rovnosti je limita pravé strany pro x jdoucí k 1 rovna B 1. Platí proto (1 x a )(1 x b )x p 1 ab B 1 = lim x 1 x 1 x 1 = lim x 1 (x 1) 2 1 ab (1 xa )(1 x b )x p (1 x a )(1 x b )(x 1)x p = (x 1) 2 1 ab = lim (1 x)(1 + x + + xa 1 )(1 x)(1 + x + + x b 1 )x p x 1 (1 x) (1 + x + + x a 1 )(1 x) (1 + x + + x b 1 )(x 1) x p. }{{}}{{}}{{} a b 1 Zkrátíme (x 1) 2 a pomocí pravidel pro počítání limit získáme B 1 = 1 ab lim x 1 1 ab (1 + x + + xa 1 )(1 + x + + x b 1 )x p 1 x 1. (7) Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 45 (verze )
46 Definujme funkci h předpisem Platí h(1) = 1, tedy h(x) = 1 ab (1 + x + + xa 1 )(1 + x + + x b 1 )x p. B 1 = 1 ab lim h(x) h(1) = 1 x 1 x 1 ab h (1). Vypočítáme derivaci funkce h podle pravidla o derivování součinu: h (x) = 1 ab[ (1 + 2x + 3x (a 1)x a 2 )(1 + x + x 2 + x x b 1 )x p + + (1 + x + x 2 + x x a 1 )(1 + 2x + 3x (b 1)x b 2 )x p + + (1 + x + x 2 + x x a 1 )(1 + x + x 2 + x x b 1 )px p 1]. Hodnota B 1 je tedy B 1 = 1 ( ( (a 1))b + ab ab = 1 ( a 1 + b 1 ab 2 2 a( (b 1)) ab ) + p = 1 ab 1 2a 1 2b p ab. + abp ) = ab Koeficienty C 1,..., C a 1 získáme analogicky. Budeme hledat koeficient C l. Vynásobením obou stran rovnosti (7) výrazem x ξ l a získáme x ξa l p (1 x a )(1 x b )x p = k=1 l 1 + A k (x ξa) l x k + B 1(x ξa) l + B 2(x ξa) l x 1 (x 1) 2 + k=1 C k (x ξ l a) x ξ k a + C l + a 1 k=l+1 Limita pravé strany pro x jdoucí k ξ l a je C l. Platí proto C k (x ξ l a) x ξ k a b 1 + x ξa l C l = lim x ξa l (1 x a )(1 x b )x p = 1 ξa lp (1 ξa lb) lim x ξa l l H 1 = x ξa l 1 x a ξa lp (1 ξ lb k=1 D k (x ξa) l x ξb k. a ) 1 aξ l(a 1) a V posledním kroku výpočtu jsme použili l Hospitalovo pravidlo. Platí, že ξa a = 1, neboť ξ a je a-tá odmocnina z jedné. Proto Použitím popsaných úprav získáme Stejným postupem zjistíme, že ξa lp ξl(a 1) a = ξa la ξlp l a = ξa l(p 1). C l = D l = 1 aξa l(p 1) (1 ξa lb). 1 bξ l(p 1) b (1 ξb la). 46 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1. Strana 46 (verze )
47 Uvažujme nyní funkci g definovanou předpisem g(x) = c p+n x n. n=0 Naším cílem je najít hodnotu c p = g(0). Pro x 0 platí g(x) = f(x) c 0 x p c p 1 x = B 1 x 1 + B 2 (x 1) C 1 x ξ a + C 2 x ξ 2 a + D 1 x ξ b + D 2 x ξ 2 b + + C a 1 x ξ a 1 + a + + D b 1 x ξ b 1. b (8) Funkce g je spojitá v bodě nula. Limitním přechodem pro x 0 tedy dospějeme k rovnosti c p = g(0) = B 1 + B 2 C 1 ξ a C 2 ξ 2 a C a 1 ξ a 1 a Dosazením za konstanty B i, C j, D k získáme c p = g(0) = 1 2a + 1 2b + p ab + 1 a 1 a k=1 1 D 1 ξ b D 2 ξ 2 b ξ kp a (1 ξ kb a ) + 1 b b 1 k=1 ξ kp b D b 1 ξ b 1. b 1 (9) (1 ξka). Našli jsme výraz udávající počet způsobů reprezentace c p částky p v systému s nesoudělnými hodnotami a, b. Pokusíme se nalezený vzorec (9) dále zjednodušit. Začneme hledáním jednoduššího způsobu zápisu pro a a k=1 ξa kp (10) (1 ξa kb ). Podíváme se na systém mincí o hodnotách a a 1. Počet způsobů, jak reprezentovat částku p, označíme c p. Každá reprezentace částky p použije k-krát minci o hodnotě a a zbytek částky doplní mincemi o hodnotě 1. Počet způsobů reprezentace p je tedy roven počtu možností, jak zvolit k N 0, aby ka < p, a tedy i k < p/a. Proto platí c p = p a + 1. (11) Symbol x přitom označuje dolní celou část x R, tj. největší celé číslo menší nebo rovné x. Počet způsobů reprezentace částky p můžeme získat také dosazením b = 1 do vztahu (9): c p = 1 2a p a + 1 a 1 a k=1 1 ξa kp (12) (1 ξa k ). Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č b Strana 47 (verze )
48 Ze vztahů (11) a (12) vyjádříme 1 a 1 a k=1 1 ξ kp a (1 ξ k a ) = { p a } a. (13) Značení {x} zde má význam desetinné části čísla x, tedy {x} = x x. Hledaný výraz (10) stále není ve stejném tvaru jako (13). Předtím, než ho do podobného tvaru upravíme, dokážeme následující lemma. Lemma 16. Pro libovolnou funkci h 1 : C C a nesoudělná čísla a, m N platí kde ξ a je dáno vztahem (6). a 1 a 1 h 1 (ξa) j = h 1 (ξa jm ), j=1 j=1 Důkaz. Zobrazení f : N 0 C s předpisem f(j) = ξa jm dokázat, že To plyne z nesoudělnosti a, m. {1, 2,..., a 1} = {mj (mod a); j {1, 2,..., a 1}}. Zavedeme funkci h předpisem Hledaný výraz (10) je pak roven h(x) = 1 x p (1 x b ). 1 a 1 h(ξa k a ). k=1 má periodu a. Stačí proto Volme nyní b N nejmenší takové, že bb 1 (mod a). Existence takového b plyne z nesoudělnosti a, b a z Eulerovy věty [6, věta 3.10]. Čísla a, b jsou navíc nesoudělná. Podle lemmatu 16 platí a 1 1 h(ξ k a a) = 1 a k=1 a 1 k=1 h(ξa kb ) = 1 a a 1 k=1 1 ξ kpb a (1 ξ k a ). Použitím vztahu (13), kde místo p píšeme pb, získáme jednodušší vyjádření vztahu (10): 1 a 1 1 a k=1 ξa kp (1 ξa kb) = 1 a 1 { } 1 pb a k=1 ξa kpb (1 ξa k) = + 1 a 2 1 2a. (14) Stejným způsobem můžeme zjednodušit druhou sumu z výrazu (9): zkoumáním systému mincí o hodnotách 1, b bychom došli k závěru, že 1 b 1 b k=1 ξ kp b { 1 pa (1 ξka ) = b b } b. (15) Dosazením získaných výrazů (14) a (15) do (9) obdržíme následující větu. 48 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 48 (verze )
49 Věta 17. Počet reprezentací částky p v systému mincí o nesoudělných hodnotách a, b N je c p = p { } { } pb pa ab + 1, a b kde a, b jsou nejmenší přirozená čísla taková, že aa 1 bb 1 (mod b), (mod a). Příklad 18. Zjistěte počet reprezentací částky 42 v systému mincí o hodnotách 5 a 7. Řešení. Příklad vyřešíme dvěma způsoby. Nejprve odhadneme řešení prostým zkoušením. Potom najdeme počet způsobů užitím věty 17. Po krátkém zkoušení zjistíme, že částku 42 můžeme reprezentovat pomocí šesti mincí o hodnotě 7, nebo pomocí jedné mince o hodnotě 7 a sedmi mincí o hodnotě 5. Našli jsme tedy dva způsoby, jak částku reprezentovat. Dalším zkoušením bychom jistě přišli i na to, že žádný jiný způsob reprezentace neexistuje. Ověříme tuto skutečnost ještě pomocí věty 17. Víme, že a = 5, b = 7 a p = 42. Vypočítáme čísla a, b. Podle Eulerovy věty platí a a ϕ(b) 1 b b ϕ(a) 1 (mod b), (mod a). Protože ϕ(7) = 6 a ϕ(5) = 4, dostáváme a (mod 7), b (mod 5). Zbývá tedy dosadit do vzorce ve větě 17 a vypočítat výsledek: c 42 = 42 { } { } = 5 7 = 42 { } {6 3} = = 2. Počet způsobů, jak reprezentovat částku 42, je roven 2. Pomocí vzorce z věty 17 nyní zjistíme počet nereprezentovatelných částek a největší nereprezentovatelnou částku v systému mincí o dvou nesoudělných hodnotách a, b. Nejprve najdeme největší nereprezentovatelnou částku. Vlastně znovu zformulujeme větu 13. Pro důkaz ale tentokrát použijeme poznatky z této kapitoly. Věta 19. V systému mincí o nesoudělných hodnotách a, b N je největší nereprezentovatelná částka rovna ab a b. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 49 (verze )
50 Důkaz. Potřebujeme ukázat, že ab a b není reprezentovatelná a že každá větší částka reprezentovatelná je. Pro počet reprezentací c ab a b platí c ab a b = ab a b { } { } (ab a b)b (ab a b)a + 1. ab a b Nejprve upravíme { } (ab a b)b = a } { {(b 1)b bb = (b 1)b k 1 }. a a Poslední rovnost využívá toho, že pro nějaké k N 0 je bb = 1 + ka. To vyplývá přímo ze zavedení b pomocí kongruence. Dále si uvědomíme, že { (b 1)b k 1 } { = 1 1 } = 1 1 a a a. Po dosazení získáme c ab a b = ab a b ab a b = 0. Zbývá dokázat, že každá větší částka je reprezentovatelná, tedy že pro každé n N platí c ab a b+n > 0. Využijeme toho, že pro m Z platí { m } a 1 a a. Nyní odhadneme c ab a b+n ab a b + n ab + 1 a 1 a b 1 b = n ab > 0. Dále najdeme počet nereprezentovatelných částek v systému mincí o nesoudělných hodnotách a, b. Lemma 20. Mějme systém dvou mincí o nesoudělných hodnotách a, b N a číslo n {1, 2,..., ab 1}, které není násobkem a ani b. Potom je právě jedna z částek n, ab n reprezentovatelná. Důkaz. Dokážeme, že součet počtů reprezentací čísel n a ab n je 1, tedy c n + c ab n = 1. Budeme upravovat výraz c ab n : c ab n = ab n { } { } (ab n)b (ab n)a + 1 = ab a b = 2 n { } } ab bb nb {aa na = a b = 2 n { } } ab nb { na = a b = n { } { } nb na ab + + = 1 c n. a b Využili jsme skutečnosti, že pokud x není celé číslo, pak 1 {x} = { x}. 50 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 50 (verze )
51 Nyní zopakujeme větu 9 a dokážeme jí pomocí poznatků z této kapitoly. Věta 21. Jsou-li a, b N nesoudělná, pak počet všech nereprezentovatelných částek menších než ab je (a 1)(b 1). 2 Důkaz. Všech částek n {1, 2,..., ab 1} je ab 1. Z nich a 1 je násobkem b a b 1 je násobkem a. Z nesoudělnosti a a b plyne, že žádná z částek není společným násobkem a i b. Částek n {1, 2,..., ab 1}, které nejsou násobkem a ani b, je proto ab 1 (a 1) (b 1) = a(b 1) (b 1) = (a 1)(b 1). Podle lemmatu 20 je právě polovina z nich nereprezentovatelná. 5. Závěr Dokázali jsme, že v systému mincí o dvou nesoudělných hodnotách a, b je Frobeniovo číslo ab a b. Počet všech nereprezentovatelných částek je roven (a 1)(b 1). 2 Tuto skutečnost jsme odvodili několika způsoby. Podobné otázky má smysl řešit také ve vícemincových systémech. V diplomové práci autora [2], ze které tento článek vychází, popisujeme například algoritmus nalezení Frobeniova čísla nebo algoritmus pro zjištění počtu reprezentací částky v obecných systémech. Poděkování. Rád bych poděkoval doc. Antonínu Slavíkovi za cenné připomínky a rady při vypracovávání diplomové práce, ze které tento článek vychází. L i t e r a t u r a [1] Beck, M., Robins, S.: Computing the continuous discretely. Integer-point enumeration in polyhedra. Springer, New York, [2] Hamáček, J.: Kombinatorické úlohy o mincích. Diplomová práce. MFF UK, Praha, Dostupné z: dp/ulohy-o-mincich.pdf [3] Honsberger, R.: Mathematical gems II. The Mathematical Association of America, Washington, DC, [4] Michael, T.: How to guard an art gallery and other discrete mathematical adventures. Johns Hopkins University Press, Baltimore, [5] Petković, M.: Famous puzzles of great mathematicians. American Mathematical Society, Providence, [6] Stanovský, D.: Základy algebry. MatfyzPress, Praha, Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 51 (verze )
52 Štatistické modelovanie javu El Niño تح Južná oscilácia v klimatológii Nikola Jajcay, Milan Paluš, Praha Abstrakt. Pri modelovaní v klimatológii a meteorológii rozlišujeme dva základné druhy modelov dynamické a štatistické. Dynamické modely majú fyzikálny základ, ktorý pozostáva z diskretizovaných diferenciálnych rovníc a súčasného stavu ako počiatočnej podmienky a následne modelujú stav systému integrovaním týchto rovníc v čase. Štatistické modely sú už v základe odlišné: ich fungovanie sa nezakladá na fyzikálnych mechanizmoch tvoriacich dynamiku modelovaného systému, ale sú odvodené z analýzy chodu počasia v minulosti. V tomto článku opíšeme príklad štatistického modelu, ktorý modeluje atmosféricko-oceánsky jav El Niño Southern Oscillation. Zvýšenú pozornosť venujeme modelovaniu nelineárnych medziškálových interakcií. Okrem štatistických vlastností modelu sa tiež zaoberáme parametrizáciami šumu. Taktiež zvažujeme možnosť použitia štatistických modelov nízkej komplexity ako surogátnych modelov na generovanie dát za účelom štatistického testovania hypotéz. 1. Modelovanie v atmosférických vedách Klimatické a atmosférické modely, ktoré používajú kvantitatívne metódy na simulovanie interakcií v klimatickom systéme, sú jedným z najdôležitejších nástrojov pre predikciu a porovnanie klímy v budúcnosti, alebo štúdium klímy v minulosti. Takmer každý sa denne stretáva s použitím dynamických modelov v predpovedi počasia. Vo všeobecnosti sa používajú dva hlavné typy modelov: dynamické a štatistické. Princíp dynamického modelovania spočíva v použití diferenciálnych rovníc (udávajúcich vzťah medzi časovým vývojom rôznych veličín), ktoré sú numericky integrované v čase z tzv. počiatočného stavu. Počiatočný stav reprezentuje východzie podmienky pri integrácii. Asi najznámejším príkladom použitia dynamických modelov sú globálne klimatické modely (GCM general circulation model). Sú to v princípe matematické modely cirkulácie atmosféry a oceánov v planetárnom merítku, ktoré na modelovanie používajú Navier-Stokesove rovnice na rotujúcej sfére (reprezentujúce zachovanie hybnosti v kvapaline), rovnicu kontinuity (zachovanie hmoty v kvapaline) a iné základné rovnice dynamiky a statiky tekutín spolu s termodynamickými členmi na vyjadrenie energetických zdrojov a prepadov. Takto zostrojené modely sa používajú v numerickej Mgr. Nikola Jajcay, Oddělení nelineární dynamiky a složitých systémů, Ústav informatiky AV ČR, v. v. i., Pod Vodárenskou věží 2, Praha 8, Katedra fyziky atmosféry, Matematicko-fyzikální fakulta, Univerzita Karlova, V Holešovičkách 2, Praha 8, jajcay@cs.cas.cz; RNDr. Milan Paluš, DrSc., Oddělení nelineární dynamiky a složitých systémů, Ústav informatiky AV ČR, v. v. i., Pod Vodárenskou věží 2, Praha 8, mp@cs.cas.cz 52 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 52 (verze )
53 predpovedi počasia, na vytváranie dát (datasetov) minulého počasia, tzv. reanalýzy a taktiež na projekcie klímy do budúcnosti vo veľkých porovnávacích projektoch ako je CMIP3 [15] alebo CMIP5 [22]. Denne sa však stretávame s chybami pri modelovaní (koľkokrát už nevyšla predpoveď počasia?). Pri klimatickom modelovaní za pomoci dynamických modelov sa stretávame s dvoma druhmi chýb: prvý typ súvisí s počiatočnou chybou (chyby v inicializácii počiatočného stavu klimatického systému), druhý je priamo naviazaný na chyby modelu (rozlíšenie či už časové alebo priestorové, chyby spojené s diskretizáciou diferenciálnych rovníc apod.) [2]. Problémy s chybami v počiatočnom stave sa väčšinou riešia rozšírením jednej predpovede (jednej integrácie) na súbor predpovedí s mierne sa líšiacimi počiatočnými podmienkami, kde sa na konci vyhodnocuje štatistika (napríklad priemer a rozptyl) daného súboru. S chybami spojenými priamo s modelom to už je zložitejšie sú vstavané do modelu prostredníctvom exponenciálneho rastu chyby (kde rast chyby znamená citlivosť na počiatočné podmienky dve integrácie, ktoré sú v čase t 0 veľmi blízko pri sebe, sa v čase od seba môžu exponenciálne vzďaľovať). Táto vlastnosť súvisí s chaotickým správaním, ktoré je spojené s nelinearitami v diskretizovaných diferenciálnych rovniciach [13] a so systematickými chybami, kde vo všeobecnosti dochádza k posunu a deformáciam štatistických rozdelení simulovaných veličín. Práve toto je hlavný dôvod obmedzenia prediktability numerických predpovedných modelov na cca 6 až 10 dní (napr. [26]). Druhým hlavným typom modelov, výrazne rozdielnym od dynamických, sú štatistické modely. Nie sú priamo založené na fyzikálnych mechanizmoch, ktoré ovladajú dynamiku modelovaného systému, ale sú odvodené z analýz chodu počasia v minulosti (v jazyku stále populárnejšieho strojového učenia by sme povedali, že sú naučené na minulých dátach). Pravdepodobne najpoužívanejším konceptom v štatistickom modelovaní je inverzný stochastický model [18], pri ktorom sa najskôr model navrhne, potom natrénuje pomocou dát z minulosti a nakoniec sa stochasticky (v procese figuruje náhodná premenná šum) integruje do budúcnosti. Tento typ modelu má samozrejme tiež svoje slabiny musíme správne vybrať premenné tak, aby čo najvernejšie zachytili dynamiku systému, ktorý sa snažíme modelovať. Ďalším typickým problémom štatistických modelov je nestacionarita modelovaného systému. Keďže štatistický model sa nezakladá na fyzikálnych mechanizmoch zodpovedných za vývoj dynamiky, model, ktorý je natrénovaný na podmnožine dát, nemusí správne reprodukovať všetky možné stavy systému (matematicky môžeme povedať, že nemusí navštíviť všetky oblasti fázového priestoru). Stále však platí, že štatistické modely majú svoje veľké opodstatnenie, hlavne v prípade, kedy je dynamika systému neznáma a zostrojenie dynamického modelu takmer nemožné. Ďalšou výhodou štatistických modelov je skutočnosť, že užívateľ si môže prispôsobiť komplexitu modelu podľa potreby. S tým súvisí aj motivácia použiť štatistický model na štúdium systému s neznámou dynamikou zostrojíme štatistický model a pokiaľ nám vie správne modelovať rôzne aspekty systému, tak je jednoduchšie študovať samotný model, v ktorom presne vieme, ktoré procesy a ako konkrétne sa podieľajú na dynamike študovaného systému. V nasledujúcej časti textu vybudujeme štatistický model javu El Niño Southern Oscillation (ENSO) a špeciálne budeme klásť dôraz na parametrizáciu šumu. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 53 (verze )
54 2. Štatistický model ENSO V tejto sekcii vybudujeme model na predikciu javu El Niño Southern Oscillation. Spomedzi atmosférických a oceánskych javov s viac ako ročnou periódou vykazuje najsilnejší signál a má veľký socioekonomický dopad. Jeho najvýraznejším prejavom je nepravidelná oscilácia teploty povrchu Tichého oceánu v rovníkovej oblasti a s tým súvisiace zmeny atmosférickej a aj oceánskej cirkulácie Fenomén ENSO Fenomén ENSO a jeho tri fázy neutrálna (normálne podmienky), teplá (El Niño) a studená (La Niña) sú zobrazené na obr. 1. V neutrálnej fáze (obr. 1 hore), ktorá reprezentuje normálne podmienky v Pacifiku, tvorí základ teplý oceán v západnom Pacifiku (pri pobreží Austrálie) a studený oceán vo východnom Pacifiku (pri pobreží Peru). Vieme, že nad teplým oceánom (západný Pacifik) existuje silný výpar a keďže teplý vzduch je ľahší a stúpa nahor, v oblasti západného Pacifiku vzniká hlboká konvekcia a pásmo permanentných zrážok. S tým je spojené aj pásmo nižšieho tlaku nad západným Pacifikom. Tento teplý vzduch stúpa nahor, často až k hranici troposféry a následne vrchnou troposférou smeruje na východ, kde klesá k povrchu a tvorí pásmo vysokého tlaku (nad východným Pacifikom). Potom, v súlade s pasátmi, fúka po povrchu späť na západ a tým dokončuje slučku známu ako Walkerova cirkulácia. Otázkou ostáva, prečo je v západnom Pacifiku teplejšia voda ako vo východnom. Vysvetlenie súvisí s povrchovými vetrami, ktoré vejú smerom na západ, čiže na západe je viac vody a termoklína (prechodová vrstva, v ktorej rýchlo klesá teplota s hĺbkou a pod ňou začína studený, hlboký oceán) sa musí tomuto efektu prispôsobiť naklonením. Vďaka pasátom vzniká tiež povrchový prúd v oceáne, ktorý smeruje k pólom na oboch hemisférach a tento úbytok vody sa vyrovnáva tzv. upwellingom, alebo pumpovaním vody na povrch oceánu, ktorý sa v rovníkovej oblasti deje z hĺbky cca 50 metrov. Termoklína je položená hlbšie na západe rovníkového Pacifiku, čiže voda vypumpovaná na povrch je stále teplá. Avšak na východe je termoklína položená v nižšej hĺbke ako je hranica upwellingu, čiže na povrch sa dostáva studená voda z tzv. hlbokého oceánu. Pri teplej fáze ENSO (obr. 1, dole vľavo) sa teplejšia voda presúva smerom na východ k pobrežiu Peru, termoklína sa vyrovnáva a absencia studeného upwellingu ešte zvýrazňuje teplú anomáliu. S tým súvisí aj oslabenie Walkerovej cirkulácie a presun oblasti permanentných zrážok na východ, kde teraz pokrýva takmer celý rovníkový Pacifik. Naopak, pri studenej fáze (obr. 1 dole vpravo) sa teplejšia voda posúva ešte viac na západ, až k pobrežiu Austrálie, termoklína je strmšia ako bežne a konvektívna cirkulácia nad Pacifikom je taktiež zosilnená. Za pôvodom ENSO síce stojí spojená dynamika atmosféry a oceánu v ekvatoriálnom (rovníkovom) Pacifiku [20], jeho efekty na všeobecnú cirkuláciu a interakciu medzi oceánom a pevninou sú však dobre badateľné aj mimo tropického pásu (oblasť medzi obratníkmi, čiže cca 23.5 severnej šírky až 23.5 južnej šírky), pretože sa prenášajú poväčšine za pomoci telekonekcií [1]. Obe extrémne fázy (teplá aj studená) môžu viesť k extrémnym klimatickým podmienkam v princípe na celej Zemi. Ako príklad nám poslúži priemerná globálna teplota, ktorá je dočasne vyššia počas teplej fázy ENSO a naopak dočasne nižšia počas studenej fázy ENSO [25]. Okrem globálnej teploty ovplyvňuje tento atmosféricko-oceánsky 54 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 54 (verze )
55 Obr. 1. ENSO normálne podmienky (hore), teplá fáza (dole vľavo) a studená fáza (dole vpravo). Obrázky prevzaté z [3]. fenomén samozrejme aj lokálnu teplotu (teplá fáza ENSO napríklad prináša zvýšenie teploty na stredozápade a východe USA, na juhu Brazílie a v celej juhovýchodnej Ázii a studenšie podmienky na Floride, kým studená fáza funguje presne opačne) a taktiež ovplyvňuje zrážky (suché podmienky v juhovýchodnej Ázii, Austrálii a v Indii počas teplej fázy ENSO a naopak zvýšené zrážky na tých istých miestach počas studenej fázy). Okrem už spomenutých javov súvisí teplá fáza ENSO tiež so slabšími vetrami okolo rovníka, so zvýšenou konvekciou pozdĺž ekvatoriálneho Pacifiku a zniženým rizikom hurikánov v Karibskej oblasti. Obrátene, počas studenej fázy ENSO môžeme počítať so silnejšími vetrami okolo rovníka, zníženou konvekciou a taktiež s vyššou pravdepodobnosťou výskytu hurikánov v Karibskej oblasti [6]. Dôležitým aspektom ENSO je skutočnosť, že teplá fáza El Niño sa vyznačuje väčšou magnitúdou (veľkosťou) ako jej náprotivok La Niña. Táto štatistická nerovnosť čiastočne napovedá, že na dynamike ENSO sa podieľajú aj nelineárne procesy [5]. Napriek tomu aj najdetailnejšie numerické dynamické modely podceňujú tieto nelineárne efekty [8], čiže kvalita predpovede je stále nedostatočná. Ešte pred rokom 2000 bola väčšina modelov ENSO lineárna a nelineárne modely začali nadobúdať popularitu iba pomerne nedávno (viz napr. [24]). Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 55 (verze )
56 2.2. Inverzný stochastický model Koncept inverzného stochastického modelu použijeme ako štartovací bod pri stavaní modelu ENSO. Táto časť je prevažne prevzatá z [11]. Nech x(t) je stavový vektor anomálií nejakej veličiny, čiže x(t) = X(t) X(t), kde X(t) je klimatický stavový vektor danej veličiny a X(t) je jeho klimatológia časový priemer. V našom prípade môže byť X(t) vektor teplôt povrchu oceánu vo vybraných bodoch v čase t. S ohľadom na veľké množstvo dát je však výhodnejšie časové rady teplôt najskôr transformovať metódou analýzy hlavných komponent (tzv. PCA rozklad). Táto slúži k dekorelácii dát a následným zanedbaním málo významných komponent môžeme znížiť dimenziu problému. Je to vlastne rozklad kovariančnej matice dát pomocou singulárnej dekompozície na priestorové komponenty nemenné v čase a k nim priradené časové rady. Časová evolúcia anomálií x sa dá vyjadriť ako ẋ = Lx + N(x), (1) kde L je lineárny operátor, N reprezentuje nelineárne zložky a bodkou značíme časovú deriváciu (explicitnú závislosť stavového vektora x(t) na čase už neuvádzame). Táto rovnica reprezentuje všeobecný inverzný model, o ktorom predpokladáme, že má lineárnu zložku reprezentovanú operátorom L a nelineárnu zložku reprezentovanú operátorom N, ktorý závisí od stavového vektora x. Tieto operátory vo všeobecnosti nezávisia od času. Najjednoduchším typom inverzných modelov sú lineárne inverzné modely (linear inverse models LIM [18]). Za pomoci predpokladu N(x)dt Tx dt+dr (0), kde T je matica, ktorá reprezentuje lineárnu spätnú väzbu nerozlíšených (skrytých) procesov v x, a dr (0) je šumový proces, zjednodušíme rovnicu na lineárnu. Šumový proces je pri odhadovaní parametrov rezíduum zvyšok po odhadnutí, ktorý sa nedá vysvetliť lineárnym odhadom, a ako uvidíme neskôr, pri následnom integrovaní modelu sa z neho stane biely šum. Vďaka nášmu predpokladu môžeme rovnicu (1) prepísať ako dx = B (0) xdt + dr (0), B (0) = L + T. (2) Maticu B (0), reprezentujúcu lineárne spätné väzby, a kovariančnú maticu šumu Q r (0) r (0)T, ktorú budeme potrebovať pri integrácii modelu, môžeme priamo odhadnúť z pozorovania veličiny x (z dát) pomocou viacnásobnej lineárnej regresie [28]. Samozrejme predpokladáme, že reziduály r (0) majú nulovú strednú hodnotu. Stavový vektor x pozostáva z časových radov hlavných komponent a tzv. vektor odoziev ẋ pozostáva z ich tendencií Nelineárny viac-stupňový model Predpoklady o lineárnej, stabilnej dynamike a o aditívnom bielom šume, ktoré sme použili pri predstavovaní lineárnych inverzných modelov, sú, bohužiaľ, platné iba pri príliš veľkej aproximácii. Konkrétne, rezíduum po lineárnom odhade dr (0) obsahuje v sebe autokorelácie, čo je v rozpore s definíciou šumového procesu rezíduum má byť tzv. biely šum, čiže náhodný signál s rovnomerne rozdeleným spektrálnym výkonom. Okrem toho, matice B (0) a Q, ktoré sme získali odhadom z dát, vykazujú silnú závislosť 56 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 56 (verze )
57 na samotnom procese x a z definície by mali byť nezávislé [19]. V nasledujúcom texte teda predstavíme dve modifikácie nášho modelu, ktoré adresujú nelinearitu a taktiež spôsob, ako sa zbaviť korelácií v v rezíduách (prevzaté z [11]). Prvú modifikáciu dosiahneme uvažovaním polynomiálneho tvaru N(x) v rovnici (1), presnejšie kvadratického polynómu. i-tu komponentu N i (x) môžeme písať ako ( ) N i (x)dx x T A i x + t i x + c (0) i dt + dr (0) i, (3) kde matice A i reprezentujú bloky tenzoru tretieho rádu, kým vektory b (0) i = l i + t i sú riadkami matice B (0) = L + T (presne ako v rovnici (2)). Tieto matice, podobne ako zložky vektoru c (0), môžeme odhadnúť pomocou viacnásobnej polynomiálnej regresie [14]. Druhá modifikácia sa vysporadúva s problémom korelácií v reziduálnom šume. Ak pri odhadovaní modelu zistíme, že rezíduá po odstránení kvadratickej a lineárnej zložky nie sú biely šum, tak tieto rezíduá odhadneme, teraz už len lineárne, pridaním ďalšieho stupňa do modelu. Konkrétne, i-tu zložku prvého, tzv. hlavného stupňa nášho inverzného stochastického modelu, môžeme písať ako dx i = ( ) x T A i x + b (0) i x + c (0) i dt + dr (0) i, (4) kde x = {x i } je stavový vektor a matice A i, vektory b (0) i, zložky c (0) i vektoru c (0), rovnako ako zložky r (0) i vektoru reziduálneho šumu r (0), zistíme pomocou metódy najmenších štvorcov. Ďalší stupeň modelu je pridaný na modelovanie známych časových inovácií (tendencií) dr (0) ako lineárnej funkcie tzv. rozšíreného stavového vektoru, [x, r (0) ] ( x T, r (0)T ) T. Rezíduá tohto stupňa opäť zistíme pomocou metódy najmenších štvorcov. Rovnakým spôsobom pridáme ďalšie a ďalšie stupne modelu, až pokiaľ rezíduá L-tého stupňa, r (L+1), nie sú biele v čase (vzájomne nezávislé a ich autokorelácia je nulová). Matematicky môžeme dodatočné stupne modelu písať ako dr (0) i = b (1) i [x, r (0) ]dt + r (1) i dt, dr (1) i = b (2) i [x, r (0), r (1) ]dt + r (2) i dt,... dr (L) i = b (L+1) i [x, r (0),..., r (L) ]dt + r (L+1) i dt. (5) Rovnice (4) a (5) reprezentujú širokú paletu procesov, kde potrebujeme explicitne modelovať spätnú väzbu modelovaného procesu x na jeho šume. Lineárny viacstupňový model dostaneme predpokladom A i 0 a c (0) 0 v rovnici (4). Detaily metodológie a taktiež diskusia rôznych aspektov tohto modelu je uvedená v pôvodnom článku [12]. V konkrétnom prípade modelovania ENSO (následujúci princíp sa dá zovšeobecniť a použiť aj na iné účely) využijeme tiež fakt, že teplá i studená fáza zvyknú mať svoje maximum v novembri a decembri. Je viacero ciest, ako podobnú synchronizáciu zahrnúť do modelu. My, v súlade s [12], zahŕňame sezónnu závislosť do dynamickej časti hlavného stupňa modelu. Rigorózne povedané, predpokladáme, že maticová Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 57 (verze )
58 funkcia B (0) (t) a vektorová funkcia c (0) (t) sú časovo závislé a periodické s periódou T = 12 mesiacov: B (0) (t) = B 0 + B s sin(2πt/t ) + B c cos(2πt/t ), c (0) (t) = c 0 + c s sin(2πt/t ) + c c cos(2πt/t ), (6) čiže v našom prípade použijeme celú dostupnú dĺžku dát na odhad štyroch sezónne závislých koeficientov. Model (čiže jeho parametre tenzor A, matice B (i) a vektory c (i) ) odhadneme v priestore komponent z PCA rozkladu (pripomíname, že PCA je rozklad časovo-priestorových dát pomocou singulárnej dekompozície kovariančnej matice na priestorové módy, ktoré vysvetľujú najviac variancie; z rozkladu dostaneme časovo-nemenné, priestorové komponenty a k nim priradené časové rady) [7] teplôt povrchu oceánu tropického Pacifiku. Optimálna (v zmysle podobnosti modelu a skutočných dát) dimenzionalita modelu (počet zložiek vektoru x), na ktorých model natrénujeme, sa určuje heuristicky, pomocou kros-validácie, kedy skúšame rôzne možnosti a vyberieme možnosť s najvyššou podobnosťou voči reálnym dátam. 3. Výsledky: porovnanie modelu s dátami V porovnávaní výsledkov nášho modelu sa zameriame na jeden z indexov opisujúcich fenomén ENSO, a to konkrétne tzv. NINO3.4 index. Tento je definovaný ako časový rad priestorového priemeru povrchovej teploty oceánu v boxe ohraničenom 5 južnej až 5 severnej šírky a 120 až 170 západnej dĺžky. Daný index sa zakladá na HadISST1 datasete [21], ktorý predstavuje súbor dát povrchových teplôt oceánu a koncentrácie ľadovcov s mesačným rozlíšením od roku 1871, vzorkovaných pri rozlíšení 5 5. Ak použijeme model a značenie z predchádzajúcej sekcie, potom X(t) je vektor teplôt povrchu oceánu v bodoch mriežky v čase t, ktorý meriame v mesiacoch, X(t) je vektor priemerných teplôt v danom mesiaci a vektor x(t) = X(t) X(t) popisuje anomálie teplôt. Pripomíname, že s ohľadom na zníženie dimenzie problému nepracujeme priamo s vektormi teplôt, ale s ich PCA transformáciami. V prvej fáze porovnávania sa zameriame na základné charakteristiky indexu NINO3.4 jeho veľkosť, sezónnu závislosť a spektrum Základné charakteristiky Ako prvú porovnáme amplitúdu (veľkosť) NINO3.4 indexu. Definujeme ju ako štandardnú odchylku (STD) anomálií (odchýliek od priemeru za celé obdobie, pre ktoré máme dáta k dispozícii) teploty povrchu oceánu (SSTA sea surface temperature anomalies) v boxe NINO3.4. Na obr. 2 môžeme vidieť amplitúdu indexu NINO3.4 z dát ako tučnú čiernu čiaru a po 20 realizácií (20 nezávislých integrácií modelu z rôznych náhodných počiatočných podmienok a za použitia náhodného bieleho šumu pri integrácii) z lineárneho (tmavo-šedé guličky) a kvadratického modelu (bledo-šedé guličky). Oba modely boli natrénované na podmnožine prvých 20 priestorových komponent z PCA rozkladu a integrované v čase, aby sme dosiahli to, že časové rady budú mať rovnakú dĺžku ako reálne dáta. Z obrázku vyplýva, že lineárny model ľahko preceňuje amplitúdu ENSO a kvadratický model naopak amplitúdu mierne podceňuje. Niektoré realizácie oboch modelov 58 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 58 (verze )
59 Obr. 2. Amplitúda ENSO, ako štandardná odchýlka NINO3.4 anomálií v pozorovaných dátach (čierna čiara) a v 20 realizáciach lineárneho (tmavo-šedé guličky) a kvadratického (bledošedé guličky) modelu. V rovnakých farbách je vykreslený aj súborový priemer ako štvorec pre tieto modely. sa reálnej amplitúde ENSO veľmi približujú, na základe čoho môžeme tvrdiť, že táto závisí na počiatočných podmienkach a na šume dodanom počas integrácie. Súborové priemery lineárneho ako aj kvadratického modelu sa celkovo s dostatočnou presnosťou približujú reálnej amplitúde. Ďalšou základnou a dôležitou charakteristikou ENSO je jeho sezónnosť. Ako bolo spomenuté vyššie, ENSO sa vyznačuje tendenciou vrcholiť v zime na severnej pologuli, čo sa preukazuje zvýšenou varianciou počas zimných mesiacov a zníženou varianciou počas jari a leta na severnej pologuli. Ako charakteristiku teda zvolíme štandardnú odchýlku SSTA za jednotlivé mesiace a tieto charakteristiky pre reálne dáta a takisto aj pre naše modely môžeme vidieť na obr. 3. Vidíme, že oba modely dobre reprezentujú sezónnosť ENSO v zmysle zvýšenej variancie v zimných mesiacoch s minimom na jar na severnej pologuli. Je potrebné podotknúť, že v reálnych dátach je rozdiel v mesačných varianciách väčší ako v oboch modeloch. Opäť platí, že súborové priemery oboch modelov dostatočne dobre reprezentujú sezónnosť, akú môžeme nájsť v dátach. Poslednou, ale nemenej dôležitou charakteristikou je frekvenčné spektrum teplotných anomálií, z ktorého sa dozvieme typické periodicity (frekvencie) signálu. Fenomén ENSO nemá veľmi konkrétnu periodicitu, väčšinou sa v literatúre stretávame s pojmom ENSO band, ktorý reprezentuje fakt, že periodicita ENSO nie je pevne definovaná (jeho spektrum nemá jasné maximum) a uvádza sa v rozmedzí 3 7 rokov. Tento spektrálny pás môžeme vidieť aj na obr. 4 (spektrálna hustota bola počítaná Welchovou metódou [27]) s mierne výrazným maximom na 9 rokoch. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 59 (verze )
60 Obr. 3. Sezónnosť ENSO, ako štandardná odchýlka NINO3.4 anomálií za mesiac v pozorovaných dátach (čierna čiara) a v 20 realizáciach lineárneho (tmavo-šedé čiary) a kvadratického (bledo-šedé čiary) modelu. V rovnakých farbách je vykreslený súborový priemer ako tučné čiary pre tieto modely. Oba modely relatívne dobre kopírujú spektrum NINO3.4 indexu či už jednotlivé realizácie, alebo súborové priemery. Vo výsledku môžeme tvrdiť, že štatistický model integrovaný na rovnaké obdobie ako dáta verne modeluje fenomén ENSO a dokáže kopírovať jeho základné (lineárne) štatistiky. 4. Vylepšenia modelu: parametrizácia šumu Po navrhnutí dizajnu a natrénovaní štatistického modelu nasleduje samotná integrácia, počas ktorej pridávame do modelu šum. Tento šum môže mať priestorovú štruktúru v zmysle korelácií medzi jednotlivými zložkami, ktorá by mala ostať rovnaká ako v dátach. Ako bolo spomenuté vyššie, model obsahuje toľko stupňov, aby rezíduá posledného stupňa boli biele v čase. To však neznamená, že tento šum nemôže byť v priestore nejako korelovaný. V najzákladnejšom a najintuitívnejšom nastavení si jednoducho spočítame kovariančnú maticu rezíduí z posledného stupňa a následne jej Choleského dekompozíciu na spodnú trojuholníkovú maticu a k nej konjugovanú transponovanú maticu R (tento krok je potrebný kvôli stabilite integrácie). Pri integrácii si v každom časovom kroku vyrobíme náhodnú realizáciu bieleho šumu o časovej dĺžke 1 a tento náhodný vektor prenásobíme maticou R, z čoho dostaneme realizáciu priestorovo korelovaného bieleho šumu, ktorý dosadíme do modelu. Tomuto procesu hovoríme parametrizácia šumu. V praxi sa však ukazuje, že aj pri vysokostupňových modeloch je stále možné, že rezíduá budú mať nejakú zložitú štruktúru (autokorelácie pri vysokých oneskoreniach, sezónnosť apod.) a parametrizácia za pomoci priestorovej korelácie by nebola dostatočná. V tom prípade môžeme siahnuť po jednej zo zložitejších parametrizácií. 60 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 60 (verze )
61 ( ) Obr. 4. Spektrum ENSO, odhad spektrálnej hustoty pomocou Welchovej metódy NINO3.4 anomálií v pozorovaných dátach (čierna čiara) a v 20 realizáciach lineárneho (tmavo-šedé čiary) a kvadratického (bledo-šedé čiary) modelu. V rovnakých farbách je vykreslený súborový priemer ako tučné čiary pre tieto modely. Jedno z vylepšení parametrizácie šumu vychádza z konceptu modelovania klimatických procesov, ktoré vykazujú variabilitu na nízkych frekvenciách (LFV low frequency variability). Princíp tejto metódy spočíva v hľadaní vzoriek (časových úsekov) v rezíduách (tzv. noise snippets), ktoré sa objavovali v systéme už v minulosti, vo fáze LFV, tesne pred práve pozorovaným stavom. Tieto (alebo informácie, ktoré z nich získame) následne použijeme na integráciu nášho systému do budúcnosti. Táto metóda je popísaná v [10]. Šumové vzorky, ktoré nájdeme v minulých stavoch systému, môžeme použiť dvoma rôznymi spôsobmi: prvým je priame použitie týchto vzoriek z minulého stavu systému na integráciu modelu do budúcnosti (ako to je použité v [10]) ako súboru viacerých integrácií. Napríklad, ak nájdeme 4 rôzne časové intervaly, ktoré pripomínaju súčasný stav LFV systému, tak použijeme priamo všetky 4 vzorky ako šum pri integrácii a následne integračný výsledok spriemerujeme. Druhý spôsob (použitý v našej štúdii) je nájdenie daného počtu vzoriek (napríklad 100) z minulosti systému, ktoré sú najbližšie súčasnému stavu LFV systému a vytvorenie kovariančnej matice z týchto 100 vzoriek. Následne vytvoríme maticu R pomocou Choleského dekompozície a náhodný šumový vektor sa touto maticou vynásobí. Bez ohľadu na to, ktorý z vyššie uvedených spôsobov použijeme, existuje viacero možností, ako odhadnúť súčasný stav systému. Jednou z najpoužívanejších je odhad pomocou korelácie SSA časových radov (SSA singular spectrum analysis [4] je rozklad kovariančnej matice, ktorá je navyše rozšírená o rôzne časové oneskorenia, v princípe podobný PCA), ktoré vytvoríme z časových radov hlavných komponent vstupov do modelu. Druhý spôsob spočíva v použití euklidovskej vzdialenosti v podpriestore modelu prvých pár hlavných komponent. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 61 (verze )
62 Obr. 5. Amplitúda ENSO (hore) a sezónnosť ENSO (dole), dáta ako čierna čiara, lineárny model v tmavo-šedej farbe, lineárny model so šumom závislým na stave systému v bledo-šedej farbe. Na obr. 5 môžeme vidieť porovnanie klasického lineárneho modelu (s bielym šumom s klasickou kovariančnou maticou tvorenou z celých dát) a lineárneho modelu so šumom s kovariančnou maticou závislou na súčasnom stave systému. V našom prípade bol súčasný stav systému odhadnutý pomocou metódy SSA. Ako je zrejmé z obrázku, iná parametrizácia šumu amplitúde nepomohla, avšak pri sezónnosti môžeme vidieť lepší prechod medzi zimou na severnej pologuli s vysokou varianciou, a naopak, jarou a letom na severnej pologuli s nízkou varianciou práve v modeli so šumom závislým na stave systému. 62 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 62 (verze )
63 5. Nelineárne interakcie v dátach a v modeli Fenomén ENSO je modelovaný počas viacerých dekád a rôzne modely majú svoje výhody a nevýhody, ale v princípe všetky dosahujú veľmi dobré výsledky v predpovedi na 3 mesiace vopred. My sme náš model chceli zostrojiť tak, aby verne kopíroval nelineárne interakcie v dynamike ENSO. Tým, že model je jednoduchší ako realita, je tento krok dôležitý v hľadaní mechanizmov, ktoré stoja za nelineárnymi interakciami. Nás zaujímajú nelineárne interakcie medzi rôznymi časovými škálami v dynamike ENSO, konkrétne sa zameriame na fázovú synchronizáciu a kauzalitu Metódy Najskôr musíme NINO3.4 index, ktorý je v princípe časovou radou teplotných anomálií v oceáne, rozložiť na jednotlivé zložky, kde každá reprezentuje časť signálu na konkrétnej časovej škále. Z dát si pomocou pásmového filtra vieme získať napríklad ročnú zložku, ktorej typická periodicita je jeden rok a iné frekvencie sa v nej až na malé odchýlky nevyskytujú. Z pôvodného časového radu s tak získame škálovú zložku s f o frekvencii f. Najjednoduchším spôsobom, ako odhadnúť jej fázu a amplitúdu, je vypočítať jej imaginárnu zložku ŝ f pomocou Hilbertovej transformácie (lineárna operácia, pomocou ktorej sa počíta analytická reprezentácia signálu). Potom môžeme písať s f (t) + iŝ f (t) = A f (t) exp(iφ f (t)), (7) kde φ f (t) = arctg ŝf(t) (8) s f (t) je fáza oscilačného signálu s frekvenciou f a A f (t) = s 2 f (t) + ŝ2 f (t) (9) je jeho amplitúda. Vyššie popísané dva kroky filtrovanie a následnú Hilbertovu transformáciu môžeme zjednodušiť na jeden použitím waveletovej transformácie. Waveletová transformácia je vlastne konvolúcia vopred predpísanej vlny o určitej perióde s dátami, čím vznikajú oscilačné časové rady na frekvencii predpísanej vlny. Výstupom komplexnej waveletovej transformácie sú reálna a imaginárna zložka časového radu, z ktorých môžeme priamo vypočítať fázu a amplitúdu škálovej zložky o danej frekvencii (perióde); pre detaily metodológie odporúčame [16]. Našim hlavným cieľom bolo odhadnúť kauzálne vzťahy medzi oscilačnými zložkami na rôznych periódach. Existuje viacero metód na rozpoznávanie synchronizácie a kauzality, my používame nástroj z teórie informácie, konkrétne vzájomnú informáciu a jej podmienenú verziu. Vzájomná informácia sa v prípade diskrétnych vstupných veličín počíta ako I(X; Y ) = p(x, y) p(x, y) log p(x)p(y), (10) x y kde p(x, y) je združená pravdepodobnosť náhodných veličín X, Y a p(x), p(y) sú marginálne pravdepodobnosti veličín X a Y. Vzájomná informácia v podstate vyjadruje (ako už jej názov napovedá), koľko informácie zdieľajú dve rôzne veličiny, X a Y. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 63 (verze )
64 Ak nezdieľajú žiadnu spoločnú informáciu (sú nezávislé), ich združená distribučná funkcia sa rovná súčinu jednotlivých marginálnych distribučných funkcií a v sume je logaritmus 1, čo sa rovná 0. Vzájomná informácia nemá vrchnú hranicu, je zhora neobmedzená. Na rozdiel, napríklad od korelácie, odhalí aj nelineárne vzťahy medzi náhodnými premennými a preto je niekedy prezývaná aj nelineárna korelácia. O vzájomnej informácii môžeme hovoriť nie iba v prípade náhodných veličín, ale tiež v prípade dvojice časových radov x(t) a y(t), t T. Značíme ju opäť I(x(t); y(t)) a počítame podľa vzorca (10), kde príslušné distribučné funkcie odhadneme pomocou histogramov; pre prehľad rôznych odhadov vzájomnej informácie odporúčame [9]. Ešte zaujímavejším konceptom je podmienená vzájomná informácia, ktorá udáva, koľko spoločnej informácie máme v dvoch náhodných veličinách, ak si odmyslíme pôsobenie tretej veličiny. Pomocou podmienenej vzájomnej informácie môžeme odhadovať mimo iného aj kauzálne vzťahy medzi dvoma veličinami a to tak, že za tretiu veličinu, na ktorú podmieňujeme, dosadíme minulosť jednej z prvých dvoch veličín, číže efektívne počítame vzájomnú informáciou medzi dvoma veličinami, podmieňujúc na minulosť jednej z nich. V tejto štúdii pozorujeme dve miery nelineárných vzťahov: fázovú synchronizáciu a fázovo-amplitúdovú kauzalitu. Fázová synchronizácia je jednoducho vzájomná informácia medzi fázami dvoch oscilačných zložiek na rôznych frekvenciách. Môže nás napríklad zaujímať fázová synchronizácia medzi oscilačnou zložkou s ročnou periódou a zložkou pomalšieho, 5-ročného cyklu. Matematicky píšeme I(φ f1 (t); φ f2 (t)). Fázovo-amplitúdová kauzalita je už trocha zložitejšia a v jej počítaní používame koncept podmienenej vzájomnej informácie. V našom prípade počítame kauzalitu smerom od fáz k amplitúde. V princípe počítame vzájomnú informáciu fázy φ 1 v čase t na amplitúdu A 2 v budúcnosti (v čase t + τ, čiže počítame ako nám znalosť momentálnej fázy pomôže predpovedať amplitúdu v budúcnosti). Zároveň však podmieňujeme na prítomnú a minulú amplitúdu A 2 v časoch t, t η,... (tu závisí na dimenzii podmienky, my používame 3-dimenzionálnu podmienku), čím sa zbavujeme jej pôsobenia. Celkovo píšeme, že odhad kauzality od fáz k amplitúde počítame ako I(φ f1 (t); A f2 (t + τ) A f2 (t), A f2 (t η), A f2 (t 2η)) Surogátne dáta Predtým, ako prejdeme priamo k výsledkom našich analýz, vysvetlíme metódu surogátnych dát. Surogátnymi dátami (surrogate data alebo analogous data) nazývame metódu na generovanie umelých časových radov, ktoré zachovávajú niektoré vybrané štatistické vlastnosti pôvodných dát, kým ostatné znáhodnia konzistentne s nulovou hypotézou. Ich najčastejšie využitie je v štatistickom testovaní významnosti. Najskôr si zvolíme nulovú hypotézu, ktorá opisuje nejaký proces, a následne vygenerujeme súbor surogátnych dát zodpovedajúcich nulovej hypotéze použitím Monte Carlo metód (opakované náhodné vzorkovanie). Jednou z najpoužívanejších techník na generovanie surogátnych dát sú tzv. fourierovské surogáty (Fourier transform surrogates [23]), ktoré zachovávajú lineárne korelácie v dátach (spektrum alebo periodogram a taktiež autokoreláciu), ale znehodnotia akékoľvek interakcie medzi nimi. Pri tvorbe týchto surogátov dáta pretransformujeme do frekvenčného priestoru pomocou Fourierovej transformácie, ich fázy znáhodníme a následne späť pretransformujeme inverznou Fourierovou transformáciou do priestoru reálneho času. 64 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 64 (verze )
65 Metódu a jej použitie ilustrujeme na jednoduchom príklade predstavme si dva prepojené dynamické systémy (napríklad Lorenzov systém), kde jeden z nich ovláda druhý v kauzálnom zmysle (to znamená, že v rovniciach pre druhý systém sa vyskytuje premenná z prvého systému). Tento systém naintegrujeme a máme k dispozícii merania časové rady z oboch systémov. Chceme zistiť, či a ako sú prepojené a ak sú, chceme vedieť smer kauzality. Na tento účel použijeme napríklad podmienenú vzájomnú informáciu. Z analýzy vzájomnej informácie dostaneme výsledok jedno číslo. Toto nám však na zistenie výsledku nestačí hodnotu sme mohli dostať aj náhodou. Za účelom štatistického testovania si teda vytvoríme súbor surogátnych dát (napríklad už zmienených Fourierových surogátov) a analýzu podmienenej vzájomnej informácie zopakujeme pre každý člen súboru zvlášť. Z hodnôt vzájomných informácií pre každý člen zostrojíme histogram a pozrieme sa, kam padne hodnota z dát. Ak prekročí vopred zvolený percentil (často to býva 95 %), povieme, že kauzálny vzťah je signifikantný Interakcie v dátach Pri študovaní nelineárnych interakcií v dátach sa najskôr zameriame na fázovú synchronizáciu. Fázovou synchronizáciou rozumieme vo všeobecnosti proces, v ktorom dva alebo viac cyklických signálov oscilujú s opakujúcou sa sekvenciou fázových rozdielov. V našom klimatickom príklade to znamená, že dve rôzne oscilačné zložky systému sú spolu zosynchronizované ak dôjde k zmene jednej, simultánne by sa mala zmeniť aj druhá. Fázovú synchronizáciu počítame pomocou vyššie zavedenej vzájomnej informácie ako I(φ f1 (t); φ f2 (t)), kde φ i (t) je časový rad fázy i-tej oscilačnej zložky. Výsledky môžeme vidieť na obr. 6 vľavo. Pre každú dvojicu periód odhadneme vzájomnú informáciu ich fáz a porovnávame ju so súborom synteticky vyrobených dát zodpovedajúcich nulovej hypotéze. Nulová hypotéza v našom prípade zodpovedá lineárnemu stochastickému procesu s rovnakým spektrom ako dáta, v ktorom ale žiadne medziškálové interakcie neexistujú. V prípade, že hodnota vzájomnej informácie je v dátach vyššia ako daný percentil (často 95 %) z distribúcie surogátnych dát, nulová hypotéza je zamietnutá a tvrdíme, že vzájomná informácia je štatisticky významná. Podobne si zobrazíme aj výsledky z kauzálnej interakcie medzi fázou a amplitúdou ako na obr. 6 vpravo. Ako je zrejmé z obr. 6, v observačných dátach môžeme vidieť synchronizáciu ročného cyklu s periódami tesne pod jedným rokom, tzv. kombinačnými tónmi a taktiež fázovú synchronizáciu 2:1, čiže tzv. bienálneho (dvojročného) cyklu s ročným. Čo sa týka kauzalít, tvrdíme, že fáza pomalého cyklu s periódou 5 6 rokov kauzálne vplýva na amplitúdu bienálneho cyklu Interakcie v modeli V nasledujúcich riadkoch sa pozrieme na podobné interakcie, ale tentoraz v modeloch. Či dokážeme nájsť rovnaké interakcie v modeloch a v observačných dátach je dôležité z hľadiska ozrejmenia mechanizmov stojacich za týmito interakciami. Komplexita modelov je na rozdiel od prírody značne znížená a model môžeme navyše rozložiť na jeho jednotlivé zložky a sledovať, z akých interakcií v modeli náš výsledok vychádza. Na test synchronizácie a kauzality sme opäť integrovali lineárny model v súbore, pre každú realizáciu zo súboru sme spravili štatistický test oproti surogátnym časovým Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 65 (verze )
66 Obr. 6. Fázová synchronizácia (vľavo) a kauzalita fáza amplitúda (vpravo) v časovej rade NINO3.4 indexu. Zobrazené sú stupne významnosti ako stupne šedi (od 95% percentilu) z odhadu vzájomnej informácie. Štatistický test významnosti oproti 500 syntetickým, surogátnym časovým radom. radom, takéto grafy sme binarizovali (ak bol daný bod na grafe významný, tak sme mu pridelili hodnotu 1, v opačnom prípade 0) a nakoniec sčítali. Výsledky ukazujeme na obr. 7. Ako vidno z ľavej časti obr. 7, fázová synchronizácia je správne modelovaná a obsahuje obe synchronizačné pásma, menovite synchronizáciu ročného cyklu s kombinačnými tónami a synchronizáciu ročného a bienálneho cyklu. S kauzalitou fáza-amplitúda to už je horšie túto interakciu model nedokázal zachytiť. Dôvodom môže byť nízka komplexita modelu, alebo absencia nejakých nelineárnych interakcií v modeli, ktoré observačné dáta (a tým pádom dynamika ENSO) obsahujú. 6. Modelovanie surogátnych dát pomocou štatistického modelu Už sme si vysvetlili, čo sú surogátne dáta a na čo sa používajú. V poslednej časti tohoto článku ukážeme, ako generovať surogátne dáta pomocou nášho štatistického modelu. Pri štúdiu nelineárnych interakcií použitím metód ako vzájomná informácia, je použitie surogátnych dát na testovanie štatistickej významnosti nutné. Samozrejme, môžeme použiť už spomenuté fourierovské surogátne dáta, čím sa nulovou hypotézou stane lineárny proces s rovnakým spektrom. Môžeme však vytvoriť sofistikovanejšiu nulovú hypotézu, využívajúc možnosti štatistických modelov: ak vezmeme lineárny model, zanedbáme dynamickú sezónnosť členov B (0) a c (0) v rovnici (6) a použijeme základnú parametrizáciu šumu (vezmeme do úvahy iba priestorové korelácie), tento model bude kopírovať základné (lineárne) štatistické vlastnosti modelovaných časových radov, ale nebude umožňovať napríklad nelineárne interakcie. Týmto spôsobom ho môžeme využiť ako nulovú hypotézu. 66 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 66 (verze )
67 ( ) Obr. 7. Suma 5 členov súboru pre fázovú synchronizáciu (vľavo) a kauzality fáza amplitúda (vpravo) v v časovom rade modelovaného NINO3.4 indexu zo súboru lineárneho modelu. Ukázané sú hladiny významnosti (od 95% percentilu) z odhadu vzájomnej informácie. Štatistický test významnosti oproti 500 syntetickým, surogátnym časovým radom. Použitie štatistického modelu na vytváranie nulových hypotéz v praxi môžeme vidieť na obr. 8. Keď porovnáme riadky (odlišné typy surogátov, čiže odlišné nulové hypotézy), v oboch máme rovnaké významné interakcie. Konkrétne sa jedná o synchronizáciu fáz ročného cyklu s kombinačnými tónmi a ročného cyklu s bienálnym. Taktiež pozorujeme kauzalitu fáza amplitúda, kde fáza pomalého cyklu (5 6 rokov) kauzálne ovplyvňuje amplitúdu bienálneho cyklu. Pri použití štatistického modelu nízkej komplexity ako nulovej hypotézy vidíme hlavne pri kauzálnych interakciách že model tohto typu má menej štatistických fluktuácií, resp. falošných pozitív, ako fourierovské surogáty. Toto je očakávateľné, pretože model verne kopíruje základnú (lineárnu) štruktúru dát a vynecháva iba sezónnu závislosť na ročnom cykle a nelineárne interakcie. Použitím štatistického modelu na testovanie hypotéz dostávame lepšiu predstavu o významných interakciách, zároveň je takýto test prísnejší (nulová hypotéza je konkrétnejšia), čo má za následok zníženie počtu falošne pozitívnych výsledkov. 7. Zhrnutie Štatistickým modelom v klimatológii sa dostáva čoraz väčšej pozornosti, aj z dôvodu, že ich použitie nie je limitované iba na predpovedné účely (napríklad spomenutého fenoménu ENSO), ale aj na identifikáciu interakcií v zložitých systémoch. Keďže sú väčšinou zostrojené v redukovanom fázovom priestore s nízkou dimenzionalitou, identifikácia zdrojov týchto interakcií sa stane jednoduchšou. Ukázali sme, že štatistické modely s vhodným nastavením (ktoré súvisí so základným pochopením modelovaného javu) vedia generovať syntetické časové rady modelovaného systému (u nás to bolo ENSO), ktoré kopírujú vlastnosti observačných dát lineárne aj nelineárne. Ďalej sme sa venovali rôznym parametrizáciam šumu. Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 67 (verze )
68 Obr. 8. Porovnanie nulových hypotéz: fázová synchronizácia (vľavo) a kauzalita fáza amplitúda (vpravo) v časovom rade NINO3.4 indexu. Zobrazené sú hladiny významnosti (od 95% percentilu) z odhadu vzájomnej informácie. Štatistický test významnosti oproti 500 (hore) fourierovským surogátnym časovým radom a (dole) časovým radom z nízkokomplexného štatistického modelu. Keďže stochasticita je dôležitým aspektom štatistických modelov, správne zvolený šum môže mať veľký vplyv na výsledné modelovanie. V našom konkrétnom prípade nám aj zložitejšia parametrizácia šumu pomohla. Záverom sme predstavili spôsob, ako zo štatistických modelov nízkej komplexity vytvárať modely na štatistické testovanie hy- 68 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 68 (verze )
69 potéz, ktoré v našom prípade ukázalo lepšie výsledky ako použitie známych metód (napr. fourierovských surogátov). Budúcnosť štatistických modelov sa môže vyvíjať viacerými smermi. Jedným z nich môže byť vývoj štatistických modelov ako takých experimentovanie s rôznymi premennými v modeli, kombinovanie meteorologických premenných na vstupe, rôzne metódy a varianty preprocessingu a pod. Ďalším môže byť prepojenie štatistických modelov s dynamickými. Ako konkrétny príklad uveďme možnosť použitia štatistických modelov na parametrizáciu javov s menším rozlíšením ako je mriežka (sub-grid phenomena) pri dynamických modeloch, napríklad mikrofyziku oblakov, lokálne konvekčné procesy a pod. Poďakovanie. Autori ďakujú za cenné pripomienky anonymným recenzentom a Lucii Hraškovej za gramatické a štylistické korektúry. Tento článok vznikol za podpory Ministerstva školstva, mládeže a telovýchovy v rámci projektu KONTAKT II, číslo LH L i t e r a t ú r a [1] Alexander, M. A., Bladé, I., Newman, M., Lanzante, J. R., Lau, N. -C., Scott, J. D.: The atmospheric bridge: The influence of ENSO teleconnections on air sea interaction over the global oceans. J. Climate 15 (2002), [2] Bjerknes, V.: Dynamic meteorology and hydrology, Part II. Kinematics. Gibson, Carnegie Institute, New York, [3] El Niño Southern Oscillation diagrams [cit ]. Dostupné z: [4] Ghil, M., Allen, M. R., Dettinger, M. D., Ide, K., Kondrashov, D., Mann, M. E., et al.: Advanced spectral methods for climatic time series. Reviews Geophys. 40, (2002), [5] Ghil, M., Robertson, A. W.: Solving problems with GCMs: General circulation models and their role in the climate modeling hierarchy. Academic Press, 2000, [6] Global patterns El Nino-Southern Oscillation (ENSO) [cit ]. Dostupné z: [7] Hannachi, A., Jolliffe, I. T., Stephenson, D. B.: Empirical orthogonal functions and related techniques in atmospheric science: A review. Int. J. Climatol. 27 (2007), [8] Hannachi, A., Stephenson, D. B., Sperber, K. R.: Probability-based methods for quantifying nonlinearity in the ENSO. Clim. Dyn. 20 (2003), [9] Hlaváčková-Schindler, K., Paluš, M., Vejmelka, M., Bhattacharya, J.: Causality detection based on information-theoretic approaches in time series analysis. Phys. Rep. 441 (1) (2007), [10] Chekroun, M. D., Kondrashov, D., Ghil, M.: Stochastic systems by noise sampling, and application to the El Nino-Southern Oscillation. Proc. Natl. Acad. Sci. USA 108 (2011), [11] Kondrashov, D., Kravtsov, S., Robertson, A. W., Ghil, M.: A hierarchy of databased ENSO models. J. Climate 18 (2005), Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 69 (verze )
70 [12] Kravtsov, S., Kondrashov, D., Ghil, M.: Multilevel regression modeling of nonlinear processes: Derivation and applications to climate variability. J. Climate 18 (2005), [13] Lorenz, E. N.: Deterministic nonperiodic flow. J. Atmos. Sci. 20 (1963), [14] McCullagh, P., Nelder, J. A.: Generalized linear models. Chapman and Hall, [15] Meehl, G. A., Covey, C., Delworth, T., Latif, M., McAvaney, B., Mitchell, J. F. B., Stouffer, R. J., Taylor, K. E.: The WCRP CMIP3 multi-model dataset: A new era in climate change research. A Bull. Amer. Meteor. Soc. 88 (2007), [16] Paluš, M.: Multiscale atmospheric dynamics: Cross-frequency phase-amplitude coupling in the air temperature. Phys. Rev. Lett. 112 (2014), 1 5. [17] Paluš, M.: From nonlinearity to causality: statistical testing and inference of physical mechanisms underlying complex dynamics. Contemp. Phys. 48 (2007), [18] Penland, C.: Random forcing and forecasting using principal oscillation pattern analysis. Mon. Weath. Rev. 117 (1989), [19] Penland, C., Ghil, M.: Forecasting northern hemisphere 700-mb geopotential height anomalies using empirical normal modes. Mon. Weath. Rev. 121 (1993), [20] Philander, S. G. H.: El Nino, La Nina, and the southern oscillation. Academic Press, [21] Rayner, N. A., Parker, D. E., Horton, E. B., Folland, C. K., Alexander, L. V., Rowell, D. P., Kent, E. C., Kaplan, A.: Global analyses of sea surface temperature, sea ice, and night marine air temperature since the late nineteenth century. J. Geophys. Res. 108 (2003), [22] Taylor, K. E., Stouffer, R. J., Meehl, G. A.: An overview of CMIP5 and the experiment design. A Bull. Amer. Meteor. Soc. 93 (2012) [23] Theiler, J., Eubank, S., Longtin, A., Galdrikian, B., Farmer, J. D.: Testing for nonlinearity in time series: The method of surrogate data. Phys. D 58 (1992), [24] Timmermann, A., Voss, H. U., Pasmanter, R.: Empirical dynamical system modeling of ENSO using nonlinear inverse techniques. J. Phys. Oceanogr. 31 (2001), [25] Trenberth, K. E., Caron, J. M., Stepaniak, D. P., Worley, S.: Evolution of El Nino Southern Oscillation and global atmospheric surface temperatures. J. Geophys. Res.: Atmospheres 107 (2002), [26] Van den Dool, H. M.: Long-range weather forecasts through numerical and empirical methods. Dyn. Atmos. Oceans 20 (1994), [27] Welch, P. D.: The use of fast Fourier transform for the estimation of power spectra: A method based on time averaging over short, modified periodograms. IEEE Trans. Audio AU-15 (1967), [28] Wetherill, G. B.: Regression analysis with applications. Chapman and Hall, Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 70 (verze )
71 Zprávy oznámení OSMDESÁTINY PROFESORA STANISLAVA MÍKY V dubnu 2017 oslaví osmdesáté narozeniny prof. RNDr. Stanislav Míka, CSc. Narodil se 5. dubna 1937 v Nalžovských Horách. V letech 1952 až 1955 studoval na Vrchlického gymnáziu v Klatovech. V roce 1959 ukončil studium matematiky a fyziky na Fakultě přírodních věd Vysoké školy pedagogické v Praze. V letech 1959 až 1962 působil jako pedagog na jednáctileté střední škole střední všeobecně vzdělávací škole v Tachově. V roce 1962 přešel na Vysokou školu strojní a elektrotechnickou v Plzni. Po listopadu 1989 byl jedním z otců- -zakladatelů Fakulty aplikovaných věd (FAV) a posléze Západočeské univerzity v Plzni (ZČU). Zastával řadu významných akademických funkcí na univerzitní i fakultní úrovni. Byl prvním předsedou akademického senátu ZČU, v letech 1992 až 1999 děkanem FAV a v letech 1999 až 2003 vedoucím katedry matematiky FAV. Jméno Stanislava Míky zůstane navždy spojeno se zavedením a rozvojem nových matematických studijních oborů na ZČU. Přednášel řadu předmětů, mj. numerické metody, speciální numerické metody, numerickou optimalizaci, parciální diferenciální rovnice a matematické modelování. Vytvořil koncepci výuky numerických metod a matematického modelování. Je autorem nebo spoluautorem učebních textů Matematická analýza I (spoluautor Pavel Drábek, ZČU, 1991), Matematická analýza II (spoluautor Pavel Drábek, ZČU, 1991), Matematická analýza III (ZČU, 1993), Numerické metody algebry (SNTL, 1982), Okrajové úlohy pro ODR (spoluautor A. Kufner, SNTL, 1979), Parciální diferenciální rovnice (spoluautor A. Kufner, SNTL, 1983), Numerické metody řešení obyčejných diferenciálních rovnic (spoluautor Petr Přikryl, ZČU, 1994), Numerické metody řešení parciálních diferenciálních rovnic (spoluautor Petr Přikryl, ZČU, 1995). V odborné oblasti se věnoval numerickým metodám pro parciální diferenciální rovnice, publikoval například články zaměřené na numerické modelování dynamiky tekutin a monografii věnovanou modelování transportu částic. Profesor Míka založil tradici mezinárodních seminářů IMAMM (Industrial Mathematics and Mathematical Modelling) a byl klíčovou postavou při realizaci mezinárodních konferencí Modelling. Stanislav Míka po dobu aktivního působení na katedře matematiky vychoval několik svých následovníků, kteří působí v akademické i aplikační sféře. Jubilant je stále aktivní a občas přednáší zajímavé partie z matematického mo- Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 71 (verze )
72 delování studentům FAV ZČU. Je také vždy připraven poskytnout cenné rady mladším kolegům. Milý Stando, přejeme Ti do dalších let pevné zdraví, štěstí a životní optimismus. Marek Brandner, Pavel Drábek ZA FRANTIŠKEM MATYÁŠKEM Dne 18. ledna 2017 jsme se v prostějovském kostele sv. Cyrila a Metoděje rozloučili s naším dlouholetým kolegou a také vedoucím Katedry matematiky na Pedagogické fakultě Univerzity Palackého v Olomouci, RNDr. Františkem Matyáškem, CSc. Šlo nejen o našeho kolegu, ale také o výraznou osobnost fakulty, a proto bychom chtěli připomenout několik údajů z jeho života. František Matyášek se narodil 17. prosince 1931 v Mostě v Čechách, ale brzy se jeho rodina přestěhovala na Moravu do Prostějova, kde František absolvoval reálné gymnázium. Po maturitě v roce 1950 odešel do Prahy studovat matematiku a deskriptivní geometrii na Matematicko- -fyzikální fakultu Univerzity Karlovy. Vysokoškolská studia ukončil v roce Svou pedagogickou činnost zahájil jako učitel na jedenáctileté střední škole v Ostrově nad Ohří a po čtyřech letech byl na vlastní žádost přeložen do Uničova. Od září roku 1960 pak působil na Střední průmyslové škole strojnické v Prostějově. Jeho hluboký zájem o matematiku se projevil v tom, že v roce 1964 úspěšně složil přijímací zkoušky k zařazení do externí aspirantury na Přírodovědecké fakultě UP v Olomouci (obor algebra a teorie čísel). V roce 1966 byl přijat jako odborný asistent na Katedru matematiky Pedagogické fakulty UP, kde vyučoval algebru a geometrii. V roce 1972 složil František Matyášek na Matematicko-fyzikální fakultě UK rigorózní zkoušky v oboru algebra a teorie čísel a získal titul RNDr. Ve studiu svého oboru pokračoval, ale až za dlouhých deset let mohl obhájit svou kandidátskou disertaci v oboru algebra a teorie čísel, a to na téma Některé vlastnosti ternárních algebraických struktur. V roce 1984 mu byl na Matematicko- -fyzikální fakultě UK udělen titul CSc. V listopadu roku 1989 obdržel společně s dalšími 77 pracovníky Pedagogické fakulty UP morální rehabilitaci a bylo mu doporučeno habilitační řízení. V roce 1990 se stal vedoucím Katedry matematiky na Pedagogické fakultě UP, aktivně se zapojil do života fakulty i univerzity, stal se členem Akademického senátu Pedagogické fakulty UP a brzy poté byl zvolen předsedou fakultního Akademického senátu. Svou odbornou činnost shrnul ve čtyřech monografiích, publikoval však i odborné stati, především ve sbornících UP, a pro posluchače matematiky připravil vhodné studijní materiály. Bezesporu zaujme i jeho přístup k řešení nejen odborných, ale také metodických otázek, souvisejících s výukou matematiky. Celým jeho dílem proniká hluboký zájem o filozofii matematiky. Zvláštní pozornost věnoval F. Matyášek i historii matematiky. Svých znalostí využíval rovněž při působení na letních školách mladých matematiků. Angažoval se jako člen Jednoty českých matematiků a fyziků a za jeho práci mu bylo v roce 2014uděleno čestné uznání. Všichni spolupracovníci i přátelé, kteří se s Františkem Matyáškem setkávali, si na něj zachovají vzpomínku jako na pracovitého, skromného a čestného člověka, ochotného vždy poradit i pomoci, na člověka se zvláštním osobitým humorem. Rádi jsme s ním spolupracovali a děkujeme mu za všechno, co nám stačil předat. Milan Kopecký a kolektiv spolupracovníků 72 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 72 (verze )
73 PROFESOR JAROSLAV ZEMÁNEK ( ) Z Varšavy přišla smutná zpráva, že zemřel významný matematik profesor Jaroslav Zemánek. Jaroslav Zemánek se narodil v roce 1946 v Praze. Od mládí projevoval velký zájem a talent pro matematiku. Pravidelně se účastnil matematických olympiád a v letech 1963 a 1964 úspěšně i mezinárodního kola. Po absolvování MFF UK pracoval v letech v Matematickém ústavu ČSAV jako odborný a vědecký pracovník. Souběžně byl doktorandem prof. W. Żelazka v Matematickém ústavu Polské akademie věd, kde obhájil svou doktorskou práci v roce Od roku 1982 pak působil v Matematickém ústavu Polské akademie věd, který je prestižním matematickým centrem. V roce 1985 se zde habilitoval a v roce 1996 se stal profesorem. Jaroslav Zemánek je autorem celkem 74 vědeckých prací, které byly publikovány v předních mezinárodních časopisech. Jeho centrálním oborem zájmu byly Banachovy algebry, kde dosáhl hlubokých výsledků. Uveďme alespoň jeho charakteristiku komutativních algeber pomocí spektrálních vlastností nebo výsledky o idempotentech a quasinilpotentech v Banachových algebrách. Další významné výsledky se týkají konvergence výrazů typu lim n g(t n ) 1/n, kde T je operátor v Banachově prostoru a g vhodná geometrická charakteristika operátoru (jde o analogii známého vzorce pro spektrální poloměr). Prof. Zemánek se dále zabýval numerickými obrazy operátorů, ergodickou teorií, semigrupami operátorů a v poslední době Volterrovým operátorem. Jaroslav Zemánek byl editorem 6 matematických časopisů včetně Czechoslovak Mathematical Journal a Mathematica Slovaca. Dlouhodobě vedl seminář Teorie operátorů v Matematickém ústavu ve Varšavě a byl školitelem 7 doktorandů. Byl organizátorem četných matematických konferencí, laureátem Hlavní ceny Polské matematické společnosti a koordinátorem programu TODEQ (Marie Curie, Evropská unie). Po celý život zůstal členem JČMF, o jejíž činnost se vždy zajímal a úzkostlivě dbal, aby nezmeškal zaplatit včas členské příspěvky (v tom může být příkladem i pro nás domácí členy). Pro Jaroslava byla vždy matematika středem zájmu a jeho nejoblíbenějším místem byla matematická knihovna. Měl neobyčejně rozsáhlou znalost literatury. Myslím, že jedním z důvodů jeho přestěhování do Polska byla proslulá varšavská matematická knihovna. V knihovně se seznámil i se svou manželkou, se kterou měl až dojemně hezký vztah. Jeho manželka zemřela jen pár týdnů před ním. Kromě matematiky byla velkou láskou Jaroslava astronomie. Doma měl hvězdářský dalekohled, navštěvoval pravidelně odborné přednášky a vždy se zajímal o místa spojená s historií astronomie, především s působením Koperníka, Tychona Brahe a Keplera. Další láskou Jaroslava byly knihy. Ve velkém množství nakupoval knihy v různých jazycích s tím, že si je přečte, až bude v penzi. Bohužel to asi nestihl. PROF. MIKULÁŠEK ZÍSKAL NUŠLOVU CENU Vladimír Müller Prof. RNDr. Zdeněk Mikulášek, CSc., získal dne 13. prosince 2016 Nušlovu cenu České astronomické společnosti. Z laudatia vyjímáme: Zdeněk Mikulášek vystudoval fyziku na Přírodovědecké fakultě MU v Brně v letech Po promoci působil nejprve jako asistent v oboru fyzika na VUT Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 73 (verze )
74 v Brně a v letech jako odborný pracovník na Hvězdárně a planetáriu M. Koperníka v Brně. V roce 1980 obhájil v Astronomickém ústavu ČSAV v Ondřejově kandidátskou práci Studium pekuliární hvězdy CQ UMa a o rok později získal akademický titul RNDr. na UK v Praze. Hned po převratu byl na základě výběrového řízení jmenován ředitelem Hvězdárny a planetária M. Koperníka v Brně, kterou neobyčejně povznesl na významné osvětové, ale i odborné astronomické zařízení. Již od roku 1995 však začal souběžně přednášet jako odborný asistent na Přírodovědecké fakultě MU astronomii a astrofyziku. V roce 2001 se na MU habilitoval na základě práce Úvod do fyziky hvězd a hvězdných soustav, roku 2012 byl jmenován profesorem. Ve své vědecké práci se věnoval zejména výzkumu chemicky pekuliárních hvězd, zákrytovým proměnným hvězdám a studiu změn astroklimatu. Jako dlouholetý garant astronomické a astrofyzikální výuky v rámci studijního programu fyzika na Přírodovědecké fakultě MU se stal autorem řady kurzů a skript napsaných velmi moderně a pro studenty atraktivně, což vedlo k vysokému nárůstu studentů astronomie a astrofyziky na MU. Před jeho příchodem totiž subkatedra astronomie skomírala. Od roku 2002 byl hlavním řešitelem řady projektů GA ČR, školitelem bakalářských, magisterských i doktorských studentů a od roku 2009 je předsedou komise pro státní rigorózní zkoušky na Přírodovědecké fakultě MU. Působí také jako oponent a člen atestačních komisí v dalších českých i slovenských astronomických institucích. Je členem Mezinárodní astronomické unie i České astronomické společnosti. Jeho druhou profesí je pěstování vážné hudby. V roce 1994 založil hudební soubor Komorní dechová harmonie Brno a až dosud je jeho uměleckým vedoucím. Soubor nezřídka vystupuje i na národních či mezinárodních astronomických akcích. Prof. Mikulášek publikoval od r do současnosti podle databáze ADS 172 vědeckých prací, které až dosud získaly 709 citací, tj. 4,1 citace na práci. Jeho Hirschův index H je roven 14. V řadě prací je prvním autorem a týmy, které se na publikacích podílejí, jsou často výrazně mezinárodní jeho spoluautory jsou slovenští, němečtí, čínští, ruští, italští, japonští, chorvatští, turečtí aj. astronomové. Brněnské univerzitní pracoviště se tak stalo významným současným českým vědeckým centrem, jak o tom svědčí i mezinárodní konference pořádané v Brně nebo brněnskými astronomy organizované např. v Litomyšli. Prof. Mikulášek se rovněž významně zasloužil o popularizaci astronomie. Je jediným žijícím spoluautorem českého unikátu knihy tří Zdeňků Sto astronomických omylů uvedených na pravou míru, vydané nakladatelstvím Svoboda v roce 1988 v rekordním nákladu 135 tisíc výtisků. Je však také oblíbeným řečníkem při veřejných přednáškách i na astronomických konferencích, který dokáže doslova uhranout své posluchače originálními způsoby, jak jim přiblížit astrofyzikální tematiku. Právem také získal v roce 2008 cenu ČAS Littera astronomica. Od r nese jeho jméno planetka č Prof. Mikulášek je příkladem badatele se širokým rozhledem, který mohl uplatnit naplno své vědecké, pedagogické a řídící schopnosti teprve od svých 43 let. Stále pracuje na plný úvazek a stal se významnou postavou naší současné astronomie. To jsou důvody, pro které mu Česká astronomická společnost uděluje své nejvyšší ocenění Nušlovu cenu ČAS za rok Jiří Grygar 74 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 74 (verze )
75 UDĚLENÍ CENY PROFESORA IVA BABUŠKY ZA ROK 2016 Ve čtvrtek 22. prosince 2016 udělily Česká společnost pro mechaniku a Jednota českých matematiků a fyziků již po třiadvacáté Cenu profesora Iva Babušky za nejlepší práci v oboru počítačových věd pro studenty a mladé vědecké pracovníky. Cenu založil v roce 1994 významný český matematik Ivo Babuška. Od podzimu 1968 působí profesor Babuška ve Spojených státech amerických, nyní v Institute for Computational Engineering and Sciences, University of Texas, Austin. U příležitosti 90. narozenin prof. Babušky se na University of Texas konala ve dnech 21. a 22. března 2016 mezinárodní vědecká konference Advances in Mathematics of Finite Elements. Cenu profesora I. Babušky za rok 2016 získal RNDr. Adam Kosík, Ph.D., z Matematicko-fyzikální fakulty UK v Praze za doktorskou disertační práci Fluid-structure interaction. V práci se zkoumají metody numerického modelování 2D interakce proudící stlačitelné vazké tekutiny a elastického tělesa. Diskretizace úlohy je provedena nespojitou Galerkinovou metodou. Mezi numerickými experimenty uvádí autor i modely kmitání lidských hlasivek. Současně byla udělena další čestná uznání. Druhé místo přisoudila komise Ing. Radku Štefanovi, Ph.D., z Fakulty stavební ČVUT v Praze za disertaci Transport processes in concrete at high temperatures. Třetí a čtvrté místo obsadili rovným dílem Ing. Václav Hapla, Ph.D., se svou doktorskou disertací Massively parallel quadratic programming solvers with applications in mechanics a Ing. Michal Merta, Ph.D., s prací Parallel boundary element methods in space and time. Oba své práce obhájili na Fakultě elektrotechniky a informatiky VŠB-TU Ostrava. Čestné uznání bylo uděleno též v kategorii diplomových a bakalářských prací. Rozhodnutím hodnotitelské komise je získal Bc. Jakub Kružík z Fakulty elektrotechniky a informatiky VŠB-TU Ostrava za svou bakalářskou práci Parallelizations of TFETI-1 coarse problem. Cena i uznání jsou udíleny každoročně a jsou spojeny s finanční odměnou. nové knihy Karel Segeth JOHANNES KEPLER: O ŠESTIÚHELNÉ SNĚHOVÉ VLOČCE POUTAVÉ ČTENÍ O NIČEM Z latiny přeložil Petr Daniš Matfyzpress, Praha, 2016, 94 stran, ISBN Útlá knížečka malého formátu (A6) je zajímavě uspořádaná. Po krátké předmluvě z pera prof. Valvody následuje vlastní Keplerův text ve dvou jazykových verzích uspořádaných po dvojicích stránek. Nejprve se nalézá originální latinský text a na Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 75 (verze )
76 protilehlé stránce jeho český překlad. V závěru čtenář najde stručnou poznámku překladatele a především ho potěší bezprostředně navazující doplněk Aleny Šolcové Kepler a Praha. Najde zde četné zajímavé informace, mj. i jakéhosi průvodce ve smyslu kudy chodil Kepler po Praze. Zde evidentně jde o nezanedbatelný příspěvek z hlediska pražské historie a kulturních dějin naší metropole. Nyní však již stručně k vlastnímu Keplerovu textu. Nebyl autorem zřejmě míněn jako vědecká práce, a to ani v dobovém smyslu. Je adresován jako osobní novoroční dárek Veleváženému kancléři Jeho Císařské Milosti panu Janu Matoušovi Wackerovi z Wackenfelsu, rytíři Zlaté ostruhy, podporovateli literátů a filosofů, mému pánu a patronu. Tomu odpovídá i styl autorova psaní, jenž velmi často zabíhá do osobních poloh. Kepler velice půvabným způsobem vyjadřuje svoji snahu pojednat o ničem chce zejména udělat adresátovi potěšení, a právě k tomu se nicotné jeví jako vhodné, neboť musí být sice malé, bezcenné a pomíjivé, ale právě proto může být půvabně lehké a vesele hravé. V mysli nám zde mohou vytanout slova malé je hezké či malé je milé a s nimi jedna z kultovních knih druhé poloviny 20. století (E. F. Schumacher: Small is beautiful: a study of economics as if people mattered, Harper & Row, 1973). V dnešním smyslu bychom mohli říci, že Kepler takto velebí zdánlivě maličké detaily v rámci ohromující, ale chladné celkové reality. Někomu se zde možná vybaví zajímavé peripetie z historického vývoje vědeckého poznání, kdy se mnohdy zdálo, že téměř vše je vyřešeno, chybí pouze zodpovědět několik drobností. Avšak právě tyto zdánlivé drobnosti posléze otevřely dveře do nových, dříve zcela netušených, sfér poznání světa a vedly k novým paradigmatům vědy. Kepler ve smyslu dobového chápání světa zmiňuje čtyři živly, půvabnými argumenty pak z nich pro svůj účel vybírá vodu, konkrétně její kapku, jež se může jevit jako nicotná, ale již svým tvarem slibuje rozpravu o geometrii. Od kapky je pak již jen malý myšlenkový krůček k šestiúhelné zmrzlé vločce. Kepler dále připomíná příhodu, kdy mu na oděvu ulpělo několik padajících ledových hvězdiček o šesti paprscích. Právě tato celkově bezvýznamná událost se zřejmě fakticky stala mocným impulsem pro jeho hloubavou mysl. Kvantitativně největší část právě uvažovaného Keplerova dílka se zabývá roztomilými úvahami o geometrických tvarech trojrozměrných těles nebo rovinných (dvourozměrných) obrazců. Zde se evidentně jeví autorova pochopitelná ideová závislost na dobových platonských představách o ideálních tělesech, obrazcích a jejich tvarech. Znalci historie astronomie si zde možná připomenou, jak se obdobná schémata u Keplera rovněž uplatňovala při jeho zdůvodňování a interpretacích zákonitostí oběžných drah planet, které ovšem fakticky formuloval na základě objektivních pozorování. Pozoruhodné jsou Keplerovy úvahy ohledně úloh, jak různá tělesa (koule, mnohostěny) nebo plošné obrazce (kruhy, čtyřúhelníky, mnohoúhelníky) mohou optimálně (co nejefektivněji) vyplnit prostor či rovinu. V těchto souvislostech lze formulovat řadu matematických úloh, o čemž možno v historii matematiky nalézt četné doklady. Pro poučení v tomto směru můžeme čtenáři doporučit např. článek T. C. Hales: Dělové koule a včelí plásty, PMFA 46 (2001), Sympaticky působí zejména zřejmá živelná chuť a radostná hravost, s nimiž Kepler k úvahám tohoto druhu přistupuje a doslova se zde bezprostředním způsobem vyžívá. Za zvláštní zmínku rovněž stojí jeho důraz kladený na přirozenou krásu zákonitostí ve světě přírody, mnohdy se dokonce zdá, 76 Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 76 (verze )
77 že hlediska krásy preferuje nad hledisky účelnosti. Krása však nikdy u něho není protikladem účelu, spíše naopak. Co však na právě zmiňovaném Keplerově způsobu uvažování nejvíce vyzdvihnout? Dle názoru autora této recenze především skutečnost, že Kepler spatřuje tvar šesticípé hvězdice sněhové vločky jako výslednici vnitřních snah vodní páry a vnějšího působení. Oba tyto okruhy vlivů naplňuje obsahem s četnými detaily, jež pochopitelně plně vycházejí z dobových filosofických a estetických představ založených na interpretacích antických (především platonských) myšlenek. Vezmeme-li však za svůj takto vytvořený formální rámec, můžeme ho konkrétně naplnit i soudobou fyzikou. Onou vnitřní složkou působení je pak, nám již delší dobu známá, neobyčejná schopnost molekul vody vytvářet složité a mnohočetné struktury svých síťových uspořádání, a to jak v kapalné vodě, tak především ve strukturách ledu. U základu všech takovýchto podivuhodných vlastností stojí specifická, prostorově trojúhelníková podoba molekuly vodní páry a její elektrická polarita. Zde jenom pro připomenutí: V právě zmíněné trojúhelníkové molekule vody se atomy vodíku nalézají ve vrcholech při základně rovnoramenného trojúhelníku a atom kyslíku má svoji polohu ve třetím vrcholu. Celá molekula pak představuje elektrický dipól, přičemž se její vodíkový konec jeví jako kladný, zatímco kyslíkový konec jako záporný pól. Jako vnější faktory působení ve smyslu Keplerova uvažování můžeme dnes zahrnout termodynamiku fázových přechodů, o níž pochopitelně Kepler ve své době na přelomu 16. a 17. století nemohl nic vědět. Dnešní fyzika oblaků však v této souvislosti dospěla během svého vývoje v průběhu 20. století k jasnému pochopení vztahů tvarů vyvíjejících se ledových oblačných částic a vnějších podmínek daných teplotními a vlhkostními parametry oblačného vzduchu. Velký počet postupně uskutečněných experimentálních měření, jak v laboratorních podmínkách, tak v reálných oblacích, i dnešní náročné počítačové simulace, vycházející z teoretických termodynamických zákonitostí, ukazují, že ledové částice ve tvaru šesticípé hvězdice se nejvíce vytvářejí při teplotách oblaku kolem 15 C a koncentracích vodní páry odpovídajících několikaprocentnímu přesycení vůči fázovému rozhraní led vodní pára. Tomu v našich zeměpisných šířkách zpravidla dobře vyhovují typické zimní podmínky v oblacích. Za poněkud jiných teplotních a vlhkostních poměrů se hojně objevují i tvary šestibokých sloupků nebo šestiúhelníkových destiček, a to v mnoha dílčích detailních variantách (např. sloupky zakončené jehlanci) a vzájemných kombinacích. Ze všech právě dotčených i dalších důvodů lze Keplerův drobný spisek doporučit všem fyzikálně gramotným čtenářům, a to nejen pro ušlechtilou zábavu, ale zřejmě i pro užitečná poučení rozšiřující obzory obecného poznání. Čtenáři, který by se chtěl blíže informovat o soudobé problematice vzniku a formování ledových částic v oblacích (a též o jejím vývoji v průběhu 20. století), lze mj. doporučit následující tři obsáhlé monografie učebnicového charakteru: Podzimek, J.: Fysika oblaků a srážek. Nakl. ČSAV, Praha, Curry, J. A., Webster, P. J.: Thermodynamics of atmospheres and oceans. Academic Press, Řezáčová, D., a kol.: Fyzika oblaků a srážek. Academia, Praha, Jan Bednář Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 77 (verze )
78 ZE IVOTA JÈMF JUBILEA 60 let Prof. RNDr. Bohdan Maslowski, DrSc. (Praha) RNDr. Miroslav Mašláň, CSc. (Olomouc) Prof. Ing. Radim Briš, CSc. (Praha) Doc. RNDr. Roman Kubínek, CSc. (Olomouc) Miloslav Machálek (Brno) doc. RNDr. Marek Wolf, CSc. (Praha) let RNDr. Milada Hudcová (Brno) Prof. RNDr. Jan Kohout, CSc. (Brno) Mgr. Jana Hanušová (Středočeská pobočka) RNDr. Stanislav Žák, CSc. (Praha) PhDr. Michaela Kaslová (Praha) Prof. RNDr. Pavel Pudlák, DrSc. (Praha) Doc. RNDr. Josef Benda, CSc. (Praha) Mgr. František Šíma, Ph.D. (České Budějovice) RNDr. Helena Husová, CSc. (Praha) PaedDr. Bc. František Jáchim (České Budějovice) let Mgr. Jiřina Bouchalová (Opava) Prof. RNDr. Jiří Rachůnek, DrSc. (Olomouc) Mgr. Marie Hladíková (Pardubice) RNDr. Vojtěch Kadlčík (České Budějovice) Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 78 (verze )
79 Doc. RNDr. Jindřich Bečvář, CSc. (Praha) RNDr. Jan Petrů, CSc. (Praha) Marie Hellmuthová (Pardubice) Doc. RNDr. Jaroslav Seibert, CSc. (Hradec Králové) RNDr. Jan Maršák, CSc. (Praha) Doc. RNDr. Pavel Burda, CSc. (Ostrava) Prof. RNDr. Pavel Pták, DrSc. (Praha) RNDr. Anna Mašková, CSc. (Praha) Prof. RNDr. Jiří Rohn, DrSc. (Praha) RNDr. Miloš Demjanenko, CSc. (Praha) RNDr. Ivan Sklenář, CSc. (Praha) let RNDr. Vladislav Navrátil (Brno) Ing. Arnošt Veselý, CSc. (Praha) Prof. Ing. Zdeněk Votruba, CSc. (Praha) Prof. RNDr. Svatoslav Staněk, CSc. (Olomouc) RNDr. Jaroslav Pančocha (Zlín) Prof. Ing. Ivan Wilhelm, CSc. (Praha) Mgr. Tomáš Denkstein (Ústí nad Labem) Prof. RNDr. Josef Pešák, CSc. (Olomouc) Prof. RNDr. Petr Přikryl, CSc. (Praha) Prof. RNDr. Pavel Tománek, CSc. (Brno) Prof. Ing. Antonín Víteček, CSc. (Ostrava) Mgr. Pavel Hrkal (České Budějovice) Doc. RNDr. Jan Obdržálek, CSc. (Praha) PhDr. Jan Rezek, CSc. (Praha) let Prof. RNDr. Stanislav Míka, CSc. (Plzeň) Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č Strana 79 (verze )
80 Prof. Ing. Bohumil Vybíral, CSc. (Hradec Králové) RNDr. Luděk Bočánek (Brno) Ing. Libuše Pajasová (Praha) Vladimír Valenta (Hradec Králové) RNDr. Alena Brožková (Ostrava) prom. mat. Anastázie Kovářová (Liberec) RNDr. Stanislav Synek, CSc. (Brno) Prof. RNDr. František Neuman, DrSc. (Brno) Milada Hlaváčová (Praha) Prof. RNDr. František Kuřina, CSc. (Hradec Králové) doc. Ing. Ladislav Krlín, DrSc. (Praha) let Prof. RNDr. Ladislav Štourač, DrSc. (Praha) let Prof. Ing. Felix Kolmer, DrSc. (Praha) Jubilantům srdečně blahopřeje předsednictvo výboru JČMF 85 let Pavel Fejfar (Ústí nad Labem) Prof. RNDr. Vlastislav Červený, DrSc. (Praha) Prof. RNDr. Jan Fischer, CSc. (Praha) RNDr. Stanislav Maloň, CSc. (Praha) Pokroky matematiky, fyziky a astronomie, ročník 62 (2017), č. 1 Strana 80 (verze )
Stručný průvodce statistickými intervaly
Stručný průvodce statistickými intervaly Martin Otava, Beerse Abstrakt. Statistické intervaly představují rozšířenou metodu k popisu nejistoty, avšak jejich přesná interpretace může být pro laika obtížná.
Nobelova cena za fyziku v roce 2016 podivné jevy v plochém světě
Nobelova cena za fyziku v roce 2016 podivné jevy v plochém světě Joanna Rose Abstrakt. Laureáti Nobelovy ceny za fyziku v roce 2016 otevřeli dveře do neznámého světa, v němž hmota existuje v podivných
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr
StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která
Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
STATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Pearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
ÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Intervalové Odhady Parametrů II Testování Hypotéz
Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti
ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Statistika pracuje s tzv. HROMADNÝMI JEVY cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů: velkého počtu jedinců
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
I. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce
Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života
Přijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,
Fyzikální korespondenční seminář MFF UK
Úloha I.S... náhodná 10 bodů; průměr 7,04; řešilo 45 studentů a) Zkuste vlastními slovy popsat, co je to náhodná veličina a jaké má vlastnosti (postačí vlastními slovy objasnit následující pojmy: náhodná
p(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.
Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom
Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
Normální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
Experimentální realizace Buquoyovy úlohy
Experimentální realizace Buquoyovy úlohy ČENĚK KODEJŠKA, JAN ŘÍHA Přírodovědecká fakulta Univerzity Palackého, Olomouc Abstrakt Tato práce se zabývá experimentální realizací Buquoyovy úlohy. Jedná se o
Diagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
STATISTICKÉ HYPOTÉZY
STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude
Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Téma 2: Pravděpodobnostní vyjádření náhodných veličin
0.025 0.02 0.015 0.01 0.005 Nominální napětí v pásnici Std Mean 140 160 180 200 220 240 260 Std Téma 2: Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Pravděpodobnostní posuzování
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
Teorie náhodných matic aneb tak trochu jiná statistika
Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr