Úloha III.S... limití 10 bodů; průměr 7,81; řešilo 6 studetů a) Zkuste vlastími slovy popsat postup kostrukce itervalových odhadů středí hodoty v případě obecého rozděleí měřeých dat (postačí vlastími slovy popsat ásledující: cetrálí limití věta a předpoklady jejího použití, kovariace a korelace (a jejich odhady), vícerozměrá cetrálí limití věta a předpoklady jejího použití, záko šířeí ejistot a kdy ho lze použít). Neí potřeba uvádět přesá matematická odvozeí, stačí požadovaé pojmy a vlastosti stručě popsat. b) V přiložeém datovém souboru merei3-1.csv ajdete výsledky měřeí určité fyzikálí veličiy v. Předpokládejme, že si emůžeme být jisti, zda mají měřeá data ormálí rozděleí. Vyjádřete ejistotu měřeí této fyzikálí veličiy (ejistotu typu B euvažujte), zkostruujte itervalové odhady a základě CLV a stručě iterpretujte jeho výzam. Jak by se změily výsledky a iterpretace, pokud bychom měli k dispozici je čtvrtiu měřeí (řekěme prví čtvrtiu dat z datového souboru)? c) Předpokládejme, že aším cílem je aměřit fyzikálí veličiy a y, které budeme chtít využít pro dosazeí do vzorce v = 1 y. Předpokládejme, že díky zalosti způsobu měřeí jsme si jisti, že jsou všecha měřeí a sobě ezávislá a ze zpracováí aměřeých dat měřeí máme ásledující výsledky, které jsou založey a velkém počtu měřeí (více ež 30 měřeí každé fyzikálí veličiy) = (5, ± 0,1), y = (1,84 ± 0,06). Určete odhad fyzikálí veličiy v a ejistotu měřeí fyzikálí veličiy v. Nápověda: Mohly by se vám hodit ásledující vztahy: ( ) 1 y = 1 y, ( ) 1 y y = y. d) Pomocí simulace ve výpočetím prostředí R demostrujte platost cetrálí limití věty. Tj. geerujte -tice ezávislých realizací áhodé veličiy, která emá ormálí rozděleí (pro teto případ použijte epoeciálí, rovoměré a Poissoovo rozděleí s libovolě zvoleými parametry) a a histogramu ukažte, že pokud a data provedeme ásledující trasformaci µ S, takto trasformovaá data už budou rozdělea přibližě podle ormálího rozděleí N(0, 1). (Součástí hodoceí bude i hodoceí vzhledu grafů zejméa vhodě zvoleé popisky os a legeda.) Bous: Předpokládejme, že aším cílem je aměřit fyzikálí veličiy a y, které budeme chtít dosadit do vzorce v = si y. 1
Uvažujme ejobecější model měřeí (tj. měřeá data emají ormálí rozděleí a měřeí růzých fyzikálích veliči a sobě mohou být závislá). V datovém souboru merei3-.csv máme výsledky měřeí fyzikálích veliči a y, určete ejistotu určeí veličiy v a zkostruujte pro i itervalový odhad. Michal se pokusil vymyslet limitě těžké zadáí seriálové úlohy. a) Detailí odpověď a tuto otázku dostaete pouze přečteím 3. dílu seriálu, v tomto vzorovém řešeí uvedeme je ty ejdůležitější věci. Cetrálí limití věta je důležitá pro zpracováí měřeých dat (zejméa pro itervalový odhad středí hodoty), o kterých si emůžeme být jisti, že mají ormálí rozděleí. Pokud si ozačíme měřeá data jako 1,..., potom cetrálí limití věta říká, že ásledující trasformace ašich dat (musíme si uvědomit, že jde o áhodou veličiu, eboť závisí a áhodých datech a emůžeme tedy dopředu zát její hodotu) µ S koverguje v distribuci k rozděleí N(0, 1), ezávisle a tom, jaké rozděleí 1 měla aše původí data. Matematicky zapsáo platí µ S D N(0, 1). Pokud chceme v prai používat aproimace založeé a CLV, musíme si uvědomit, že potřebujeme mít dostatečě velký počet měřeí, aby byla takováto aproimace přesá. Obecé pravidlo zí: Pokud máme alespoň 30 měřeí, potom je aproimace pomocí CLV velice přesá. Pokud máme alespoň 10 měřeí, potom je aproimace pomocí CLV pouze přibližá, ale stále poměrě přesá. Pokud máme méě ež 10 měřeí, potom může být aproimace pomocí CLV začě epřesá. Pokud měříme více fyzikálích veliči ajedou, musíme se zabývat také tím, zda ejsou aše měřeí závislá. Závislost ašich měřeí (tedy vlastě áhodých veliči) měříme pomocí kovariace a korelace, které jsou pro dvě áhodé veličiy X a Y defiováy ásledově cov(x, Y ) = E [(X EX)(Y EY )], corr(x, Y ) = (X, Y ) = cov(x, Y ) var(x) var(y ). Korelace je vhodě zormovaá kovariace (může abývat je hodot od 1 do 1) a vyjadřuje, jak moc jsou áhodé veličiy lieárě závislé (hodoty kolem 0 začí malou závislost, hodoty blízké 1 ebo 1 začí velkou závislost). Pokud jsou veličiy X a Y ezávislé, potom je kovariačí i korelačí koeficiet rove 0 (obráceá implikace ale eplatí). V prai je 1 Ve skutečosti je zde ještě podmíka a koečý rozptyl.
důležité vědět, jak z aměřeých dat odhadovat kovariačí a korelačí koeficiet. K tomu slouží výběrový kovariačí koeficiet (resp. výběrový korelačí koeficiet) defiovaý jako ĉov(x, Y ) = ĉorr(x, Y ) = ( i ) (y i y ), i=1 i=1 ( i ) (y i y ). S X, SY, Na tomto místě musíme pozameat, že při výpočtu výběrového kovariačího (resp. korelačího) koeficietu musíme vždy používat dvojice odpovídajích si měřeí. Nelze postupovat tak, že si měřeí libovolě popárujeme. Eistuje i vícerozměrá verze CLV, která se zaobírá případem, kdy chceme změřit k fyzikálích veliči v (1),..., v (k), dosadit je do vzorce v = f ( v (1),..., v (k)) a ásledě chceme určit ejistotu měřeí fyzikálí veličiy v a kostruovat pro i itervalové odhady. Vícerozměrá cetrálí limití říká, že v tomto případě platí ( ) f v (1),..., v (k) f ( v (1),..., v (k)) D N(0, 1), S kde v (i) je výběrový průměr měřeí i-té fyzikálí veličiy, v (i) je skutečá hodota i-té fyzikálí veličiy a S je vhodý ormalizačí koeficiet, který se spočte podle vzorce S = ( f v (1) (v) f (v) ) v (k) s 1 ĉov(v (),v (1) ) 1. ĉov(v (1),v (k) ) 1 k ĉov(v (),v (k) ) k...... ĉov(v (k),v (1) ) k 1 s k f (v) v (1). f (v) v (k), (1) kde v = ( ) v (1) 1,..., v (k) k. Pro použití vícerozměré CLV opět platí podobá pravidla jako pro použití jedorozměré CLV, tedy: Pokud máme alespoň 30 měřeí každé fyzikálí veličiy v (1),..., v (k), potom je aproimace pomocí vícerozměré CLV velmi přesá. Pokud máme alespoň 10 měřeí každé fyzikálí veličiy, potom je aproimace pomocí vícerozměré CLV pouze přibližá, ale stále poměrě přesá. Pokud máme méě ež 10 měřeí ějaké fyzikálí veličiy, potom může být aproimace pomocí vícerozměré CLV začě epřesá. 3
V případě, že si ze zalosti průběhu eperimetu můžeme být jistí, že jsou všecha měřeí růzých fyzikálích veliči a sobě ezávislá (což je v prai velmi časté), se vzorec a výpočet čleu S velmi zjedoduší a tvar ( ) S = f v (1) ( ) 1 s (1) 1 + + f v (k) k s (k) k. v (1) v (k) Tomuto vzorci se často říká záko šířeí ejistot (případě záko propagace ejistot). V obou případech můžeme kostruovat itervaly spolehlivosti pro výsledou fyzikálí veličiu v. Ze zěí vícerozměré CLV lze odvodit, že platí P ( f ( v (1) ),..., v (k) u 1 α S < f ( v (1),..., v (k)) ( < f v (1) ),..., v (k) ) + u 1 α S 1 α. Tedy itervalový odhad pro skutečou hodotu výsledé fyzikálí veličiy v bude mít tvar ( ( ) ) f,..., v (k) ± u 1 α S v (1) Fyzikové teto itervalový odhad zapisují zkráceě je jako (f (v ) ± S) a čleu S říkají stadardí odchylka. b) V přiložeém datavém souboru se achází 40 aměřeých dat, se kterými budeme pracovat. Nejprve musíme spočítat výběrový průměr ašich dat podle vzorce 40 = 1 40 40 i=1 i = 9,86. Dále spočítáme výběrovou směrodatou odchylku průměru podle vzorce s 40 = 1 40 ( i ) = 0,036. 40(40 1) i=1 V ašem případě, kdy euvažujeme žádou ejistotu typu B, vyjadřuje výběrová směrodatá odchylka ejistotu měřeí. Podle teorie odvozeé v seriálu bude mít asymptotický itervalový odhad založeý a CLV o spolehlivosti (1 α) tvar ( ± s u 1 α ). Pokud použijeme stadardí zkráceý zápis, vyjde ám ásledující výsledek (9,83 ± 0,04). Jelikož jsme použili velké možství dat (tj. více ež 30), bude aproimace pomocí CLV už velice přesá. Tedy takovýto iterval bude mít pravděpodobost pokrytí skutečé hodoty měřeé fyzikálí veličiy velice blízkou 68%. 4
Pokud bychom uvažovali, že máme k dispozici je prví čtvrtiu měřeí (tj. prvích 10 měřeí), dostali bychom jié hodoty výběrového průměru a výběrové směrodaté odchylky průměru. Kokrétě bychom dostali 10 = 9,9, s 10 = 0,06. Itervalový odhad pro měřeou fyzikálí veličiu by v tomto případě byl ásledující (používáme zkráceý zápis) (9,9 ± 0,06). Je zřejmé, že za použití jiých vstupích dat dostaeme jié číselé výsledky (i a tomto je vidět, že výběrový průměr a výběrová směrodatá odchylka průměru jsou áhodé veličiy). V tomto případě jsme provedli méě měřeí, takže jsme vcelku logicky dostali větší ejistotu měřeí. V tomto případě je ale uté pozameat, že áš itervalový odhad byl založe a poměrě málo měřeích (je 10 měřeí), takže v tomto případě aproimace pomocí CLV emusí být tolik přesá. Teto iterval má tedy pravděpodobost pokrytí skutečé hodoty měřeé fyzikálí veličiy pouze přibližě 68%. c) Odhad fyzikálí veličiy v se zkostruuje jedoduše tak, že do fukce f dosadíme odhady fyzikálích veliči a y. V ašem případě dostaeme v = f (, y ) = 1 5, 1,84 = 48,65. V tomto speciálím případě, kdy můžeme měřeí růzých fyzikálích veliči považovat za ezávislé, můžeme a výpočet ejistoty měřeí fyzikálí veličiy v použít záko šířeí ejistot. Všechy potřebé údaje máme zadaé, takže stačí dosadit. V tomto vzorovém řešeím budeme dosazováí dělat postupě, aby bylo všem jasé, jak jsme a áš výsledek přišli. S = = ( f ( ) ) s () + ( f (y ) y ) s (y) = ( 1 y ) s () ( ) 1 1,84 0,1 + (5, 1,84) 0,06 = 9,165. + (y ) s (y) Když bychom měli zapsat itervalový odhad pro fyzikálí veličiu v ve zkráceém tvaru, vypadal by ásledově (49 ± 9). d) S využitím výpočetího prostředí R provedeme přesě to, co se píše v zadáí. Nejprve si zvolíme přirozeé číslo. Toto číslo bude v ašem modelu představovat počet měřeí, které při kokrétím eperimetu provádíme (budeme volit hodoty v řádu ízkých desítek ebo jedotek, což je typický počet měřeí při fyzikálích eperimetech). Dále zvolíme počet opakováí aší simulace (ideálě zvolit co ejvyšší, v ašem případě zvolíme 10 000). Nyí už můžeme začít se samotou simulací. V každé jedotlivém cyklu vygeerujeme ezávislých realizací áhodé veličiy s určitým rozděleím, které eí ormálí (v ašem případě používáme rozděleí Ep(), R(0, 10) a P oiss()). Z těchto realizací spočteme ásledující trasformaci t = µ S, () = 5
kde µ představuje skutečou středí hodotu rozděleí, ze kterého jsme geerovali použité realizace áhodé veličiy (tedy 1 u epoeciálího rozděleí, 5 u rovoměrého rozděleí a u Poissoova rozděleí). Toto opakujeme celkem 10 000krát, čímž získáme trasformace t 1,..., t 10 000. Pokud cetrálí limití věta platí, potom by mělo být rozděleí takto trasformovaých dat velice podobé rozděleí N(0, 1). Toto ověříme a histogramu a budeme zkoumat závislost podoby s rozděleím N(0, 1) a volbě. Nyí už k samotým výsledkům. Příslušé histogramy můžeme vidět a obrázcích 1,, 3, 4, 5, 6, 7, 8 a 9. Ze všech těchto obrázků je vidět, že limití rozděleí trasformace měřeých dat () je právě rozděleí N(0, 1), přesě jak říká CLV. Je dobré si povšimout, že rychlost kovergece je pro růzá rozděleí měřeých dat růzá. Pokud ale provedeme alespoň 30 měřeí, je už rozděleí trasformace měřeých dat velice podobé rozděleí N(0, 1), tedy aproimace pomocí CLV už bude v takovýchto případech velice přesá. Ep() 5 měřeí pozorovaá data četost 0.0 0.1 0. 0.3 Obr. 1: Histogram trasformace měřeých dat pocházejících z epoeciálího rozděleí pro 5 měřeí. 6
Ep() 10 měřeí pozorovaá data četost 0.0 0.1 0. 0.3 Obr. : Histogram trasformace měřeých dat pocházejících z epoeciálího rozděleí pro 10 měřeí. 7
Ep() 0 měřeí četost 0.0 0.1 0. 0.3 0.4 pozorovaá data Obr. 3: Histogram trasformace měřeých dat pocházejících z epoeciálího rozděleí pro 0 měřeí. 8
Ep() 40 měřeí pozorovaá data četost 0.0 0.1 0. 0.3 Obr. 4: Histogram trasformace měřeých dat pocházejících z epoeciálího rozděleí pro 40 měřeí. 9
R(0, 10) 5 měřeí četost 0.0 0.1 0. 0.3 0.4 pozorovaá data Obr. 5: Histogram trasformace měřeých dat pocházejících z rovoměrého rozděleí pro 5 měřeí. 10
R(0, 10) 15 měřeí četost 0.0 0.1 0. 0.3 0.4 pozorovaá data Obr. 6: Histogram trasformace měřeých dat pocházejících z rovoměrého rozděleí pro 15 měřeí. 11
Poiss() 5 měřeí pozorovaá data četost 0.0 0.1 0. 0.3 0.4 Obr. 7: Histogram trasformace měřeých dat pocházejících z Poissoova rozděleí pro 5 měřeí. 1
Poiss() 15 měřeí pozorovaá data četost 0.0 0.1 0. 0.3 0.4 Obr. 8: Histogram trasformace měřeých dat pocházejících z Poissoova rozděleí pro 15 měřeí. 13
Poiss() 30 měřeí četost 0.0 0.1 0. 0.3 0.4 0.5 pozorovaá data Obr. 9: Histogram trasformace měřeých dat pocházejících z Poissoova rozděleí pro 30 měřeí. 14
Bous: Jedié, co pro vyřešeí tohoto úkolu potřebujeme, je dosadit do vícerozměré cetrálí limití věty. Nejprve vypočítáme ejistotu určeí fyzikálí veličiy podle vzorce (1). K tomu budeme potřebovat zát parciálí derivace fukce f, které mají tvar f(, y) = si y, f(, y) = cos y. y Nyí už můžeme psát, čemu se rová ejistota určeí fyzikálí veličiy v S = ( si y ) ( s () cos y ĉov(,y) ĉov(,y) s (y) ) ( ) si y, cos y kde používáme stadardí začeí. Za použití matematického softwaru (výpočetí prostřeí R) dostáváme, že ejistota určeí veličiy v je S = 6,03. Odhad veličiy v získéme pouze dosazeím výběrových průměrů do aší fukce, tedy v = si y. Za použití matematického softwaru dostáváme výsledek v = 117,9. Vícerozměrá cetrálí limití věta potom říká, že itervalový odhad pro fyzikálí veličiu v bude tvaru ( v ± Su 1 α ). Pokud použijeme zkráceý zápis itervalového odhadu a dosadíme aše kokrétí číselé výsledky, dostaeme v = (117 ± 6). Jelikož máme dostatečě velký počet měřeí obou fyzikálích veliči (tj. více ež 30) bude teto itervalový odhad už velice přesý. Je pro zajímavost a tomto místě uvedeme, že pokud bychom předpokládali ezávislá data a použili bychom pouze záko šířeí ejistot, dostali bychom výsledek v = (117 ± 7). Vidíme, že rozdíl v získaých výsledcích eí velký, icméě je uté pozameat, že takovýto postup eí správý, eboť zaedbává korelaci v ašich měřeých datech. V jiých příkladech z prae už může být chyba, které bychom se takovýmto zaedbáím dopustili, velmi velká. Michal Nožička ozicka@fykos.cz Fyzikálí korespodečí semiář je orgaizová studety MFF UK. Je zastřeše Odděleím pro vější vztahy a propagaci MFF UK a podporová Ústavem teoretické fyziky MFF UK, jeho zaměstaci a Jedotou českých matematiků a fyziků. Toto dílo je šířeo pod licecí Creative Commos Attributio-Share Alike 3.0 Uported. Pro zobrazeí kopie této licece avštivte http://creativecommos.org/liceses/by-sa/3.0/. 15