Fyzikální korespondenční seminář MFF UK

Podobné dokumenty
Seriál XXX.I Zpracování dat fyzikálních měření

Fyzikální korespondenční seminář MFF UK ročník XXX číslo 1/7

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Fyzikální korespondenční seminář MFF UK

Definice spojité náhodné veličiny zjednodušená verze

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

8 Střední hodnota a rozptyl

Seriál II.II Vektory. Výfučtení: Vektory

Náhodné (statistické) chyby přímých měření

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Výběrové charakteristiky a jejich rozdělení

Chyby měření 210DPSM

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

KGG/STG Statistika pro geografy

Základy teorie pravděpodobnosti

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Náhodné chyby přímých měření

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Úloha I.E... tři šedé vlasy dědy Aleše

Náhodná veličina a rozdělení pravděpodobnosti

Téma 22. Ondřej Nývlt

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Vybraná rozdělení náhodné veličiny

y = 0, ,19716x.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

I. D i s k r é t n í r o z d ě l e n í

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Výpočet pravděpodobností

p(x) = P (X = x), x R,

Poznámky k předmětu Aplikovaná statistika, 5.téma

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

MATEMATICKÁ STATISTIKA

Praktická statistika. Petr Ponížil Eva Kutálková

Semestrální písemka BMA3 - termín varianta A13 vzorové řešení

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

MATEMATIKA III V PŘÍKLADECH

Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Pravděpodobnost a statistika I KMA/K413

1 Rozptyl a kovariance

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Odhady - Sdružené rozdělení pravděpodobnosti

Teorie náhodných matic aneb tak trochu jiná statistika

7. Rozdělení pravděpodobnosti ve statistice

Statistika II. Jiří Neubauer

pravděpodobnosti 10 Poissonovo a exponenciální rozdělení pravděpodobnosti

Zápočtová práce STATISTIKA I

Pravděpodobnostní rozdělení

Pravděpodobnost a aplikovaná statistika

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Cvičení ze statistiky - 5. Filip Děchtěrenko

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Design Experimentu a Statistika - AGA46E

NUMP403 (Pravděpodobnost a Matematická statistika I)

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Diagnostika regrese pomocí grafu 7krát jinak

Normální (Gaussovo) rozdělení

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Úloha II.E... listopadová

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

Stochastické signály (opáčko)

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Fyzikální korespondenční seminář MFF UK

Tomáš Karel LS 2012/2013

Základy teorie odhadu parametrů bodový odhad

Cvičení ze statistiky - 8. Filip Děchtěrenko

Poznámky k předmětu Aplikovaná statistika, 4. téma

7 Pravděpodobnostní modely úvod

Aplikovaná statistika v R - cvičení 2

Regresní analýza 1. Regresní analýza

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

3 Bodové odhady a jejich vlastnosti

TECHNICKÁ UNIVERZITA V LIBERCI

Přednáška IV. Náhodná veličina, rozdělení pravděpodobnosti a reálná data

Vektory aneb když jedno číslo nestačí

Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Posuzoval:... dne:...

Transkript:

Úloha I.S... náhodná 10 bodů; průměr 7,04; řešilo 45 studentů a) Zkuste vlastními slovy popsat, co je to náhodná veličina a jaké má vlastnosti (postačí vlastními slovy objasnit následující pojmy: náhodná veličina, rozdělení náhodné veličiny, realizace náhodné veličiny, střední hodnota, rozptyl, histogram). b) Vygenerujte grafy hustot pravděpodobnosti (případně pravděpodobností nabývání jednotlivých hodnot) všech v seriálu popsaných rozdělení náhodných veličin pro různé typy parametrů daného rozdělení a popište, jaký má změna parametru/ů vliv na tvar hustoty pravděpodobnosti (případně pravděpodobností nabývání jednotlivých hodnot). c) Vygenerujte z přiložených dat histogramy a pokuste se určit, ze kterého rozdělení tato data pocházejí. d) Definujme si náhodnou veličinu X jako výsledek hodu férovou šestistěnnou kostkou (všechna čísla padají se stejnou pravděpodobností). Určete rozdělení náhodné veličiny X a dále spočítejte EX a varx. Bonus Uveďte příklad dvou náhodných veličin, které mají stejnou střední hodnotu i stejný rozptyl, ale mají různá rozdělení. Pro práci s daty a vykreslování grafů použijte výpočetní prostředí R. Pro vyřešení těchto úkolů postačí drobně upravit přiložený skript, ve kterém je pomocí komentářů v kódu vysvětlena potřebná syntaxe jazyka R. Michal stanovil zadání úlohy náhodně, snad nebude moc těžká. a) Detailní odpověď na tuto otázku dostanete přečtením 1. dílu seriálu, na tomto místě si vysvětlíme jen ty opravdu nejdůležitější pojmy. Náhodné veličiny se používají k matematickému modelování situací, u kterých nemůžeme dopředu s jistotou znát přesný výsledek. Náhodnou veličinu si můžeme představovat jako proměnnou, která ale nemá jednu pevnou hodnotu (ať už známou či neznámou), ale může nabývat (s různými pravděpodobnostmi) různých hodnot. Rozdělení náhodné veličiny je potom to, čím je náhodná veličina určená (podobně jako je klasická proměnná určená svojí hodnotou). Rozdělení náhodné veličiny může být buď diskrétní (potom je toto rozdělení určeno pravděpodobnostmi nabývání jednotlivých hodnot), nebo spojité (potom je toto rozdělení určeno hustotou pravděpodobnosti). Realizace náhodné veličiny je hodnota, kterou dostaneme v konkrétním případě, kdy budeme náhodnou veličinu měřit. Střední hodnota a rozptyl náhodné veličiny představují jakýsi zjednodušený popis náhodné veličiny (plný popis je právě rozdělení náhodné veličiny), jsou určeny následujícími vzorci EX = varx = k P(X = k), k=1 k P(X = k) (k EX) 2, k=1 1

pokud se jedná o diskrétní náhodnou veličinu, případně vzorci EX = xf(x)dx, varx = (x EX) 2 f(x)dx v případě, že se jedná o spojitou náhodnou veličinu s hustotou f. Střední hodnota vyjadřuje, jakou hodnotu bychom měli v průměru očekávat při konkrétní realizaci náhodné veličiny a rozptyl vyjadřuje míru rozptýlenosti náhodné veličiny kolem její střední hodnoty. Histogram je potom typ grafu, který vykresluje naměřená data (tedy realizace nějaké náhodné veličiny) a slouží k odhadování typu rozdělení, ze kterého naměřená data pocházejí. b) V seriálu byly uvedeny celkem čtyři nejčastěji se vyskytující rozdělení náhodných veličin (normální, exponenciální, Poissonovo a rovnoměrné rozdělení). Budeme postupně vykreslovat hustoty pravděpodobnosti (případně pravděpodobnosti nabývání jednotlivých hodnot) pro tato čtyři rozdělení. Začneme normálním rozdělením, které, jak bylo uvedeno v seriálu, závisí na dvou parametrech µ R, σ 2 > 0. Hustota pravděpodobnosti normálního rozdělení je dána vztahem f(x) = 1 1 (x µ) 2 2πσ 2 e 2 σ 2. Grafy hustot normálního rozdělení pro různé hodnoty parametrů µ, σ 2 můžeme vidět na obrázcích 1 a 2. Jak je z těchto obrázků patrné, parametr µ ovlivňuje pouze posun po ose x a parametr σ 2 škáluje graf hustoty v horizontálním směru (laicky řečeno graf rozšiřuje nebo zužuje). Další v seriálu uvedené rozdělení je exponenciální rozdělení, které závisí na jednom parametru λ > 0. Hustota pravděpodobnosti exponenciálního rozdělení je určená vztahem { λe λx pro x > 0 f(x) = 0 jinak. Grafy hustot exponenciálního rozdělení pro různé hodnoty parametru λ jsou vykresleny na obrázku 3. Jak je na obrázku vidět, tvar hustoty pravděpodobnosti exponenciálního rozdělení zůstává stále stejný, parametr λ je zodpovědný pouze za škálování v horizontálním směru. Posledním v seriálu uvedeným spojitým rozdělením je rovnoměrné rozdělení, které závisí na dvou parametrech < a < b <. Hustota pravděpodobnosti rovnoměrného rozdělení je určena vztahem { 1 pro x (a, b) f(x) = b a 0 jinak. Grafy hustot rovnoměrného rozdělení pro různé hodnoty parametrů a, b si můžeme prohlédnout na obrázku 4. Jak je z obrázku vidět, hustota pravděpodobnosti rovnoměrného rozdělení je nulová mimo interval (a, b) a na intervalu (a, b) nabývá takové konstantní hodnoty, aby platilo P(a X b) = 1. 2

f(x) 0.0 0.1 0.2 0.3 0.4 µ = 4, σ 2 = 1 µ = 2, σ 2 = 1 µ = 0, σ 2 = 1 µ = 2, σ 2 = 1 6 4 2 0 2 4 6 x Obr. 1: Graf hustoty pravděpodobnosti normálního rozdělení pro různé hodnoty parametru µ Jediným v seriálu uvedeným diskrétním rozdělím je Poissonovo rozdělení, které je určeno jedním parametrem λ > 0. Pravděpodobnosti nabývání jednotlivých hodnot jsou určeny vztahem P(X = k) = e λ λ k k!, k N. Grafy pravděpodobností nabývání jednotlivých hodnot pro různé hodnoty parametru můžeme vidět na obrázku 5. Opět je vidět, že se tvar závislosti pravděpodobností nabývání jednotlivých hodnot při změně parametru λ nemění, ale pouze škáluje v horizontálním směru. c) Vygenerované histogramy můžeme vidět na obrázcích 6, 7, 8 a 9. Z těchto obrázků lze odhadovat, že první vzorek dat pochází z rovnoměrného rozdělení, druhý vzorek z Poissonova rozdělení, třetí vzorek z normálního rozdělení a čtvrtý vzorek z exponenciálního rozdělení. Je nutno poznamenat, že toto jsou pouze odhady, nelze to chápat jako rigorózní matematický postup určování typu rozdělení. d) Takováto náhodná veličina může nabývat jen konečně mnoha hodnot (jen hodnot 1, 2, 3, 4, 5 nebo 6), proto se bude jednat o diskrétní náhodnou veličinu. Rozdělení náhodné veličiny X tedy bude určeno výčtem pravděpodobností nabývání těchto jednotlivých hodnot, jelikož podle zadání budou všechny výsledky hodu touto kostkou stejně pravděpodobné, musí platit P(X = 1) = 1 6, P(X = 2) = 1 6,..., P(X = 6) = 1 6. Toto je rozdělení náhodné veličiny X. Pro výpočet střední hodnoty a rozptylu pouze dosadíme do vzorců uvedených výše. Dostáváme, že střední hodnota X je rovna EX = 1 1 6 + 2 1 6 + + 6 1 6 = 3,5. 3

f(x) 0.0 0.1 0.2 0.3 0.4 0.5 µ = 0, σ 2 = 0,5 µ = 0, σ 2 = 1 µ = 0, σ 2 = 2 µ = 0, σ 2 = 4 6 4 2 0 2 4 6 x Obr. 2: Graf hustoty pravděpodobnosti normálního rozdělení pro různé hodnoty parametru σ 2 Když nyní známe střední hodnotu náhodné veličiny X, můžeme spočítat i její rozptyl, který je roven varx = (1 3, 5) 2 1 6 + (2 3, 5)2 1 6 + + (6 3, 5)2 1 6 = 35 12 Bonus: Tento úkol je velice jednoduchý, stačí ze seznamu nejčastěji se vyskytujících rozdělení náhodných veličin vybrat dvě vhodná rozdělení (různá) a vhodně navolit jejich parametry tak, aby se jejich střední hodnota i rozptyl rovnaly. Jako příklad můžeme uvést náhodné veličiny X a Y, kde X bude mít exponenciální rozdělení Exp(2) a náhodná veličina Y bude mít rozdělení N( 1, 1 ). Pomocí vzorců uvedených v seriálu si každý může ověřit, že střední 2 4 hodnota obou těchto náhodných veličin jsou rovny 1 a rozptyl obou těchto náhodných veličin 2 je roven 1. Takovýchto příkladů lze samozřejmě vymyslet mnoho, pro udělení bonusových 4 bodů stačí uvést jeden. Michal Nožička nozicka@fykos.cz Fyzikální korespondenční seminář je organizován studenty MFF UK. Je zastřešen Oddělením pro vnější vztahy a propagaci MFF UK a podporován Ústavem teoretické fyziky MFF UK, jeho zaměstnanci a Jednotou českých matematiků a fyziků. Toto dílo je šířeno pod licencí Creative Commons Attribution-Share Alike 3.0 Unported. Pro zobrazení kopie této licence navštivte http://creativecommons.org/licenses/by-sa/3.0/. 4

f(x) 0 1 2 3 4 λ = 4 λ = 2 λ = 1 λ = 0,5 0 1 2 3 4 x Obr. 3: Graf hustoty pravděpodobnosti exponenciálního rozdělení pro různé hodnoty parametru λ. f(x) 0.0 0.2 0.4 0.6 0.8 1.0 a = 0, b = 1 a = 1, b = 1 a = 1, b = 5 a = 5, b = 5 4 2 0 2 4 x Obr. 4: Grafy hustot pravděpodobnosti rovnoměrného rozdělení pro různé hodnoty parametrů a, b. 5

P(X = k) 0.0 0.1 0.2 0.3 λ = 1 λ = 2 λ = 4 λ = 8 0 5 10 15 k Obr. 5: Pravděpodobnosti nabývání jednotlivých hodnot poissonova rozdělení pro různé hodnoty parametru λ. Histogram: Vzorek 1 počet 0 5 10 15 20 25 30 35 0,0 0,2 0,4 0,6 0,8 1,0 hodnota Obr. 6: Histogram prvního vzorku dat. 6

Histogram: Vzorek 2 počet 0 50 100 150 0 2 4 6 8 10 hodnota Obr. 7: Histogram druhého vzorku dat. Histogram: Vzorek 3 počet 0 10 20 30 40 3 2 1 0 1 2 hodnota Obr. 8: Histogram třetího vzorku dat. 7

Histogram: Vzorek 4 počet 0 20 40 60 80 0 2 4 6 8 10 hodnota Obr. 9: Histogram čtvrtého vzorku dat. 8