Pravděpodobnost, náhoda, kostky



Podobné dokumenty
Pravděpodobnost, náhoda, kostky

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

You created this PDF from an application that is not licensed to print to novapdf printer (

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

Tomáš Karel LS 2012/2013

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

= = 2368

Vytěžování znalostí z dat

Pravděpodobnost a aplikovaná statistika

Bayesovské metody. Mnohorozměrná analýza dat

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

GENEROVÁNÍ NÁHODNÝCH ČÍSEL PSEUDONÁHODNÁ ČÍSLA

Cvičení ze statistiky - 4. Filip Děchtěrenko

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA

Jednofaktorová analýza rozptylu


PRAVDĚPODOBNOST A STATISTIKA

Informační a znalostní systémy

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Tomáš Karel LS 2012/2013

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Pravděpodobnost a matematická statistika

Měření závislosti statistických dat

Václav Jirchář, ZTGB

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Testy. Pavel Provinský. 19. listopadu 2013

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

4EK211 Základy ekonometrie

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Simulace. Simulace dat. Parametry

KGG/STG Statistika pro geografy

Vybraná rozdělení náhodné veličiny

Pravděpodobnost a statistika

INDUKTIVNÍ STATISTIKA

Regresní a korelační analýza

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Úvod do problematiky měření

Intervalové Odhady Parametrů

Základy teorie pravděpodobnosti

Tomáš Karel LS 2012/2013

Regresní a korelační analýza

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

4ST201 STATISTIKA CVIČENÍ Č. 7

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Tomáš Karel LS 2012/2013

Intuitivní pojem pravděpodobnosti

UČENÍ BEZ UČITELE. Václav Hlaváč

Pravděpodobnost a aplikovaná statistika

TECHNICKÁ UNIVERZITA V LIBERCI

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Lineární regrese. Komentované řešení pomocí MS Excel

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Náhodná veličina a rozdělení pravděpodobnosti

cv3.tex. Vzorec pro úplnou pravděpodobnost

Normální (Gaussovo) rozdělení

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Odhad parametrů N(µ, σ 2 )

Tomáš Karel LS 2012/2013

Studijní program Matematika Obor Pravděpodobnost, matematická statistika a ekonometrie

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

KGG/STG Statistika pro geografy

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Value at Risk. Karolína Maňáková

Kombinatorika, výpočty

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Generátory pseudonáhodných čísel a jejich aplikace v kryptografii (proudové šifry)

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

Úvod do zpracování signálů

Ilustrační příklad odhadu LRM v SW Gretl

8. Normální rozdělení

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Transkript:

Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015

Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků

Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké programy, realizovatelné i v tabulkovém editoru základní myšlenka: využití jednoduchých simulací, analýz pro lepší pochopení abstraktních matematických pojmů

Pojmy pravděpodobnost, podmíněná pravděpodobnost, nezávislost střední hodnota, rozptyl, směrodatná odchylka distribuční funkce normální distribuce

Normální distribuce Wikipedia

Normální distribuce µ průměr σ standardní odchylka f (x) = 1 σ (x µ) 2 2π e 2σ 2

Monty Hall Problem troje dveře, za jedněmi z nich je poklad, cílem je najít poklad vyberete jedny dveře já otevřu jedny z nevybraných dveří, za kterými není poklad vy nyní můžete zůstat u své volby nebo změnit své rozhodnutí co je rozumné udělat? zůstat u své volby změnit rozhodnutí je to úplně jedno (můžeme se rozhodnout náhodně)

Monty Hall Problem: řešení je výhodnější změnit rozhodnutí: zůstat u své volby: 33 % změnit rozhodnutí: 66 % rozhodnout se náhodně: 50 % problém známý tím, že i mnoho matematiků se v něm snadno splete

Využití simulace pro vybudování intuice (lepší pochopení) se hodí simulace Monty Hall velmi jednoduché využití simulace užitečný obecný princip

Monty Hall: experimentálně implementujte simulátor hry vyzkoušejte strategie zůstat při původním rozhodnutí, změnit rozhodnutí, náhodně měnit rozhodnutí experimentálně vyhodnoťte úspěšnost strategií v dlouhém běhu

Náhodná čísla aplikace: počítačové hry, loterie kryptografie vědecké výpočty, simulace zdroje: pseudonáhodná čísla běžné random(), deterministické s chaotickým chováním opravdová náhoda např. atmosférický tlak, www.random.org

Co to jsou náhodná čísla? Házení kostkou čísla 1-6 Která z následující posloupností je více pravděpodobná? 1 1 2 2 3 3 4 4 5 5 6 6 1 5 2 3 4 6 2 3 3 1 2 4

Co to jsou náhodná čísla? Házení kostkou čísla 1-6 Která z následující posloupností je více pravděpodobná? 1 1 2 2 3 3 4 4 5 5 6 6 1 5 2 3 4 6 2 3 3 1 2 4 Obě mají stejnou pravděpodobnost ( 1 6 )12

Úkol: (ne)náhodné posloupnosti máte k dispozici několik posloupností čísel hody kostkou celá čísla 1 až 6 určete, které z nich jsou nenáhodné a proč co to znamená, že posloupnost je náhodná?

Testování náhodnosti

Testování náhodnosti nenáhodná posloupnost: predikovatelná dokážete předpovědět další číslo (lépe než náhodným tipem)? zdroje nenáhodnosti např. zkreslení, korelace, vzory, periodicita existují rozsáhlé sady testů náhodnosti vztah statistické testy

Testování náhodnosti: frekvence Frekvence čísel ve 300 hodech 1 2 3 4 5 6 očekávané 50 50 50 50 50 50 série 1 49 50 48 51 52 50 série 2 56 45 43 62 44 50 série 3 52 71 66 34 30 48 Odpovídá to náhodnému generování?

Testování náhodnosti: Chí kvadrát test O i očekávaný počet P i pozorovaný počet S = 6 (P i O i ) 2 i=1 P i S pro velké n má přibližně χ 2 -rozložení o 5 stupních volnosti χ 2 (k) = k i=1 Z i 2 kde Z i má standardní normální rozdělení test: určíme p-hodnotu χ 2 (5) pro S, pokud příliš malá zamítnout

Chí kvadrát Wikipedia

Generování náhodných čísel uniformní distribuce: základ rekurentní vztahy, např. x n = (ax n 1 + c) mod m neuniformní distribuce: např. normálně rozložená čísla, náhodné body v kruhu, podle zadané distribuce,... chytré transformace, rejection sampling, Monte Carlo Markov Chain,...

Centrální limitní věta nezávislé a identicky rozložené proměnné vzorky velikosti n pro velké n je průměr vzorku přibližně normálně rozložen

Centrální limitní věta: příklad hody (férovou) kostkou vzorky velikosti 100 počet vzorků 10000

Centrální limitní věta: poznámky umožňuje modelovat mnoho neznámých vlivů pomocí normální distribuce typický příklad šum v datech (chyba měření): předpokládáme, že šum je výsledkem mnoha dílčích vlivů modelujeme pomocí normální distribuce pozor na: předpoklad nezávislé a identicky rozložené platí pro aritmetický průměr ( aditivní veličiny) rychlost konvergence závisí na výchozí distribuci

Centrální limitní věta: příklady kostky K a = zatížená kostka, která preferuje vyšší čísla (pravděpodobnost úměrná počtu teček) K b = inverzně zatížená kostka Jak to dopadne (rozmyslete teoreticky, vyzkoušejte prakticky): hody kostkou K a pro každý hod náhodně vybereme jednu z kostek K a, K b náhodně vybereme jednu z kostek K a, K b a tou házíme všechna čísla ve vzorku Věnujte pozornost tvaru výsledné distribuce, průměru i směrodatné odchylce.

Bayesova věta pojmy: Bayesova věta prior, posterior likelihood věrohodnost Bayesovská analýza dat

Bayesova věta P(A B) podmíněná pravděpodobnost Bayesova věta P(A B) = P(B A)P(A) P(B)

Bayesova věta D pozorovaná data H i hypotézy o vzniku dat P(H i ) prior, odhad pravděpodobnosti H i předtím, než jsme viděli data P(D H i ) pravděpodobnost dat při dané hypotéze P(H i D) posterior, odhad pravděpodobnosti H i korigovaný daty Bayesova věta P(H i D) = P(D H i)p(h i ) P(D) P(D) = i P(D H i)p(h i ) pravděpodobnost dat

Bayesova věta klasický příklad předpokládejme výskyt AIDS: 6 z 1000 spolehlivý test na AIDS: správný výsledek 99.9 % pro ty, co mají AIDS 99 % pro ty, co nemají AIDS výsledek testu osoby X je pozitivní jaká je pravděpodobnost, že X má AIDS?

Bayesova věta klasický příklad hypotézy: A = AIDS, N = nemá AIDS data: V = pozitivní výsledek P(A V ) = P(V A)P(A) P(V A)P(A)+P(V N)P(N) = 0.006 0.999 0.006 0.999+0.994 0.01 0.38

Bayesova věta příklad kostky 1, 3, 4, 5, 1, 4, 6, 5, 1, 5, 4, 5 posloupnost byla vygenerována jednou z následujících kostek: 1 normální kostka 2 normální kostka, na které je dvojka přepsaná na pětku 3 zatížená kostka, na které padá 6 s dvakrát větší pravděpodobností než ostatní čísla jaký je posterior (jak bychom měli věřit pravděpodobnosti jednotlivých kostek) pro: uniformní prior (dopředu jsme považovali všechny možnosti za stejně pravděpodobné)? prior preferující 3. kostku (věříme: 5 % normální, 5 % přepsaná, 90 % zatížená)? napište program: vstup: prior, posloupnost, výstup: posterior