Pravděpodobnost, náhoda, kostky

Podobné dokumenty
Pravděpodobnost, náhoda, kostky

Testy. Pavel Provinský. 19. listopadu 2013

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

You created this PDF from an application that is not licensed to print to novapdf printer (

KGG/STG Statistika pro geografy

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

Vytěžování znalostí z dat

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

PRAVDĚPODOBNOST A STATISTIKA

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

PRAVDĚPODOBNOST A STATISTIKA

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

4EK211 Základy ekonometrie

= = 2368

Výběrové charakteristiky a jejich rozdělení

Cvičení ze statistiky - 4. Filip Děchtěrenko

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a matematická statistika

Základy teorie pravděpodobnosti

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Úvod do problematiky měření

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Tomáš Karel LS 2012/2013

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Jednofaktorová analýza rozptylu

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Vybraná rozdělení náhodné veličiny

Tomáš Karel LS 2012/2013

Pravděpodobnostní rozdělení

Definice spojité náhodné veličiny zjednodušená verze

Pravděpodobnost a aplikovaná statistika

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Odhady - Sdružené rozdělení pravděpodobnosti

Tomáš Karel LS 2012/2013

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

Intuitivní pojem pravděpodobnosti

Tomáš Karel LS 2012/2013

Náhodná veličina a rozdělení pravděpodobnosti

Intervalové Odhady Parametrů

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

1. Klasická pravděpodobnost

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Pravděpodobnost a statistika

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 8. Filip Děchtěrenko

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady


22. Pravděpodobnost a statistika

Náhodné (statistické) chyby přímých měření

TECHNICKÁ UNIVERZITA V LIBERCI

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Informační a znalostní systémy

Náhodné chyby přímých měření

Regresní a korelační analýza

Aproximace binomického rozdělení normálním

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Bayesovské metody. Mnohorozměrná analýza dat

KGG/STG Statistika pro geografy

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Inovace bakalářského studijního oboru Aplikovaná chemie

Testy statistických hypotéz

Měření závislosti statistických dat

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

STATISTICKÉ ZJIŠŤOVÁNÍ

KGG/STG Statistika pro geografy

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Cvičení ze statistiky - 5. Filip Děchtěrenko

oddělení Inteligentní Datové Analýzy (IDA)

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Tomáš Karel LS 2012/2013

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Regresní a korelační analýza

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

AVDAT Klasický lineární model, metoda nejmenších

12. cvičení z PST. 20. prosince 2017

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Testování statistických hypotéz

Transkript:

Pravděpodobnost, náhoda, kostky Radek Pelánek IV122

Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků

Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti krátké programy, realizovatelné i v tabulkovém editoru základní myšlenka: využití jednoduchých simulací a analýz pro lepší pochopení abstraktních matematických pojmů kostky

Pojmy pravděpodobnost, podmíněná pravděpodobnost, nezávislost střední hodnota, rozptyl, směrodatná odchylka distribuční funkce normální distribuce

Normální distribuce Wikipedia

Normální distribuce µ průměr σ standardní odchylka f (x) = 1 σ (x µ) 2 2π e 2σ 2

Monty Hall Problem troje dveře, za jedněmi z nich je poklad, cílem je najít poklad vyberete jedny dveře já otevřu jedny z nevybraných dveří, za kterými není poklad vy nyní můžete zůstat u své volby nebo změnit své rozhodnutí co je rozumné udělat? zůstat u své volby změnit rozhodnutí je to úplně jedno (můžeme se rozhodnout náhodně)

Monty Hall Problem: řešení je výhodnější změnit rozhodnutí: zůstat u své volby: 33 % změnit rozhodnutí: 66 % rozhodnout se náhodně: 50 % problém známý tím, že i mnoho matematiků se v něm snadno splete

Využití simulace pro vybudování intuice (lepší pochopení) se hodí simulace Monty Hall velmi jednoduché využití simulace užitečný obecný princip

Monty Hall: experimentálně implementujte simulátor hry vyzkoušejte strategie zůstat při původním rozhodnutí, změnit rozhodnutí, náhodně měnit rozhodnutí experimentálně vyhodnot te úspěšnost strategíı v dlouhém běhu alternativa: jiný, podobný úkol

Náhodná čísla aplikace: počítačové hry, loterie kryptografie vědecké výpočty, simulace zdroje: pseudonáhodná čísla běžné random(), deterministické s chaotickým chováním opravdová náhoda např. atmosférický tlak, www.random.org

Co to jsou náhodná čísla? Házení kostkou čísla 1-6 Která z následující posloupností je více pravděpodobná? 1 1 2 2 3 3 4 4 5 5 6 6 1 5 2 3 4 6 2 3 3 1 2 4

Co to jsou náhodná čísla? Házení kostkou čísla 1-6 Která z následující posloupností je více pravděpodobná? 1 1 2 2 3 3 4 4 5 5 6 6 1 5 2 3 4 6 2 3 3 1 2 4 Obě mají stejnou pravděpodobnost ( 1 6 )12

Úkol: (ne)náhodné posloupnosti máte k dispozici několik posloupností čísel hody kostkou celá čísla 1 až 6 určete, které z nich jsou nenáhodné a proč co to znamená, že posloupnost je náhodná?

Testování náhodnosti

Testování náhodnosti nenáhodná posloupnost: predikovatelná dokážete předpovědět další číslo (lépe než náhodným tipem)? zdroje nenáhodnosti např. zkreslení, korelace, vzory, periodicita existují rozsáhlé sady testů náhodnosti vztah statistické testy

Testování náhodnosti: frekvence Frekvence čísel ve 300 hodech 1 2 3 4 5 6 očekávané 50 50 50 50 50 50 série 1 49 50 48 51 52 50 série 2 56 45 43 62 44 50 série 3 52 71 66 34 30 48 Odpovídá to náhodnému generování?

Testování náhodnosti: Chí kvadrát test O i očekávaný počet P i pozorovaný počet S = 6 (P i O i ) 2 i=1 P i S pro velké n má přibližně χ 2 -rozložení o 5 stupních volnosti χ 2 (k) = k i=1 Z i 2 kde Z i má standardní normální rozdělení test: určíme p-hodnotu χ 2 (5) pro S, pokud příliš malá zamítnout

Chí kvadrát Wikipedia

Centrální limitní věta

Centrální limitní věta zjednodušeně: nezávislé a identicky rozložené proměnné vzorky velikosti n pro velké n je průměr vzorku přibližně normálně rozložen

Centrální limitní věta: příklad hody (férovou) kostkou vzorky velikosti 100 z nich vypočítám průměr počet vzorků 10000 jak vypadá distribuce průměrů?

Centrální limitní věta: příklad hody (férovou) kostkou vzorky velikosti 100 z nich vypočítám průměr počet vzorků 10000 jak vypadá distribuce průměrů?

Centrální limitní věta: poznámky umožňuje modelovat mnoho neznámých vlivů pomocí normální distribuce typický příklad šum v datech (chyba měření): předpokládáme, že šum je výsledkem mnoha dílčích vlivů modelujeme pomocí normální distribuce pozor na: předpoklad nezávislé a identicky rozložené platí pro aritmetický průměr ( aditivní veličiny) rychlost konvergence závisí na výchozí distribuci

Centrální limitní věta: příklady kostky K a = zatížená kostka, která preferuje vyšší čísla (pravděpodobnost úměrná počtu teček) K b = inverzně zatížená kostka Jak to dopadne (rozmyslete teoreticky, udělejte simulaci): hody kostkou K a pro každý hod náhodně vybereme jednu z kostek K a, K b náhodně vybereme jednu z kostek K a, K b a tou házíme všechna čísla ve vzorku Věnujte pozornost tvaru výsledné distribuce, průměru i směrodatné odchylce.

Bayesova věta pojmy: Bayesova věta prior, posterior likelihood věrohodnost Bayesovská analýza dat

Bayesova věta P(A B) podmíněná pravděpodobnost Bayesova věta P(A B) = P(B A)P(A) P(B)

Bayesova věta D pozorovaná data H i hypotézy o vzniku dat P(H i ) prior, odhad pravděpodobnosti H i předtím, než jsme viděli data P(D H i ) pravděpodobnost dat při dané hypotéze P(H i D) posterior, odhad pravděpodobnosti H i korigovaný daty Bayesova věta P(H i D) = P(D H i)p(h i ) P(D) P(D) = i P(D H i)p(h i ) pravděpodobnost dat

Bayesova věta klasický příklad předpokládejme výskyt AIDS: 6 z 1000 spolehlivý test na AIDS: správný výsledek 99,9 % pro ty, co mají AIDS 99 % pro ty, co nemají AIDS výsledek testu osoby X je pozitivní jaká je pravděpodobnost, že X má AIDS?

Bayesova věta klasický příklad hypotézy: A = AIDS, N = nemá AIDS data: V = pozitivní výsledek P(A V ) = P(V A)P(A) P(V A)P(A)+P(V N)P(N) = 0.006 0.999 0.006 0.999+0.994 0.01 0.38

Bayesova věta příklad kostky 100 kostek, 1 falešná (samé 6), ostatní poctivé náhodně vytáhnu jednu kostku, 3 krát hodím, vždy padne šestka jaká je pravděpodobnost, že jde o poctivou kostku? Vypočítejte: vzorcem (Bayes) simulací