Náhoda při hře. Náhoda při hře

Podobné dokumenty
Náhoda při hře. Náhoda při hře

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Základy popisné statistiky

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pravděpodobnost a statistika

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Charakteristika datového souboru

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Tomáš Karel LS 2012/2013

Analýza dat na PC I.

Základy biostatistiky

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

7. Rozdělení pravděpodobnosti ve statistice

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Popisná statistika. Statistika pro sociology

Pravděpodobnost a matematická statistika


NÁHODNÁ VELIČINA. 3. cvičení

Inovace bakalářského studijního oboru Aplikovaná chemie

Jevy a náhodná veličina

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Normální (Gaussovo) rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Pravděpodobnost a aplikovaná statistika

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

Tomáš Karel LS 2012/2013

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Praktická statistika. Petr Ponížil Eva Kutálková

Popisná statistika kvantitativní veličiny

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Statistika pro geografy

Tomáš Karel LS 2012/2013

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

23. Matematická statistika

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

TEMATICKÝ PLÁN VÝUKY

Kontingenční tabulky v Excelu. Představení programu Statistica

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Metodologie pro ISK II

Základy teorie pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Zápočtová práce STATISTIKA I

KGG/STG Statistika pro geografy

Charakterizace rozdělení

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

ADZ základní statistické funkce

Aplikovaná statistika v R

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Testování statistických hypotéz

Číselné charakteristiky

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Průzkumová analýza dat

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Regresní analýza 1. Regresní analýza

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Informační technologie a statistika 1

Základní statistické metody v rizikovém inženýrství

Deskriptivní statistické metody II. Míry polohy Míry variability

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

KGG/STG Statistika pro geografy

PRAVDĚPODOBNOST A STATISTIKA

Regresní a korelační analýza

Kontingenční tabulky, korelační koeficienty

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Náhodné (statistické) chyby přímých měření

1. Přednáška. Ing. Miroslav Šulai, MBA

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Číselné charakteristiky a jejich výpočet

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Návrh a vyhodnocení experimentu

PRAVDĚPODOBNOST A STATISTIKA

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Normální (Gaussovo) rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základní statistické charakteristiky

1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost

Tomáš Karel LS 2012/2013

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

MATEMATIKA III V PŘÍKLADECH

Regresní a korelační analýza

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

STATISTICKÉ ZJIŠŤOVÁNÍ

Transkript:

áhoda při hře Martingale: Vsadíš řekněme 1 dolar na barvu, kterou si vybereš (červená či černá) a budeš stále sázet jen na ni. Roztočíš ruletu a čekáš Pokud prohraješ, zdvojnásobíš sázku, takže vsadíš příště 2 dolary. Pak řekněme, že znova prohraješ, tak příště vsadíš 4 dolary. A když zas prohraješ, tak příště vsadíš 8 dolarů. Řekněme, že už konečně padla barva, kterou jsi vsadil. Casino ti dá ke tvým vsazeným 8 dolarům svých 8, takže máš teď 16 dolarů. Spočítej si, kolik jsi vsadil: 1 + 2 + 4 + 8 = 15 dolarů, takže - vydělal jsi 1 dolar! Pak začneš sázet znova 1 dolar áhoda při hře Pravděpodobnost výhry při sázce na barvu: p = 18/37 = 0,486 Průměrný zisk při n sázkách částky č: - n.č + 2.č.n.p = n.č.(-0,027) Dlouhodobý zisk kasina je 2,7% ze vsazených částek. 1

Co to je pravděpodobnost? je matematická disciplína, popisující zákonitosti týkající se jevů, které (přinejmenším z hlediska pozorovatele) mohou a nemusí nastat, resp. jejichž výsledná hodnota není předem jistá. Příkladem může být výsledek hodu kostkou ještě předtím, než hodíme, anebo venkovní teplota zítra v poledne. Laplaceova def. pravděpodobnosti Může-li náhodný pokus vykázat konečný počet n různých, vzájemně se vylučujících, stejně možných výsledků a jestli m z těchto výsledků má za následek událost A, pak pravděpodobnost události A položíme rovnou číslu m/n P( A) m n Model pro hod kostkou Úkol: Odhadněte pst, že padne šestka 100 x opakujeme pokus hody=ceil(6*rand(100,1)) nebo hody2=randi(6,100,1) transformace U(0,1) diskrétní U(1, 2, 6) Bodovým odhadem pravděpodobnosti je relativní četnost. pst6=sum(hody==6)/1000 2

Základní pojmy áhodný pokus -výsledky závisí nejen na předepsaných podmínkách, ale také na náhodě. áhodný jev - každý výsledek (elementární jev) nebo skupina výsledků náhodného pokusu. Jakékoliv tvrzení o výsledku náhodného pokusu, o kterém lze (po provedení pokusu) rozhodnout, zda je pravdivé. Prostor elementárních jevů S - množina všech možných výsledků pokusů jsme schopni je všechny předem vyjmenovat (ve sš matematice konečná), jsou vzájemně neslučitelné (žádné dva nemohou nastat současně), jeden z nic nastane vždy (nemůže nastat žádný jiný než jeden z jmenovaných), Chevalier de Mere Hod jednou kostkou Chevalier de Mere příjimal sázky na to, že hodí minimálně jednu šestku ve čtyřech po sobě následujících hodech. Pravděpodobnost padnutí šestky je v každém hodu 1/6. Domníval se, že jeho šance na padnutí šestky ve čtyřech hodech je tedy (1/6) 4 = 2/3. Správně: Vypočítáme pravděpodobnost doplňkového jevu k počtu nepříznivých možností: P(A) = 1 (5/6) 4 = 0,517746914 Hod dvěma kostkami. Vyhrajeme, pokud se nám alespoň jedenkrát podaří hodit 2 šestky ve 24 hodech. Pravděpodobnost vrhnutí dvou šestek v jednom hodu je 1/36. De Mere předpokládal, že jeho šance je tedy (1/36) 24 a tedy opět 2/3. Správně: Pravděpodobnost výhry bude: P(A) = 1 (35/36) 24 = 0,491403876. 3

Metoda Monte Carlo Metoda, která používá stochastických metod k řešení deterministických problémů. Postup: 1. Systém nahradíme simulačním modelem se stejnými pravděpodobnostními charakteristikami a chování mnohonásobně simulujeme na modelu. 2. Jednotlivé charakteristiky výstupu nahradíme bodovým odhadem - střední hodnotu průměrem - pst stavu relativní četností Obr: áhodná procházka 2D (1D) Výpočet integrálu metodou Monte Carlo Výpočet derivace funkce a "hledání obsahu plochy pod grafem" jsou "obrácené" operace. 4

d f(x) y Výpočet integrálu metodou Monte Carlo a W B x X b b I f ( x) a W a, b 0, d I S X náhodně vybraný bod z X B f ( x) y S P( X B) S B W Pravděpodobnost odhadneme relativní četností P( X B) B W B počet pokusů B =0, x i=1.. rovn a, b y rovn 0, d S x, y B S B W B + B = B +1 Simulace Monte Carlo %Určete obsah plochy y=x^2 pod grafem na intervalu (0,1) clc;clear; datax=rand(100,1); datay=rand(100,1); os=sum(datay < datax.^2) area=os/100 n=100;pokusy=500 area = zeros(1,n); for i=1:n datax=rand(pokusy,1); datay=rand(pokusy,1); os=sum(datay < datax.^2); area(i)=os/pokusy; end mean(area) https://scratch.mit.edu/projects/148016090/ 5

Metoda Monte Carlo Při každém běhu dostaneme jiný výsledek Odpovídá reálné situaci Každý výsledek jednoho běhu stochastického simulačního modelu musí být považován za jedno pozorování statistického experimentu! Kolikrát musíme opakovat simulaci abychom mohli důvěřovat výsledku? Intervalový odhad zkoumaných veličin Provádíme n nezávislých pokusů získáme realizace Xi zkoumané náhodné veličiny. Interval spolehlivosti pro odhad střední hodnoty náhodné veličiny s X t ; X t 1 1, n1 n, n1 2 2 s n s - standardní odchylka získaná ze vzorku α hladina významnosti t 1, n1 2 kvantil Studentova rozdělení s (n-1) stupni volnosti 6

Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika Shromažďování a třídění dat Analýza za účelem formulování obecných závěrů a rozhodování Popisná statistika - Metody zjišťování a sumarizace informací Inferenční statistika - Měření spolehlivosti závěrů o populaci založených na informacích získaných z výběru náhodný výběr výběrový soubor x základní soubor 7

den teplota 1.4.2008 11 2.4.2008 10 3.4.2008 10 4.4.2008 9 5.4.2008 8 6.4.2008 7 7.4.2008 8 8.4.2008 9 9.4.2008 4 10.4.2008 9 11.4.2008 8 12.4.2008 7 13.4.2008 8 14.4.2008 9 15.4.2008 12 16.4.2008 13 17.4.2008 15 18.4.2008 11 19.4.2008 12 20.4.2008 10 21.4.2008 9 22.4.2008 8 23.4.2008 9 24.4.2008 11 25.4.2008 10 26.4.2008 9 27.4.2008 6 Elementární zpracování dat cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! Hodnota statistického znaku 1. Kvalitativní ominální kvalitativní znaky Jednotlivé hodnoty jsou neporovnatelné, data nelze seřadit, neexistuje nic jako velikost Ordinární lze je seřadit a přiřadit jim číslo, tj. určit pořadí eumožňují posoudit vzdálenost 2. Kvantitativní Diskrétní (je možné je spočítat) Spojité (údaje, které lze měřit -přečíst na stupnici) Určete typ dat: věk člověka, výška, počet podlaží, teplota, pohlaví, zaměstnání, účel budovy, barva očí, dosažené vzdělání, počet studentů, známka ze zkoušky, 8

Třídění rozdělení dat do tříd 1. Tříd musí být tak akorát cílem je potlačit kolísání četností, ale nesmíme setřít charakteristické rysy 2. Třídy musí být disjunktní 3. Stejná šířka intervalu Základní popisné statistiky 9

Charakteristiky polohy aritmetický průměr mean(data) výběrový průměr je nejlepší nestranný konzistentní odhad střední hodnoty základního souboru. Citlivý na outliery - vychýlené hodnoty můžeme odfiltrovat pomocí percentilu apod. (86% percentil říká, že 86% prvků leží pod touto hodnotou a 14% nad ní) modus ejčastěji se vyskytující hodnota mode(data) min. modus = 1, max. modus = může jich být víc odpovídá vrcholu histogramu četností medián (50 % kvantil) median(data) polovina pozorování menší než medián, polovina větší střed uspořádaného základního souboru i pro pouze seřazená data (na ordinální stupnici) např. jídlo je vynikající (1), dobré (2), ucházející (3), bez chuti (4), nic moc (5), hnusné (6), vyvolávající zvracení (7) v případ ulítlé hodnoty lepší vypovídající hodnota než průměr robustní charakteristika Míry rozptýlení s 2 i 1 X i 2 rozptyl (variance) var(data) průměrná hodnota druhé mocniny odchylky od průměru směrodatná odchylka std(data) odmocnina z rozptylu čím menší, tím nižší variabilita dat variační koeficient porovnává variabilitu nestejně velkých objektů (myš a slon) bezrozměrné číslo s CV X Qvartilové rozpětí kvartil 75 % - kvartil 25 % 10

směrodatná odchylka empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru. normální rozdělení: Výpočetní složitost algoritmů n=1:1:10; plot(n,n,'r',n,n.*log(n),'g', 'LineWidth',2) figure plot(n, n.^2,'m',n, 2.^n,'c') 11

ásobení matic for i=10:1000; tic; soucin(i); time(i) = toc; end plot(time); 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 100 200 300 400 500 600 700 800 900 1000 function[out]=soucin(n) %soucin dvou nahodne vygenerovanych matic nxn out = rand(n,n)*rand(n,n); soucintictoc.m Merge sort? time=zeros(1,100) for n=1:100:50000 L=randi(50,n,1); tic sort(l); time(n)=toc; end plot(time) 3.5 x 10-3 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 6 7 8 9 10 x 10 4 A + B* n*log(n) vyp_slozitost.m 12

Faktoriál https://cs.wikipedia.org/wiki/rekurze_%28pro gramov%c3%a1n%c3%ad%29 1.4 x 10-3 1.2 1 clear; for n=1:200 tic factorial(n); time1(n)=toc; tic factorial2(n); time2(n)=toc; end 0 0 20 40 60 80 100 120 140 160 180 200 plot(1:200,time1,'r',1:200,time2,'g','linewidth',2) 0.8 0.6 0.4 0.2 function[out]=factorial2(n) if n==0 out=1; else out=factorial2(n-1)*n; end vyp_slozitost2.m 13