Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Podobné dokumenty
Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Náhodné (statistické) chyby přímých měření

Téma 22. Ondřej Nývlt

KGG/STG Statistika pro geografy

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Cvičení ze statistiky - 7. Filip Děchtěrenko

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Výběrové charakteristiky a jejich rozdělení

NMAI059 Pravděpodobnost a statistika

Vybraná rozdělení náhodné veličiny

PRAVDĚPODOBNOST A STATISTIKA

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pravděpodobnost a aplikovaná statistika

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Cvičení ze statistiky - 5. Filip Děchtěrenko

Náhodné chyby přímých měření

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

PRAVDĚPODOBNOST A STATISTIKA

KGG/STG Statistika pro geografy

NÁHODNÁ VELIČINA. 3. cvičení

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Charakterizace rozdělení

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Náhodná veličina a rozdělení pravděpodobnosti

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Diskrétní náhodná veličina. November 12, 2008

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Chyby měření 210DPSM

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

I. D i s k r é t n í r o z d ě l e n í

Úvod do problematiky měření

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

p(x) = P (X = x), x R,

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

PRAVDĚPODOBNOST A STATISTIKA

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Inovace bakalářského studijního oboru Aplikovaná chemie

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy teorie pravděpodobnosti

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Charakterizují kvantitativně vlastnosti předmětů a jevů.

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnostní rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Normální (Gaussovo) rozdělení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

MATEMATIKA III V PŘÍKLADECH

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Intervalové Odhady Parametrů

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Pravděpodobnost a statistika I KMA/K413

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Deskriptivní statistické metody II. Míry polohy Míry variability

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Statistika II. Jiří Neubauer

Odhad parametrů N(µ, σ 2 )

Rovnoměrné rozdělení

Náhodný vektor a jeho charakteristiky

1. Statistická analýza dat Jak vznikají informace Rozložení dat

1. Přednáška. Ing. Miroslav Šulai, MBA

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

STATISTICKÉ ZJIŠŤOVÁNÍ

Tomáš Karel LS 2012/2013

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

STATISTICKÉ ODHADY Odhady populačních charakteristik

Tomáš Karel LS 2012/2013

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Normální (Gaussovo) rozdělení

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

7. Rozdělení pravděpodobnosti ve statistice

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Transkript:

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor) (2. část) (pro potřeby přednášky Úvod do strojového učení, PFL054)

Náhodná veličina ina náhodný jev ω Ω chceme popsat prostřednictvím některé jeho číselné charakteristiky X(ω), kterou nazveme náhodná veličina; X : Ω R diskrétn tní (nabývá konečného nebo spočetn etného počtu hodnot), spojitá (nabývá všech hodnot z daného intervalu) základní charakteristiky: průměr, r, rozptyl

Diskrétní pravděpodobnostní rozdělení Σ (i=1 ) P[X=x i ] = 1 seznam hodnot, kterých nabývá diskrétní náhodná veličina, a seznam pravděpodobností, s nimiž těchto hodnot náhodná veličina nabývá, udává diskrétní pravděpodobnostní rozdělení

Střední hodnota (průměr) diskrétní náhodné veličiny E[X] Σ i=1 n x i P(X=x i ) (µ) E[X] Σ i=1 x i P(X=x i )

Rozptyl (variance) popisuje velikost kolísání náhodné veličiny kolem střední hodnoty var [X] = E (X-E[X]) 2 (σ 2 )

Směrodatná odchylka σ= var[x]

Spojitá náhodná veličina pravděpodobnostní rozdělení je popsáno hustotou (frekvenční fcí) f(x)

Binomické rozdělení - motivace hod mincí: panna? orel? Jaká je pravděpodobnost p, že padne panna? Házejme n-krát, z toho r-krát padla panna p = r/n opakujme n hodů mincí; r r, p p

Binomické rozdělení motivace (pokračování) binomické rozdělení popisuje, pro libovolnou hodnotu r, pravděpodobnost jevu, že při n nezávislých hodech mincí právě r-krát padne panna za předpokladu, že pravděpodobnost panny v jednotlivých hodech je p

Kdy binomické rozdělení? 1. výsledky pokusu se dají popsat náhodnou veličinou X, která má dvě možné hodnoty {0,1} 2. P(X=1) je dáno konstantou p, nezávislou na výsledku jakéhokoli pokusu; většinou je p neznámé JAK ODHADNOUT?

Binomické rozdělení Bin(n,p) n nezávislých pokusů, zdar/nezdar - prostor elementárních jevů Ω = {0,1} n náhodná veličina X(ω) = Σ (i=1 n) ω i vyjadřuje počet (0,1, n) úspěchů v n nezávislých pokusech, kdy v každém z jednotlivých pokusů je pravděpodobnost úspěchu rovna p ω Ω, ω=(ω 1,ω 2,,ω n ), ω i je počet zdarů v i-tém pokusu, p(ω i ) = p ω i (1-p) (1-ωi) nezávislost pokusů: p(ω) = Π (i=1..n) p(ω i ) = p Σ ω i (1-p)(n- Σ ωi) pro k=σ (i=1 n) ω i, je počet elem. jevů = n!/k!(n-k)! P(X=k)= n!/k!(n-k)! p k (1-p) (n-k)

Binomické rozdělení: střední hodnota, rozptyl, směrodatná odchylka E[X] = np var[x] = np(1-p) σ = np(1-p)

Normální rozdělení (spojité) N(µ, σ 2 ) f(x) = 1/( 2πσ 2 )e 1/2((x-µ)/σ)2 normální rozdělení je určeno parametry µ (střední hodnotou) a σ (sm. odchylkou) µ a σ jsou konstanty, které určují polohu křivky na ose x (µ) a její roztažení podél osy x (σ)

Normální rozdělení - pokračování Jestliže náhodná veličina X vyhovuje normálnímu rozdělení, potom: P(X (a,b)) = p(x)dx E[X] = µ, var(x) = σ 2, σ X = σ

Normální rozdělení graficky

Normální rozdělení graficky - vysvětlení jednovrcholové, symetrické okolo střední hodnoty plocha pod křivkou hustoty je rovna jedné pravděpodobnost, že náhodná veličina nabude hodnot z určitého intervalu, je rovna ploše pod hustotou nad tímto intervalem např. pro interval s hranicí 1,96 a 1,96 má tato plocha velikost 0,95. Náhodná veličina nabývá hodnot z tohoto intervalu s 95% pravděpodobností a pouze s 5% pravděpodobností leží její hodnoty mimo uvedený interval

Průměr náhodné veličiny určuje polohu rozdělení na na číselné ose (µ 1 <µ 2 )

Směrodatná odchylka určuje tvar hustoty (σ 1 <σ 2 )

Centrální limitní věta

Statistická metodologie Nemusíte sníst celého vola na to, abyste poznali, že maso je tuhé. (S. Johnson)

induktivní statistika zobecňování závěrů s udáním stupně jejich nejistoty; schopnost učit se ze zkušenosti populace: základní soubor (výčtem/vymezením některých společných vlastností) parametr: číselná charakteristika populace (např. průměrná výška osmiletých dětí v ČR) výběr: požadované vlastnosti se zjišťují pouze u některých prvků populace; reprezentativnost výběru; za určitých předpokladů se dají závěry z výběrů pomocí statistické indukce zobecnit na celou populaci s vyjádřením míry nejistoty zobecňovaných závěrů

populace 12 osmiletých dětí výběr 6 dětí

Zkreslení odhadu odhad: je náhodná veličina použitá pro odhad parametru populace, z které je daný vzorek vybírán zkreslení odhadu libovolného parametru p : E[X] p nestranný odhad: E[X] p = 0

Jak odhadnou populační průměr z výběru pomocí tzv. intervalu spolehlivosti? populační (µ) vs. výběrový (x ) průměr provedeme-li opakované výběr a spočítáme průměry, pak se tyto výběry budou obvykle chovat tak, jako kdyby pocházely z normálního rozdělení (bez důkazu) σ výběr = σ populace / n, kde n je rozsah výběru, σ výběr je směrodatná odchylka rozdělení výběrových průměrů, σ populace je směrodatná odchylka původního rozdělení interval místo jednoduchého bodového odhadu

Vlastnosti rozdělení výběrového průměru

Interval spolehlivosti N% interval spolehlivosti pokrývá parametr p s pravděpodobností N

Interval spolehlivosti - pokračování hranice spolehlivosti N% 50 68 80 90 95 98 99 konstanta z n 0,67 1,00 1,28 1,64 1,96 2,33 2,58 konstanta z n určuje šířku nejmenšího intervalu kolem střední hodnoty, který pokrývá N% pravděpodobností v rámci normálního rozdělení čím vyšší je koeficient spolehlivosti, tím delší a tedy méně přesný je výsledný interval; je potřeba najít kompromis mezi požadovanou spolehlivostí a přesností odhadu, tj. délkou intervalu

Pro dané N - jak určit velikost intervalu, který obsahuje N% pstí? pro binomické rozdělení značně obtížné ALE máme štěstí: pro dostatečně velkou množinu instancí je možné binomické rozdělení aproximovat rozdělením normálním se stejnou střední hodnotou a se stejným rozptylem (Centrální limitní věta)

Interval spolehlivosti jestliže náhodná veličina X vyhovuje normálnímu rozdělení se střední hodnotu µ a směrodatnou odchylkou σ, potom hodnota x veličiny X padne do intervalu µ±z N σ v N% případů střední hodnota µ padne do intervalu x±z N σ v N% případů