PRAVDĚPODOBNOST A STATISTIKA OPAKOVÁNÍ, pro rozpoznávání



Podobné dokumenty
SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

Pravděpodobnost a statistika: řešené příklady 2014 Tomáš Kroupa

Řešení: a) Označme f hustotu a F distribuční funkci náhodné veličiny X. Obdobně označme g hustotu a G distribuční funkci náhodné veličiny Y.

9.2.5 Sčítání pravděpodobností I

Pravděpodobnost a statistika; Opakování pro rozpoznávání

Pravděpodobnost a statistika

Dopravní úloha. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Pravděpodobnost a statistika

1 Rozptyl a kovariance

Příklady k třetímu testu - Matlab

Všechny možné dvojice ze čtyř možností, nezáleží na uspořádání m (všechny výsledky jsou rovnocenné), 6 prvků. m - 5 prvků

{ } Kombinace II. Předpoklady: =. Vypiš všechny dvoučlenné kombinace sestavené z těchto pěti prvků. Urči počet kombinací pomocí vzorce.

1. Pravděpodobnost a statistika (MP leden 2010)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Drsná matematika IV 7. přednáška Jak na statistiku?

(a) = (a) = 0. x (a) > 0 a 2 ( pak funkce má v bodě a ostré lokální maximum, resp. ostré lokální minimum. Pokud je. x 2 (a) 2 y (a) f.

Diferenciální počet funkcí jedné proměnné

Kapitola 7: Integrál. 1/14

Funkce více proměnných

Domácí úkol DU01_2p MAT 4AE, 4AC, 4AI

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Tématické celky { kontrolní otázky.

Základy teorie pravděpodobnosti

Síla a významnost asociace mezi proměnnými v systému

2.7.2 Mocninné funkce se záporným celým mocnitelem

2 ELEMENTÁRNÍ POČET PRAVDĚPODOBNOSTI. Čas ke studiu kapitoly: 70 minut. Cíl: Po prostudování této kapitoly budete umět

6. T e s t o v á n í h y p o t é z

PRAVDĚPODOBNOST A STATISTIKA

A NUMERICKÉ METODY. Matice derivací: ( ) ( ) Volím x 0 = 0, y 0 = -2.

Využití EduBase ve výuce 2

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

Důkazové metody. Teoretická informatika Tomáš Foltýnek

Numerická integrace. 6. listopadu 2012

Inovace bakalářského studijního oboru Aplikovaná chemie

PREPRINT PRAVDĚPODOBNOST A NÁHODNÁ VELIČINA

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a statistika I KMA/K413

Modelování pohotovosti systému metodou Monte Carlo Availability modeling by Monte Carlo method

Nerovnice s absolutní hodnotou

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Regresní a korelační analýza

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Definice z = f(x,y) vázané podmínkou g(x,y) = 0 jsou z geometrického hlediska lokálními extrémy prostorové křivky k, Obr Obr. 6.2.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Cvičení ze statistiky - 6. Filip Děchtěrenko

Rozhodování v podmínkách rizika. Marie Kalhousová

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

15 s. Analytická geometrie lineárních útvarů

19. Testy dobré shody

Teoretická rozdělení

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

ROZPOZNÁVÁNÍ Formulace úlohy, neformálně

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Statistické metody v ekonomii

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Aritmetika s didaktikou I.

1 Pravděpodobnostní prostor

UŽITÍ DERIVACÍ, PRŮBĚH FUNKCE

3.2.4 Podobnost trojúhelníků II

EXPONENCIÁLNÍ A LOGARITMICKÁ FUNKCE

Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM

Statistika II. Jiří Neubauer

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Sada 1 Matematika. 16. Úvod do pravděpodobnosti

2.8.9 Parametrické rovnice a nerovnice s absolutní hodnotou

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Příklady a návody. Databázová vrstva

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

z možností, jak tuto veličinu charakterizovat, je určit součet

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA I

NÁHODNÁ VELIČINA. 3. cvičení

Cvičení 3 - teorie. Teorie pravděpodobnosti vychází ze studia náhodných pokusů.

PRAVDĚPODOBNOST A STATISTIKA

Funkce rostoucí, funkce klesající I

Matematická analýza III.

Lokální a globální extrémy funkcí jedné reálné proměnné

( ) Neúplné kvadratické rovnice. Předpoklady:

Cvičení ze statistiky - 4. Filip Děchtěrenko

M - Rovnice - lineární a s absolutní hodnotou

Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

Matice a maticová algebra, soustavy lineárních rovnic, kořeny polynomu a soustava nelin.rovnic

INTEGRÁLNÍ POČET NEURČITÝ INTEGRÁL,

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

( ) Kreslení grafů funkcí metodou dělení definičního oboru I. Předpoklady: 2401, 2208

Pravděpodobnost je Martina Litschmannová MODAM 2014

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Výsledky testování školy. Druhá celoplošná generální zkouška ověřování výsledků žáků na úrovni 5. a 9. ročníků základní školy. Školní rok 2012/2013

Náhodná veličina a rozdělení pravděpodobnosti

Sekvenční logické obvody

10. Polynomy a racionálně lomenné funkce

Dualita v úlohách LP Ekonomická interpretace duální úlohy. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

2.1. Pojem funkce a její vlastnosti. Reálná funkce f jedné reálné proměnné x je taková

Transkript:

PRAVDĚPODOBNOST A STATISTIKA OPAKOVÁNÍ, pro rozpoznávání Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/25 OBSAH PŘEDNÁŠKY Pravěpodobnost (definice, náhodná veličina) Statistika (náhodný výběr, odhad parametrů) Poděkování Ing. Martinovi Urbanovi, PhD. za první verzi z podzimu 2005; prof. Ing. Mirko Navarovi, DrSc. za několik průsvitek.

DOPORUČENÉ ČTENÍ 2/25 J. Novovičová: Pravděpodobnost a matematická statistika. Skriptum Fakulty dopravní ČVUT, Praha 2002. A. Papoulis: Probability, Random Variables and Stochastic Processes, McGraw Hill, Edition 4, 2002. http://mathworld.wolfram.com/

PRAVDĚPODOBNOST, STATISTIKA 3/25 Pravděpodobnost abstraktní matematický model neurčitosti modeluje děje, v nichž hraje roli náhodnost Statistika popisná nebo inferenční sběr, organizace a analýza dat zobecňuje z omezených / konečných vzorků odhad parametrů, testování hypotéz, atd.

PRAVDĚPODOBNOST Navarův motivační příklad 4/25 Los loterie se prodává za cenu 2 EUR. 1 los z 1000 vyhrává 1000 EUR, ostatní nic. (Tím je dána hodnota losu po losování.) Za kolik máme prodat los před losováním? Za 2 EUR by ho koupil jen hlupák. (Nebo ne?) Hodnota losu před losováním je 1 1000 1000 = 1 EUR = průměrná hodnota po losování. Na to je teorie pravděpodobnosti. Otázka Loterie : Proč se přesto kupují losy a loterie fungují?

STATISTIKA, Navarův motivační příklad 5/25 Dosud jsme předpokládali, že parametry pravděpodobnostního modelu jsou známy. To je málokdy splněno. Příklad (Sportka): Na Sportce se normálně prodělává; jelikož jsou výhry stanoveny podle počtu výherců, je výhodnější sázet jinak než ostatní. K tomu potřebujeme vědět, podle jakého modelu sázejí ostatní. Příklad (ruleta): U rulety se obě strany zajímají, zda padají všechna čísla se stejnou pravděpodobností, přesněji, jak velké jsou odchylky od rovnoměrného rozdělení. Ale jak to zjistit a jaké je riziko chybných závěrů? Na to je statistika. Statistika poskytuje daleko víc: nástroj pro zkoumání světa, pro hledání a ověřování závislostí, které nejsou zjevné.

Náhodný pokus NÁHODNÉ JEVY, POJMY 6/25 Prostor elementárních jevů je neprázdná množina Ω všech možných výsledků daného pokusu. Elementární jevy ω Ω jsou prvky prostoru elementárních jevů (výsledky pokusu). Jevové pole A je tvořeno systémem všech podmnožin prostoru elementárních jevů Ω. Náhodný jev A A je prvkem jevového pole. Poznámka: pojem náhodného jevu byl zaveden proto, aby bylo možné definovat pravděpodobnost, rozdělení pravděpodobnosti, atd.

PRAVDĚPODOBNOST, ZAVEDENÍ 7/25 Klasická (dnes se již nepovažuje za definici pravděpodobnosti, ale metodu odhadu pravděpodobnosti) Limitní (četnostní) P (A) N A N P (A) = lim N N A N Axiomatická (Andreje Kolmogorova 1930)

AXIOMATICKÁ DEFINICE PRAVDĚPODOBNOSTI 8/25 Ω - prostor elementárních jevů A - jevové pole 1. P (A) 0, A A. 2. P (Ω) = 1. 3. If A B = then P (A B) = P (A) + P (B), A A, B B.

PRAVDĚPODOBNOST je funkce P, která jevům přiřazuje čísla z 0, 1 a splňuje podmínky 9/25 (P1) P [true] = 1, [ ] (P2) P A n = P [A n ], pokud se jevy A n, n N, n N n N navzájem vylučují. Z nich vyplývá: P [false] = 0, P [ A] = 1 P [A], jestliže A B, pak P [A] P [B]. Pro korektnost je potřeba, aby systém jevů splňoval určité podmínky.

ODVOZENÉ VZTAHY 10/25 If A B then P (B \ A) = P (B) P (A). Symbol \ označuje množinový rozdíl. P (A B) = P (A) + P (B) P (A B).

PODMÍNĚNÁ PRAVDĚPODOBNOST 11/25 Máme pravděpodobnostní popis systému. Dostaneme-li dodatečnou informaci, že nastal jev B, změní se naše znalost o pravděpodobnosti jevu A na P (A B) = P (A B), P (B) což je podmíněná pravděpodobnost jevu A za podmínky B. Je definována pouze pro P (B) 0.

VLASTNOSTI PODMÍNĚNÉ PRAVDĚPODOBNOSTI 12/25 P (true B) = 1, P (false B) = 0. Pokud A = A n a jevy A 1, A 2,... se navzájem vylučují, n N pak P ( A B ) = n N P (A n B). Jevy A, B jsou nezávislé, právě když P (A B) = P (A). Pokud B A, pak P (A B) = 1. Pokud B A, pak P (A B) = 0. Jevy B i, i I, tvoří úplný systém jevů, jestliže se navzájem vylučují a i I B i = true.

PŘÍKLAD: podmíněná pravděpodobnost Jeden hod kostkou. Jaká je pravděpodobnost, že padne číslo větší než 3 (jev A) za podmínky, že padlo liché číslo (jev B). 13/25 Ω = {1, 2, 3, 4, 5, 6}, A = {4, 5, 6}, B = {1, 3, 5} P (A) = P (B) = 1 2 P (A B) = P ( {5} ) = 1 6 P (A B) = P (A B) P (B) = 1 2 1 6 = 1 3

VĚTA O ÚPLNÉ PRAVDĚPODOBNOSTI Nechť B i, i I, je úplný systém jevů a i I : P (B i ) 0. 14/25 Pak pro každý jev A platí P (A) = i I P (B i ) P (A B i ). Důkaz: (( ) ) P (A) = P B i A = i I P (B i A) = i I i I = P ( ) (B i A) i I P (B i ) P (A B i ).

BAYESOVA VĚTA 15/25 Nechť B i, i I, je úplný systém jevů a i I : P (B i ) 0. Pak pro každý jev A splňující P (A) 0 platí P (B i A) = P (B i ) P (A B i ) i I P (B i) P (A B i ). Důkaz (s využitím věty o úplné pravděpodobnosti): P (B i A) = P (B i A) P (A) = P (B i ) P (A B i ) i I P (B i) P (A B i ).

VÝZNAM BAYESOVY VĚTY 16/25 Pravděpodobnosti P (A Bi) odhadneme z pokusů nebo z modelu, pomocí nich určíme pravděpodobnosti P (B i A), které slouží k optimálnímu odhadu, který z jevů B i nastal. Problém: Ke stanovení aposteriorní pravděpodobnosti P (B i A) potřebujeme znát i apriorní pravděpodobnost P (B i ). Podobně definujeme podmíněné rozdělení náhodné veličiny, podmíněnou hustotu spojité náhodné veličiny apod.

PODMÍNĚNÁ NEZÁVISLOST 17/25 Náhodné jevy A, B jsou podmíněně nezávislé za podmínky C, jestliže P (A B C) = P (A C) P (B C). Podobně definujeme podmíněnou nezávislost více jevů, náhodných veličin apod.

SDRUŽENÁ PRAVDĚPODOBNOST 18/25 P (A B) = P (A) P (B A) = P (B) P (A B)

NEZÁVISLÉ JEVY Jevy A, B jsou nezávislé P (A B) = P (A) P (B). 19/25 Příklad Jeden hod kostkou. Jevy A > 3, jev B liché číslo. Jsou jevy nezávislé? Ω = {1, 2, 3, 4, 5, 6}, A = {4, 5, 6}, B = {1, 3, 5} P (A) = P (B) = 1 2 P (A B) = P ({5}) = 1 6 P (A) P (B) = 1 1 2 2 = 1 4 P (A B) P (A) P (B) jevy jsou závislé.

DISTRIBUČNÍ FUNKCE NÁHODNÉ VELIČINY Distribuční funkce náhodné veličiny X je funkce F : 0, 1 je definovaná pomocí F (x) = P (X x). Vlastnosti: 1. F (x) je neklesající funkce, tj. pro dvojici x 1 < x 2 platí F (x 1 ) F (x 2 ). 2. F (X) je zprava spojitá, tj. platí lim F (x + h) = F (x). h 0 + 3. Pro každou distribuční funkci platí lim F (x) = 0 a x lim F (x) = 1. Zapsáno zkráceně: F ( ) = 0, F ( ) = 1. x Jestliže jsou možné hodnoty F (x) z intervalu (a, b), pak F (a) = 0, F (b) = 1. Každou funkci splňující předchozí tři vlastnosti můžeme pokládat za distribuční funkci. 20/25

ABSOLUTNĚ SPOJITÁ DISTRIBUČNÍ FUNKCE Distribuční funkce F se nazývá absolutně spojitá, jestliže existuje nezáporná funkce f (hustota pravděpodobnosti) a platí F (x) = Hustota splňuje x f (u) du pro každé x X. f (x) dx = 1 Existuje-li derivace F (x) v bodě x, potom F (x) = f (x). Pro a, b Re, a < b platí 21/25 P (a < X < b) = b a f (x)dx = F (b) F (a)

PŘÍKLAD, NORMÁLNÍ ROZDĚLENÍ 22/25 F (x) f (x) = 1 2πσ 2 e x2 2σ 2 Distribuční funkce Hustota

ZÁKLADNÍ CHARAKTERISTIKY NÁHODNÉ VELIČINY 23/25 Spojité rozdělení Diskrétní rozdělení Střední hodnota E(x) = x f(x) dx E(x) = x k-tý obecný moment E(x k ) = x k f(x) dx E(x) = x k-tý centrální moment E(x k ) = µ x ) (x k f(x) dx E(x) = x Rozptyl, též disperze D(x) = µ x ) (x 2 f(x) dx E(x) = x x P (x) x k P (x) x k P (x) x 2 P (x)

KOVARIANCE 24/25 Vzájemná kovariance dvou veličin X, Y σ xy = E ( (X µ x )(Y µ y ) ) Kovarianční matice n veličin X 1,..., X n Σ = σ 2 1... σ 1n... σ n1... σ 2 n Kovarianční matice je symmetrická, pozitivně semidefinitní.

KVANTILY, MEDIÁN 25/25 p-kvantil Qp P (X < Q p ) = p Medián je p-kvantil pro p = 0, 5 P (X < Q p ) = 0, 5 Poznámka: Medián se používá jako náhrada střední hodnoty v robustní statistice.