Informační a znalostní systémy

Podobné dokumenty
Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Základy teorie pravděpodobnosti

Náhodný jev a definice pravděpodobnosti

Motivace. Náhodný pokus, náhodný n jev. pravděpodobnost. podobnostní charakteristiky diagnostických testů, Bayesův vzorec. Prof.RND. RND.

Pravděpodobnost a statistika

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

Pravděpodobnost a aplikovaná statistika

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Matematika III. 27. září Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Teorie pravěpodobnosti 1

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Matematika I 2a Konečná pravděpodobnost

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

2. přednáška - PRAVDĚPODOBNOST

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Pravděpodobnost a její vlastnosti

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 2

Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Pravděpodobnost a statistika

( ) ( ) Nezávislé jevy I. Předpoklady: 9204

PRAVDĚPODOBNOST A JEJÍ UŽITÍ

Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy. Příklad: při hodu hrací kostkou padne trojka

Pravděpodobnost (pracovní verze)

Intuitivní pojem pravděpodobnosti

Tomáš Karel LS 2012/2013

Počet pravděpodobnosti

5.1. Klasická pravděpodobnst

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Náhodný jev. Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy.

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

MATEMATIKA III V PŘÍKLADECH

ZÁKLADY INFORMATIKY. 1. Úvod do informatiky - pojem informace, vznik a vývoj teorie informace, osobnosti, přístupy, důvody pro vznik teorie informace.

Populace vs. data. popisná (deskriptivní) popis konkrétních dat. letní semestr

a) 7! 5! b) 12! b) 6! 2! d) 3! Kombinatorika

oddělení Inteligentní Datové Analýzy (IDA)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

Tomáš Karel LS 2012/2013

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

IB112 Základy matematiky

KGG/STG Statistika pro geografy

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

cv3.tex. Vzorec pro úplnou pravděpodobnost

1. Statistická analýza dat Jak vznikají informace Rozložení dat

ZÁKLADY TEORIE PRAVDĚPODOBNOSTI

Určeno studentům středního vzdělávání s maturitní zkouškou, 4. ročník, okruh Základy počtu pravděpodobnosti

7. Rozdělení pravděpodobnosti ve statistice

Úvod do teorie pravděpodobnosti

pravděpodobnosti a Bayesova věta

Pravděpodobnost a aplikovaná statistika

Řešené příklady z pravděpodobnosti:

Pravděpodobnost, náhoda, kostky

PRAVDĚPODOBNOST JE. Martina Litschmannová

Statistika (KMI/PSTAT)

Jevy A a B jsou nezávislé, jestliže uskutečnění jednoho jevu nemá vliv na uskutečnění nebo neuskutečnění jevu druhého

Pravděpodobnost, náhoda, kostky

Diskrétní náhodná veličina. November 12, 2008

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

NMAI059 Pravděpodobnost a statistika

Induktivní statistika. z-skóry pravděpodobnost

náhodný jev je podmnožinou

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

Základy pravděpodobnosti poznámky. Jana Klicnarová

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Projekt OPVK - CZ.1.07/1.1.00/ Matematika pro všechny. Univerzita Palackého v Olomouci

Zdroje chyb. Absolutní a relativní chyba. Absolutní chyba. Absolutní chyba přibližného čísla a se nazývá absolutní hodnota rozdílu přesného

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Cvičení ze statistiky - 4. Filip Děchtěrenko

4.5.9 Pravděpodobnost II

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Podmíněná pravděpodobnost

Statistická teorie učení

13. cvičení z PSI ledna 2017

6 5 = 0, = 0, = 0, = 0, 0032

3. Podmíněná pravděpodobnost a Bayesův vzorec

14. cvičení z PSI. 9. ledna Pro každý stav platí, že všechny hrany z něj vycházející mají stejnou pravděpodobnost.

CZ.1.07/1.5.00/ CZ.1.07/1.5.00/ Zvyšování vzdělanosti pomocí e-prostoru OP Vzdělávání pro konkurenceschopnost

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

VEKTORY. Obrázek 1: Jediný vektor. Souřadnice vektoru jsou jeho průměty do souřadných os x a y u dvojrozměrného vektoru, AB = B A

2. Definice pravděpodobnosti

MODELY ŘÍZENÍ ZÁSOB nákladově orientované modely poptávka pořizovací lhůta dodávky předstih objednávky deterministické stochastické

TECHNICKÁ UNIVERZITA V LIBERCI

Cvičení ze statistiky - 5. Filip Děchtěrenko

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Transkript:

Informační a znalostní systémy

Teorie pravděpodobnosti není v podstatě nic jiného než vyjádření obecného povědomí počítáním. P. S. de Laplace

Pravděpodobnost a relativní četnost Pokusy, výsledky nejsou jednoznačně předurčeny podmínkami, za kterých probíhají. Pokusy, které jsou (teoreticky) neomezeně mnohokrát opakovatelné, nazýváme náhodné pokusy. házení hracími kostkami nebo mincemi, tahání losů z osudí, míchání karet Praxe: výběrová šetření lze realizovat náhodný výběr losováním -> lze určit pravděp., s jakými dostáváme výběry strukturou odlišné od základního souboru (populace) Význam počtu pravděpodobnosti: vhodné vyjádření či zachycení náhodné stránky experimentů např. v biologii a medicíně

Náhodný jev Jakékoli tvrzení o výsledku, o kterém lze po uskutečnění pokusu či pozorování rozhodnout, zda je či není pravdivé Např. náhodný jev A "narození chlapce": v okamžiku početí, i těsně před porodem není předpověď pohlaví budoucího novorozence příliš spolehlivá Zaznamenávání jevu do posloupnosti Četnost, s jakou nastává A pro lib. dlouhou posl. charakterizuje, n délka posloupnosti (rozsah výběru) r počet narozených chlapců r absolutní četnost r/n relativní četnost výskytu náhodného jevu A ve výběru o rozsahu n S rostoucím rozsahem výběru se rel. četnosti ustalují kolem 0,5 Rel. četnost "narození chlapce" (log. stupnice)

Pravděpodobnost náhod. jevu Náhodný jev A je charakterizován číslem P(A), které je mírou častosti výskytu tohoto jevu a nazývá se pravděpodobnost náhodného jevu A. Základní vlastnosti P(A) nabývá hodnot z <0;1>, V případě, že A je jistý jev (nastává vždycky), je P(A)=1. V případě, že A je nemožný jev (nikdy nenastane), je P(A)=0. Mnohonásobné nezávislé opakování náh. pokusu: prakticky jisté, že se relativní četnost výskytu náhodného jevu A jen nepatrně liší od P(A) P(A) nepatrně odlišný od 0: prakticky jisté, že při jediném pokusu A nenastane P(A) nepatrně odlišný od 1: prakticky jisté, že při jediném pokusu A nastane V praxi pravděpodobnosti náh. jevů odhadujeme pomocí rel. četností. Kvalita odhadů vzrůstá s rostoucím počtem provedených pokusů

Odhady: statistické údaje Odhad pravděp. náh. jevu "narození chlapce" v naší populaci Rel. četnosti "narození chlapce" z celkového počtu živě narozených dětí v ČSSR (1966-1975) Rel. četnosti "narození chlapce" se v jedn. letech téměř neliší Lze usuzovat: P(A) se nemění - o něco vyšší než 0,51 Rok Počet živě narozených dětí Relativní četnost jevu "narození chlapce" 1966 222 615 0,5131 1967 215 985 0,5146 1968 213 807 0,5138 1969 222 934 0,5145 1970 228 531 0,5125 1971 237 242 0,5134 1972 251 455 0,5133 1973 274 703 0,5144 1974 291 367 0,5135 1975 289 425 0,5108 Celkem 2 448 064 0,5133

Pravidla pro počítání s pravděp. V praxi se zajímáme o více jevů současně a o jejich vzájemné interakce. C = (A,B) nastanou oba jevy A a B současně D = (A nebo B) nastane alespoň jeden z jevů A a B, tj. buď jev A, nebo jev B, či oba jevy A a B současně (tj. jev C). Pomocí pravděpodobností jevů A, B a C = (A,B): P(A nebo B) = P(A) + P(B) P(A,B)

Příklad 1 V náhodně vybrané skupině 140 mužů věku 40-50 let ohrožených ateriální hypertenzí se vyskytl rizikový faktor "zvýšený cholesterol" (jev A) ve 37 případech a rizikový faktor "kouření" (jevb) v 98 případech. Ve 31 případech jsme zjistili současný výskyt obou rizikových faktorů. Odhadněte pomocí relativních četností pravděpodobnosti výskytu jevů A, B, C = (A,B) a D = (A nebo B). Řešení: P(A)=37/140=0,2643 P(B)=98/140=0,7 P(C) =31/140=0,2214 P(D)=0,2643+0.7-0,2214=0,7429

Neslučitelné jevy Nemohou nastat současně P(A,B) = 0 pravidlo o sčítání pravděpodobností: P(A nebo B)=P(A)+P(B) obecněji: P(A 1 nebo A 2 nebo nebo A k ) = k 1P(A i ) Speciální případ: opačné jevy (doplňkové jevy) A, A např. "narození chlapce" a "narození dívky P( A)=1-P(A)

Příklad 2 Pravděpodobnost jevu A "narození chlapce" je 0,51, spočtěte pravděpodobnost jevu A "narození dívky" Řešení: Jev A "narození dívky" je opačným jevem k jevu A "narození chlapce P( A) = 1 - P(A) = 1-0,51 = 0,49

Podmíněná pravděpodobnost Slučitelné jevy mohou nastat současně Nelze použít pravidlo o sčítání pravděpodobností, ale: P(A nebo B) = P(A) + P(B) P(A,B) Někdy se zajímáme o výskyt A jen, pokud nastal určitý jev B s kladnou pravděpodobností (tj. může nastat) Víme-li že nastal B, může se tím změnit i pravděpodobnost výskytu A: Jevy neslučitelné s B se stanou nemožnými Jevy deterministicky určené B se stanou jistými (obr.: A nastává vždy, když nastane jev B) Ostatní jevy se mohou vyskytnout s pravděpodobnostmi obecně odlišnými od původních Pravděpodobnosti jevů, zjištěné za podmínky výskytu jevu B, se nazývají podmíněné pravděpodobnosti vzhledem k jevu B. Podmíněná pravděpodobnost jevu A vzhledem k jevu B je definována: Tudíž pravděpodobnost současného výskytu dvou jevů A a B

Příklad 3 Odhadněte podmíněnou pravděpodobnost výskytu faktoru "zvýšený cholesterol" (jev A) za podmínky výskytu faktoru "kouření" (jev B) - viz příklad 1 Řešení: Odhad P(A B) spočteme, jestliže za pravděpodobnosti jevů A a B dosadíme jejich odhady pomocí relativních četností. Dostaneme P(A B) = 0,2214/0,7 = 0,3163 Stejný výsledek musíme dostat, jestliže z celkového počtu 98 případů, ve kterých nastal B, stanovíme počet případů, ve kterých zároveň nastal jev A: 31. Odhad je tedy P(A B) = 31/98 = 0,3163 a vyjadřuje relativní četnost jevu A mezi případy, kdy nastal jev B

Nezávislé jevy Jevy A a B jsou nezávislé, jestliže výskyt jednoho jevu neovlivňuje výskyt druhého jevu. Matematické vyjádření tohoto faktu zapíšeme pomocí podmíněné pravděpodobnosti jako P(A B) = P(A) nebo obdobně P(B A) = P(B). Vidíme tedy, že pro nezávislé jevy A, B platí pravidlo o násobení pravděpodobností: P(A, B) = P(A)P(B) Obecněji: P(A 1, A 2,, A k ) = P(A 1 )P(A 2 ) P(A k )

Příklad 4 Zjistěte, zda faktory A a B uvedené v příkladu 1 se vyskytují nezávisle, jestliže vypočtené relativní četnosti považujeme za skutečné pravděpodobnosti. Řešení: V případě nezávislosti faktorů A a B platí P(A B)=P(A). Z dat příkladu dostáváme P(A B)=0,3163, což se liší od pravděpodobnosti P(A)=0,2643. Jevy A a B tedy nejsou nezávislé.

Příklad 5 Jev A: "první novorozenec narozený v příštím kalendářním roce v ČR je chlapec Jev B: "druhý novorozenec narozený v příštím kalendářním roce v ČR je chlapec" Vyloučíme-li vícečetné porody, spočtěte pravděpodobnost jevu C, že "oba novorozenci jsou chlapci" za předpokladu, že pravděpodobnost narození chlapce je 0,51 Řešení: Výskyt jevu A neovlivňuje výskyt jevu B, tudíž jevy A a B jsou nezávislé. Pravděpodobnost jevu C = (A,B), že oba novorozenci jsou chlapci: P(C) = P(A)P(B) = 0,51*0,51 = 0,2601

Příklad 6 Pravděp. jevu A "osoba má pravé oko modré" je 0,3 a pravděp. jevu B "osoba má levé oko modré" je také 0,3. Jestliže pravděpodobnost, že "osoba má pravé oko modré" za podmínky, že nastal jev "osoba má levé oko modré" je rovna 1, spočtěte pravděpodobnost jevu C "osoba má obě oči modré". Řešení: Jevy A a B nejsou nezávislé, neboť P(A) = 0,3 a P(A B)=1 Pravděpodobnost jevu C = (A, B): P(C) = P(A B)P(B) = 1*0,3 = 0,3

Příklad 7 Za předpokladu, že pravděpodobnost narození chlapce je 0,51, spočtěte, jaká je pravděpodobnost, že v sérii čtyř po sobě narozených dětí (vícečetné porody vyloučíme), bude právě jeden chlapec. Řešení: Označme C jev, že mezi čtyřmi novorozenci je právě jeden chlapec. Konkrétní možnosti, které vytvářejí jev C, jsou: C 1 =(A, A, A, A) chlapec se narodí jako první, C 2 =( A, A, A, A) druhý, C 3 =( A, A, A, A) třetí, C 4 =( A, A, A, A) čtvrtý C 1, C 2, C 3 a C 4 vzájemně neslučitelné. Z pravidla o sčítání pravděpodobností: P(C) = P(C 1 ) + P(C 2 ) + P(C 3 ) + P(C 4 ) Pravděpodobnosti jevů C 1, C 2, C 3 a C 4 jsou všechny stejné a jsou vypočteny pomocí pravidla o násobení pravděpodobností. Např.: P(C 1 ) = P(A)P( A)P( A)P( A) = 0,51*0,49 3 = 0,06 P(C) = 4*0,06 = 0,24

Bayesův vzorec Předpokládejme, že náhodné jevy B i, kde i=1, 2, 3,, k, jsou vzájemně neslučitelné a v každém pokusu nastává právě jeden z nich, takže musí platit: P(B 1 nebo B 2 nebo nebo B k ) k 1P(B i ) = 1 Známe-li podmíněné pravděpodobnosti jevu A za podmínky výskytu jevu B i : P(A B i ) pro i=1, 2, 3,, k, potom pravděpodobnost jevu A lze vyjádřit: P(A)= k 1P(A, B i ) = k 1P(A B i )P(B i ) - Pravidlo o úplné pravděpodobnosti

Příklad 8 Předpoklad: pravděpodobnost "úrazu" (jev A) u "dítěte" (jev B 1 ) je P(A B 1 ) = 0,2, u "osoby v reprodukčním věku" (jev B 2 ) je P(A B 2 ) = 0,2 u "osoby v postreprodukčním věku" (jev B 3 ) je P(A B 3 ) = 0,4 Pravděpodobnosti, že osoba bude patřit do některé z těchto skupin, jsou P(B 1 )=0,25, P(B 2 )=0,6 a P(B 3 )=0,15 Spočtěte pravděpodobnost úrazu v dané populaci. Řešení: B 1, B 2 a B 3 jsou vzájemně neslučitelné a v každém případě nastává právě jeden z nich. Ze znalosti podmíněných pravděpodobností výskytu úrazu v jednotlivých věkových kategoriích obyvatelstva a ze znalostí pravděpodobností těchto kategorií spočteme pravděpodobnost úrazu v populaci jako: P(A) = P(A B 1 )P(B 1 ) + P(A B 2 )P(B 2 ) + P(A B 3 )P(B 3 ) = = 0,2*0,25 + 0,2*0,6 + 0,4*0,15 = 0,23

Bayesův vzorec udává, jakým způsobem vypočítáme pravděpodobnosti P(B j A) jevu B j za podmínky, že nastal jev A, jestliže známe apriorní pravděpodobnosti P(B i ) a podmíněné pravděpodobnosti pro všechny jevy B i, i=1, 2, 3,, k. Bayesův vzorec má tvar Odvození Bayesova vzorce:

Příklad 9 Pravděpodobnost, že "osoba je kuřák" (jev A) ve skupině "osob s chronickou bronchitidou" (jev B 1 ) je P(A B 1 ) = 0,75 Pravděpodobnost, že "osoba je kuřák" ve skupině "osob bez chronické bronchitidy" (jev B 2 ) je P(A B 2 ) = 0,5 Pravděpodobnost "výskytu osoby s chronickou bronchitidou" v populaci P(B 1 ) = 0,4 Pravděpodobnost "výskytu osoby bez chronické bronchitidy" v populaci P(B 2 ) = 0,6. Spočtěte pravděpodobnost výskytu chronické bronchitidy u kuřáka. Řešení: Pomocí Bayesova vzorce dostaneme, že pravděpodobnost výskytu chronické bronchitidy u kuřáka je

Šance a pravděpodobnost Řekneme-li že šance O(A) (odds) závodního koně na první místo v dostihovém závodě (jev A) je 1 ku 4, znamená to, že kůň závod vyhraje s P(A) = 1/5 = 0,2. Převod šancí na pravděpodobnosti: sečtením 1 + 4 = 5 dostaneme jmenovatel zlomku pro vyjádření pravděpodobnosti výhry, tj. 1/5. Pro libovolný náhodný jev A tedy platí: šance O(A) výskytu jevu A je