Počet pravděpodobnosti

Podobné dokumenty
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

KGG/STG Statistika pro geografy

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Inovace bakalářského studijního oboru Aplikovaná chemie

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Tomáš Karel LS 2012/2013

Náhodná veličina a rozdělení pravděpodobnosti

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Informační a znalostní systémy

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

7. Rozdělení pravděpodobnosti ve statistice

Vybraná rozdělení náhodné veličiny

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

Pravděpodobnost a aplikovaná statistika

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Poznámky k předmětu Aplikovaná statistika, 5.téma

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Základy teorie pravděpodobnosti

Tomáš Karel LS 2012/2013

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Pravděpodobnost (pracovní verze)

Diskrétní náhodná veličina. November 12, 2008

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Síla a významnost asociace mezi proměnnými v systému

Design Experimentu a Statistika - AGA46E

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

TECHNICKÁ UNIVERZITA V LIBERCI

Odhady - Sdružené rozdělení pravděpodobnosti

Design Experimentu a Statistika - AGA46E

Základy teorie pravděpodobnosti

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

Základy teorie pravděpodobnosti

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

MATEMATICKÁ STATISTIKA - XP01MST

2. přednáška - PRAVDĚPODOBNOST

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Jana Vránová, 3. lékařská fakulta UK

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

ROZDĚLENÍ NÁHODNÝCH VELIČIN

IB112 Základy matematiky

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Motivace. Náhodný pokus, náhodný n jev. pravděpodobnost. podobnostní charakteristiky diagnostických testů, Bayesův vzorec. Prof.RND. RND.

Náhodné (statistické) chyby přímých měření

Chyby měření 210DPSM

Univerzita Palackého v Olomouci

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

NMAI059 Pravděpodobnost a statistika

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Induktivní statistika. z-skóry pravděpodobnost

Pravděpodobnost a statistika

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Ranní úvahy o statistice

Přednáška X. Testování hypotéz o kvantitativních proměnných

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Epidemiologické metody

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Pravděpodobnost a aplikovaná statistika

Diskrétní náhodná veličina

Cvičení ze statistiky - 5. Filip Děchtěrenko

1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a statistika I KMA/K413

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

1. Statistická analýza dat Jak vznikají informace Rozložení dat

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ VELIČINA. Podle typu výběrového prostoru rozlišujeme dva základní druhy NV Diskrétní (nespojitou) náhodnou veličinu Spojitou náhodnou veličinu

Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Usuzování za neurčitosti

Teoretická rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

TEMATICKÝ PLÁN VÝUKY

NÁHODNÁ VELIČINA. 3. cvičení

Analýza dat na PC I.

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Základy biostatistiky

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Transkript:

PSY117/454 Statistická analýza dat v psychologii Přednáška 4 Počet pravděpodobnosti Je známo, že když muž použije jeden z okrajových pisoárů, sníží se pravděpodobnost, že bude pomočen o 50%. anonym

Pravděpodobnost jevu Pravděpodobnost, že nastane jev A jistý jev: P = 1 nemožný jev: P = 0 jisté a nemožné jevy se vyskytují pouze v teorii 2 pojetí pravděpodobnosti subjektivní jistota, zejm. p-nost jednotlivých událostí četnostní (statistické): z m náhodných pokusů nastal jev A n-krát P (A) = n /m, blíží-li se počet pokusů (populaci) AJ: probability, event, random trial, subjectivist vs. frequentist probability

Jevy a náhodné pokusy Jevy hodnoty proměnných např. Petr má IQ = 150 vzorek 15 IQ (lidí) 15 jevů a jejich kombinace (složené jevy) náhodné vs. deterministické, 2: neslučitelné(disjunktní), ekvivalentní doplňkový jev (A ) Pole jevů množina hodnot, kterých může proměnná/é nabývat proměnná Náhodný pokus situace, kdy z pole jevů může nastat jeden nebo více jevů výběr a změření člověka, hod kostkou nelze určit, který jev nastane & lze opakovat bez vzájemného ovlivňování Náhodným pokusem získáváme z pole jevů jev. AJ: event, sample space, random trial, random vs. deterministic events, mutally exclusive events, equivalent events

Počítání s pravděpodobnostmi NEBO součet jevů - nastane jev A nebo jev B [nebo oba, nejsou-li disjunktní] P (AUB) = P (A) + P (B) P (A B) př. disj. náhodně vybraný člověk má základní vz. nebo je vyučen. A součin jevů - nastane jev A a zároveň jev B [jsou-li A a B nezávislé] P (A B) = P (A). P (B) P (A B) = P (A&B) př. náhodně vybraný člověk je psycholožka (pohlaví=žena, povolání=psychologie) Kombinatorika velikost pole jevů permutace n prvků = n! kombinace r prvků z n-prvkové množiny = n! / r!(n-r)! Šance odds - častý způsob vyjádření pravděpodobnosti př. šance Komety na vítězství jsou 1:10 O(A) = P (A) / P (A ) Poměr šancí (OR): obvyklý způsob srovnání šancí ve 2 skupinách: OR 12 =O 1 /O 2 AJ: and, or, addition, multiplication, probability calculus, permutations, combinations, odds, odds ratio

Podmíněná pravděpodobnost Pravděpodobnost jevu A, pokud nastal jev B P (A B) = P (A B) / P (B) Př. Kuřáků je v populaci 30%, tedy P (Kou + ) = 0,3. 12% lidí má jak rakovinu, tak návyk na kouření: P (Rak + Kou + )=0,12 Jsem-li kuřák, jaká je pro mě pravděpodobnost onemocnění rakovinou? Kouří-li člověk (nastalý jev B), je riziko onemocnění rakovinou (P jevu A) P (Rak + Kou + ) = P (Rak + Kou + ) / P (Kou + ) = 0,12/0,3=0,4 AJ: conditional probability, Bayes s theorem

Podmíněné p-nosti a teroristé FBI usilovalo možnost neomezených odposlechů. Automatický analyzátor hovorů dokáže s 99% přesností identifikovat po hlase teroristu/teroristku. Jaká je p-nost, že člověk, kterého začne FBI vyšetřovat, je ve skutečnosti nevinný? Je-li člověk identifikován systémem (I+), jaká je p-nost neviny (T-): P(T- I+)? V populaci terorista 1 z 100000 (3000 z 300000000 v USA), P(T+)=0,00001. 99% z teroristů je identifikováno: P(I+ T+)=0,99x0,00001=0,0000099 1% teroristů není identifikováno: P(I- T+)=0,01x0,00001= 0,0000001 Neteroristů je 9999 z 100000 (299997t z 300000t v USA), P(T-)=0,99999. 99% z neteroristů je OK: P(I- T-)=0,99x0,99999=0,9899901 1% neteroristů je identifikováno: P(I+ T-)=0,01x0,99999= 0,0099999 P(I+)=0,0100098, tj. 300294 lidí P(T- I+) = P(I+ T-)/P(I+) = 0,0099999 / 0,0100098 = 0,999... 999 z 1000 Savage, Wainer (2008)

Bayesův teorém Přepočet mezi P (A B) a P (B A) P (A). P (B A) P(A B) = ----------------------------------- P (A). P (B A) + P (A ). P (B A ) př. Test na LMD má 15% chybovost: P (T- L+)=0,15 ; P (T+ L-)=0,15 Prevalence LMD je 5%: P (L+)=0,05 Dítě má pozitivní výsledek testu. Jaká je P, že má LMD? P (L+ T+)=? P (L+ T+) = P (L+).P (T+ L+) / [P (L+).P (T+ L+) + P (L-).P (T+ L-)] = = 0,05. 0,85 / (0,05. 0,85 + 0,95. 0,15) = 0,23

Podmíněné pravděpodobnosti v diagnostické praxi Skutečný stav Má, co hledáme Dg+ Nemá, co hledáme Dg Pozitivní T+ Úspěch (a) Neúspěch (c) Výsledek testu Negativní T Neúspěch (b) Úspěch (d) Celkem % T+ testů (a+c) % T-testů (b+d) Celkem % Lidí s Dg (a+b) Prevalence Lidí bez Dg (c+d) Senzitivita testu: P(T+ Dg+) Specificita testu: P(T Dg ) Prediktivní hodn. T+: P(Dg+ T+) Prediktivní hodn. T : P(Dg T ) Př. Z manuálu Addenbrookského kognitivního testu Význam testu pro záchyt syndromu demence Skóruje-li pacient 88 bodů a méně je senzitivita pro demenci 94 % a specificita 89 %. Zvolíme-li přísnější kritérium (hranici 82 bodů a méně) je senzitivita 84% a specificita 100%.

Pravděpodobnostní rozložení náhodné proměnné Je-li proměnná náhodná (tj. její hodnoty lze považovat za výsledek náhodných pokusů) jaká je P výskytu jednotlivých možných hodnot? Vzpomeňme si, že P (A) = n / m, blíží-li se počet pokusů (populaci) Máme-li tedy dost velký, náhodně vybraný vzorek, pak P výskytu jednotlivých hodnot jejich relativní četnost Pravděpodobnostní rozložení = teoretické rozložení rel. četností U diskrétních proměnných uvažujeme o P výskytu jednotlivých hodnot. U spojitých proměnných neuvažujeme o P výskytu jednotlivých hodnot ( ), ale spíše o p výskytu hodnot v intervalech hustota pravděpodobnosti P-nostní rozložení je popsáno distribuční funkcí F(x) = P (X x) tj. P výskytu hodnot x Tato P je rovna ploše oblasti pod křivkou hustoty pravděpodobnosti AJ: random variable, probability distribution, distribution function, probability density

Normální rozložení 1,0 kumulativní relativní četnosti normálního rozložení - graf distribuční funkce hustota (četnosti) normálního rozložení 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0-4 -3-2 -1 0 1 2 3 4

P v normálním rozložení

Důležitá p-nostní rozložení Normální Poissonovo Studentovo t-rozložení Fisherovo F-rozložení 2 -rozložení (chí-kvadrát) Binomické Vyjma binomického se všechna uvedená rozložení používají jako přibližné (asymptotické) ideály, jimž by se rozložení našich proměnných (statistik) blížilo, kdybychom měli obrovský a reprezentativní vzorek.