Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Podobné dokumenty
Motivace. Náhodný pokus, náhodný n jev. pravděpodobnost. podobnostní charakteristiky diagnostických testů, Bayesův vzorec. Prof.RND. RND.

Informační a znalostní systémy

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

PRAVDĚPODOBNOST JE. Martina Litschmannová

Počet pravděpodobnosti

Základy teorie pravděpodobnosti

Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Pravděpodobnost a statistika

OR (odds ratio, poměr šancí) nebo též relativní riziko RR. Validita vyšetření nádorových markerů. Validita (určuje kvalitu testu)v % = SP/ SP+FP+FN+SN

Statistika (KMI/PSTAT)

Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

2. přednáška - PRAVDĚPODOBNOST

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Intuitivní pojem pravděpodobnosti

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pravděpodobnost a její vlastnosti

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

ZÁKLADY INFORMATIKY. 1. Úvod do informatiky - pojem informace, vznik a vývoj teorie informace, osobnosti, přístupy, důvody pro vznik teorie informace.

Tomáš Karel LS 2012/2013

Pravděpodobnost a statistika

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Pravděpodobnost vs. Poměr šancí. Pravděpodobnostní algoritmy: Bayesova věta. Bayesova teorie rozhodování. Bayesova věta (teorém) Vzorec. ...

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Náhodný jev a definice pravděpodobnosti

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

PRAVDĚPODOBNOST A JEJÍ UŽITÍ

Matematika III. 27. září Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Induktivní statistika. z-skóry pravděpodobnost

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

( ) ( ) Nezávislé jevy I. Předpoklady: 9204

3. Podmíněná pravděpodobnost a Bayesův vzorec

Ranní úvahy o statistice

Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy. Příklad: při hodu hrací kostkou padne trojka

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

Teorie pravěpodobnosti 1

Pravděpodobnost (pracovní verze)

Úvod do teorie pravděpodobnosti

Epidemiologie, 4. seminář. SCREENING SCREENINGOVÉ TESTY v epidemiologii

NMAI059 Pravděpodobnost a statistika

Matematika I 2a Konečná pravděpodobnost

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Epidemiologické metody

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

5.1. Klasická pravděpodobnst

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Jana Vránová, 3. lékařská fakulta UK

IB112 Základy matematiky

KGG/STG Statistika pro geografy

Pravděpodobnost a aplikovaná statistika

Cvičení ze statistiky - 5. Filip Děchtěrenko

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Usuzování za neurčitosti

Cvičení ze statistiky - 4. Filip Děchtěrenko

Populace vs. data. popisná (deskriptivní) popis konkrétních dat. letní semestr

Rychlokurz forenzní DNA statistiky Anastassiya Žídková

Poznámky k předmětu Aplikovaná statistika, 1. téma

Tomáš Karel LS 2012/2013

Odhady - Sdružené rozdělení pravděpodobnosti

Poznámky k předmětu Aplikovaná statistika, 11. téma

oddělení Inteligentní Datové Analýzy (IDA)

TECHNICKÁ UNIVERZITA V LIBERCI

pravděpodobnosti a Bayesova věta

Diskrétní náhodná veličina. November 12, 2008

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Testování statistických hypotéz

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Jevy A a B jsou nezávislé, jestliže uskutečnění jednoho jevu nemá vliv na uskutečnění nebo neuskutečnění jevu druhého

Jana Vránová, 3. lékařská fakulta, UK Praha

4ST201 STATISTIKA CVIČENÍ Č. 7

Pravděpodobnost a aplikovaná statistika

Motivace. 1. Náhodné jevy. Poznámky k předmětu Aplikovaná statistika, 1. téma

Značení 1.1 (posloupnost výsledků pokusu). Mějme posloupnost opakovaných (i závislých) pokusů,

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Náhodné vektory a matice

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

1. Statistická analýza dat Jak vznikají informace Rozložení dat

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

(bridžové karty : 52 karet celkem, z toho 4 esa) [= 0, 0194] = 7, = 4, = 1, = 9, = 1, 77 10

VÝBĚR A JEHO REPREZENTATIVNOST

Inovace bakalářského studijního oboru Aplikovaná chemie

IV. Základní pojmy matematické analýzy IV.1. Rozšíření množiny reálných čísel

Základy pravděpodobnosti poznámky. Jana Klicnarová

Náhodný jev. Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy.

Pravděpodobnost a matematická statistika

Transkript:

Pravděpodobnostn podobnostní charakteristiky diagnostických testů, Bayesův vzorec Prof.RND.Jana Zvárov rová,, DrSc. Motivace V medicíně má mnoho problémů pravěpodobnostní charakter prognóza diagnoza účinnost léčby Počet pravděpodobnosti je základem induktivní statistiky zobecnění směrem od výběru k populaci nejistota; hladina významnosti, p-hodnoty, intervaly spolehlivosti Náhodný pokus, náhodný n jev Náhodný pokus: výsledek není jednoznačně určen podmínkami, předpokládáme opakovatelnost pokusu, jednotlivá opakování se neovlivňují Náhodný jev: tvrzení o výsledku pokusu, lze určit jeho pravdivost náhodné jevy A,B,C,D, (Př.A...padnutí šestky, B narození chlapce) negace A 1

815 Relativní četnost, pravděpodobnost podobnost předpokládáme opakovánípokusu, sledujeme výsledky: A, A, A, A, A, A, A, A, A, A jev nastal mkrát z n pokusů Relativní četnost výskytu jevu A: m / n Pravděpodobnost jevu A číslo A), které je mírou častosti výskytu A A) = lim n m n Příklad Sledujeme náhodný jev narozeníchlapce v závislosti na rostoucím počtu novorozenců. ABSOLUTNÍ ČETNOST m počet narozených chlapců RELATIVNÍ ČETNOST m/n počet narozených chlapců k celkovému počtu novorozenců (často se udává v %) Počet novorozenců n Absolutní četnost m Relativní četnost m/n 1 1 1 2 1 0,50 3 2 0,66 4 2 0,50 5 2 0,40 6 3 0,50 Základní vlastnosti pravděpodobnost jistého jevu je rovna 1 pravděpodobnost nemožného jevu je 0 pro libovolný A platí 0 A) 1 lze-li A rozložit na několik vzájemně se vylučujících (disjunktních) jevů A 1,, A k, pak A) = A 1 ) + + A k ) je-li A částí B, pak A) B) 2

Pravidla pro počítání většinou sledujeme nikoli jeden jev, ale více jevů a zajímají nás jejich vzájemné vztahy C=(A,B) A a B nastanou současně D=(A nebo B) nastane alespoň jeden z jevů A a B A nebo B) = A) + B) -A,B) Jevy neslučiteln itelné,, opačné A a B jsou neslučitelné, když nemohou nastat oba současně, neboli A,B)=0 A nebo B) = A) + B) pravidlo o sčitání pravděpodobností obecněji: nechť A 1, A 2,..., A k vzájemně neslučitelné, jev D=(A 1 nebo A 2 nebo A k ) D)= A 1 ) + + A k )=ΣA i ) opačný (doplňkový) jev k jevu A (značíme A) nastává právě tehdy, když A nenastává A) = 1- A) Příklad A narození chlapce, A)=0,51 A... narození dívky, A) = 1-A)=0,491 Příklad: hod kostkou Mějme 3 vzájemn jemně neslučiteln itelné jevy: A padne 1, B padne 3, C padne 5 D padne liché číslo, D=(A nebo B nebo C) D)=A)+B)+C) = 1/6+1/6+1/6=0,5 3

Podmíněná pravděpodobnost podobnost pravd. nějakého jevu často závisí na tom, zda nastal jev jiný; nastal-li B může se změnit A) podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B P ( A B) = A, B) B) Nezávislost jevů Jevy A a B nezávislé, když výskyt jednoho neovlivňuje výskyt druhého P ( A B) = A) pravidlo o násobení pravděpodobností P ( A, B) = A) B) P ( B A) = B) obecněji: A 1, A 2,..., A k nezávislé, C=(A 1, A 2,..., A k ) P ( C) = A1) A2)... Ak) Příklad A zvýšený cholesterol, B kouření A) = 37/140=0,2643 B) = 98/140=0,7000 A,B) = 31/140 = 0,2214 A B) = 0,2214 / 0,7000 = 0,3163 A B) A) A) A a B nejsou nezávisl vislé Příklad: hod kostkou A v v 1.hodu 6, B ve B 2.hodu 6 A,B)=A)B)=(1/6)(1/6)=1/36=0,0278 4

Pravidlo o úplné pravděpodobnosti podobnosti jevy B i (i=1, 2,,k) vzájemně neslučitelné a jeden z nich musínastat P ( B1neboB 2nebo... nebobk) = 1 = k i= 1 A=(A,B 1 ) nebo (A,B 2 ) nebo nebo (A,B k ) A) = k A, = i= 1 i= 1 k A A úraz, zajímá nás s A) Příklad 3 skupiny osob rozdělěné dle věku: v B 1 dítě,, B 2 osoba v reprod.v.věku, B 3 osoba v postreprod.v.věku, B i... vzájemn jemně neslučiteln itelné,, 1 musí nastat B 1 )+B 2 )+B 3 )=0,25+0,60+0,15=1 navíc c známe podmíněné pravděpodobnosti: podobnosti: A B 1 )=0,2; A B 2 )=0,1; A B 3 )=0,4 A) = A B 1 ) B 1 ) + A B 2 ) B 2 ) + A B 3 ) B 3 ) = = 0,20*0,25 + 0,10*0,60 + 0,40*0,15 = 0,17 Bayesův vzorec známe apriorní pravděpodobnosti B i ) i=1,...,k známe podm. pravděpodobnosti A B i ) i=1,...,k zajímá nás aposteriornípravděp. B j A) Bj A) = k A Bj) Bj) i= 1 A 5

Příklad A osoba je kuřák, k, zajímá nás s A) B 1 osoba s chron.. bronchitidou, B 2 osoba bez chron.bronchitidy, B 1 )=0,40, B 2 )=0,60 navíc c známe podmíněné pravděpodobnosti: podobnosti: A B 1 )=0,75; A B 2 )=0,50 A B1) B1) B1 A) = A B1) B1) + A B 2) B 2) 0,75*0,40 = = 0,50 0,75*0,40 + 0,50*0,60 BAYESOVSKÝ PŘÍSTUP SKRÍNINGOVÝ T NEMOC D + - CELKEM + - a c b d a + b c + d CELKEM a + c b + d n SENSITIVITA a SPECIFICITA SENSITIVITA (SE) je pravděpodobnost P (T + /D + ) pozitivního výsledku testu u nemocné osoby SE = a/ (a+ c) SPECIFICITA (SP) je proevděpodobnost T - /D - ) negativního výsledku testu u osoby bez nemoci SP = d / (b + d) 6

NESPRÁVNÁ NEGATIVITA A NESPRÁVNÁ POZITIVITA NESPRÁVNÁ NEGATIVITA (FN) je pravděpodobnost T - /D + ) negativního výsledku testu u nemocných FN = c / (a + c) NESPRÁVNÁ POZITIVITA (FP) je pravděpodobnost T + /D - ) of pozitivního výsledku testu u osob bez nemoci FP = b / (b + d) Hodnocení diagnostického či skríningov ningového testu pro detekci nemoci ALE: v klinické praxi nevíme, zda je nemoc přítomna p či i nikoli; známe jen výsledek testu a na jeho základz kladě chceme predikovat přítomnost choroby... T+) musíme me na data nahlížet ve směru ru výsledků testu fi prediktivní hodnoty PREDIKTIVNÍ HODNOTY PREDIKTIVNÍ HODNOTA POZITIVNÍHO U je pravděpodobnost D + /T + ) výskytu nemoci v případě pozitivního výsledku testu PV + = a / (a + b) PREDIKTIVNÍ HODNOTA NEGATIVNÍHO U je prevděpodobnost D - /T - ), že se nemoc nevyskytne v případě negativního výsledku testu PV - = d / (c + d) 7

Prediktivní hodnota pozitivního testu pomocí Bayesova vzorce T + ) ) T + ) = T + ) ) + T + D ) D ) SE * ) = SE * ) + (1 SP) *(1 ) )... apriorní předtestová pravděpodobnost podobnost D T+)... aposteriorní potestová pravděpodobnost podobnost D POZOR: pro SE=0,95, SP=0,95, )=0,01 dostaneme PV+=0,16 při skríningu obecné populace bude nevyhnutelně mnoho lidí nesprávn vně pozitivních VZTAH MEZI SENZITIVITOU (SE), SPECIFICITOU (SP), PREVALENCÍ (P ()) A PREDIKTIVNÍMI HODNOTAMI (PV +, PV - ) VYPLYVAJÍCÍ ZBAYESOVA VZORCE PV + =(SE. P ( D + )) / (SE.P ( ) + ( 1 - SP).(1-P () )) PV - =(SP. (1-P ( D + )) / (SP.(1-P ( ) + ( 1 - SE).P () ) ROC křivkak řada diagnostických testů je kvantitativních jak stanovit dělící bod (cut-off point)? cíl: najít dělící bod tak, abychom dosáhli rovnováhy mezi FP a FN závěry (váhy nesprávných rozhodnutí) ROC křivka: spočteme SE a SP pro různé dělící body 8

Příklad 1 000 osob Bez U RAKOVINA P=0,012 Bez RAKOVINY P=0,988 RAKOVINA P=0,012 Bez RAKOVINY P=0,988 0 0 POZITIVNÍ P=0,8 NEGATIVNÍ P=0,2 NEGATIVNÍ P=0,95 POZITIVNÍ P=0,05 0 0 0 OPERACE 0 OPERACE P=0,45 P=0,10 P=0,45 P=0,10 P=0,90 NO. PERSONS 4,5 1,0 4,5 2,0 939 5,0 44 12 988 A B C C A B D C A A ZLEPŠENÍ B ÚMRTÍ OPERACE C ÚMRTÍRAKOVINA D ZHORŠENÍPANKREATICKÉ INSUFICIENCE Šance Řekneme, že šance (odds) závodního koně na první místo vdostihovém závodě (jev A) je 1 ku 4, znamená to, že kůň závod vyhraje spravděpodobností Abychom vyjádření pomocí šance převedli na vyjádření pomocí pravděpodobnosti, sečteme vlastně čísla 1 + 4 = 5 a dostaneme tak jmenovatel zlomku pro vyjádření pravděpodobnosti výhry, tj. 1/5. Pro libovolný náhodnýjev A tedyplatí: šance A je O(A) výskytu jevu Ř e k n e m e - l i n a p ř í k l a d Podíl šancí (Odds ratio) Podíl šancí (odds ratio) OR udává podíl šanci, že se vyskytne nějaký jev A za určité podmínky (jev B), k šanci, že se jev A vyskytne, když podmínka neplatí (jev B). Podíl šancí se tedy vypočte jako přičemž 9

Věrohodnostní poměr Věrohodnostní poměr (likelihood ratio) LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B), kpravděpodobnosti, že se jev A vyskytne, když podmínka neplatí (jev B), tedy Věrohodnostní poměr - příklad Má-li pacient náhlou ztrátu paměti (jev A), chceme znát věrohodnostní poměr výskytu jevu A vpřípadě, že má mozkový nádor (jev B), tj. podíl pravděpodobnosti, s jakou ztráta paměti vzniká přinádoru mozku, k pravděpodobnosti, s jakou vzniká vostatních případech (jev B). Věrohodnostní poměr je tedy podíl podmíněných pravděpodobností Příklad Ve statistické studii o rakovině plic bylo zjištěno, že šance na výskyt rakoviny plic (jev A) u kuřáků (jev B) je 5 ku 4 (5/4) a šance na výskyt rakoviny unekuřáků (jev B) je 1 ku 8 (1/8). Potom podíl šancí je což znamená, že šance dostat rakovinu plic je 10x větší ukuřáků než unekuřáků. 10

Věrohodnostní poměr Věrohodnostní poměr užíváme i při hodnocení skríningových a diagnostických testů a ve forenznígenetice. Například věrohodnostní poměr pozitivního skríningového testu je dán jako Podobně věrohodnostní poměr negativního testu spočteme jako 11