Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Podobné dokumenty
Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky

Základy teorie pravděpodobnosti

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Vztah pravděpodobnosti, statistiky a biostatistiky

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Pravděpodobnost a její vlastnosti

Teorie pravěpodobnosti 1

Intuitivní pojem pravděpodobnosti

Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Pravděpodobnost a statistika

Přednáška X. Testování hypotéz o kvantitativních proměnných

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Statistika (KMI/PSTAT)

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Informační a znalostní systémy

PRAVDĚPODOBNOST JE. Martina Litschmannová

Usuzování za neurčitosti

ZÁKLADY TEORIE PRAVDĚPODOBNOSTI

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Tomáš Karel LS 2012/2013

VÝBĚR A JEHO REPREZENTATIVNOST

Náhodný jev a definice pravděpodobnosti

Motivace. Náhodný pokus, náhodný n jev. pravděpodobnost. podobnostní charakteristiky diagnostických testů, Bayesův vzorec. Prof.RND. RND.

Počet pravděpodobnosti

3. Podmíněná pravděpodobnost a Bayesův vzorec

Matematika III. 27. září Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Populace vs. data. popisná (deskriptivní) popis konkrétních dat. letní semestr

5.1. Klasická pravděpodobnst

Úvod do teorie pravděpodobnosti

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

7. Rozdělení pravděpodobnosti ve statistice

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Základy teorie pravděpodobnosti

2. přednáška - PRAVDĚPODOBNOST

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

NMAI059 Pravděpodobnost a statistika

Podmíněná pravděpodobnost

Matematika I 2a Konečná pravděpodobnost

Přednáška III. Data, jejich popis a vizualizace. Náhodný výběr, cílová a výběrová populace Typy dat Vizualizace různých typů dat Popisné statistiky

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

Pravděpodobnost a aplikovaná statistika

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Vytěžování znalostí z dat

Pravděpodobnost, náhoda, kostky

IB112 Základy matematiky

TECHNICKÁ UNIVERZITA V LIBERCI

cv3.tex. Vzorec pro úplnou pravděpodobnost

Pravděpodobnost vs. Poměr šancí. Pravděpodobnostní algoritmy: Bayesova věta. Bayesova teorie rozhodování. Bayesova věta (teorém) Vzorec. ...

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

STATISTICKÉ ODHADY Odhady populačních charakteristik

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

PRAVDĚPODOBNOST A STATISTIKA

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 5. Filip Děchtěrenko

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Markovské metody pro modelování pravděpodobnosti

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

analýzy dat v oboru Matematická biologie

Pravděpodobnost a statistika

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

2 Hlavní charakteristiky v analýze přežití

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

2. Definice pravděpodobnosti

Bayesovské metody. Mnohorozměrná analýza dat

Základní pojmy a úvod do teorie pravděpodobnosti. Ing. Michael Rost, Ph.D.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy. Příklad: při hodu hrací kostkou padne trojka

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost, náhoda, kostky

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Náhodné chyby přímých měření

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost je Martina Litschmannová MODAM 2014

ANALÝZA A KLASIFIKACE DAT

Pravděpodobnost a statistika (BI-PST) Cvičení č. 2

Normální (Gaussovo) rozdělení

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí.

Jana Vránová, 3. lékařská fakulta UK

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Transkript:

řednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky Statistika vychází z pravděpodobnosti odmíněná pravděpodobnost, Bayesův vzorec Senzitivita, specificita, prediktivní hodnoty Frekventistická a Bayesovská statistika

Opakování klíčové principy biostatistiky Zkreslení Významnost Reprezentativnost Spolehlivost Srovnatelnost

Opakování příčina a důsledek říklad: Farmaceutická společnost se snaží o kategorizaci nového přípravku proti běžné rýmě. Jako důkaz účinnosti přípravku provedla společnost experiment, kdy byl její přípravek podán velkému množství pacientů s rýmou. S potěšením pak firma reportovala Státnímu ústavu pro kontrolu léčiv, že 90 % pacientů se po 10 dnech užívání cítilo lépe. SÚKL přesto přípravek neschválil. roč?

Statistika, biostatistika a analýza dat Statistika nalýza dat rimárně je zaměřena na vývoj metod a algoritmů pro řešení teoretických problémů. Nicméně i statistika je vždy primárně motivována reálnými problémy. Vychází z teorie pravděpodobnosti. ropojení znalosti statistických metod a dané problematiky v řešení biologických a klinických úloh. Na prvním místě není teoretický vývoj, ale aplikace. Velmi obecná oblast bez jasné definice. rostupuje různými odvětvími. Zahrnuje komplexní postupy hodnocení dat čištění, kódování. Nemusí být založena na statistice.

vychází ze statistiky je aplikace statistických metod v řešení biologických a klinických problémů. Snahou je získat z pozorovaných dat užitečnou informaci. V popředí zájmu je pozorovaná variabilita mezi studovanými subjekty, kterou chceme vysvětlit.

Statistický pohled na problém Cílová populace chceme postihnout konkrétní problém. Získáme experimentální vzorek cílové populace pozorování, která převedeme na číselné vyjádření data. Vzorek by měl být reprezentativní a náhodný. ředpokládáme pravděpodobnostní chování model tohoto vzorku tedy i cílové populace. Konkrétní problém vyjádříme ve vybraném modelu jako hypotézu. Zhodnotíme hypotézu na základě vybraného modelu a pozorovaných dat.

Statistika vychází z pravděpodobnosti Teorie pravděpodobnosti se zabývá modelováním náhody. Lze nějak ale vyjádřit, co je to náhoda?

Statistika vychází z pravděpodobnosti Teorie pravděpodobnosti se zabývá modelováním náhody. Lze nějak ale vyjádřit, co je to náhoda? Objektivní nepředvídatelnost? Nedostatek informací?

Statistika vychází z pravděpodobnosti Teorie pravděpodobnosti se zabývá modelováním náhody. Lze nějak ale vyjádřit, co je to náhoda? Objektivní nepředvídatelnost? Nedostatek informací? Chance is only ignorance of the connections between phenomena. ierre Simon de Laplace

Statistika vs. pravděpodobnost Statistika ravděpodobnost Cílová populace Cílová populace Vzorek Vzorek

Statistika vs. pravděpodobnost Statistika ravděpodobnost Cílová populace Cílová populace Cílem statistiky je získání informace o cílové populaci na základě pozorovaného experimentálního vzorku. V teorii pravděpodobnosti se ptáme na pravděpodobnost získání konkrétního výsledku, máme-li danou strukturu cílové populace. Vzorek Vzorek

Značení Základní prostor Ω množina všech možných výsledků experimentu Elementární jev ω konkrétní výsledek experimentu Náhodný jev podmnožina základního prostoru Množina všech jevů množina všech podmnožin základního prostoru Ø představuje jev nemožný, Ω zase jev jistý Množinové operace mají v teorii pravděpodobnosti svůj význam: 1. ω - jev nastane, když nastane ω 2. ω - jev nenastane, když nastane ω 3. B - nastání jevu implikuje nastání jevu B 4. B - nastání jevu a zároveň jevu B 5. B - nastání jevu nebo jevu B 6. B = 0 - jevy a B se navzájem vylučují, jsou disjunktní 7. c - nastání jevu opačného k jevu

ravděpodobnost ravděpodobnost lze definovat jako funkci, která přiřazuje náhodnému jevu reálné číslo mezi 0 a 1. Je to tedy funkce : [0,1]. Musí platit následující: 3. 1 0 2. 1 0, 1. B B B + = = Ω = Ω = φ φ

Definice pravděpodobnosti Klasická definice pravděpodobnosti: předpokládáme, že Ω je konečná a všechny ω jsou stejně pravděpodobné. ak Ω = Ω kde je počet prvků množiny počet elementárních jevů jevu. xiomatická definice pravděpodobnosti: Ω je libovolná množina elementárních jevů, je množina měřitelných jevů je podmnožina. Funkce : [0,1], která splňuje 1. Ω = 1 n 2. 1, 2,... Ω : i j = φ, i j i= 1 i = i = 1 i se nazývá pravděpodobnost. Trojice Ω,, se nazývá pravděpodobnostní prostor. n

Definice pravděpodobnosti najděte rozdíly Klasická definice pravděpodobnosti: předpokládáme, že Ω je konečná a všechny ω jsou stejně pravděpodobné. ak Ω = Ω kde je počet prvků množiny počet elementárních jevů jevu. xiomatická definice pravděpodobnosti: Ω je libovolná množina elementárních jevů, je množina měřitelných jevů je podmnožina. Funkce : [0,1], která splňuje 1. Ω = 1 n 2. 1, 2,... Ω : i j = φ, i j i= 1 i = i = 1 i se nazývá pravděpodobnost. Trojice Ω,, se nazývá pravděpodobnostní prostor. n

Co to znamená? xiomatická definice připouští i nespočetný základní prostor, tedy nespočetnou množinu elementárních jevů. říklady: hod kostkou měření výšky lidské postavy xiomatická definice připouští různou pravděpodobnost různých elementárních jevů. říklady: hod kostkou měření výšky lidské postavy

Nezávislost jevů Dva jevy a B jsou nezávislé právě tehdy, když platí B = B Jsou-li dva jevy a B nezávislé, pak i c je nezávislé na B je nezávislé na B c c je nezávislé na B c

Nezávislost jevů Dva jevy a B jsou nezávislé právě tehdy, když platí B = B Jsou-li dva jevy a B nezávislé, pak i c je nezávislé na B je nezávislé na B c c je nezávislé na B c říklad: Uvažujme opět hod kostkou a jevy = {1, 3, 5} a B = {4, 5, 6}. B = 1/ 6 1/ 4 = B Jevy a B tedy nejsou nezávislé.

odmíněná pravděpodobnost Máme-li jev B s pravděpodobností B > 0, pak podmíněnou pravděpodobnost jevu za podmínky nastoupení jevu B definujeme jako ro nezávislé jevy a B platí B B B = B B B = =

odmíněná pravděpodobnost Ω B B = B B B

odmíněná pravděpodobnost říklad: Osoba X má všechny typické příznaky chřipky. ravděpodobnost, že se jedná o klasickou chřipku je 0,7 jev, prasečí chřipku 0,2 jev B, ptačí chřipku 0,05 jev C a dosud neznámou formu 0,05 jev D. Diagnostický test prokázal, že klasická chřipka to není. Jaká je nyní pravděpodobnost, že se jedná o novou formu chřipky?

odmíněná pravděpodobnost říklad: Osoba X má všechny typické příznaky chřipky. ravděpodobnost, že se jedná o klasickou chřipku je 0,7 jev, prasečí chřipku 0,2 jev B, ptačí chřipku 0,05 jev C a dosud neznámou formu 0,05 jev D. Diagnostický test prokázal, že klasická chřipka to není. Jaká je nyní pravděpodobnost, že se jedná o novou formu chřipky? Řešení: c c D D 0,05 D = = = = 0,167 c c 0,3

Celková pravděpodobnost a Bayesův vzorec Můžeme-li rozdělit základní prostor na k po dvou disjunktních podmnožin i, i = 1,, k, pro které zároveň platí, že jejich sjednocení je celý základní prostor tzv. systém hypotéz, pak pravděpodobnost jevu lze získat jako Dále platí = = k i i i 1 = = = k i i i j j j j 1 Bayesův vzorec Vzorec pro celkovou pravděpodobnost

očasí a podmíněná pravděpodobnost Co má počasí společného s pravděpodobností?

očasí a podmíněná pravděpodobnost Co má počasí společného s pravděpodobností? U každého jevu se můžeme ptát na jeho pravděpodobnost za slunečného počasí, za deště, za bouřky, atd. Celkovou pravděpodobnost jevu potom můžeme získat jako součet přes tyto možnosti. Tyto stavy lze chápat jako výchozí hypotézy ovlivňující výsledek, přičemž vždy nastává platí pouze jeden z těchto stavů hypotéz. okud pozorujeme jev, můžeme se zpětně ptát na platnost těchto hypotéz s použitím Bayesova vzorce. Ω 0 1 2 3 4 5

Celková pravděpodobnost jiný příklad opulaci můžeme rozdělit dle věku na tři skupiny: děti 0, dospělé v produktivním věku 1 a dospělé v postproduktivním věku 2, přičemž známe rozdělení populace, tedy známe 0, 1 a 2. Ω 0 1 2 Označme jev : stane se úraz. Známe-li pravděpodobnost úrazu u dítěte, 0, u dospělého v produktivním věku, 1, a u dospělého v postproduktivním věku, 2, jsme schopni pomocí vzorce pro celkovou pravděpodobnost spočítat.

Bayesův vzorec říklad: Uvažujme populaci mužů nekuřáků ve věku 50 60 let, u kterých sledujeme výskyt chronického kašle jev. Dle stavu plic můžeme muže zjednodušeně rozdělit na zdravé jev 1, nemocné plicním karcinomem jev 2 a nemocné sarkoidózou jev 3. ravděpodobnosti výskytu jednotlivých plicních onemocnění jsou známé, navíc známe i pravděpodobnosti výskytu chronického kašle dle stavu plic: 1 = 0,991, 2 = 0,001, 3 = 0,008 1 =0,002, 2 =0,900, 3 =0,950 Zajímá nás, s jakou pravděpodobností bude u pacienta s chronickým kašlem při podrobnějším vyšetření diagnostikován karcinom plic.

Bayesův vzorec říklad: Uvažujme populaci mužů nekuřáků ve věku 50 60 let, u kterých sledujeme výskyt chronického kašle jev. Dle stavu plic můžeme muže zjednodušeně rozdělit na zdravé jev 1, nemocné plicním karcinomem jev 2 a nemocné sarkoidózou jev 3. ravděpodobnosti výskytu jednotlivých plicních onemocnění jsou známé, navíc známe i pravděpodobnosti výskytu chronického kašle dle stavu plic: 1 = 0,991, 2 = 0,001, 3 = 0,008 1 =0,002, 2 =0,900, 3 =0,950 Zajímá nás, s jakou pravděpodobností bude u pacienta s chronickým kašlem při podrobnějším vyšetření diagnostikován karcinom plic. Řešení: 2 2 = = 2 = 3 i= 1 0,900 0,001 0,002 0,991+ 0,900 0,001+ 0,950 0,008 2 i 2 i = 0,086

Význam podmíněné pravděpodobnosti v biostatistice rincip podmíněné pravděpodobnosti je v biostatistice velmi častý máme systém hypotéz nejčastěji dvou o vlastnostech cílové populace a pozorovaná data. Na jejich základě pak rozhodujeme o platnosti stanovených hypotéz. římé použití podmíněné pravděpodobnosti lze demonstrovat na příkladu binárních diagnostických testů: Osoba ve skutečnosti má jev nebo nemá jev c sledované onemocnění. Diagnostický test u dané osoby indikuje přítomnost jev + nebo nepřítomnost jev - sledovaného onemocnění. Nás zajímají diagnostické schopnosti testu.

Senzitivita, specificita Skutečnost přítomnost nemoci no Ne c Výsledek diagnostického testu ozitivní + T U Negativní - V W Senzitivita testu: schopnost testu rozpoznat skutečně nemocné osoby, tedy pravděpodobnost, že test bude pozitivní, když je osoba skutečně nemocná. Senzitivita testu = + = T / T + V. Specificita testu: schopnost testu rozpoznat osoby bez nemoci, tedy pravděpodobnost, že test bude negativní, když osoba není nemocná. Specificita testu = - c = W / U + W.

ozitivní a negativní prediktivní hodnota Skutečnost přítomnost nemoci no Ne c Výsledek diagnostického testu ozitivní + T U Negativní - V W rediktivní hodnota pozitivního testu: pravděpodobnost, že osoba je skutečně nemocná, když je test pozitivní. rediktivní hodnota pozitivního testu = + = T / T + U. rediktivní hodnota negativního testu: pravděpodobnost, že osoba není nemocná, když je test negativní. rediktivní hodnota negativního testu = c - = W / V + W.

Shrnutí Skutečnost přítomnost nemoci Výsledek diagnostického testu no Ne c ozitivní + T U T + U Negativní - V W V + W T + V U + W rediktivní hodnota pozitivního testu rediktivní hodnota negativního testu Senzitivita testu Specificita testu

Senzitivita, specificita říklad: Zajímá nás přesnost vyšetření jater ultrazvukem, tedy schopnost vyšetření UTZ identifikovat maligní ložisko v pacientových játrech. řesnost je vztažena k histologickému ověření odebrané tkáně. Výsledky jsou dány tabulkou: Vyšetření UTZ istologické ověření Maligní Benigní Celkem Maligní 32 2 34 Benigní 3 24 27 Celkem 35 26 61 Senzitivita testu = + =? Specificita testu = - c =?

Senzitivita, specificita říklad: Zajímá nás přesnost vyšetření jater ultrazvukem, tedy schopnost vyšetření UTZ identifikovat maligní ložisko v pacientových játrech. řesnost je vztažena k histologickému ověření odebrané tkáně. Výsledky jsou dány tabulkou: Vyšetření UTZ istologické ověření Maligní Benigní Celkem Maligní 32 2 34 Benigní 3 24 27 Celkem 35 26 61 Senzitivita testu = + = 32 / 35 = 91,4 % IS = 75,8 97,8 Specificita testu = - c = 24 / 26 = 92,3 % IS = 73,4 98,7

Bayesův vzorec pro výpočet prediktivních hodnot Obě prediktivní hodnoty testu lze vypočítat s pomocí charakteristik testu, senzitivity a specificity, a celkové prevalence onemocnění v cílové populaci. c c + + + + + = rediktivní hodnota pozitivního testu rediktivní hodnota negativního testu c c c c c + = Senzitivita testu Specificita testu revalence + c

ozitivní a negativní prediktivní hodnota říklad: Zajímají nás pozitivní a negativní prediktivní hodnoty diagnostického testu na IV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. 1. Uvažujme jihoafrickou zemi s prevalencí IV pozitivních cca 20 %: + = 0,98; - c = 0,99; = 0,2.

ozitivní a negativní prediktivní hodnota říklad: Zajímají nás pozitivní a negativní prediktivní hodnoty diagnostického testu na IV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. 1. Uvažujme jihoafrickou zemi s prevalencí IV pozitivních cca 20 %: + = 0,98; - c = 0,99; = 0,2. rediktivní hodnota pozitivního testu + + 0,98 0,20 = = = 96,1% + + + c c 0,98 0,20 + 1 0,99 1 0,20 rediktivní hodnota negativního testu c c c 0,99 1 0,20 = = = 99,5% c c + 0,99 1 0,20 + 1 0,98 0,20

ozitivní a negativní prediktivní hodnota říklad: Zajímají nás pozitivní a negativní prediktivní hodnoty diagnostického testu na IV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. 2. Uvažujme evropskou zemi s prevalencí IV pozitivních cca 0,2 %: + = 0,98; - c = 0,99; = 0,002.

ozitivní a negativní prediktivní hodnota říklad: Zajímají nás pozitivní a negativní prediktivní hodnoty diagnostického testu na IV pozitivitu, u kterého výrobce garantuje 98% senzitivitu a 99% specificitu. 2. Uvažujme evropskou zemi s prevalencí IV pozitivních cca 0,2 %: + = 0,98; - c = 0,99; = 0,002. rediktivní hodnota pozitivního testu + + 0,98 0,002 = = = 16,4% + + + c c 0,98 0,002 + 1 0,99 1 0,002 rediktivní hodnota negativního testu c c c 0,99 1 0,002 = = = 99,9% c c + 0,99 1 0,002 + 1 0,98 0,002

Dva směry statistiky Ve statistice existují dva hlavní filozofické směry: frekventistický a Bayesovský. Liší se v pohledu na pravděpodobnostní chování neznámých hodnot, které se snažíme odhadnout. Frekventistická statistika: všechny neznámé hodnoty považujeme za konstantní parametry. Na základě dat se snažíme tuto hodnotu lokalizovat. Bayesovská statistika: všechny neznámé hodnoty mají pravděpodobnostní chování rozdělení pravděpodobnosti. Na základě dat se snažíme toto pravděpodobnostní chování upřesnit.

Frekventistická statistika Neznámou charakteristiku cílové populace konstantu se snažíme odhadnout pouze na základě pozorovaných dat. Důležitý je předpoklad reprezentativnosti vzorku pracujeme pouze s daty jako obrazem neznámé charakteristiky. Bude-li špatný vzorek, bude špatný i odhad výsledky mohou být velmi odlišné od známých hodnot. Často pracuje s asymptotickým chováním, kdy velikost vzorku jde do nekonečna; řada odhadů a testů je odvozena právě pro tyto situace. 0.3 n << 0.3 n 0.2 0.2 0.1 0.1 0 0 1 2 3 4 5 6 0 0 1 2 3 4 5 6

Bayesovská statistika Neznámá charakteristika cílové populace má pravděpodobnostní chování, které se snažíme pomocí pozorovaných dat upřesnit. = ředpoklad reprezentativnosti vzorku je stále důležitý, ale již nepracujeme pouze s daty pracujeme i s tzv. apriorní pravděpodobností,, což je náš vstupní předpoklad o chování neznámé charakteristiky. Nevýhodou je neznalost apriorní pravděpodobnosti.

Reklama na další týdny Středem zájmu statistiky a biostatistiky je tzv. náhodná veličina. Základní prostor Ω ravděpodobnost Jev ω 1 Náhodná veličina X 0 1 R 0 x R

oděkování Rozvoj studijního oboru Matematická biologie řf MU Brno je finančně podporován prostředky projektu ESF č. CZ.1.07/2.2.00/07.0318 Víceoborová inovace studia Matematické biologie a státním rozpočtem České republiky