Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Podobné dokumenty
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

PRAVDĚPODOBNOST A STATISTIKA

Intuitivní pojem pravděpodobnosti

Inovace bakalářského studijního oboru Aplikovaná chemie

Tomáš Karel LS 2012/2013

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Testování statistických hypotéz

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Cvičení ze statistiky - 5. Filip Děchtěrenko

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Testy. Pavel Provinský. 19. listopadu 2013

Normální (Gaussovo) rozdělení

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

2. přednáška - PRAVDĚPODOBNOST

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

STATISTICKÉ ZJIŠŤOVÁNÍ

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Normální (Gaussovo) rozdělení

KGG/STG Statistika pro geografy

Tomáš Karel LS 2012/2013

Pravděpodobnost a statistika

Matematika III. 27. září Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

You created this PDF from an application that is not licensed to print to novapdf printer (

Populace vs. data. popisná (deskriptivní) popis konkrétních dat. letní semestr

Tomáš Karel LS 2012/2013

Základy teorie pravděpodobnosti

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Pravděpodobnost a aplikovaná statistika

Výpočet pravděpodobností

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

AVDAT Náhodný vektor, mnohorozměrné rozdělení

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

Testování statistických hypotéz

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

4. cvičení 4ST201. Pravděpodobnost. Obsah: Pravděpodobnost Náhodná veličina. Co je třeba znát z přednášek

Pravděpodobnost a její vlastnosti

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

12. cvičení z PST. 20. prosince 2017

Matematika I 2a Konečná pravděpodobnost

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Cvičení ze statistiky - 8. Filip Děchtěrenko

Diskrétní náhodná veličina. November 12, 2008

Pravděpodobnost a statistika

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Ing. Michael Rost, Ph.D.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

5 Parametrické testy hypotéz

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Výběrové charakteristiky a jejich rozdělení

Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Tomáš Karel LS 2012/2013

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

I. D i s k r é t n í r o z d ě l e n í

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Aproximace binomického rozdělení normálním

Základy teorie pravděpodobnosti

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

p(x) = P (X = x), x R,

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

NÁHODNÁ VELIČINA. 3. cvičení

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Cvičení 5. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Pravděpodobnost a statistika I KMA/K413

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Téma 22. Ondřej Nývlt

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Stručný úvod do testování statistických hypotéz

Odhad parametrů N(µ, σ 2 )

Transkript:

Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Přednáška 2 Induktivní statistika Data zobrazují jen část objektů reálného světa, který zkoumáme Populace a výběr Indukce usuzujeme o celku jen z jeho části Matematická (induktivní) statistika Odhady parametrů, bodové odhady, intervalové odhady Testování statistických hypotéz

Potíže při výzkumu založeném na empirických datech: počet objektů části reálného světa, kterou zkoumáme, je velký. Př. obyvatelé Moravskoslezského kraje, voliči v ČR, mravenci v Beskydech, součástky vyrobené na automatické lince,... zobrazit všechny objekty do statistických dat nelze z různých důvodů (čas, cena měření,...), musíme se spokojit s daty jen o části objektů přesto se potřebujeme dozvědět důležité pravdy o celé zkoumané části reálného světa

Popis situace: všechny objekty jen část objektů realita populace výběr data základní soubor výběrový soubor charakteristiky parametry odhady (parametrů) metody deskriptivní statistika induktivní statistika

Abychom z výběru mohli usuzovat o populaci: jasně vymezit (definovat) populaci, o níž chceme vědět dosud nepoznané pravdy zařídit, aby výběr tuto populaci opravdu reprezentoval (náhodný výběr jedinců z populace, všichni stejnou šanci) mít dostatečný rozsah výběru (počet řádků ve výběrovém souboru) ~ kvalita nových pravd

Obtíže lze překonat s pomocí induktivní (matematické) statistiky!!! Dobré zprávy: struktura dat stejná, jakou známe z popisné statistiky charakteristiky počítáme stejně jako v popisné statistice Špatná zpráva: nemáme úplnou vstupní informaci v datech, tzn. charakteristiky z dat nejsou přesně hodnotami platnými pro všechny objekty

Zatím jsme vystačili se zdravým selským rozumem, abychom zmapovali situaci, ve které se nacházíme, když chceme z výběru udělat rozumný výrok platný pro celou populaci Dále ale budeme potřebovat základní pojmy z (teorie) pravděpodobnosti budeme muset namáhat hlavu

Pravděpodobnost základní pojmy: Náhodný pokus více možných výsledků, nevíme, jak to dopadne, např. - zkouška na řidičského průkaz (projdeme nebo neprojdeme?), - zkoumání vzorku říční vody (kolik druhů mikroorganismů?), - těhotenství (narodí se kluk nebo holka nebo více dětí?) - hod kostkou nebo mincí Náhodný pokus lze nezávisle opakovat za stejných podmínek!(?)

Náhodný jev a pravděpodobnost: Náhodný jev je výsledkem náhodného pokusu (např. padla sudá při hodu kostkou), jev A Náhodnému jevu A lze přiřadit pravděpodobnost P(A)

Hod kostkou - jevy E 1 E 2 E 3 E 4 E 5 E 6 padla jednička padla dvojka padla trojka padla čtyřka padla pětka padla šestka Jiný výsledek nastat nemůže, kostka spadnout musí. Žádný z jevů E i, i = 1, 2,...,6, není složen z jiných jevů, nelze jej dále rozložit, ani nemohou nastat žádné dva takové jevy současně. Říkáme, že jevy E i jsou elementární jevy.

Jevy a operace jev B padne sudá je sjednocením jevů B = E E E 2 4 6 Sjednocením všech elementárních jevů dostaneme jev jistý - označíme jej symbolem U, tedy v našem příkladu U = E 1. E2 E6 Průnik jevů = oba jevy nastanou současně Jev nemožný B C Pokud, jsou B, C neslučitelné Jev opačný k jevu A =

Jevy a operace s jevy

Pravděpodobnost - platí (axiomy): ( ) 0 PA 1 ( ) PU = 1 Je-li A B=, pak PA ( B) = PA ( ) + PB ( )

Jak počítat pravděpodobnosti? lze odvodit z uvedených axiomů: ( ) ( ) PA = 1 PA PA ( B) = PA ( ) + PB ( ) PA ( B) Kde vzít hodnoty pravděpodobnosti?

Určení hodnot pravděpodobnosti: klasická prst všechny elementární jevy stejně pravděpodobné (počet možností příznivých) / (počet všech možností) statistická prst - odhadnout relativní četností při n opakování náhodného pokusu n A P( A) = lim n n

Podmíněná prst, nezávislé jevy: Podmíněná prst P ( A B) = P ( A B) P( B) Pravděpodobnost, že současně nastanou dva nezávislé jevy A, B: P( A B) = P( A) P( B)

Náhodná veličina, rozdělení Náhodná veličina (X, Y,...) abstrakce, přiřazuje elementárnímu náhodnému jevu reálné číslo Praktický účel umožňuje definovat rozdělení pravděpodobnosti, např. prsti jevů X = x nebo Y < y Náhodná veličina má charakteristiky polohy, variability, šikmost,...

Funkce definující rozdělení: Distribuční funkce F( x) = P( X < x) Diskrétní prstní funkce [ x, P( X = x )] i i Spojité - hustota f(t) x t

p-kvantil (daného rozdělení)

Binomické rozdělení model hodu n mincemi, na každé padne lev s pravděpodobností p, pravděpodobnost, že na n mincích padne k lvů n PY ( = k) = p k ( p) k 1 n k

Pravděpodobnostní funkce binomického rozdělení n = 10, p = 0,5 n = 10, p = 0,8

Rovnoměrné spojité rozdělení - hustota

Normální rozdělení s parametry µ, sigma ^ 2

chi kvadrát, n stupňů volnosti f(x) n=4 0.15 n=10 0.000 0 2 4 7 9 11 13 16 18 20 x

Studentovo t -rozdělení

Fisherovo F rozdělení f(x) m=1, n=50 1 m=12, n=6 0 0 2 3 5 6 x

Náhodný výběr v matematické statistice n náhodných veličin jsou nezávislé všechny mají stejné rozdělení mat. statistika nám říká, jaké úsudky o celé populaci můžeme udělat z náhodného výběru výběrový soubor je realizací náhodného výběru, z toho spočítáme hodnoty výběrových charakteristik

Odhady

Bodové odhady výběrová charakteristika je odhadem populační charakteristiky chceme, aby se do populační charakteristiky strefovala nestranný odhad aby se rozptyl výb. charakteristiky zmenšoval s rostoucím rozsahem výběru konzistentní odhad aby rozptyl výb. charakteristiky byl co nejmenší nejlepší odhad

Intervalové odhady θ, θ 1 2 interval,, ve kterém leží parametr (populační charakteristika) s velkou pravděpodobností 100( 1 α ) ( ) P θ θ θ = α 1 2 1 - procentní interval spolehlivosti

Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru, zda tvrzení přijímáme nebo zamítneme.

Testování hypotéz SKUTEČNOST (nám neznámá) NAŠE ROZHODNUTÍ: H 0 : nezamítáme H 0 : zamítáme Tvrzení H 0 je pravdivé SPRÁVNÉ CHYBA I. druhu Tvrzení H 0 je nepravdivé CHYBA II. druhu SPRÁVNÉ