vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Podobné dokumenty
vají statistické metody v biomedicíně

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Pravděpodobnost a aplikovaná statistika

Deskriptivní statistika 1

P2: Statistické zpracování dat

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Odhady parametrů 1. Odhady parametrů

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

PRAVDĚPODOBNOST A STATISTIKA

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Náhodný výběr 1. Náhodný výběr

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

V. Normální rozdělení

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

12. N á h o d n ý v ý b ě r

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

8. Odhady parametrů rozdělení pravděpodobnosti

Intervalové odhady parametrů

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Přednášky část 7 Statistické metody vyhodnocování dat

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Dynamická pevnost a životnost Statistika

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

6. P o p i s n á s t a t i s t i k a

Číselné charakteristiky náhodných veličin

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

13 Popisná statistika

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Zhodnocení přesnosti měření

Intervalové odhady parametrů některých rozdělení.

Statistika pro metrologii

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Pravděpodobnost a aplikovaná statistika

Popisná statistika. Zdeněk Janák 9. prosince 2007

Závislost slovních znaků

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Úloha II.S... odhadnutelná

2. Náhodná veličina. je konečná nebo spočetná množina;

Kvantily. Problems on statistics.nb 1

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

4. Základní statistické pojmy.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

7. Odhady populačních průměrů a ostatních parametrů populace

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

1 Úvod { }.[ ] A= A A, (1.1)

8. Analýza rozptylu.

11. P o p i s n á s t a t i s t i k a

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

NEPARAMETRICKÉ METODY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

BAKALÁŘSKÁ STA I. + II.

17. Statistické hypotézy parametrické testy

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Pravděpodobnostní model doby setrvání ministra školství ve funkci

7. cvičení 4ST201-řešení

Mendelova univerzita v Brně Statistika projekt

PRAVDĚPODOBNOST A STATISTIKA

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

STATISTIKA PRO EKONOMY

Pravděpodobnost a statistika - absolutní minumum

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

14. B o d o v é o d h a d y p a r a m e t r ů

8. Základy statistiky. 8.1 Statistický soubor

Národní informační středisko pro podporu jakosti

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

OVMT Přesnost měření a teorie chyb

b c a P(A B) = c = 4% = 0,04 d

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

3. Charakteristiky a parametry náhodných veličin

4. B o d o v é o d h a d y p a r a m e t r ů

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

[ jednotky ] Chyby měření

Veterinární a farmaceutická univerzita Brno. Základy statistiky. pro studující veterinární medicíny a farmacie

1. Základy počtu pravděpodobnosti:

7. P o p i s n á s t a t i s t i k a

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Testování statistických hypotéz

Úloha III.S... limitní

Transkript:

Statistika v biomedicísk ském výzkumu a ve zdravotictví Prof. RNDr. Jaa Zvárov rová,, DrSc. EuroMISE Cetrum Ústav iformatiky AV ČR R v.v.i. Literatura Edice Biomedicísk ská statistika vydáva vaá a Uiverzitě Karlově v Praze, Karolium Zvárov rová,, J.: Základy statistiky pro biomedicísk ské obory I. Karolium, Uiverzita Karlova v Praze, Praha 00 http:// //www.euromise.cz/ Proč se používaj vají statistické metody v biomedicíě Biomedicísk ské obory se rychle kvatifikují Pláov ováí, prováděí a iterpretadce výsledků biomedicísk ského výzkumu se stále více stávaj vají závislými a statistické metodologii Statistika proiká do literatury v biomedicíských oborech. 3

Statistika popisá statistika shromažďováí, uspořádáí a popis souborů dat přehledá sumarizace iformací (apř. ČSÚ) iduktiví statistika a základě vzorku (výběru) se sažíme odvodit obecá tvrzeí o celku - závěry jsou zatížey statistickou chybou spolehlivost závěrů je staovea objektivě 4 Obsah a výzam statistiky - schéma Výběr Populace 5 Populace populace (základí soubor) přesě určea výčtem ebo vlastostmi prvků určeé výčtem (apř. demografické populace) -koečý rozsah vymezeé vlastostmi (apř. všechy možé výsledky pokusu v daých experimetálích podmíkách) -ekoečý rozsah 6

Výběr výběr část populace, kterou sledujeme v rámci výzkumu Druhy výběru: reprezetativí výběr výběr, který svojí strukturou odpovídá struktuře populace selektiví výběr výběr, jehož struktura eodpovídá struktuře populace - -zkresleí výsledků rozsah výběru počet prvků populace zahrutých do výběru 7 Kostrukce výběru záměrý výběr expertí hledisko, často subjektiví áhodý výběr prostý mechaický oblastí (stratifikovaý) G Data tvoří základ každého výzkumu, při ěmž jsou použity statistické metody. Jejich kvalita určuje kvalitu výsledků. 8 Zaky Předmětem statistického výzkumu jsou zaky, tj. určit ité vlastosti objektů sledovaých. kvatitativí zak sledovaou vlastost je možé změřit a vyjádřit číslem Př.: tělesá výška, počet sourozeců kvalitativí zak vlastost je vyjádřea slově Př.: rodiý stav, stupeň bolesti 9 3

Kvalitativí zaky omiál lí rozděle leí do tříd t d bez uspořádáí Př.: rodiý stav:{svobodý, svobodý, žeatý, vdovec, rozvedeý, druh} ordiál lí rozděle leí do tříd t d s uspořádáím Př.: stupeň bolesti: {žádá bolest, malá bolest, střed edě silá bolest, velmi silá bolest} Kvalitativí zaky se pro účely aalýzy mohou kódovat. k 0 Kvalitativí pozorováí Jméo pacieta Rodiý stav Rod. stav - kód Riziko povoláí Kód rizika Novák svobodý 0 středí Kubíček žeatý velké Bláhová rozvedeá malé 0 Roubal rozvedeý středí Kratochvílová svobodá 0 malé 0 Zemaová ovdovělá 3 malé 0 Novotá vdaá středí Žitý svobodý 0 velké Absolutí a relativí četosti Absolutí četost... počet pozorováí v daé skupiě Př.: počet svobodých osob ve výběru (v ašem příkladu 3) Relativí četost relativí četost = m počet pozorováí m absolutí četost Př.: relativí četost svobodých ve výběru je 3/8 = 0,375 4

Kvatitativí zaky spojité diskrét tí Př.: výška, hmotost, kocetrace roztoku Př.: počet úmrtí,, počet sourozeců 3 Kvatitativí zaky - míry polohy hodoty charakterizující středí"" hodotu zaku Aritmetický průměr x = x i i = Př.: Vypočtěte průměr ásledujících výsledků vyšetřeí: 39, 4, 73, 67, 4, 55. Řešeí: 6 x = x i i= = 300 = 50 6 4 Kvatitativí zaky - míry polohy Modus (výběrový)... hodota, která se v souboru dat vyskytuje ejčastěji Př.: Co je modus v ásledujících výsledcích zjišťováí krevích skupi: A, 0, 0, B, B, AB, A, A, 0, 0, 0, AB, B, 0, B, A, 0, AB, 0, 0, B, 0, A? Řešeí: Výsledky měřeí shreme do tabulky: kreví skupia četost výskytu A 5 B 5 AB 3 0 0 Modem je tedy kreví skupia 0. 5 5

Kvatitativí zaky - míry polohy Mediá (výběrový)... v seřazeém souboru je to taková hodota, která soubor rozděluje a dvě stejě velké části Př.: Co je mediáem v ásledujících měřeích výšek dětí: 5, 7, 9,, 4, 8, 50? Řešeí: 6 Kvatitativí zaky - míry rozptýleosti R = x max x mi Rozptyl s = ( ) = xi x xi x i= i= Směrodatá odchylka s = s 7 Kvatily 00P% kvatil x P je číslo, které odděluje 00P% % ejmeší ších hodot zaku. Zámé kvatily: Percetily Decily Kvartily Mediá 8 6

Normál lí rozděle leí 9 Prostá tabulka Tělesá výška v cm 30 40 36 4 39 33 49 5 39 36 38 4 7 47 39 35 4 43 3 46 5 46 4 4 3 4 4 Skupiová tabulka Střed třídího itervalu Počet dětí 5 30 3 35 4 40 45 4 50 3 Celkem 7 0 Rozděleí chlapců ve věku 9,5-0 let podle tělesé výšky ( délka třídího itervalu 5 cm ) Číslo třídy Střed třídy Absolutí četost Souči Relativí četost Relativí kumulativí i x i i ix i četost i/ 0 3 560 0,0040 0,0040 5 95 875 0,094 0,0334 3 30 44 53 80 0,8 0,65 4 35 880 8 800 0,74 0,4339 5 40 03 4 80 0,335 0,7474 6 45 58 84 390 0,80 0,975 7 50 99 9 850 0,066 0,989 8 55 9 4 495 0,0090 0,998 9 60 6 960 0,009,0000 celkem - 33 447 570,0000-7

Histogram - výška chlapců 00 500 00 450 000 900 400 HISTOGRAM HISTOGRAM délka itervalu 5 cm Délka itervalu cm absolutí èetost absolutí èetost 800 350 700 300 600 50 500 00 400 300 50 00 00 00 50 0 6,5 0,5 6,5 3,5 36,5 4,5 46,5 5,5 56,5 6,5 6,5,5 8,5 34,5 40,5 46,5 5,5 58,5 výška v cm výška v cm Histogram - výška chlapců absolutí èetost absolutí èetost HISTOGRAM HISTOGRAM délka itervalu 5 cm délka Délka itervalu cm cm 00 500 00 450 000 900 400 800 350 700 300 600 50 500 00 400 50 300 50 00 00 00 00 50 50 0 6,5,5 6,5 3,5 36,5 4,5 46,5 5,5 56,5 6,5 6,5 0,5 4,5 8,5 3,5 36,5 40,5 44,5 48,5 5,5 56,5 60,5 6,5,5 8,5 34,5 40,5 46,5 5,5 58,5 výška v cm výška v cm výška v cm 3 Normál lí rozděle leí 4 8

Normál lí rozděle leí Normálí rozděleí se týká populace, ikoli výběru. V případě ormálího rozděleí průměr, modus a mediá splývají. Normálí rozděleí je plě určeou dvěma parametry: -populačím průměrem µ a -populačí směrodatou odchylkou σ. 5 Vliv populačího průměru ru a tvar ormál lího rozděle leí 6 Vliv populačí směrodat rodaté odchylky a tvar ormál lího rozděle leí 7 9

-4-0 4-4 - 0 4 Výzam parametrů 0.0 0. 0. 0.3 0.4 µ střed edí hodota (poloha, populačí průměr, r, těžt ěžiště), modus i mediá µ < µ, σ = σ 0.0 0. 0. 0.3 0.4 σ směrodat rodatá odchylka (míra variability, kocetrace) σ rozptyl (populačí rozptyl) µ = µ, σ < σ 8 Obecé ormál lí rozděle leí 34,3 % 34,3 %,8 %,8 % 3,59 % 3,59 % µ σ µ σ µ µ+σ µ+σ X~ N ( µσ, ) (stadardizace) X µ Z = σ ~ N(0,) X µ x µ = x µ P ( X x) = P Φ σ σ σ 9 Hustota N (μ,σ ) 0,60 0,45 Hustota N(0,) 99,73% 0,30 68,7% 0,5 0,00 95,45% µ 3σ µ σ µ σ µ+σ µ+σ µ+3σ 30 0

Normál lí rozděle leí 0.0 0. 0. 0.3 0.4 - - 34,3 % 34,3 %,8 %,8 % 3,59 % 3,59 % 0 součet spousty epatrých ezávislých příspěvků epřesost esost měřm ěřeí délkové rozměry ry částí lidského tělat objemy, kocetrace zpravidla aža po trasformaci relativí četost při p velkém m počtu pokusů 3 Hustota logaritmicko-orm ormálího rozděle leí 0 e+00 e-04 e-04 3 e-04 6000 8000 0000 000 4000 6000 3 Odhad populačího průměru ru Statistická teorie: "Nejlepším odhadem populačího průměru µ je výběrový průměr."? Nakolik odhad vystihuje skutečou hodotu µ? Vypovídací hodotu odhadu posuzujeme podle délky itervalu spolehlivosti. Iterval spolehlivosti... iterval, v ěmž s 95% pravděpodobostí leží ezámý populačí průměr µ. Příklad: Průměrá výška dětí: -pro 5 pozorováí můžeme tvrdit, že průměrá výška leží s 95% pravděpodobostí v itervalu (8; 48) -pro 85 pozorováí získáme iterval (38,; 38,9) 33

Rozděle leí výběrov rového průměru ru áhodý výběr: : za stálých podmíek ezávisle provedeá opakovaá měřeí stejé vlastosti výšky áhod hodě vybraých desetiletých hochů x,x,,x mají stejé rozděle leí: µ - populačí průměr, r, σ - populačí rozptyl pro velké potom přiblip ibližě x = xi ~ N µ, σ i = σ σ x = 34 Iterval spolehlivosti pro µ průměr r x přiblip ibližě orm pro velké má pr rozděle leí N ( µ,σ ) ormálí x µ α = P < z α / σ = σ σ P x z α / < µ < x + z α / při i opakovaém m pořizov izováí výběrů obsahuje asi 00(-α) ) % itervalů populačí průměr µ 35 Bodový a itervalový odhad pro μ u rozděle leí N(μ,σ ) Bodový odhad X X σ ~ N µ, 95%% iterval i spolehlivosti σ σ X,96 ; X +,96 délka itervalu: přesost p odhadu 36

Rozsah výběru Příklad: : Chceme kostruovat 95 % iterval spolehlivosti pro průměrou rou hodou cholesterolu s délkou d +-+ 0, mmol/l, rozptyl hladiy cholesterolu je,5. Řešeí:,5,5 X,96 ; X +,96,5,96 = 0, = (,96 *,5 / 0,) = 50 37 Statistická a kliická výzamost Možost Statistická výzamost Kliická výzamost a e možá b e možá c ao možá d ao ao e e e f ao e 38 3