Obrázek: Záznam psaný protosumerským písmem



Podobné dokumenty
Statistická analýza volebních výsledk

Dokumentaní píruka k aplikaci. Visor: Focení vzork. VisorCam. Verze 1.0

1 Klientský portál WEB-UDS. 2 Technické ešení. 2.1 Popis systému co všechno WEB-UDS nabízí. 2.2 Definice uživatele a jeho pihlášení

Vcný zámr zákona o zdravotnické záchranné služb (kroužkové íslo 295/2007)

VÝZVA K PODÁNÍ NABÍDKY K VE EJNÉ ZAKÁZCE MALÉHO ROZSAHU

Lekce. 1. I. Úvod. Kontrolní otázky a cviení k 1. lekci

OBECN ZÁVAZNÁ VYHLÁŠKA obce POLERADY. 2/2001

St edisko sociálních služeb m sta Kop ivnice, p.o. eská 320, Kop ivnice

1 KOMBINATORIKA, KLASICKÁ PRAVDPODOBNOST

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Nkolik poznámek k ochran technických ešení

V textu jsou barevn odlišeny metodické vsuvky barevn. Mly by studenta pi vypracovávání práce nasmrovat.

DÉLKA A USPO_ÁDÁNÍ PRACOVNÍ DOBY AD HOC MODUL 2001

DOPRAVNÍ INŽENÝRSTVÍ

POZVÁNKA NA VALNOU HROMADU spolenosti Rizzo Associates Czech, a. s.

Cena poizovací, neboli cena historická, je cena, za kterou byl majetek poízen, vetn náklad souvisejících s jeho poízením, bez odpotu opotebení.

ZADÁVACÍ DOKUMENTACE VE EJNÉ ZAKÁZKY

SBÍRKA PEDPIS ESKÉ REPUBLIKY

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu

Teoretická rozdělení

3.01 Adsorpce na aktivním uhlí co dokáže uhlí(k). Projekt Trojlístek

Olomouc, INŽENÝRSKO-DODAVATELSKÁ, PROJEKNÍ A OBCHODNÍ SPOLENOST ŠTPÁNOV, MŠ SÍDLIŠT REALIZACE ENERGETICKÝ ÚSPORNÝCH OPATENÍ

Měření změny objemu vody při tuhnutí

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Reálná čísla

3] KAPACITNÍ PROPOET KOVÁRNY

DOPRAVNÍ INŽENÝRSTVÍ

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

TALISMAN. (dále také jen TAL 5.0 )

Ž Á D O S T. o poskytnutí účelové neinvestiční dotace z rozpočtu hlavního města Prahy na realizaci projektů v oblasti místní Agendy 21

VLÁDA ČESKÉ REPUBLIKY. Příloha k usnesení vlády ze dne 13. února 2013 č Stanovisko

Pardubický kraj Komenského náměstí 125, Pardubice SPŠE a VOŠ Pardubice-rekonstrukce elektroinstalace a pomocných slaboproudých sítí

Aritmetika s didaktikou II.


Aviva investiční pojištění aneb 6 jednou ranou (recenzí)

Mendelova univerzita v Brn

Příprava na 1. čtvrtletní písemku pro třídu 1EB

Výpočet dotace na jednotlivé druhy sociálních služeb

1)! 12 a) 14 a) K = { 1 }; b) K = { 6 }; c) K ={ 2 }; d) K ={ 3 }; e) K ={ 4 }; f) K = 0 ! ; N; 17 a) K =N; b) K ={ 2; 3;

STANOVISKO č. STAN/1/2006 ze dne

Záznam zkušební komise Jméno a píjmení Podpis Vyhodnocení provedl INSTRUKCE

MENDELOVA ZEMDLSKÁ A LESNICKÁ UNIVERZITA V BRN PROVOZN EKONOMICKÁ FAKULTA. Diplomová práce. Lidské zdroje. Bc. Milada ezáová

Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace. Komenské 1720, Staré Město, Metodika

Faktory ovlivňující zdravotní stav Anamnéza, anebo problémy s možným dopadem na zdravotní péči

STUDIE HELEN. MUDr. K. Žejglicová SZÚ, Ústředí monitoringu

Investice a akvizice

Přednáška 5. Výběrová šetření, Exploratorní analýza

Databáze invazivních vstupů jako zdroj dat pro účinnou kontrolu infekcí

Co je čistá současná hodnota (NPV)

Evidence dat v prostředí MS Excelu Kontingenční tabulka a kontingenční graf

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

6. Bytové domy I. Bytové domy I. 1/29

PRINCIPY ŠLECHTĚNÍ KONÍ

Měření hustoty kapaliny z periody kmitů zkumavky

3. Restrukturalizace nebo manipulace s údaji - práce s rastrovými daty

Direktor na Direkcia Obžalvane i upravlenie na izpalnenieto Varna pri Centralno upravlenie na Nacionalnata agencia za prichodite,

ZNALECKÝ POSUDEK .7670/110/13

3. Polynomy Verze 338.

MATEMATIKA A BYZNYS. Finanční řízení firmy. Příjmení: Rajská Jméno: Ivana

Epidemiologie, 4. seminář. SCREENING SCREENINGOVÉ TESTY v epidemiologii

I. Objemové tíhy, vlastní tíha a užitná zatížení pozemních staveb

Domovní ád. Spoleenství vlastník jednotek v budov , Brechtova ul., Praha 4. I. Úvod

Návrh. VYHLÁŠKA ze dne o zdravotnické dokumentaci. Rozsah údajů zaznamenávaných do zdravotnické dokumentace

Drsná matematika IV 7. přednáška Jak na statistiku?

ODBORNÝ POSUDEK. č. 2661/108/15

DUM 10 téma: Nástroje malování

Pravidla poskytování pečovatelské služby (PS) (pro zájemce a uživatele PS)

METODIKA PRO NÁVRH TEPELNÉHO ČERPADLA SYSTÉMU VZDUCH-VODA

HYPERTENZE VYSOKÝ KREVNÍ TLAK

Konzistence databáze v nekonzistentním světě

Vyvažování tuhého rotoru v jedné rovině přístrojem Adash Vibrio

DYNAMICKÉ VÝPOČTY PROGRAMEM ESA PT

Zkouška Jestliže 17 % z 215 t je 36,55 t, potom 83 % z 215 t je 215 t 36,55 t = 178,45 t.

Základní škola a mateřská škola, Ostrava-Hrabůvka, Mitušova 16, příspěvková organizace Školní vzdělávací program 2. stupeň, Matematika.

M - Příprava na čtvrtletní písemnou práci

Závrená zpráva o útování a daovém posouzení hospodaení SRPdŠ pi SPŠ/VOŠ Chomutov za úetní a zdaovací období roku 2010

Algoritmizace a programování

Žádanka na neinvazivní prenatální test aneuplodií cfdna vyšetření

100+1 OTÁZEK A ODPOVÌDÍ O PREVENCI NEJÈASTÌJŠÍCH ONEMOCNÌNÍ

1. Pojem ochranná známka

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

VYSOKÉ U ENÍ TECHNICKÉ V BRN BRNO UNIVERSITY OF TECHNOLOGY

DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 5. cvičení

Proudìní fotosférického plazmatu po sluneèním povrchu

ZÁKON 250/2000 ) PROGRAM PRO POSKYTOVÁNÍ DOTACÍ 2016 A.

ODBORNÝ POSUDEK. č. 2381/21/14

Jiné přístupy k územnímu plánování a řešení krajiny

Využití EduBase ve výuce 10

Výchovné a vzdělávací strategie pro rozvoj klíčových kompetencí žáků

metodická příručka DiPo násobení a dělení (čísla 6, 7, 8, 9) násobilkové karty DiPo

1 Matematické základy teorie obvodů

Nové trendy v prenatálním screeningu, první trimestr, OSCAR, Nejefektivnější metoda screeningu vrozených vývojových vad

Těhotenský test pro zrakově postižené Tereza Hyková

Základní charakteristiky demografie a zdravotního stavu

Informační a znalostní systémy

170/2010 Sb. VYHLÁŠKA. ze dne 21. května 2010

Poskytovatel: Národní rada osob se zdravotním postižením ČR, o.s. Poradna pro uživatele sociálních služeb Děčín

SMĚRNICE Zjednodušená analýza rizika blesku

V rámci. pacientovi. V souvislosti. aktualizace

2013 ISBN$

5.2.1 Matematika povinný předmět

Transkript:

1. Úvod Statistika je vdní obor, jehož výsledky mžeme pi své práci používat prakticky denn. Neexistuje snad jediný odborný medicínský asopis, ve kterém bychom nenašli lánky obsahující odbornou statistickou terminologii. asto se mžeme setkat s prezentací výsledk klinického testování nového léivého pípravku, s porovnáním rzných metod léby pacient nebo se zprávami o incidenci konkrétní nemoci v jednotlivých regionech. (Incidence je podíl potu nov hlášených nemocných jedinc za dané asové období a potu všech jedinc ve sledované populaci). Takové studie používají k vyjádení nových poznatk vždy metody statistické analýzy. Vysoká frekvence vdeckých sdlení v odborných asopisech však u tená automaticky nezajišuje znalost jazyka statistické analýzy. Dlouholeté zkušenosti v oblasti vdeckého výzkumu a využití metod statistiky ukazují spíše na to, že mnohé statistické pojmy, respektive pojmy z výzkumu jsou i odbornou veejností chápány nepesn, nebo dokonce nejsou pochopeny vbec. V takovém pípad však odborná sdlení nemohou pinést pedpokládaný efekt. 11.1. Historie statistiky Statistika je velmi starý vdní obor, který provází lidskou spolenost už od poátku. Slovo statistika pochází z latinského status stav. Statistika byla pvodn nástrojem k zaznamenávání dat dležitých a dokonce nezbytných pro stát a jeho ízení. Tmito dležitými informacemi byly údaje o potu obyvatel, výši daní, velikosti území, potu voják, stavu zásob atd. Tyto informace se vždy získávaly prostednictvím pozorování a mení. Nejstarší písemné památky mající statistickou povahu pochází z oblasti Sumeru, byly zaznamenány informace o ase, potu osob, potu kus domácího zvíectva a úrod viz. obrázek. Obrázek: Záznam psaný protosumerským písmem Starovké íše byly zcela finann závislé na objemu vybraných daní ve form naturální, penžní nebo ve form pracovních povinností obyvatelstva. K zaznamenání tchto údaj se používaly propracované statistické metodiky. 1

Egypt od r. 850 p. n. l. pravideln za roky se provádlo sítání obyvatel, soupis dobytka, výše daní a stavu zásob. Zvláš propracovaný systém evidence (census) se používal ve starovkém ím. Stedovkými statistickými roenkami byly vrchnostenské urbáe, které zaznamenávaly píjem poddaných, rozsah pozemkového vlastnictví šlechty a církve, a mstské berní knihy a berní rejstíky, které obsahovaly výet poplatník spolu s údaji o jejich nemovitém majetku a výši odvedených daní. Ve 14. století se v Evrop objevují první církevní matriky, jako cenný zdroj informací o pirozené mn obyvatelstva. 16. století s sebou pineslo nový pohled na svt a lovka, rozvoj filozofie a poátky moderních vdních disciplín - pojem STATISTIKA poprvé použil Ital Girolamo Ghilini (v r. 1589). V 17. století dochází k vývoji moderní statistiky, pedevším v oblasti teorie her a teorie pravdpodobnosti. V Anglii vzniká okruh statistiky, tzv. politická aritmetika (dnešní demografie) - vycházela z údaj o narozeních a úmrtích a pokoušela se na jejich základ zkoumat vývoj stavu obyvatelstva v delších asových údobích. John Graunt (160-1674) John Graunt, zakladatel demografie Edmund Halley, teorie pravdpodobnosti Edmund Halley (1656-174) - anglický astronom, matematik, meteorolog a fyzik - na konci 17. století pi konstrukci úmrtnostních tabulek propojil statistiku s potem pravdpodobnosti. Mimoádnou zásluhu o rozvoj statistiky ml belgický matematik, statistik a astronom Adolphe Lambert Quételet (1796-1874), který vypracoval zásady moderního sítání lidu. Zaal aplikovat numerické postupy na rzné stránky spoleenského života (nap. na zloinnost). Pišel s myšlenkou prmrného lovka - na základ velkého souboru dat vypoítal základní prmrné tlesné rozmry lovka a odchylky jednotlivc od tchto prmr. Je duchovním otcem pojm prmr, stední hodnota, rozptyl a rozdlení. Statistika 19. a poátku 0. století se vyznaovala sbrem informací od co nejširšího okruhu respondent, s cílem obsáhnout ve svém šetení celou populaci a tím získat maximáln pesný obraz stavu spolenosti. Vzniká biometrická statistická škola. K. Pearson aplikace statistiky v biologii. Poátkem 0. století se zrodila matematická statistika - disciplína, jejímž charakteristickým rysem je hledání metod, jež by umožnily vytvoení závr o celku na základ výbru. R. A. Fischer vytváí statistiku malých výbrových soubor. I dnes se významná ást statistiky zabývá zpracováním podobných dat a jejím cílem je mit a poskytovat informace pro ízení. Zájem státu na shromažování a vyhodnocování uritých

dat se projevuje existencí a podporou rzných institucí - v našem pípad je to pedevším eský statistický úad, který sbírá údaje o všech nemocnicích, obcích, uritých službách a ekonomických výsledcích. Dnešní statistika se však zdaleka neomezuje jen na prosté shromažování a popis dat, ale umož uje zobecovat poznatky z dat a podporovat kvalifikované rozhodování. Co je statistika? Slovo statistika mžeme používat nejmén ve tech významech: 1. íselné údaje o hromadných jevech - statistiku nezajímá to, co lze pozorovat a zmit pouze jednou, ale zabývá se pozorováním tzv. hromadných jev (hromadný jev je jev, který se vyskytuje mnohokrát a neustále se mže opakovat nap. zkoumání urité vlastnosti velkého množství objekt).. Praktická innost spoívající ve sbru, zpracování a vyhodnocování dat. 3. Teoretická disciplína, která se zabývá metodami vyhodnocení hromadných jev - složitá matematika, kterou se zabývají profesionální statistici. Strun bychom mohli íci, že statistika je zpsob shromažování dat, práce s daty a jejich kvantitativní vyhodnocení, tedy interpretace. Používá k tomu pedevším metodu pozorování a popisu urité vybrané ásti reality (nap. vybrané skupiny zdravotnických zaízení) s následným zobecnním tchto pozorování na celou realitu (všechna zdravotnická zaízení na sledovaném území). 1.. Statistika a medicína Používání statistických metod je dnes v medicín velmi rozšíeno a základní znalosti ze statistiky jsou nezbytné nejen pro psaní odborných lánk, ale i pro jejich tení a studium. V medicín se asto setkáváme s otázkami, které mají statistický charakter: Je nový lék lepší než dosud užívaný? Jaké okolnosti ovliv ují výsledek léby pacienta? Jaké významné ukazatele (charakteristiky) jsou spojeny s relapsem (návratem) choroby, úmrtím pacienta nebo vznikem komplikací pi léb? Jaká je pesnost a citlivost dané diagnostické metody? Na tyto a podobné otázky umí odpovdt práv statistika. 1.3. Odvtví statistiky Deskriptivní statistika Deskriptivní (popisná) statistika se zabývá uspoádáním datových soubor, jejich popisem a sumarizací. Induktivní statistika Induktivní statistika se zabývá zobec ováním poznatk získaných z dat. Induktivní metoda (indukce) je princip usuzování, kdy z konkrétních poznatk získaných pozorováním a mením na vybraných ástech reality vyvozujeme obecné zákonitosti platné pro celou realitu. Pi každém zobec ování poznatk dochází k ovlivnní výsledk subjektivními vjemy pozorovatele a takové poznatky mají proto jen omezenou platnost. Tento problém eší induktivní statistika, která pracuje s metodami, umož ujícími stanovit u obecných závr stupe jejich spolehlivosti. Výpoet stupn spolehlivosti je objektivní, protože je založen na poznatcích teorie pravdpodobnosti a nikoliv na subjektivním názoru pozorovatele. 3

Kontrolní otázky: 1. Vyjmenujte nkteré významné statistiky, matematiky a astronomy, kteí se zasloužili o rozvoj vdního oboru statistika.. ím se zabývá deskriptivní statistika? 3. Co je pedmtem induktivní statiky?. Základní pojmy K problematice statistického výbru a vlastního výzkumu je teba si nadefinovat nkolik pojm. Hlavní roli v metodách induktivní statistiky hrají pojmy populace a výbrový soubor. Populace (základní soubor) je definována pesným stanovením statistických jednotek bu jejich výtem (v pípad tzv. demografické populace), nebo vymezením spolených vlastností statických jednotek (v pípad hypotetické populace). V medicínském výzkumu je obvyklé definovat populaci vymezením spolených vlastností pacient, kterých se daný výzkum týká. Píklady definice hypotetické populace: - Populaci tvoí ženy s hormonální antikoncepcí, u nichž došlo k hluboké žilní trombóze (tj. vzniku krevní sraženiny). - Populaci tvoí pacienti s opravnou operací (tzv. revizí) totální endoprotézy kyle (tj. celkové náhrady kyelního kloubu). - Populaci tvoí dosplí pacienti s diabetes mellitus (cukrovkou), kteí používají k aplikaci inzulinu inzulinovou pumpu. - Populaci tvoí pacienti hospitalizovaní pro akutní infarkt myokardu (srdení svaloviny). Parametry populace (populaní charakteristiky) jsou íselné charakteristiky populace. Obecn jde o neznámá ísla (nap. prmrná výška dosplých muž), která jsou pedmtem odhadování. Výbrový soubor je ást (vzorek) základního souboru. V praxi jsou sledované vlastnosti zjišovány jen u uritého potu, neboli vzorku statistických jednotek, vybraného z populace podle uritých statistických pravidel. Poet jednotek ve výbrovém souboru znaíme písmenem n. Pro úely zobec ování by ml být výbrový soubor dostaten reprezentativní, tj. ml by dobe odrážet základní strukturu celé populace (nap. stejný pomr muži/ženy, stejné vkové složení, stejné rozdlení pacient podle stádia nemoci atd.). výbr zobecnní výsledk Statistická jednotka základní prvek, který je pedmtem zkoumání (pacient, pokusné zvíe, transplantovaná ledvina,...) Znak vlastnost sledovaná na jednotkách statistického šetení (u pacient nap. diagnóza, pohlaví, vk, délka hospitalizace, hladina celkového cholesterolu, glykémie, krevní tlak, ). 4

3. Pravidla poizování náhodných výbr Úplné šetení dnes provádíme v praxi jen zídka, dvodem je vtšinou nedostupnost celé populace, ekonomická a asová náronost a v nkterých pípadech i destruktivní charakter provádného výzkumu (pokusné zvíe se musí usmrtit, testovaný výrobek se musí zniit, atd.). Induktivní metoda, používaná ve výzkumné praxi, vyžaduje, aby byl výbrový soubor dostaten reprezentativní. Pi získávání reprezentativního výbrového souboru není pípustné, aby byl výbr statistických jednotek ovliv ován subjektivními postupy výzkumník, proto používáme objektivní procedury, které jsou založeny na principech náhodnosti a nezávislosti. Náhodností se rozumí to, že metoda, pomocí které je výbr poizován, spl uje podmínku: každá statistická jednotka (v medicín vtšinou pacient) má stejnou šanci dostat se do výbru. Nezávislost znamená, že výbr statistické jednotky (pacienta) není ovlivnn pedchozími výbry. 3.1. Metody poizování náhodného výbru V medicín se nejastji setkáváme se tymi metodami: prostý náhodný výbr získáme mechanismem výbru, ve kterém má každý prvek výchozí populace stejnou šanci dostat se do výbru. V praxi se používají poítaové programy tzv. generátory náhodných ísel, nebo tabulky náhodných ísel (prostý náhodný výbr lze poídit také losováním). Pedpokladem je, že všechny statistické jednotky základního souboru jsou oíslované. Píklad: Oíslujeme chorobopisy ísly 1 až 900. Pomocí generátoru náhodných ísel vygenerujeme adu ísel od 0 do 9, nap.: 7, 5, 6,, 3, 1, 4, 6, 9, 0, 8, 1,... Do výbru zaadíme chorobopisy s ísly: 756, 31, 469, 081,... systematický náhodný výbr z výchozí populace vybereme každý k-tý prvek, kde k = N/n, N je poet prvk výchozí populace, n je požadovaný rozsah náhodného výbru. V praxi nejprve náhodn zvolíme íslo mezi 1 a 9, od kterého se výbr zahájí. Píklad: Výchozí populace má 100 prvk, do výbrového souboru chceme zaadit 0 prvk. Do výbru budou vzaty prvky. 6, 11, 16, 1, 6, 31, 36, 41, atd. 5

stratifikovaný náhodný výbr výchozí populace se nejdíve podle hodnot uritého znaku rozdlí do nkolika homogenních skupin (tzv. strat) - nap. podle vku, po 10-ti letech. V druhém kroku se z takto vytvoených skupin provede prostý náhodný výbr. Cílem stratifikace je zajistit, aby jednotlivé podskupiny výchozí populace byly ve výbru adekvátn zastoupeny. V medicínských studiích se krom vku asto stratifikuje podle pohlaví, vku, stádia nebo délky nemoci. vícestupový náhodný výbr výchozí populace je nejdíve rozdlena do nkolika hierarchicky uspoádaných úrovní. Píklad: Chceme získat reprezentativní výbr žák 7. tíd základních škol v R. Populaci tvoí žáci ZŠ eských a moravských mst nad 10 000 obyvatel. Populaci rozleníme na úrovn: msta - školy - tídy - žáci. V prvním kroku nejdíve ze všech eských a moravských mst (nad 10 000 obyvatel) náhodn vybereme nkolik mst. Ve druhém kroku potom v každém vybraném mst náhodn vybereme nkolik základních škol. V tetím kroku v každé vybrané škole náhodn vybereme nkolik 7. tíd a nakonec provedeme v tchto tídách náhodný výbr žák (tj. jednotek na nejnižší úrovni). Vícestup ový náhodný výbr se používá v situacích, kdy není k dispozici tzv. výbrový rámec (opora výbru), tj. seznam nebo jiný prostedek k identifikaci jedinc v celé populaci (v našem pípad nemáme k dispozici seznam všech žák ZŠ). V praxi obvykle není snadné poídit skuten náhodný výbr. Ve vtšin pípad je to tak, že léka žádný náhodný výbr neuskute uje vzhledem k tomu, že pacient spl ujících daná kritéria není dost na to, aby se z nich dlal výbr. Daný vzorek pacient je potom implicitn považován za náhodný výbr. V takové situaci je nutné zvážit, zda jsou pacienti, kteí se do vzorku dostali, skuten reprezentativní pro populaci, na kterou se má zobec ovat. 3.. Metody sbru dat Observaní metody metody založené na pouhém vizuálním pozorování nebo klinickém, mikrobiologickém nebo biochemickém vyšetení jde o registrování a zaznamenání sledovaných událostí. Rozhovor a dotazník - o sledovaném jevu se dozvídáme zprostedkovan dotazováním. V tomto pípad existuje možnost zkreslení v dsledku nepochopení otázky nebo špatného záznamu odpovdi. Studium dokumentace - tzv. sekundární analýza, umož uje získat informace z minulosti (zdravotní záznamy, záznamy o hospitalizaci, záznamy o pracovní neschopnosti, hlášení infekních nemocí, hlášení úraz, odborné posudky, MR nebo RTG snímky, ). 3.3. Pilotní studie Abychom se vyhnuli chybám pi rozsáhlém sbru a zpracování dat, provádíme ped vlastním výzkumem pedbžné šetení - tzv. pilotní studii. Posláním pilotní studie je na malém vzorku výbrového souboru ovit metody sbru, zpracování a vyhodnocení údaj a pípadn na základ tohoto poznání metody píslušným zpsobem upravit. Teprve potom pikroíme k vlastnímu sbru dat v projektovaném rozsahu. Kontrolní otázky: 1. Definujte pojem populace, uvete píklady populací.. Definujte pojem výbrový soubor. 3. Co si pedstavujete pod pojmem parametry populace? 6

4. Definujte pojmy statistická jednotka a znak. 5. Vyjmenujte základní metody poizování náhodných výbr. 6. Vyjmenujte základní metody sbru dat. 4. Typy dat Na sledovaných statistických jednotkách (pacienti, události, výrobky) zjišujeme (míme) urité znaky, tj. vlastnosti (charakteristiky) tchto jednotek. Podle povahy rozlišujeme dva základní typy znak - kvalitativní (kategoriální) a kvantitativní (metrický). 4.1. Kvalitativní (kategoriální) data U kvalitativních znak jsou varianty zkoumané vlastnosti dány vtšinou slovním vyjádením - vyjadují kvalitu mené vlastnosti pomocí tzv. kategorií. K mení kvalitativních znak používáme nominální nebo ordinální (tj. poadovou) škálu. Podle použité micí škály potom mluvíme o datech nominálního nebo ordinálního typu. Data nominální Nominální micí škála je nejjednodušší mrnou škálou, pedstavuje tídní statistických jednotek do dvou nebo více vzájemn se vyluujících kategorií. V pípad dvou kategorií mluvíme o tzv. Dichotomické stupnici (nap. kategorie: pozitivní/negativní, ano/ne, pítomen/nepítomen, 0/1 atd.). Pro oznaení kategorií se také asto používají ísla (nap.: 1=muž, =žena), pro která však nelze použít obvyklé aritmetické operace! Kategorie nominálního znaku jsou rovnocenné a nelze je uspoádat. Píklady nominálních znak: pohlaví (kategorie: muž, žena), thotenství (kategorie: normální, rizikové), Rh faktor (kategorie: pozitivní, negativní), Hypertenze (kategorie: ano, ne), krevní skupina (kategorie: A, B, AB, 0), rodinný stav (kategorie: svobodný(á), ženatý(vdaná), rozvedený(á), vdovec(vdova)). Data ordinální (poadová) Ordinální micí škála je tvoena vzájemn se vyluujícími kategoriemi, které lze vzájemn uspoádat a lze tedy urit jejich poadí, nemá však smysl urovat vzdálenost (rozdíl) mezi jednotlivými kategoriemi. Škále se nkdy íká semi-kvantitativní. Píklady ordinálních znak: stádium nemoci (kategorie podle symptom nap.: I, II, III, IV), intenzita nežádoucího úinku (kategorie: mírná, stední, silná), invalidita (kategorie: žádná, ástená, úplná), GOS (kategorie: 1,,3,4,5)...Glasgow Outcome Score - škála používaná v traumatologii: 1 = smrt, = vegetativní stádium, 3 = závažné postižení, 4 = stední postižení, 5 = dobrý stav, mrs (kategorie: 0,,...,6)... škála používaná v neurologii: 7

0 = bez deficitu, 1 = lehké postižení bez omezení aktivit,... 5 = závislý, imobilní pacient, 6 = úmrtí reakce po okování (kategorie: žádná, zarudnutí, otok+horeka), vztahy na pracovišti (kategorie: pátelské, ist pracovní, nepátelské), závažnost prbhu onemocnní, stupe ortodontické anomálie (kategorie: definovány podle symptom). 4.. Kvantitativní data Kvantitativní znaky vyjadují menou vlastnost íslem. Jsou bu diskrétní (varianty znaku jsou vyjádeny celými ísly nap. délka hospitalizace: 10 dní), nebo spojité (jednotlivé varianty znaku mohou nabývat jakékoliv hodnoty z uritého intervalu nebo rozmezí nap. tlesná hmotnost: 56,5 kg). Kvantitativní znaky míme na pomrové nebo intervalové stupnici. Tyto stupnice umož ují uspoádat jednotlivá pozorování podle velikosti a urit také jejich pesnou vzdálenost. Na intervalové stupnici je pozice nuly vcí volby, nula mže být na kterémkoli míst, aniž se tím zmní povaha mení (nap. libovolná kalendání stupnice nebo teplotní stupnice). Na pomrové stupnici je pevn definována pozice nuly, 0 vyjaduje bu naprostou absenci mené vlastnosti, nebo pevný poátek, od nhož míme velikost znaku. Na rozdíl od intervalové stupnice, pi porovnání dvou hodnot na pomrové stupnici, má smysl se ptát, kolikrát je první hodnota vtší než druhá. Mení znak na pomrové škále dovoluje vytžit maximální objem informací o studovaném jevu. Kvantitativní znaky dovolují použití rzných matematicko-statistických operací - nap. výpoet prmr, smrodatné odchylky, korelaních koeficient, výpoet rzných index, atd. Píklady kvantitativních znak: vk, tlesná hmotnost, tlesná výška, BMI (Body Mass Index), prmrná velikost ervených krvinek, hladina celkového cholesterolu, glykémie (hladina krevního cukru), hemoglobin, hematokrit, kreatinin, poet leukocyt, poet erytrocyt, poet trombocyt, krevní tlak (systolický nebo diastolický), tepová frekvence, délka hospitalizace, délka pracovní neschopnosti, poet zub stálého chrupu, poet thotenství, poet potrat, atd. Kontrolní otázky: 1. Uvete charakteristiku kvalitativních dat.. Uvete píklady nominálních dat. 3. Uvete píklady ordinálních dat. 4. Uvete píklady metrických (kvantitativních dat). 5. Zaate do píslušného typu dat následující znaky: pohlaví pacienta, tlesná hmotnost (v kg), délka pracovní neschopnosti (ve dnech), 6. Zaate do píslušného typu dat následující znaky: 8

hladina celkového cholesterolu (v mmol/l), BMI (Body Mas Index), reakce po okování (meno na škále: žádná, zarudnutí, otok+horeka). 5. Metody deskriptivní statistiky Nejastji používanou metodou popisné statistiky je tídní. Tídní slouží k rozdlení prvk celého zkoumaného souboru do skupin. Skupiny jsou tvoeny podle kategorií daného tídicího znaku (obvykle podle kategorií znaku kvalitativního). Podle potu tídicích znak rozlišujeme tídní jednostup ové (jeden tídicí znak) a tídní vícestup ové (dva a více tídicích znak). Napíklad tídní novorozenc podle pohlaví (tj. vytvoení dvou skupin: chlapci, dívky) je jednostup ové. Tídní novorozenc podle pohlaví (chlapci / dívky) a termínu porodu (ped termínem/ v termínu/ po termínu) je dvoustup ové (vytvoení 6 skupin). ím vyšší stupe tídní provedeme, tím se sice dostáváme ke konkrétnjší ásti celého souboru, ale souasn spolu s tím je takto vybraný soubor menší. Vytídíme-li napíklad ze souboru 1500 respondent, který je reprezentativní pro celé území eské republiky, ženy z Prahy, zstane z pvodních 1500 respondent jen 90 dotázaných. Chceme-li ke tídní použít znak kvantitativní, musíme nejdíve definovat intervaly hodnot tohoto znaku, podle kterých vytvoíme jednotlivé skupiny. Intervaly musí pokrýt všechny hodnoty znaku a nesmí se vzájemn pekrývat. Výsledkem tídní je etnostní (frekvenní) tabulka, která obsahuje: Absolutní etnosti = poty prvk zaazených do jednotlivých tíd (kategorií nebo interval). Relativní etnosti = absolutní etnosti dlené rozsahem výbru (tj. celkovým potem prvk). Kumulativní etnosti = vzniknou postupným naítáním etností z pedchozích kategorií k dané kategorii. Kumulativní etnosti mohou být absolutní nebo relativní, poítají se pouze u znak ordinálních nebo v pípad definovaných interval pro znak kvantitativní. Uspoádané absolutní nebo relativní etnosti vytváí rozdlení výbrové etnosti. Píklad: etnostní tabulka - rozdlení sledovaných osob do tíd podle vkových interval Relativní etnost (v %) Kumulativní absolutní etnost Kumulativní relativní etnost Absolutní Tída etnost 15-19 let 140 8,4 % 140 8,4 % 0-4 let 174 10,5 % 314 18,9 % 5-34 let 88 17,4 % 60 36,3 % 35-44 let 69 16,3 % 871 5,6 % 45-54 let 311 18,8 % 118 71,4 % 55-64 let 09 1,7 % 1391 84,1 % 65 let a více 6 15,9 % 1653 100,0 % Celkem 1653 100,0 % Kumulativní absolutní etnost 60 znamená, že v celém souboru je celkem 60 osob ve vku do 34 let (tj. 34 let a mladších). 60 = 88+174+140. Kumulativní relativní etnost 5,6 % znamená, že v celém souboru je celkem 5,6 % osob ve vku do 44 let (tj. 44 let a mladších). 5,6% = 16,3% + 17,4% + 10,5% + 8,4%. 9

Prezentace výsledk statistického šetení je dána slovním výkladem, statistickými tabulkami a grafickým znázornním. Podle stupn tídní rozeznáváme ti základní typy statistických tabulek: tabulku prostou tabulku skupinovou tabulku kombinaní Tabulka prostá Tlesná výška v cm 130 140 136 141 139 133 149 151 139 136 138 14 17 147 139 135 141 143 13 146 151 146 141 141 131 14 141 Tabulka skupinová Sted tídního intervalu Poet dtí 15 1 130 3 135 4 140 1 145 4 150 3 Celkem 7 Tabulka kombinaní Sted tídního intervalu Poet chlapc Poet dívek Poet dtí 15 1-1 130 1 3 135 3 1 4 140 7 5 1 145 1 3 4 150 1 3 Celkem 15 1 7 5.1. Grafická prezentace výsledk Grafické znázor ování je velmi úinný zpsob, jak prezentovat statistické údaje. Grafy nejsou tak pesné jako tabulky, ale jsou pehlednjší a názornjší. Krom pravoúhlé soustavy souadnic se používá i polárních souadnic a v nkterých pípadech také nerovnomrná logaritmická stupnice. Bodový graf používá se ke znázornní závislosti dvou kvantitativních znak. Pro rozlišení hodnot rzných skupin (nap. muži, ženy) se používají jiné symboly nebo barvy. Data pro bodový graf: Pacient. Diastolický TK Systolický TK 1 110 180 70 90 3 70 130 4 100 130...... n 100 160 10

Bodový graf závislost systolického a diastolického krevního tlaku 00 180 systolický krevní tlak 160 140 10 100 80 60 40 50 60 70 80 90 100 110 10 diastolický krevní tlak Sloupcový graf používá se ke znázornní absolutních nebo relativních etností kvalitativního znaku, výška sloupc odpovídá etnosti. Sloupcový graf rozdlení potu narozených dvat podle kestního jména 11

Spojnicový graf používá se ke znázornní zmny hodnot kvantitativního údaje v ase, nebo ke znázornní rozdlení absolutních nebo relativních etností spojitého znaku (v tomto pípad se graf nazývá polygon etností). Spojnicový graf Kojenecká a novorozenecká úmrtnost na 1 000 živ narozených dtí rok Polygon etností Tabulka s daty pro polygon etností distribuce pacient podle vku v definovaných intervalech. Procento Vk pacient <= 9 let 3,% 30-39 let 3,% 40-44 let 8,4% 45-49 let 9,7% 50-54 let 6,5% 55-59 let,6% >= 60 let 6,5% Celkem 100% 1

Vk pacient v dob operace 35% 30% 5% 0% 15% 10% 5% 0% <= 9 let 30-39 let 40-44 let 45-49 let 50-54 let 55-59 let >= 60 let Histogram etností používá se ke znázornní rozdlení absolutních nebo relativních etností spojitého znaku. Výška sloupc odpovídá etnosti, základna každého sloupce zahrnuje tídu hodnot znaku. Pro úely porovnání se v grafu zobrazují relativní etnosti (procenta). Poet mimodložních Vk matky thotenství 15-19 let 100 0-4 let 340 5-9 let 530 30-34 let 370 35-39 let 55 40-44 let 68 Celkem 1663 Poet mimodložních thotenství v R v roce 199 podle vku matky 600 500 400 300 00 100 0 15-19 0-4 5-9 30-34 35-39 40-44 vk matky [roky] 13

Výseový (kruhový, koláový) graf Zachycuje strukturu souboru, tj. rozdlení celého souboru do jednotlivých skupin podle kategorií daného znaku. Plocha kruhu pedstavuje celý soubor a jednotlivé ásti jsou znázornny kruhovými výseemi. Procento osob Vk bez domova 0-18 let 4 % 19-5 let 9 % 6-40 let 19 % 41-50 let 8 % 51-6 let 5 % nad 6 let 15 % Graf vkové struktury bezdomovc v R nad 60 let 15% 0-18 let 4% 19-5 let 9% 6-40 let 19% 51-6 let 5% 41-50 let 8% Vková pyramida (strom života) Znázor uje vkové složení obyvatelstva, je to zvláštní typ sloupcového grafu. 14

Demografické složení obyvatel v Jihomoravském kraji Krabicový graf (box graf) Znázor uje rozdlení hodnot meného kvantitativního znaku. Krabicový graf nejastji zobrazuje tzv. kvartily: medián (tj.. kvartil = silná ára uprosted krabice), 1. kvartil (dno krabice), 3. kvartil (víko MEZIKVARTILOVÉ krabice) a nejmenší a nejvtší ROZPTÍ hodnotu (viz. anténky), pípadn odlehlé nebo extrémní hodnoty (obvykle bývají znázornny njakým symbolem, nap. kroužkem, hvzdikou atd.). Výška krabice definuje tzv. mezikvartilové rozptí. Kvartily budou definovány dále v Qtextu 3 Q 1 viz 3. kapitola kvartil 1. 1. kvartil Popisné statistiky kvantitativní data. Porovnání rozložení hemoglobinu u muž a žen Box graf zobrazení distribuce hodnot kvantitativního znaku pomo maximum 3. kvartil medián 1. kvartil mezikvartilové rozptí muži ženy minimum Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpotem eské republiky. 15

Kontrolní otázky: 1. Definujte pojmy frekvenní tabulka, absolutní etnost, relativní etnost.. Definujte pojmy kumulativní absolutní etnost, kumulativní relativní etnost. 3. Uvete, jaký typ grafu by byl vhodný pro grafickou prezentaci závislosti dvou kvantitativních znak. 4. Jaký typ grafu se používá pro znázornní zmny hodnot kvantitativního údaje v závislosti na ase? 5. Definujte pojem polygon etností, k emu se používá?. 6. Definujte pojem histogram etností. 7. K emu se používá box graf (krabicový graf)? 6. Základy teorie pravdpodobnosti Pravdpodobnost a relativní etnost Pokus (experiment) se liší od prostého pozorování tím, že pi pokusu vdec aktivn ovliv uje podmínky, za kterých probíhá mení. V praxi se asto setkáváme s pokusy, jejichž výsledky nejsou jednoznan pedureny podmínkami, za kterých probíhají takové pokusy nazýváme náhodné pokusy. (p. házení mincí nebo hrací kostkou, losování z osudí, ) Náhodný jev = jakékoli tvrzení o výsledku náhodného pokusu nebo pozorování, o kterém lze po uskutenní pokusu rozhodnout, zda je i není pravdivé. Píklad: Náhodný jev A = narození chlapce Budeme-li postupn zaznamenávat pohlaví narozených dtí, dostaneme následující posloupnost: A, A, A, A, A, A, A, A, kde A je náhodný jev narození dívky etnost, s jakou nastává náhodný jev A (tj. narození chlapce) pro libovoln dlouhou posloupnost pozorování, mžeme charakterizovat podílem r/n, kde n je délka posloupnosti a r je poet narozených chlapc. íslo r nazýváme absolutní etnost a podíl r/n relativní etnost výskytu náhodného jevu A ve výbru o rozsahu n. S rostoucím rozsahem výbru se relativní etnosti ustalují v blízkosti hodnoty 0,5 (platí pro tento konkrétní píklad). Každý náhodný jev A je charakterizován íslem P(A), které je mírou astosti výskytu jevu a nazývá se pravdpodobnost náhodného jevu A. 6.1. Základní vlastnosti pravdpodobnosti 0 P(A) 1 P(A) = 1, je-li A jev jistý (jev A nastává vždy) P(A) = 0, je-li A jev nemožný (jev A nikdy nenastane). 16

Pi mnohonásobném nezávislém opakování náhodného pokusu se relativní etnost výskytu jevu A jen nepatrn liší od pravdpodobnosti P(A). P( A) = lim n r n V praxi odhadujeme pravdpodobnost náhodných jev pomocí relativních etností, kvalita odhad závisí na potu provedených pokus. 6.. Pravidla pro poítání s pravdpodobností 1. Pravidlo o sítání pravdpodobností a) Jsou-li náhodné jevy A, B vzájemn nesluitelné (nemohou nastat oba souasn), potom pravdpodobnost, že nastane jev A nebo nastane jev B je P(A B) = P(A) + P(B) A B b) Jsou-li náhodné jevy A, B sluitelné (mohou nastat oba souasn), potom P(A B) = P(A) + P(B) P(A B) jevy nesluitelné A B jevy sluitelné c) Obecn: Jsou-li jevy A 1, A,, A k vzájemn nesluitelné, potom P(A 1 A A k ) = k i= 1 P( A i ) 6.3. Píklad V náhodn vybrané skupin n=140 muž ve vku 40-50 let ohrožených arteriální hypertenzí se vyskytl: - rizikový faktor "zvýšený cholesterol" (jev A) ve 37 pípadech a - rizikový faktor "kouení" (jev B) v 98 pípadech, - souasný výskyt obou rizikových faktor (A B) byl zjištn ve 31 pípadech. Odhadnte pomocí relativních etností pravdpodobnosti výskytu jev A, B, A B a A B. 17

ešení: P(A) = 37/140 = 0,643 Pravdpodobnost, že muže ve vku 40-50 let zjistíme zvýšenou hladinu celkového cholesterolu, je 0,643. P(B) = 98/140 = 0,7000 Pravdpodobnost, že muž ve vku 40-50 let bude kuák, je 0,7000. P(A B) = 31/140 = 0,14 Pravdpodobnost, že muž ve vku 40-50 let bude kuák se zvýšenou hladinou celkového cholesterolu, je 0,14. P(A B) = P(A) + P(B) P(A B) = 0,643 + 0,7000 0,14 = 0,749 (jevy A a B jsou sluitelné) Pravdpodobnost, že muž ve vku 40-50 let bude bu kuák, nebo bude mít zvýšenou hladinu celkového cholesterolu, je 0,749.. Pravdpodobnost opaného jevu ( A) k jevu A: P( A) = 1 - P(A) 3. Podmínná pravdpodobnost Je-li výskyt jevu A závislý na výskytu jevu B, potom pravdpodobnost, že nastane jev A, nastal-li jev B, je P( A B) P( A B) = P( B) (Jevy A, B jsou nezávislé, jestliže výskyt jednoho jevu neovliv uje výskyt druhého.) 4. Pravidlo o násobení pravdpodobností Jsou-li jevy A a B nezávislé, potom pravdpodobnost, že nastanou oba jevy souasn je P(A B) = P(A).P(B) Obecn P(A 1 A A k ) = P(A 1 ).P(A ).. P(A k ) 5. Pravidlo o úplné pravdpodobnosti Jsou-li náhodné jevy B i, i =1,,k vzájemn nesluitelné a v každém pokusu nastává práv jeden, tj. k P(B 1 B B k ) = P( B i ) =1, a známe-li podmínné pravdpodobnosti P(A B i ), i= 1 potom k P( A) = P( A Bi ) = i= 1 i= 1 k P( A B ) P( B ) i i 18

Bayesv vzorec Udává jakým zpsobem vypoítat pravdpodobnosti P(B j A), známe-li pravdpodobnosti P(B i ) a P(A B i ) pro všechny jevy B i, i=1,,k. P( B j A) = k P( A B ) P( B ) i= 1 j P( A B ) P( B ) i j i 6.4. Píklad použití Bayesova vzorce Jev A B 1 B osoba je kuák osoba má chronickou bronchitidu osoba nemá chronickou bronchitidu Pravdpodobnost jevu P(B 1 )= 0,40 P(B )= 0,60 P(A B 1 ) = 0,75 P(A B ) = 0,50 pravdpodobnost výskytu osoby s bronchitidou v populaci pravdpodobnost výskytu osoby bez bronchitidy v populaci pravdpodobnost, že osoba je kuák ve skupin s chronickou bronchitidou pravdpodobnost, že osoba je kuák ve skupin bez chronické bronchitidy Pravdpodobnost výskytu chronické bronchitidy u kuáka se vypoítá podle Bayesova vzorce: P( A B1 ) P( B1 ) 0, 75. 0, 40 P( B1 A) = = = 0, 50 P( A B ) P( B ) + P( A B ) P( B ) 0, 75. 0, 40 + 0, 50. 0, 60 1 1 Pravdpodobnost výskytu chronické bronchitidy u kuáka je 0,5. Kontrolní otázky: 1. Definujte pojmy náhodný jev, pravdpodobnost náhodného jevu.. Definujte základní vlastnosti pravdpodobnosti. 3. Uvete pravidlo o sítání pravdpodobnosti. 4. Uvete pravidlo o násobení pravdpodobnosti. 5. Uvete pravidlo o úplné pravdpodobnosti. 19

7. Skríning (screening), diagnostické screeningové testy Screeningové vyšetení má pomoci pi odhalení výskytu nemoci v raném stádiu, tedy nemoci u osob, u kterých zatím nebyla nemoc diagnostikována. Pi screening se používá vhodn zvolený a jednoduchý screeningový test, obvykle klinický nebo laboratorní test nebo jiná procedura. Úelem použití screeningového testu je rozdlit populaci vyšetovaných osob na dv skupiny: osoby s pozitivním výsledkem testu, které jsou s velkou pravdpodobností nemocné a osoby s negativním výsledkem testu, které s velkou pravdpodobností nejsou nemocné. Diagnostické screeningové testy jsou tedy založeny na pedpokladu, že nemocní a zdraví jedinci mohou být pomocí diagnostického testu rozlišeni. Pi použití testu k urení diagnózy mohou nastat 4 možné situace: Pi hodnocení pesnosti diagnostického testu porovnáváme jeho výsledky s tzv. zlatým standardem. Zlatý standard je referenní metoda pro danou diagnózu. Je to ideální vyšetení, které jednoznan rozdlí populaci na nemocné a zdravé. asto se jedná o složité a nákladné nebo rizikové vyšetení (biopsii, použití kontrastní zobrazovací metody, pitvu, ). asté chybní zlatého standardu pro urení nkterých diagnóz mže vést k situaci, kdy je jako standard používán test, který není úpln pesný, ale je v souasné dob považován za nejlepší. Mže dojít také k situaci, kdy je srovnáván jeden špatný test s druhým, nebo paradoxn je nový test prohlášen za špatný i když mže být ve skutenosti lepší než používaný standard. 7.1. Charakteristiky diagnostického (screeningového) testu Pi stanovování charakteristik screeningového testu je vhodné uspoádat si známé skutenosti do obecného schéma: ureno podle zlatého standardu a je poet nemocných osob, u nichž byl test pozitivní (správná pozitivita), c je poet nemocných osob, u nichž byl test negativní (falešná negativita), b je poet osob bez nemoci, u nichž byl test pozitivní (falešná pozitivita), d je poet osob bez nemoci, u nichž byl test negativní (správná negativita). a+c je celkový poet nemocných osob, 0

b+d je celkový poet osob bez nemoci, a+b je celkový poet osob s pozitivním výsledkem testu, c+d je celkový poet osob s negativním výsledkem testu, N = a+b+c+d celkový poet osob, u nichž byl použit screeningový test. Mezi základní charakteristiky screeningových test patí: Senzitivita = pravdpodobnost, že test bude pozitivní u nemocných. Senzitivita = a / (a + c) Specificita = pravdpodobnost, že test bude negativní u osob bez nemoci. Specificita = d / (b + d) Pesnost testu = pravdpodobnost, že test dává správné výsledky Pesnost = (a + d) / N Pozitivní prediktivní hodnota = pravdpodobnost, že osoba je nemocná, když test byl pozitivní. PPV = a / (a + b) Negativní prediktivní hodnota = pravdpodobnost, že osoba nemá sledovanou nemoc, když test byl negativní. NPV = d / (c + d) Charakteristiky screeningových test se asto vyjadují v procentech, tzn., že danou pravdpodobnost násobíme íslem 100 %. Je žádoucí, aby screeningový test byl vysoce senzitivní a vysoce specifický. Toho však v praxi nelze vtšinou dosáhnout. V situaci, kdy se pro stanovení diagnózy používá klinický údaj, který má charakter spojitého znaku (nap. údaj o hladin daného biochemického parametru), je teba zvolit kompromis. V tchto situacích je stanovena tzv. cut-off hodnota (hraniní hodnota), která rozdluje kontinuum hodnot tohoto spojitého znaku na normální a abnormální hodnoty. 7.. Píklad Pedpokládejme, že pro danou diagnózu jsou typické vysoké hodnoty uritého biochemického parametru, který má být použit pro screening. Jako optimální cut-off hodnota byla stanovena hodnota 140. Tzn., že: je-li u osoby namena hodnota vyšší než cut-off = 140, ekneme, že daná osoba má s velkou pravdpodobností sledovanou nemoc, je-li u osoby namena hodnota menší než cut-off = 140, ekneme, že je osoba s velkou pravdpodobností zdravá. Problém je v tom, že i u ásti osob, které jsou ve skutenosti zdravé, namíme hodnoty vyšší než cut-off 140 a naopak u ásti osob, které jsou ve skutenosti nemocné, namíme hodnoty menší než 140. Je teba si uvdomit, že zmnou diskriminaní hranice (cut-off hodnoty) se mní také vzájemný pomr senzitivity a specificity testu: Na obrázku je znázornno rozdlení hodnot biochemického parametru u osob zdravých a osob nemocných. 1

škála hodnot spojitého znaku Pímky kolmé na osu x znázor ují možnou pozici cut-off hodnoty pro tento parametr. Ideální situace by nastala v pípad, kdybychom u všech zdravých osob namily hodnotu menší než cut-off hodnota a u všech osob nemocných hodnotu vtší než daná cut-off hodnota (tj. distribuce na obrázku by byly oddleny). V tomto pípad by byla senzitivita testu, specificita testu i pesnost testu rovna 100 %. 7.3. Faktory ovlivující prediktivní hodnoty Léka v praxi musí rozhodnout, zda pacient má nebo nemá uritou nemoc v závislosti na tom, vyjde-li test pozitivn nebo negativn. Dležitou informaci pro toto rozhodnutí poskytují prediktivní hodnoty testu. Hlavním faktorem, který ovliv uje prediktivní hodnoty je prevalence (tj. výskyt) nemoci v populaci, která je testem vyšetována. Je-li známa prevalence nemoci, poítají se prediktivní hodnoty screeningového testu pomocí vzorc PPV SE. prevalence = SE. prevalence + (1 SP ).(1 prevalence ) NPV = SP.(1 SP.(1 prevalence prevalence ) ) + (1 SE ). prevalence SE senzitivita testu, SP specificita testu Je zejmé, že screeningové testy nejsou vhodné pro urení nemoci, která má v populaci velmi malou prevalenci. 7.4. Píklad: Použijeme-li test s 95% senzitivitou a 95% specificitou k pedpovdi nemoci, která má prevalenci 1%, potom pozitivní prediktivní hodnota PPV=0,16. To znamená, že pouze 16% osob, u kterých byl test pozitivní, je skuten nemocných a 84% nemoc nemá, i když test vyšel pozitivn.

Výpoet: Senzitivita SE = 0,95, specificita SP = 0,95, prevalence = 0,01 Pozitivní prediktivní hodnota PPV = 0,95*0,01/(0,95*0,01+0,05*0,99) = 0,161. 7.5. Píklady screeningových program Prenatální screening vrozených vývojových vad u plodu (nap. diagnostika Downova syndromu). Screening je založen na ultrazvukovém vyšetení plodu, nebo krevních testech. Jako invazivní metoda je používáno vyšetení plodové vody (amniocentéza). Mamografický screening pro záchyt karcinomu prsu. Screening je založen na klinickém vyšetení v prsní poradn a následn na mamografickém vyšetení a ultrazvukovém vyšetení. Screening karcinomu dložního hrdla / dložního ípku založen na mikroskopickém vyšetení cytologického stru. Screening kolorektálního karcinomu je založen na testu na okultní krvácení ve stolici, pípadn kolonoskopickém vyšetení tlustého steva. Screening karcinomu prostaty založen na klinickém vyšetení a zjištní hladiny PSA (prostatického specifického antigenu, hladina > 4,0 indikuje biopsii prostaty). screening hypertenze (realizuje se mením krevního tlaku bžn provádno v ordinacích obvodních léka). 7.6. Píklad: Výpoet základních charakteristik screeningového testu Screeningový test byl použit k diagnostice urité nemoci. Výsledek screeningu byl pozitivní u 50 osob skuten nemocných a u 8 osob zdravých (podle metody zlatého standardu). Podle zlatého standardu byl celkový poet skuten nemocných osob 60 a celkový poet osob zdravých 90. Urete senzitivitu, specificitu, pesnost, pozitivní a negativní prediktivní hodnotu screeningového testu. ešení: 1. Nejdíve vytvoíme tabulku, do které doplníme známé údaje, tj. poet osob s pozitivním výsledkem screeningového testu ve skupin nemocných a ve skupin zdravých a celkový poet nemocných a zdravých osob.. Dopoítáme zbývající údaje v tabulce. metoda zlatého standardu Osoba je nemocná Osoba je zdravá Celkem Pozitivní výsledek testu 50 8 58 Negativní výsledek testu 10 8 9 Celkem 60 90 150 3

3. Podle vzorc vypoítáme všechny charakteristiky screeningového testu Výsledky pravdpodobnost procento Senzitivita 50/60 = 0,8333 83,3 % Specificita 8/90 = 0,9111 91,1 % Pesnost (50+8)/150 = 0,8800 88,0 % Pozitivní prediktivní hodnota 50/58 = 0,861 86, % Negativní prediktivní hodnota 8/9 = 0,8913 89,1 % Všechny parametry screeningového testu jsou vyšší než 80%. Senzitivita testu je 0,833 (resp. 83,3%), to znamená, že test vyjde pozitivn u 83,3% skuten nemocných osob a u 16,7% osob dává test falešn negativní výsledek. Specificita testu je 0,911 (resp. 91,1%), to znamená, že test vyjde negativn u 91,1% osob skuten zdravých a u 8,9% zdravých osob dává test falešn pozitivní výsledek. Pesnost testu je 0,880 (resp. 88,0%) tzn., že test dává správné výsledky (je správn pozitivní nebo správn negativní) u 88% osob a u 1% osob dává test chybný výsledek. Pozitivní prediktivní hodnota testu je 0,86 (86,%). To znamená, že 86,% osob, u kterých byl test pozitivní, je skuten nemocných a 13,8% nemoc nemá, i když test vyšel pozitivn. Negativní prediktivní hodnota testu je 0,891 (89,1%). To znamená, že 89,1% osob, u kterých byl test negativní, je skuten zdravých a 10,9% je nemocných, i když test vyšel negativn. Kontrolní otázky: 1. Definujte pojem screeningový test.. Uvete základní charakteristiky screeningových test. 3. Uvete konkrétní píklady screeningových program. 4. Senzitivitu a specificitu screeningového testu podle zadaných údaj: 5. Výsledek screeningu byl negativní u 0 osob skuten nemocných a u 160 osob zdravých (podle metody zlatého standardu). Celkový poet skuten nemocných osob (podle zlatého standardu) byl 140 a celkový poet osob zdravých byl 190. 8. Náhodná veliina a rozdlení pravdpodobnosti Za náhodnou veliinu považujeme promnnou, jejíž hodnota je jednoznan urena výsledkem náhodného pokusu. Hodnotu náhodné veliiny není možné jednoznan urit ped provedením pokusu. Jak asto urité hodnoty náhodné veliiny nastávají lze popsat pomocí rozdlení pravdpodobnosti. Rozdlení pravdpodobnosti je pedpis, který uruje vztah mezi možnými hodnotami náhodné veliiny x i a jim píslušejícími pravdpodobnostmi p i = P(X = x i ). Rozdlení pravdpodobnosti bývá zadáno tabulkou: Platí. Poet možných hodnot (n) mže být konený nebo nekonený. 4

8.1. Typy náhodných veliin Podle toho, jakých hodnot náhodné veliiny nabývají, je dlíme na: 1) Diskrétní náhodné veliiny jsou definovány pouze v jednotlivých (diskrétních) hodnotách na omezeném nebo neomezeném intervalu. Popisují se pomocí: - rozdlení pravdpodobnosti, - distribuní funkce F(x). ) Spojité náhodné veliiny jsou definovány na všech možných hodnotách v intervalu - až +, nebo na omezeném intervalu a, b. Popisují se pomocí: - rozdlení pravdpodobnosti tzv. hustoty pravdpodobnosti f(x), - distribuní funkce F(x). Distribuní funkce je kumulativní pravdpodobnost. Pro každé x udává pravdpodobnost s jakou náhodná veliina X nabude hodnot menších nebo rovno x F(x) = P(X x) Pro diskrétní veliinu lze distribuní funkci zapsat jako souet pravdpodobností: F ( x) = P( x ) x x i P (x 1 X < x ) = F(x ) F(x 1 ) Pro spojitou veliinu platí: x F ( x) = f ( x) d( x) P(a X < b) = F(b) - F(a). i Graficky lze vztah mezi hustotou pravdpodobnosti a distribuní funkcí zobrazit následovn: Distribuní funkce (plocha pod kivkou hustoty pravdpodobnosti) Hustota pravdpodobnosti 5

8.. Základní typy rozdlení pravdpodobnosti Rozdlení pro diskrétní náhodnou veliinu: Rovnomrné, Binomické, Poissonovo, Alternativní, Hypergeometrické, Rozdlení pro spojitou náhodnou veliinu: Normální, Exponenciální, Rovnomrné, Studentovo, Weibullovo, Fischer-Snedecorovo, χ² rozdlení (chí-kvadrát rozdlení), 8.3. Modely rozdlení pravdpodobnosti pro diskrétní veliiny Rovnomrné rozdlení nejjednodušší pípad diskrétního rozdlení, piazuje všem hodnotám náhodné veliiny stejnou pravdpodobnost Píklad Hod hrací kostkou pravdpodobnost padnutí každého z ísel je stejná, tj. 1/6). Binomické rozdlení Uvažujme n nezávislých pokus, v každém pokusu mže sledovaný jev bu nastat s pravdpodobností p nebo nenastat s pravdpodobností 1- p. Pravdpodobnost, že jev nastane práv v k pokusech z n, se vypoítá podle vzorce Píklad Pedpokládejme, že pravdpodobnost narození dívky je 0,49. Jaká je pravdpodobnost, že mezi temi dtmi v rodin je práv jedna dívka? n = 3, k = 1, p = 0,49 Pravdpodobnost, že mezi temi dtmi v rodin je práv jedna dívka, je p = 0,38. 6

Jaká je pravdpodobnost, že mezi temi dtmi v rodin jsou práv dv dívky? 3 1 P ( X = ) = 0,49.0,51 = 3. 0,401. 0,51 = 0,367 Jaká je pravdpodobnost, že mezi temi dtmi v rodin není žádná dívka? 3 0 3 3 P ( X = 0) = 0,49.0,51 = 1. 1. 0,51 = 0,133 0 Píklad - Pravdpodobnostní rozložení potu chlapc v rodin se tymi dtmi. ešení: Je-li pravdpodobnost narození dívky p = 0,49, potom pravdpodobnost narození chlapce p = 1-0,49 = 0,51. V rodin se 4 dtmi mže být celkový poet chlapc: 0, 1,, 3 nebo 4. Pravdpodobnost, že v rodin se 4 dtmi není žádný chlapec: n = 4, k = 0, pravdpodobnost narození chlapce p = 0,51 P ( X 4 0 = = 0 ) 4! 0!4! 4 = 0,51 0 = 1 0 (1 0,51) 4 = 1.1.0,49 0,0576 Pravdpodobnost, že v rodin se 4 dtmi není žádný chlapec je: P(X = 0 chlapc ) = 0,058 Pravdpodobnost, že v rodin se 4 dtmi je 1 chlapec je: P(X = 1 chlapec) = 0,4. Pravdpodobnost, že v rodin se 4 dtmi jsou chlapci je: P(X = chlapci) = 0,37. Pravdpodobnost, že v rodin se 4 dtmi jsou 3 chlapci je: P(X = 3 chlapci) = 0,6 Pravdpodobnost, že v rodin se 4 dtmi jsou 4 chlapci je: P(X = 4 chlapci) = 0,07 4 = 7

Pro p = 0,5 je binomické rozdlení symetrické, pro jiné hodnoty p je asymetrické Poissonovo rozdlení Používá se pro jevy, které mají malou pravdpodobnost výskytu ( vzácné jevy nap. mutace genu, poet nehod za danou jednotku asu, poet pacient pijatých pi noní služb na chirurgickém oddlení, atd.). Uvažujme náhodnou veliinu X, která pedstavuje poet výskyt vzácné události v daném asovém intervalu. X mže nabývat celoíselných hodnot od 0 do +. Pravdpodobnost, že vzácných událostí nastane v daném ase práv k, je kde λ je konstanta, která oznauje prmrný poet událostí (nap. v ase), e =,718 matematická konstanta. je Píklad použití Poissonova rozdlení Uvažujme jako vzácnou událost hospitalizaci pacienta s ischemickou chorobou srdení (ICHS) po chirurgickém zákroku. Sledujeme celkem 00 pacient s ICHS a zajímá nás pravdpodobnostní rozdlení potu hospitalizací u tchto pacient v prbhu 3 let. Víme, že prmrný poet hospitalizací na jednoho pacienta: 30 /00 = 1,6 = λ. Uvažujme k = 0, 1,, 3, 4, 5 hospitalizací. Dosazením do vzorce za λ = 1,6 a k = 0,1,,,5, postupn dostaneme následující pravdpodobnosti: Pravdpodobnost, že bhem 3 let nedojde k hospitalizace vbec je: P(X = 0 hospitalizací) = 0,0. Pravdpodobnost, že bhem 3 let dojde k hospitalizaci jednou je: 8

P(X = 1 hospitalizace) = 0,3. Pravdpodobnost, že bhem 3 let dojde k hospitalizaci krát je: P(X = hospitalizace) = 0,6. Pravdpodobnost, že bhem 3 let dojde k hospitalizaci 3krát je: P(X = 3 hospitalizace) = 0,14. Pravdpodobnost, že bhem 3 let dojde k hospitalizaci 4krát je: P(X = 4 hospitalizace) = 0,06. Pravdpodobnost, že bhem 3 let dojde k hospitalizaci 5krát je: P(X = 5 hospitalizací) = 0,0. Rozdlení pravdpodobnosti potu hospitalizací 8.1. Model rozdlení pro spojité veliiny Normální (Gaussovo) rozdlení S normálním rozdlením se setkáváme u veliin popisujících nap. výsledky biochemického vyšetení. Hustota pravdpodobnosti náhodné veliiny X má tvar π = 3,141 a e =,718 jsou matematické konstanty, x (-,+). µ a σ jsou parametry urující polohu kivky na ose X a její tvar (roztažení podél osy). 9

Graf hustoty pravdpodobnosti normálního rozdlení pi rzném µ a stejném σ pi stejném µ a rzném σ Pro rzné µ a stejné σ jsou kivky totožné, liší se pouze posunutím. Pro stejné µ a rzné σ jsou kivky odlišné, vrchol všech kivek však leží nad stejnou hodnotou (µ). Hustota normálního rozdlení je symetrická jednovrcholová kivka zvonovitého charakteru, která nikde neprotíná osu X. Parametr µ (populaní prmrná hodnota) uruje polohu vrcholu, parametr σ (populaní smrodatná odchylka hodnot) uruje roztažení kivky podél osy. Plocha pod kivkou hustoty normálního rozdlení je rovna jedné. Distribuní funkce normálního rozdlení veliiny X Graf distribuní funkce normálního rozdlení pro stejný parametr µ (=0) a rzný parametr σ. 30

Normované normální rozdlení Je to rozdlení pro standardizovanou náhodnou veliinu. Je definováno hustotou pravdpodobnosti kde x (-,+). Parametry rozdlení normovaného normálního rozdlení µ = 0 a σ = 1 Popisné statistiky kvalitativní data Základním popisným nástrojem pro data kvalitativní je etnostní (frekvenní) tabulka, která popisuje rozdlení (distribuci) etností v jednotlivých kategoriích kvalitativního znaku. Vlastnosti normální distribuce Podle tvaru distribuce rozeznáváme, zda je distribuce symetrická nebo asymetrická. Vtšina distribucí v medicín je symetrická. Je-li asymetrická, jde vtšinou o distribuci šikmou doprava. Vtšina distribucí je také jednovrcholová (unimodální), distribuce vícevrcholová je vtšinou zpsobena nehomogenitou dat. Píklad Distribuce utonulých podle vku je dvouvrcholová 1. vrchol: batolata a dti do 4 let vku,. vrchol: dospívající (výskyt v dosplosti je mén astý). Píklad: Distribuce symetrická, jednovrcholová tlesná výška 35% 30% 5% 0% 15% 10% 5% 0% Distribuce tlesné výšky muž ve vku 40 let 160-164 pod 159 165-169 185-189 180-184 175-179 170-174 nad 194 190-194 tlesná výška [cm] 31

Píklad: Distribuce šikmá doprava tlesná hmotnost % 0% 18% 16% 14% 1% 10% 8% 6% 4% % 0% Distribuce tlesné hmotnosti muž ve vku 40 let 75-79,5 65-69,5 pod 60 95-99,5 85-89,5 135-139,5 15-19,5 115-119,5 105-109,5 145-149,5 tlesná hmotnost [kg] Pro normální rozložení hodnot meného kvantitativního znaku dále platí: a) 68,3% hodnot leží v intervalu µ ± 1σ b) 95,4% hodnot leží v intervalu µ ± σ c) 99,7% hodnot leží v intervalu µ ± 3σ. Koeficient šikmosti je míra symetrie kolem stední hodnoty, poítá se podle vzorce n 1 ( x x) i S = 3 n i = 1 s 3 Hodnoty koeficientu kolem 0 znamenají, že je distribuce symetrická. Hodnoty koeficientu > 0 znamenají distribuci sešikmenou doprava, hodnoty koeficientu < 0 znamenají sešikmení doleva. Pozice prmru a mediánu u symetrické distribuce a sešikmených distribucí symetrické rozdlení S > 0 sešikmení doprava S < 0 sešikmení doleva 3

Koeficient špiatosti Je míra koncentrace kolem stední hodnoty, poítá se podle vzorce n 1 ( x x) i K = 4 n i = 1 s 4 3 Hodnoty koeficientu kolem 0 znamenají, že distribuce normální. Hodnoty koeficientu > 0 znamenají, že je distribuce špiatjší než normální distribuce, hodnoty koeficientu < 0 znamenají, že je distribuce plošší než normální distribuce. Normální rozdlení Špiaté rozdlení Ploché rozdlení K > 0 špiatjší než normální distribuce K < 0 plošší než normální distribuce Exponenciální rozdlení Exponenciální rozdlení pravdpodobnosti se používá pro vyjádení doby ekání na výskyt njakého jevu. Hustota pravdpodobnosti exponenciálního rozdlení má tvar Distribuní funkce exponenciálního rozdlení parametr δ je stední doba ekání na výskyt jevu. Graf hustoty exponenciálního rozdlení Graf distribuní funkce 33

Kontrolní otázky: 1. Definujte pojmy náhodná veliina, rozdlení pravdpodobnosti náhodné veliiny.. Definujte základní typy náhodných veliin a vyjmenujte známé typy rozdlení pravdpodobnosti náhodných veliin. 3. Uvete píklad použití binomické pravdpodobnosti. 4. Jaké parametry urují tvar normální distribuce. 5. Jaký vztah je mezi prmrnou hodnotou a mediánem u doprava zešikmené distribuce. 9. Popisné charakteristiky kvalitativní data etnostní (frekvenní) tabulka Základním popisným nástrojem pro data kvalitativní je etnostní (frekvenní) tabulka, která popisuje rozdlení (distribuci) etností v jednotlivých kategoriích kvalitativního znaku. Píklad Kvalita spolupráce s pacientem pi vyšetení Kvalita spolupráce výborná velmi dobrá prmrná spíše s obtížemi Celkem etnost Procenta 13 1,7 6 43,3 16 6,7 5 8,3 60 100,0 etnost (absolutní etnost) je poet pacient zaazených do dané kategorie. Procenta (relativní etnost) je poet pacient v dané kategorii vztažený k celkovému potu pacient. V tabulce je relativní etnost vyjádena v procentech (je vynásobena 100). Zobrazujeme-li údaje v etnostní tabulce graficky, používáme zpravidla relativní etnosti v procentech. Graf popisující distribuci etností v jednotlivých kategoriích meného znaku 50 40 Kvalita spolupráce s pacientem 43,3 procento 30 0 1,7 6,7 10 8,3 0 výborná velmi dobrá prmrná s obtížemi 34