Klinický výzkum odpovědi
Statistická šetření - PROČ? Žádná věda není skutečnou vědou, není-li podložena matematickými principy. (L.da Vinci)
Statistická šetření - na kom / čem? statistické jednotky (S.J.) 1 respondent (pacient, proband) 1 krevní vzorek 1 nemocnice populace = stanovení všech S.J. konečná (např. demograficky) nekonečná (hypotetická např. všechny potenciální krevní vzorky)
Příklady statistických šetření úplné lze jen v konečné populaci, i tak bývá dlouhé a drahé (SLBD) výběrové jen na náhodně vybraných S.J., či vybraných jinak, ale aby byla zajištěna reprezentativnost (tj. poměrné zastoupení důležitých podskupin ve výběru musí kopírovat jejich poměrné zastoupení v celé populaci)
NEREPREZENTATIVNOST
NEREPREZENTATIVNOST
NEREPREZENTATIVNOST
REPREZENTATIVNOST
REPREZENTATIVNOST
REPREZENTATIVNOST
Proč výběrová šetření realizujeme? odhad pro neznámý populační parametr = =neznámá číselná charakteristika celé populace pravděpodobnost střední hodnota = populační průměr Př: Pravděpodobnost výskytu rakoviny plic u kuřáků její odhad? Př: Střední hodnota LDL cholesterolu u pacientů s kardiovaskulárním onemocněním její odhad? (příp.jiné úkoly např. ověření rozdílností mezi podpopulacemi či závislostí mezi veličinami)
Typy výběrových šetření ANKETA obvykle ústní zjišťování na malém vzorku dotázaných spíše orientační, např. pro média - nebývá reprezentativní! lze použít při pilotním odzkoušení Př: Názor občanů na situaci ve zdravotnictví
Typy výběrových šetření PRŮZKUM (SEARCH) slouží ke zjišťování a popisu (deskripci) dané situace na reprezentativním vzorku populace, obvykle bez ambice zkoumat / analyzovat hlubší příčiny či možné důsledky obvykle měkká data (názory apod. zjišťované dotazníkem) Př.: Průzkum spokojenosti pacientů dané nemocnice
Typy výběrových šetření VÝZKUM (RESEARCH) nejen deskripce, i ANALÝZA (příčin/důsledků) pokud měkká data : kvalitativní výzkum pokud číselná data (výsledky měření, laboratorních testů apod.): kvantitativní výzkum v obou typech nutná opět reprezentativnost obvykle pro větší populace Př.: Výzkum příčin kardiovaskulárních onemocnění v české populaci
TYPY VELIČIN a) textové - otevřené pokud odpovědí je volný text Př.: Popište, jak se cítíte po zákroku. nelze zpracovat automaticky b) textové uzavřené (kategoriální) výběr z předem připravených variant Př.: Pohlaví M Ž lze zpracovat automaticky; někdy musí být varianty odpovědí pečlivě promýšleny
TYPY VELIČIN c) číselné diskrétního typu pokud odpovědí je jen spočetný počet číselných hodnot Př.: Počet provedených re-operací u daného pacienta. (možnosti: 0,1,2, ) d) číselné spojitého typu odpověď = jakékoli reálné číslo Př.: Tělesná teplota pacienta.
TYPY VELIČIN POZNÁMKY 1. Kategoriální veličiny se někdy dál dělí na nominální (neuspořádané) Př.: Typ léčby (pokud lze daného pacienta léčit jedním z např. 4 možných postupů) ordinální (uspořádané) Př.: Míra bolestivosti zákroku (např. s možnostmi: nebolí vůbec < bolí snesitelně < nesnesitelná bolest)
TYPY VELIČIN POZNÁMKY 2. Číselné údaje lze někdy zaznamenávat různě: Např. veličinu tělesná teplota lze zaznamenat: Jako veličinu spojitého typu jak v dotazníku? Uveďte naměřenou teplotu ( C) Jako ordinální kategoriální veličinu jak v dotazníku? kategorie 1 do 37 C; kategorie 2 37-40 C; kategorie 3 více než 40 C
TYPY VELIČIN POZNÁMKY 3. Proč je důležité rozlišovat typy veličin? každý typ má svůj specifický způsob zpracování Př.: Průměrnou hodnotu má smysl počítat u číselných veličin, ale určitě ne u nečíselných (např. u veličiny nominálního typu barva očí s možnostmi 1=modrá, 2=zelená, 3=hnědá, 4=jiná, nemá smysl počítat průměrnou barvu )
Charakteristiky kategoriálních veličin Data (a zpracování) v programu MS EXCEL Identifikátor Veličina kategoriální (1-4)
Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY)
Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY)
Na samostatné procvičení: Data vpravo zaznamenávají výsledky dotazování 14 studentů, kteří patřili do některého ze studijních oborů, kódovaných 1=fyzioterapie, 2=ergoterapie, 3=ostatní. Data si přepište do Excelu a pomocí příkazu =ČETNOSTI připravte tabulku četností, obsahující počty studentů v každé z uvedených tří kategorií.
Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY)
Charakteristiky kategoriálních veličin Relativní četnosti
Charakteristiky kategoriálních veličin Relativní četnosti
Charakteristiky kategoriálních veličin Relativní četnosti
Charakteristiky kategoriálních veličin Relativní četnosti VÝZNAM REL.ČETNOSTÍ? HODNOTA JEJICH SUMY?
Charakteristiky kategoriálních veličin Grafické znázornění četností SLOUPCOVÝ GRAF
Charakteristiky kategoriálních veličin Grafické znázornění četností SLOUPCOVÝ GRAF
Charakteristiky kategoriálních veličin Grafické znázornění četností SLOUPCOVÝ GRAF
Charakteristiky kategoriálních veličin Grafické znázornění četností VÝSEČOVÝ GRAF
Charakteristiky kategoriálních veličin Grafické znázornění četností VÝSEČOVÝ GRAF
Charakteristiky kategoriálních veličin MODUS je ta hodnota (kategorie), která se v datech vyskytla nejčastěji; pozná se tak, že je u ní nejvyšší četnost (absolutní či relativní); určení pomocí sloupcového / výsečového grafu? Poznámka skloňování: modus, modu,, modem Př: Pro veličinu léčba je modem (modální hodnotou) kategorie 2. Jinak řečena, typ léčby označený č.2 se vyskytl u největšího počtu pacientek (bráno absolutně i relativně).
Charakteristiky kategoriálních veličin ČETNOSTI poznámka: SOUČET ABS.ČETNOSTÍ = POČET STAT.JEDNOTEK! nemusí platit v případě multiple responses! Př.: Dotázaných 20 respondentů uvádělo, z jakého zdroje se dozvěděli o možnosti preventivního vyšetření na daný typ karcinomu, možnosti byly: 1. z internetu 2. z tisku 3. od lékaře 4. jinak 5. nedozvěděl(a) jsem se o tom; odpověď 1 2 3 4 5 suma četnost 6 4 8 5 6 29 Jaktože součet nečiní 20, ale 29?
Multiple responses pokračování příkladu
Dotazník KVALITAT.VÝZKUM Používat STANDARDIZOVANÉ DOTAZNÍKY (již ve výzkumu použité) Likertova škála (*1932) = výroky, respondent volí z 5bodové škály (obvykle): * zcela nesouhlasím * spíše nesouhlasím * nevím (lze vynechat) * spíše souhlasím * zcela souhlasím
Dotazník KVALITAT.VÝZKUM Nebo jiný příklad škály (právě ze stand.dotazníku):
Dotazník KVALITAT.VÝZKUM
Př: BP (2013) 15 položek za účelem zjištění, nakolik těhotné ženy s diagnózou GDM dodržují zdravý životní styl (n=80) položky např. Dodržuji velmi striktně dietní omezení Stravuji se v pravidelných intervalech Mé těhotenství provází množství stresových situací 4-stupňová škála ano ; spíše ano ; spíše ne ; ne (proč 3.položka červeně? reverze )
A) Zpracování item-by-item : Např. položka č.1 Abs.četnost Rel.četnost Ano 28 35,0 % Spíše ano 28 35,0 % Spíše ne 18 22,5 % Ne 6 7,5 % CELKEM 80 100,0 %
B) Souhrnné zpracování: Kódování ano = 1 spíše ano = 2 spíše ne = 3 ne = 4 čím vyšší hodnota, tím větší provinění proti zásadám zdravého životního stylu (reverzní!) Př. (12 respondentek, 8 položek)
Charakteristiky kategoriálních veličin ČETNOSTI PRO DVOJICI KATEGORIÁLNÍCH VELIČIN: KONTINGENČNÍ TABULKA
Charakteristiky kategoriálních veličin ČETNOSTI PRO DVOJICI KATEGORIÁLNÍCH VELIČIN: KONTINGENČNÍ TABULKA
Charakteristiky kategoriálních veličin ČETNOSTI PRO DVOJICI KATEGORIÁLNÍCH VELIČIN: KONTINGENČNÍ TABULKA
Charakteristiky kategoriálních veličin ČETNOSTI PRO DVOJICI KATEGORIÁLNÍCH VELIČIN: KONTINGENČNÍ TABULKA
Charakteristiky kategoriálních veličin ČETNOSTI PRO DVOJICI KATEGORIÁLNÍCH VELIČIN: KONTINGENČNÍ TABULKA Význam žlutých hodnot? Význam čísel 110, 160 a 200?
Poznámka pozor na PROCENTA Pozor při určování relativních hodnot z tabulky: např. a) 85/200 = 42,5 % (200 = počet všech dětí) b) 85/110 = 77,3 % (110 = počet všech chlapců) c) 85/160 = 53,1 % (160 = počet všech dětí v normě) Různé výpočty, tudíž různé interpretace: a) Mezi všemi dětmi tvořili chlapci v normě 42,5 %. b) Mezi všemi chlapci tvořili ti v normě 77,3 %. c) Mezi dětmi v normě tvořili chlapci 53,1 %.
Jak by měla vypadat např. kontingenční tabulka znázorňující znalost 50 respondentů před edukací a po ní (tzv. párový design)? Jde o tabulku vpravo, nebo ji musíme předělat a jak? znali neznali před edukací 12 38 po edukaci 40 10 Př. ( domácí úkol k samostatnému procvičení): V průzkumu byli rozlišování ne/kuřáci dle pohlaví, viz tabulka. Určete v procentech podíl a) žen mezi kuřáky b) kuřáků mezi ženami c) kuřaček mezi všemi dotázanými počty: nekuřáci kuřáci muži 33 27 ženy 19 21
Charakteristiky číselných veličin u veličin číselných - diskrétních lze (stejně jako u veličin kategoriálních) určovat četnosti; každá hodnota je pak vlastně samostatnou kategorií u veličin číselných - spojitých obvykle nemívá smysl četnosti určovat (tyto veličiny nabývají obvykle příliš mnoha navzájem různých hodnot) u obou typů lze ale určovat kvantily (medián) a momenty (průměr, rozptyl - resp. jeho odmocninu, tzv. směrodatnou odchylku)
Charakteristiky číselných veličin Identifikátor Veličina diskrétní a spojitá
Charakteristiky číselných veličin PRŮMĚR (AVERAGE; MEAN)
Charakteristiky číselných veličin PRŮMĚR (AVERAGE; MEAN)
Charakteristiky číselných veličin SMĚRODATNÁ ODCHYLKA
Charakteristiky číselných veličin SMĚRODATNÁ ODCHYLKA
Charakteristiky číselných veličin Interpretace výsledků? veličina VĚK typické hodnoty se nacházely v rozmezí (po zaokrouhlení): 35,9 ± 11,4 = 24,5 až 47,3 veličina POČET DĚTÍ typické hodnoty v rozmezí (po zaokrouhlení): 1,6 ± 1,4 = 0,2 až 2,9 = 0 až 3
Charakteristiky číselných veličin KRABIČKOVÝ GRAF (ne Excel )
Charakteristiky číselných veličin KRABIČKOVÝ GRAF (ne Excel )
Charakteristiky číselných veličin MEDIÁN (50% KVANTIL)
Charakteristiky číselných veličin MEDIÁN (50% KVANTIL)
Charakteristiky číselných veličin Interpretace mediánu? veličina VĚK polovina (50 %) dotázaných byla ve věku nejvýše 33,5 roku (tj. 33,5 nebo mladší) veličina POČET DĚTÍ polovina (50 %) dotázaných uvedla nejvýše 1 dítě (tj. měli 1 dítě, nebo byli bezdětní)
ČASOVÉ ŘADY = záznam ukazatele (číselného) v čase specifikace věcná a místní (co, kde) typy např. : ČŘ okamžiková versus intervalová Př: Počty zaměstnanců X novotvarů (k danému okamžiku) (za dané období)
ČASOVÉ ŘADY oficiální data statistika ze slova stát (tj. pro stát důležité infce) důležité weby: http://www.czso.cz/ http://www.uzis.cz/
ČASOVÉ ŘADY pojmy Počty převáděné na relativní hodnoty: Morbidita (nemocnost) - demografické ukazatele Incidence = poměr nově vzniklých případů onemocnění v daném časovém období k celkovému počtu osob ve sledované ( exponované ) populaci Prevalence (obecné rozšíření) = poměr počtu všech existujících případů (tj. bez ohledu na dobu jejich vzniku) daného onemocnění k počtu obyvatel v dané lokalitě ve sledovaném časovém období
ČASOVÉ ŘADY graf Vývoj ČŘ (např. data ÚZIS) lze zobrazit spojnicovým ( čárovým ) grafem (výběr =jen data), pak osa x=pořadová čísla (dodatečně lze na osu x roky doplnit); nebo grafem bodovým (výběr=roky+data) Př: Počty novotvarů hlášených za každý rok (1995-2008) v Ústeckém kraji
ČASOVÉ ŘADY graf
ČASOVÉ ŘADY graf Upozornění ke zpracování: Pokud váš ukazatel obsahuje desetinná čísla, DPS výstup oddělí desetinná místa dle anglické konvence TEČKOU; pro Excel PŘED vytvářením grafu proto musíte nejdřív všechny tyto tečky nahradit "českou" desetinnou čárkou, jinak může být v Excelu problém s rozpoznáním číselných hodnot a graf by se nemusel zobrazovat vůbec (nebo chybně). Náhradu je nejjednodušší provést po překopírování tabulky do Wordu; klávesová zkratka Ctrl+H:
ČASOVÉ ŘADY DÚ č.2 V tabulkách níže najde každý dle svého STAGového čísla příslušné zadání: vždy číslo DPS ukazatele a zkratku požadovaného regionu (kdo se v tabulce dle svého STAG číslo nenajde, kontaktuje mě e- mailem). Z databáze ÚZIS získejte časovou řadu údajů za všechny roky, které jsou v ní k dispozici, převeďte ji do Excelu (příp. využijte jiný podobný tabulkový editor) a zde vytvořte graf své řady, v němž na vodorovné ose budou znázorněny jednotlivé roky, nikoliv jen jejich pořadová čísla; graf by tedy měl vypadat podobně jako graf na snímku nadepsaném ČASOVÉ ŘADY - graf (viz dva snímky zpět). Excelovský soubor, v němž bude pohromadě jak tabulka, tak z ní vytvořený graf, si uložte, přičemž jako název zvolte své STAG číslo (např. tedy soubor D16111.xlsx) a pošlete mi jej jako přílohu e- mailu opět na mou e-adresu do 12. 1. 2018. Jako subjekt zprávy uveďte DU2 KOPA, v samotném textu e-mailu není už nutno uvést nic, jen pro kontrolu své příjmení. Po kontrole tohoto druhého úkolu vám udělím zápočet do STAGu (nezapomeňte mě následně vyhledat kvůli zápisu do indexu, což je nutno do konce aktuálního akademického roku). Neúspěšné budu informovat e-mailem, co a jak je ještě případně potřeba opravit. student D16165 D16166 D16167 D16168 D16169 D16170 D16171 D16172 D16173 D16174 ukazatel 1042 1083 1102 1110 1241 1300 1042 1083 1102 1110 region PHA STC JHC PLZ KAR UST LIB HRA PAR VYS student D16175 D16176 D16177 D16178 D16180 D16181 D16182 D16183 D16184 D16185 ukazatel 1241 1300 1042 1102 1083 1102 1110 1241 1300 1042 region JHM OLO ZLI MSK PHA STC JHC PLZ KAR UST student D16186 D16188 D16189 D16190 D16191 D16192 D16193 D16194 D16285 D17180 ukazatel 1083 1102 1110 1241 1042 1083 1102 1110 1241 1300 region LIB HRA PAR VYS STC JHC PLZ KAR UST LIB