VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Zadání 11 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL 2: DOMÁCÍ ÚKOL 3: DOMÁCÍ ÚKOL 4: CELKEM: --------------------- HODNOCENÍ Ostrava, AR 2015/2016
Popis datového souboru V datovém souboru endoprotezy_11.xlsx se nachází údaje o bolesti pacientů po totální endoprotéze kyčelního, kolenního nebo ramenního kloubu během nultého a prvního pooperačního dne. Bolest pacientů byla zaznamenávána pomocí škály VAS (Visual Analog Scale), každý pacient v pravidelných intervalech zaznamenával, jakou právě cítí bolest na škále od 0 do 10, kde 0 je žádná bolest a 10 maximální možná bolest. V datovém souboru je pro každého pacienta uveden průměr hodnot bolesti zaznamenaných během nultého pooperačního dne a průměr hodnot bolesti zaznamenaných během prvního pooperačního dne. Dále je uvedeno, kterou ze tří typů operací pacient absolvoval, a zda se jedná o muže nebo ženu. Obecné pokyny: Portfolio domácích úkolů budete odevzdávat postupně. Tj. nejdříve odevzdáte titulní stránku + úkol 1, následně doplníte úkol 2, atd. Jednotlivé domácí úkoly odevzdávejte vždy v termínu, který určil váš cvičící. Domácí úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do domácích úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690.
Úkol 1 a) Prezentujte strukturu datového souboru podle pohlaví pacienta (muž / žena) a podle typu endoprotézy (kyčelní kloub / kolenní kloub / ramenní kloub). Uveďte tabulku sdružených četností a výsledky vhodným způsobem vizualizujte. b) Srovnejte na základě explorační analýzy hodnoty bolesti pacientů po absolvování jednotlivých typů operací (endoprotéza kyčelního / kolenního / ramenního kloubu) během nultého pooperačního dne. Data prezentujte graficky (histogram, vícenásobný krabicový graf) a doplňte následující tabulky a text. Tab. 1: Výběrové charakteristiky průměrné bolesti podle VAS u mužů a žen po totálních endoprotézách kloubů dolních končetin Míra bolesti Kyčelní kloub počet pacientů Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost Kolenní kloub Ramenní kloub po odstranění odlehlých pozorování Kyčelní kloub Kolenní kloub Ramenní kloub Identifikace odlehlých pozorování - vnitřní hradby dolní mez horní mez
Grafická prezentace sledovaného statistického znaku (vícenásobný krabicový graf + histogramy, resp. odhady hustoty pravděpodobnosti): Průměrná bolest pacientů během 0. pooperačního dne po totálních endoprotézách Byly analyzovány záznamy o průměrné bolesti u pacientů ( po endoprotéze kyčelního kloubu, kolenního kloubu a ramenního kloubu) během nultého pooperačního dne (viz Tab. 1). Kyčelní kloub bolest během 0. pooperačního dne Míra bolesti (vyjádřena indexem VAS) pacientů po endoprotézách kyčelního kloubu se pohybovala v rozmezí od do. Hodnoty ležící mimo interval od do byly identifikovány jako odlehlá pozorování a příslušní pacienti byli z dalšího zpracování vyřazeni. Níže uvedené výsledky tedy pocházejí z analýzy datového souboru o rozsahu pacientů. Průměr míry bolesti byl a směrodatná odchylka. U poloviny pacientů byla hodnota bolesti nižší než. (Podrobněji: U čtvrtiny pacientů byla hodnota bolesti nižší než, u čtvrtiny pacientů vyšší než.) Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality míry bolesti u pacientů po endoprotézách kyčelních kloubů během 0. pooperačního dne na základě explorační analýzy Na základě grafického zobrazení (viz ) a výběrové šikmosti a špičatosti (viz Tab. 1, výběrová šikmost i špičatost leží / neleží v intervalu 2; 2 ) lze / nelze předpokládat, že bolest pacientů po endoprotézách kyčelních kloubů má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že u 95% / více než 75% pacientů bude během 0. pooperačního dne míra bolesti v rozmezí až.
Úkol 2 Srovnejte změnu bolesti mezi 0. a 1. pooperačním dnem u pacientů po endoprotézách kyčelních a kolenních kloubů. a) Změnu bolesti u obou skupin pacientů vhodným způsobem graficky prezentujte. b) Určete 95% intervalové odhady střední změny bolesti (resp. mediánu změny bolesti) pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušných intervalových odhadů.)
c) Čistým testem významnosti ověřte, zda je pozorovaný průměrný nárůst bolesti statisticky významný na hladině významnosti 5%. Test proveďte pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.) d) Pokud je to možno, určete 95% intervalový odhad rozdílu středních hodnot nárůstů bolesti srovnávaných skupin pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušného intervalového odhadu.) e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) nárůstů bolesti u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.)
Úkol 3 Srovnejte míru bolesti pacientů během 0. pooperačního dne po endoprotézách kyčelních, kolenních a ramenních kloubů pomocí exaktních metod statistické indukce. Využijte výsledků získaných v úkolu 1. a) Ověřte normalitu bolesti u všech tří skupin pacientů (empiricky i exaktně). b) Ověřte homoskedasticitu (shodu rozptylů) bolesti u všech tří skupin pacientů (empiricky i exaktně). c) Určete 95% intervalové odhady střední hodnoty (resp. mediánu) bolesti u srovnávaných skupin pacientů. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.)
d) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) bolesti u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. Pokud ano, zjistěte, zda lze některé skupiny pacientů označit (z hlediska bolesti během 0. pooperačního dne) za homogenní. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.)
Úkol 4 Analyzujte závislost mezi pohlavím pacientů a typem absolvované operace. a) Ověřte, zda existuje závislost mezi pohlavím pacienta a typem absolvované operace (endoprotéza kyčelního / kolenního / ramenního kloubu) pomocí Chí-kvadrát testu nezávislosti. Nezapomeňte ověřit předpoklady pro použití testu. b) Pomocí vhodné asociační tabulky prezentujte vliv pohlaví pacienta na skutečnost, jestli absolvoval endoprotézu kloubu dolní končetiny (kyčelní nebo kolenní) nebo kloubu horní končetiny (ramenní). Tabulku doplňte o řádkové relativní četnosti. c) Analyzovanou závislost prezentujte pomocí vhodného grafu. d) Určete alespoň jednu míru kontingence. Na základě posouzení vizualizace analyzované závislosti a nalezené míry kontingence posuďte míru analyzované závislosti.
e) Určete šanci, že pacient absolvoval operaci kloubu dolní končetiny, v případě, že se jedná o ženu, i v případě, že se jedná o muže. (Komentujte.) f) Určete relativní šanci, že pacient absolvoval operaci kloubu dolní končetiny, jestliže se jedná o ženu (včetně 95% intervalového odhadu). Na základě svého zjištění určete, zda lze vliv pohlaví pacienta považovat za statisticky významný na hladině významnosti 5%. g) Vybereme náhodného pacienta. Určete riziko, že je po operaci kloubu horní končetiny (včetně 95% intervalového odhadu) v případě, že je náhodně vybraným pacientem žena i v případě, že je náhodně vybraným pacientem muž. Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů. h) Vybereme opět náhodného pacienta. Určete relativní riziko, že je po operaci kloubu horní končetiny (včetně 95% intervalového odhadu) v případě, že je náhodně vybraným pacientem žena.
Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení: použití vnitřních (vnějších) hradeb, resp. z souřadnice, resp. mediánová souřadnice, vizuální posouzení krabicového grafu. Exaktní posouzení: Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test) Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku). Jak ověřit normalitu dat? Emiprické posouzení: vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti. Exaktní posouzení: testy normality (např. Shapirův Wilkův test, Andersonův-Darlingův test, Lillieforsův test, ) Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení: poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu. Exaktní posouzení: F test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test).