VŠB Technická univerzita Ostrava BIOSTATISTIKA

Podobné dokumenty
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

VŠB Technická univerzita Ostrava

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Kurz Biostatistiky pro zaměstnance FNO

Zápočtová práce STATISTIKA I

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Průzkumová analýza dat

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Charakteristika datového souboru

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Kvantily a písmenové hodnoty E E E E-02

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Manuál pro zaokrouhlování

S E M E S T R Á L N Í

Návrhy dalších možností statistického zpracování aktualizovaných dat

Analýza dat s využitím MS Excel

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Návod na vypracování semestrálního projektu

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Metodologie pro ISK II

Porovnání dvou výběrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Tabulka 1. Výběr z datové tabulky

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Korelační a regresní analýza

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

UNIVERZITA PARDUBICE

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

MATEMATIKA III V PŘÍKLADECH

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Testování statistických hypotéz

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Statistická analýza jednorozměrných dat

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Cvičení 12: Binární logistická regrese

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Statistická analýza. jednorozměrných dat

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

KORELACE. Komentované řešení pomocí programu Statistica

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Vzorová prezentace do předmětu Statistika

Statistická analýza jednorozměrných dat

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Národníinformačnístředisko pro podporu jakosti

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Testy statistických hypotéz

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Nejčastější chyby v explorační analýze

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

Minimální hodnota. Tabulka 11

S E M E S T R Á L N Í

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Obecné, centrální a normované momenty

Analýza dat na PC I.

Stručný úvod do testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Popisná statistika. Komentované řešení pomocí MS Excel

Základy pravděpodobnosti a statistiky. Popisná statistika

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení


Úvodem Dříve les než stromy 3 Operace s maticemi

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Transkript:

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL 2: DOMÁCÍ ÚKOL 3: DOMÁCÍ ÚKOL 4: CELKEM: --------------------- HODNOCENÍ Ostrava, AR 2015/2016

Popis datového souboru V datovém souboru diabetes_5.xlsx najdete údaje o 3 skupinách pacientů. O pacientech, u nichž byl diagnostikován diabetes mellitus I. typu, o pacientech, u nichž byl diagnostikován diabetes mellitus II. typu a pacientech, u nichž diabetes nebyl diagnostikován. V souboru jsou uvedeny hodnoty glykemie měřeny nalačno při odběru, na jehož základě bylo diagnostikováno onemocnění diabetem a informace o tom, zda byl diabetes diagnostikován alespoň u jednoho z rodičů pacienta. U pacientů, u nichž byl diagnostikován diabetes, jsou navíc uvedeny hodnoty glykemie zjištěné nalačno při kontrolním odběru uskutečněném 6 měsíců po zahájení léčby. Obecné pokyny: Portfolio domácích úkolů budete odevzdávat postupně. Tj. nejdříve odevzdáte titulní stránku + úkol 1, následně doplníte úkol 2, atd. Jednotlivé domácí úkoly odevzdávejte vždy v termínu, který určil váš cvičící. Domácí úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do domácích úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690. 1

Úkol 1 a) Prezentujte strukturu datového souboru, tj. strukturu pacientů dle jejich zdravotního stavu (diabetes mellitus I. typu, diabetes mellitus II. typu, diabetes nediagnostikován). Použijte tabulku četností a výsledky vhodným způsobem vizualizujte. b) Srovnejte hodnoty glykemie nalačno u daných skupin pacientů na základě explorační analýzy, data graficky prezentujte (histogram, vícenásobný krabicový graf) a doplňte následující tabulky a text. Tab. 1: Výběrové charakteristiky glykemie měřené nalačno u pacientů, u nichž byl posléze diagnostikován diabetes I. nebo II. typu a u pacientů, jimž diabetes diagnostikován nebyl glykemie (mmol/l) počet pacientů Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost Diabetes I. typu Diabetes II. typu Diabetes nediag. po odstranění odlehlých pozorování Diabetes Diabetes Diabetes I. typu II. typu nediag. Identifikace odlehlých pozorování vnitřní hradby dolní mez horní mez 2

Grafická prezentace sledovaného statistického znaku (vícenásobný krabicový graf + histogramy, resp. odhady hustoty pravděpodobnosti): Pacienti s diabetem I. typu Byly analyzovány záznamy o glykemii nalačno. pacientů, u nichž byl diagnostikován diabetes I. typu (viz Tab. 1). Hodnoty glykemie se pohybovaly v rozmezí až. mmol/l. Hodnoty glykemie ležící mimo interval až.. mmol/l byly identifikovány jako odlehlá pozorování a příslušní pacienti byli z dalšího zpracování vyřazeni. Níže uvedené výsledky pocházejí z analýzy datového souboru o rozsahu. pacientů. Průměrná hodnota glykemie byla.. mmol/l, směrodatná odchylka.. mmol/l. Polovině pacientů byla zjištěna glykemie nižší než.. mmol/l. (Podrobněji: U čtvrtiny pacientů s diabetem I. typu byla zjištěna glykemie nižší než mmol/l, u čtvrtiny pacientů glykemie vyšší než mmol/l.) Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality glykemie pacientů s diabetem I. typu na základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (viz Tab. 1, výběrová šikmost i špičatost leží / neleží v intervalu 2; 2 ) lze / nelze předpokládat, že glykemie pacientů s diabetem I. typu má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že 95% / více než 75% pacientů s diabetem bude mít hodnotu glykemie v rozmezí... až.. mmol/l. Obdobně lze popsat výsledky analýzy glykemie pacientů, u nichž byl diagnostikován diabetes II. typu a pacientů, u nichž nebyl diagnostikován diabetes. 3

Úkol 2 Srovnejte pokles glykemie během 6 měsíců léčby u pacientů s diabetem I. a II. typu. a) Pokles glykemie u obou skupin pacientů vhodným způsobem graficky prezentujte. b) Určete 95% intervalové odhady středního poklesu glykemie (resp. mediánu poklesu glykemie) pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušných intervalových odhadů.) 4

c) Čistým testem významnosti ověřte, zda je pozorovaný pokles glykemie statisticky významný na hladině významnosti 5%. Test proveďte pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.) d) Pokud je to možno, určete 95% intervalový odhad rozdílu středních hodnot poklesů glykemie srovnávaných skupin pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušného intervalového odhadu.) e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) poklesů glykemie u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.) 5

Úkol 3 Srovnejte glykemii pacientů s diabetem I. a II. typu s glykemií pacientů bez diabetu pomocí exaktních metod statistické indukce. Využijte výsledků získaných v úkolu 1. a) Ověřte normalitu glykemie všech tří skupin pacientů (empiricky i exaktně). b) Ověřte homoskedasticitu (shodu rozptylů) glykemie všech tří skupin pacientů (empiricky i exaktně). c) Určete 95% intervalové odhady střední hodnoty (resp. mediánu) glykemie u srovnávaných skupin pacientů. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.) 6

d) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) glykemie u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. Pokud ano, zjistěte, zda lze některé skupiny pacientů označit (z hlediska jejich glykemie) za homogenní. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.) 7

Úkol 4 Analyzujte vliv výskytu diabetu v rodinné anamnéze na výskyt diabetu II. typu. Analýzu proveďte na základě údajů o pacientech s diabetem II. typu a pacientech s nediagnostikovaným diabetem. a) Pomocí vhodné asociační tabulky prezentujte vliv výskytu diabetu II. typu v rodinné anamnéze na výskyt diabetu II. typu. Tabulku doplňte o řádkové relativní četnosti. b) Analyzovanou závislost prezentujte pomocí vhodného grafu. c) Určete alespoň jednu míru kontingence. Na základě posouzení vizualizace analyzované závislosti a nalezené míry kontingence posuďte míru analyzované závislosti. d) Určete šanci na onemocnění diabetem II. typu u obou skupin pacientů, tj. u pacientů, v jejichž rodinné anamnéze se diabetes vyskytoval i u těch, v jejichž rodinné anamnéze se diabetes nevyskytoval. (Komentujte.) 8

e) Určete relativní šanci na onemocnění diabetem II. typu u rizikové skupiny pacientů (včetně 95% intervalového odhadu). Na základě svého zjištění určete, zda lze vliv výskytu diabetu v rodinné anamnéze považovat za statisticky významný na hladině významnosti 5%. f) Určete riziko onemocnění diabetem II. typu (včetně 95% intervalového odhadu) u obou skupin pacientů, tj. u pacientů, v jejichž rodinné anamnéze se diabetes vyskytoval i u těch, v jejichž rodinné anamnéze se diabetes nevyskytoval. Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů. g) Určete relativní riziko onemocnění diabetem II. typu u rizikové skupiny pacientů (včetně 95% intervalového odhadu). Na základě svého zjištění určete, zda lze vliv výskytu diabetu v rodinné anamnéze považovat za statisticky významný na hladině významnosti 5%. h) Ověřte, zda existuje závislost mezi výskytem diabetu v rodinné anamnéze a výskytem diabetu II. typu u pacienta pomocí Chí-kvadrát testu nezávislosti. Nezapomeňte ověřit předpoklady pro použití testu. 9

Biostatistika nápověda k domácím úkolům Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení: použití vnitřních (vnějších) hradeb, resp. z souřadnice, resp. mediánová suřadnice, vizuální posouzení krabicového grafu. Exaktní posouzení: Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test) Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku). Jak ověřit normalitu dat? Emiprické posouzení: vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti. Exaktní posouzení: testy normality (např. Shapirův Wilkův test, Andersonův-Darlingův test, Lillieforsův test, ) Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení: poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu. Exaktní posouzení: F test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test).