Cvičení z biostatistiky 01

Podobné dokumenty
Cvičení z biostatistiky 03

Velmi stručný návod jak dostat data z Terminálu Bloomberg do R

Cvičení z biostatistiky 06

Návod k aplikaci DPH Kontrol

František Hudek. květen ročník

STATISTICA Téma 1. Práce s datovým souborem

Začínáme pracovat s tabulkovým procesorem MS Excel

Laboratorní výsledky

UniLog-D. v1.01 návod k obsluze software. Strana 1

Formátování pomocí stylů

Modul 2. Druhá sada úkolů:

Manuál k programu KaraokeEditor

Základní vzorce a funkce v tabulkovém procesoru

VYÚČTOVÁNÍ DANĚ ZE ZÁVISLÉ ČINNOSTI, SRÁŽKOVÉ DAŃE

OFF - LINE. PRO ZAČÁTEČNÍKY Zdroje textů a obrázků

Pro definici pracovní doby nejdříve zvolíme, zda chceme použít pouze informační

Pro vytvoření zdrojového souboru použít export GEOPORTAL, který obsahuje i adresy na webové stránky s válečnými hroby.

Mgr. et Mgr. Jan Petrov, LL.M. Ph.D. BYZNYS A PRÁVO

Návod k práci s programem MMPI-2

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

ODRÁŽKY A ČÍSLOVÁNÍ. Odrážky

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců.

Úvodní list. Název školy Integrovaná střední škola stavební, České Budějovice, Nerudova 59 Číslo šablony/ číslo sady Poř. číslo v sadě 19 32/10

Pracovní list č. 14 Microsoft Word 2010 jazykové nástroje, reference I Jazykové nástroje

Nápověda k aplikaci EA Script Engine

Obsah. při vyšetření pacienta. GDT souboru do programu COSMED Omnia GDT souboru z programu COSMED Omnia a zobrazení výsledků měření v programu MEDICUS

1. Podmínky chodu aplikace

Uživatelská příručka pro respondenty

PRÁCE S TEXTOVÝM EDITOREM 6.4 TEXTOVÉ POLE

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Microsoft Word 2010 prostředí MS Wordu, práce se souborem

Soukromá střední odborná škola Frýdek-Místek, s.r.o. VY_32_INOVACE_03_IVT_MSOFFICE_02_Excel

Vzorce. Suma. Tvorba vzorce napsáním. Tvorba vzorců průvodcem

Soukromá střední odborná škola Frýdek-Místek, s.r.o. VY_32_INOVACE_49_IVT_MSOFFICE_05_Word

František Hudek. duben 2013

Import zboží ve formátu CSV

Centrální příjem (CP) požadavků, Pracovní listy (PL), Výsledky po metodách (VPM)

4. Jednoduché výpočty

Postup instalace softwaru Creo3:

Práce s programem MPVaK

WinFAS. obecné. Praktický úvod do WinFASu IQ sestavy podrobně. Strana 1

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Průvodce instalací modulu Offline VetShop verze 3.4

10 Algoritmizace Příklad 2 Word 2007/ VBA

Modul 2. První sada úkolů:

Stěžejní funkce MS Excel 2007/2010, jejich ovládání a možnosti využití

Popis ovládání. Po přihlášení do aplikace se objeví navigátor. Navigátor je stromově seřazen a slouží pro přístup ke všem oknům celé aplikace.

Kontrolní hlášení DPH (CZ) od verze Klient 5.12.a

Práce se styly 1. Styl

Tvorba článků na knihožroutu: Slovo úvodem... 2 Přihlášení... 3 Tvorba tabulky... 5 Vložení obrázků... 8 Vložení hypertextového odkazu...

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 2. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

Gymnázium Ostrava Hrabůvka, příspěvková organizace Františka Hajdy 34, Ostrava Hrabůvka

Stručný manuál pro webový editor. Ukládáni základních informací, tvorba menu

Pracujeme s programem Excel (interní učební text pro potřeby školy) (verze 1.0)

První kroky s Google Apps

ZŠ ÚnO, Bratří Čapků 1332

Otázky neopisuj, piš odpověď!

Ovládání Open Office.org Calc Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako.

- PC musí být připojené v lokální síti - je bezpodmínečně nutné, aby aplikace Outlook nebyla aktivní)

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Pracovní plocha. V první kapitole se seznámíme s pracovním prostředím ve Photoshopu.

Prostředí Microstationu a jeho nastavení. Nastavení výkresu

METODICKÉ LISTY. výstup projektu Vzdělávací středisko pro další vzdělávání pedagogických pracovníků v Sokolově

MS OFFICE MS WORD. Editor rovnic - instalace

Instalace a aktivace 3E pluginů pro SketchUp 2015 Rychlý průvodce instalací a aktivací pluginů: 3E Parametrické tvary, 3E Doors&Windows a 3E Katalog.

Microsoft Office Outlook 2003 s aplikací Business Contact Manager

Průvodce aplikací. Aplikaci easyeldp spusťte z nabídky Start pomocí ikony KomixFiller, kterou naleznete ve složce Komix.

Pošta a kancelář. Děkujeme za Váš zájem o tento program, věříme že v tomto dokumentu naleznete vše důležité pro práci s programem.

Jak používat program P-touch Transfer Manager

Úvod do problematiky ÚPRAVY TABULKY

Sada 2 Microsoft Word 2007

G-Client. Import adresáře do aplikace

Microsoft Office. Word vzhled dokumentu

Grid 2. Krok za krokem. Jednoduchý manuál pro základní úpravy mřížek v programu

Nápověda ke cvičení 8

Zde se objeví všechny spisy, které má uživatel v ISAS vyznačeny na sebe.

Tabulkový procesor Microsoft Excel

Obsah Přehled existujících a evidence nových klientů... 3 Přehled foto-záznamů... 4 Nahrávání foto-záznamů... 6 Analýza foto-záznamů...

ÚLOHA 6. Úloha 6: Stěžejní body tohoto příkladu:

2.3.3 PRÁCE S JEDNÍM A VÍCE DOKUMENTY

2. cvičení z ZI1 - Excel

PowerPoint. v PowerPointu se pracuje se snímky, u kterých je možné si vybrat rozvržení obrazovky

INFORMATIKA. aplikační software pro práci s informacemi TSUNAMI. Pracovní list pro žáky. Gymnázium K. V. Raise, Hlinsko, Adámkova 55

X36UNX 16. Numerické výpočty v sh příkazy expr, bc, dc. Zdeněk Sojka

MS Word 2007 Šablony programu MS Word

Aplikace BAUR pro správu naměřených údajů. ITS Lite

sloučení dokumentů Zadání: TÉMA: Sledování změn a komentářů, revize, porovnání dokumentů,

pi Ludolfovo číslo π = 3,14159 e Eulerovo číslo e = 2,71828 (lze spočítat jako exp(1)), např. je v Octave, v MATLABu tato konstanta e není

Uživatelský manuál. A4000 Download

OBSAH. KaPiGraf příručka III. vydání

Popis a ovládání. Aplikace 602XML Filler


Řešení. ŘEŠENÍ 36 Výsledková listina soutěže

ESTATIX INFORMAČNÍ SYSTÉM REALITNÍCH KANCELÁŘÍ UŽIVATELSKÁ PŘÍRUČKA UŽIVATELSKÁ PŘÍRUČKA STRANA 1 / 23

AC FORM FILLER. aplikace pro podání žádosti o poskytnutí finančního příspěvku. Verze 1.0

Ignijet_2007 Externí monitor

Operační systém MS Windows XP Professional

Hledat a označit 2 z 16

Transkript:

Cvičení z biostatistiky 01 Poslední úprava dokumentu: 16. února 2017. Seznámení s R 1 Úvod 1) Postup prací pro cvičení se bude postupně objevovat na webu cvičícího: http://www.karlin.mff.cuni.cz/~turcic 2) Nejprve vytvořte na vlastním disku J: složku biostat, tj. J:\biostat a v této složce vytvořte podsložku data, do které budeme ukládat data. 3) Do složky J:\biostat\data zkopírujte soubory *.csv ze složky V:\turcicova\data. 4) Do složky J:\biostat zkopírujte soubor PrF01.R z adresáře V:\turcicova. 5) Spust te RStudio z nabídky. 6) V RStudio nastavte pracovní adresář na J:\biostat jedním z následujících způsobů: (a) Napište a pomocí Enter odešlete v okně Console příkaz setwd("j:/biostat") (pozor, lomítko je obyčejné a nikoliv zpětné). (b) V horní nabídce postupně zvolte Session y Set Working directory y Choose directory... a pomocí myši najděte složku J:\biostat. 7) Zjistěte, zda se vše povedlo. Po zadání příkazu getwd() by se mělo vypsat J:/biostat. 8) Pomocí horní nabídky zaved te do skriptového okna (alias Script Window, vlevo nahoře) skriptový soubor PrF01.R: File y Open File... 1

Několik poznámek k práci se skriptovým souborem 6 Při psaní příkazů v Script Window jsou vám automaticky nabízeny příkazy začínající na daná písmena. Pokud se vám některý z těchto příkazů zamlouvá, vyberte ho pomocí šipky na klávesnici a poté potvrd te klávesou Enter. 6 Znak # odděluje poznámky, tj. něco, co chcete v souboru vidět vy, ale nechcete, aby to vidělo R. 6 Různé příkazy musí být na různých řádcích (doporučuji), nebo na stejném řádku oddělené středníkem. 6 Když chceme, aby se provedl příkaz na konkrétním řádku, nastavíme kurzor na příslušný řádek a zmáčkneme klávesovou zkratku Ctrl-Enter, nebo klikneme na tlačítko Run (v pravém horním rohu Script Window). 6 Když chceme, aby se provedlo více příkazů najednou, označíme je myší jako blok a zmáčkneme klávesovou zkratku Ctrl-Enter, nebo klikneme na tlačítko Run (v pravém horním rohu Script Window). 6 Čas od času si (doplňovaný) skriptový soubor uložte (stačí sem tam stisknout klávesovou zkratku Ctrl-S) nebo kliknout na ikonu diskety vlevo nahoře. 6 Nápovědu k libovolnému příkazu vyvoláme pomocí help(prikaz) nebo?prikaz. (Nápověda se pak zobrazí v pravém dolním okně.) Další poznámky pro práci s R / RStudiem 6 Všechny požadované příkazy je nutné napsat do Script Window nebo do Console. 6 Po odeslání požadovaného přikazu se příkaz v tichosti provede a v Console se objeví výsledky výpočtu (jsou-li nějaké). V případě chybného příkazu se objeví červená chybová hláška. 6 Předchozí příkazy je možné v Consoli vyvolávat pomocí šipky nahoru na klávesnici. Vyvolaný příkaz lze dále upravit a odeslat klávesou Enter. 6 Chceme-li provést ve výpočtu drobnou změnu (např. zpracovat proměnnou vaha místo proměnné vyska), můžeme si příslušnou část ve skriptovém okně zkopírovat níže, upravit a odeslat. 6 Pro pozdější použití vytvořeného skriptu je dobré si do něj sem tam napsat nějaký komentář (za znak #). 2

2 Základní operace a funkce v R 1) Nejprve použijte R jako kalkulačku a spust te postupně ze skriptového okna následující příkazy: 2 2 + 3 # scitani 2-3 # odcitani 2 * 3 # nasobeni 2 / 3 # deleni 2^3 # mocnina 3^(1/2) # (od)mocnina sqrt(3) # jeste jednou odmocnina exp(3) # exponenciela (e na neco) log(3) # prirozeny logaritmus (pozor! jinde se casto znaci ln) exp(log(3)) sin(3) # sinus cos(3) # cosinus pi # konstanta pi sin(pi/2) cos(pi/2) factorial(3) # 3! (faktorial) choose(3, 2) # "3 nad 2 (kombinacni cislo)" 2) Nyní budeme pracovat s proměnnými a <- 2 a = 2 a b <- 3 b a + b a - b a * b a / b # ulozeni hodnoty do promenne # jiny zpusob ulozeni (nelze kombinovat s jinymi prikazy, viz nize) # podivame se, co tam mame # ulozeni do jine promenne # secteni ulozenych hodnot # odecteni ulozenych hodnot # vynasobeni ulozenych hodnot # vydeleni ulozenych hodnot 3) Ukládání výsledku do dalších proměnných c <- log(b) c print(c) # ulozi, ale nevytiskne vysledek # vytiskne vysledek # tez vytiskne vysledek 4) Úklid (před začátkem jiné práce) ls() # zjistime, jake promenne mame nadefinovane rm(list=ls()) # vycistime Rko (vsechny promenne se smazou) ls() # zjistime, jake promenne mame nactene (snad nic) 5) Do budoucna bude vhodné, když každý vámi vytvořený skriptový soubor pro novou práci bude začínat příkazy setwd("j:/biostat") rm(list=ls()) 6 Při práci mimo učebnovou sít PřF si samozřejmě J:/biostat nahrad te něčím jiným dle konfigurace svého počítače. 3

3 Práce s daty 6 Data (nějaká vlastní měření apod.) si asi většinou ukládáte v nějakém tabulkovém procesoru (LibreOffice Calc, MS Excel apod.) 6 Z tabulkového procesoru lze (rozumně uložená) data uložit ve formě textového souboru (např. ve formátu csv), obvykle nabídkou Save As / Uložit jako. 6 Z formátu csv (a jemu podobných) lze již data snadno načíst do R. 6 Podívejme se na data uložená v souboru Deti23.csv, která obsahují následující proměnné: hoch jde o hocha? (0/1); poradi o kolikáté dítě dané matky jde; vekmatky věk matky; vekotce věk otce; vaha váha dítěte v 1 roce (kg); delka délka dítěte v 1 roce (cm); hcd počet onemocnění horních cest dýchacích v prvních 12 měsících života; Gender pohlaví dítěte (M/F). 1) Načtěte data do R. Menu RStudia: File y Import Dataset y from CSV y Browse... y Name Delimiter First Row as Names Deti23 Semicolon (středník) Nebo příkazem: Deti23 <- read.csv2("./data/deti23.csv", header=true) 2) Pokud jste data načetli pomocí Menu, již se vám otevřela. Pokud jste je načetli příkazem, můžete si je prohlédnout pomocí nebo View(Deti23) print(deti23) 3) V příkazové formě práce se k jednotlivým veličinám z dat dostanete pomocí operátoru $. Zkuste např. spustit ze skriptového okna následující příkazy: Deti23$vaha Deti23$delka 6 Následující příkazy skončí chybou: vaha delka 4) V dalším si lze ukrátit psaní a zajistit si bezplatný (míněno bezdolarový) přístup k hodnotám dat příkazem attach. Spust te ze skriptového okna 4

attach(deti23) vaha Deti23$vaha delka Deti23$delka 5) V datech je délka dětí uvedena v centimetrech. Co kdybychom chtěli zpracovávat délku v metrech? Vytvořme novou proměnnou, kterou nazveme delka.m, jež bude udávat délku dětí v metrech. 6 Před každou manipulací s daty doporučuji zpoplatnit přístup k proměnným příkazem detach. Spust te proto ze skriptového okna detach(deti23) 6 Nyní přistoupíme k vlastnímu výpočtu délky dětí v metrech: Deti23 <- transform(deti23, delka.m = delka / 100) 6 Nyní opět umožněte bezplatný přístup k proměnným (včetně nové delka.m). Spust te ze skriptového okna: attach(deti23) 6) Prohlédněte si znovu data a zjistěte, zda se vše povedlo. 7) Samostatně vytvořte proměnnou nazvanou bmi, jež bude udávat BMI (bodu mass index = (hmotnost v kg)/(výška v m) 2 ) jednotlivých dětí, tj. bmi = vaha / delka.mˆ2. 8) Samostatně vytvořte proměnnou dobaplnolet, která bude udávat, kolik let již byla matka při porodu plnoletá, tj. dobaplnolet = vekmatky 18. 9) Ze skriptového okna vytiskněte hodnoty proměnných bmi a dobaplnolet: bmi dobaplnolet 10) K jednotlivým složkám vektoru bmi se lze dostat operátorem [ ]. 6 Například BMI 10. dítěte dostaneme pomocí bmi[10] 6 Hodnoty BMI prvních 5 dětí lze dostat takto: bmi[1:5] 6 Hodnoty BMI pro 2., 5., a 7. dítě získáme zase tímto způsobem: bmi[c(2, 5, 7)] 11) Obdobně se lze dostat ke konkrétním naměřeným údajům konkrétního dítěte, či konkrétních dětí. 6 Hodnotu 5. proměnné (vaha) 10. dítěte získáme takto: Deti23[10, 5] nebo také takto Deti23[10, "vaha"] 5

6 Hodnotu 5. a 6. proměnné (vaha a delka) 10. dítěte získáme takto: Deti23[10, c(5, 6)] nebo také takto Deti23[10, c("vaha", "delka")] 6 Všechny údaje 10. dítěte (jde o 73 cm dlouhého a 9,6 kg těžkého chlapce) dostaneme takto: Deti23[10, ] 6 Všechny údaje 7. 11. dítěte dostaneme takto: Deti23[7:11, ] 6 Všechny údaje 2., 5., a 12. dítěte dostaneme takto: Deti23[c(2, 5, 12), ] 6 Hodnotu 5. a 6. proměnné (vaha a delka) 2., 5., a 12. dítěte dostaneme takto: Deti23[c(2, 5, 12), c(5, 6)] nebo také takto Deti23[c(2, 5, 12), c("vaha", "delka")] 4 Uložení dat Do datové tabulky Deti23 jsme přidali několik nových proměnných (delka.m, dobaplnolet, bmi). V budoucnu s nimi možná budeme znovu pracovat. Abychom si tyto proměnné nemuseli vytvářet znovu, uložíme si současnou formu datové tabulky Deti23: 1) bud ve formátu csv write.table(deti23, file = "./data/deti23upr.csv",row.names=false, col.names=true, sep=";", dec=",") 2) nebo ve formě R datového formátu (přípona RData) save(deti23, file = "./data/deti23.rdata") 6