Tabulární data, pozorované vs očekávané četnosti



Podobné dokumenty
Frekvenční analýza, čtyřpolní tabulky

05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Vliv odlehlých hodnot, korelační koeficient, mnohonásobná regrese

M cvičení : GLM04b (Vztah mezi Poissonovým a

M cvičení : GLM03a (The Working Activities of Bees)

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Jana Vránová, 3. lékařská fakulta UK

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Fisherův exaktní test

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Regresní a korelační analýza

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Seminář 6 statistické testy

4ST201 STATISTIKA CVIČENÍ Č. 10

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

Regresní a korelační analýza

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Seminář 6 statistické testy

Příklad: Test nezávislosti kategoriálních znaků

Přednáška X. Testování hypotéz o kvantitativních proměnných

M cvičení : GLM05b (Trojrozměrné kontingenční tabulky)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Kontingenční tabulky a testy shody

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Tomáš Karel LS 2012/2013

Analýza dat z dotazníkových šetření

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

INDUKTIVNÍ STATISTIKA

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

4EK211 Základy ekonometrie

Testy dobré shody TESTY DOBRÉ SHODY (angl. goodness-of-fit tests), : veličiny X, Y jsou nezávislé nij eij

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

M cvičení : GLM01a (Toxic Chemical Production Data)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní analýza. Eva Jarošová

Plánování experimentu

Úvodem Dříve les než stromy 3 Operace s maticemi

Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných

Aplikovaná statistika v R - cvičení 2

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

StatSoft Jak poznat vliv faktorů vizuálně

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

12. cvičení z PST. 20. prosince 2017

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII

Problém 1: Ceny nemovitostí Poznámkykřešení 1

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

KGG/STG Statistika pro geografy

ADDS cviceni. Pavlina Kuranova

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení 12: Binární logistická regrese

Základy biostatistiky (MD710P09) ak. rok 2008/2009

Přednáška IX. Analýza rozptylu (ANOVA)

Jana Vránová, 3. lékařská fakulta, UK Praha

= = 2368

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Plánování experimentu

velkou variabilitou: underdispersion, overdispersion)

Design Experimentu a Statistika - AGA46E

Aplikovaná statistika v R - cvičení 3

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ADDS cvičení 7. Pavlína Kuráňová

Popisná statistika. Komentované řešení pomocí MS Excel

KORELACE. Komentované řešení pomocí programu Statistica

Analýza dat na PC I.

Matematická statistika Zimní semestr

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Regresní a korelační analýza

Regresní a korelační analýza

Základy biostatistiky (MD710P09) ak. rok 2007/2008

Manuální kroková regrese Newsletter Statistica ACADEMY

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Tomáš Karel LS 2012/2013

Moderní regresní metody. Petr Šmilauer Biologická fakulta JU České Budějovice (c)

10. Předpovídání - aplikace regresní úlohy

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Regresní a korelační analýza

Korelace. Komentované řešení pomocí MS Excel

TECHNICKÁ UNIVERZITA V LIBERCI

Transkript:

Tabulární data, pozorované vs očekávané četnosti Máme data o počtech např. samců a samic v populaci a zajímá nás, zda naše pozorované (observed) četnosti se liší od předpokládaného (expected). Příklad je tedy: celkem uloveno 47 zvířat, 29 samců a 18 samic; teoretický předpoklad je že zastoupení samců a samic je shodné, tedy 50:50. Nejprve vytvoříme vektor četností: zver<-c(29,18), který pak použijeme ve funkci chisq.test; chisq.test(zver). Tím, že jsme zadali pouze jeden parametr, fce předpokládá rovnoměrné zastoupení ve skupinách, tedy 50:50. Výsledkem je p-value = 0.1086, což značí, že nezamítneme hypotézu H0. Tím tedy můžeme říci, že námi pozorované četnosti mohou pocházet z populace se stejným zastoupením samců a samic. Dalším příkladem na srovnání pozorovaných a očekávaných četností jsou např. Mendelovy hrachy a štěpné poměry. Data jsou následující: žluté, kulaté žluté, svrasklé zelené, kulaté zelené, svrasklé pozorované četnosti 315 101 108 32 očekávané štěpné poměry 9 3 3 1 Vytvoříme dva vektory pro pozorované a očekávané četnosti: hr.pozor<-c(315,101,108,32) a hr.ocek<-c(9,3,3,1) a následně použijeme fci chisq.test. V případě, že zadáváme očekávané četnosti tak, že součet vektoru není 1, je třeba u fce chisq.test použít parametr rescale.p=true. Samotný test pak tedy vypadá následovně chisq.test(hr.pozor,hr.ocek,rescale.p=true) p-value je v tomto případě vysoké, tedy opět nezamítáme hypotézu H0 a můžeme s klidným svědomím prohlásit, že pozorované četnosti odpovídají teoretickým štěpným poměrům. Frekvenční analýza, čtyřpolní tabulky V následujícím příkladě nás zajímá, zda sekání má pozitivní vliv na reprodukci studovaného druhu. V experimentu tedy máme dva druhy ošetření (sekané, nesekané) a pro každé máme patnáct ploch. V průběhu sezóny sledujeme, jestli druh vykvete. Nezajímá nás tedy kolik jedinců vykvete, ale zda se na ploše objeví alespoň jedna kvetoucí rostlina. Výsledná tabulka sledování je zde: X7 Faktor5 Faktor6 13 1 1 2 1 2 6 2 1 9 2 2 X7 - četnost pozorování, Faktor5 - typ ošetření (sekaná - 1, kontrola - 2), Faktor6 - kvetení (vykvetl - 1, nevykvetl - 2) Experimenty s četnostmi nějakého jevu v závislosti na působení dvou či více faktorů se řeší pomocí metod frekvenční analýzy. V našem případě máme pouze dva faktory a oba mají pouze dvě hladiny, a tak se jedná o nejjednodušší typ frekvenčních analýz - tzv. čtyřpolní tabulku. Frekvenční analýzy se obvykle řeší pomocí testů Chí-kvadrát nebo Fisherovým

exaktním testem (ten pouze pro čtyřpolní tabulky). Předpokladem a nulovou hypotézou testu je nezávislost působení obou faktorů. Pokud zadáme data do sloupců (sloupec četností, a kódování pro faktory), lze v S+ pouze vytvořit "Crosstabulation" z menu Statistics>Data Summarries>Crosstabulations... V příkazovém řádku R fci xtabs. *** Crosstabulations *** Call: crosstabs(formula = X7 ~ Faktor5 + Faktor6, data = SDF1, na.action = na.exclude, drop.unused.levels = T) 30 cases in table +----------+ N N/RowTotal N/ColTotal N/Total +----------+ Faktor5 Faktor6 1 2 RowTotl -------+-------+-------+-------+ 1 13 2 15 0.87 0.13 0.5 0.68 0.18 0.43 0.067 -------+-------+-------+-------+ 2 6 9 15 0.4 0.6 0.5 0.32 0.82 0.2 0.3 -------+-------+-------+-------+ ColTotl 19 11 30 0.63 0.37 -------+-------+-------+-------+ Test for independence of all factors Chi^2 = 7.033493 d.f.= 1 (p=0.007999917) Yates' correction not used Tabulka spočte "observed" proporce pro jednotlivé faktory a to jak pro celková data (N/Total) tak i pro jednotlivé řádky a sloupce. Pokud chceme spočíst očekávané "expected" četnosti, musíme počítat v ruce: pro kombinaci 1&1 počítáme z marginálních četností (15*19)/30=9.5. V menu pro vytvoření tabulky bohužel nelze nastavit podrobnější parametry Chí-kvadrát testu (Yatesova korekce). Pokud bychom chtěli spočíst Fisherův exaktní test či Chí-kvadrát s Yatesovou korekcí, je třeba data zadat buď přímo do kontingenční tabulky, nebo přímo pro každé sledování vlastní řádek (tj. v tomto případě: třináctkrát ve sloupcích Faktor5 a Faktor6 jedna, dvakrát ve sloupci Faktor5 jedna a Faktor6 dva...). Z menu voláme Statistics>Compare Samples>Counts and Proportions a poté buď Fisherův exaktní test či Chí-kvadrát. Výsledkem jsou tedy: Fisher's exact test data: Faktor5 and Faktor6 from data set frekv p-value = 0.0209 alternative hypothesis: two.sided

Pearson's chi-square test with Yates' continuity correction data: Faktor5 and Faktor6 from data set frekv X-square = 5.1675, df = 1, p-value = 0.023 V našem případě oba testy zamítly nulovou hypotézu o nezávislosti působení obou jevů. Pokud chceme říci které kombinace faktorů jak ovlivňují kvetení, musíme ještě dopočítat očekávané četnosti a na základě porovnání se skutečnými správně interpretovat. Z výsledků v našem příkladu můžeme říci, že sekání louky pozitivně ovlivňuje kvetení sledovaného druhu rostliny. Yatesova korekce (dostupná pouze pro tabulky 2 2) je zde použita, protože frekvenční tabulky obsahují diskrétní data, avšak Chí-kvadrát je rozdělení spojité. Zejména by se měla použít, pokud se jedná o tabulky kdy pozorované četnosti jsou nízké (<5). Pro tyto tabulky je vhodnější použít Fisherův exaktní test. observed expected pozorované očekávané sekaná/vykvetl 13 > (15*19)/30 = 9.5 sekaná/nevykvetl 2 < (15*11)/30 = 5.5 kontrola/vykvetl 6 < (15*19)/30 = 9.5 kontrola/nevykvetl 9 > (15*11)/30 = 5.5 Alternativou pro analýzu dat kde vysvětlující proměnné jsou kategoriální a vysvětlovanou počty jsou kromě výše uvedených Chí-kvadrát testu a Fisherova exaktního testu i zobecněné lineární modely. Použijeme log-lineární model s poissonovským rozdělením chyb. V S+ pro tyto výpočty používáme funkci glm. Její parametry jsou obdobné jako u např. lm (lineární regrese). Jen je třeba doplnit typ rozložení chyb, v našem případě: poisson. Model uložíme pod jménem "pokus" a píšeme tedy: pokus<-glm(x7~faktor1+faktor2, data=sdf1, poisson) Výsledek vyvoláme a z celého výpisu nás zajímá pouze hodnota residuální deviance. pokus Call: glm(formula = x7 ~ f1 + f2, family = poisson, data = SDF1) Coefficients: (Intercept) f1 f2 1.97802-2.279783e-008-0.2732718 Degrees of Freedom: 4 Total; 1 Residual Residual Deviance: 7.458882 Hodnotu residuální deviance srovnáme s hodnotou Chí-kvadrátu s jedním stupněm volnosti. Pro výpočet hladiny významnosti voláme: 1-pchisq(7.46,1) [1] 0.006308501 Což ukazuje obdobný výsledek jako když jsme příklad počítali Fisherovým testem či přímo Chí-kvadrátem. Pozorované a očekávané hodnoty si vypíšeme pro určení, které kombinace faktorů mají pozitivní či negativní efekt.

> SDF1$x7 [1] 13 2 6 9 > fitted(model) 1 2 3 4 9.5 5.500001 9.5 5.500001

Logistická regrese Pokud máme závislou proměnnou kategoriální a ještě k tomu nabývá pouze dvou hodnot (přežil/nepřežil, kvete/nekvete, nakažený/nenakažený) a zajímá nás které faktory a jak je ovlivňují. V následujícím příkladu nás bude zajímat jak je pravděpodobnost přežití rostliny ovlivněna množstvím vytvořených semen v závislosti na její velikosti. K dispozici máme údaje o 59 jedincích, zda přežili do další sezóny (surv: 0 - nepřežil, 1 - přežil; flow - počet úborů, root - velikost kořene). Data jsou z příkladu GLEX26 programového balíku GLIM. Výpočet je založen na závislosti p = e y /(1+e y ), kde hodnoty y získáme z regresních koeficientů (viz níže). 1. Výpočet Vlastní analýzu budeme počítat pomocí logistické regrese z menu Statistics>Regression>Logistic... Menu, kde zadáváme vlastní analýzu se příliš neliší od klasické regrese. V tomto příkladě využijeme možnosti S+ a uložíme si model analýzy jako samostatný objekt se kterým budeme později pracovat. Pro uložení je potřeba jen zadat jméno analýzy do okna "Save Model Object". Po zadání analýzy máme obecnou rovnici: surv~flow+root. Ve výsledcích jsou opět uvedeny hodnoty pro rozdělení reziduí. Hlavní výsledek je v části "Coefficients" kde jsou uvedeny regresní koeficienty pro jednotlivé proměnné spolu s jejich standardními chybami a t-hodnotami. Pravděpodobnosti pro jednotlivé proměnné je třeba dopočítat ručně či je můžeme otestovat delečními testy (funce drop1). Z příkazového řádku voláme logistickou regresi: glex.1<-glm(surv~flow+root, data=glex26, binomial). *** Generalized Linear Model *** Call: glm(formula = surv ~ flow + root, family = binomial(link = logit), data = GLEX26, na.action = na.exclude, control = list(epsilon = 0.0001, maxit = 50, trace = F)) Deviance Residuals: Min 1Q Median 3Q Max -1.42963-0.7899175-0.1878944 0.7291494 2.359577 Coefficients: Value Std. Error t value (Intercept) 0.9615073 0.61588600 1.561177 flow -0.1064166 0.03331434-3.194318 root 6.6003244 2.09356086 3.152679 (Dispersion Parameter for Binomial family taken to be 1 ) Null Deviance: 78.90332 on 58 degrees of freedom Residual Deviance: 54.06811 on 56 degrees of freedom Number of Fisher Scoring Iterations: 5

2. Test proměnných (funce drop1) To zda jsou pro model významné můžeme otestovat kromě t-testu obdobným způsobem jako u "stepwise" analýzy, tedy postupně odebírat jednotlivé proměnné a sledovat výslednou statistiku Cp, která bere v potaz množství vysvětlené variability a počet proměnných zahrnutých v modelu. Máme-li uložený model pod jménem "glex.1" vyvoláme analýzu postupného odebírání proměnných funkcí drop1. V okně "Commands" tedy voláme: drop1 (glex.1) a dostáváme tabulku. > drop1(glex.1) Single term deletions Model: surv ~ flow + root Df Sum of Sq RSS Cp <none> 52.46392 58.08506 flow 1 10.20366 62.66759 66.41501 root 1 9.93938 62.40331 66.15073 Testovací statistika Cp v žádném případě neklesla pod hodnotu kompletního modelu a tak tedy můžeme zahrnout obě proměnné do modelu. Získané závislosti tedy ukazují, že čím méně vytvořených květních úborů, tím vyšší pravděpodobnost přežití a zároveň s velikostí kořene také klesá pravděpodobnost smrti. Získaná regresní rovnice by tedy vypadala: y = 0.9615-0.1064*flow + 6.6003*root a pravděpodobnosti přežití pro jedince s danými parametry bychom získali po zadání do výše zmíněné rovnice p = e y /(1+e y ). Pokud chceme spočíst pravděpodobnost přežití pro jedince s námi známými parametry, pak můžeme využít další funkce predict. Pro jedince s počtem úborů 30 a velikostí kořene 0.52 voláme: predict(glex.1,list(seeds=30,size=0.52),type="response"). Prvním parametrem funkce je jméno modelu, který je použit pro výpočet, dále následuje seznam hodnot pro všechny proměnné v modelu, v našem případě pro seeds a size. Poslední parametr zajišťuje převedení výsledku do intervalu 0 až 1. Výsledkem je tedy 77procentní pravděpodobnost přežití pro zadanou rostlinu. 3. Grafické znázornění Získané závislosti pro jednotlivé proměnné si můžeme znázornit také v grafech.v S+ je to jednodušší provést pomocí příkazového řádku. Využijeme pro vytvoření grafu minulé funkce predict. Pro graf závislosti přežití na počtu vytvořených úborů musíme vytvořit odpovídající model (glex.flow<-glm(surv~flow, data=glex26, binomial. Dále si zjistíme rozsah hodnot, kterých může nabývat počet úborů (min(flow) a max(flow). Pro graf tedy bude rozumné použít na ose x hodnoty od 0 do 180. Vytvoříme pomocnou proměnnou rada<-seq(0,180, 10). Pro hodnoty této pomocné proměnné pak budeme počítat predikované hodnoty a těmi pak proložíme výslednou křivku. Nejdříve si vyneseme hodnoty počtu úborů oproti přežití a poté do grafu přidáme fitovanou křivku. Voláme tedy: >plot(flow,surv) >lines(rada,predict(glex.flow,list(flow=rada),type="response"))

1.0 0.8 0.6 surv 0.4 0.2 0.0 5 30 55 80 105 130 155 180 flow 4. Vliv interakce (funkce update) Avšak může nás také zajímat, jaká je závislost mezi přežitím a oběma parametry navzájem, tedy interakce mezi velikostí a investicí do reprodukce. Přidáme tedy do našeho modelu hodnoty interakcí. Interakce přidáme jednoduše buď vytvořením nového modelu či pomocí funkce update. Změnu modelu zadáme pomocí "tečkové" konvence v S+. Model můžeme obecně vyjádřit jako závislost proměnné na levé straně na proměnných, které jsou uvedeny na straně pravé. Tedy v našem případě surv ~ flow + root, což je obecně. ~., kde tečka zastupuje veškeré proměnné na dané straně rovnice. Pokud tedy do modelu glex.1 chceme přidat interakce pak použijeme funkci update takto: update (glex.1,. ~. +flow:root). Obdobným způsobem můžeme proměnné i odebírat. Pro náš příklad tedy vytvoříme nový model (glex.full) na základě glex.1 s přidanými interakcemi. Voláme tedy: glex.full<-update(glex.1,.~.+flow:root) Po vyvolání modelu glex.full již S+ vypíše celý model i s interakcemi > glex.full Call: glm(formula = surv ~ flow + root + flow:root, family = binomial(link = logit), data = GLEX26, na.action = na.exclude, control = list(epsilon = 0.0001, maxit = 50, trace = F)) Coefficients: (Intercept) flow root flow:root -2.960503-0.07887645 25.15061-0.2090799 Degrees of Freedom: 59 Total; 55 Residual Residual Deviance: 37.12823 Nyní stejným způsobem jako pro model glex.1 bez interakcí otestujeme významnost jednotlivých proměnných. pomocí funkce drop1. > drop1(glex.full) Single term deletions

Model: surv ~ flow + root + flow:root Df Sum of Sq RSS Cp <none> 60.63389 69.45336 flow:root 1 5.58286 66.21675 72.83135 A opět vidíme, že všechny proměnné použité v našem modelu mají své opodstatnění. Použité interakce v modelu (regresní koeficient -0.20908) můžeme interpretovat tak, že větší rostliny mají nižší pravděpodobnost přežití pokud vytvoří stejný počet květních úborů jako menší jedinci. Srovnáme-li jednotlivé modely s interakcí a bez ní (obdobně jako např. u mnohonásobné regrese) vidíme, že modely se výrazně liší a tedy přidaná interakce výrazně ovlivnila vysvětlenou variabilitu modelu a měli bychom ji tedy zahrnout. Avšak pozor, zde používáme jako testovací statistiku rozdělení Chí-kvadrát! > anova(model,model2, test="chi") Analysis of Deviance Table Response: surv Terms Resid. Df Resid. Dev Test Df Deviance Pr(Chi) 1 seeds + size 56 54.06811 2 seeds + size + seeds:size 55 37.12823 +seeds:size 1 16.93988 0.0000385824 > Získaná (a finální) regresní rovnice tedy vypadá: y = -2.960503-0.07887645*flow + 25.15061*root - 0.2090799*flow:root a odhadnuté pravděpodobnosti přežití pro dané hodnoty vytvořených úborů a velikosti kořene získáme zadáním do p = e y /(1+e y ). Pokud budeme pravděpodobnosti přežití počítat v ruce, pak hodnoty pro interakce získáme prostým vynásobením hodnot pro kořen a květenství. Pokud chceme data s interakcí zobrazit v grafu, lze použít postup, kdy např. pro určité hodnoty velikosti kořene vynášíme průběhy prsti přežití vs. počet úborů. Postup je obdobný jako u nakreslení jednoduché závislosti. Liší se pouze v nutnosti zadat hodnoty pro všechny vysvětlované proměnné. Např tedy pokud budu chtít v grafu mít na ose x počet úborů a jednotlivé čáry budou vybrané průměry kořenu zjistím rozsahy hodnot kterých může nabývat počet úborů a velikost kořene. Pro počet úborů vytvořím pomocnou proměnnou funkcí seq (rada). Pro hodnoty této pomocné proměnné a pak budeme počítat predikované hodnoty a těmi pak proložíme výslednou křivku. Nejdříve si vyneseme hodnoty počtu úborů oproti přežití a poté do grafu přidáme fitovanou křivku. Voláme tedy: >plot(flow,surv) >lines(rada,predict(glex.flow,list(flow=rada,size=rep(0.1,length (rada)),type="response")) Předchozí příkaz tedy kreslí průběh pravděpodobnosti přežití pro celý rozsah počtu úborů, při konstantní velikosti kořene 0.1. Stejný příkaz mohu opakovat pro různé velikosti kořene a tím získat představu o charakteru interakce a vlivu jednotlivých charakteristik pro přežití.

Použitá data z příkladu glex26 pro program GLIM: surv flow root 1 32 0.30 0 165 1.57 0 63 0.66 0 41 0.2 1 9 0.2 0 33 0.2 0 7 0.02 0 141 0.91 1 46 0.55 0 150 2.36 1 15 0.25 0 21 0.2 0 24 0.15 0 35 0.2 0 12 0.01 0 57 0.66 0 18 0.15 0 108 1.57 1 35 0.25 1 38 0.66 1 29 0.39 1 41 0.44 0 21 0.25 0 37 0.2 1 12 0.25 0 86 0.66 0 45 0.2 0 32 0.25 0 21 0.25 1 45 0.55 0 59 0.44 0 26 0.2 1 35 0.98 0 143 1.57 1 60 0.66 0 39 0.25 1 35 0.44 1 20 0.2 1 59 0.66 0 50 0.44 1 16 0.15 0 29 0.1 1 65 1.57 1 75 1.18 1 25 0.44 0 60 0.2 1 89 1.9 1 47 0.2 0 10 0.05 0 81 0.55 1 16 0.29 0 133 0.88 0 54 0.25 0 57 0.04 0 17 0.2 1 20 0.55 0 77 0.15 0 20 0.1 0 41 0.2