Princip parsimonie (Occamova břitva)

Transkript

1 Plánování pokusů Replikace (opakování) kvůli spolehlivosti (reliability) Randomizace (znáhodnění) kvůli zabránění zkreslení výsledků (bias) Princip parsimonie Síla statistického testu Kontroly Efektivní experimentální uspořádání Rozpoznání pseudoreplikací Rozdíl mezi experimentálními a observačními

2 Princip parsimonie (Occamova břitva) Máme-li několik alternativních vysvětlení, správné vysvětlení je to, které je nejjednodušší Modely by měly mít co nejméně parametrů Lineární modely mají přednost před nelineárními Experimenty spoléhající na méně předpokladů jsou upřednostňovány před experimenty založenými na více předpokladech Jednodušší vysvětlení jsou upřednostňována před složitějšími

3 Parsimonie a modelování v S-Plus Při modelování je proměnná ponechána v modelu jen tehdy, jestliže způsobí statisticky průkazný vzrůst variability při odstranění z modelu Model by měl být tak jednoduchý jak je to možné. Ale nikoli jednodušší. (A. Einstein)

4 Pozorování, teorie a experiment navzájem promyšleně kombinované jsou nejlepší cestou k řešení vědeckých problémů

5 Opakování dělá n Děláme-li stejnou věc s různými jedinci, dostaneme různé výsledky Příčiny jsou různé: genotyp, věk, pohlaví, substrát, mikroklima Cílem je zvýšit spolehlivost odhadu parametrů a jejich rozptylu

6 Co je správné opakování Měření musí být nezávislá: opakovaná měření stejného jedince nebo na stejném místě nejsou nezávislá Nesmítvořit časovou řadu: data sbíraná na stejném místě při různých příležitostech nejsou nezávislá Nesmí se dávat dohromady z jednoho místa: nejsou pak prostorově nezávislá Měření musí být prováděno ve správném prostorovém měřítku

7 Co je ideální opakování Jedno opakování z každého typu ošetření je uspořádáno do bloku a tyto bloky jsou mnohokrát opakovány

8 Jak mnoho opakování Tak mnoho jak si můžete dovolit 30; menší vzorek je malý, větší je velký; není to ale vždycky pravda Správnou minimální velikost vzorku lze spočítat; potřebujeme k tomu pilotní studii

9 Opakování nebo bloky? Mnoho opakování v malém počtu bloků? Mnoho bloků bez opakování uvnitř bloku? Většinou lepší více bloků, protože variabilita je většinou veliká Opakování uvnitř bloku ale umožňuje specifikovat interakci (blok) x (ošetření) a tak odhadnout podíl chyby měření

10 Znáhodnění (randomizace) Náhodně vybraný objekt zájmu je takový objekt, který splňuje podmínku, že měl stejnou šanci být vybrán jako všechny ostatní objekty zájmu Dělejte to tak, jak říkám, nikoli tak, jak to dělám

11

12 Znáhodnění (randomizace) Toxikologický test na broucích potemnících Kontaktní insekticidy: 4 typy + kontrola, pro každé ošetření a kontrolu 3 Petriho misky, na každou misku 10 brouků

13 Síla testu lová hypotéza jata Skutečná situace Pravda Nepravda Správné rozhodnutí Chyba II. druhu mítnuta Chyba I. druhu Správné rozhodnutí t zamítnutí nulové hypotézy když je nepravdivá uvisí s chybou II. druhu (beta) m menší bude chyba II. druhu, tím větší bude chyba I. druhu (al ětšinou pracujeme s alfa = 0,05 a beta = 0,2; síla testu (1 beta) k rovna 0,8 to síla testu se konvenčně používá k výpočtu velikosti vzorku, k nutný k určení definované velikosti rozdílu mezi vzorky pro ámou nebo odhadnutou standardní chybu (např. z pilotní studie)

14 Experimentální studie 1. Formulujte jasnou hypotézu Musí být jednoznačná, tj. nesmí být vysvětlitelná jinými jevy než navrhujete 2. Navrhněte, jak ji testovat Test musí jednoznačně říci, zda je či není hypotéza pravdivá Spousta experimentů je dělána bez jasné hypotézy; jejich výsledky pak lze vysvětlit milióny příčin

15 Observační studie Můžeme mezi ně zahrnout i tzv. přírodní experimenty (popis situace po výbuchu sopky, na výsypce apod.) Při zisku informací z observačních studií, které zpravidla představují jediná dostupná data, musíme brát v úvahu všechny limitace těchto dat (neortogonalita, absence kontroly, chybějící opakování atd.) Výsledky tak často mají spíše charakter hypotéz než jejich potvrzení či zamítnutí

16 Jak dlouho jev zkoumat O délce bychom měli rozhodnout před počátkem experimentu Většina ekologických experimentů patrně probíhá příliš krátkou dobu; krátkodobá dynamika např. po disturbanci (narušení) prostředí přitom může být úplně jiná než její dlouhodobé důsledky (Podobně krátkozraké může být nedostatečně dlouhé sledování efektů např. v medicínském výzkumu)

17 Vedle ošetření vždy potřebujete kontrolu Bez kontrolních pokusů nemůžete dospět k žádným věrohodným závěrům

18 Rozptyl roste s průměrem (Taylorův mocninový zákon) Základní statistické aplikace jako regrese a ANOVA ale předpokládají, že rozptyl vzorků je konstatní Vysvětlovanou proměnnou je proto zpravidla potřeba logaritmovat abychom rozptyl stabilizovali V S-Plusu můžeme místo logaritmování využít různých transformačních funkcí

19 Pseudoreplikace Vznikají tehdy, když analyzujeme data jako by měly více stupňů volnosti než ve skutečnosti mají Časové pseudoreplikace: opakovaná měření na jednom místě v čase Opakovaná měření na stejném jedinci Prostorové pseudoreplikace: např. několik měření v těsné blízkosti vedle sebe

20 Pseudoreplikace Porušují jeden ze základních předpokladů řádné statistické analýzy: nezávislost chyb Opakovaná měření v čase na stejném jedinci nebudou mít nezávislé chyby díky tomu, že zvláštnosti měřeného jedince se projeví ve všech měřeních tohoto jedince Vzorky brané ze stejného kousku pole nebudou mít nezávislé chyby protože zvláštnosti tohoto kousku pole se projeví ve všech měřeních (budeme-li např. měřit výnos, může být tento kousek pole mimořádně úrodný či naopak

21 Pseudoreplikace: příklad s použitím insekticidů 20 ploch: 10 ošetřených a 10 neošetřených Na každé ploše je 50 rostlin Na každé rostlině je počítán hmyz 5 x za sezónu Experiment má 20 x 50 x 5 = čísel; kolik má stupňů volnosti pro měření chyby? Proč nemá pokus stupňů volnosti pro měření chyby, ale jen 18?

22 Jak analyzovat pseudoreplikovaná data Analyzovat průměry s pseudoreplikací (předchozí příklad) Analyzovat každý časový úsek zvlášť Použít analýzu časových řad nebo smíšené modely (mixed models)

23 Měření počátečních podmínek Na počátku pokusu by měly být všechny experimentální jednotky shodné; to je ale třeba dokázat Nejsme-li schopni prokázat homogenitu jednotek na počátku experimentu, je vždy možné přisoudit konečný rozdíl v experimentu rozdílu v počátečních podmínkách Nejjednodušší a zároveň zpravidla nejdůležitější bývá zjištění, zda jsou organismy na počátku experimentu stejně velké (např. v růstových experimentech)

24 Ortogonální vs. neortogonální uspořádání Ortogonální data - zpravidla plánované experimenty: všechny kombinace ošetření jsou rovnocenně zastoupeny; s výjimkou nehod nejsou žádné chybějící hodnoty Neortogonální uspořádání observační data, ve kterých nemáme žádnou kontrolu nad množstvím individuí použitých pro analýzu; zastoupení kombinací pro ošetření není proto rovnocenné

25 Ortogonální vs. neortogonální data: rozdíly v analýze Při ortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru konstantní a nezávisí na pořadí, v jakém je faktor z modelu odstraňován Při neortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru závislá na pořadí, v jakém jsou faktory z modelu odstraňovány

26 Chybějící hodnoty Mohou se objevit v každém typu analýzy Vždy způsobují naředění experimentu S-Plus si sice umí s chybějícími hodnotami poradit, ale vždy to je na úkor dosažených výsledků: menší d.f., nafouknuté standardní chyby -> snížení psti, že dosáhneme průkazné výsledky

27 Fixní a náhodné efekty Fixní efekty jsou takové, které vyvolává experimentátor (Model I ANOVA) Náhodné efekty jsou zpravidla místa, kde pokus opakujeme (Model II ANOVA)

28 Fixní a náhodné efekty Často jsou experimentálně kombinované Například různá společenstva slouží jako statistické bloky (náhodný efekt), ve kterých aplikujeme ošetření (fixní efekt)

29 Fixní a náhodné efekty V případě fixních efektů předpokládáme, že příčina odlišností je v působení efektů V případě náhodných efektů buď pouze víme, že působení je odlišné, ale nevíme proč, a nebo to sice víme, ale zajímá nás, jak naše ošetření působí v různých případech (např. fixní efekt odrůdy na různě úrodných půdách, které představují statistický blok)

30 Experimentální uspořádání Mějme faktor (kategorická proměnná) se 4 úrovněmi, s 8 opakováními každé úrovně (4 x 8 = 32 čísel) Předpokládejme, že jde o polní experiment prováděný na 32 polích

31 Zcela znáhodnělé uspořádání (completely randomized design) 32 papírků s opakováními (8 pro každou ze 4 úrovní faktoru), které představují jednotlivá pole, vytáhneme z klobouku Tento postup nejlépe zabraňuje zkreslení výsledků (bias)

32 Zcela znáhodnělé uspořádání: slabiny Aplikovat 4 typy ošetření na 32 ploch bude prakticky obtížné Budou-li od sebe plochy vzdálené a v určité oblasti přitom budou plochy podobné, může se nám navíc stát, že ošetření v určité oblasti budou spleteny (confounded) s charakterem dané oblasti

33 Zcela znáhodnělé uspořádání: Příklad v S-Plus

34 Stratifikované náhodné uspořádání (stratified random sampling; stratum = vrstva) Pole rozdělené do vrstev V každé vrstvě je jedna plocha pro každé ošetření (v našem příkladu 4 plochy) Počet vrstev je je tedy velikost experimentu (32) dělená počtem ošetření (32/4 = 8) Ošetření je přiřazováno každé ploše v rámci vrstvy náhodně

35 Stratifikované náhodné uspořádání Každé ošetření má stejnou pst objevit se na každé ploše Existují-li systematické rozdíly v kvalitě ploch, stratifikované náhodné uspořádání je může vzít v úvahu

36 byste uspořádali vrstvy? Rovnoběžně s gradient osti (a) nebo kolmo na gradient (b)? řípadě (a) mají všechny vrstvy stejnou průměrno ost, ale každá vrstva je vnitřně heterogenní; ípadě (b) je každá vrstva vnitřně homogenní, ale jinou průměrnou vlhkost

37 erete-li případ (a), Vaše 4 plochy budou tvořeny hou velmi vlhkou, vlhkou, suchou a velmi such ž každé vrstvě náhodně přidělíte ošetření, přede, že efekt ošetření bude spleten (counfouded) s tem plochy. Musíte věřit, že znáhodnění proběh že se efekty plochy vyruší (ale proč by se to mě?)

38 erete-li případ (b), Vaše 4 plochy budou mít nou vlhkost, takže efekt ošetření nebude spleten tem plochy. Průměrná odpověď nebude v každé vě stejná, protože bude záviset na vlhkosti. Můž věřit tomu, že v každé vrstvě odpovídající určité osti dostanete nespletený efekt ošetření.

39 řípadě (b) se tedy průměrný výnos bude lišit me vami, ale to je výhoda, nikoli nevýhoda. Efekt vy lze totiž odstranit jako statistický blok v průu analýzy variance. Variabilita uvnitř vrstvy se t čně zmenší, protože veškerá variabilita působená ostí bude z modelu odstraněna. Zbylou variabil eme přisoudit rozdílům mezi ošetřeními.

40 inou tohoto přístupu však zůstává možnost, že otný efekt ošetření může na vlhkosti záviset. To t interakce (ošetření) x (vlhkost). Abychom mo ťovat jeho vliv, musí být ošetření opakováno v dé vrstvě. Chyba, která nám zbude, už je pak čis ba měření.

41 Stratifikované náhodné uspořádání Příklad v S-Plus

42 Latinské čtverce radient může být vícesměrný; může se např. týka roveň vlhkosti a obsahu živin

43 Latinské čtverce ude-li gradient takový, jak znázorňuje obr., pak s ošetřeními můžeme vytvořit 4 x 4 = 16 ploch jednom čtverci a opakovat celé uspořádání dvak získáme naše n = 32.

44 Latinské čtverce: omezené znáhodnění D A C B C D B A B C A D A B D C

45 Latinské čtverce: omezené znáhodnění Příklad v S-Plus

46 Faktoriální vs. hierarchické uspořádání (Factorial vs. nested desing)

47

48 Faktoriální uspořádání Zjišťování, zda úroveň jednoho faktoru závisí na úrovni jiného faktoru

49 Faktoriální uspořádání: pozor na počet vysvětlujících proměnných Vysvětlovaná proměnná účinek léku Vysvětlující proměnné pohlaví (2 úrovně), věk (3), rasa (3), zaměstnání (4), vzdělání (3), životní úroveň (3), kuřácký návyk (2) Počet kombinací v pokusu = 2 x 3 x 3 x 4 x 3 x 3 x 2 = 1296 Minimální počet pozorování = 1296 x 2 = 2 592

50 Faktoriální vs. hierarchické uspořádání Uspořádání je faktoriální, jestliže: Jestliže máme opakování pro každý interakční člen Kombinace ošetření jsou navzájem nezávislé Kombinace ošetření jsou náhodné

51 Faktoriální vs. hierarchické uspořádání: příklad na (ne)závislost ošetření Vysvětlovaná proměnná je růst hmyzu Vysvětlující proměnné typ potravy (5 typů, na každé potravě tři opakování) a teplota (4 teploty ve čtyřech různých klimatických komorách) Kolik klimatických komor potřebujeme, aby šlo o faktoriální experiment?

52 Faktoriální vs. hierarchické uspořádání: příklad na (ne)závislost ošetření 5 potrav s 3 opakováními = 15 komor pro každou teplotu Teploty jsou 4 = 4 x 15 = 60 komor Protože komory máme čtyři, nemůže jít o faktoriální uspořádání (Jde o split plot uspořádání)

53 Uspořádání dělením ploch: splitplot design Různé typy ošetření jsou aplikované na různě velké plochy

54 Split plot design příklad

55 Split-plot design: analýza Ošetření (= faktor) jsou aplikována na plochy různé velikosti Každá plocha má proto jinou nevysvětlenou variabilitu (error term), přes kterou testujeme význam ošetření (faktoru), který byl na plochu aplikován

56 Split-plot design: analýza Tři typy ošetření (=faktory): Zavlažování (ano, ne = 2 úrovně faktoru) Hustota porostu (nízká, stření vysoká = 3 úrovně faktoru) Hnojení (slabé, střední, silné = 3 úrovně faktoru) Opakování ve 4 blocích (= pole) Celkem 4 x 3 x 3 x 2 = 72 výnosů (= vysvětlovaná proměnná)

57 Split-plot design: analýza Začínáme ošetřením (= faktorem) aplikovaným na největší ploše a pokračujeme v hierarchii ošetření směrem dolů, tj. na menší plochy V každém stádiu analýzy je správná nevysvětlená variabilita, přes kterou testujeme efekt ošetření (tj. Error) interakce mezi blokem a všemi faktory v hierarchii výše

58 Závlaha Zdroj SS df MS F Závlaha Blok (NS) Chyba (Z)x(B) ro závlahu máme jen 8 čísel (4 bloky x 2 úrovně závlahy), ne 72 upně volnosti jsou proto 7 celkem, 4-1=3 pro bloky, 2-1=1 pro lahy a 7-3-1=3 pro chybu

59 Porost roj SS df MS F rost orost) x (Závlaha) yba (P)x(Z) + )x(z)x(b)

60 Hnojení roj SS df MS F ojivo nojivo) x (Závlaha) nojivo) x (Porost) NS nojivo) x (Porost) x ávlaha) NS yba (H)x(P)x(Z)x(B) + )x(z)x(b) + (H)x(B)

61 Split plot analýza testování pomocí nevysvětlené variability Je to vždy interakce Je vždy tvořena faktorem, který právě testujeme, plus všemi faktory v hierarchii výše Stupněvolnosti postupně stoupají s tím, jak jdeme v hierarchii níže

62 Efektivní uspořádání regresní analýzy Dva kontrastní případy pro zdroje omezené na 14 experimentálních opakování

63 Nejednodušší je uspořádat všechna měření ve stejně vzdálených valech podél osy x. To je nejefektivnější pro nalezení prahové ho ty efektu a nelinearity jeho působení. Je to ale nejméně efektivní ořádání pro minimalizaci standardní chyby regresního sklonu. Standardní chyba regresního sklonu roste rozptylem chyby a klesá s rostoucím rozsahem hodnot podél osy x 2 s SE y = SSX

64 Výhodou tohoto uspořádání je, že má opakování pro každou dnotu x, takže umožňuje odhad chyby vzorku nezávisle na regre onu. Tím umožňuje v nejvyšší možné míře testy významnosti chylek regresního sklonu od linearity

65 Kompromisní uspořádání mající opakování pro měřené hodnoty kže umožňuje nezávislé testování chyby vzorku), ale s větším po opakování na obou koncích (takže se zmenšuje standardní chy hadu regresního sklonu, protože se zvětšuje hodnota SSX). 2 s SE y = SSX

66 Podobný kompromis, s menší standardní chybou sklonu, ale tak enší schopností detekovat nelinearitu.

67 Toto uspořádání by bylo rozumné, pokud bychom věděli, že zálost bude mocninová. Bylo by ale nerozumné pro sigmoidní záv t (neodhalilo by totiž nelinearitu). Mocninová závislost Sigmoidní závislost

68 Jako (e), ale extrémnější. Dává dobrý odhad standardní chyby onu, pokud se ukáže, že vztah je lineární. 2 s SE y = SSX

69 Je-li vztah lineární, toto uspořádání vede k nejmenší standardní ybě. Neumožňuje však detekovat nelinearitu. 2 s SE y = SSX