Princip parsimonie (Occamova břitva)

Rozměr: px
Začít zobrazení ze stránky:

Download "Princip parsimonie (Occamova břitva)"

Transkript

1 Plánování pokusů Replikace (opakování) kvůli spolehlivosti (reliability) Randomizace (znáhodnění) kvůli zabránění zkreslení výsledků (bias) Princip parsimonie Síla statistického testu Kontroly Efektivní experimentální uspořádání Rozpoznání pseudoreplikací Rozdíl mezi experimentálními a observačními

2 Princip parsimonie (Occamova břitva) Máme-li několik alternativních vysvětlení, správné vysvětlení je to, které je nejjednodušší Modely by měly mít co nejméně parametrů Lineární modely mají přednost před nelineárními Experimenty spoléhající na méně předpokladů jsou upřednostňovány před experimenty založenými na více předpokladech Jednodušší vysvětlení jsou upřednostňována před složitějšími

3 Parsimonie a modelování v S-Plus Při modelování je proměnná ponechána v modelu jen tehdy, jestliže způsobí statisticky průkazný vzrůst variability při odstranění z modelu Model by měl být tak jednoduchý jak je to možné. Ale nikoli jednodušší. (A. Einstein)

4 Pozorování, teorie a experiment navzájem promyšleně kombinované jsou nejlepší cestou k řešení vědeckých problémů

5 Opakování dělá n Děláme-li stejnou věc s různými jedinci, dostaneme různé výsledky Příčiny jsou různé: genotyp, věk, pohlaví, substrát, mikroklima Cílem je zvýšit spolehlivost odhadu parametrů a jejich rozptylu

6 Co je správné opakování Měření musí být nezávislá: opakovaná měření stejného jedince nebo na stejném místě nejsou nezávislá Nesmítvořit časovou řadu: data sbíraná na stejném místě při různých příležitostech nejsou nezávislá Nesmí se dávat dohromady z jednoho místa: nejsou pak prostorově nezávislá Měření musí být prováděno ve správném prostorovém měřítku

7 Co je ideální opakování Jedno opakování z každého typu ošetření je uspořádáno do bloku a tyto bloky jsou mnohokrát opakovány

8 Jak mnoho opakování Tak mnoho jak si můžete dovolit 30; menší vzorek je malý, větší je velký; není to ale vždycky pravda Správnou minimální velikost vzorku lze spočítat; potřebujeme k tomu pilotní studii

9 Opakování nebo bloky? Mnoho opakování v malém počtu bloků? Mnoho bloků bez opakování uvnitř bloku? Většinou lepší více bloků, protože variabilita je většinou veliká Opakování uvnitř bloku ale umožňuje specifikovat interakci (blok) x (ošetření) a tak odhadnout podíl chyby měření

10 Znáhodnění (randomizace) Náhodně vybraný objekt zájmu je takový objekt, který splňuje podmínku, že měl stejnou šanci být vybrán jako všechny ostatní objekty zájmu Dělejte to tak, jak říkám, nikoli tak, jak to dělám

11

12 Znáhodnění (randomizace) Toxikologický test na broucích potemnících Kontaktní insekticidy: 4 typy + kontrola, pro každé ošetření a kontrolu 3 Petriho misky, na každou misku 10 brouků

13 Síla testu lová hypotéza jata Skutečná situace Pravda Nepravda Správné rozhodnutí Chyba II. druhu mítnuta Chyba I. druhu Správné rozhodnutí t zamítnutí nulové hypotézy když je nepravdivá uvisí s chybou II. druhu (beta) m menší bude chyba II. druhu, tím větší bude chyba I. druhu (al ětšinou pracujeme s alfa = 0,05 a beta = 0,2; síla testu (1 beta) k rovna 0,8 to síla testu se konvenčně používá k výpočtu velikosti vzorku, k nutný k určení definované velikosti rozdílu mezi vzorky pro ámou nebo odhadnutou standardní chybu (např. z pilotní studie)

14 Experimentální studie 1. Formulujte jasnou hypotézu Musí být jednoznačná, tj. nesmí být vysvětlitelná jinými jevy než navrhujete 2. Navrhněte, jak ji testovat Test musí jednoznačně říci, zda je či není hypotéza pravdivá Spousta experimentů je dělána bez jasné hypotézy; jejich výsledky pak lze vysvětlit milióny příčin

15 Observační studie Můžeme mezi ně zahrnout i tzv. přírodní experimenty (popis situace po výbuchu sopky, na výsypce apod.) Při zisku informací z observačních studií, které zpravidla představují jediná dostupná data, musíme brát v úvahu všechny limitace těchto dat (neortogonalita, absence kontroly, chybějící opakování atd.) Výsledky tak často mají spíše charakter hypotéz než jejich potvrzení či zamítnutí

16 Jak dlouho jev zkoumat O délce bychom měli rozhodnout před počátkem experimentu Většina ekologických experimentů patrně probíhá příliš krátkou dobu; krátkodobá dynamika např. po disturbanci (narušení) prostředí přitom může být úplně jiná než její dlouhodobé důsledky (Podobně krátkozraké může být nedostatečně dlouhé sledování efektů např. v medicínském výzkumu)

17 Vedle ošetření vždy potřebujete kontrolu Bez kontrolních pokusů nemůžete dospět k žádným věrohodným závěrům

18 Rozptyl roste s průměrem (Taylorův mocninový zákon) Základní statistické aplikace jako regrese a ANOVA ale předpokládají, že rozptyl vzorků je konstatní Vysvětlovanou proměnnou je proto zpravidla potřeba logaritmovat abychom rozptyl stabilizovali V S-Plusu můžeme místo logaritmování využít různých transformačních funkcí

19 Pseudoreplikace Vznikají tehdy, když analyzujeme data jako by měly více stupňů volnosti než ve skutečnosti mají Časové pseudoreplikace: opakovaná měření na jednom místě v čase Opakovaná měření na stejném jedinci Prostorové pseudoreplikace: např. několik měření v těsné blízkosti vedle sebe

20 Pseudoreplikace Porušují jeden ze základních předpokladů řádné statistické analýzy: nezávislost chyb Opakovaná měření v čase na stejném jedinci nebudou mít nezávislé chyby díky tomu, že zvláštnosti měřeného jedince se projeví ve všech měřeních tohoto jedince Vzorky brané ze stejného kousku pole nebudou mít nezávislé chyby protože zvláštnosti tohoto kousku pole se projeví ve všech měřeních (budeme-li např. měřit výnos, může být tento kousek pole mimořádně úrodný či naopak

21 Pseudoreplikace: příklad s použitím insekticidů 20 ploch: 10 ošetřených a 10 neošetřených Na každé ploše je 50 rostlin Na každé rostlině je počítán hmyz 5 x za sezónu Experiment má 20 x 50 x 5 = čísel; kolik má stupňů volnosti pro měření chyby? Proč nemá pokus stupňů volnosti pro měření chyby, ale jen 18?

22 Jak analyzovat pseudoreplikovaná data Analyzovat průměry s pseudoreplikací (předchozí příklad) Analyzovat každý časový úsek zvlášť Použít analýzu časových řad nebo smíšené modely (mixed models)

23 Měření počátečních podmínek Na počátku pokusu by měly být všechny experimentální jednotky shodné; to je ale třeba dokázat Nejsme-li schopni prokázat homogenitu jednotek na počátku experimentu, je vždy možné přisoudit konečný rozdíl v experimentu rozdílu v počátečních podmínkách Nejjednodušší a zároveň zpravidla nejdůležitější bývá zjištění, zda jsou organismy na počátku experimentu stejně velké (např. v růstových experimentech)

24 Ortogonální vs. neortogonální uspořádání Ortogonální data - zpravidla plánované experimenty: všechny kombinace ošetření jsou rovnocenně zastoupeny; s výjimkou nehod nejsou žádné chybějící hodnoty Neortogonální uspořádání observační data, ve kterých nemáme žádnou kontrolu nad množstvím individuí použitých pro analýzu; zastoupení kombinací pro ošetření není proto rovnocenné

25 Ortogonální vs. neortogonální data: rozdíly v analýze Při ortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru konstantní a nezávisí na pořadí, v jakém je faktor z modelu odstraňován Při neortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru závislá na pořadí, v jakém jsou faktory z modelu odstraňovány

26 Chybějící hodnoty Mohou se objevit v každém typu analýzy Vždy způsobují naředění experimentu S-Plus si sice umí s chybějícími hodnotami poradit, ale vždy to je na úkor dosažených výsledků: menší d.f., nafouknuté standardní chyby -> snížení psti, že dosáhneme průkazné výsledky

27 Fixní a náhodné efekty Fixní efekty jsou takové, které vyvolává experimentátor (Model I ANOVA) Náhodné efekty jsou zpravidla místa, kde pokus opakujeme (Model II ANOVA)

28 Fixní a náhodné efekty Často jsou experimentálně kombinované Například různá společenstva slouží jako statistické bloky (náhodný efekt), ve kterých aplikujeme ošetření (fixní efekt)

29 Fixní a náhodné efekty V případě fixních efektů předpokládáme, že příčina odlišností je v působení efektů V případě náhodných efektů buď pouze víme, že působení je odlišné, ale nevíme proč, a nebo to sice víme, ale zajímá nás, jak naše ošetření působí v různých případech (např. fixní efekt odrůdy na různě úrodných půdách, které představují statistický blok)

30 Experimentální uspořádání Mějme faktor (kategorická proměnná) se 4 úrovněmi, s 8 opakováními každé úrovně (4 x 8 = 32 čísel) Předpokládejme, že jde o polní experiment prováděný na 32 polích

31 Zcela znáhodnělé uspořádání (completely randomized design) 32 papírků s opakováními (8 pro každou ze 4 úrovní faktoru), které představují jednotlivá pole, vytáhneme z klobouku Tento postup nejlépe zabraňuje zkreslení výsledků (bias)

32 Zcela znáhodnělé uspořádání: slabiny Aplikovat 4 typy ošetření na 32 ploch bude prakticky obtížné Budou-li od sebe plochy vzdálené a v určité oblasti přitom budou plochy podobné, může se nám navíc stát, že ošetření v určité oblasti budou spleteny (confounded) s charakterem dané oblasti

33 Zcela znáhodnělé uspořádání: Příklad v S-Plus

34 Stratifikované náhodné uspořádání (stratified random sampling; stratum = vrstva) Pole rozdělené do vrstev V každé vrstvě je jedna plocha pro každé ošetření (v našem příkladu 4 plochy) Počet vrstev je je tedy velikost experimentu (32) dělená počtem ošetření (32/4 = 8) Ošetření je přiřazováno každé ploše v rámci vrstvy náhodně

35 Stratifikované náhodné uspořádání Každé ošetření má stejnou pst objevit se na každé ploše Existují-li systematické rozdíly v kvalitě ploch, stratifikované náhodné uspořádání je může vzít v úvahu

36 byste uspořádali vrstvy? Rovnoběžně s gradient osti (a) nebo kolmo na gradient (b)? řípadě (a) mají všechny vrstvy stejnou průměrno ost, ale každá vrstva je vnitřně heterogenní; ípadě (b) je každá vrstva vnitřně homogenní, ale jinou průměrnou vlhkost

37 erete-li případ (a), Vaše 4 plochy budou tvořeny hou velmi vlhkou, vlhkou, suchou a velmi such ž každé vrstvě náhodně přidělíte ošetření, přede, že efekt ošetření bude spleten (counfouded) s tem plochy. Musíte věřit, že znáhodnění proběh že se efekty plochy vyruší (ale proč by se to mě?)

38 erete-li případ (b), Vaše 4 plochy budou mít nou vlhkost, takže efekt ošetření nebude spleten tem plochy. Průměrná odpověď nebude v každé vě stejná, protože bude záviset na vlhkosti. Můž věřit tomu, že v každé vrstvě odpovídající určité osti dostanete nespletený efekt ošetření.

39 řípadě (b) se tedy průměrný výnos bude lišit me vami, ale to je výhoda, nikoli nevýhoda. Efekt vy lze totiž odstranit jako statistický blok v průu analýzy variance. Variabilita uvnitř vrstvy se t čně zmenší, protože veškerá variabilita působená ostí bude z modelu odstraněna. Zbylou variabil eme přisoudit rozdílům mezi ošetřeními.

40 inou tohoto přístupu však zůstává možnost, že otný efekt ošetření může na vlhkosti záviset. To t interakce (ošetření) x (vlhkost). Abychom mo ťovat jeho vliv, musí být ošetření opakováno v dé vrstvě. Chyba, která nám zbude, už je pak čis ba měření.

41 Stratifikované náhodné uspořádání Příklad v S-Plus

42 Latinské čtverce radient může být vícesměrný; může se např. týka roveň vlhkosti a obsahu živin

43 Latinské čtverce ude-li gradient takový, jak znázorňuje obr., pak s ošetřeními můžeme vytvořit 4 x 4 = 16 ploch jednom čtverci a opakovat celé uspořádání dvak získáme naše n = 32.

44 Latinské čtverce: omezené znáhodnění D A C B C D B A B C A D A B D C

45 Latinské čtverce: omezené znáhodnění Příklad v S-Plus

46 Faktoriální vs. hierarchické uspořádání (Factorial vs. nested desing)

47

48 Faktoriální uspořádání Zjišťování, zda úroveň jednoho faktoru závisí na úrovni jiného faktoru

49 Faktoriální uspořádání: pozor na počet vysvětlujících proměnných Vysvětlovaná proměnná účinek léku Vysvětlující proměnné pohlaví (2 úrovně), věk (3), rasa (3), zaměstnání (4), vzdělání (3), životní úroveň (3), kuřácký návyk (2) Počet kombinací v pokusu = 2 x 3 x 3 x 4 x 3 x 3 x 2 = 1296 Minimální počet pozorování = 1296 x 2 = 2 592

50 Faktoriální vs. hierarchické uspořádání Uspořádání je faktoriální, jestliže: Jestliže máme opakování pro každý interakční člen Kombinace ošetření jsou navzájem nezávislé Kombinace ošetření jsou náhodné

51 Faktoriální vs. hierarchické uspořádání: příklad na (ne)závislost ošetření Vysvětlovaná proměnná je růst hmyzu Vysvětlující proměnné typ potravy (5 typů, na každé potravě tři opakování) a teplota (4 teploty ve čtyřech různých klimatických komorách) Kolik klimatických komor potřebujeme, aby šlo o faktoriální experiment?

52 Faktoriální vs. hierarchické uspořádání: příklad na (ne)závislost ošetření 5 potrav s 3 opakováními = 15 komor pro každou teplotu Teploty jsou 4 = 4 x 15 = 60 komor Protože komory máme čtyři, nemůže jít o faktoriální uspořádání (Jde o split plot uspořádání)

53 Uspořádání dělením ploch: splitplot design Různé typy ošetření jsou aplikované na různě velké plochy

54 Split plot design příklad

55 Split-plot design: analýza Ošetření (= faktor) jsou aplikována na plochy různé velikosti Každá plocha má proto jinou nevysvětlenou variabilitu (error term), přes kterou testujeme význam ošetření (faktoru), který byl na plochu aplikován

56 Split-plot design: analýza Tři typy ošetření (=faktory): Zavlažování (ano, ne = 2 úrovně faktoru) Hustota porostu (nízká, stření vysoká = 3 úrovně faktoru) Hnojení (slabé, střední, silné = 3 úrovně faktoru) Opakování ve 4 blocích (= pole) Celkem 4 x 3 x 3 x 2 = 72 výnosů (= vysvětlovaná proměnná)

57 Split-plot design: analýza Začínáme ošetřením (= faktorem) aplikovaným na největší ploše a pokračujeme v hierarchii ošetření směrem dolů, tj. na menší plochy V každém stádiu analýzy je správná nevysvětlená variabilita, přes kterou testujeme efekt ošetření (tj. Error) interakce mezi blokem a všemi faktory v hierarchii výše

58 Závlaha Zdroj SS df MS F Závlaha Blok (NS) Chyba (Z)x(B) ro závlahu máme jen 8 čísel (4 bloky x 2 úrovně závlahy), ne 72 upně volnosti jsou proto 7 celkem, 4-1=3 pro bloky, 2-1=1 pro lahy a 7-3-1=3 pro chybu

59 Porost roj SS df MS F rost orost) x (Závlaha) yba (P)x(Z) + )x(z)x(b)

60 Hnojení roj SS df MS F ojivo nojivo) x (Závlaha) nojivo) x (Porost) NS nojivo) x (Porost) x ávlaha) NS yba (H)x(P)x(Z)x(B) + )x(z)x(b) + (H)x(B)

61 Split plot analýza testování pomocí nevysvětlené variability Je to vždy interakce Je vždy tvořena faktorem, který právě testujeme, plus všemi faktory v hierarchii výše Stupněvolnosti postupně stoupají s tím, jak jdeme v hierarchii níže

62 Efektivní uspořádání regresní analýzy Dva kontrastní případy pro zdroje omezené na 14 experimentálních opakování

63 Nejednodušší je uspořádat všechna měření ve stejně vzdálených valech podél osy x. To je nejefektivnější pro nalezení prahové ho ty efektu a nelinearity jeho působení. Je to ale nejméně efektivní ořádání pro minimalizaci standardní chyby regresního sklonu. Standardní chyba regresního sklonu roste rozptylem chyby a klesá s rostoucím rozsahem hodnot podél osy x 2 s SE y = SSX

64 Výhodou tohoto uspořádání je, že má opakování pro každou dnotu x, takže umožňuje odhad chyby vzorku nezávisle na regre onu. Tím umožňuje v nejvyšší možné míře testy významnosti chylek regresního sklonu od linearity

65 Kompromisní uspořádání mající opakování pro měřené hodnoty kže umožňuje nezávislé testování chyby vzorku), ale s větším po opakování na obou koncích (takže se zmenšuje standardní chy hadu regresního sklonu, protože se zvětšuje hodnota SSX). 2 s SE y = SSX

66 Podobný kompromis, s menší standardní chybou sklonu, ale tak enší schopností detekovat nelinearitu.

67 Toto uspořádání by bylo rozumné, pokud bychom věděli, že zálost bude mocninová. Bylo by ale nerozumné pro sigmoidní záv t (neodhalilo by totiž nelinearitu). Mocninová závislost Sigmoidní závislost

68 Jako (e), ale extrémnější. Dává dobrý odhad standardní chyby onu, pokud se ukáže, že vztah je lineární. 2 s SE y = SSX

69 Je-li vztah lineární, toto uspořádání vede k nejmenší standardní ybě. Neumožňuje však detekovat nelinearitu. 2 s SE y = SSX

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

Smíšené regresní modely a možnosti jejich využití. Karel Drápela Smíšené regresní modely a možnosti jejich využití Karel Drápela Regresní modely Základní úloha regresní analýzy nalezení vhodného modelu studované závislosti vyjádření reálného tvaru závislosti minimalizace

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot

Více

Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných

Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných Výběr metody Jak vybrat správnou statistickou metodu pro moje data a pro otázku, kterou si kladu Neexistuje žádná náhražka za zkušenost nejlepší metoda, jak vědět co dělat, je použít stejnou správnou metodu

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

ANALÝZA ROZPTYLU (ANOVA)

ANALÝZA ROZPTYLU (ANOVA) ANALÝZA ROZPTYLU (ANOVA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Design of Experiment (DOE) Petr Misák. Brno 2017

Design of Experiment (DOE) Petr Misák. Brno 2017 Navrhování experimentů Design of Experiment (DOE) Petr Misák Vysoké učení technické v Brně, Fakulta stavební, Ústav stavebního zkušebnictví Brno 2017 Úvod - Experiment jako nástroj hledání slavné vynálezy

Více

ANOVA PSY252 Statistická analýza dat II

ANOVA PSY252 Statistická analýza dat II ANOVA 9. 11. 2011 PSY252 Statistická analýza dat II Program dnešní přednášky jednofaktorová (one-way) ANOVA faktoriální (two -way) ANOVA ANCOVA (ANOVA s kovariáty) MANOVA (ANOVA s více závislými) ANOVA

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Navrhování experimentů a jejich analýza. Eva Jarošová

Navrhování experimentů a jejich analýza. Eva Jarošová Navrhování experimentů a jejich analýza Eva Jarošová Obsah Základní techniky Vyhodnocení výsledků Experimenty s jedním zkoumaným faktorem Faktoriální experimenty úplné 2 N dílčí 2 N-p Experimenty pro studium

Více

LINEÁRNÍ MODELY. Zdeňka Veselá

LINEÁRNÍ MODELY. Zdeňka Veselá LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu Analýza rozptylu opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu Analýza rozptylu porovnání více průměrů sledujeme F-statistiku: poměr rozptylu mezi skupinami

Více

4. Zpracování číselných dat

4. Zpracování číselných dat 4. Zpracování číselných dat 4.1 Jednoduché hodnocení dat 4.2 Začlenění dat do písemné práce Zásady zpracování vědecké práce pro obory BOZO, PÚPN, LS 2011 4.1 Hodnocení číselných dat Popisná data: střední

Více

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00 Seminární úkol č. 4 Autoři: Klára Čapková (406803), Markéta Peschková (414906) Zdroj dat: EU Kids Online Survey Popis dat Analyzovaná data pocházejí z výzkumu online chování dětí z 25 evropských zemí.

Více

VÝBĚR A JEHO REPREZENTATIVNOST

VÝBĚR A JEHO REPREZENTATIVNOST VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistická analýza dat

Statistická analýza dat Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Aplikovaná statistika v R - cvičení 3

Aplikovaná statistika v R - cvičení 3 Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Design of experiment Návrh experimentu

Design of experiment Návrh experimentu Design of experiment Návrh experimentu 19.7.2010 Co je to experiment Co je to experiment DOE SixSigma Proč se zabývat návrhem experimentu? Motivační příklad Klasický návrh DOE návrh experimentu Znalost

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Varianty výzkumu Kroky výzkumu Výběrový soubor

Varianty výzkumu Kroky výzkumu Výběrový soubor Varianty výzkumu Kroky výzkumu Výběrový soubor Dvě cesty k poznání. Technické kroky ve výzkumu. Zdroje zkreslení výzkumu. Jak vytvořit výběrový soubor. Varianty výzkumu-kvalitativní a kvantitativní Kvalitativní

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Cíle korelační studie

Cíle korelační studie Korelační studie Cíle korelační studie cíle výzkumu v psychologii deskripce predikce explanace kontrola korelační studie popisuje vztah (ko-relaci) mezi proměnnými cíle - deskripce, příp. predikce První

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

DOE (Design of Experiments)

DOE (Design of Experiments) DOE - DOE () DOE je experimentální strategie, při které najednou studujeme účinky několika faktorů, prostřednictvím jejich testování na různých úrovních. Charakteristika jakosti,y je veličina, pomocí které

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Pěstování pokusných rostlin

Pěstování pokusných rostlin zimní semestr 2008/2009 Pěstování pokusných rostlin Přednáška 7: Zakládání pokusů Pěstování pokusných rostlin ZS 2008/2009 cvičení klíčivost a vzcházivost příklady založení pokusu: 15. 10. 2008 foto: 20.

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

Optimalizace provozních podmínek. Eva Jarošová

Optimalizace provozních podmínek. Eva Jarošová Optimalizace provozních podmínek Eva Jarošová 1 Obsah 1. Experimenty pro optimalizaci provozních podmínek 2. EVOP klasický postup využití statistického softwaru 3. Centrální složený návrh model odezvové

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu 1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Zákony hromadění chyb.

Zákony hromadění chyb. Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Design of experiment Návrh experimentu

Design of experiment Návrh experimentu Design of experiment Návrh experimentu 19.7.2010 Cíl kurzu Seznámit studenty s metodologií, postupy a software pro návrh experimentu pomocí teorie a praktických ukázek Kurz je úspěšný pokud: Student si

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 10 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev 3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu živin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se

Více