5 ANALÝZA ROZPTYLU. 5.1 Jednofaktorová analýza rozptylu (ANOVA1)

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "5 ANALÝZA ROZPTYLU. 5.1 Jednofaktorová analýza rozptylu (ANOVA1)"

Transkript

1 5 AALÝZA ROZPTYLU Analýza rozptylu AOVA (z anglického Analysis of Variance) se v technické praxi používá buď ako samostatná technika nebo ako postup umožňuící analýzu zdroů variability u lineárních statistických modelů Cílem e zistit které z kvalitativních nebo kvantitativních faktorů významně ovliňuí sledované veličiny ede přitom o to ak ovliňuí ale zda vůbec ovliňuí V technické praxi se AOVA uplatňue ako samostatná technika v úlohách: (a) Určení vlivu způsobu přípravy vzorků na výsledek analýzy (b) Určení vlivu přístroe lidského faktoru a obsluhy na výsledek měření (c) Zpracování různých mezilaboratorních experimentů (d) Zpracování plánovaných experimentů u kterých se systematicky sledue vliv rozličných faktorů (teploty času koncentrace a dalších) na výsledek reakce či analýzy Podstatou analýzy rozptylu e rozklad celkového rozptylu dat na složky obasněné (známé zdroe variability) a složku neobasněnou o níž se předpokládá že e náhodná ásledně se testuí hypotézy o významnosti ednotlivých zdroů variability Prvním krokem analýzy rozptylu e určit zda de o model analýzy rozptylu s pevnými náhodnými nebo smíšenými efekty Vlastní postup analýzy rozptylu lze rozdělit do pěti kroků imiž sou: Odhad parametrů základního modelu AOVA 2 Testování eho významnosti a konstrukce různých modelů 3 Vyádření složek rozptylů a testování eich významnosti 4 Ověření předpokladu normality a indikace silně vybočuících hodnot 5 Interpretace výsledků s ohledem na zadání dat a eich případné úpravy 5 Jednofaktorová analýza rozptylu (AOVA) Formulace modelu: sledue se faktor A na různých úrovních A A a každé úrovni A i e provedeno n i měření {y i} = n i odel analýzy rozptylu má tvar y i µ i % g i n i kde µ i µ % α i

2 2 a α e efekt i-té úrovně Parametry µ µ a α se odhaduí pomocí odpovídaících výběrových i i i průměrů Celkový počet měření e n i Sloupcový průměr ˆµ představue součet hodnot opakovaného měření y pro úroveň faktoru A dělený počtem opakování n i i i i ˆµ i n i n i y i Celkový průměr e součet všech hodnot y dělený celkovým počtem dat který e roven i průměru sloupcových průměrů ˆµ ˆµ i Pro výpočet odhadu i-tého efektu α lze použít vztah i ˆα i ˆµ i & ˆµ Zavedením efektů vznikne přeurčený model obsahuící o eden parametr více Proto se při odhadu efektů používá omezuící podmínka n i α i 0 a pro vyvážené experimenty α i 0 lasická ednofaktorová analýza rozptylu dat a ruskalo-va-wallisova ednofaktorová analýza rozptylu pořadí dat porovnává střední hodnoty dvou či více úrovní faktoru A čili sloupců v matici dat za účelem určit zda alespoň edna sloupcová střední hodnota se liší od ostatních Statistická významnost e testována F-testem tak že nulová hypotéza H 0 říká Všechny střední hodnoty sou stené proti alternativní H A Alespoň edna střední hodnota se odlišue od ostatních Základní předpoklady ednofaktorové analýzy rozptylu dat Před použitím analýzy rozptylu musí být ověřeny následuící předpoklady o výběru: Data maí normální rozdělení: náhodné chyby g i sou náhodné veličiny s normálním 2 rozdělením a střední hodnotou chyb rovnou nule (0 σ ) 2 2 Rozptyly sloupcových výběrů σ sou stené (homoskedasticita) 3 aždý sloupec e prostým náhodným výběrem ze svého souboru: každý prvek souboru má stenou pravděpodobnost že bude vybrán do výběru Základní předpoklady ruskalova-wallisova testu analýzy rozptylu dat Před použitím analýzy rozptylu musí být ověřeny následuící předpoklady o výběru: ěrná stupnice e přinemenším ordinální 2 Rozdělení souborů musí být stené kromě míry polohy Rozptyly sou stené (homoskedasticita) 3 Všechny sloupce představuí náhodné výběry svých souborů

3 Omezení: velikost výběru může být od několika ednotek až po několik stovek prvků Snad nevětší omezení v datech se týká náhodného výběru ze souboru: když totiž nebude výběr náhodný hladiny významnosti budou nesprávné Testování: součet čtverců odchylek od celkového průměru ˆµ definovaný vztahem 3 lze rozložit na dvě složky S c n i (y i & ˆµ) 2 n i S c [(y i & ˆµ i ) % (ˆµ i & ˆµ)] 2 S A % S R kde S A představue rozptyl mezi ednotlivými úrovněmi daného faktoru S A n i (ˆµ i & ˆµ) 2 a S e rozptyl reziduálnít uvnitř ednotlivých úrovní R S R evychýleným odhadem rozptylu chyb σ 2 e n i (y i & ˆµ i ) 2 e průměrný reziduální čtverec S R dle S S R R & ˆσ2 e Cílem ednofaktorové analýzy e především testování zda sou efekty α i nulové tedy zda ednotlivé úrovně daného faktoru sou statisticky nevýznamně odlišné Testue se nulová hypotéza H 0: α i = 0 i = proti alternativní H σ 2 A: α i 0 i = Při testování se 2 využívá faktu že veličina S e σ 2 A / má χ -rozdělení s ( - ) stupni volnosti a veličina S R / e 2 má nezávislé χ -rozdělení s ( - ) stupni volnosti Jeich podíl má pak F-rozdělení s ( - ) a ( - ) stupni volnosti Testační statistika F e má tvar F e S A S A ( & ) S R S R ( & ) Při platnosti nulové hypotézy H 0 má F e statistika F-rozdělení s ( - ) a ( - ) stupni volnosti Vyde-li F e větší než kvantil F -α( - - ) e nutné nulovou hypotézu H 0 na hladině významnosti α zamítnout a efekty považovat za nenulové čili statisticky významné Vícenásobné porovnávání (ultiple Comparison Procedure CP) dyž AOVA určí že faktor A e statisticky významný e možné nalézt úrovně faktoru A které se významně liší od ostatních Druhy porovnávacích metod CP Volba porovnávací metody e ovlivněna odpovědí na následuící dvě otázky: () Víme už v průběhu experimentu co chceme porovnávat? (2)

4 4 Zaímáme se o všechny nebo enom o některá porovnání? Budeme přitom rozlišovat dva typy chyb chyby typu metodického a chyby typu experimen-tálního etodická chyba δ: každé porovnání dvou průměrů se bere ako ediný test který se provedl a označue se δ Pomovou ednotkou e proto chyba pro edno porovnání Ostatní testy na datech sou pak ignorovány vzhledem k výpočtu hodnoty chyby Experimentální chyba δ f : hodnota chyby vyšla ze skupiny nezávislých testů Je to pravděpodobnost nabytí edné či více chyb typu I ve skupině nezávislých porovnání Označíme tuto chybu u skupiny nezávislých testů δ f Vztah mezi oběma typy chyb e δ f & ( & δ) c kde c e celkový počet porovnání provedených v úloze Definice metod CP Všechny CP metody předpokládaí nezávislost mezi úrovněmi faktoru čili sloupcovými výběry homoskedasticitu a normalitu (kromě ruskalova- Wallisova testu) Budiž ȳ i sloupcový průměr a n i velikost sloupcového výběru i-tého 2 sloupce s představue průměrný čtverec chyb způsobených - stupni volnosti a při uvažování úrovní faktoru A Vícenásobné porovnávání může být provedeno () automaticky kdy každý sloupcový průměr e porovnáván s každým nebo (2) plánovaně dle zadaných váhových koeficientů C i = kdy budeme porovnávat určité vybrané i sloupce s inými vybranými sloupci Jestliže všechny koeficienty C vykazuí součet rovný i nule porovnání se nazývá kontrast oeficienty C i se zadávaí následuícím způsobem: chceme například pro 6 sloupců porovnat pouze první dva sloupcové průměry s posledními dvěma tzn vyčíslit významnost rozdílů ȳ 5 & ȳ ȳ 5 & ȳ 2 ȳ 6 & ȳ ȳ 6 & ȳ 2 což zapíšeme pomocí vahových koeficientů: C = - C = - C = 0 C = 0 C = C = Všimněte si že suma vahových koeficientů musí dávat nulu a porovnání e proto kontrastem Bonferroniho porovnání všech párů Test má odhalit které páry se liší Zvolí se metodická chyba δ tak že bude korigovat požadovanou experimentální chybu δ f Je-li sloupcových průměrů a záem vyšetřit všechny možné kombinace párů sloupcových průměrů metodická chyba δ e definována vztahem: δ *ȳ i & ȳ * s 2 n i δ f & a testační kritérium statistické významnosti testovaných párů e pro ν = - stupňů volnosti a γ = α dáno vztahem % n $ t γν Bonferroniho porovnání sloupců vůči kontrolnímu Jestliže eden sloupec bude představovat kontrolní sloupec a všechny ostatní sloupce budeme porovnávat s kontrolním půde o ν = - porovnání Zvolíme metodickou chybu δ dle vzorce 7

5 5 δ δ f 2( & ) Standardní porovnání Plánovaný test významnosti určitého zvoleného porovnání který se týká metodické chyby Zadává se edna z porovnávacích voleb: (a) standardního porovnání (b) porovnání ortogonálními polynomy (c) porovnání každého sloupce s prvním (d) porovnání každého sloupce s posledním (e) porovnání při více než třech uživatelských kontrastech a další volby astavíme hladinu metodické chyby tak že dosáhneme specifické hodnoty celkové chyby Studentovo testační kritérium významnosti sloupcových průměrů testovaných párů e pro ν = - stupňů volnosti a γ = α/2 dáno vztahem s * C ȳ * C 2 n $ t γν Uvedeme ukázku zadání způsobu (a) standardního porovnání : pro například = 4 úrovně faktoru A máme k dispozici tři volby porovnání sloupcových průměrů Všimněte si že suma vahových koeficientů dává vždy nulu čili de o kontrast Váhové koeficienty C Provádí porovnání sloupcových průměrů: -3 Porovnává průměr sloupce s průměry všech vyšších ostatních t s průměry 2 3 a 4 sloupce 0-2 Porovnává průměr 2 sloupce s průměry všech vyšších ostatních t s průměry 3 a 4 sloupce Porovnává průměr 3 sloupce s průměry všech vyšších ostatních t s průměry 4 sloupce ruskalovo-wallisovo porovnání Z-skóre Hodnoty Z-skóre (standardizovaná veličina kdy od prvků sloupce e odečten sloupcový průměr a pak sou poděleny směrodatnou odchylkou) sou zde využity k porovnání sloupcových mediánů v páru při nesplnění předpokladů výběrové normality Test však vyžadue výběr o minimální četnosti n = 5 (a lépe eště vyšší) v každé úrovni faktoru A Hladina chyby e nastavena na základě i metodické chyby tak aby poskytla experimentální hladinu chyby δ f Za střední hodnoty může test užít vedle mediánu také průměr pořadí ak e zřemé ze vzorce pro δ δ f /( & ) porovnávaící sloupec i se sloupcem ( % ) 2 * R i & R * n i % n $ z α kde e celkový počet prvků n e počet prvků v i-tém sloupci R e suma pořadí v i-tém i i sloupci Rozdělení z e normální se střední hodnotou nula a rozptylem edna Je-li i

6 6 vypočtená hodnota z pro dva sloupce (i a ) větší než kritická hodnota pak se sloupcové i průměry významně liší Scheffeho porovnání Vyšetřue všechna možná porovnání sloupcových průměrů Testační kritérium významnosti pro páry sloupcových průměrů e pro - a pro ν = - stupňů volnosti rovno nebo větší než ( & ) F α&ν Je stené ako Bonferroniho porovnání Postup ednofaktorové analýzy rozptylu (AOVA) Vstupem e tabulka dat obsahuící pro ednotlivé sloupce čili úrovně A A faktoru A vždy n pozorování {y } i = a = n Pro všechny testy e obvykle uvažována i i i hladina významnosti α = 005 Postup obsahue kroky: Přípravu dat: už přípravou dat lze zaistit větší věrohodnost dosažených výsledků (a) Velikost výběru e počet plných řádků AOVA byla původně odvozena za předpokladu že četnosti ve sloupcích sou shodné V praxi e však tento předpoklad zřídka splněn Steně však platí že čím těsněi e toto pravidlo splněno tím věrohodněší sou výsledky Lze analyzovat i malé výběry 4 až 5 hodnot ve sloupci áme-li testovat všechny výběrové předpoklady e třeba prvků ve sloupci více ze statistického hlediska nelépe 30 a více (b) Chyběící hodnoty mohou způsobit vychýlení výsledků V každém případě e poněkud nebezpečné analyzovat výběr s řadou chyběících hodnot (c) Typ dat: matematické pozadí F-testu požadue aby data byla spoitá vůli zaokrouhlo-vání při zápisu dat sou všechna data vlastně technicky vzato diskrétní Požadavek spoitosti e proto na místě sou-li data hodně zaokrouhlovaná (d) Odlehlé hodnoty obecně způsobuí zborcení F-testů Je třeba prozkoumat data v grafech exploratorní analýzy dat EDA často se užívá krabicový graf Pak následue vyšetření zda se odlehlé hodnoty vyskytuí pouze v ednom sloupci nebo i v ostatních Je-li odlehlá hodnota v datech pouze ednou e třeba i odstranit Pakliže i v datech ponecháme e třeba dát přednost neparametrickému testování F-test by totiž mohl selhat 2 Ověření výběrových předpokladů: nestačí se soustředit na tabulku výsledků testování AOVA Je třeba pečlivě ověřit splnění základních předpokladů o výběru Často data nemaí ve všech sloupcích normální rozdělení a e třeba použít mocninnou (nebo logaritmickou) transformaci dat Po transformaci pak data iž vykazuí normální rozdělení I když e pouze ediný sloupec s nenormální rozdělením transformace celého výběru přinese zlepšení výsledků (a) áhodnost: metoda odběru vzorku by měla zaistit že každý prvek souboru má stenou pravděpodobnost být vybrán do výběru (b) ezávislost: aplikací von eumannova testu ověříme nezávislost prvků výběru Budeme-li například porovnávat levé a pravé pneumatiky u výběru určitého množství aut nezávislost nebude zaručena (c) ormalita: nelépe e začít vyšetřením rankitového grafu odchylek od totálního průměru Pak následue řada testů normality Síla těchto testů se zvyšue s velikostí výběru I když byla normalita potvrzena prověříme velikost výběru zda e možné brát výsledky testu za dostatečně věrohodné (d) Homoskedasticita: aby bylo možné užít řadu statistických testů e třeba ověřit zda rozptyly sloupců sou shodné (homoskedasticita) V krabicových grafech e sledována šířka krabic zda e u všech sloupců stená umericky lze ověřit homoskedasticitu pomoci modifiko-vaného Levenova 7 testu

7 3 Průměry a efekty úrovní: e proveden výpočet parametrů ˆµ i ˆµ ˆα i reziduí ê i Jackknife reziduí ê a diagonálních prvků H proekční matice H Jsou identifikovány vlivné body pro které e Ji ê Ji > 2 a H ii > 2/ n i 4 Volbu statistických testů významnosti faktoru A v tabulce AOVA: Je sestavena tabulka AOVA a proveden F-test významnosti efektů faktoru A Předem e třeba ověřit výběrové předpoklady a zvolit správný test: (a) ormalita a homoskedasticita dat: aplikueme F-test (b) ormalita a heteroskedasticita dat: pokusíme se stabilizovat rozptyl mocninnou transformací (nebo logaritmickou) Pak užieme test shodnosti středních hodnot u dvou výběrů při nehomogenitě rozptylů elze užít ani ruskalův-wallisův test protože tento test také předpokládá shodné rozptyly obou výběrů (c) enormalita a homoskedasticita dat: užieme ruskalův-wallisův test (d) enormalita a heteroskedasticita dat: když nede data transformovat za účelem stabilizace 7 rozptylu a zaištění normality užieme olmogorův-smirnovův test (viz cit ) který testue oboí 7 průměry i rozptyly současně Jelikož však už víme z Levenova testu (viz cit ) že rozptyly nesou stené e otázkou zda olmogorův-smirnovův test přinese něco nového Testování hypotéz: výklad analýzy rozptylu e snadný Jednoduše sledueme F-test Je-li hodnota spočtené hladiny významnosti menší než předvolená hladina významnosti α (obyčeně 005) můžeme potvrdit že přinemenším dva sloupcové průměry sou odlišné 5 Vícenásobné porovnávání sloupcových průměrů CP: postup předpokládá normalitu a homoskedasticitu výběrových sloupců ení-li splněna normalita pro každý sloupec e třeba užít ruskalův-wallisův test vícenásobného porovnávání CP: (a) Plánované všechny možné páry: víme-li dopředu že budeme vyšetřovat všechny páry užieme Bonferroniho porovnávání párů (b) eplánované všechny možné páry: užieme Scheffeho porovnávání (c) aždý versus kontrolní sloupec: užieme Bonferroniho porovnání všech sloupců vůči kontrolnímu (d) Vybrané a plánované sloupce: užieme Standardní porovnávání a nastavíme hladinu α 6 Grafy a diagramy: e konstruován rankitový graf Jackknife reziduí a transformační graf závislosti s i vs ˆµ i Pokud sou všechna data kladná a tato závislost e přibližně lineární lze zvolit logaritmickou transformaci ii (viz 6 kapitola) 7 52 Dvoufaktorová analýza rozptylu bez opakování v cele Při dvoufaktorové analýze rozptylu se provádí experimenty na různých úrovních dvou faktorů A a B ombinace úrovní faktorů tvoří typickou mřížkovou strukturu eímž elementem e tzv cela Platí že (i )-tá cela odpovídá kombinaci úrovně A i faktoru A a B faktoru B V každé cele e obecně n pozorování Často se však setkáváme s případem bez i opakování kdy v každé cele e pouze ediné pozorování n i = romě řádkových αi a sloupcových ß efektů se zde vyskytue také interakční člen τ Tento člen e důsledkem i různých kombinací sloupcových a řádkových efektů

8 8 B B B 2 A A 2 cela A 2 B 2 A Obvykle se užívá Tukeyův model interakce vyádřený tvarem τ i C α i β kde C e konstanta U těchto modelů obsahue každá cela právě ednu hodnotu y i O chybách g i se předpokládá že sou to nezávislé a steně rozdělené náhodné veličiny s nulovou střední hodnotou a konstantním rozptylem testování se navíc předpokládá že rozdělení chyb e normální Definuí se omezuící podmínky ˆµ α i 0; β 0; τ i 0; τ i 0 V případě pouze aditivního působení ednotlivých faktorů e τ i = 0 pro všechna i = a = Odhady parametrů µ α i β lze pak určit ze vztahů y i ˆα i y i & ˆµ ˆβ y i & ˆµ Pro rezidua ê i platí ê i y i & ˆµ & ˆα i & ˆβ určení interakcí můžeme využít skutečnosti že τ i E(y i ) & µ & α i & β a pro odhad interakcí platí přibližně ˆτ i ê i Pak lze snadno identifikovat Tukeyův model interakce Platí-li tento model vyde na grafu ê i vs ˆα i ˆβ lineární trend Ze směrnice odpovídaící regresní přímky se odhadne parametr C Platí pro ně výraz: Ĉ ê i ˆα i ˆβ ˆα 2 i Graf ê i vs ˆα i ˆβ /ˆµ se označue ako graf neaditivity Pokud vyde v tomto grafu nenáhodný trend znamená to že e třeba uvažovat interakce Analýza rozptylu pro dvoné třídění s interakcí Tukeyova typu Součet Stupně Průměrný ritérium F čtverců pro volnosti čtverec ˆβ 2

9 9 Faktor A S A Faktor B S B α 2 i ß 2 - = S /(-) F = / A A A A AB - = S /(-) F = / B B B B AB Interakce (Tukey) T = S T F T = T/E Reziduální S R= SAB-ST - - E= S R/(--) - Celkový S C (i) (ˆµ & y i ) () V tabulce představue S součet čtverců odchylek odpovídaící Tukeyově interakci T S T S AB 2 y i ˆα i ˆβ ˆα 2 i β2 Symbol S označue reziduální součet čtverců pro případ bez interakcí AB (y i & ˆµ & ˆα i & ˆβ ) 2 Odpovídaící průměrný čtverec e AB S AB ( & ) ( & ) Hodnota e AB 2 nevychýleným odhadem rozptylu σ Pomocí F-kritéria lze opět provádět statistické testy Začíná se testováním nulové hypotézy H : "Tukeyova interakce e nevýznamná" pro kterou 0 lze použít testační statistiku F Za předpokladu platnosti nulové hypotézy H má tato T 0 testační statistika F-rozdělení s a ( - - ) stupni volnosti Pokud nelze tuto hypotézu zamítnout testue se nulová hypotéza H : α = 0 i = (efekty řádků čili faktoru A sou 0 i nevýznamné) pomocí statistiky F nebo nulová hypotéza H : β = 0 = (efekty A 0 sloupců čili faktoru B sou nevýznamné) pomocí statistiky F Obě tyto testační statistiky B sou uvedeny v tabulce Za předpokladu platnosti hypotézy H má statistika F Fisherovo- 0 A Snedecorovo F-rozdělení s ( - ) a ( - ) ( - ) stupni volnosti a statistika F také F- B rozdělení s ( - ) a ( - )( - ) stupni volnosti Pokud však vyde F vyšší než T odpovídaící kvantil F-rozdělení e efekt Tukeyovy interakce významný Friedmanův pořadový test V případě nenormality a heteroskedasticity se aplikue tento neparametrický test kdy původní data sou nahrazena svými pořadími V experimentu s úrovněmi faktoru A v řádcích a úrovněmi faktoru B v sloupcích matice o rozměru se užie Friedmanovo testační kritérium Q dle vzorce Q ( & ) 2 R 2 i & 3 2 ( % ) 2 ( 2 & ) 2 & (t 3 & t)

10 0 kde data v každém ze řádků sou nahražena pořadím Pořadí sou sečtena pro každý ze sloupců Tato suma pořadí se značí R i Faktor t ve menovateli testačního kritéria Q představue počet opakuící se edné hodnoty v průběhu řádku dyž e tento člen nulový 2 tak se vynechá Testační kritérium Q má přibližně χ rozdělení s - stupni volnosti Toto kritérium e blízké endalově koeficientu dobré shody U těchto testů musí být faktor A vždy náhodným faktorem a faktor B vždy pevným faktorem Vícenásobné porovnávání CP Dá se použít enom pro pevné faktory Plánovaná porovnávání se formuluí v pomech sloupcových průměrů dle vzorce C i w i m kde značí počet úrovní faktoru m sou průměry pro každou hladinu faktoru a wi představue soubor vah pro i-té porovnání Porovnávací hodnota C se testue pomocí t- i testu Všimněte si že estliže váha w nabývá nuly při sumaci přes všechna porovnání i budeme nazývat kontrast průměrů Porovnání může být zadáno ednoduše pomocí vah apříklad uvažume faktor o 3 úrovních kde sloupec představue úroveň kontrolní druhý a třetí sloupec obsahuí 2 a 3 úroveň faktoru Porovnání zadáme pomocí vah: porovnání kontrolního sloupce s 2 úrovní faktoru: - 0 Porovnání kontrolního sloupce se 3 úrovní faktoru: - 0 Porovnání 2 úrovně s 3 úrovní: 0 - Porovnání kontrolního sloupce s průměrem 2 a 3 úrovně: -2

11 Postup dvoufaktorové analýzy rozptylu bez opakování (AOVA2P) Pro dvoufaktorovou analýzu rozptylu a modelu s pevnými efekty v případě n = tedy bez i opakování v cele se předpokládá možnost interakce Tukeyova typu Provádí se odhady parametrů testy významnosti a ověření interakce resp transformace vedoucí k aditivitě efektů Vstupem e obdélníková tabulka dat pro A A úrovní faktoru A (řádky) a B B úrovní faktoru B (sloupce) {y i} = a = Pro všechny testy e standardně uvažována hladina významnosti α = 005 Postup obsahue stené kroky ako postup ednofaktorové analýzy rozptylu: Příprava dat: (a) Velikost výběru (b) Chyběící hodnoty (c) Typ dat (d) Odlehlé hodnoty 2 Průměry a efekty úrovní: sou vypočteny odhady parametrů: celkový průměr ˆµ řádkové efekty ˆα i sloupcové efekty ˆβ interakční člen ˆτ i a Tukeyho konstanta C 3 AOVA tabulka: e sestavena tabulka AOVA a provedeny testy významnosti faktorů A B a AB (a) Za předpokladu normality a homoskedasticity: F-testy významnosti faktorů resp interakcí včetně kombinovaných testů pro ověření celkové významnosti faktorů A B (b) Za předpokladu nenormality nebo heteroskedasticity: Friedmanův pořadový neparametrický test 4 Graf neaditivity: e kreslen graf neaditivity včetně určení optimální mocninné transformace ˆλ pro zaištění aditivity Lze zadat provedení analýzy pro transformovaná data pokud sou kladná 53 Vyvážená dvoufaktorová analýza rozptylu Slouží ke dvoufaktorové analýze rozptylu u vyvážených experimentů n = n a modelů i s pevnými efekty Je hledán optimální model AOVA odhadnuty eho parametry a provedeny testy významnosti Vstupem sou pro úrovně A A faktoru A a úrovně B B faktoru B hodnoty {y ik} i = = a k = n Pro všechny testy e standardně uvažována hladina významnosti α = 005 Pro výpočet se užívá AOVA2B (ADSTAT) Pro tyto modely platí že v každé cele e n i = n pozorování Odhadem µ i sou aritmetické průměry ˆµ i n n Pro odhady ostatních parametrů se použií vztahy y ik k ˆµ ˆµ i ˆα i ˆµ i & ˆµ ˆβ ˆµ i & ˆµ

12 2 Rezidua vyádříme vztahem ê ik y ik & ˆµ & ˆα i & ˆβ Podobně lze i v tomto případě definovat odhad interakcí ˆτ i ˆµ i & ˆµ & ˆα i & ˆβ Povšimněme si že tento vztah se liší od předešlé rovnice en tím že se místo veličin y i používá průměrů ˆµ i Pro ověření Tukeyova modelu interakce neaditivity lze vynášet graf ˆτ i vs ˆα i ˆβ áhodný obrazec zde svědčí o aditivním působení obou faktorů Součty čtverců modelu analýzy rozptylu pro obecný případ interakcí sou uvedeny v tabulce Odpovídaící střední hodnoty (očekávané hodnoty) průměrných čtverců sou E( A ) σ 2 % n α 2 i ( & ) σ 2 σ 2 % nσ 2 A a E( B ) σ 2 % E( AB ) σ 2 % n β 2 ( & ) σ 2 σ 2 % nσ 2 B n τ 2 i σ 2 % n σ 2 ( & ) ( & ) σ 2 AB 2 2 Očekávaná hodnota E( R) = σ ukazue že roztyl R e nevychýleným odhadem σ rozptylu chyb Rozptyly σ 2 A σ2 B a σ 2 AB odpovídaí efektům řádků sloupců a interakcí Těchto vztahů lze využít i v případech kdy se hledaí odhady rozptylů příslušeící faktorům a interakcím Pak se místo středních hodnot E() dosazuí přímo průměrné čtverce a místo 2 2 rozptylu σ reziduální rozptyl ˆσ Důležité e že průměrné čtverce nesou přímo odhady odpovídaících rozptylů Také v případě analýzy rozptylu definované AOVA tabulkou se využitím statistik F F a F testue zda e možné považovat sloupcové a řádkové efekty resp interakce za AB B A nevýznamné Pro test nulové hypotézy H : τ = 0 i = a = lze použít 0 i testační statistiku F která má za předpokladu platnosti hypotézy H F-rozdělení s {( - AB 0 )( - )} a { (n - )} stupni volnosti Při testování významnosti řádkových efektů faktoru A e H : α = 0 i = Pokud nulová hypotéza platí má testační F statistika F- 0 i A rozdělení s ( - ) a { (n - )} stupni volnosti Analogicky při testování významnosti sloupcových efektů faktoru B e H : β = 0 = Pokud nulová hypotéza platí má 0 testační F statistika F-rozdělení s ( - ) a { (n - )} stupni volnosti evychýleným B odhadem rozptylu e zde R Analýza rozptylu pro dvoné třídění a vyvážený experiment Součet Stupně Průměrný ritérium F čtverců pro volnosti čtverec Faktor A

13 3 S A n ˆα 2 i - A Faktor B S B n Interakce AB S AB n Reziduální S R Celkový S C ˆβ 2 - B ˆτ 2 i n k AB S A & S B & S AB ( & ) ( & ) F A A R F B B R F AB AB R (y ik & ˆµ i ) 2 (n - ) R - (n & ) n (y ik & ˆµ) 2 k ( - )( - ) n Výhodou vyvážených experimentů e to že ednotlivé složky modelů analýzy rozptylu sou vzáemně nezávislé Postup vyvážené dvoufaktorové analýzy rozptylu (AOVA2B) Slouží ke dvoustupňové analýze rozptylu u vyvážených experimentů n = n a modelů i s pevnými efekty Je hledán optimální model AOVA odhadnuty eho parametry a provedeny testy významnosti Vstupem sou pro úrovně A A faktoru A a úrovně B B faktoru B hodnoty {y ik} i = = a k = n Pro všechny testy e standardně uvažována hladina významnosti α = 005 Postup obsahue stené kroky ako postup ednofaktorové analýzy rozptylu: Příprava dat: (a) Velikost výběru (b) Chyběící hodnoty (c) Typ dat (d) Odlehlé hodnoty 2 Ověření výběrových předpokladů: z opakování v celách (a) áhodnost (b) ezávislost (c) ormalita (d) Homoskedasticita 3 Průměry a efekty úrovní: sou vypočteny odhady: celkový průměr ˆµ řádkové efekty ˆα i sloupcové efekty ˆβ interakční člen ˆτ i a Tukeyho konstanta C 4 AOVA tabulka: e sestavena tabulka AOVA a provedeny testy významnosti faktorů A B a AB S R

14 4 (a) Za předpokladu normality a homoskedasticity: F-testy významnosti faktorů resp interakcí včetně kombinovaných testů pro ověření celkové významnosti faktorů A B (b) Za předpokladu nenormality nebo heteroskedasticity: Friedmanův pořadový test 5 Grafy a diagramy: e kreslena závislost výběrových směrodatných odchylek s i v celách na průměrech ˆµ i Pokud e nalezena monotónní závislost lze zadat vhodnou transformaci ve které se provede opakovaná analýza Je konstruován rankitový graf pro rezidua ê ik 54 evyvážená dvoufaktorová analýza rozptylu Pro nevyvážené modely platí že v (i )-té cele e n i pozorování Pokud e experiment velmi špatně vyvážený což znamená že rozdíly mezi ednotlivými hodnotami n i sou řádově v desítkách e analýza rozptylu komplikovaněší Analýza rozptylu se pak provádí s využitím programů pro lineární regresi kdy se modely AOVA uvažuí ako speciální regresní modely s vysvětluícími proměnnými které nabývaí pouze hodnot 0 nebo Pro praktické účely se osvědčue použití přibližného rozkladu celkového součtu čtverců Začíná se výpočtem průměrů ˆµ i n k n k y ik k pro všechny cely Z těchto hodnot se dá odhadnout reziduální součet čtverců S R n k (y ik & ˆµ i ) 2 k Pro výpočet dalších složek rozkladu celkového součtu čtverců se používá ˆµ i o kterých * se uvažue že sou určeny z ekvivalentního počtu pozorování n definovaného vztahem n ( n i & Analýza rozptylu se pak provádí steně ako u vyvážených experimentů s tím že sou ednotlivé součty čtverců definovány vztahy S A n ( (ˆµ i & ˆµ) 2 S B n ( (ˆµ & ˆµ) 2 s ( - ) stupni volnosti s ( - ) stupni volnosti a S AB n ( V těchto vztazích e použito označení (ˆµ i & ˆµ i & ˆµ % ˆµ) 2 s ( - )( - ) stupni volnosti

15 5 ˆµ i ˆµ i ˆµ ˆµ i ˆµ s 2 i s 2 i ˆµ i ˆµ i Součet S + S + S + S zde iž není přesně roven S ale rozdíly sou poměrně malé A B AB R C Testování hypotéz o řádkových a sloupcových efektech nebo interakcích se provádí steně ako u vyvážených experimentů V případě více opakování v ednotlivých celách lze pro každou z nich určit výběrový rozptyl a pomocí grafu vs testovat případnou závislost rozptylu na střední hodnotě (heteroskedasticitu) Postup nevyvážené dvoufaktorové analýzy rozptylu (AOVA2U) Slouží ke dvoufaktorové analýze rozptylu u nevyvážených experimentů n a modelů i s pevnými efekty Je hledán optimální model AOVA odhadnuty eho parametry a provedeny testy významnosti Vstupem sou pro úrovně A A faktoru A a úrovně B B faktoru B hodnoty {y ik} i = = a o = O Pro všechny testy e standardně uvažována hladina významnosti α = 005 Postup obsahue stené kroky ako postup ednofaktorové analýzy rozptylu: Příprava dat: (a) Velikost výběru (b) Chyběící hodnoty (c) Typ dat (d) Odlehlé hodnoty 2 Ověření výběrových předpokladů: z opakování v celách (a) áhodnost (b) ezávislost (c) ormalita (d) Homoskedasticita 3 Průměry a efekty úrovní: sou vypočteny odhady: celkový průměr ˆµ řádkové efekty ˆα i sloupcové efekty ˆβ interakční člen ˆτ i a Tukeyho konstanta C 4 Tabulka AOVA: e sestavena tabulka AOVA a provedeny testy významnosti faktorů A B a AB (a) Za předpokladu normality a homoskedasticity: F-testy významnosti faktorů resp interakcí včetně kombinovaných testů pro ověření celkové významnosti faktorů A B (b) Za předpokladu nenormality nebo heteroskedasticity: Friedmanův pořadový neparametrický test 5 Grafy a diagramy: e kreslena závislost výběrových směrodatných odchylek s i v celách na průměrech ˆµ i Pokud e nalezena monotónní závislost lze zadat vhodnou transformaci ve které se provede opakovaná analýza Je konstruován rankitový graf pro rezidua ê ik 55 Opakovatelnost a reprodukovatelnost (O&R analýza)

16 6 Populárně zvané cechování se týká ověření přesnosti zda dotyčná technika měření e co do přesnosti vhodně zvolena a tím pro experimentální proces přiměřená Je-li proměnlivost měření malá ve srovnání s proměnlivostí experimentálního procesu říkáme že postup měření e adekvátní nebo odpovídaící ení-li e třeba techniku měření zlepšit tak aby vůbec mohla uspokoivě monitorovat experimentální proces Jsou-li například míry opracovaného výrobku uváděny v toleranci milimetrů nelze použít techniku měřením měřidlem které má čtení enom v centimetrech O&R analýza rozdělue celkovou proměnlivost do dvou složek: Složky měřicí techniky a 2 složky procesní týkaící se vlastního experimentálního procesu Proměn-livost složky měření e pak dále rozdělena: Do složky operátora O což vlastně představue reprodukovatelnost a 2 složky měřicí techniky V což e opakovatelnost Je důležité zdůraznit že O&R analýza se týká enom přesnosti složky měření Data pro tuto analýzu pocházeí z experimentu zvláště postaveného enom a enom k tomuto účelu ení proto možné kombinovat O&R analýzu s ostatními experimenty v laboratoři Platí obecné pravidlo: náhodné chyby měření by neměly být větší než edna desetina rozptylu procesu O&R analýza zišťue aká část pozorovaného rozptylu procesu náleží rozptylu měřicího systému AOVA rozdělue eště reprodukova-telnost na vliv operátora a interakci operátorvzorek Analýzu rozptylu vyšetřovaného experimentálního plánu vystihue model AOVA y ik µ % V i % O % (VO) i % g ik kde i = I = J k = a V i O (VO) i g ik sou nezávislé normální náhodné proměnné se střední hodnotou nula a rozptyly σ 2 V σ2 O σ2 VO a σ 2 g Tyto rozptyly sou často označovány ako složky rozptylu nazývané také rozptylové komponenty V tomto modelu AOVA shodném s modelem AOVA pro vyváženou dvoufaktorovou analýzu rozptylu značí písmeno V náhodný vzorek písmeno O udává operátora a písmeno g náhodnou chybu Dále v modelu označíme složku rozptylu za opakovatelnost dále složku rozptylu γ = σ 2 g + σ 2 VO za reprodukovatelnost složku rozptylu γ σ 2 O σ 2 VO σ 2 2 = + + g za celkovou proměnlivost měření která se také někdy nazývá O&R hodnota Proměnlivost procesu od vzorku k vzorku představue další složku rozptylu σ 2 V Poměr který porovnává dvě složky rozptylu a sice proměnlivost experimentálního procesu vůči proměnlivosti samotného měření e dán vzorcem σ 2 O δ σ 2 V σ 2 O % σ2 VO % σ2 g V literatuře e popsána řada kritérií k posouzení O&R hodnot V automobilovém průmyslu se užívá kritérium SR (Signal-to-oise Ratio) poměr signálu vůči šumu vyčíslené vzorcem SR = %δ a dále rozhodčí kategorie R = %(2δ) Existuí dvě populární míry k porovnání rozptylu vůči toleranci v nichž se za toleranci bere rozdíl horní a dolní toleranční meze HSL - DSL Jsou to ednak chyba měření dle vzorce 3 σ 2 O % σ2 VO % σ2 g HSL & DSL 00%

17 a dále poměr přesnosti vůči toleranci PT = 2 Obě kritéria sou obvykle vyčíslována spolu se svými intervaly spolehlivosti Cílem analýzy e vyčíslit tyto hodnoty a rozhodnout zda padnou do předem určeného intervalu 7

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

5 ANALÝZA ROZPTYLU. Počet sloupců, K = 7 Počet dat, N = 70 Celkový průměr = 3.9846

5 ANALÝZA ROZPTYLU. Počet sloupců, K = 7 Počet dat, N = 70 Celkový průměr = 3.9846 1 5 ANALÝZA ROZPTYLU Vzorová úloha 5.1 Zkrácený postup jednofaktorové analýzy rozptylu Na úloze B5.02 Porovnání nové metody v sedmi laboratořích ukážeme postup 16 jednofaktorové analýzy rozptylu. Kirchhoefer

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj. Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.

Více

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření 1.4 ANOVA Úloha 1 Jednofaktorová ANOVA Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření Bylo měřeno množství DNA hub Fusarium culmorum

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Zobecněná analýza rozptylu, více faktorů a proměnných

Zobecněná analýza rozptylu, více faktorů a proměnných Zobecněná analýza rozptylu, více faktorů a proměnných Menu: QCExpert Anova Více faktorů Zobecněná analýza rozptylu (ANalysis Of VAriance, ANOVA) umožňuje posoudit do jaké míry ovlivňují kvalitativní proměnné

Více

PYTHAGORAS Statistické zpracování experimentálních dat

PYTHAGORAS Statistické zpracování experimentálních dat UNIVERZITA PARDUBICE Fakulta chemicko-technologická, Katedra analytické chemie SEMESTRÁLNÍ PRÁCE Květen 2008 Licenční studium PYTHAGORAS Statistické zpracování experimentálních dat Předmět 1.4 ANOVA a

Více

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21

A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21 Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Kanonická korelační analýza

Kanonická korelační analýza Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

Úloha 1: Lineární kalibrace

Úloha 1: Lineární kalibrace Úloha 1: Lineární kalibrace U pacientů s podezřením na rakovinu prostaty byl metodou GC/MS měřen obsah sarkosinu v moči. Pro kvantitativní stanovení bylo nutné změřit řadu kalibračních roztoků o různé

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom

Více

Regulační diagramy (RD)

Regulační diagramy (RD) Regulační diagramy (RD) Control Charts Patří k základním nástrojům vnitřní QC laboratoře či výrobního procesu (grafická pomůcka). Pomocí RD lze dlouhodobě sledovat stabilitu (chemického) měřícího systému.

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

ANALÝZA ROZPTYLU (ANOVA)

ANALÝZA ROZPTYLU (ANOVA) ANALÝZA ROZPTYLU (ANOVA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod Měření Pb v polyethylenu 36 různými laboratořemi 0,47 0 ± 0,02 1 µmol.g -1 tj. 97,4 ± 4,3 µg.g -1 Měření

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách 13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních

Více

Tvorba nelineárních regresních modelů v analýze dat

Tvorba nelineárních regresních modelů v analýze dat Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Tvorba nelineárních regresních modelů v analýze dat Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271 1 Příklad 1. Porovnání dvou regresních přímek Při výrobě automatových ocelí dané jakosti byla porovnávána závislost obsahu uhlíku v posledním zkušebním vzorku (odebraném z mezipánve na ZPO a analyzovaném

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor

Více

Způsobilost systému měření podle normy ČSN ISO doc. Ing. Eva Jarošová, CSc.

Způsobilost systému měření podle normy ČSN ISO doc. Ing. Eva Jarošová, CSc. Způsobilost systému měření podle normy ČSN ISO 22514-7 doc. Ing. Eva Jarošová, CSc. Předmět normy Postup validace měřicího systému a procesu měření (ověření, zda daný proces měření vyhovuje požadavkům

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT PROKAZOVÁNÍ SHODY VÝROBKŮ část 3, díl 8, kapitola 4, str. 1 3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT Vyjadřování standardní kombinované nejistoty výsledku zkoušky Výsledek zkoušky se vyjadřuje v

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Tvorba lineárních regresních modelů

Tvorba lineárních regresních modelů Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Tvorba lineárních regresních modelů při analýze dat Zdravotní ústav

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základ ekonometrie Odhad klasického lineárního regresního modelu I Cvičení 2 Zuzana Dlouhá Metodologický postup tvor EM 1. Specifikace modelu určení proměnných určení vzájemných vaze mezi proměnnými

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více