3 ANALÝZA ROZPTYLU ANOVA
|
|
- Rudolf Šmíd
- před 8 lety
- Počet zobrazení:
Transkript
1 3 Analýza rozptlu ANOVA 3 ANALÝZA ROZPTYLU ANOVA RYCHLÝ NÁHLED KAPITOLY Analýza rozptlu je statistickým nástrojem, který nám umožňuje zkoumat závislost kvantitativního znaku na kvalitativním znaku. Základní mšlenka analýz rozptlu spočívá v rozkladu celkového rozptlu na dílčí rozptl příslušející jednotlivým vlivům, podle nichž jsou data roztříděna. Kromě dílčích rozptlů je jednou složkou celkového rozptlu tzv. reziduální rozptl, způsobený nepostiženými vliv. Podle počtu analzovaných faktorů, tj. podle počtu vlivů na hodnot kvantitativního znaku, rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptlu. Všeobecně používané označení ANOVA je akronmem anglických slov ANalsis Of VAriance (doslovný překlad z angličtin: analýza rozptlu). 3. ANALÝZA ROZPTYLU JEDNÍM FAKTOREM Často se vsktuje situace, kd máte k (např. k=5) nezávislých náhodných výběrů, které nemusí pocházet z jednoho základního souboru, s příslušnými rozsah n, n,..., n k. Přitom k může být,3,..., a součet těchto rozsahů je N. Tto rozsah výběrů rovněž nemusí být stejné, v každém z nich je znám průměr x i, a také rozptl s i, i =,,...,k. V praktických situacích obvkle tto výběr vzniknou tak, že základní soubor rozdělíme podle určitého obvkle kvalitativního - nečíselného třídícího statistického znaku X do k skupin, v každé z nich pak vbíráme samostatně ni prvků. Znak X se pak označuje jako faktor, jehož hodnot jsou předem stanoven a hovoří se proto často o faktoru kontrolovaném, nebo faktoru pozorovaném, např. věková skupina, druh výrobku, tp reklam, tp služb apod. Hodnot faktoru X se označují x, x,..., x k Faktor X má k úrovní kategorií a ovlivňuje jiný statistický znak Y, jež má kvantitativní - intervalovou nebo podílovou (ted číselnou) povahu. Hodnot znaku Y příslušné hodnotě x i faktoru X označujeme i, i,..., in i Pro analýzu rozptlu je výhodné uspořádat výchozí údaje do přehledné tabulk: Číslo výběru Zjištěné hodnot sledovaného znaku Počet prvků Průměr Rozptl,,..., j,..., n n s,,..., j,..., n n s i i, i,..., ij,..., in i ni i s i k k, k,..., kj,..., kn k k n k s k Celkem N s
2 Elena Mielcová, Radmila toklasová a Jaroslav Ramík; tatistické program Celková variabilita znaku (souboru) se měří obvkle (výběrovým) rozptlem: s i j ij N V souvislosti s analýzou rozptlu nás bude zajímat pouze čitatel výše uvedeného zlomku, totiž součet čtverců odchlek zjištěných hodnot od celkového průměru, přičemž tento průměr je dán vztahem: N k Ni ij i j Tento celkový součet čtverců se označuje smbolem N i ij k i j ij, ted: Celkovému součtu čtverců přísluší počet stupňů volnosti df c = N -. Variabilitu uvnitř skupin označujeme jako vnitroskupinovou, nebo také reziduální a používáme přitom označení, přičemž definujeme vnitroskupinový (reziduální) součet čtverců takto:, v N i ij i k, v i j Vnitroskupinovému součtu čtverců přísluší počet stupňů volnosti df v = N - k. Variabilitu mezi skupinami měříme meziskupinovým součtem čtverců definujeme následovně: k, m i N i i, m, který Meziskupinovému součtu čtverců přísluší počet stupňů volnosti df m = k -. Aritmetickými úpravami výše uvedených vzorců lze snadno odvodit základní vztah analýz rozptlu, totiž, že celkový součet čtverců je roven sumě meziskupinového a vnitroskupinového součtu čtverců, smbolick:, m, v Analýza rozptlu je statistickým testem, který zkoumá vliv faktorů X na hodnot znaku Y. Postup testování:. tanovení hpotéz: H 0 : hodnot faktoru X nemají na hodnot znaku Y žádný vliv (nezávislost znaků), H : negace H 0.. Testové kritérium: T, m k, v N k 3. Obor přijetí:, F ( ), kritický obor ( ), ( k, N k ) 0 ( k, N k ) hodnota F rozdělení pro stupně volnosti k a N k. 4. Závěr. F, kde F ( ) je kritická ( k, N k ) Analýza rozptlu je založena na předpokladu shod rozptlů v jednotlivých k skupinách. Pokud jsou předpoklad splněn, pak popsaná metoda ANOVA posktuje nejlepší výsledk je nejúčinnější. Není-li tento předpoklad splněn, pak použití výše uvedeného testu může posktnout neadekvátní výsledek. V takovém případě lze použít jiné test, např. Chi-kvadrát test, nebo F-test, případně některé neparametrické test, jako Kruskal-Wallisův nebo Friedmanův test, viz kapitola 6, nebo literatura, např. [eger]
3 3 Analýza rozptlu ANOVA V Excelu můžete jak podmíněné průměr, tak i hodnot všech součtů čtverců, testového kritéria, kritickou hodnotu i hodnotu p zjistit pomocí analtického nástroje Anova: jeden faktor. Výsledkem jsou dvě tabulk, tabulka Faktor a tabulka Anova. V tabulce Faktor je pro každý z faktorů určený celkový přehled počet pozorování pro faktor, součet hodnot, průměr a výběrový rozptl. V tabulce Anova jsou postupně hodnot, které jsou vužit v testu: Zdroj variabilit Rozdíl M F Hodnota P F krit Mezi výběr m df m = k - m k m T k p-hodnota F ( ) ( k )( N k ) v N k Všechn výběr Celkem v v df v = N - k N k df c = N ŘEŠENÝ PŘÍKLAD 3. Porovnejte úspěšnost absolventů gmnázií, PŠ a odborných učilišť s maturitou (OU) u přijímacích zkoušek na vsokou školu. Na hladině významnosti 0,05 testujte, zda faktor absolvovaná střední škola má vliv na úspěšnost žáků u přijímacích zkoušek na vsokou školu. Bod, získané u přijímacích zkoušek u 30 náhodně vbraných studentů jsou zadán v následující tabulce: Gmnázium PŠ OU Řešení: Příklad vřešíte pomocí analtického nástroje Anova: jeden faktor. Po otevření dialogového okna (Data Analýza dat Anova: jeden faktor) lze zadat vstupní oblast dat s popiskami, vznačit, že popisk se nachází v prvním řádku a zadat hladinu významnosti testu (Obr. 3.)
4 Elena Mielcová, Radmila toklasová a Jaroslav Ramík; tatistické program Obrázek 3. Zdroj: Vlastní zpracování. Obrázek 3. Výsledkem jsou dvě tabulk (Obr. 3.): Zdroj: Vlastní zpracování. Postup testování:. tanovení hpotéz: H 0 : hodnot faktoru X nemají na hodnot znaku Y žádný vliv (faktor škola nemá vliv na výsledk přijímacího řízení.), H : negace H 0.. Testové kritérium: T 0, Obor přijetí: ; 3, 354 0, kritický obor,354; 3, ( F krit je kritická hodnota F rozdělení pro stupně volnosti a 7.) 4. Závěr: Na hladině významnosti alfa = 0,05 nelze zamítnout hpotézu H 0 o nezávislosti výsledků přijímacího řízení na absolvované škole uchazečů
5 3 Analýza rozptlu ANOVA 3. DVOUFAKTOROVÁ ANOVA Analýza rozptlu se dvěma faktor znamená testovat závislost kvantitativního znaku na dvou znacích kvalitativních, tj. na dvou faktorech. Předpokládáme, že působení těchto faktorů na sledovaný znak je nezávislé. Podle. faktoru budeme hodnot znaku Y třídit do skupin, podle. faktoru do bloků. Rozklad celkového součtu čtverců se provede analogick jako v případě jednofaktorové analýz rozptlu, pouze přibude nový sčítanec. Označíme jej, a přináleží blokovému faktoru. oučet čtverců přináleží meziskupinovému faktoru, součet čtverců m v přináleží vnitroskupinovému faktoru. Rozklad celkového součtu čtverců potom bude:. m v b U dvoufaktorové analýz bez opakování se jedná o dva simultánní test. Postup testování:. Hpotéz: : H : Znak (faktor) 0 X nemá na znak Y žádný vliv, H : Znak (faktor) X má na znak Y vliv, H : Znak (faktor) 0 X nemá na znak žádný vliv, Y H : Znak (faktor) X má na znak Y vliv,. Testová kritéria: m b F k F r ( k ).( r ) ( k ).( r ) kde k je počet skupin pro faktor a r je počet bloků pro faktor. 3. Kritické hodnot: F ( ) a F ( ). ( k ),( k )( r ) v ( r ),( k )( r ) 4. Závěr: Je-li F F ( ) ( k, znak ),( k )( r ) X statistick významně ovlivňuje znak Y. Je-li F F ( ) ( k, znak ),( k )( r ) X statistick významně ovlivňuje znak Y. K dvoufaktorové analýze rozptlu bez opakování použijeme v Excelu analtický nástroj Anova:dva faktor bez opakování. Výsledkem jsou dvě tabulk, tabulka Faktor a tabulka Anova. V tabulce Faktor je pro každý z faktorů a bloků určený celkový přehled počet pozorování pro faktor a blok, součet hodnot, průměr a výběrový rozptl. V tabulce Anova jsou postupně hodnot, které jsou vužit v testu: v b Zdroj variabilit Rozdíl M F Hodnota P F krit Řádk loupce k m b r m k b r F p-hodnota F ( ) ( k ),( k )( r ) F p-hodnota F ( ) ( r ),( k )( r ) Chba Celkem ( k ).( r ) v v - ( k ).( r ) N
6 Elena Mielcová, Radmila toklasová a Jaroslav Ramík; tatistické program Použití dvoufaktorové analýz demonstruje následující řešený příklad. Je důležité si uvědomit, že data pro Faktor se zadávají do řádků, zatímco data pro Faktor do sloupců vstupní tabulk. ŘEŠENÝ PŘÍKLAD 3. Testujte závislost výsledků přijímacích zkoušek na předmětu zkoušek a absolvované škole uchazečů. Na hladině významnosti 0,0 testujte, zda faktor vstudovaná střední škola má vliv na úspěšnost žáků u přijímacích zkoušek na vsokou školu. Bod, získané u přijímacích zkoušek pro 4 absolvent u 4 zkouškových předmětů jsou v následující tabulce. Řešení: Gmnázium PŠ OU Matematika Angličtina Ekonomie Všeobecný přehled Příklad lze vřešit pomocí analtického nástroje Anova: dva faktor bez opakování. Po otevření dialogového okna (Data Analýza dat Anova: dva faktor bez opakování) lze zadat vstupní oblast dat s popiskami, vznačit, že vstupní oblast obsahuje popisk a zadat hladinu významnosti testu (Obr. 3.3). Obrázek 3.3 Zdroj: Vlastní zpracování. Výsledkem výpočtu jsou dvě tabulk (Obr. 3.4). Test hpotéz:. Hpotéz: : H : Předmět zkoušk neovlivňuje výsledek zkoušk, 0 H : Předmět zkoušk má vliv na výsledek zkoušk, H : Škola uchazeče nemá vliv na výsledek zkoušk, 0 H : Škola uchazeče ovlivňuje výsledek zkoušk
7 3 Analýza rozptlu ANOVA Obrázek 3.4. Testová kritéria: F 5,58 F 30, Kritické hodnot: F KRIT 9,78 a F KRIT 0,9. 4. Závěr: Protože F F KRIT, předmět zkoušk neovlivňuje výsledek zkoušk. Vzhledem k tomu, že F F KRIT, škola uchazeče má vliv na výsledek zkoušk. Zdroj: Vlastní zpracování. 3.3 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD 3. Pan Novák může jet do zaměstnání pěti různými trasami. Čtřikrát projel jednotlivé tras a zaznamenal si dobu, po kterou jel do zaměstnání. Na hladině významnosti 0,05 zjistěte, zda záleží na tom, kterou trasou pojede. Výsledk měření jsou v následující tabulce: Trasa Trasa Trasa 3 Trasa 4 Trasa
8 Elena Mielcová, Radmila toklasová a Jaroslav Ramík; tatistické program PŘÍKLAD 3. Zjistěte, zda počet vrobených výrobků závisí na stroji nebo na operátorovi, popř. zda oba tto faktor mají vliv na počet vrobených výrobků. Test proveďte na hladině významnosti 0,05. Počet vrobených výrobků zachcuje následující tabulka. troj Operátor A B C I II III IV V PŘÍKLAD 3.3 ledují se emise výfukových plnů v závislosti na dvou faktorech. Jedná se o tp přísad (A,B,C,D), což představuje první faktor, který ovlivňuje emise výfukových plnů. Druhým faktorem je vliv řidiče (I,II,III,IV). Celkem bl proveden 4 pokus s každým tpem přísad. Naměřené hodnot emise jsou v následující tabulce. Proveďte test na hladině významnosti 5%, kterým ověříte, zda jsou emise výfukových plnů statistick významně ovlivněn prvním faktorem (tp přísad), nebo druhým faktorem (vliv řidiče), popř. oběma faktor současně. Přísada Řidič A B C D I II III IV ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ PŘÍKLADU 3. Test hpotéz:. tanovení hpotéz: H 0 : faktor trasa nemá vliv na dobu cest do zaměstnání, H : negace H 0.. Testové kritérium: T 5, Obor přijetí: ; 3, 056 0, kritický obor 3,056; 4. Závěr: Na hladině významnosti 0,05 zamítáme hpotézu o nezávislosti dob cestování na trase faktor trasa má vliv na celkovou dobu cest do zaměstnání
9 3 Analýza rozptlu ANOVA ŘEŠENÍ PŘÍKLADU 3. Obě nulové hpotéz o nezávislosti faktorů na počet vrobených výrobků lze zamítnout. Můžete ted z 95% tvrdit, že počet vrobených výrobků je ovlivněn jak strojem, tak i operátorem. ŘEŠENÍ PŘÍKLADU 3.3 Emise výfukových plnů jsou ovlivňován řidičem, ale nejsou ovlivňován tpem přísad. 3.5 PŘÍPADOVÉ TUDIE PŘÍPADOVÁ TUDIE 3. Porovnejte úspěšnost absolventů gmnázií, EŠ, Hotelových škol a Integrovaných škol u přijímacích zkoušek na vsokou školu. Na hladinách významnosti 0,05, 0,0 a 0, testujte, zda faktor vstudovaná středná škola má vliv na úspěšnost žáků u přijímacích zkoušek na vsokou školu. Bod, získané u přijímacích zkoušek jsou zadán v následující tabulce. Gmnázium EŠ Hotelová škola Integrovaná škola
10 Elena Mielcová, Radmila toklasová a Jaroslav Ramík; tatistické program PŘÍPADOVÁ TUDIE 3. ledují se emise výfukových plnů v závislosti na dvou faktorech. Jedná se o tp přísad (A,B,C,D), což představuje první faktor, který ovlivňuje emise výfukových plnů. Druhým faktorem je vliv řidiče (,, 3,...,). Celkem blo provedeno pokusů s každým tpem přísad. Naměřené hodnot emise jsou v následující tabulce. Proveďte test na hladině významnosti %, 5%, a 0%, kterými ověříte, zda jsou emise výfukových plnů statistick významně ovlivněn prvním faktorem (tp přísad), nebo druhým faktorem (vliv řidiče), popř. oběma faktor současně. Přísada Řidič A B C D
Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
STATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Cvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
ADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.
Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
STATISTICKÉ PROGRAMY
Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty
Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Národní informační středisko pro podporu jakosti
Národní informační středisko pro podporu jakosti 1 ANALÝZA ROZPTYLU a její využití při vyhodnocování experimentálních dat Eva Jarošová, VŠE Praha 2 Obsah Podstata metody, jednofaktorová ANOVA F-test Mnohonásobná
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Test dobré shody v KONTINGENČNÍCH TABULKÁCH
Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když
Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
Navrhování experimentů a jejich analýza. Eva Jarošová
Navrhování experimentů a jejich analýza Eva Jarošová Obsah Základní techniky Vyhodnocení výsledků Experimenty s jedním zkoumaným faktorem Faktoriální experimenty úplné 2 N dílčí 2 N-p Experimenty pro studium
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.
ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.
Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer
ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
Plánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
4EK211 Základy ekonometrie
4EK211 Základ ekonometrie Odhad klasického lineárního regresního modelu I Cvičení 2 Zuzana Dlouhá Metodologický postup tvor EM 1. Specifikace modelu určení proměnných určení vzájemných vaze mezi proměnnými
Cvičící Kuba Kubina Kubinčák Body u závěrečného testu
1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
Cvičení 9 Testy více výběrů. 1 Příklad - ANOVA 1
Cvičení 9 Testy více výběrů 1 Příklad - ANOVA 1 Testujeme výdrž baterie mobilů 5 různých výrobců. Každý z mobilů jsme intenzivně používali 7 dní pro volání, psaní a přehled videa, následné časy v minutách
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří
1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření
1.4 ANOVA Úloha 1 Jednofaktorová ANOVA Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření Bylo měřeno množství DNA hub Fusarium culmorum
Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006
ANALÝZA ROZPTYLU JAKO ZÁKLADNÍ METODA MNOHONÁSOBNÉHO POROVNÁVÁNÍ STŘEDNÍCH HODNOT V RŮZNÝCH SOFTWAROVÝCH PRODUKTECH ANALYSIS OF VARIANCE AS A PRIMARY METHOD OF MULTIPLE COMPARISON OF EXPECTED VALUES IN
Zobecněná analýza rozptylu, více faktorů a proměnných
Zobecněná analýza rozptylu, více faktorů a proměnných Menu: QCExpert Anova Více faktorů Zobecněná analýza rozptylu (ANalysis Of VAriance, ANOVA) umožňuje posoudit do jaké míry ovlivňují kvalitativní proměnné
4ST201 STATISTIKA CVIČENÍ Č. 8
4ST201 STATISTIKA CVIČENÍ Č. 8 analýza závislostí kontingenční tabulky test závislosti v kontingenční tabulce analýza rozptylu regresní analýza lineární regrese Analýza závislostí Budeme ověřovat existenci
PYTHAGORAS Statistické zpracování experimentálních dat
UNIVERZITA PARDUBICE Fakulta chemicko-technologická, Katedra analytické chemie SEMESTRÁLNÍ PRÁCE Květen 2008 Licenční studium PYTHAGORAS Statistické zpracování experimentálních dat Předmět 1.4 ANOVA a
Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA
Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
ANALÝZA ROZPTYLU (ANOVA)
ANALÝZA ROZPTYLU (ANOVA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
Testování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.
MATEMATIKA III V PŘÍKLADECH
VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita
II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.
Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.
Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Testy pro porovnání vlastností dvou skupin
Testy pro porovnání vlastností dvou skupin Petr Pošík Části dokumentu jsou převzaty (i doslovně) z Mirko Navara: Pravděpodobnost a matematická statistika, https://cw.felk.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Cvičení 9: Neparametrické úlohy o mediánech
Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
Analýza rozptylu. ANOVA cvičení
Analýza rozptylu 1. Pět skupin po 4 mužích bylo vystaveno rozličné dietě A1 až A5. Na konci týdne byly vyčísleny kladné a záporné diference hmotnosti mužů po aplikaci týdenní diety. Porovnejte čtyři diety
Přednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21
Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného