7. Analýza rozptylu jednoduchého třídění
|
|
- Drahomíra Hrušková
- před 8 lety
- Počet zobrazení:
Transkript
1 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky polohy a varablty - podmíněné krabcové dagramy (BOXPLOT) - Výsledky dvou-výběrových č párových testů Co však neumíme je hodnott vztah ve více než dvou-složkovém výběru. Pro takové účely používáme nalýzu rozptylu je o něco omezenější po stránce konstrukce alternatvních hypotéz o neobjevují se zde znaménka < nebo > ale pouze Trocha termnologe Ošetření ( nálepka ) - je reprezentováno jako X - jde o kategorální (kvaltatvní) znak Odezva - je reprezentována jako Y - jde o kvanttatvní znak nalýza rozptylu - vyšetřování závslost mez Y a X. Y a, b a je nahrazením písmene b je nahrazením písmene j a vyjadřuje kolkátý řádek (jaký druh nálepky) b vyjadřuje kolkátý sloupec (jaký druh odezvy) Příklad o závslost doby koksování v závslost na šířce pece Šířka pece [cm] Pozorované doby koksování [mn] Například: Y 1,2 = 3,0 Y 1,6 = 2,4 Y 3,6 = 7, , Další důležté symboly: µ n = populační průměr lbovolného řádku (skupny odezev na konkrétní druh ošetření) N = celkový počet odezev (například pozorovaných dob koksování) I = celkový počet ošetření (například možnost šířek koksovací pece) n = počet odezev u lbovolného řádku
2 Obecná formulace hypotéz: Slovně : H 0 : Kvanttatvní proměnná nezávsí na kvaltatvní. H 1 : Mez kvanttatvní a kvaltatvní proměnnou je závslost. Obecně: H 0 : µ 1 = µ 2 = = µ I H 1 : µ 1 µ 2 = µ 2 µ 3 a tak dále dokud se nevystřídají všechny µ n vzájemně. V našem případě (pro I = 3) : H 0 : µ 1 = µ 2 = µ 3 H 1 : µ 1 µ 2 µ 2 µ 3 µ 3 µ 1 Př analýze rozptylu rozlšujeme totž 2 zdroje varablty : - Mez-skupnová varablta (varablta průměrů mez jednotlvým ošetřením) - Vntro-skupnová varablta (varablta průměrů uvntř každého ošetření) o Tzv. Rezduální varablta Následně tyto dva zdroje vzájemně porovnáme a potřebná data nalezneme v tabulce NOV {nalyss of varance} Zdroj varablty Ošetření (between) Rezduální (wthn) Celkem (total) Stupně volnost Součet čtverců Průměrný čtverec F statstka a P-hodnota df = 2 S = MS = F 2,15 = 35,202 df R = 15 S R = MS R = P < 0,001 df T = 17 S T = MS T = Položky v tabulce NOV Df Sum Sq Mean Sq F value Pr(>F) fsrka e-06 *** Resduals Df - z anglckého Degrees of freedom - jde tedy o stupně volnost - výpočet: o U mez-skupnových ukazatelů = počet nálepek (I) snížený o 1 I 1 = Df o U vntro-skupnových ukazatelů = počet pozorování snížený o I n I = Df R Sum Sq - z anglckého Sum of squares nebo též SS - jde tedy o součet čtverců
3 Mean Sq - z anglckého Mean of squares nebo též MS - jde tedy průměr čtverců - 4asto e též nazýván průměrným čtvercem ale v podstatě jde o rozptyl a podle koncovky už pouze rozlšujeme, zda jede o: o Mez-skupnový rozptyl => MS o Vntro-skupnový rozptyl => MS R F value - testová statstka F jenž se řídí Fscherovým-Snedecorovým F-rozdělením - pro rozhodnutí vůč H0 j porovnáme s kvantlem: o qf(pravděpodobnost, df, df R ) o Například: qf(0.95,2,15) Pr (>F) - jde o p-hodnotu - Pro rozhodnutí vůč H0 j porovnáme s 5% hladnou významnost SS = n ( y y) Způsob propočtů s hodnotam z tabulky NOV 2 Trocha vysvětlvek k použtým symbolům: n = počet položek na jednotlvých řádcích ( v našem případě vždy 6) y s pruhem = průměr pro jednotlvé řádky y s pruhem = celkový průměr I = počet nálepek (v našem případě počet šířek pece tedy = 3 varanty) Šířka pece [cm] Pozorované doby koksování [mn] , Výpočet: all = c(3.5, 3.0, 2.7, 2.2, 2.3, 2.4, 7.1, 6.5, 7.9, 5.2, 4.6, 6.8, 10.8, 10.6, 11.0, 7.6, 7.1, 7.3) col1=c(3.5,3.0,2.7,2.2,2.3,2.4) col2=c(7.1,6.5,7.9,5.2,4.6,6.8) col3=c(10.8,10.6,11.0,7.6,7.1,7.3) a=mean(col1) b=mean(col2) c=mean(col3) n = 6 y 1 = (a) = y 2 = (b) = 6.35 y 3 = (c) = y = (x) =
4 2 2 2 SS = {6 [( a x) ]} + {6 [( b x) ]} + {6 [( c x) ]} SS = MS = SS = Df (3 1) = Obdobným způsobem bychom vypočítal ukazatele: SS R = MS R = F statstka SS Df MS F = = SS R MS Df R R = = (podle R to je přesnější) Způsob nterpretace tabulky NOV - V první řade porovnáme p-hodnotu s hladnou významnost - Obecně řečeno, čím větší je f-statstka, tím spíš zamítneme H0. - Přesněj řečeno lze F statstku porovnat s příslušným kvantlem jež vypočteme následujícím příkazem: o Pokud vyjde F-statstka kladná qf(0.95,df,df R ) o Pokud vyjde F-statstka záporná qf(0.05,df,df R ) Předpoklady použtí této metody I.) rezdua (chyby) pocházejí z normálního rozdělení II.) rezdua (chyby) jsou nezávslá a stejně rozdělená - zejména požadavek HOMOSKEDSTICITY o shoda rozptylů III.) dtvta střední hodnoty a rezduí (chyb) - tedy že platí vztah: o Y, B = µ + ε, B = 1 I B = 1 n Rezduum - hodnota pozorování Y,B snížená o průměr podle příslušného řádku
5 Důležtost jednotlvých předpokladů Nesplnění normálního rozdělení chyb - U dat vyššího rozsahu nevadí díky centrální lmtní větě (dále jen CLV) - Možné metody, jak napravt ne-normaltu: o Transformace o Neparametrcká NOV Heteroskedastcta - Mírná přílš nevadí - U vážnějších případů lze napravt: o transformací o Zobecněná NOV Porušená adtvta - Lze napravt transformacem Porušená nezávslost chyb Použtí lbovolné metody povede s velkou pravděpodobností k chybným závěrům Praktcký postup př volbě vhodné metody 1.) Zjštění, zda máme dostatek dat Pokud ano, lze použít NOVU V případě malého počtu dat se zabýváme normaltou chyb o Normalta splněna => NOV o Normalta nesplněna => Neparametrcká NOV tedy Kruskalův - Wallsův test (o shodě medánů ) 2.) Zjštění, zda data vykazují HETEROSKEDSTICITU - mírná nevadí - pro přesnost používáme Leveneův test o shoda rozptylů = Klascká NOV o neshoda rozptylů = Welchova zobecněná NOV
6 Přehled jednotlvých možností I. Dvou-výběrový T-test (nezávslé výběry řídící se normálním rozdělením ) - hypotézy o středních hodnotách - zobecněním je NOV jednoduchého třídění pro více testů II. Dvou-výběrový Wlcoxonův test (nezávslé výběry neřídící se normaltou) - hypotézy o medánech - zobecněním je Kruskal Wallsův test III. Párový T- test (závslé výběry řídící se normálním rozdělením) - zobecněním je NOV dvojného třídění => NOV s bloky IV. Wlcoxonův test ( párový neparametrcký test, data nejsou normální) - zobecněním je Fredmanův test Blokové stude analýza rozptylu dvojného třídění - Podstatou blokových studí je zobecněný přístup, který jž známe z párových problémů. - Například: o Prospěch dvojčat od jedné matky o Opotřebení pravé a levé pneumatky o Cena másla dentckého výrobku na dvou různých místech o Energetcký příjem před a po menstruac o td. - V podstatě u blokových studí zjšťujeme vlv faktoru (ošetření) o I 2 úrovních na spojtou odezvu. - Samozřejmě lze předpokládat významný vlv dalšího rušvého faktoru Bloku (například charakterstka ženy) na odezvu. Pojem blok s lze představt jako : počet prodejen, počet žen, basketbalových hráčů a jných potenconálních respondentů jež nám poskytnul párová data. Například: Prodejna tržby před a po reklamní kampan Žena energetcký příjem před a po menstruac Basketbalový hráč opotřebenost jeho podrážky u několka druhů bot td. Block what you can and randomze what you can t Blokováním elmnujeme rušvé faktory ( známe zdroje varablty) Znáhodněním elmnujeme rušvé faktory (neznáme zdroje varablty) - V rámc více-výběrových problémů se setkáváme z další typem grafu a sce grafem špagetovým. Názorná ukázka vz. 6MI221-tématcký celek II.pdf - slde 106 V čem se lší NOV dvojného třídění od NOVY založené na třídění jednoduchém? - především nám zde přbývá řádek navíc Kromě ošetření a rezduí ve sloupc zdrojů varablty fgurují bloky. Neřešíme jeden ale hned 2 problémy o Vlv ošetření na odezvu o Vlv bloku na odezvu
7 V souvslost s NOVOU s bloky (dále jen SB) se setkáváme s pojmy: Vyrovnaná hodnota (FV) FV = yˆ b, = y+ + yb+ Tedy : FV = průměr í-tého sloupce + průměr b-tého řádku celkový průměr Resduum RSD = e b, = yb, yˆ b, Tedy: RSD = konkrétní hodnota jí odpovídající vyrovnaná hodnota (FV) y Formulace hypotéz u jednotlvých problému: I. Jako hlavní problém považujeme vlv ošetření na odezvu vz. hodnoty v prvním řádku SB H 0 : Kvanttatvní proměnná nezávsí na ošetření (faktoru) H 1 : Kvanttatvní proměnná závsí na ošetření (faktoru) Takže například u problému s výnosností ovsa by hypotézy vypadaly následovně: H 0 : Výnos ovsa nezávsí na množství použtého hnojva. H 1 : Výnos ovsa závsí na množství použtého hnojva. II. Jako dodatečný problém považujeme vlv bloku na odezvu vz. hodnoty v druhém řádku SB. Tuto nformac bereme opravdu pouze jako dodatečnou, uvádíme j tedy jen na požádání zadavatele. H 0 : Kvanttatvní proměnná nezávsí na bloku H 1 : Kvanttatvní proměnná závsí na bloku Takže například u problému s výnosností ovsa by hypotézy vypadaly následovně: H 0 : Výnos ovsa nezávsí na pol, kde oves roste. H 1 : Výnos ovsa závsí na pol, kde oves roste. podrobněj vz. lexkon SPM Jak se vlastně SB generuje programem R? omodel <- aov(vynos~hnojvo + blok, data=oves) summary(omodel) Př rozhodování vůč H0 lze přhlížet na průměry a to: - řádkové (n b+ ) - sloupcové (n + ) Obecně řečeno, pokud se mez sebou odlšují sloupcové průměry a podobný vztah je mez řádkovým průměry, nulovou hypotézu bychom měl zamítnout. Ovšem konečné rozhodnutí by mělo být podloženo: - p-hodnotou jež je třeba porovnat s hladnou významnost - testovou statstkou jež je třeba porovnat s kvantlem příslušného rozdělení vz. lexkon SPM zpravdla Fscherovo => qf (%spolehlvost,df, Df B )
8 Předpoklady použtí metody SB dtvta střední hodnoty a chyb dtvta vlvu bloku a ošetření na střední hodnotu odezvy Chyby jsou nezávslé a stejně rozdělené (..d.) o Nezávslost chyb o Stejné rozdělení chyb => zejména homoskedastcta Normální rozdělení chyb Jak postupovat př nesplnění některých předpokladů? Porušená nezávslost chyb - nelze dále řešt ( v podstatě lze ale jde o prác pro odborníka) Porušení homoskedastcty => heteroskedastcta - buď lze vyřešt transformacem - nebo použtím neparametrckého testu Porušená normalta - a zároveň dostatek dat => díky CLV lze použít NOVU s bloky (SB) - lehce porušená normalta => nevadí, tak lze použít NOVU neboť není tak ctlvá na normaltu - výrazná ne-normalta + malý počet dat => Fredmanův test (neparametrcká SB) Ověřování předpokladů - Je dobré s pamatovat, že o : Grafcké metody jsou mnohdy cennější než formální test! 1.) Porušení nezávslost chyb - především pomocí resduálního grafu prot času [e-tme] 2.) Homoskedastcta - především pomocí resduálního grafu prot: o času [e tme] o ošetření [e-x] o vyrovnaným hodnotám [e - yhat] - a samozřejmě testem homoskedastcty o Levenův test 3.) dtvta - jak jsme byl upozorněn na přednášce, v písemce by se mohla objevt otázka na rozpoznání, zda je daný model adtvní s nterakcí č bez nterakce. V podstatě se dobře podíváme na špagetový graf a pozorujeme, zda se jednotlvé špagety lší pouze posunutím, jsou téměř rovnoběžné (berme to s rezervo, stačí přblžná rovnoběžnost) pak je model adtvní bez nterakce!!! Názorná ukázka, jak takový model vypadá vz. 6MI221-tématcký celek II.pdf - slde 148 Jnak jde o model s nterakcí, která může nabývat různých forem. Nejčastější je tzv. Multplkatvní nterakce jenž svým tvarem přpomíná trychtýř nebo téměř symetrckou hvězdu - vz. 6MI221-tématcký celek II.pdf - slde 153 Přčemž přítomnost multplkatvní nterakce lze ověřt Tukeyovým testem adtvty.
9 4.) Nenormalta - Normaltu ověřujeme : o Grafcky => QQ dagram o Testem => Shapro Wlkův test Ovšem pozor!! U dat vyššího rozsahu nám většna běžných testů normalty (Shapro.test atd.) budou hlást jako sgnfkantní velce nízkou míru porušení normalty.
ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)
NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než
REGRESNÍ ANALÝZA. 13. cvičení
REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha
ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl
Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky
Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou
Regresní a korelační analýza
Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska
Přednáška č. 11 Analýza rozptylu při dvojném třídění
Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané
POROVNÁNÍ MEZI SKUPINAMI
POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá
STATISTIKA (pro navazující magisterské studium)
Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU
6 LINEÁRNÍ REGRESNÍ MODELY
1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů
6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu
6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a
2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC
25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc
Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.
Ing. Martna Ltschmannová Statsta I., cvení ANOVA Rozšíením dvouvýbrových test pro stední hodnoty je analýza rozptylu nebol ANOVA, terá umožuje srovnávat nol stedních hodnot nezávslých náhodných výbr. Analýza
Statistická šetření a zpracování dat.
Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.
podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y
4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.
Analýza závislosti veličin sledovaných v rámci TBD
Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá
4EK211 Základy ekonometrie
4EK Základy ekonometre Zobecněná MNČ Cvčení 8 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(u u T ) = σ I n konečný a konstantní
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran
Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz
4EK211 Základy ekonometrie
4EK Základy ekonometre Zobecněná MNČ Cvčení 7 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(uu T ) = σ I n konečný a konstantní
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM
7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test
Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina
3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních
CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.
CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt
Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi
Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny
0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí
Metody matematické statistiky (NMAI 061)
Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné
STATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10
SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním
VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ
VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje
Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d
Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím
Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2
Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...
STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY
STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY Eva Reterová Olomouc 06 Fakulta zdravotnckých věd Unverzta Palackého v Olomouc Statstka pro nelékařské zdravotncké obory Eva Reterová Olomouc 06 Oponent: PhDr.
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní
Teoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Matematická statistika Zimní semestr
Analýza rozptylu (jednoduché třídění) 11.1.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Med.txt. Otevřete si program R Studio a načtěte si výše
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Mechatronické systémy s elektronicky komutovanými motory
Mechatroncké systémy s elektroncky komutovaným motory 1. EC motor Uvedený motor je zvláštním typem synchronního motoru nazývaný též bezkartáčovým stejnosměrným motorem (anglcky Brushless Drect Current
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
Optimalizace provozních podmínek. Eva Jarošová
Optimalizace provozních podmínek Eva Jarošová 1 Obsah 1. Experimenty pro optimalizaci provozních podmínek 2. EVOP klasický postup využití statistického softwaru 3. Centrální složený návrh model odezvové
Testování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
2. Posouzení efektivnosti investice do malé vtrné elektrárny
2. Posouzení efektvnost nvestce do malé vtrné elektrárny Cíle úlohy: Posoudt ekonomckou výhodnost proektu malé vtrné elektrárny pomocí základních metod hodnocení efektvnost nvestních proekt ako sou metoda
Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Staré mapy TEMAP - elearning
Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost
9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese
cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování
ADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
t-test, Studentův párový test Ing. Michael Rost, Ph.D.
Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se
Teoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
Monte Carlo metody Josef Pelikán CGG MFF UK Praha.
Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný
4. Třídění statistických dat pořádek v datech
4. Třídění statstcých dat pořáde v datech Záladní členění statstcých řad: řada časová, řada prostorová, řada věcná věcná slovní řada, věcná číselná řada. Záladem statstcého třídění je uspořádání hodnot
Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička
Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
MODELOVÁNÍ A SIMULACE
MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
27 Systémy s více vstupy a výstupy
7 Systémy s více vstupy a výstupy Mchael Šebek Automatcké řízení 017 4-5-17 Stavový model MIMO systému Automatcké řízení - Kybernetka a robotka Má obecně m vstupů p výstupů x () t = Ax() t + Bu() t y()
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Využití logistické regrese pro hodnocení omaku
Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost
Náhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH
VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova 6 461 17 Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta
PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ
PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme
motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky
Energie elektrického pole
Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný
Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze
Aplikovaná statistika v R - cvičení 2
Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
11 Kvantová teorie molekul
11 Kvantová teore molekul Pops molekul v rámc kvantové teore je ústředním tématem kvantové cheme. Na rozdíl od atomů nejsou molekuly centrálně symetrcké, což výpočty jejch vlastností komplkuje. V důsledku
Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)
. NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou
Design Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr
StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule
4.4 Exploratorní analýza struktury objektů (EDA)
4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk
Přednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace
Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality
Opakování Opakování: Testy o střední hodnotě normálního rozdělení 1 jednovýběrový t-test 2 párový t-test 3 dvouvýběrový t-test jednovýběrový Wilcoxonův test párový Wilcoxonův test dvouvýběrový Wilcoxonův
Seminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná