4ST201 STATISTIKA CVIČENÍ Č. 8
|
|
- Rudolf Horáček
- před 8 lety
- Počet zobrazení:
Transkript
1 4ST201 STATISTIKA CVIČENÍ Č. 8 analýza závislostí kontingenční tabulky test závislosti v kontingenční tabulce analýza rozptylu regresní analýza lineární regrese Analýza závislostí Budeme ověřovat existenci závislosti dvou kategoriálních proměnných kontingenční tabulky o např. závislost oblíbeného deníku a oblíbené televizní stanice, závislost průběhu choroby na tom, zda byl pacient očkován číselné proměnné na kategoriální proměnné analýza rozptylu o např. závislost příjmu na dosaženém vzdělání, závislost spotřeby auta na typu použitého benzinu číselné proměnné na jedné nebo více jiných číselných proměnných regresní analýza o např. závislost zisku firmy na počtu zaměstnanců, výši investic, objemu produkce, dvou číselných proměnných korelační analýzy o např. závislost výše pojistného na výši příjmu, závislost měsíčních výdajů domácnosti na počtu členů domácnosti Závislost 2 kategoriálních proměnných - kontingenční tabulky Hodnoty proměnné Y X/Y Y1 Y2 Yj Ys ni. Hodnoty proměnné X X1 n11 n12 n1j n1s n1. X2 n21 n22 n2j n2s n2. Xi n31 n32 n3j n3s n3. Xr nr1 nr2 nrj nrs nr. n.j n.1 n.2 n.j n.s n okrajové četnosti vyjadřují četnosti jednotlivých hodnot proměnných X a Y sdružené četnosti vyjadřují četnosti kombinací jednotlivých hodnot proměnných X a Y 1
2 Co testujeme? Test test k ověření nezávislosti v kontingenční tabulce je speciální případ chí-kvadrát testu dobré shody a porovnává výběrové (pozorované) četnosti s teoretickými četnostmi, které bychom očekávali v případě nezávislosti sledovaných proměnných kontingenční (kombinační) tabulka vzniká tříděním jednotek souboru podle variant dvou kategoriálních znaků nulová hypotéza říká, že sledované proměnné jsou nezávislé, alternativní hypotéza nulovou popírá a říká, že sledované proměnné jsou závislé : =.. : 1 1 testovým kritériem je veličina G, která má v případě nezávislosti a při dostatečně velkém počtu pozorování přibližně chí-kvadrát rozdělení s ν = (r-1)(s-1) stupni volnosti, kde r je počet variant prvního znaku (počet řádků) a s je počet variant druhého znaku (počet sloupců) =, kde =.. tabulka obsahovala v případě nezávislosti sledovaných znaků Testové kritérium má při platnosti nulové hypotézy rozdělení Kritický obor jsou teoretické četnosti, které by kontingenční 1 1 =< 1 1; pro posouzení intenzity závislosti proměnných v kontingenční tabulce se používají různé charakteristiky, nejpoužívanější jsou Pearsonův koeficient kontingence a Cramérův koeficient kontingence, které jsou založené na hodnotě testového kritéria chí-kvadrát =/+ = Pearsonův koeficient kontingence =/ 1 = Cramérův koeficient kontingence, kde =; Asociační tabulka kontingenční tabulce o rozměru 2 řádky x 2 sloupce se říká asociační tabulka v případě asociační tabulky lze hodnotu testového kritéria vypočítat pomocí vzorce =, kritický obor má pak tvar... = 1;. těsnost závislosti v asociační tabulce lze měřit pomocí tzv. koeficientu asociace = , který nabývá hodnot <-1;1> 2
3 Př. 8.1 U 93 pacientů trpících chorobou bylo zjišťováno, zda byli očkováni a jaký průběh choroba má. Závisí průběh choroby na tom, zda pacient byl očkován? Uvažujte α = 0,05. Vypočtěte ručně. Průběh choroby Lehký Těžký Pacient očkován ANO 33 9 NE Př. 8.2 Byla zjišťována souvislost mezi hladinou alkoholu v krvi (nízká, střední, vysoká) a rychlostí reakce (dobrá, špatná) u 100 náhodně vybraných lidí. Existuje souvislost? Pokud ano, jaká je intenzita závislosti? Testuje na hladině významnosti α = 0,05. Vypočtěte v MS Excel pomocí funkce CHITEST, pokud znáte teoretické četnosti. Rychlost reakce Hladina alkoholu Dobrá Špatná Celkem Nízká Střední Vysoká Empirické Teoretické Empirické 5 15 Teoretické 12 8 Empirické 2 13 Teoretické Celkem
4 Závislost číselné proměnné na kategoriální - Analýza rozptylu (ANOVA) Co testujeme? ověření existence vlivu kategoriálního faktoru (nezávisle proměnné) na hodnoty číselného znaku (závisle proměnné) tj. ověření závislosti jedné číselné proměnné na jedné kategoriální proměnné (faktoru) faktor nabývá malého počtu (k) obměn a hodnoty závisle proměnné můžeme roztřídit do k skupin podle tohoto faktoru Př. Máme k dispozici údaje z filmové databáze o průměrném hodnocení kvality 15 filmů uživateli webu. Filmy mají na škále hodnocení 87, 87, 84, 81, 62, 64, 70, 74, 67, 58, 79, 83, 91, 84 a 88. Filmy je možné roztřídit dle žánru do 3 skupin akční, komedie a drama. Zajímá nás, zda faktor žánr má vliv na to, jak jsou filmy hodnoceny. ověření závislosti spočívá v porovnání výběrových průměrů uvnitř jednotlivých skupin (tj. jde o určité rozšíření testu o shodě středních hodnot) rozdílnost mezi skupinovými průměry (charakterizovaná pomocí meziskupinové variability) je srovnávána s kolísáním hodnot uvnitř skupin (charakterizovaným vnitroskupinovou variabilitou) ŽÁNR HODNOCENÍ PRŮMĚRNÉ HODNOCENÍ Komedie ,6 Akční ,2 Drama ,0 PRŮMĚRNÉ HODNOCENÍ ZA VŠECHNY FILMY = 77,3 meziskupinová variabilita vyjádřena jako meziskupinový součet čtverců (součet druhých mocnin odchylek skupinových průměrů od celkového průměru sledované závislé veličiny) vyjadřuje, jak moc se od sebe liší jednotlivé skupiny. = vnitroskupinová variabilita vyjádřena jako vnitroskupinový součet čtverců (součet druhých mocnin odchylek jednotlivých hodnot uvnitř skupin od příslušných skupinových průměrů) vyjadřuje, jak moc se liší hodnoty uvnitř skupin. = celková variabilita závisle proměnné vyjádřena jako celkový součet čtverců vyjadřuje, jak moc různé jsou hodnoty závisle proměnné a platí, =. +. = 4
5 Test nulová hypotéza o nezávislosti formulována jako hypotéza o rovnosti středních hodnot : μ =μ = =μ : => nezávislost závisle proměnné na faktoru => závislost závisle proměnné faktoru testové kritérium F vychází z toho, že čím větší podíl na celkové variabilitě má variabilita meziskupinová oproti vnitroskupinové, tím spíše má sledovaný faktor vliv na rozdílnost hodnot závisle proměnné =./ 1. / Při platnosti nulové hypotézy má testové kritérium rozdělení 1,, kde k je počet variant faktoru a n je počet pozorování. Kritický obor = 1, ; míru těsnosti závislosti závisle proměnné na třídícím faktoru lze měřit pomocí tzv. poměru determinace, který je konstruován jak podíl meziskupinové variability na celkové variabilitě závisle proměnné nabývá hodnot o 0 do 1, přičemž závislost je tím těsnější, čím je hodnota poměru determinace blíže 1 =. statistický software často dává výstup analýzy rozptylu v následujícím formátu: Zdroj Součet čtverců Stupně volnosti Průměrný Hodnota F Hodnota P variability (SS) (Rozdíl) čtverec (MS) (F) Faktor (Mezi výběry). 1. / 1. / 1. / Reziduální (Všechny výběry).. / Celkem 1 ANALÝZA ROZPTYLU V MS EXCEL o o V modulu ANALÝZA DAT nabídka Anova: jeden faktor Jsou-li data ve formátu, kdy proměnné jsou v řádcích a pozorování ve sloupcích, pak volbu Sdružit nastavit na Řádky o Jsou-li data ve formátu, kdy proměnné jsou ve sloupcích a pozorování v řádcích, pak volbu Sdružit nastavit na Sloupce 5
6 Př. 8.3 U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi. Má osoba cvičícího vliv na počet dosažených bodů u závěrečného testu? Jaká je těsnost závislosti? Využijte výstup z MS Excel. Zkuste v modulu Analýza dat výstup vytvořit (sdružit sloupce). Zadání Cvičící Kuba Kubina Kubinčák Body u závěrečného testu Výstup z MS Excel ANOVA Zdroj variability SS Rozdíl MS F Hodnota P F krit Mezi výběry 2 181,17 90,58 7,58 0,0117 4,256 Všechny výběry 9 107,5 11,94 Celkem ,67 Př. 8.4 Pomocí experimentu byla testována spotřeba při použití 3 druhů benzinu, s každým druhem bylo provedeno 5 pokusů. Doplňte tabulku ANOVA a rozhodněte na hladině významnosti 0,05, zda spotřeba závisí na druhu benzinu. Změřte těsnost závislosti. Zdroj variability SS Rozdíl MS F Mezi výběry Všechny výběry 0, Celkem 0, Př Existuje závislost hodnocení filmu na serveru na jeho žánru? Testujte na 5% hladině významnosti a posuďte těsnost testované závislosti. Vypočtěte v MS Excel pomocí modulu Analýza dat (sdružit řádky). ŽÁNR HODNOCENÍ Komedie Akční Drama
Cvičící Kuba Kubina Kubinčák Body u závěrečného testu
1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.
VíceAnalýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer
ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími
VíceAnalýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.
ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.
VíceV praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
VíceSever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty
Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí
VíceStav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
VícePříloha č. 3. Kombinační třídění
Příloha č. 3 Kombinační třídění Měření závislosti mezi spokojeností s kulturním programem v Třebíči a dojížděním za kulturou do větších měst. Řádky: Vyhovuje Vám kulturní program nabízený v Třebíči? Sloupce:
Více4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
VícePříloha CD: Testování hypotéz 1
Příloha CD: Testování hypotéz 1 Testování hypotéz Hypotéza č. 1: Vyhodnocování efektivnosti zakázek je závislé na užívání softwaru pro Typ testování: testování nezávislosti kvalitativních znaků (2x2) pomocí
VíceVÍCEROZMĚRNÝ STATISTICKÝ SOUBOR
KORELACE A REGRESE 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/..00/8.001)
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceNEPARAMETRICKÉ TESTY
NEPARAMETRICKÉ TESTY Výhodou neparametrických testů je jejich použitelnost bez ohledu na typ rozdělení, z něhož výběr pochází. K testování se nepoužívají parametry výběru (např.: aritmetický průměr či
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 2: Metoda nejmenších čtverců LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Doplnění a opakování z
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceSEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
VícePoznámky k předmětu Aplikovaná statistika, 9.téma
Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního
VíceZa hranice nejistoty(2)
Za hranice nejistoty(2) MUDr. Jaroslava Ambrožová OKB-H Nemocnice Prachatice, a.s. 19.5.2014 1 TNI 01 0115: VIM EP15-A2 User Verification of performance for Precision and Trueness C51-A Expression of measurement
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceZ mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
VícePlánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Vícea) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily
Testování hypotéz Testování hypotéz jsou klasické statistické úsudky založené na nějakém apriorním předpokladu. Vyslovíme-li předpoklad o hodnotě neznámého parametru nebo o zákonu rozdělení sledované náhodné
Více6. T e s t o v á n í h y p o t é z
6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceMatematická statistika
Matematická statistika Daniel Husek Gymnázium Rožnov pod Radhoštěm, 8. A8 Dne 12. 12. 2010 v Rožnově pod Radhoštěm Osnova Strana 1) Úvod 3 2) Historie matematické statistiky 4 3) Základní pojmy matematické
VíceÚloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
VíceÉ ý ě š ý ó š ý ů ý ž ů ý ý ě ó š Š ó ó ů ě š ě ý ž ó ó ž ý ý ů ě š Š ý ó ě š ů ě ě ý ý š ě ý š ě š ě ý ž ě ů ě ý ů ě ý ů š ě ž š ě ů ů ě ě ů ě ý ů ě ě ů ň É ý š ů ý š ú š š Ů Ý Ů ě ž ž š š ž š ý ý ý ž
VíceUniverzita Pardubice Fakulta Ekonomicko- správní. Testy hypotéz s využitím programu MS EXCEL. Tomáš Borůvka
Univerzita Pardubice Fakulta Ekonomicko- správní Testy hypotéz s využitím programu MS EXCEL Tomáš Borůvka Bakalářská práce 010 Prohlašuji: Tuto práci jsem vypracoval samostatně. Veškeré literární prameny
VíceNáhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
VíceÚvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
VíceSimulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích
Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích Nedostatešný popis systému a jeho modelu vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělit fyzickou nebo
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 2.1 Tvorba lineárních regresních modelů při analýze dat Autor práce: Přednášející:
VíceVŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Zadání 11 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL
VícePříklady ze Statistiky
Příklady ze Statistiky Regrese Příklad 1 V továrně byla sledována závislost celkových nákladů "n" (v tis. Kč.) na produkci "p". Byly zaznamenány následující údaje p = [532 297 378 121 519 613 592 497];
VíceHledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích
Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích Firková, L. 1), Kafka, V. 2), Figala, V. 3), Herzán, M. 4), Nykodýmová, V. 5) 1) VŠB
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
Více12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
1. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ Průvodce studiem Navážeme na předchozí kapitolu 11 a vysvětlíme některé statistické testy. Předpokládané znalosti Pojmy z předchozích kapitol. Cíle Cílem této kapitoly
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceMSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test
c 2007 Kompost 1 MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test Jestliže při testování výsledek (hodnota testového kritéria) padne do kritického oboru: a) musíme nově formulovat nulovou hypotézu,
VíceMěření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceVŠB Technická univerzita Ostrava
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: PRAVDĚPODOBNOST A STATISTIKA Domácí úkoly Zadání 21 DATUM ODEVZDÁNÍ
VíceTestování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
VíceCvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VíceSemestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2
Semestrální projekt do předmětu Statistika Vypracoval: Adam Mlejnek 2-36 Oponenti: Patrik Novotný 2-36 Jakub Nováček 2-36 Úvod Pro vypracování projektu do předmětu statistika jsem si zvolil průzkum kvality
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VícePřírodopis v očích žáků II. stupně základních škol
Přírodopis v očích žáků II. stupně základních škol Hlavním cílem práce bylo zjistit postoje žáků druhého stupně základních škol k vyučovacímu předmětu Tento cíl byl dále rozvíjen dílčími cíli: 1. zjistit
Více4ST201 STATISTIKA CVIČENÍ Č. 10
4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VícePoměrní ukazatelé. Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí
Poměrní ukazatelé Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí Poměrný ukazatel Poměrný ukazatel znázorňuje výsledek, který získáme
VícePříklad 81b. Předpokládejme, že výška chlapců ve věku 9,5 až 10 roků má normální rozdělení N(mi;sig2)
Příklad 1. Za předpokladu, že výška dětí ve věku 10 let má normální rozdělení s rozptylem 38, určete pravostranný 99% interval spolehlivosti, ve kterém bude ležet neznámá střední hodnota výšky dětí, jestliže
VíceLiteratura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější)
1. přednáška Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější) 1. Testování hypotéz H0 testovaná (nulová) hypotéza H1 alternativní hypotéza (dvoustranná,
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
Více31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceZpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
VíceTest dobré shody v KONTINGENČNÍCH TABULKÁCH
Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
VíceVliv vzdělanostní úrovně na kriminalitu obyvatelstva
Ing. Erika Urbánková, PhD. Katedra ekonomických teorií Provozně ekonomická fakulta Česká zemědělská univerzita Mgr. František Hřebík, Ph.D. prorektor pro zahraniční styky a vnější vztahy Katedra managementu
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceNěkteré zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení
Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj.
VíceAnalýza rozptylu. ANOVA cvičení
Analýza rozptylu 1. Pět skupin po 4 mužích bylo vystaveno rozličné dietě A1 až A5. Na konci týdne byly vyčísleny kladné a záporné diference hmotnosti mužů po aplikaci týdenní diety. Porovnejte čtyři diety
VíceSEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI
SEMESTRÁ LNÍ PRÁ CE Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI Předmě t ANOVA A ZÁ KON PROPAGACE CHYB U JEDNOROZMĚ RNÝ CH DAT Ú stav experimentá lní biofarmacie, Hradec
Víceý ý š ž š ý ý š š ž ý ú ý ž Í š ý ý ž Ť ý ž ž Ú ý ý ý ý ď ý Í ž ď ýš Ž ž ž ž ď Ť Ž ž ď ž š š ý ú ň ý ý ý ý š ď ý š š ž ž Č Žš š š ýš š ž š ď ýš ž ý š Ú š Í Í ž ž ý ý ý š ž š ž ž ž š ž ý ž š š š ý ý š š
Více"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006
ANALÝZA ROZPTYLU JAKO ZÁKLADNÍ METODA MNOHONÁSOBNÉHO POROVNÁVÁNÍ STŘEDNÍCH HODNOT V RŮZNÝCH SOFTWAROVÝCH PRODUKTECH ANALYSIS OF VARIANCE AS A PRIMARY METHOD OF MULTIPLE COMPARISON OF EXPECTED VALUES IN
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
VíceOrganizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?
Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/
Více1. Příklad U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti:
1. říklad U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti: Rychlost (km/h) 40 50 60 70 80 9010 Spotřeba (l/100 km) 5,7 5,4 5,2 5,2 5,8 6 6,8 8,1 a. Vyrovnejte data regresní přímkou
VíceHeritabilita. Heritabilita = dědivost Podíl aditivního rozptylu na celkovém fenotypovém rozptylu Výpočet heritability
Heritabilita Heritabilita = dědivost Podíl aditivního rozptylu na celkovém fenotypovém rozptylu Výpočet heritability h 2 = V A / V P Výpočet genetické determinance znaku h 2 = V G / V P Heritabilita závisí
VíceZ mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
1. Příklad Hodíme 60krát šestistěou hrací kostkou. Jedotlivé stěy padly v ásledujícím poměru: 7:9:10:6:15:13. Proveďte test a 5% hladiě výzamosti, zda je kostka v pořádku. H 0 : π 1 = 1/6, π = 1/6, π 3
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
VíceVyužití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)
Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) doc. RNDr. PhMr. Karel
VíceStatistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceUKAZATELÉ VARIABILITY
UKAZATELÉ VARIABILITY VÝZNAM Porovnejte známky dvou studentek ze stejného předmětu: Studentka A: Studentka B: Oba soubory mají stejný rozsah hodnoty, ale liší se známky studentky A jsou vyrovnanější, jsou
Více