IV. CVIENÍ ZE STATISTIKY

Rozměr: px
Začít zobrazení ze stránky:

Download "IV. CVIENÍ ZE STATISTIKY"

Transkript

1 IV. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data kvantitativní povahy. K tomuto budeme opt používat program Excel 2007 MS Office. 1. Jak mžeme analyzovat kvantitativní data? Krátce si pipomeme základní fakta ze statistické teorie testování hypotéz. a) Hodnocení rozdíl dvou výbrových prmr nezávislých soubor dvouvýbrový t-test. Teoretický úvod: Pedpokládejme, že máme dva nezávislé soubory reprezentující dv populace. Pedpokládejme, že sledovaná numerická veliina je v obou populacích normáln rozložená s neznámými populaními prmry µ 1 a µ 2. Nulová hypotéza pedpokládá nulový rozdíl mezi populaními prmry, tedy že µ 1 = µ 2. K tomu, abychom mohli prmry dvou populací porovnat, je teba spoítat testovou statistiku t. Výpoet je založen na rozdílu mezi prmry obou výbr, variabilit sledované veliiny a velikosti obou výbr. Pesný vzorec naleznete ve výukových textech. Tato testová statistika je rozložena podle Studentova t-rozdlení s n 1 + n 2-2 stupni volnosti. Stupn volnosti jsou parametrem t-rozdlení. Pomocí statistického modulu programu Excel najdeme pesnou p-hodnotu. Tato pravdpodobnost odpovídá pravdpodobnosti výskytu takovéto nebo ješt extrémnjší hodnoty testového kritéria t za pedpokladu platnosti nulové hypotézy. Pokud je menší než 0,05, nulovou hypotézu zamítáme. Znamená to, že pravdpodobnost, že by pozorované rozdíly vznikly pouze náhodou, je menší než 5 %. Klasický dvouvýbrový t-test, krom normálního rozložení sledované veliiny, pedpokládá také, že rozptyly jsou v obou populacích shodné. Tento pedpoklad se testuje na základ výbrových odhad smrodatných odchylek s 1 a s 2 F-testem. V pípad nestejných smrodatných odchylek se použije modifikovaný výpoet testové statistiky t a také poet stup volnosti je výsledkem pomrn složitého výpotu. Data, se kterými budete pracovat, naleznete v souboru F:\SOFTWARE\biostatistika\data\analýza dat.xlsx 1

2 Na listu dvouvýbrový t-test jsou data 237 zamstnanc nemocnice. Ve sloupci A Zamstnanec. je uvedena identifikace. Druhý sloupec (B) Vk udává vk zamstnance v letech. Tetí sloupec (C) Cholesterol obsahuje informaci o hodnot celkového cholesterolu meného v mmol/l, ve sloupci D je zadána hodnota body mass indexu BMI každého zamstnance a znak Kouení rozlišuje kuáky (kódováno 1) a nekuáky (kódováno 2). Zadání úkolu Vaším úkolem bude provit, jestli zamstnanci, kteí kouí, jsou stejn staí jako zamstnanci, kteí nekouí i zda se tyto skupiny vkov odlišují. Dále je teba zjistit, jestli má kouení vliv na hodnoty celkového cholesterolu a BMI. Stanovíme nulové a alternativní hypotézy: 1. Nulová hypotéza: Kuáci a nekuáci se neliší ve vku. Alternativní hypotéza: Kuáci a nekuáci se liší ve vku. 2. Nulová hypotéza: Kuáci a nekuáci se neliší v celkovém cholesterolu. Alternativní hypotéza: Kuáci a nekuáci se liší v celkovém cholesterolu. Postup ovení první hypotézy: 1. Pomocí F-testu ovíme zda, rozptyl veliiny Vk je stejný v populaci kuák a v populaci nekuák. Tento nástroj je obsažen v položce Analýza dat. (Analýzu dat nastavte stejným zpsobem jako pi použití nástroje Popisná statistika kliknte na ikonu, otevete Možnosti aplikace Excel, vyberte položku Doplky, nastavte Analytické nástroje jako 2

3 Aktivní doplnk k dispozici a kliknte na tlaítko Pejít, zaškrtnte Analytické nástroje a potvrte OK. 2. Z hlavního menu vyberte položku Data a kliknte na položku Analýza dat. 3. Ze seznamu analytických nástroj vyberte Dvouvýbrový F-test pro rozptyl. Vyplte dialogové okno Dvouvýbrový F-test pro rozptyl. Do pole 1. soubor zadejte adresu bunk, které obsahují vk kuák buky B2:B97. Do pole 2. soubor zadejte adresu bunk, které obsahují vk nekuák buky B98:B238. Hladinu alfa ponechte nastavenou na standardní hodnotu 0,05 a do pole Výstupní oblast zadejte adresu buky K1. Potvrte tlaítkem OK. Dostanete výstupní tabulku: 3

4 Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr veliiny Vk pro 1. i 2. soubor. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik pacient bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. Název rozdíl je pekladatelskou chybou. Dále je uvedena hodnota testového kriteria F, dosažená hladina statistické významnosti P a kritická hodnota F krit. Pokud je p-hodnota vtší nebo rovna 0,05, znamená to, že rozptyly v obou populacích jsou shodné. Pokud je p-hodnota menší než 0,05, rozptyly ve sledovaných populacích nejsou shodné. V tomto pípad p = 0,205, což je vtší než 0,05, rozptyly jsou tedy shodné. Provedení t-testu. 4. Kliknte na Analýza dat a z nabídky analytických nástroj vyberte Dvouvýbrový t-test s rovností rozptyl. 5. Vyplte dialogové okno Dvouvýbrový t-test s rovností rozptyl obdobným zpsobem jako v pípad F-testu. Soubory jsou totožné, hypotetický rozdíl stedních hodnot je roven 0, hodnotu hladiny alfa nechejte na hodnot 0, Do pole Výstupní oblast zadejte adresu buky K12. Kliknte na OK 4

5 Tabulka s výsledky t-testu Soubor 1 pedstavuje opt kuáky, Soubor 2 zamstnance nekuáky. St. hodnota je aritmetický prmr veliiny Vk u kuák a nekuák. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. V následujícím ádku je spoítán Spolený rozptyl pro 1. a 2. soubor. Hyp. rozdíl stedních hodnot je nulový, což je v souladu s naší nulovou hypotézou. Položka Rozdíl nám udává poet stup volnosti. K výpotu bylo použito vzorce n 1 + n 2-2 = = 235. Dále je uvedena hodnota testového kriteria t Stat, dosažená hladina statistické významnosti P (1) pro jednostranný test (1) a kritická hodnota t krit pro jednostranný test. Vzhledem k oboustranné formulaci alternativní hypotézy nás zajímá hladina dosažené statistické významnosti pro oboustranný test P (2) = 0,026. Je zejmé, že dosažená hodnota signifikance je podstatn menší než stanovená hladina 0,05, je tedy oprávnné zamítnout nulovou hypotézu. Závr testování: Zamítáme nulovou hypotézu: Kuáci a nekuáci se neliší ve vku. Dvouvýbrovým t-testem bylo prokázáno, že kuáci jsou statisticky významn mladší než nekuáci. Prmrný vk kuák je 34,8 rok, nekuák 38,2 rok. Postup ovení druhé hypotézy: Nulová hypotéza: Kuáci a nekuáci se neliší v celkovém cholesterolu. Alternativní hypotéza: Kuáci a nekuáci se liší v celkovém cholesterolu. Postup bude obdobný jako v prvním píkladu: 1. Pomocí F-testu opt ovte zda, rozptyl veliiny celkový cholesterol je stejný v populaci kuák a v populaci nekuák. 2. Vyberte položku Data v hlavním menu a kliknte na Analýza dat. Vyplte dialogové okno Dvouvýbrový F-test pro rozptyl: 5

6 Potvrte tlaítkem OK. Tabulka s výsledky F-testu:. Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr celkového cholesterolu pro 1. i 2. soubor. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. Dále je uvedena hodnota testového kriteria F, dosažená hladina statistické významnosti P a kritická hodnota F krit. Dosažená hladina statistické významnosti pro F-test nabyla hodnoty 0,011, je tedy menší než 0,05, rozptyly v obou populacích tedy nejsou shodné. Vidíme, že veliina celkový cholesterol je ve skupin kuák variabilnjší (má vtší rozptyl) než ve skupin nekuák. Provete dvouvýbrový t-test. 3. Zvolte Analýza dat a z nabídky analytických nástroj vyberte Dvouvýbrový t-test s nerovností rozptyl. 6

7 4. Vyplte dialogové okno Dvouvýbrový t-test s nerovností rozptyl obdobným zpsobem jako v pípad F-testu. Soubory jsou totožné, hypotetický rozdíl stedních hodnot je roven 0, hodnotu hladiny alfa nechejte na hodnot 0, Kliknte na OK. Tabulka s výsledky t-testu Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr celkového cholesterolu kuák a nekuák. Všimnte si tchto hodnot, které se píliš neliší (5,096 mmol/l u kuák a 5,0132 u nekuák). Položka Rozptyl nám udává hodnotu rozptyl sledované veliiny v obou souborech. 7

8 V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. K výpotu potu stup volnosti bylo použito složitjšího vzorce než v pedchozím píkladu, kde byl splnn pedpoklad rovnosti rozptyl. Dále je uvedena hodnota testového kriteria t Stat, dosažená hladina statistické významnosti P (1) pro jednostranný test a kritická hodnota t krit pro jednostranný test (1). Vzhledem k oboustranné formulaci alternativní hypotézy nás zajímá hladina dosažené statistické významnosti pro oboustranný test P (2) = 0,590. Je zejmé, že dosažená hodnota signifikance je vtší než stanovená hladina 0,05, a tudíž není možné zamítnout nulovou hypotézu. 1) Závr testování: Pijímáme nulovou hypotézu: Kuáci a nekuáci se neliší v celkovém cholesterolu. Úkol k samostatnému ešení: Zjistte, zda kouení ovlivuje tlesnou hmotnost zamstnanc nemocnice. Tlesná hmotnost je vyjádena indexem BMI. Návod: Stanovte nulovou a alternativní hypotézu. Ovte, zda rozptyly veliiny BMI jsou shodné v obou zkoumaných populacích (u kuák a nekuák). Zvolte vhodný typ dvouvýbrového t-testu. Provete t-test a na základ dosažené hladiny statistické významnosti (p-hodnoty) rozhodnte o platnosti dané nulové hypotézy. b) Hodnocení rozdíl dvou výbrových prmr párových dat párový t-test. Teoretický úvod: Nyní uvažujme situaci, kdy na skupin vybraných jedinc provedeme urité mení a potom znovu za jiných okolností nebo po provedení uritého zásahu (léby apod.) provedeme totéž mení na týchž jedincích ješt jednou. Pjde o to zjistit, zda ml zásah vliv na prmrnou hodnotu sledované veliiny, jinými slovy, zda se prmr ped zásahem µ 1 rovná prmru po zásahu µ 2. Nulová hypotéza opt pedpokládá, že se tyto prmry neliší. Ze sledované populace poídíme náhodný výbr o rozsahu n jedinc. Provedeme dvakrát mení dané numerické veliiny jednou ped zásahem, podruhé po zásahu a spoteme rozdíl tchto hodnot pro každého jedince. Získáme tak n dvojic mení a n rozdíl. Spoteme prmr tchto rozdíl (diferencí) a oznaíme d. Pokud platí nulová hypotéza a zásah neml na menou veliinu žádný vliv, bude d velice blízký nule. Bude-li naopak d od nuly daleko, bude to svdit o tom, že zásah uritým zpsobem ovlivnil sledovanou numerickou veliinu. K tomu abychom mohli vyjádit, jak daleko je d od nuly, spoítáme hodnotu testové statistiky t. Výpoet statistiky t vychází z prmrné diference d, rozptylu diferencí a rozsahu náhodného výbru. Pesný vzorec naleznete ve výukových textech. Tato testová statistika je rozložena podle Studentova t-rozdlení s n - 1 stupni volnosti. Pomocí statistického modulu programu Excel najdeme pesnou p hodnotu. Tato pravdpodobnost odpovídá pravdpodobnosti výskytu takovéto nebo ješt extrémnjší hodnoty testového kritéria za pedpokladu, že platí 8

9 nulová hypotéza. Pokud je dosažená hladina statistické významnosti p menší než 0,05, nulovou hypotézu zamítáme. Znamená to, že pravdpodobnost, že by pozorované rozdíly vznikly pouze náhodou, je menší než 5 %. Data, se kterými budete pracovat, naleznete v souboru F:\SOFTWARE\biostatistika\data\analýza dat.xlsx na listu párový t-test Na listu párový t-test jsou zaznamenána data pacient, kterým byla transplantována ledvina. Ve sloupci (A) Pacient. je uvedena identifikace. Ve sloupci (B) je zaznamenán Vk pacienta v letech, ve sloupci (C) jeho Pohlaví a ve sloupci (D) je uvedeno Imunosupresivum, které pacienti po transplantaci užívali. Ve sloupcích (E) a (F) najdete hodnoty Kreatininu namené ped transplantací a 6 msíc po transplantaci v µmol/l. Ve sloupcích (G) a (H) jsou hodnoty Albuminu namené ped transplantací a 6 msíc po transplantaci v g/l. Ve sloupcích (I) a (J) najdete hodnoty Kyseliny moové namené ped transplantací a 6 msíc po transplantaci v µmol/l. Je zejmé, že všechny veliiny ve sloupcích (E) až (J) jsou kvantitativního typu a byly získány opakovaným mením. Jedná se tedy o párová data páry jsou vyznaeny barevným oznaením sloupc stejnou barvou. Zadání úkolu Vaším úkolem bude posoudit, zda vlivem transplantace došlo ke zmnám biochemických parametr kreatininu, albuminu a kyseliny moové. Stanovíme nulovou a alternativní hypotézu: Nulová hypotéza: Hladina kreatininu 6 msíc po transplantaci ledviny se neliší od hladiny ped transplantací. Alternativní hypotéza: Hladina kreatininu 6 msíc po transplantaci ledviny se liší od hladiny ped transplantací. 9

10 Postup ovení hypotézy: 1. Kliknte na položku Analýza dat v hlavním menu a z nabídky analytických nástroj vyberte Dvouvýbrový párový t-test na stední hodnotu. Slovo dvouvýbrový zde nemá opodstatnní, pracujeme pouze s jedním výbrem, jedná se opt o pekladatelskou chybu. Výbr potvrte tlaítkem OK. Dostanete dialogové okno: 2. Do pole 1. soubor zadejte adresu oblasti bunk s hodnotami ze sloupce E Kreatinin ped transplantací. 3. Do pole 2. soubor zadejte adresu oblasti bunk s hodnotami ze sloupce F Kreatinin 6 msíc po transplantaci. 4. Do pole Hypotetický rozdíl stedních hodnot napište íslo nula (nulová hypotéza pedpokládá, že rozdíl stedních hodnot (prmr) je roven nule). 5. Zatrhnte políko Popisky, protože jste v polích 1. a 2. soubor zadali data i s bukami v prvním ádku, kde jsou popisky. Do pole Výstupní oblast zadejte adresu L1. 6. Kliknte na OK.. 10

11 Dostanete následující tabulku: V prvním ádku je uveden aritmetický prmr hladiny kreatininu zjištný ped transplantací (1. sloupec) a po transplantaci (2. sloupec). Všimnte si znaného rozdílu mezi obma hodnotami. V druhém ádku jsou uvedeny rozptyly veliiny, tetí ádek Pozorování nás informuje o potu jedinc, kteí byli zaazeni do sledování. Na dalším ádku je vypoítán Pearsonv korelaní koeficient, jehož hodnota vypovídá o tém nulové korelaci mezi hodnotami zjištnými ped transplantací a po transplantaci. Hyp. rozdíl st. hodnot je roven 0, tak jak to pedpokládá stanovená nulová hypotéza. Položka Rozdíl udává poet stup volnosti vypoítaný podle vzorce n 1 = 50 1 = 49. Dále je uvedena hodnota testové statistiky t Stat, dosažená hladina statistické významnosti P pro jednostranný test (1), kritická hodnota pro jednostranný test. Pro posouzení platnosti nulové hypotézy je nejdležitjší hodnota dosažené statistické významnosti pro oboustranný test P(2), která je v našem pípad rovna 2,968* Je zejmé, že dosažená hodnota signifikance je podstatn menší než stanovená hladina 0,05, jsme tedy oprávnni zamítnout nulovou hypotézu. 7. Uiníme závr testování: Zamítáme nulovou hypotézu: Hladina kreatininu 6 msíc po transplantaci ledviny se neliší od hladiny ped transplantací. a pijímáme alternativní hypotézu: Hladina kreatininu 6 msíc po transplantaci ledviny se liší od hladiny ped transplantací. Prmrná hladina kreatininu se vlivem transplantace ledviny statisticky významn snížila, z prmrné hodnoty 642,14 µmol/l na prmrnou hodnotu 124,64 µmol/l. Pro porovnání uvádíme tabulku s referenními mezemi kreatininu: 11

12 Úkol k samostatnému ešení: Posute, zda vlivem transplantace došlo ke zmnám dalších biochemických parametr albuminu a kyseliny moové. Návod: Stanovte nulové a alternativní hypotézy. Provete t-testy, v prvním pípad porovnejte hodnoty sloupc G a H, ve druhém úkolu porovnejte hodnoty obsažené ve sloupcích I a J. Na základ dosažených hladin statistické významnosti (p-hodnoty) rozhodnte o platnosti nulových hypotéz. 12

III. CVIENÍ ZE STATISTIKY

III. CVIENÍ ZE STATISTIKY III. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data pomocí chí-kvadrát testu, korelaní a regresní analýzy. K tomuto budeme používat program Excel 2007 MS Office,

Více

Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat.

Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat. Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat. Po pihlášení se do sít (viz login name + password v okn Login) budete mít pistupný síový disk F:\, na kterém jsou uložena data

Více

Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu

Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu Po pihlášení se do sít (viz login name + password v okn Login) budete mít pístupný síový disk F:\, na kterém jsou

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky Analýza dojíždní z dotazníkového šetení v MSK Semestrální projekt 18.1.2007 GN 262 Barbora Hejlková 1 OBSAH OBSAH...2 ZADÁNÍ...3

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Z pastí na daném území byla odhadnuta abundance několika druhů: myšice lesní 250, myšice křovinná 200, hraboš polní 150,

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Informatika B Píklad 05 MS Excel

Informatika B Píklad 05 MS Excel Informatika B Píklad 05 MS Excel TÉMA: Vytváení vzorc, pojmenování oblastí Sekretáka spolenosti Naše zahrada, a.s. dostala za úkol provést urité výpoty v sešit se seznamy zboží. Práci si usnadnila pojmenováním

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

DUM. Databáze - úvod

DUM. Databáze - úvod DUM Název projektu íslo projektu íslo a název šablony klíové aktivity Tematická oblast - téma Oznaení materiálu (pílohy) Inovace ŠVP na OA a JŠ Tebí CZ.1.07/1.5.00/34.0143 III/2 Inovace a zkvalitnní výuky

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Zbytky zákaznického materiálu

Zbytky zákaznického materiálu Autoi: V Plzni 31.08.2010 Obsah ZBYTKOVÝ MATERIÁL... 3 1.1 Materiálová žádanka na peskladnní zbytk... 3 1.2 Skenování zbytk... 7 1.3 Vývozy zbytk ze skladu/makulatura... 7 2 1 Zbytkový materiál V souvislosti

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

2. M ení t ecích ztrát na vodní trati

2. M ení t ecích ztrát na vodní trati 2. M ení t ecích ztrát na vodní trati 2. M ení t ecích ztrát na vodní trati 2.1. Úvod P i proud ní skute ných tekutin vznikají následkem viskozity t ecí odpory, tj. síly, které p sobí proti pohybu ástic

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II. Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová

Více

R O V N O B Ž N Í K (2 HODINY)

R O V N O B Ž N Í K (2 HODINY) R O V N O B Ž N Í K (2 HODINY)? Co to vlastn rovnobžník je? Na obrázku je dopravní znaka, která íká, že vzdálenost k železninímu pejezdu je 1 m (dva pruhy, jeden pruh pedstavuje vzdálenost 80 m): Pozorn

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Statistická analýza volebních výsledk

Statistická analýza volebních výsledk Statistická analýza volebních výsledk Volby do PSP R 2006 Josef Myslín 1 Obsah 1 Obsah...2 2 Úvod...3 1 Zdrojová data...4 1.1 Procentuální podpora jednotlivých parlamentních stran...4 1.2 Údaje o nezamstnanosti...4

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Tabulkový procesor Excel

Tabulkový procesor Excel Tabulkový procesor Excel Excel 1 SIPVZ-modul-P0 OBSAH OBSAH...2 ZÁKLADNÍ POJMY...4 K EMU JE EXCEL... 4 UKÁZKA TABULKOVÉHO DOKUMENTU... 5 PRACOVNÍ PLOCHA... 6 OPERACE SE SOUBOREM...7 OTEVENÍ EXISTUJÍCÍHO

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Správa obsahu ízené dokumentace v aplikaci SPM Vema

Správa obsahu ízené dokumentace v aplikaci SPM Vema Správa obsahu ízené dokumentace v aplikaci SPM Vema Jaroslav Šmarda, smarda@vema.cz Vema, a. s., www.vema.cz Abstrakt Spolenost Vema patí mezi pední dodavatele informaních systém v eské a Slovenské republice.

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B.

Jednotlivé mezivýsledky, získané v prbhu analýzy rozptylu, jsou prbžn a systematicky zaznamenávány v tabulce ANOVA. Prmrný tverec. volnosti SS B. Ing. Martna Ltschmannová Statsta I., cvení ANOVA Rozšíením dvouvýbrových test pro stední hodnoty je analýza rozptylu nebol ANOVA, terá umožuje srovnávat nol stedních hodnot nezávslých náhodných výbr. Analýza

Více

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz 6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení

Více

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

Téma 9: Vícenásobná regrese

Téma 9: Vícenásobná regrese Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.

Více

( ) ( ) 2 2 B A B A ( ) ( ) ( ) B A B A B A

( ) ( ) 2 2 B A B A ( ) ( ) ( ) B A B A B A Vzdálenost dvou bod, sted úseky Ž Vzdálenost dvou bod Pi vyšetování vzájemné polohy bod, pímek a rovin lze použít libovolnou vhodn zvolenou soustavu souadnic (afinní). však pi vyšetování metrických vlastností

Více

STUDIJNÍ OPORY S PŘEVAŽUJÍCÍMI DISTANČNÍMI PRVKY PRO VÝUKU STATISTIKY PRVNÍ ZKUŠENOSTI. Pavel Praks, Zdeněk Boháč

STUDIJNÍ OPORY S PŘEVAŽUJÍCÍMI DISTANČNÍMI PRVKY PRO VÝUKU STATISTIKY PRVNÍ ZKUŠENOSTI. Pavel Praks, Zdeněk Boháč STUDIJNÍ OPORY S PŘEVAŽUJÍCÍMI DISTANČNÍMI PRVKY PRO VÝUKU STATISTIKY PRVNÍ ZKUŠENOSTI Pavel Praks, Zdeněk Boháč Katedra matematiky a deskriptivní geometrie, VŠB - Technická univerzita Ostrava 17. listopadu

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Cykly Intermezzo. FOR cyklus

Cykly Intermezzo. FOR cyklus Cykly Intermezzo Rozhodl jsem se zaadit do série nkolika lánk o základech programování v Delphi/Pascalu malou vsuvku, která nám pomže pochopit principy a zásady pi používání tzv. cykl. Mnoho ástí i jednoduchých

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x)

Pravdpodobnost výskytu náhodné veliiny na njakém intervalu urujeme na základ tchto vztah: f(x) NÁHODNÁ VELIINA Náhodná veliina je veliina, jejíž hodnota je jednoznan urena výsledkem náhodného pokusu (je-li tento výsledek dán reálným íslem). Jde o reálnou funkci definovanou na základním prostoru

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více