IV. CVIENÍ ZE STATISTIKY

Rozměr: px
Začít zobrazení ze stránky:

Download "IV. CVIENÍ ZE STATISTIKY"

Transkript

1 IV. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data kvantitativní povahy. K tomuto budeme opt používat program Excel 2007 MS Office. 1. Jak mžeme analyzovat kvantitativní data? Krátce si pipomeme základní fakta ze statistické teorie testování hypotéz. a) Hodnocení rozdíl dvou výbrových prmr nezávislých soubor dvouvýbrový t-test. Teoretický úvod: Pedpokládejme, že máme dva nezávislé soubory reprezentující dv populace. Pedpokládejme, že sledovaná numerická veliina je v obou populacích normáln rozložená s neznámými populaními prmry µ 1 a µ 2. Nulová hypotéza pedpokládá nulový rozdíl mezi populaními prmry, tedy že µ 1 = µ 2. K tomu, abychom mohli prmry dvou populací porovnat, je teba spoítat testovou statistiku t. Výpoet je založen na rozdílu mezi prmry obou výbr, variabilit sledované veliiny a velikosti obou výbr. Pesný vzorec naleznete ve výukových textech. Tato testová statistika je rozložena podle Studentova t-rozdlení s n 1 + n 2-2 stupni volnosti. Stupn volnosti jsou parametrem t-rozdlení. Pomocí statistického modulu programu Excel najdeme pesnou p-hodnotu. Tato pravdpodobnost odpovídá pravdpodobnosti výskytu takovéto nebo ješt extrémnjší hodnoty testového kritéria t za pedpokladu platnosti nulové hypotézy. Pokud je menší než 0,05, nulovou hypotézu zamítáme. Znamená to, že pravdpodobnost, že by pozorované rozdíly vznikly pouze náhodou, je menší než 5 %. Klasický dvouvýbrový t-test, krom normálního rozložení sledované veliiny, pedpokládá také, že rozptyly jsou v obou populacích shodné. Tento pedpoklad se testuje na základ výbrových odhad smrodatných odchylek s 1 a s 2 F-testem. V pípad nestejných smrodatných odchylek se použije modifikovaný výpoet testové statistiky t a také poet stup volnosti je výsledkem pomrn složitého výpotu. Data, se kterými budete pracovat, naleznete v souboru F:\SOFTWARE\biostatistika\data\analýza dat.xlsx 1

2 Na listu dvouvýbrový t-test jsou data 237 zamstnanc nemocnice. Ve sloupci A Zamstnanec. je uvedena identifikace. Druhý sloupec (B) Vk udává vk zamstnance v letech. Tetí sloupec (C) Cholesterol obsahuje informaci o hodnot celkového cholesterolu meného v mmol/l, ve sloupci D je zadána hodnota body mass indexu BMI každého zamstnance a znak Kouení rozlišuje kuáky (kódováno 1) a nekuáky (kódováno 2). Zadání úkolu Vaším úkolem bude provit, jestli zamstnanci, kteí kouí, jsou stejn staí jako zamstnanci, kteí nekouí i zda se tyto skupiny vkov odlišují. Dále je teba zjistit, jestli má kouení vliv na hodnoty celkového cholesterolu a BMI. Stanovíme nulové a alternativní hypotézy: 1. Nulová hypotéza: Kuáci a nekuáci se neliší ve vku. Alternativní hypotéza: Kuáci a nekuáci se liší ve vku. 2. Nulová hypotéza: Kuáci a nekuáci se neliší v celkovém cholesterolu. Alternativní hypotéza: Kuáci a nekuáci se liší v celkovém cholesterolu. Postup ovení první hypotézy: 1. Pomocí F-testu ovíme zda, rozptyl veliiny Vk je stejný v populaci kuák a v populaci nekuák. Tento nástroj je obsažen v položce Analýza dat. (Analýzu dat nastavte stejným zpsobem jako pi použití nástroje Popisná statistika kliknte na ikonu, otevete Možnosti aplikace Excel, vyberte položku Doplky, nastavte Analytické nástroje jako 2

3 Aktivní doplnk k dispozici a kliknte na tlaítko Pejít, zaškrtnte Analytické nástroje a potvrte OK. 2. Z hlavního menu vyberte položku Data a kliknte na položku Analýza dat. 3. Ze seznamu analytických nástroj vyberte Dvouvýbrový F-test pro rozptyl. Vyplte dialogové okno Dvouvýbrový F-test pro rozptyl. Do pole 1. soubor zadejte adresu bunk, které obsahují vk kuák buky B2:B97. Do pole 2. soubor zadejte adresu bunk, které obsahují vk nekuák buky B98:B238. Hladinu alfa ponechte nastavenou na standardní hodnotu 0,05 a do pole Výstupní oblast zadejte adresu buky K1. Potvrte tlaítkem OK. Dostanete výstupní tabulku: 3

4 Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr veliiny Vk pro 1. i 2. soubor. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik pacient bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. Název rozdíl je pekladatelskou chybou. Dále je uvedena hodnota testového kriteria F, dosažená hladina statistické významnosti P a kritická hodnota F krit. Pokud je p-hodnota vtší nebo rovna 0,05, znamená to, že rozptyly v obou populacích jsou shodné. Pokud je p-hodnota menší než 0,05, rozptyly ve sledovaných populacích nejsou shodné. V tomto pípad p = 0,205, což je vtší než 0,05, rozptyly jsou tedy shodné. Provedení t-testu. 4. Kliknte na Analýza dat a z nabídky analytických nástroj vyberte Dvouvýbrový t-test s rovností rozptyl. 5. Vyplte dialogové okno Dvouvýbrový t-test s rovností rozptyl obdobným zpsobem jako v pípad F-testu. Soubory jsou totožné, hypotetický rozdíl stedních hodnot je roven 0, hodnotu hladiny alfa nechejte na hodnot 0, Do pole Výstupní oblast zadejte adresu buky K12. Kliknte na OK 4

5 Tabulka s výsledky t-testu Soubor 1 pedstavuje opt kuáky, Soubor 2 zamstnance nekuáky. St. hodnota je aritmetický prmr veliiny Vk u kuák a nekuák. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. V následujícím ádku je spoítán Spolený rozptyl pro 1. a 2. soubor. Hyp. rozdíl stedních hodnot je nulový, což je v souladu s naší nulovou hypotézou. Položka Rozdíl nám udává poet stup volnosti. K výpotu bylo použito vzorce n 1 + n 2-2 = = 235. Dále je uvedena hodnota testového kriteria t Stat, dosažená hladina statistické významnosti P (1) pro jednostranný test (1) a kritická hodnota t krit pro jednostranný test. Vzhledem k oboustranné formulaci alternativní hypotézy nás zajímá hladina dosažené statistické významnosti pro oboustranný test P (2) = 0,026. Je zejmé, že dosažená hodnota signifikance je podstatn menší než stanovená hladina 0,05, je tedy oprávnné zamítnout nulovou hypotézu. Závr testování: Zamítáme nulovou hypotézu: Kuáci a nekuáci se neliší ve vku. Dvouvýbrovým t-testem bylo prokázáno, že kuáci jsou statisticky významn mladší než nekuáci. Prmrný vk kuák je 34,8 rok, nekuák 38,2 rok. Postup ovení druhé hypotézy: Nulová hypotéza: Kuáci a nekuáci se neliší v celkovém cholesterolu. Alternativní hypotéza: Kuáci a nekuáci se liší v celkovém cholesterolu. Postup bude obdobný jako v prvním píkladu: 1. Pomocí F-testu opt ovte zda, rozptyl veliiny celkový cholesterol je stejný v populaci kuák a v populaci nekuák. 2. Vyberte položku Data v hlavním menu a kliknte na Analýza dat. Vyplte dialogové okno Dvouvýbrový F-test pro rozptyl: 5

6 Potvrte tlaítkem OK. Tabulka s výsledky F-testu:. Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr celkového cholesterolu pro 1. i 2. soubor. Rozptyl nám udává hodnotu rozptylu v obou souborech. V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. Dále je uvedena hodnota testového kriteria F, dosažená hladina statistické významnosti P a kritická hodnota F krit. Dosažená hladina statistické významnosti pro F-test nabyla hodnoty 0,011, je tedy menší než 0,05, rozptyly v obou populacích tedy nejsou shodné. Vidíme, že veliina celkový cholesterol je ve skupin kuák variabilnjší (má vtší rozptyl) než ve skupin nekuák. Provete dvouvýbrový t-test. 3. Zvolte Analýza dat a z nabídky analytických nástroj vyberte Dvouvýbrový t-test s nerovností rozptyl. 6

7 4. Vyplte dialogové okno Dvouvýbrový t-test s nerovností rozptyl obdobným zpsobem jako v pípad F-testu. Soubory jsou totožné, hypotetický rozdíl stedních hodnot je roven 0, hodnotu hladiny alfa nechejte na hodnot 0, Kliknte na OK. Tabulka s výsledky t-testu Soubor 1 pedstavuje kuáky, Soubor 2 nekuáky. St. hodnota je aritmetický prmr celkového cholesterolu kuák a nekuák. Všimnte si tchto hodnot, které se píliš neliší (5,096 mmol/l u kuák a 5,0132 u nekuák). Položka Rozptyl nám udává hodnotu rozptyl sledované veliiny v obou souborech. 7

8 V ádku Pozorování je uvedeno, kolik osob bylo zaazeno do jednotlivých soubor. Položka Rozdíl nám udává poet stup volnosti. K výpotu potu stup volnosti bylo použito složitjšího vzorce než v pedchozím píkladu, kde byl splnn pedpoklad rovnosti rozptyl. Dále je uvedena hodnota testového kriteria t Stat, dosažená hladina statistické významnosti P (1) pro jednostranný test a kritická hodnota t krit pro jednostranný test (1). Vzhledem k oboustranné formulaci alternativní hypotézy nás zajímá hladina dosažené statistické významnosti pro oboustranný test P (2) = 0,590. Je zejmé, že dosažená hodnota signifikance je vtší než stanovená hladina 0,05, a tudíž není možné zamítnout nulovou hypotézu. 1) Závr testování: Pijímáme nulovou hypotézu: Kuáci a nekuáci se neliší v celkovém cholesterolu. Úkol k samostatnému ešení: Zjistte, zda kouení ovlivuje tlesnou hmotnost zamstnanc nemocnice. Tlesná hmotnost je vyjádena indexem BMI. Návod: Stanovte nulovou a alternativní hypotézu. Ovte, zda rozptyly veliiny BMI jsou shodné v obou zkoumaných populacích (u kuák a nekuák). Zvolte vhodný typ dvouvýbrového t-testu. Provete t-test a na základ dosažené hladiny statistické významnosti (p-hodnoty) rozhodnte o platnosti dané nulové hypotézy. b) Hodnocení rozdíl dvou výbrových prmr párových dat párový t-test. Teoretický úvod: Nyní uvažujme situaci, kdy na skupin vybraných jedinc provedeme urité mení a potom znovu za jiných okolností nebo po provedení uritého zásahu (léby apod.) provedeme totéž mení na týchž jedincích ješt jednou. Pjde o to zjistit, zda ml zásah vliv na prmrnou hodnotu sledované veliiny, jinými slovy, zda se prmr ped zásahem µ 1 rovná prmru po zásahu µ 2. Nulová hypotéza opt pedpokládá, že se tyto prmry neliší. Ze sledované populace poídíme náhodný výbr o rozsahu n jedinc. Provedeme dvakrát mení dané numerické veliiny jednou ped zásahem, podruhé po zásahu a spoteme rozdíl tchto hodnot pro každého jedince. Získáme tak n dvojic mení a n rozdíl. Spoteme prmr tchto rozdíl (diferencí) a oznaíme d. Pokud platí nulová hypotéza a zásah neml na menou veliinu žádný vliv, bude d velice blízký nule. Bude-li naopak d od nuly daleko, bude to svdit o tom, že zásah uritým zpsobem ovlivnil sledovanou numerickou veliinu. K tomu abychom mohli vyjádit, jak daleko je d od nuly, spoítáme hodnotu testové statistiky t. Výpoet statistiky t vychází z prmrné diference d, rozptylu diferencí a rozsahu náhodného výbru. Pesný vzorec naleznete ve výukových textech. Tato testová statistika je rozložena podle Studentova t-rozdlení s n - 1 stupni volnosti. Pomocí statistického modulu programu Excel najdeme pesnou p hodnotu. Tato pravdpodobnost odpovídá pravdpodobnosti výskytu takovéto nebo ješt extrémnjší hodnoty testového kritéria za pedpokladu, že platí 8

9 nulová hypotéza. Pokud je dosažená hladina statistické významnosti p menší než 0,05, nulovou hypotézu zamítáme. Znamená to, že pravdpodobnost, že by pozorované rozdíly vznikly pouze náhodou, je menší než 5 %. Data, se kterými budete pracovat, naleznete v souboru F:\SOFTWARE\biostatistika\data\analýza dat.xlsx na listu párový t-test Na listu párový t-test jsou zaznamenána data pacient, kterým byla transplantována ledvina. Ve sloupci (A) Pacient. je uvedena identifikace. Ve sloupci (B) je zaznamenán Vk pacienta v letech, ve sloupci (C) jeho Pohlaví a ve sloupci (D) je uvedeno Imunosupresivum, které pacienti po transplantaci užívali. Ve sloupcích (E) a (F) najdete hodnoty Kreatininu namené ped transplantací a 6 msíc po transplantaci v µmol/l. Ve sloupcích (G) a (H) jsou hodnoty Albuminu namené ped transplantací a 6 msíc po transplantaci v g/l. Ve sloupcích (I) a (J) najdete hodnoty Kyseliny moové namené ped transplantací a 6 msíc po transplantaci v µmol/l. Je zejmé, že všechny veliiny ve sloupcích (E) až (J) jsou kvantitativního typu a byly získány opakovaným mením. Jedná se tedy o párová data páry jsou vyznaeny barevným oznaením sloupc stejnou barvou. Zadání úkolu Vaším úkolem bude posoudit, zda vlivem transplantace došlo ke zmnám biochemických parametr kreatininu, albuminu a kyseliny moové. Stanovíme nulovou a alternativní hypotézu: Nulová hypotéza: Hladina kreatininu 6 msíc po transplantaci ledviny se neliší od hladiny ped transplantací. Alternativní hypotéza: Hladina kreatininu 6 msíc po transplantaci ledviny se liší od hladiny ped transplantací. 9

10 Postup ovení hypotézy: 1. Kliknte na položku Analýza dat v hlavním menu a z nabídky analytických nástroj vyberte Dvouvýbrový párový t-test na stední hodnotu. Slovo dvouvýbrový zde nemá opodstatnní, pracujeme pouze s jedním výbrem, jedná se opt o pekladatelskou chybu. Výbr potvrte tlaítkem OK. Dostanete dialogové okno: 2. Do pole 1. soubor zadejte adresu oblasti bunk s hodnotami ze sloupce E Kreatinin ped transplantací. 3. Do pole 2. soubor zadejte adresu oblasti bunk s hodnotami ze sloupce F Kreatinin 6 msíc po transplantaci. 4. Do pole Hypotetický rozdíl stedních hodnot napište íslo nula (nulová hypotéza pedpokládá, že rozdíl stedních hodnot (prmr) je roven nule). 5. Zatrhnte políko Popisky, protože jste v polích 1. a 2. soubor zadali data i s bukami v prvním ádku, kde jsou popisky. Do pole Výstupní oblast zadejte adresu L1. 6. Kliknte na OK.. 10

11 Dostanete následující tabulku: V prvním ádku je uveden aritmetický prmr hladiny kreatininu zjištný ped transplantací (1. sloupec) a po transplantaci (2. sloupec). Všimnte si znaného rozdílu mezi obma hodnotami. V druhém ádku jsou uvedeny rozptyly veliiny, tetí ádek Pozorování nás informuje o potu jedinc, kteí byli zaazeni do sledování. Na dalším ádku je vypoítán Pearsonv korelaní koeficient, jehož hodnota vypovídá o tém nulové korelaci mezi hodnotami zjištnými ped transplantací a po transplantaci. Hyp. rozdíl st. hodnot je roven 0, tak jak to pedpokládá stanovená nulová hypotéza. Položka Rozdíl udává poet stup volnosti vypoítaný podle vzorce n 1 = 50 1 = 49. Dále je uvedena hodnota testové statistiky t Stat, dosažená hladina statistické významnosti P pro jednostranný test (1), kritická hodnota pro jednostranný test. Pro posouzení platnosti nulové hypotézy je nejdležitjší hodnota dosažené statistické významnosti pro oboustranný test P(2), která je v našem pípad rovna 2,968* Je zejmé, že dosažená hodnota signifikance je podstatn menší než stanovená hladina 0,05, jsme tedy oprávnni zamítnout nulovou hypotézu. 7. Uiníme závr testování: Zamítáme nulovou hypotézu: Hladina kreatininu 6 msíc po transplantaci ledviny se neliší od hladiny ped transplantací. a pijímáme alternativní hypotézu: Hladina kreatininu 6 msíc po transplantaci ledviny se liší od hladiny ped transplantací. Prmrná hladina kreatininu se vlivem transplantace ledviny statisticky významn snížila, z prmrné hodnoty 642,14 µmol/l na prmrnou hodnotu 124,64 µmol/l. Pro porovnání uvádíme tabulku s referenními mezemi kreatininu: 11

12 Úkol k samostatnému ešení: Posute, zda vlivem transplantace došlo ke zmnám dalších biochemických parametr albuminu a kyseliny moové. Návod: Stanovte nulové a alternativní hypotézy. Provete t-testy, v prvním pípad porovnejte hodnoty sloupc G a H, ve druhém úkolu porovnejte hodnoty obsažené ve sloupcích I a J. Na základ dosažených hladin statistické významnosti (p-hodnoty) rozhodnte o platnosti nulových hypotéz. 12

III. CVIENÍ ZE STATISTIKY

III. CVIENÍ ZE STATISTIKY III. CVIENÍ ZE STATISTIKY Vážení studenti, úkolem dnešního cviení je nauit se analyzovat data pomocí chí-kvadrát testu, korelaní a regresní analýzy. K tomuto budeme používat program Excel 2007 MS Office,

Více

Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat.

Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat. Statistický popis dat. Tvorba kontingenních tabulek. Grafická prezentace dat. Po pihlášení se do sít (viz login name + password v okn Login) budete mít pistupný síový disk F:\, na kterém jsou uložena data

Více

Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu

Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu Zásady tvorby databáze, seznamy, organizace dat, tídní, funkce, výpoty a souhrny v Excelu Po pihlášení se do sít (viz login name + password v okn Login) budete mít pístupný síový disk F:\, na kterém jsou

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) 5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt

Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky. Analýza dojíždní z dotazníkového šetení v MSK. Semestrální projekt Vysoká škola báská Technická univerzita Ostrava Institut geoinformatiky Analýza dojíždní z dotazníkového šetení v MSK Semestrální projekt 18.1.2007 GN 262 Barbora Hejlková 1 OBSAH OBSAH...2 ZADÁNÍ...3

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy. Z pastí na daném území byla odhadnuta abundance několika druhů: myšice lesní 250, myšice křovinná 200, hraboš polní 150,

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Zbytky zákaznického materiálu

Zbytky zákaznického materiálu Autoi: V Plzni 31.08.2010 Obsah ZBYTKOVÝ MATERIÁL... 3 1.1 Materiálová žádanka na peskladnní zbytk... 3 1.2 Skenování zbytk... 7 1.3 Vývozy zbytk ze skladu/makulatura... 7 2 1 Zbytkový materiál V souvislosti

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Informatika B Píklad 05 MS Excel

Informatika B Píklad 05 MS Excel Informatika B Píklad 05 MS Excel TÉMA: Vytváení vzorc, pojmenování oblastí Sekretáka spolenosti Naše zahrada, a.s. dostala za úkol provést urité výpoty v sešit se seznamy zboží. Práci si usnadnila pojmenováním

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

DUM. Databáze - úvod

DUM. Databáze - úvod DUM Název projektu íslo projektu íslo a název šablony klíové aktivity Tematická oblast - téma Oznaení materiálu (pílohy) Inovace ŠVP na OA a JŠ Tebí CZ.1.07/1.5.00/34.0143 III/2 Inovace a zkvalitnní výuky

Více

Neparametrické metody

Neparametrické metody Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Statistické ízení finanních tok

Statistické ízení finanních tok Statistické ízení finanních tok OBUST 3.. - 7..006 Fakulta strojní VUT v Praze, Ústav technické matematiky Eliška Cézová eliska_c@email.cz Úvod Statistické ízení finanních tok znamená ízení penžních prostedk

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz. Obecný postup poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Statistická analýza volebních výsledk

Statistická analýza volebních výsledk Statistická analýza volebních výsledk Volby do PSP R 2006 Josef Myslín 1 Obsah 1 Obsah...2 2 Úvod...3 1 Zdrojová data...4 1.1 Procentuální podpora jednotlivých parlamentních stran...4 1.2 Údaje o nezamstnanosti...4

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

2. M ení t ecích ztrát na vodní trati

2. M ení t ecích ztrát na vodní trati 2. M ení t ecích ztrát na vodní trati 2. M ení t ecích ztrát na vodní trati 2.1. Úvod P i proud ní skute ných tekutin vznikají následkem viskozity t ecí odpory, tj. síly, které p sobí proti pohybu ástic

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II. Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

R O V N O B Ž N Í K (2 HODINY)

R O V N O B Ž N Í K (2 HODINY) R O V N O B Ž N Í K (2 HODINY)? Co to vlastn rovnobžník je? Na obrázku je dopravní znaka, která íká, že vzdálenost k železninímu pejezdu je 1 m (dva pruhy, jeden pruh pedstavuje vzdálenost 80 m): Pozorn

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více