2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran
|
|
- Adéla Brožová
- před 7 lety
- Počet zobrazení:
Transkript
1 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz je statstcká metoda, která umožňuje, se zvolenou tolerancí, zamítnout předpoklad určtého jevu. Např. Zda zmetkovtost tří různých výrobních lnek je stejná, zda platí předpoklad, že určtý lék je účnnější než jný; nebo například, zda platí, že úroveň matematckých dovedností studentů OPF SU je nezávslá typu střední školy, nebo zda rozhodnutí spotřebtele o nákupu určtého výrobku závsí na jeho vzdělání atp. Populační soubory mohou obsahovat neomezeně velký počet hodnot, mohou tedy být potencálně nekonečné (spočetné nespočetné). Například počet zákazníků daného supermarketu není omezený (an přesně známý), počet hodnot hmotnost plodů zjštěných například vážením závsí na počtu opakování měření a je také teoretcky neomezený, atp. Proto byl pojem statstcký soubor rozšířen o případy s nekonečným počtem prvků a byl zaveden pojem náhodné velčny, který zahrnuje jak klascké soubory s konečným počtem prvků (hodnot), tak soubory s nekonečným počtem prvků. Náhodná velčna obsahuje dále nformac o pravděpodobnost, se kterou se daná hodnota v souboru vyskytuje tzv. rozdělení pravděpodobnost. U klasckého souboru s konečným počtem hodnot tato pravděpodobnost odpovídá relatvní četnost výskytu dané hodnoty v souboru. I když náhodná velčna nabývá potencálně nekonečně mnoha hodnot (např. výsledků měření rozměru jsté součástky), má smysl se ptát, jaká je průměrná hodnota (případně rozptyl ) takové velčny. Tato otázka vedla k zavedení pojmů střední hodnota a rozšíření významu pojmu populační rozptyl. Tyto pojmy přrozeným způsobem rozšřují jž známé pojmy artmetcký průměr a rozptyl a nazývají se souhrnně parametry. Více o tom čtenář nalezne např. v [KvMeB]. Statstcká hypotéza je tvrzení o hodnotách parametrů náhodných velčn (nejčastěj je tímto parametrem střední hodnota) nebo o tvaru pravděpodobnostních rozdělení náhodných velčn. Testování statstckých hypotéz je založeno na ověřování, zda statstcká hypotéza platí s jstou poměrně vysokou pravděpodobností p=1-, přtom je malé číslo (obvykle 0,05 nebo menší), které se nazývá hladna významnost. Statstcké hypotézy rozdělujeme na parametrcké hypotézy a neparametrcké hypotézy. Parametrcké hypotézy se týkají jednoho nebo několka parametrů daného rozdělení náhodné velčny. Neparametrcké hypotézy se netýkají parametrů rozdělení náhodné velčny, nýbrž jných statstckých vlastností daných rozdělení. Předpoklad, který se ověřuje (testuje), se nazývá nulová hypotéza a značí se H 0. V případě že by nulová hypotéza neplatla, bude platt alternatvní hypotéza H 1. Alternatvní hypotéza může mít více podob. Pro parametrcké testy, tedy obecně nulovou hypotézu H 0 : θ=θ 0 (čt: hodnota parametru theta je rovna konkrétní hodnotě thetanula ) může mít alternatvní hypotéza tvar: 1. H 1 : θ=θ 1 ( hodnota parametru theta je rovna konkrétní hodnotě theta- jedna ). H 1 : θ θ 0 tzv. oboustranná hypotéza 3. H 1 : θ>θ 0 tzv. jednostranná hypotéza 4. H 1 : θ<θ 0 tzv. jednostranná hypotéza Testováním statstcké hypotézy buď zamítáme nebo nezamítáme (tj. přjímáme). Př rozhodování o platnost H0 č H1 je možné se dopustt dvou chyb: chyba prvního druhu: zamítneme H 0, když je správná (tj. platí ) chyba druhého druhu: nezamítneme H 0, když není správná - 1 -
2 Testování hypotéz U testování stanovíme malou pravděpodobnost α, která se nazývá hladna významnost a určuje maxmální možnou velkost chyby prvního druhu, kterou jsme u testu ochotn akceptovat. Testy jsou konstruovány tak, aby pro danou hladnu významnost byla chyba druhého druhu co nejmenší. Jako α se obvykle volí hodnota 0,05 nebo 0,01. Pravděpodobnost chyby druhého druhu se nazývá síla testu, značí se β. U každého statstckého testu musíte dodržet postup testování, který se skládá ze čtyř částí: 1. Formulace nulové a alternatvní hypotézy.. Výpočet testového krtéra. 3. Nalezení oboru přjetí a krtckého oboru. 4. Určení výsledku, tedy rozhodnutí přjmout nebo zamítnout nulovou hypotézu. Rozhodujete na základě porovnání testového krtéra s oborem přjetí a krtckým oborem. V případě, že testové krtérum spadá do oboru přjetí, přjímáte nulovou hypotézu. Pokud leží v krtckém oboru, zamítáte nulovou hypotézu, přjímáte alternatvní hypotézu. Použtím statstckých programů se body., 3., a 4. testování u mnoha testů zjednodušly na body: Část a 3: Nalezení pravděpodobnost rozdělení odpovídajícího testovému krtéru. Část 4: Určení výsledku porovnání vypočítané p-hodnoty s hladnou významnost α. V dalším textu jsou uvedeny některé parametrcké a neparametrcké testy. Pro každý test naleznete obecný postup a funkc programu Excel, které vám testování zjednoduší..1 PŘÍKLADY PARAMETRICKÝCH TESTŮ.1.1 TEST STŘEDNÍ HODNOTY, KDYŽ JE ZNÁMÉ Test pro střední hodnotu, když je známe lze provádět v případě, že se testují hodnoty velkého vzorku (n > 30), nebo menší vzorek pochází z výběru z normálního rozdělní. V případě, že se jedná o velký vzorek, je možné nahradt v následujícím vztahu populační směrodatnou odchylku výběrovou směrodatnou odchylkou s : Postup testování: 1. Stanovení hypotézy: H 0 :μ=μ 0 H 1 :μ μ 0 x 0. n. Testové krtérum: T 3. Obor přjetí: 0, u (1 ), krtcký obor: ( u (1 ), ), u je kvantl N(0,1). 4. Výsledek ŘEŠENÝ PŘÍKLAD.1 Automat na plnění ltrových lahví je podle výrobce seřízen tak, že střední hodnota objemu naplněných lahví je 1000 ml se směrodatnou odchylkou 5 ml. Kontrola jakost 9 naplněných lahví ukázala, že průměrný objem náplně byl 998 ml. Naměřené hodnoty jsou v tabulce. Je automat správně seřízen? Testujte na hladně významnost 0,05, předpokládejte normální rozdělení základního souboru
3 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Řešení: Postup testování: 1. H 0 :μ=1000 H 1 :μ 1000 x 0. n Testové krtérum: T 1, 5 3. Krtckou hodnotu u(1-α/) vypočítáme pomocí funkce =NORMSINV(0,975), tedy u(0,975)=1,96. Potom obor přjetí je nterval: 0 ;1, 96, krtcký obor: ( 1,96 ; ) 4. Výsledek: Testové krtérum spadá do oboru přjetí a proto na hladně významnost 0,05 přjímáme nulovou hypotézu a automat je seřízený správně. Pro určení výsledku lze použít funkc =ZTEST(pole;x;sgma), která vypočítá pravděpodobnost normálního rozdělení odpovídající testovému krtéru (tzv. p-hodnotu nebol sgnfkanc). Výsledek se pak stanoví porovnáním s hladnou významnost α. Argumenty funkce jsou: vstupující pole hodnot, hodnota μ 0 a populační směrodatná odchylka. V případě, že argument σ není zadaný, funkce použje výběrovou směrodatnou odchylku vstupního pole hodnot (Obr..1) Obrázek.1 P-hodnota (sgnfkance) je větší než hladna významnost α: p=0,885>0,05=α, tedy přjímáme nulovou hypotézu. Pomocí funkce =NORMSINV(prst) můžeme z čísla p zpětně dopočítat testové krtérum (Obr..) - 3 -
4 Testování hypotéz Obrázek..1. TEST STŘEDNÍ HODNOTY, KDYŽ NENÍ ZNÁMÉ Test střední hodnoty, když σ neznáme, můžete provádět v případě, že testujete hodnoty velkého vzorku (n>30), nebo menší vzorek pochází z výběru z normálního rozdělní. Postup testování: ŘEŠENÝ PŘÍKLAD. 1. Stanovení hypotézy: H 0 :μ=μ 0 H 1 :μ μ 0 x. n. Testové krtérum: T 0 s 3. Obor přjetí: 0, t 1( ), krtcký obor: ( t 1( ), ), kde t n1 ( ) n je krtcká hodnota Studentova t-rozdělení 4. Výsledek Automat na plnění ltrových lahví je podle výrobce seřízen tak, že střední hodnota objemu naplněných lahví je 1000 ml. Kontrola jakost 5 naplněných lahví ukázala, že průměrný objem náplně byl 998 ml se směrodatnou odchylkou 5 ml. Je automat seřízený správně? Testujte na hladně významnost 0,05, předpokládejte normální rozdělení základního souboru. Řešení: Postup testování: 1: H 0 :μ=1000 H 1 :μ 1000 n x 0. n : Testové krtérum: T s 5 3: Krtckou hodnotu t n-1 (α) pro 4 stupňů volnost vypočítáme pomocí funkce =TINV(0,05;4)=t 4 (0,05)=,06. Obor přjetí: 0,, 06, krtcký obor: (,06, ) 4: Výsledek: Na hladně významnost 0,05 nemůžeme zamítnout nulovou hypotézu a tedy automat je seřízený správně
5 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy.1.1 TEST PRO ROZPTYL NÁHODNÉ VELIČINY Předpokládáme, že z normálně rozděleného základního souboru byl proveden náhodný výběr o rozsahu n. Postup testování: 1. Stanovení hypotézy: H 0 :σ =σ 0 H 1 :σ σ 0 ( n 1). s. Testové krtérum: T 3. Obor přjetí: (1 ), ( ), krtcký obor: ( n 1) ( n1) 0 0, (1 ) ( ),, kde ( ) ( n 1) ( n1) ( n jsou krtcké hodnoty 1) rozdělení. 4. Výsledek ŘEŠENÝ PŘÍKLAD.3 Automat na plnění ltrových lahví je podle výrobce seřízen tak, že rozptyl objemu náplně je 5 ml. Kontrola jakost 5 naplněných lahví ukázala, že výběrový rozptyl vzorku je 8 ml. Je automat seřízený správně? Testujte na hladně významnost 0,05, předpokládejte normální rozdělení základního souboru. Řešení: Postup testování: 1: H 0 :σ =5 H 1 :σ 5 (5 1).8 : Testové krtérum: T 6, : Krtcké hodnoty vypočítáte pomocí funkce CHIINV: (0,975) =CHIINV(0,975; 4)=1,40 a 4(0,05) =CHIINV(0,05;5)=39,36. Potom obor přjetí je 1,40, 39,36, a krtcký obor 0, 1,40 39,36, 4: Výsledek: Hodnota testového krtéra padne do oboru přjetí, proto přjímáme nulovou hypotézu na hladně významnost 0,05 a tedy automat je seřízený správně (s rzkem 5% chybného závěru). 4. NEPARAMETRICKÉ TESTY Tato část se zabývá dvěma neparametrckým testy založeným na tzv. chí-kvadrát rozdělení: testem dobré shody a testem nezávslost (v kontngenční tabulce). Pro oba testy se předpokládá znalost četností výskytu daného znaku ve vzorku, oba testy používají podobné testové krtérum. Prncpem neparametrckých testů dobré shody je porovnávání četností výskytů náhodného znaku n s teoretckým (deálním) hodnotam ψ. Tyto deální hodnoty se dají získat z předpokládané pravděpodobnost daného jevu p. Pro test nezávslost bude uveden postup, jak se test provádí pro jž sestavenou kontngenční tabulku a také postup, jak sestrojt kontngenční tabulku v případě, že data jsou zadaná v jné podobě
6 Testování hypotéz..1 TEST DOBRÉ SHODY Pro (Pearsonův) test dobré shody předpokládáme to, že výsledky lze uspořádat do J nepřekrývajících se tříd. Četnost výskytů v jednotlvých třídách značíme n1, n, nj, celkový rozsah náhodného výběru je n. Testovaná hypotéza spočívá v předpokladu určtého modelu pravděpodobnostního rozdělení, tedy předpokladu pravděpodobností pro každou třídu p1, p, p J, součet všech pravděpodobností musí být 1. Test dobré shody spočívá v porovnání naměřených (emprckých) četností s četnostm teoretckým. Teoretcké četnost 1,, J získáte jako součn odpovídající pravděpodobnost a rozsahu náhodného výběru: p. n Postup testování: 1: Stanovení hypotézy: H 0 : p 1 =π 1, p =π, p J =π J, (dobrá shoda) H 1 : ; (negace H 0 ) : Testové krtérum: G J ( 1 n ) 3: Obor přjetí: 0, J 1 ( ), krtcký obor: ( J 1( ), ) 4: Výsledek V Excelu lze krtckou hodnotu získat pomocí funkce =CHIINV(Pravděpodobnost;Volnost), například =CHIINV(0,05;)=5, Další funkce programu Excel, funkce =CHITEST(Aktuální;Očekávané) vám umožní spočítat pravděpodobnost odpovídající hodnotě testového krtéra pro χ rozdělení. Argumenty funkce CHITEST jsou naměřené, aktuální hodnoty n a pak teoretcké, očekávané hodnoty ψ. Testové krtérum získáte z pravděpodobnost p pomocí funkce =CHIINV(Pravděpodobnost;Volnost). p ŘEŠENÝ PŘÍKLAD.4 Před volbam do akademckého senátu byl odhad volebních preferencí pro kanddáta A 8 %, pro kanddáta B 3 % a pro kanddáta C 40 %. V prvním kole voleb získal kanddát A 51 hlasů, kanddát B 74 hlasů a kanddát C 75 hlasů. Na hladně významnost 0,05 zjstěte, zda byly odhady předvolebních preferencí konzstentní s výsledkem voleb. Řešení: V následující tabulce je přehled zadání a výpočet teoretckých hodnot. Celkový počet pozorování je n=00. Četnost výskytu Teoretcká pravděpodobnost Teoretcká četnost n p ψ = p.n 51 0, , ,
7 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Postup testování: 1. Stanovení hypotézy: H 0 :p 1 =0,8, p =0,3, p 3 =0,4, (dobrá shoda) H 1 : negace H 0.. Testové krtérum: J ( n ) (51 56) (74 64) (75 80) G , Obor přjetí: 0, 6, krtcký obor: ( 6, ) 4. Výsledek: Testové krtérum leží v oboru přjetí. Přjímáme nulovou hypotézu. Odhady předvolebních preferencí byly konzstentní s výsledkem voleb. Funkce =CHITEST(Aktuální,Očekávané) vám umožní spočítat pravděpodobnost odpovídající hodnotě testovacího krtéra pro χ rozdělení. V našem příkladě je pravděpodobnost p=0,3133 a je tedy větší, než zadaná hladna významnost α=0,05 a tedy přjímáme nulovou hypotézu o dobré shodě předpokladu s výsledkem (Obr..3). Testové krtérum získáte z pravděpodobnost p pomocí funkce =CHIINV(Pravděpodobnost;Volnost), které argumenty budou pravděpodobnost a počet stupňů volnost. Zkontrolujte s, že =CHIINV(0,3136;)=,3. Obrázek.3.. TEST NEZÁVISLOSTI KVALITATIVNÍCH ZNAKŮ Typckou úlohou, k jejímuž řešení se často používá test dobré shody, je ověření nezávslost dvou (nebo více) kvaltatvních znaků. Jejch hodnoty byly zjštěny u n náhodně vybraných prvků základního souboru, nebo, obecněj řečeno, jde o výsledky n nezávslých náhodných pokusů. Výsledky jsou pak pro přehlednost zpracování uspořádány v tzv. kontngenční tabulce. V jednom expermentu můžeme současně sledovat dvě nebo více odpovědí - hodnoty kvaltatvních znaků. Tak například př kontrole jakost výrobku můžeme sledovat přítomnost nebo nepřítomnost vady A (znak A), nebo přítomnost nebo nepřítomnost vady B (znak B)
8 Testování hypotéz Oba znaky A B nabývají pouze dvě alternatvní hodnoty - kategore: např. Ano, Ne (Přítomnost, Nepřítomnost, apod.). Př psychologcké zkoušce způsoblost osoby k výkonu určté čnnost může testovaná osoba dostat dva úkoly, jejchž výsledek může být hodnocen jako "vynkající", "průměrný" a "podprůměrný". Zde jde o sledování dvou kvaltatvních znaků se třem kategorem odpovědí. Představte s nyní n nezávslých opakování expermentu se dvěma kvaltatvním znaky A a B. Znak A má r možných kategorí hodnot, značených A 1, A,..., A r, znak B má s možných kategorí hodnot B 1, B,..., B s. Výsledek celého složeného expermentu lze shrnout do kontngenční tabulky: Kategore znaku A/B B 1 B B 3. B s Margnální součty A 1 n 1,1 n 1, n 1,3. n 1,s n 1,. A n,1 n, n,3. n,s n,. A 3 n 3,1 n 3, n 3,3. n 3,s n 3, A r n r,1 n r, n r,3. n r,s n r,. Margnální součty n.,1 n., n.,3 n.,s Celkový součet n Počet kategorí znaku A je r a toto číslo současně označuje počet řádků tabulky. Počet kategorí znaku B je s a označuje počet sloupců tabulky. Celkový počet pozorování je n. Test nezávslost má smysl provádět, když je každá z četností n,j je alespoň 5. Teoretcké četnost jsou hodnoty, které by byly v tabulce, kdyby oba znaky byly nezávslé a současně by margnální četnost zůstaly stejné jak u emprckých hodnot. Teoretcké hodnoty se vypočítají ze vztahu: n,. n, j, j n Výsledná tabulka teoretckých četností bude mít tvar: Kategore znaku A/B B 1. B s Margnální součty n n 1,. n, 1 1,. n 1,1, s 1, s A 1 n. n n 1,. n,. n, 1 n,1,. n, s, s A n. n n,..... n r,. n,1 n r,1 r,. n, s r, s n. n n r,. A r Margnální součty n.,1. n.,s Celkový součet n Po vytvoření tabulky teoretckých hodnot můžete přstoupt k testu, který je podobný jako v předchozím případě
9 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Postup testování: 1: Stanovení hypotézy: H 0 : p,j =p,..p.j =1, r; j=1, s, (nezávslost znaků) H 1 : negace H 0 J ( n : Stanovení hypotézy: Testové krtérum: G ) 3: Stanovení hypotézy: Obor přjetí: 0, ( r 1).( s1) ( ), krtcký obor: ( ( r 1).( s1) ( ), ) 4: Stanovení hypotézy: Výsledek zda hodnota testového krtéra leží v krtckém oboru: Nulovou hypotézu zamítáme/přjímáme, co to konkrétně znamená. 1 ŘEŠENÝ PŘÍKLAD.5 Vysoká škola zjšťovala, zda exstuje závslost mez výsledky studa z předmětů matematka a mkroekonome. Do výzkumu zahrnula 100 studentů druhých ročníků, kteří měl obě zkoušky za sebou. Výsledky jsou uspořádány v následující kontngenční tabulce (Obr..4): Obrázek.4 Na hladně významnost α=0,05 stanovte, zda exstuje závslost mez výsledky těchto dvou předmětů. Řešení: Po zjštění margnálních četnost pro řádky a sloupce lze vypočítat teoretcké hodnoty, které budou vypadat následovně (Obr..5): - 9 -
10 Testování hypotéz Obrázek.5 Postup testování: 1: Stanovení hypotézy: H 0 : nezávslost výsledků matematky a mkroekonome H 1 : negace H 0 : Testové krtérum: J ( n ) (7 5,) (5 7) (8 7,8) (5 7,8) G 5, 7 7,8 7,8 1 (11 9,8) 9,8 (1 10,9) 10,9 (14 13,5) 13,5 (19 18,) 18, (19 0,8),3 0,8 3: Obor přjetí: 0, 9, 49, krtcký obor: ( 9,49, ) 4: Výsledek: Testové krtérum leží v oboru přjetí, přjímáme hypotézu nezávslost kvaltatvních znaků. Výsledky z matematky a mkroekonome jsou na sobě nezávslé. V programu Excel krtckou hodnotu získáte pomocí funkce =CHIINV(Pravděpodobnost;Volnost), pro zadaný příklad je počet stupňů volnost df=4, a tedy krtcká hodnota =CHIINV(0,05;4)=9,488. Funkce =CHITEST(Aktuální,Očekávané) vám umožní vypočítat pravděpodobnost odpovídající hodnotě testového krtéra pro χ rozdělení. Teoretcké emprcké hodnoty jsou zadávány ve formě tabulky s r řádky a s sloupc. V tomto příkladě je P-hodnota p=0,6807, je tedy větší než zadaná hladna významnost α=0,05. Přjímáme nulovou hypotézu, výsledky předmětů matematky a fyzky jsou nezávslé. Testové krtérum získáte z pravděpodobnost p pomocí funkce CHIINV. Zkontrolujte s, že =CHIINV(0,6807;4)=, KONTINGENČNÍ TABULKY Častokrát se stane, že výsledky výzkumu, expermentu, nebo dotazníku, pro které lze aplkovat test nezávslost pro některé dvojce znaků, nejsou zadány přímo ve formě kontngenční tabulky, ale ve formě kategorí pro každou položku zvlášť. Z takto získaných dat lze pomocí tabulkového procesoru Excel vytvořt kontngenční tabulku, kterou dále můžete využít. Nástroj na vytvoření kontngenční tabulky naleznete v menu Vložení položka
11 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Kontngenční tabulka. Vytvoření kontngenční tabulky je vysvětleno v následujícím příkladu. ŘEŠENÝ PŘÍKLAD.6 Vysoká škola zkoumala, jak spolu souvsí výsledky v předmětech matematka, mkroekonome, makroekonome, dále pohlaví studenta a typ střední školy na které student maturoval (gymnázum G, střední škola S, učlště-u). Pro tento výzkum byl studentům předložen anonymní dotazník, výsledky z dotazníku jsou uvedeny v následující tabulce. Každý řádek odpovídá jednomu vyplněnému dotazníku. Sestavte kontngenční tabulku tak, aby a) v řádcích byl výsledek z matematky a v sloupc z mkroekonome. b) v řádcích bylo rozdělení podle školy a ve sloupcích výsledek z makroekonome. Student číslo Matematka Mkroekonome Makroekonome Muž/Žena Škola Počet M G 1 Z S M S M S Z U Z G Z U Z S Z S Z S Z G Z G Z G Z G Z U 1 16 Z U Z S Z S M S M S Z G Z G Z U Z S M S M S Z S Z G Z G Z G 1 Řešení: K tabulce je přdaný sloupec Počet, který určuje kolk osob vysthuje jeden dotazník. Pro zjednodušení lze totž zapsat dotazníky se stejným vyplněním jedenkrát a označt počet
12 Testování hypotéz takto vyplněných dotazníků. V uvedené tabulce jsou vyplněny všechny dotazníky zvlášť, proto u každého z nch má položka Počet hodnotu 1. Celkový počet dotazníků je 30. Pro vytvoření kontngenční tabulky v menu Vložení zvolíte položku Kontngenční tabulka (Obr..6): Obrázek.6 Otevře se dalogové okno, ve kterém vyznačíte oblast dat, kterou budete používat a požadované umístění kontngenční tabulky nejlépe na nový lst (Obr..7). Obrázek.7 V novém lstu se na pravé straně otevře seznam polí kontngenční tabulky. Nejpřehlednější je uspořádání Část pole a část oblast na sebe, tedy uspořádání, které je na Obr
13 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Obrázek.8 Do polí Popsky sloupců, Popsky řádků a Hodnoty postupně přetáhneme pole Mkroekonome, Matematka, a Počet (Obr..9)
14 Testování hypotéz Obrázek.9 V souboru se vytvořla tabulka, která má tvar (Obr..10): Obrázek.10 Pro lepší přehled je dobré přejmenovat položku Popsky sloupců na Mkroekonome a Popsky řádků na Matematka. Výsledná kontngenční tabulka bude mít tvar (Obr..11): Obrázek
15 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Podobně přpravíte řešení příkladu b); do polí Popsky sloupců, Popsky řádků a Hodnoty postupně přetáhneme pole Makroekonome, Škola, a Počet. (.9). Popsky sloupců přejmenujeme na Makroekonome a Popsky řádků na Škola. Výsledná kontngenční tabulka bude mít tvar (Obr..1) Obrázek.1.3 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD.1 Automat na plnění jogurtů do kelímků byl podle výrobce seřízen tak, že střední hodnota objemu naplněných kelímků je 00 ml. Kontrola jakost 16 naplněných kelímků ukázala, že průměrný objem náplně byl 00,1 ml se směrodatnou odchylkou 1 ml. a) Je automat seřízený správně? Testujte na hladně významnost 0,01. b) Jak by se změnl výsledek testu z bodu a), kdyby byla výrobcem zadaná (populační) směrodatná odchylka 0,5 ml? c) Na hladně významnost 0,01 testujte, zda je velkost rozptylu rovna výrobcem zadané hodnotě 0,5. PŘÍKLAD. Dodavatel slíbl, že dodávka bude obsahovat 70% výrobků 1. jakost, 0% druhé jakost a 10% jakost třetí. Př kontrole dodávky kontroloř náhodně vybral 100 výrobků a zjstl, že 75 kusů je 1. jakost, 10 kusů je. jakost a 15 kusů je jakost třetí. Na hladně významnost 0,05 zjstěte, zda dodavatel dodržel smlouvu
16 Testování hypotéz PŘÍKLAD.3 Př výzkumu spokojenost občanů s úrovní služeb ve městě byly obdrženy výsledky, vz dále tabulka. Na hladně významnost 0,01 testujte, zda postoj občanů ke stavu služeb závsí na jejch pohlaví. Muž Žena Spokojenost Nespokojenost ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ PŘÍKLADU.1 a) 1. H 0 :μ=00 H 1 :μ 00. Testové krtérum: T=0,4 3. Obor přjetí: 0,, 95, krtcký obor: (,95, ) 4. Výsledek: Na hladně významnost 0,01 nemůžeme zamítnout nulovou hypotézu a tedy automat je seřízený správně. b) 1. H 0 :μ=00 H 1 :μ 00. Testové krtérum:t=0,8 3. Obor přjetí: 0 ;, 58, krtcký obor: (,58 ; ) 4. Výsledek: Hodnota testového krtéra padne do oboru přjetí a proto na hladně významnost 0,01 přjímáme nulovou hypotézu a automat je seřízený správně. Výsledek se nezmění. c) 1. H 0 :σ =0,5 H 1 :σ 0,5. Testové krtérum: T=60 3. Obor přjetí: 4,601, 3, 801, 4. Hodnota testového krtéra padne do krtckého oboru a proto zamítáme nulovou hypotézu na hladně významnost 0,01 a tedy automat není seřízen správně. ŘEŠENÍ PŘÍKLADU. Výsledná tabulka obsahuje všechny požadované nformace s popsem (Obr. 1.1). Obrázek.13 Test: 1. Stanovení hypotézy: H 0 :p 1 =0,7, p =0,, p 3 =0,1, (dobrá shoda) H 1 : negace H
17 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy. Testové krtérum: J ( G 1 ) (75 70) , Obor přjetí: 0, 6, krtcký obor: ( 6, ) n (10 0) 0 (15 10) Výsledek: Hodnota testového krtéra padne do krtckého oboru. Zamítáme hypotézu dobré shody vzorku s předpokladem. Dodavatel nedodržel smlouvu. ŘEŠENÍ PŘÍKLADU.3 1: Stanovení hypotézy: H 0 : nezávslost výsledků na pohlaví respondentů H 1 : negace H 0 : Testové krtérum: G 18, 38 3: Obor přjetí: 0, 6, 63, krtcký obor: ( 6,63, ) 4: Testové krtérum leží v krtckém oboru, zamítáme hypotézu o nezávslost kvaltatvních znaků. Názory respondentů jsou závslé na jejch pohlaví..5 PŘÍPADOVÉ STUDIE PŘÍPADOVÁ STUDIE.1 Zdravotní pojšťovna zkoumala vzájemnou souvslost čtyř chronckých nemoc chroncká bronchtda (A), dabetes (B), astma (B) a hypertenze (C). Oslovla proto náhodně 50 pacentů ve věku do 60 let s alespoň jednou se zmíněných nemocí a zjšťovala, zda jsou u nch přítomny také další nemoc ze seznamu. Výsledky jsou zapsány v následující tabulce. Každý řádek odpovídá jednomu vyplněnému dotazníku. Na hladně významnost 0,05 zjstěte, zda exstuje souvslost mez hypertenzí a dabetem, a mez bronchtdou a astmatem. A B C D Ano Ne Ano Ne Ne Ano Ano Ano Ano Ne Ano Ano Ano Ano Ne Ano Ano Ne Ano Ne Ano Ano Ano Ano Ne Ne Ne Ne Ano Ano Ne Ano Ano Ano Ne Ne Ne Ne Ne Ne Ano Ano Ano Ano Ne Ne Ano Ano
18 Testování hypotéz Ano Ne Ne Ne Ano Ano Ne Ano Ne Ne Ano Ne Ano Ano Ne Ano Ne Ne Ne Ano Ano Ne Ne Ano Ne Ano Ne Ne Ano Ano Ano Ano Ne Ano Ne Ne Ano Ne Ne Ano Ne Ano Ano Ano Ano Ano Ne Ne Ne Ne Ano Ne Ne Ne Ne Ano Ano Ne Ano Ne Ne Ne Ano Ano Ano Ne Ano Ano Ano Ne Ne Ano Ne Ano Ne Ne Ano Ano Ne Ne Ano Ano Ano Ano Ne Ne Ne Ne Ano Ano Ne Ano Ne Ne Ano Ne Ano Ne Ne Ne Ne Ano Ano Ano Ne Ne Ne Ano Ano Ano Ne Ano PŘÍPADOVÁ STUDIE.1 Agentura pro výzkum veřejného mínění zkoumala, zda exstuje souvslost mez vzděláním respondentů (ZŠ, SŠ, VŠ), jejch rodnným stavem (svobodný, v manželském svazku), preferencí poltcké strany (pravce, levce) a pohlavím respondentů). Výsledky jsou zapsány v následující tabulce. Jeden řádek odpovídá jednomu vyplněnému dotazníku. Na hladně významnost 0,05 zjstěte, zda exstuje souvslost mez preferencí poltcké strany a vzděláním, rodnným stavem a pohlavím. Strana Vzdělání Stav Pohlaví Levce ZŠ M M Levce SŠ S Ž Pravce VŠ M Ž Levce ZŠ M M Pravce SŠ M M Levce VŠ S M Levce SŠ S Ž Levce VŠ S Ž Pravce VŠ M M
19 Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Levce SŠ M M Levce e ZŠ S M Levce SŠ M M Pravce SŠ M Ž Levce SŠ M Ž Levce VŠ M M Pravce VŠ M Ž Pravce VŠ M M Pravce SŠ S Ž Levce e SŠ S M Levce ZŠ S Ž Pravce SŠ M Ž Levce SŠ M Ž Levce ZŠ M Ž Pravce SŠ M M Pravce VŠ S M Pravce SŠ S M Levce e ZŠ M M Levce SŠ M M Pravce SŠ S M Levce VŠ S Ž Levce ZŠ M Ž Pravce VŠ M Ž Pravce VŠ M Ž Pravce SŠ M M Levce SŠ M M Levce SŠ S M Pravce SŠ M Ž Pravce SŠ M Ž Pravce SŠ S Ž Levce VŠ S Ž Levce SŠ S M Pravce SŠ M M Pravce SŠ M Ž Pravce VŠ M Ž Levce SŠ M M Levce SŠ M Ž Pravce SŠ M M Pravce VŠ M Ž Pravce SŠ M M Levce SŠ M Ž
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Více6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu
6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a
VíceANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
Vícepodle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y
4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.
VíceANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha
ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl
VíceREGRESNÍ ANALÝZA. 13. cvičení
REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká
VíceTESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
VíceTESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VíceTestování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
VíceTestování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
VíceAproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
VíceRegresní a korelační analýza
Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceANALÝZA ROZPTYLU (Analysis of Variance ANOVA)
NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VíceTestování statistických hypotéz
Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím
VíceTestování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
VíceStatistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VíceUrčujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
VíceSTATISTICKÉ HYPOTÉZY
STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VícePřednáška č. 11 Analýza rozptylu při dvojném třídění
Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané
VíceStatistická šetření a zpracování dat.
Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceTestování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
VíceTest dobré shody v KONTINGENČNÍCH TABULKÁCH
Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Víceanalýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceSTATISTIKA (pro navazující magisterské studium)
Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU
VíceTestování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
Více2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Více9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese
cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
VíceKatedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
VíceTestování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
VíceCvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
VíceEpidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceJednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
Více5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
VíceSTATISTICA Téma 6. Testy na základě jednoho a dvou výběrů
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
VíceJarqueův a Beryho test normality (Jarque-Bera Test, JB test)
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména
VíceNeparametrické metody
Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VíceNáhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceTECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
Více12. prosince n pro n = n = 30 = S X
11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli
VíceTestování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
VíceNeparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
VíceTestování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
VíceTestování hypotéz Biolog Statistik: Matematik: Informatik:
Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé
VícePříklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VíceADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceVzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VíceIterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2
Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...
VíceZ mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Více12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
VíceJednovýběrové testy. Komentované řešení pomocí MS Excel
Jednovýběrové testy Komentované řešení pomocí MS Excel Vstupní data V dalším budeme předpokládat, že tabulka se vstupními daty je umístěna v oblasti A1:C23 (viz. obrázek) Základní statistiky vložíme vzorce
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
VíceSTATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
Více5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST
Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy
Více