Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Rozměr: px
Začít zobrazení ze stránky:

Download "Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích"

Transkript

1 Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích

2 Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové mají jinou hodnotu IQ testů (zatím neuvažujme zda menší nebo větší) než absolventi středních škol v celé České republice Naším cílem bude zjistit, zda absolventi středních škol v Hradci Králové představují jinou populaci než zbytek ČR Při hledání odpovědi na tuto otázku při testování může dojít ke třem případům 1. Mezi oběma populacemi není rozdíl 2. IQ studentů v Hradci Králové je vyšší 3. IQ studentů v Hradci Králové je nižší než IQ studentů celé ČR

3 Nulová hypotéza: μ HK = μ ČR Alternativní hypotéza: μ HK μ ČR

4 Šetření na celých populacích bývá ekonomicky, organizačně i časově velmi náročné Proto vybíráme z populace určitou vzorku a hypotézy testujeme na těchto vzorcích VÝBĚR Pokud zkoumaný výběr dobře odráží strukturu celé populace REPREZENTATIVNÍ VÝBĚR Příklad: vybereme 50 studentů z Hradce Králové, spočteme průměr jejich IQ testů, přičemž předpokládáme, že průměrná hodnota IQ testu u zbylých studentů ČR je 100 Protože studenti z HK jsou reprezentováni pouze výběrem, nikdy nebudeme moci říct se 100%-ní jistotou, zda se jejich inteligence významně liší od zbylých studentů ČR, či nikoli SAMPLING ERROR (výběrová chyba)

5 Vzniká v důsledku toho, že neprovádíme šetření na celé populaci ale pouze na určitém náhodném výběru. Naštěstí však vždy můžeme říct: Čím více je vzdálen průměr IQ testů studentů z HK od průměru IQ testů zbylé populace v ČR, tím je větší pravděpodobnost, že inteligence studentů z HK je jiná jako inteligence studentů ČR z pohledu IQ jde tedy o dvě různé populace Malá vzdálenost mezi průměry IQ testů HK vs. ČR rozdíl vznikl v důsledku výběrové chyby jde o jednu populaci Velká vzdálenost mezi průměry malá pravděpodobnost, že rozdíl vznikl v důsledku výběrové chyby populace HK a ČR jsou 2 různé populace

6 Průměry obou populací jsou blízko sebe: μ ČR μ HK Průměry obou populací jsou velmi vzdálené: μ ČR μ HK

7 Chyba I. druhu: Přijmeme rozhodnutí, že výběr pochází z jiné populace, když ve skutečnosti pochází z uvedené populace Chyba II. druhu: Přijmeme rozhodnutí, že výběr pochází z uvedené populace, i když ve skutečnosti pochází z jiné Naším cílem je přijmout takové rozhodnutí, abychom minimalizovali jak chybu I. tak i II. druhu Potřebujeme KVANTITATIVNÍ INDIKÁTORY pro přijímaní hypotéz

8

9 Pro jakoukoliv populaci se výběrové rozložení skládá ze všech možných rozdílných výběrů (daného rozsahu), které můžeme z dané populace vybrat. Rozdílný = daný výběr z populace, může být přítomen ve výběrovém rozložení jen jednou Máme prvky A, B, C a rozsah výběru n = 2 můžeme získat pouze 3 vzorky: (A, B), (A, C) a (B, C)

10 Příklad: Předpokládejme, že náš výběr studentů HK představuje 6 studentů a předpokládejme, že jejich IQ skóre má následující hodnoty Jméno studenta Robert 70 Anna 85 Jan 100 Petr 100 Katka 115 IQ test Marek 130

11 Četnost Příklad: Rozsah výběrů n = 2 Počet všech možných výběrů = 15 Vytvoříme tabulku průměrů IQ testů pro všechny dvojice Výběrové rozložení 77, , , ,5 Průměry IQ skóre Student 1 Student 2 Průměr IQ skóre Robert Anna 77,5 Robert Jan 85 Robert Petr 85 Robert Katka 92,5 Robert Marek 100 Anna Jan 92,5 Anna Petr 92,5 Anna Katka 100 Anna Marek 107,5 Jan Petr 100 Jan Katka 107,5 Jan Marek 115 Petr Katka 107,5 Petr Marek 115 Katka Marek 122,5 Celkový průměr výběrového rozložení průměrů je roven průměru populace 100 = 100

12 Směrodatná odchylka výběrového rozložení je velmi důležitá, protože indikuje, jak dobře střední hodnota výběru reprezentuje populaci Čím větší směrodatná odchylka tím méně je střední hodnota reprezentativní Tuto vlastnost můžeme vyjádřit pomocí výběrové chyby Čím větší směrodatná odchylka, tím větší efekt vliv výběrové chyby Výběrová chyba je velmi důležitá při rozhodování především pokud je naše rozhodnutí učiněno pouze na základě jediného výběru Směrodatná odchylka výběrového rozložení = SMĚRODATNÁ CHYBA PRŮMĚRU STANDARD ERROR of the MEAN

13 Směrodatná chyba má vliv na tvar výběrového rozložení a na výběrovou chybu Při zmenšování standardní chyby se výběrový průměr přibližuje průměru celé populace Čím je menší výběrová chyba, tím je rozhodnutí o tom, že výběr pochází z jiné nebo ze stejné populace jednodušší

14 Vidíme, že čím je větší rozsah výběru tím je menší směrodatná chyba o Proto se při výzkumu snažíme získat výběr tak velký jak to jen jde (jak je to ekonomicky únosné)

15 Příklad: Předpokládejme, že rozložení inteligence u absolventů středních škol celé ČR je normální, střední hodnota je 100 vyberme 50 studentů z Hradce Králové Rozložení IQ skóre celé populace ČR i studentů HK vidíme na následujícím obrázku Střední hodnota výběru leží na střední hodnotě populace

16 Pokud posouváme červenou linii doleva a doprava dochází Ke změně výběrového průměru IQ testů studentů z HK Mění se i procento vlevo i vpravo od červené linie Procento na levé straně představuje procento výběrových průměrů studentů ČR, které jsou nižší jako výběrový průměr HK Na pravé straně představuje procento vyšších výběrových průměrů

17 Je rozhodující bod, ve kterém upřednostníme jedno rozhodnutí před druhým Vždy jsme velmi opatrní, při rozhodnutí, že náš výběr se liší od populace, se kterou náš výběr porovnáváme velmi se snažíme vyhnout chybě I. druhu INTERVAL SPOLEHLIVOSTI NASTAVÍME NA 95% 95%-ní interval spolehlivosti znamená, že pokud je populace absolventů středních škol HK stejná jako populace zbylé ČR, pak existuje 5%-ní pravděpodobnost, že průměr HK bude níže nebo výše jako hranice intervalu spolehlivosti Pokud průměr IQ testů studentů z HK bude výše nebo níže jako 95%-ní interval spolehlivosti, pak rozhodneme, že studenti HK pochází z jiné populace

18 Následující rozložení ilustruje vztah mezi hranicemi intervalu spolehlivosti a statistickou významností Vyšrafovaná plocha představuje 95%-ní interval spolehlivosti Hodnoty, které představují krajní body intervalu spolehlivosti se nazývají kritické hodnoty Kritické hodnoty vyjadřujeme pomocí Z skóre nebo standardních hodnot Pokud je rozložení normální je hodnota z = +1,96 pro horní hranici a z = -1,96 pro dolní hranici. Hodnota ±1,96 je kritickou hodnotou, protože 2,5% průměrů výběrových rozložení leží nad hodnotou +1,96.σ a 2,5% leží pod hodnotou -1,96.σ

19 Kritické hodnoty jsou funkcí Rizika, které jsme ochotni podstoupit, že učiníme chybu I. druhu Tvaru výběrového rozložení ČÍM VĚTŠÍ RIZIKO CHYBY I. DRUHU TÍM MENŠÍ KRITICKÁ HODNOTA 90%-ní interval spolehlivosti (10% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ±1,64 99%-ní interval spolehlivosti (1% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ± 2,57

20 Dvoustranný test: Zajímá nás pouze jestli je inteligence absolventů středních škol z HK jiná jako inteligence zbylých studentů ČR Kritické hodnoty nastavíme na obou koncích křivky Jednostranný test: Předpokládáme směr rozdílu Z nějakého důvodu předpokládáme, že studenti z HK jsou šikovnější, inteligentnější jako zbytek studentů ČR Tento test nazýváme jednostranný, nebo jenom výsledky na jedné straně potvrzují naši hypotézu 5%-ní riziko toho, že učiníme chybu I. druhu kritickou hodnotu nastavíme tak, aby 5% možných výsledků leželo nad touto kritickou hodnotou = +1,64

21

22 Před tím než provedeme studii definujeme hypotézy: NULOVOU HYPOTÉZU H 0 nazýváme ji nulovou, protože je to hypotéza, kterou chceme vynulovat popřít ( nulllify ) Nejčastěji zní: Neexistuje žádný rozdíl mezi skupinami. Neexistuje rozdíl mezi výběrem a celou populací. ALTERNATIVNÍ HYPOTÉZU H 1 (H A ) hypotéza, kterou předpokládáme, že potvrdí naše studie, naše data Nejčastěji zní: Mezi našimi skupinami pacientů (studentů) existuje rozdíl. Výběr pochází z jiné populace.

23

24 a jeho použití při testování hypotéz

25 Příklad: Předpokládejme, že vedení univerzity zajímá, jak jsou studenti spokojeni se životem a ubytováním na koleji Studenti odpovídají na tuto otázku ve škále 1 7; 1 velmi nespokojený 7 velmi spokojený Vedení univerzity chce vědět, zda spokojenost studentů je různá od neutrálního postoje (odpověď 4) Řešení: Učiníme výběr ze studentů (z ekonomického, organizačního apod. hlediska není možné zeptat se všech) a zeptáme se jich, jak jsou spokojeni se životem na koleji Spočteme průměr spokojenosti z tohoto výběru (předpokládejme, že není roven 4)

26 Řešení: Musíme rozhodnout, zda se průměr výběru liší od neutrálního postoje (4) v důsledku výběrové chyby, nebo studenti nejsou neutrální v otázce života na koleji Předpokládejme, že rozsah výběru N = 15; výběrový průměr = 5; a směrodatná odchylka = 1,936 Našim cílem je určit, zda je 5 dostatečně daleko od 4 při daném rozsahu výběru a při spočtené směrodatné odchylce 1. Řešení 1: Oslovíme všechny studenty a vytvoříme všechny možné výběry o rozsahu N = 15 Avšak to nemusíme dělat, nebo když oslovíme skutečně všechny, můžeme přímo spočítat celkový průměr = průměru celé populace (našich studentů na našich kolejích) a víme přesně, zda jsou naši studenti spokojeni a do jaké míry

27 Řešení: 2. Řešení 2: Avšak z ekonomických a jiných důvodů není možné získat odpovědi od všech studentů Musíme vytvořit výběrové rozložení a určit směrodatnou chybu Tvar tohoto rozložení je jiný jako u normálního rozložení, a to především pokud je rozsah výběru menší než 30 Toto rozložení nazýváme T rozložení : Pokud je N > 30, je téměř identické s normálním rozložením Pro N < 30 je T rozložení plošší a má větší plochu na obou koncích Důvodem, proč se toto rozložení liší od normálního je, že směrodatná chyba se určuje ze směrodatné odchylky výběru na rozdíl od směrodatné odchylky populace (tato směrodatná odchylka není známá)

28 Normální rozložení: Výsledek je statistický významný jenom pokud pravděpodobnost, že se dopustíme chyby I. druhu je menší než 5% Z skóre se rovná ±1,96 T rozložení: Pro Z skóre 1,96 leží pod kritickou hodnotou 3,7% souboru a nad hodnotou + 1,96 leží také 3,7% souboru, celkem tedy 7,4% Abychom dosáhli 5% spolehlivosti musíme posunout hranice kritických hodnot dále, a to na hodnotu ± 2,15 Výběry malého rozsahu přinášejí méně vypovídající výsledky a proto potřebujeme přísnější kritéria proto, abychom výsledky prohlásily za významné

29 Obvykle při různých studiích neznáme směrodatnou odchylku a průměr celé populace pro proměnné, které zkoumáme, a proto pro testování hypotéz častěji používáme t rozložení, než normální rozložení Kritické hodnoty, které používáme při rozhodnutí o statistické významnosti testu jsou funkcí rozsahu výběru Pro N > 30, jsou však rozdíly mezi normálním rozložením a t rozložením zanedbatelné

30 Směrodatná chyba je směrodatná odchylka výběrového průměru Směrodatná chyba není směrodatná odchylka hodnot v populaci, ani není směrodatnou odchylkou hodnot ve výběru Směrodatná chyba je mírou chyby, kterou očekáváme, při výpočtu výběrového průměru Při rozsahu výběru N, můžeme získat mnoho různých výběrů, každý z těchto výběrů má různý průměr Získáme rozložení těchto průměrů, a tak mírou chyby pro kterýkoliv z průměrů je právě směrodatná chyba

31 Obvykle máme jeden výběr a tedy jednu střední hodnotu (průměr) Směrodatnou chybu v tomto případě určíme ze směrodatné odchylky ze získaných hodnot výběru Příklad: Průměr našeho výběru byl 5; směrodatná odchylka 1,936 Ze vztahu s Směrodatná chyba průměru : s x = N získáme pro směrodatnou chybu našeho výběru hodnotu s x = = Ze směrodatné chyby spočteme t hodnoty pomocí vztahu: x μ Pozorovaná hodnota t: t = s x Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty (pro daný počet stupňů volnosti), zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

32 Nulová hypotéza H 0 : Spokojenost studentů se životem na koleji je neutrální Alternativní hypotéza H 1 : Postoj studentů k ubytování a životu na koleji není neutrální. Hypotetický průměr = 4, chyba I. druhu je 5% Jediné, co potřebujeme určit, je vypočítat o kolik směrodatných chyb je výběrový průměr vzdálen od průměru populace Pro dvoustranný t-test jsou 0,05 kritické hodnoty ± 2,15 při rozsahu výběru N = 15 Protože náš průměr je 5, směrodatná chyba je 0,5, je náš průměr vzdálen od hypotetického průměru 4 dvě směrodatné chyby ((5 4)/0,5 = 2) Protože 2 < 2,15 nemůžeme odmítnou nulovou hypotézu Na základě studie o 15 studentech nemůžeme učinit závěr, že studenti jsou nebo nejsou spokojeni se životem na koleji

33 Celý předchozí proces nazýváme T test: Spočteme t hodnoty Tyto hodnoty srovnáme s kritickými hodnotami t rozložení pro daný rozsah výběru Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty, zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

34 Příklad: o Předpokládejme, že jsme získali stejné výsledky jako v předchozím příkladě jenom rozsah našeho výběru je N = 20 (náš průměr je 5, hypotetický průměr je 4, směrodatná odchylka je 1,936). Nyní je směrodatná chyba / 20 = a kritická hodnota při 5%-ní významnosti je 2,09. Výběrový průměr je nyní vzdálen o (5 4)/0,433 = 2,309 směrodatných chyb od populačního průměru 4. o Protože 2,309 > 2,09 můžeme nulovou hypotézu zamítnout o Nyní můžeme říct, že na základě výběrové studie o rozsahu 20 studentů, je spokojenost studentů se životem na koleji jiná než neutrální

35 Tvar t rozložení je funkcí rozsahu výběru Při narůstajícím rozsahu výběru se t rozložení blíží normálnímu rozložení T rozložení = normální rozložení, když rozsah výběru = velikosti populace V praktickém využití t rozložení = normální rozložení pro N > 30 T rozložení je funkcí stupňů volnosti, které jsou přímo dané rozsahem výběru Když se d.f. t rozložení se blíží normálnímu rozložení Pro každé N existuje jiná křivka Pro každé N existují jiné kritické hodnoty pro 5% riziko, že učiníme chybu I. druhu

36 pokračování

37 Jsou definované námi zvoleným rizikem, které jsme schopni podstoupit, že učiníme chybu I. druhu a tím, zda jde o jednostranný nebo dvoustranný test Předpokládejme, že N = 20 Při 5%-ní spolehlivosti t krit = ± 2,093 Při 1%-ní spolehlivosti t krit = ± 2,861 Při 10%-ní spolehlivosti t krit = ± 1,729 N = 20 Dvoustranný test 5%-ní spolehlivost t krit = ± 2,093 Jednostranný test 5%-ní spolehlivost t krit = + 1,729 nebo 1,729 d.f. 0,95 0,99 2 4,303 9, ,182 5, ,776 4, ,571 4, ,306 3, ,228 3, ,093 2, ,009 2, ,984 2,626

38 Nejčastěji porovnáváme dva různé nezávislé výběry a snažíme se rozhodnout zda pochází ze stejné populace či nikoliv H 0 : Oba výběry pochází ze stejné populace. H 1 : Výběry pochází ze dvou různých populací. Dvoustranný test: Jednostranný test: μ = μ 1 2 μ μ 1 2 μ > μ nebo μ < μ

39 1. Dvě různé populace 2. Z každé populace vybereme výběr s rozsahy n 1 a n 2 3. Pro každý výběr vytvoříme výběrové rozložení 4. Sestrojíme výběrové rozložení rozdílu mezi průměry spočteme všechny možné odchylky mezi průměry 1. a 2. výběru 5. Výběrové rozložení rozdílu mezi průměry má také t rozložení

40 Směrodatná chyba rozdílu průměrů: s x x 1 2 ( ) 2 ( ) 2 n1 1 s1 + n2 1 s2 1 1 = + n1+ n2 2 n1 n2 Pozorovaná t hodnota pro nezávislý t test: t = x x ( ) 1 2 sx x 1 2

41 Srovnávání provádíme na jednom výběru. Zajímá nás: Zda došlo ke změně v průběhu času Jaká je odezva na nějakou intervenci Směrodatná chyba pro párový t test: Pozorovaná t hodnota pro párový test: s D t = = D s D s D N

42 Příklad: Otestujme, jak se změnila spokojenost studentů s bydlením na koleji po instalaci klimatizace Potřebujeme odpovědět na otázku, zda se hodnota 1,4 dostatečně liší od 0. Směrodatná odchylka pro rozdíl s D = 0,548 Potom směrodatná chyba pro rozdíl průměrů s = = D 15 A spočtená hodnota t je potom 1.4 t = = Student Před instalací Po instalaci Rozdíl A = 4.2 B = 5.6 D = 1.4

43 děkuji za pozornost

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

STATISTICKÉ HYPOTÉZY

STATISTICKÉ HYPOTÉZY STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II. Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Induktivní statistika. z-skóry pravděpodobnost

Induktivní statistika. z-skóry pravděpodobnost Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,

Více

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Ranní úvahy o statistice

Ranní úvahy o statistice Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016 Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26 Základní pojmy

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

7. cvičení 4ST201. Úvod: bodový a intervalový odhad cvičící 7. cvičení 4ST20 Obsah: Bodový odhad Intervalový odhad Testování hypotéz Vysoká škola ekonomická Úvod: bodový a intervalový odhad Statistický soubor lze popsat pomocípopisných charakteristik jako

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Jana Vránová, 3. lékařská fakulta, UK Praha

Jana Vránová, 3. lékařská fakulta, UK Praha Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně

Více

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,

Více

Testy pro porovnání vlastností dvou skupin

Testy pro porovnání vlastností dvou skupin Testy pro porovnání vlastností dvou skupin Petr Pošík Části dokumentu jsou převzaty (i doslovně) z Mirko Navara: Pravděpodobnost a matematická statistika, https://cw.felk.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

Interval spolehlivosti t rozdělení

Interval spolehlivosti t rozdělení Interval spolehlivosti t rozdělení Předpokládejme nyní, že směrodatnou odchylku neznáme. Potom transformace: nemá pro nás význam, protože vedle µ neznáme také σ, které se vyskytuje ve výpočtu mezí intervalu

Více

Statistická teorie učení

Statistická teorie učení Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů. Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

NEPARAMETRICKÉ TESTY

NEPARAMETRICKÉ TESTY NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky)

Více