Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Rozměr: px
Začít zobrazení ze stránky:

Download "Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích"

Transkript

1 Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích

2 Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové mají jinou hodnotu IQ testů (zatím neuvažujme zda menší nebo větší) než absolventi středních škol v celé České republice Naším cílem bude zjistit, zda absolventi středních škol v Hradci Králové představují jinou populaci než zbytek ČR Při hledání odpovědi na tuto otázku při testování může dojít ke třem případům 1. Mezi oběma populacemi není rozdíl 2. IQ studentů v Hradci Králové je vyšší 3. IQ studentů v Hradci Králové je nižší než IQ studentů celé ČR

3 Nulová hypotéza: μ HK = μ ČR Alternativní hypotéza: μ HK μ ČR

4 Šetření na celých populacích bývá ekonomicky, organizačně i časově velmi náročné Proto vybíráme z populace určitou vzorku a hypotézy testujeme na těchto vzorcích VÝBĚR Pokud zkoumaný výběr dobře odráží strukturu celé populace REPREZENTATIVNÍ VÝBĚR Příklad: vybereme 50 studentů z Hradce Králové, spočteme průměr jejich IQ testů, přičemž předpokládáme, že průměrná hodnota IQ testu u zbylých studentů ČR je 100 Protože studenti z HK jsou reprezentováni pouze výběrem, nikdy nebudeme moci říct se 100%-ní jistotou, zda se jejich inteligence významně liší od zbylých studentů ČR, či nikoli SAMPLING ERROR (výběrová chyba)

5 Vzniká v důsledku toho, že neprovádíme šetření na celé populaci ale pouze na určitém náhodném výběru. Naštěstí však vždy můžeme říct: Čím více je vzdálen průměr IQ testů studentů z HK od průměru IQ testů zbylé populace v ČR, tím je větší pravděpodobnost, že inteligence studentů z HK je jiná jako inteligence studentů ČR z pohledu IQ jde tedy o dvě různé populace Malá vzdálenost mezi průměry IQ testů HK vs. ČR rozdíl vznikl v důsledku výběrové chyby jde o jednu populaci Velká vzdálenost mezi průměry malá pravděpodobnost, že rozdíl vznikl v důsledku výběrové chyby populace HK a ČR jsou 2 různé populace

6 Průměry obou populací jsou blízko sebe: μ ČR μ HK Průměry obou populací jsou velmi vzdálené: μ ČR μ HK

7 Chyba I. druhu: Přijmeme rozhodnutí, že výběr pochází z jiné populace, když ve skutečnosti pochází z uvedené populace Chyba II. druhu: Přijmeme rozhodnutí, že výběr pochází z uvedené populace, i když ve skutečnosti pochází z jiné Naším cílem je přijmout takové rozhodnutí, abychom minimalizovali jak chybu I. tak i II. druhu Potřebujeme KVANTITATIVNÍ INDIKÁTORY pro přijímaní hypotéz

8

9 Pro jakoukoliv populaci se výběrové rozložení skládá ze všech možných rozdílných výběrů (daného rozsahu), které můžeme z dané populace vybrat. Rozdílný = daný výběr z populace, může být přítomen ve výběrovém rozložení jen jednou Máme prvky A, B, C a rozsah výběru n = 2 můžeme získat pouze 3 vzorky: (A, B), (A, C) a (B, C)

10 Příklad: Předpokládejme, že náš výběr studentů HK představuje 6 studentů a předpokládejme, že jejich IQ skóre má následující hodnoty Jméno studenta Robert 70 Anna 85 Jan 100 Petr 100 Katka 115 IQ test Marek 130

11 Četnost Příklad: Rozsah výběrů n = 2 Počet všech možných výběrů = 15 Vytvoříme tabulku průměrů IQ testů pro všechny dvojice Výběrové rozložení 77, , , ,5 Průměry IQ skóre Student 1 Student 2 Průměr IQ skóre Robert Anna 77,5 Robert Jan 85 Robert Petr 85 Robert Katka 92,5 Robert Marek 100 Anna Jan 92,5 Anna Petr 92,5 Anna Katka 100 Anna Marek 107,5 Jan Petr 100 Jan Katka 107,5 Jan Marek 115 Petr Katka 107,5 Petr Marek 115 Katka Marek 122,5 Celkový průměr výběrového rozložení průměrů je roven průměru populace 100 = 100

12 Směrodatná odchylka výběrového rozložení je velmi důležitá, protože indikuje, jak dobře střední hodnota výběru reprezentuje populaci Čím větší směrodatná odchylka tím méně je střední hodnota reprezentativní Tuto vlastnost můžeme vyjádřit pomocí výběrové chyby Čím větší směrodatná odchylka, tím větší efekt vliv výběrové chyby Výběrová chyba je velmi důležitá při rozhodování především pokud je naše rozhodnutí učiněno pouze na základě jediného výběru Směrodatná odchylka výběrového rozložení = SMĚRODATNÁ CHYBA PRŮMĚRU STANDARD ERROR of the MEAN

13 Směrodatná chyba má vliv na tvar výběrového rozložení a na výběrovou chybu Při zmenšování standardní chyby se výběrový průměr přibližuje průměru celé populace Čím je menší výběrová chyba, tím je rozhodnutí o tom, že výběr pochází z jiné nebo ze stejné populace jednodušší

14 Vidíme, že čím je větší rozsah výběru tím je menší směrodatná chyba o Proto se při výzkumu snažíme získat výběr tak velký jak to jen jde (jak je to ekonomicky únosné)

15 Příklad: Předpokládejme, že rozložení inteligence u absolventů středních škol celé ČR je normální, střední hodnota je 100 vyberme 50 studentů z Hradce Králové Rozložení IQ skóre celé populace ČR i studentů HK vidíme na následujícím obrázku Střední hodnota výběru leží na střední hodnotě populace

16 Pokud posouváme červenou linii doleva a doprava dochází Ke změně výběrového průměru IQ testů studentů z HK Mění se i procento vlevo i vpravo od červené linie Procento na levé straně představuje procento výběrových průměrů studentů ČR, které jsou nižší jako výběrový průměr HK Na pravé straně představuje procento vyšších výběrových průměrů

17 Je rozhodující bod, ve kterém upřednostníme jedno rozhodnutí před druhým Vždy jsme velmi opatrní, při rozhodnutí, že náš výběr se liší od populace, se kterou náš výběr porovnáváme velmi se snažíme vyhnout chybě I. druhu INTERVAL SPOLEHLIVOSTI NASTAVÍME NA 95% 95%-ní interval spolehlivosti znamená, že pokud je populace absolventů středních škol HK stejná jako populace zbylé ČR, pak existuje 5%-ní pravděpodobnost, že průměr HK bude níže nebo výše jako hranice intervalu spolehlivosti Pokud průměr IQ testů studentů z HK bude výše nebo níže jako 95%-ní interval spolehlivosti, pak rozhodneme, že studenti HK pochází z jiné populace

18 Následující rozložení ilustruje vztah mezi hranicemi intervalu spolehlivosti a statistickou významností Vyšrafovaná plocha představuje 95%-ní interval spolehlivosti Hodnoty, které představují krajní body intervalu spolehlivosti se nazývají kritické hodnoty Kritické hodnoty vyjadřujeme pomocí Z skóre nebo standardních hodnot Pokud je rozložení normální je hodnota z = +1,96 pro horní hranici a z = -1,96 pro dolní hranici. Hodnota ±1,96 je kritickou hodnotou, protože 2,5% průměrů výběrových rozložení leží nad hodnotou +1,96.σ a 2,5% leží pod hodnotou -1,96.σ

19 Kritické hodnoty jsou funkcí Rizika, které jsme ochotni podstoupit, že učiníme chybu I. druhu Tvaru výběrového rozložení ČÍM VĚTŠÍ RIZIKO CHYBY I. DRUHU TÍM MENŠÍ KRITICKÁ HODNOTA 90%-ní interval spolehlivosti (10% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ±1,64 99%-ní interval spolehlivosti (1% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ± 2,57

20 Dvoustranný test: Zajímá nás pouze jestli je inteligence absolventů středních škol z HK jiná jako inteligence zbylých studentů ČR Kritické hodnoty nastavíme na obou koncích křivky Jednostranný test: Předpokládáme směr rozdílu Z nějakého důvodu předpokládáme, že studenti z HK jsou šikovnější, inteligentnější jako zbytek studentů ČR Tento test nazýváme jednostranný, nebo jenom výsledky na jedné straně potvrzují naši hypotézu 5%-ní riziko toho, že učiníme chybu I. druhu kritickou hodnotu nastavíme tak, aby 5% možných výsledků leželo nad touto kritickou hodnotou = +1,64

21

22 Před tím než provedeme studii definujeme hypotézy: NULOVOU HYPOTÉZU H 0 nazýváme ji nulovou, protože je to hypotéza, kterou chceme vynulovat popřít ( nulllify ) Nejčastěji zní: Neexistuje žádný rozdíl mezi skupinami. Neexistuje rozdíl mezi výběrem a celou populací. ALTERNATIVNÍ HYPOTÉZU H 1 (H A ) hypotéza, kterou předpokládáme, že potvrdí naše studie, naše data Nejčastěji zní: Mezi našimi skupinami pacientů (studentů) existuje rozdíl. Výběr pochází z jiné populace.

23

24 a jeho použití při testování hypotéz

25 Příklad: Předpokládejme, že vedení univerzity zajímá, jak jsou studenti spokojeni se životem a ubytováním na koleji Studenti odpovídají na tuto otázku ve škále 1 7; 1 velmi nespokojený 7 velmi spokojený Vedení univerzity chce vědět, zda spokojenost studentů je různá od neutrálního postoje (odpověď 4) Řešení: Učiníme výběr ze studentů (z ekonomického, organizačního apod. hlediska není možné zeptat se všech) a zeptáme se jich, jak jsou spokojeni se životem na koleji Spočteme průměr spokojenosti z tohoto výběru (předpokládejme, že není roven 4)

26 Řešení: Musíme rozhodnout, zda se průměr výběru liší od neutrálního postoje (4) v důsledku výběrové chyby, nebo studenti nejsou neutrální v otázce života na koleji Předpokládejme, že rozsah výběru N = 15; výběrový průměr = 5; a směrodatná odchylka = 1,936 Našim cílem je určit, zda je 5 dostatečně daleko od 4 při daném rozsahu výběru a při spočtené směrodatné odchylce 1. Řešení 1: Oslovíme všechny studenty a vytvoříme všechny možné výběry o rozsahu N = 15 Avšak to nemusíme dělat, nebo když oslovíme skutečně všechny, můžeme přímo spočítat celkový průměr = průměru celé populace (našich studentů na našich kolejích) a víme přesně, zda jsou naši studenti spokojeni a do jaké míry

27 Řešení: 2. Řešení 2: Avšak z ekonomických a jiných důvodů není možné získat odpovědi od všech studentů Musíme vytvořit výběrové rozložení a určit směrodatnou chybu Tvar tohoto rozložení je jiný jako u normálního rozložení, a to především pokud je rozsah výběru menší než 30 Toto rozložení nazýváme T rozložení : Pokud je N > 30, je téměř identické s normálním rozložením Pro N < 30 je T rozložení plošší a má větší plochu na obou koncích Důvodem, proč se toto rozložení liší od normálního je, že směrodatná chyba se určuje ze směrodatné odchylky výběru na rozdíl od směrodatné odchylky populace (tato směrodatná odchylka není známá)

28 Normální rozložení: Výsledek je statistický významný jenom pokud pravděpodobnost, že se dopustíme chyby I. druhu je menší než 5% Z skóre se rovná ±1,96 T rozložení: Pro Z skóre 1,96 leží pod kritickou hodnotou 3,7% souboru a nad hodnotou + 1,96 leží také 3,7% souboru, celkem tedy 7,4% Abychom dosáhli 5% spolehlivosti musíme posunout hranice kritických hodnot dále, a to na hodnotu ± 2,15 Výběry malého rozsahu přinášejí méně vypovídající výsledky a proto potřebujeme přísnější kritéria proto, abychom výsledky prohlásily za významné

29 Obvykle při různých studiích neznáme směrodatnou odchylku a průměr celé populace pro proměnné, které zkoumáme, a proto pro testování hypotéz častěji používáme t rozložení, než normální rozložení Kritické hodnoty, které používáme při rozhodnutí o statistické významnosti testu jsou funkcí rozsahu výběru Pro N > 30, jsou však rozdíly mezi normálním rozložením a t rozložením zanedbatelné

30 Směrodatná chyba je směrodatná odchylka výběrového průměru Směrodatná chyba není směrodatná odchylka hodnot v populaci, ani není směrodatnou odchylkou hodnot ve výběru Směrodatná chyba je mírou chyby, kterou očekáváme, při výpočtu výběrového průměru Při rozsahu výběru N, můžeme získat mnoho různých výběrů, každý z těchto výběrů má různý průměr Získáme rozložení těchto průměrů, a tak mírou chyby pro kterýkoliv z průměrů je právě směrodatná chyba

31 Obvykle máme jeden výběr a tedy jednu střední hodnotu (průměr) Směrodatnou chybu v tomto případě určíme ze směrodatné odchylky ze získaných hodnot výběru Příklad: Průměr našeho výběru byl 5; směrodatná odchylka 1,936 Ze vztahu s Směrodatná chyba průměru : s x = N získáme pro směrodatnou chybu našeho výběru hodnotu s x = = Ze směrodatné chyby spočteme t hodnoty pomocí vztahu: x μ Pozorovaná hodnota t: t = s x Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty (pro daný počet stupňů volnosti), zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

32 Nulová hypotéza H 0 : Spokojenost studentů se životem na koleji je neutrální Alternativní hypotéza H 1 : Postoj studentů k ubytování a životu na koleji není neutrální. Hypotetický průměr = 4, chyba I. druhu je 5% Jediné, co potřebujeme určit, je vypočítat o kolik směrodatných chyb je výběrový průměr vzdálen od průměru populace Pro dvoustranný t-test jsou 0,05 kritické hodnoty ± 2,15 při rozsahu výběru N = 15 Protože náš průměr je 5, směrodatná chyba je 0,5, je náš průměr vzdálen od hypotetického průměru 4 dvě směrodatné chyby ((5 4)/0,5 = 2) Protože 2 < 2,15 nemůžeme odmítnou nulovou hypotézu Na základě studie o 15 studentech nemůžeme učinit závěr, že studenti jsou nebo nejsou spokojeni se životem na koleji

33 Celý předchozí proces nazýváme T test: Spočteme t hodnoty Tyto hodnoty srovnáme s kritickými hodnotami t rozložení pro daný rozsah výběru Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty, zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

34 Příklad: o Předpokládejme, že jsme získali stejné výsledky jako v předchozím příkladě jenom rozsah našeho výběru je N = 20 (náš průměr je 5, hypotetický průměr je 4, směrodatná odchylka je 1,936). Nyní je směrodatná chyba / 20 = a kritická hodnota při 5%-ní významnosti je 2,09. Výběrový průměr je nyní vzdálen o (5 4)/0,433 = 2,309 směrodatných chyb od populačního průměru 4. o Protože 2,309 > 2,09 můžeme nulovou hypotézu zamítnout o Nyní můžeme říct, že na základě výběrové studie o rozsahu 20 studentů, je spokojenost studentů se životem na koleji jiná než neutrální

35 Tvar t rozložení je funkcí rozsahu výběru Při narůstajícím rozsahu výběru se t rozložení blíží normálnímu rozložení T rozložení = normální rozložení, když rozsah výběru = velikosti populace V praktickém využití t rozložení = normální rozložení pro N > 30 T rozložení je funkcí stupňů volnosti, které jsou přímo dané rozsahem výběru Když se d.f. t rozložení se blíží normálnímu rozložení Pro každé N existuje jiná křivka Pro každé N existují jiné kritické hodnoty pro 5% riziko, že učiníme chybu I. druhu

36 pokračování

37 Jsou definované námi zvoleným rizikem, které jsme schopni podstoupit, že učiníme chybu I. druhu a tím, zda jde o jednostranný nebo dvoustranný test Předpokládejme, že N = 20 Při 5%-ní spolehlivosti t krit = ± 2,093 Při 1%-ní spolehlivosti t krit = ± 2,861 Při 10%-ní spolehlivosti t krit = ± 1,729 N = 20 Dvoustranný test 5%-ní spolehlivost t krit = ± 2,093 Jednostranný test 5%-ní spolehlivost t krit = + 1,729 nebo 1,729 d.f. 0,95 0,99 2 4,303 9, ,182 5, ,776 4, ,571 4, ,306 3, ,228 3, ,093 2, ,009 2, ,984 2,626

38 Nejčastěji porovnáváme dva různé nezávislé výběry a snažíme se rozhodnout zda pochází ze stejné populace či nikoliv H 0 : Oba výběry pochází ze stejné populace. H 1 : Výběry pochází ze dvou různých populací. Dvoustranný test: Jednostranný test: μ = μ 1 2 μ μ 1 2 μ > μ nebo μ < μ

39 1. Dvě různé populace 2. Z každé populace vybereme výběr s rozsahy n 1 a n 2 3. Pro každý výběr vytvoříme výběrové rozložení 4. Sestrojíme výběrové rozložení rozdílu mezi průměry spočteme všechny možné odchylky mezi průměry 1. a 2. výběru 5. Výběrové rozložení rozdílu mezi průměry má také t rozložení

40 Směrodatná chyba rozdílu průměrů: s x x 1 2 ( ) 2 ( ) 2 n1 1 s1 + n2 1 s2 1 1 = + n1+ n2 2 n1 n2 Pozorovaná t hodnota pro nezávislý t test: t = x x ( ) 1 2 sx x 1 2

41 Srovnávání provádíme na jednom výběru. Zajímá nás: Zda došlo ke změně v průběhu času Jaká je odezva na nějakou intervenci Směrodatná chyba pro párový t test: Pozorovaná t hodnota pro párový test: s D t = = D s D s D N

42 Příklad: Otestujme, jak se změnila spokojenost studentů s bydlením na koleji po instalaci klimatizace Potřebujeme odpovědět na otázku, zda se hodnota 1,4 dostatečně liší od 0. Směrodatná odchylka pro rozdíl s D = 0,548 Potom směrodatná chyba pro rozdíl průměrů s = = D 15 A spočtená hodnota t je potom 1.4 t = = Student Před instalací Po instalaci Rozdíl A = 4.2 B = 5.6 D = 1.4

43 děkuji za pozornost

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

STATISTICKÉ HYPOTÉZY

STATISTICKÉ HYPOTÉZY STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II. Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz. Obecný postup poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

VÝBĚR A JEHO REPREZENTATIVNOST

VÝBĚR A JEHO REPREZENTATIVNOST VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Induktivní statistika. z-skóry pravděpodobnost

Induktivní statistika. z-skóry pravděpodobnost Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Ranní úvahy o statistice

Ranní úvahy o statistice Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016 Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26 Základní pojmy

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 9: Úvod do induktivní statistiky Obsah Induktivní statistika... 2 Kdy můžeme zobecňovat?... 2 Logika statistické indukce... 3 Proč nelze jednoduše

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Aplikovaná statistika v R - cvičení 2

Aplikovaná statistika v R - cvičení 2 Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary. Dvouvýběrové testy 11.12.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq2.txt a zdrojové kódy cviceni11.r a figks.r. Otevřete si program R Studio,

Více