Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Transkript

1 Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích

2 Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové mají jinou hodnotu IQ testů (zatím neuvažujme zda menší nebo větší) než absolventi středních škol v celé České republice Naším cílem bude zjistit, zda absolventi středních škol v Hradci Králové představují jinou populaci než zbytek ČR Při hledání odpovědi na tuto otázku při testování může dojít ke třem případům 1. Mezi oběma populacemi není rozdíl 2. IQ studentů v Hradci Králové je vyšší 3. IQ studentů v Hradci Králové je nižší než IQ studentů celé ČR

3 Nulová hypotéza: μ HK = μ ČR Alternativní hypotéza: μ HK μ ČR

4 Šetření na celých populacích bývá ekonomicky, organizačně i časově velmi náročné Proto vybíráme z populace určitou vzorku a hypotézy testujeme na těchto vzorcích VÝBĚR Pokud zkoumaný výběr dobře odráží strukturu celé populace REPREZENTATIVNÍ VÝBĚR Příklad: vybereme 50 studentů z Hradce Králové, spočteme průměr jejich IQ testů, přičemž předpokládáme, že průměrná hodnota IQ testu u zbylých studentů ČR je 100 Protože studenti z HK jsou reprezentováni pouze výběrem, nikdy nebudeme moci říct se 100%-ní jistotou, zda se jejich inteligence významně liší od zbylých studentů ČR, či nikoli SAMPLING ERROR (výběrová chyba)

5 Vzniká v důsledku toho, že neprovádíme šetření na celé populaci ale pouze na určitém náhodném výběru. Naštěstí však vždy můžeme říct: Čím více je vzdálen průměr IQ testů studentů z HK od průměru IQ testů zbylé populace v ČR, tím je větší pravděpodobnost, že inteligence studentů z HK je jiná jako inteligence studentů ČR z pohledu IQ jde tedy o dvě různé populace Malá vzdálenost mezi průměry IQ testů HK vs. ČR rozdíl vznikl v důsledku výběrové chyby jde o jednu populaci Velká vzdálenost mezi průměry malá pravděpodobnost, že rozdíl vznikl v důsledku výběrové chyby populace HK a ČR jsou 2 různé populace

6 Průměry obou populací jsou blízko sebe: μ ČR μ HK Průměry obou populací jsou velmi vzdálené: μ ČR μ HK

7 Chyba I. druhu: Přijmeme rozhodnutí, že výběr pochází z jiné populace, když ve skutečnosti pochází z uvedené populace Chyba II. druhu: Přijmeme rozhodnutí, že výběr pochází z uvedené populace, i když ve skutečnosti pochází z jiné Naším cílem je přijmout takové rozhodnutí, abychom minimalizovali jak chybu I. tak i II. druhu Potřebujeme KVANTITATIVNÍ INDIKÁTORY pro přijímaní hypotéz

8

9 Pro jakoukoliv populaci se výběrové rozložení skládá ze všech možných rozdílných výběrů (daného rozsahu), které můžeme z dané populace vybrat. Rozdílný = daný výběr z populace, může být přítomen ve výběrovém rozložení jen jednou Máme prvky A, B, C a rozsah výběru n = 2 můžeme získat pouze 3 vzorky: (A, B), (A, C) a (B, C)

10 Příklad: Předpokládejme, že náš výběr studentů HK představuje 6 studentů a předpokládejme, že jejich IQ skóre má následující hodnoty Jméno studenta Robert 70 Anna 85 Jan 100 Petr 100 Katka 115 IQ test Marek 130

11 Četnost Příklad: Rozsah výběrů n = 2 Počet všech možných výběrů = 15 Vytvoříme tabulku průměrů IQ testů pro všechny dvojice Výběrové rozložení 77, , , ,5 Průměry IQ skóre Student 1 Student 2 Průměr IQ skóre Robert Anna 77,5 Robert Jan 85 Robert Petr 85 Robert Katka 92,5 Robert Marek 100 Anna Jan 92,5 Anna Petr 92,5 Anna Katka 100 Anna Marek 107,5 Jan Petr 100 Jan Katka 107,5 Jan Marek 115 Petr Katka 107,5 Petr Marek 115 Katka Marek 122,5 Celkový průměr výběrového rozložení průměrů je roven průměru populace 100 = 100

12 Směrodatná odchylka výběrového rozložení je velmi důležitá, protože indikuje, jak dobře střední hodnota výběru reprezentuje populaci Čím větší směrodatná odchylka tím méně je střední hodnota reprezentativní Tuto vlastnost můžeme vyjádřit pomocí výběrové chyby Čím větší směrodatná odchylka, tím větší efekt vliv výběrové chyby Výběrová chyba je velmi důležitá při rozhodování především pokud je naše rozhodnutí učiněno pouze na základě jediného výběru Směrodatná odchylka výběrového rozložení = SMĚRODATNÁ CHYBA PRŮMĚRU STANDARD ERROR of the MEAN

13 Směrodatná chyba má vliv na tvar výběrového rozložení a na výběrovou chybu Při zmenšování standardní chyby se výběrový průměr přibližuje průměru celé populace Čím je menší výběrová chyba, tím je rozhodnutí o tom, že výběr pochází z jiné nebo ze stejné populace jednodušší

14 Vidíme, že čím je větší rozsah výběru tím je menší směrodatná chyba o Proto se při výzkumu snažíme získat výběr tak velký jak to jen jde (jak je to ekonomicky únosné)

15 Příklad: Předpokládejme, že rozložení inteligence u absolventů středních škol celé ČR je normální, střední hodnota je 100 vyberme 50 studentů z Hradce Králové Rozložení IQ skóre celé populace ČR i studentů HK vidíme na následujícím obrázku Střední hodnota výběru leží na střední hodnotě populace

16 Pokud posouváme červenou linii doleva a doprava dochází Ke změně výběrového průměru IQ testů studentů z HK Mění se i procento vlevo i vpravo od červené linie Procento na levé straně představuje procento výběrových průměrů studentů ČR, které jsou nižší jako výběrový průměr HK Na pravé straně představuje procento vyšších výběrových průměrů

17 Je rozhodující bod, ve kterém upřednostníme jedno rozhodnutí před druhým Vždy jsme velmi opatrní, při rozhodnutí, že náš výběr se liší od populace, se kterou náš výběr porovnáváme velmi se snažíme vyhnout chybě I. druhu INTERVAL SPOLEHLIVOSTI NASTAVÍME NA 95% 95%-ní interval spolehlivosti znamená, že pokud je populace absolventů středních škol HK stejná jako populace zbylé ČR, pak existuje 5%-ní pravděpodobnost, že průměr HK bude níže nebo výše jako hranice intervalu spolehlivosti Pokud průměr IQ testů studentů z HK bude výše nebo níže jako 95%-ní interval spolehlivosti, pak rozhodneme, že studenti HK pochází z jiné populace

18 Následující rozložení ilustruje vztah mezi hranicemi intervalu spolehlivosti a statistickou významností Vyšrafovaná plocha představuje 95%-ní interval spolehlivosti Hodnoty, které představují krajní body intervalu spolehlivosti se nazývají kritické hodnoty Kritické hodnoty vyjadřujeme pomocí Z skóre nebo standardních hodnot Pokud je rozložení normální je hodnota z = +1,96 pro horní hranici a z = -1,96 pro dolní hranici. Hodnota ±1,96 je kritickou hodnotou, protože 2,5% průměrů výběrových rozložení leží nad hodnotou +1,96.σ a 2,5% leží pod hodnotou -1,96.σ

19 Kritické hodnoty jsou funkcí Rizika, které jsme ochotni podstoupit, že učiníme chybu I. druhu Tvaru výběrového rozložení ČÍM VĚTŠÍ RIZIKO CHYBY I. DRUHU TÍM MENŠÍ KRITICKÁ HODNOTA 90%-ní interval spolehlivosti (10% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ±1,64 99%-ní interval spolehlivosti (1% riziko, že učiníme chybu I. druhu) kritické hodnoty z = ± 2,57

20 Dvoustranný test: Zajímá nás pouze jestli je inteligence absolventů středních škol z HK jiná jako inteligence zbylých studentů ČR Kritické hodnoty nastavíme na obou koncích křivky Jednostranný test: Předpokládáme směr rozdílu Z nějakého důvodu předpokládáme, že studenti z HK jsou šikovnější, inteligentnější jako zbytek studentů ČR Tento test nazýváme jednostranný, nebo jenom výsledky na jedné straně potvrzují naši hypotézu 5%-ní riziko toho, že učiníme chybu I. druhu kritickou hodnotu nastavíme tak, aby 5% možných výsledků leželo nad touto kritickou hodnotou = +1,64

21

22 Před tím než provedeme studii definujeme hypotézy: NULOVOU HYPOTÉZU H 0 nazýváme ji nulovou, protože je to hypotéza, kterou chceme vynulovat popřít ( nulllify ) Nejčastěji zní: Neexistuje žádný rozdíl mezi skupinami. Neexistuje rozdíl mezi výběrem a celou populací. ALTERNATIVNÍ HYPOTÉZU H 1 (H A ) hypotéza, kterou předpokládáme, že potvrdí naše studie, naše data Nejčastěji zní: Mezi našimi skupinami pacientů (studentů) existuje rozdíl. Výběr pochází z jiné populace.

23

24 a jeho použití při testování hypotéz

25 Příklad: Předpokládejme, že vedení univerzity zajímá, jak jsou studenti spokojeni se životem a ubytováním na koleji Studenti odpovídají na tuto otázku ve škále 1 7; 1 velmi nespokojený 7 velmi spokojený Vedení univerzity chce vědět, zda spokojenost studentů je různá od neutrálního postoje (odpověď 4) Řešení: Učiníme výběr ze studentů (z ekonomického, organizačního apod. hlediska není možné zeptat se všech) a zeptáme se jich, jak jsou spokojeni se životem na koleji Spočteme průměr spokojenosti z tohoto výběru (předpokládejme, že není roven 4)

26 Řešení: Musíme rozhodnout, zda se průměr výběru liší od neutrálního postoje (4) v důsledku výběrové chyby, nebo studenti nejsou neutrální v otázce života na koleji Předpokládejme, že rozsah výběru N = 15; výběrový průměr = 5; a směrodatná odchylka = 1,936 Našim cílem je určit, zda je 5 dostatečně daleko od 4 při daném rozsahu výběru a při spočtené směrodatné odchylce 1. Řešení 1: Oslovíme všechny studenty a vytvoříme všechny možné výběry o rozsahu N = 15 Avšak to nemusíme dělat, nebo když oslovíme skutečně všechny, můžeme přímo spočítat celkový průměr = průměru celé populace (našich studentů na našich kolejích) a víme přesně, zda jsou naši studenti spokojeni a do jaké míry

27 Řešení: 2. Řešení 2: Avšak z ekonomických a jiných důvodů není možné získat odpovědi od všech studentů Musíme vytvořit výběrové rozložení a určit směrodatnou chybu Tvar tohoto rozložení je jiný jako u normálního rozložení, a to především pokud je rozsah výběru menší než 30 Toto rozložení nazýváme T rozložení : Pokud je N > 30, je téměř identické s normálním rozložením Pro N < 30 je T rozložení plošší a má větší plochu na obou koncích Důvodem, proč se toto rozložení liší od normálního je, že směrodatná chyba se určuje ze směrodatné odchylky výběru na rozdíl od směrodatné odchylky populace (tato směrodatná odchylka není známá)

28 Normální rozložení: Výsledek je statistický významný jenom pokud pravděpodobnost, že se dopustíme chyby I. druhu je menší než 5% Z skóre se rovná ±1,96 T rozložení: Pro Z skóre 1,96 leží pod kritickou hodnotou 3,7% souboru a nad hodnotou + 1,96 leží také 3,7% souboru, celkem tedy 7,4% Abychom dosáhli 5% spolehlivosti musíme posunout hranice kritických hodnot dále, a to na hodnotu ± 2,15 Výběry malého rozsahu přinášejí méně vypovídající výsledky a proto potřebujeme přísnější kritéria proto, abychom výsledky prohlásily za významné

29 Obvykle při různých studiích neznáme směrodatnou odchylku a průměr celé populace pro proměnné, které zkoumáme, a proto pro testování hypotéz častěji používáme t rozložení, než normální rozložení Kritické hodnoty, které používáme při rozhodnutí o statistické významnosti testu jsou funkcí rozsahu výběru Pro N > 30, jsou však rozdíly mezi normálním rozložením a t rozložením zanedbatelné

30 Směrodatná chyba je směrodatná odchylka výběrového průměru Směrodatná chyba není směrodatná odchylka hodnot v populaci, ani není směrodatnou odchylkou hodnot ve výběru Směrodatná chyba je mírou chyby, kterou očekáváme, při výpočtu výběrového průměru Při rozsahu výběru N, můžeme získat mnoho různých výběrů, každý z těchto výběrů má různý průměr Získáme rozložení těchto průměrů, a tak mírou chyby pro kterýkoliv z průměrů je právě směrodatná chyba

31 Obvykle máme jeden výběr a tedy jednu střední hodnotu (průměr) Směrodatnou chybu v tomto případě určíme ze směrodatné odchylky ze získaných hodnot výběru Příklad: Průměr našeho výběru byl 5; směrodatná odchylka 1,936 Ze vztahu s Směrodatná chyba průměru : s x = N získáme pro směrodatnou chybu našeho výběru hodnotu s x = = Ze směrodatné chyby spočteme t hodnoty pomocí vztahu: x μ Pozorovaná hodnota t: t = s x Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty (pro daný počet stupňů volnosti), zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

32 Nulová hypotéza H 0 : Spokojenost studentů se životem na koleji je neutrální Alternativní hypotéza H 1 : Postoj studentů k ubytování a životu na koleji není neutrální. Hypotetický průměr = 4, chyba I. druhu je 5% Jediné, co potřebujeme určit, je vypočítat o kolik směrodatných chyb je výběrový průměr vzdálen od průměru populace Pro dvoustranný t-test jsou 0,05 kritické hodnoty ± 2,15 při rozsahu výběru N = 15 Protože náš průměr je 5, směrodatná chyba je 0,5, je náš průměr vzdálen od hypotetického průměru 4 dvě směrodatné chyby ((5 4)/0,5 = 2) Protože 2 < 2,15 nemůžeme odmítnou nulovou hypotézu Na základě studie o 15 studentech nemůžeme učinit závěr, že studenti jsou nebo nejsou spokojeni se životem na koleji

33 Celý předchozí proces nazýváme T test: Spočteme t hodnoty Tyto hodnoty srovnáme s kritickými hodnotami t rozložení pro daný rozsah výběru Pokud jsou námi spočtené hodnoty větší jako kritické hodnoty, zamítáme nulovou hypotézu a přijímáme hypotézu alternativní

34 Příklad: o Předpokládejme, že jsme získali stejné výsledky jako v předchozím příkladě jenom rozsah našeho výběru je N = 20 (náš průměr je 5, hypotetický průměr je 4, směrodatná odchylka je 1,936). Nyní je směrodatná chyba / 20 = a kritická hodnota při 5%-ní významnosti je 2,09. Výběrový průměr je nyní vzdálen o (5 4)/0,433 = 2,309 směrodatných chyb od populačního průměru 4. o Protože 2,309 > 2,09 můžeme nulovou hypotézu zamítnout o Nyní můžeme říct, že na základě výběrové studie o rozsahu 20 studentů, je spokojenost studentů se životem na koleji jiná než neutrální

35 Tvar t rozložení je funkcí rozsahu výběru Při narůstajícím rozsahu výběru se t rozložení blíží normálnímu rozložení T rozložení = normální rozložení, když rozsah výběru = velikosti populace V praktickém využití t rozložení = normální rozložení pro N > 30 T rozložení je funkcí stupňů volnosti, které jsou přímo dané rozsahem výběru Když se d.f. t rozložení se blíží normálnímu rozložení Pro každé N existuje jiná křivka Pro každé N existují jiné kritické hodnoty pro 5% riziko, že učiníme chybu I. druhu

36 pokračování

37 Jsou definované námi zvoleným rizikem, které jsme schopni podstoupit, že učiníme chybu I. druhu a tím, zda jde o jednostranný nebo dvoustranný test Předpokládejme, že N = 20 Při 5%-ní spolehlivosti t krit = ± 2,093 Při 1%-ní spolehlivosti t krit = ± 2,861 Při 10%-ní spolehlivosti t krit = ± 1,729 N = 20 Dvoustranný test 5%-ní spolehlivost t krit = ± 2,093 Jednostranný test 5%-ní spolehlivost t krit = + 1,729 nebo 1,729 d.f. 0,95 0,99 2 4,303 9, ,182 5, ,776 4, ,571 4, ,306 3, ,228 3, ,093 2, ,009 2, ,984 2,626

38 Nejčastěji porovnáváme dva různé nezávislé výběry a snažíme se rozhodnout zda pochází ze stejné populace či nikoliv H 0 : Oba výběry pochází ze stejné populace. H 1 : Výběry pochází ze dvou různých populací. Dvoustranný test: Jednostranný test: μ = μ 1 2 μ μ 1 2 μ > μ nebo μ < μ

39 1. Dvě různé populace 2. Z každé populace vybereme výběr s rozsahy n 1 a n 2 3. Pro každý výběr vytvoříme výběrové rozložení 4. Sestrojíme výběrové rozložení rozdílu mezi průměry spočteme všechny možné odchylky mezi průměry 1. a 2. výběru 5. Výběrové rozložení rozdílu mezi průměry má také t rozložení

40 Směrodatná chyba rozdílu průměrů: s x x 1 2 ( ) 2 ( ) 2 n1 1 s1 + n2 1 s2 1 1 = + n1+ n2 2 n1 n2 Pozorovaná t hodnota pro nezávislý t test: t = x x ( ) 1 2 sx x 1 2

41 Srovnávání provádíme na jednom výběru. Zajímá nás: Zda došlo ke změně v průběhu času Jaká je odezva na nějakou intervenci Směrodatná chyba pro párový t test: Pozorovaná t hodnota pro párový test: s D t = = D s D s D N

42 Příklad: Otestujme, jak se změnila spokojenost studentů s bydlením na koleji po instalaci klimatizace Potřebujeme odpovědět na otázku, zda se hodnota 1,4 dostatečně liší od 0. Směrodatná odchylka pro rozdíl s D = 0,548 Potom směrodatná chyba pro rozdíl průměrů s = = D 15 A spočtená hodnota t je potom 1.4 t = = Student Před instalací Po instalaci Rozdíl A = 4.2 B = 5.6 D = 1.4

43 děkuji za pozornost