Z metodologie známe dělení proměnných do několika skupin. Nejčastěji se užívá dělení dle S. Stevense. Nicméně nám postačí dělení jednodušší:

Rozměr: px
Začít zobrazení ze stránky:

Download "Z metodologie známe dělení proměnných do několika skupin. Nejčastěji se užívá dělení dle S. Stevense. Nicméně nám postačí dělení jednodušší:"

Transkript

1 Slovo úvodem Ne všechno, co si řekneme v tomto kurzu, je pravda. Není to proto, že by mým záměrem bylo před posluchači něco tajit nebo je uvádět ve zmatek. Problematika testování statistických hypotéz je široká a komplikovaná. Její podrobná znalost by vyžadovala několik semestrů výuky a ne jediné setkání. Úkolem toho kurzu je posluchače připravit na situaci, kdy bude muset sám statistické hypotézy formulovat a testovat. A kdy se jej pravděpodobně nikdo nebude ptát, jestli tyto hluboké odborné znalosti má. Většina uváděných informací je proto jakýmsi zjednodušením, které poskytne možnost samostatně pracovat s daty bez závažných chyb. Proměnné a konstanty Tématem celého kurzu jsou proměnné (respektive konstanty). Proměnnou se rozumí nějaká veličina, kterou jsme zjistili (naměřili) u účastníků výzkumu. Tedy například věk, pohlaví, inteligence. Ze samotného názvu proměnná vyplývá, že může nabývat různých hodnot. Pokud by tomu tak nebylo, a hodnota by byla pro všechny jedince stejná, nejedná se o proměnnou ale o konstantu. Z metodologie známe dělení proměnných do několika skupin. Nejčastěji se užívá dělení dle S. Stevense. Nicméně nám postačí dělení jednodušší: Alternativní proměnná je jakákoli proměnná, která nabývá pouze dvou různých hodnot. Nejčastěji je značíme 1 a 0 (které skupině dáme jedničku a které nulu, je jedno). Například muž-žena, praváklevák, profesionál-amatér, člen kontrolní skupiny-člen experimentální skupiny. Nominální proměnná pro každé dva prvky můžeme s jistotou říct, jestli si jejich hodnoty jsou rovny nebo nejsou rovny. Může nabývat více než dvou hodnot. Například studijní obor, příjemce jednoho z několika druhů léčby, národnost. Ordinální proměnná pro každé dva prvky můžeme s jistotou říct, jestli si jsou rovny nebo jestli má jeden vyšší hodnotu než druhý. Metrická proměnná pro každé dva prvky dokážeme posoudit, jestli je má jeden vyšší, nižší nebo stejnou hodnotu jako druhý a navíc dokážeme stejné srovnání provést mezi rozdíly hodnot libovolných dvou prvků. Například můžu říct, že Honza je vyšší než Anna o 10 cm, zatímco Lucka je vyšší než Petr o 2 cm, a tedy že rozdíl vzrůstu mezi Honzou a Annou je větší než mezi Luckou a Petrem. (Do této kategorie patří proměnné, které označujeme jako intervalové i poměrové nicméně takto jemné dělení obvykle nepotřebujeme.) 1

2 O jaké typy proměnných se jedná? Doplňte do horního řádku K, A, N, O nebo M. Jméno Pohlaví Věk Třída Pokročilost Diagnóza Depresivita (BDI-II) Množství vykouřených cigaret denně Honza muž 19 4.A začátečník bez dg Anna žena 18 3.C pokročilý bez dg. 0 0 Lucka žena 19 4.A začátečník bez dg Petr muž 19 4.B expert bez dg. 14 více než 30 Při počítačovém zpracování obvykle používáme kódování pomocí čísel. Přepište tabulku tak, abyste se zbavili slovních označení a přitom zachovali jakousi logiku značení. Jméno Pohlaví Věk Třída Pokročilost Diagnóza Honza Anna Lucka Petr Depresivita (BDI-II) Množství vykouřených cigaret denně Zapamatujte si: Jakákoli proměnná vyšší úrovně je zároveň proměnnou všech nižších úrovní nebo na ni může být převedena. METRICKÁ -> ORDINÁLNÍ -> NOMINÁLNÍ -> ALTERNATIVNÍ -> (KONSTANTA) 2

3 Převeďte proměnnou výše platu na nižší úroveň metrická ordinální ordinální nominální alternativní Jméno Plat Plat Plat Plat Plat Honza Anna Lucka Petr 0 Zapamatujte si: Při převedení proměnné na nižší úroveň ztrácíme část informace, která je v datech obsažena. Vždy proto volíme nejvyšší úroveň, se kterou můžeme pracovat. Testování hypotéz o vztahu mezi dvěma proměnnými Inferenční statistika nabízí statistický testy pro téměř jakoukoli myslitelnou hypotézu. V tomto kurzu se však zaměříme pouze na testy hypotéz o závislosti dvou proměnných nebo vztahu mezi proměnnou a konstantou. Jedná se sice o drastické zúžení oblasti zájmu, nicméně ze zkušenosti víme, že i takováto úzká znalost postačí k výběru vhodného testu u téměř všech zkoumaných problémů, se kterými se setkáváme v diplomových pracích z oblasti psychologie. Závislost nebo rozdíl? Většina studentů je zvyklá rozlišovat mezi tím, jestli zkoumá vztah dvou proměnných (např. pomocí korelačního koeficientu) nebo rozdíl mezi skupinami (třeba pomocí t-testu nebo ANOVy). Toto přináší užitek, zvláště pokud chcete čtenáři práce sdělit, co vlastně děláme. Nicméně pro účely statistické analýzy je dobré si uvědomit, že vždycky zkoumáme vztah (závislost) mezi nějakými proměnnými, i když hovoříme o rozdílu skupin. Níže je napsáno několik otázek, které si výzkumník může pokládat. Všech y se týkají nějaké souvislosti mezi dvěma proměnnými (nebo proměnnou a konstantou). Doplňte do tabulky, o vztah jakých proměnných se jedná. 3

4 Dožívají se inteligentnější lidé vyššího věku? Existují rozdíly v míře empatie mezi muži a ženami? Jsou blondýny hodnoceny muži jako atraktivnější než ženy s jinou barvou vlasů? Mají pravidelní kuřáci marihuany horší krátkodobou paměť než nekuřáci? Liší se čtenářské dovednosti žáků čtvrtých tříd napříč základními školami Olomouckého kraje? Odpovídá zastoupení mužů a žen mezi VŠ studenty zastoupení mužů a žen mezi akademiky? Je některá ze tří vybraných psychoterapeutických technik ke zmírnění příznaků PTSD účinnější než jiné? Vede senzorická deprivace k nárůstu agresivity? Dokážete odhadnout, o jaké typy proměnných se jedná? (V některých případech není odpověď jednoznačná.) Výběr statistického testu Při výběru vhodného testu můžeme postupovat podle těchto bodů: 1) Určete, s jakými dvěma proměnnými pracujete. 2) Identifikujte, jestli se jedná o alternativní, nominální, ordinální nebo metrické proměnné. 3) Vyberte správný řádek a správný sloupec z následující tabulky, podle toho, s jakými proměnnými pracujeme. Metoda první volby je zvýrazněná; šedě jsou značeny případné alternativy. 4) Je zvolený test svázán nějakými dalšími podmínkami, kdy může být použit? Pokud ano, zamyslete se nad tím, jestli jsou splněny (ověřte jejich platnost). Jsou splněny? a. Ne -> proměnnou, která podmínky porušuje, musíme nějak upravit. Nejčastějším řešením bude převedení metrické proměnné na ordinální proměnnou, pokud možno s co nejmenší ztrátou dat. Po potřebných opravách se vraťte k bodu 3. b. Ano -> proveďte test a výsledky interpretujete! 4

5 Alternativní Nominální Ordinální Metrická Konstanta nebo zadané četnosti (odvození p-hodnoty z binomické nebo normální distribuce, chí kvadrát test homogenity) Chí kvadrát test homogenity (F) Wilcoxonův jednovýběrový test (znaménkový test) Jednovýběrový t-test (N) (z-test) Alternativní Fisherův faktoriálový test (Chí kvadrát test dobré shody, Fí koeficient) Chí kvadrát test dobré shody (F) Mann-Whitneyův U-test (Wilcoxonův dvouvýběrový test) Studentův t-test pro 2 nezávislé výběry (N,S) (bodově-biseriální korelace) Nominální Chí kvadrát test dobré shody (F) Kruskal-Wallisův test ANOVA (N,S) Ordinální Spearmanův korelační koeficient Spearmanův korelační koeficient Metrická Pearsonův korelační koeficient (N) Symboly u názvů testů značí podmínky jejich užití: N podmínka normálního rozdělení, S podmínka homogenity rozptylů, F podmínka minimální očekávané četnosti 5

6 6

7 Podmínky užití jednotlivých testů Podmínka normality Testy, co označujeme jako parametrické (v našem případě t-testy, ANOVA a test významnosti Pearsonova korelačního koeficientu) vyžadují normální rozdělení. Histogram proměnné, která normální rozdělení by se měl podobat tomuto obrázku. Pokud si nejsme jistí, jestli rozdělení naší proměnné normalitu připomíná dostatečně, můžeme si pomoci některým statistickým testem normality (např. Shapiro-Wilkův test). P-hodnota menší než 0,05 je pro nás pak signálem, že podmínka normality byla porušena. Dobrá zpráva však je to, že podmínka normality je palčivá pouze u malých rozsahů souboru (n < 30). S rostoucím rozsahem souboru můžeme tolerovat čím dál tím větší odchylky. Soubory čítající stovky či tisíce jedinců snesou i nápadně ve1lká odchýlení od požadovaného tvaru. Podmínka homogenity rozptylů T-test pro dva nezávislé výběry a analýza rozptylu (ANOVA) požadují, aby rozptyly zkoumané proměnné u všech srovnávaných skupin, byly přibližně stejně velké. Tento předpoklad lze snadno ověřit pomocí F testu nebo Leveneova testu. V případě, že najdeme statisticky významné rozdíly ve velikosti rozptylu mezi skupinami, můžou být naše výsledky zkreslené. Špatná zpráva je, že se důležitost této podmínky nesnižuje s rostoucí velikostí souboru. Dobrá zpráva, že t test má variantu, která počítá s nerovností rozptylů (tzv. Welshův test) a porušení této podmínky výsledky nijak nezkreslí. Podmínka minimální očekávané četnosti Testy pracující s četnostmi, které používají rozdělení Chí kvadrát, vyžadují, aby všechny očekávané četnosti byly vyšší nebo rovné pěti, jinak test ztrácí svou sílu. Klasická situace může vypadat třeba takto: pozorované četnosti Jedináček Nejstarší Prostřední Nejmladší Vedoucí pozice Ostatní pozice očekávané četnosti Jedináček Nejstarší Prostřední Nejmladší Vedoucí pozice 22,9 19,4 3,7 25,0 Ostatní pozice 76,1 64,6 12,3 83,0 S touto podmínkou se však můžeme vypořádat poměrně snadno. Je-li porušena jen u několika málo četností z velkého počtu a není-li očekávaná četnost blízká nule, můžeme si ji dovolit přehlížet bez rizika vážného zkreslení výsledku testu. Není-li tomu tak, můžeme sloučit některé malé skupiny (zde 7

8 třeba Prostřední + Nejmladší = Mladší sourozenci). A nakonec můžeme využít kombinatorický test, pokud nám jej statistický program nabízí. Ten zjistí zcela přesnou p-hodnotu i v případě, že v některé buňce vyjde nulová hodnota. Párové testy Pro úplnost musím zmínit ještě jednu situaci, které může být někdy matoucí. Představte si, že chceme ověřit, třeba jestli se nějak liší míra obtíží, které mají pacienti před podáním určitého léku a po jeho podání. Tabulka by mohla vypadat jako níže uvedená Tabulka párového testu. Tabulka párového testu: Tabulka jednovýběrového testu: Pozorované Očekávané Jméno Potíže před Potíže po Jméno zlepšení zlepšení Honza Honza 20 0 Anna Anna -2 0 Lucka Lucka 12 0 Petr Petr 6 0 Dle našeho postupu bychom došli k tomu, že máme použít Pearsonův korelační koeficient. Ten nám ale na naši otázku odpověď nedá! Pes je totiž zakopaný v tom, jak nám je problém prezentován. Naše otázka ve skutečnosti totiž zní Je průměrné zlepšení (tedy hodnota po mínus hodnota před) vyšší než nula?. Při pohledu na druhou tabulku je již výběr metody o mnoho jasnější jedná se o srovnání metrické proměnné a konstanty (nuly). Řešením je tedy jednovýběrový t-test. V knihách i ve statistických programech jej můžeme najít pod názvem párový t-test. Z matematického pohledu se jedná o totožnou metodu lišit se bude jen formulář, do kterého zadáváme názvy proměnných, se kterými proměnnými pracujeme. Pokud proměnná rozdíl není vhodná pro parametrickou metodu (není splněna podmínka normality a máme jen malý soubor), tak snadno dojdeme k tomu, že správným řešením je Wilcoxonův párový/jednovýběrový test. Pokud už samotné proměnné potíže před a potíže po nebyly metrické povahy, tak musíme vybrat některý z jiných testů. Pokud by se jednalo a alternativní proměnné (má/nemá příznaky), pátrejte po McNemarově testu, pokud o nominální, tak po Bowkerově testu. (Poznámka pro odvážné: párový test lze použíti i tehdy, když bylo měření před a měření po provedeno vždy na dvou různých lidech. Je zde však podmínkou, aby každý člověk ze skupiny před měl svého protějška ve skupině po, který mu je přesně určen. Toto spárování se nejčastěji provádí podle pohlaví, věku, diagnózy atd... S touto poznámkou bude jistě řada psychologů nesouhlasit, nicméně je pravdivá.) 8

9 Úvod do regresní analýzy a GLM Ve skutečném psychologickém výzkumu si bohužel s výše uvedenými metodami nevystačíme většina jevů je natolik komplexních, že je těžko můžeme poznat prostřednictvím vztahů jednotlivých dvojic proměnných. Velmi dobrým pomocníkem nám proto může být regresní analýza, které dokáže uchopit celé skupiny proměnných naráz. Lineární regrese se pokouší modelovat vztah mezi jednou závisle proměnnou (vysvětlovanou proměnnou, Y) pomocí jedné nebo více nezávisle proměnných (prediktorů, X i ). Zjednodušeně řečeno, regrese říká, že naše Y je rovno součtu všech X, s tím, že každému přidělíme nějakou váhu b. Třeba můžeme tvrdit, že individuální rozdíly v tělesné hmotnosti lze vysvětit pomocí hmotnosti jídla, které člověk denně sní a průměrné době, kterou denně stráví sportem. Regresní rovnice by pak vypadala ve své obecné formě takto: Rovnice bude názornější u konkrétního případu. Kolik váží Tom? Abychom mohli rovnici vypočítat, musíme znát hodnoty koeficientů b. Ty můžeme zjistit jedině tak, že budeme sledovat všechny tři proměnné u velkého množství lidí a pak je vypočítáme právě pomocí mnohonásobné regrese. Její postup si ukážeme na praktických příkladech. Nejnutnější pojmy b 1, b 2, b 3... nestandardizované regresní koeficienty. Jednoduše říkají, o kolik bodů se změní hodnota proměnné Y, když změníme hodnotu příslušné proměnné X o jeden bod b 0 konstanta (též počátek), Y = b 0 tehdy, když jsou všechny proměnné X rovny nule. β 1, β 2, β 3... standardizované regresní koeficienty. Říkají, o kolik směrodatných odchylek se změní hodnota proměnné Y, když změníme hodnotu příslušné proměnné X o jednu směrodatnou odchylku. Pokud je v rovnici jen jediný prediktor nebo jsou všechny prediktory dokonale nekorelované, tak přesně odpovídá Pearsonovu korelačnímu koeficientu mezi Y a příslušnou proměnnou X. β 0 se rovná vždy 0, proto se nikde neuvádí. Zamyslete se nad tím, proč tomu tak je. R 2 koeficient determinance. Jedná se o množství rozptylu (variabilitu) proměnné Y, kterou lze vysvětlit (předpovědět) pomocí proměnných X. Je to velmi dobrý ukazatel toho, jak je náš model přesný. Můžeme ho pro názornost psát v procentech. e reziduum. Hodnota, kterou získáme z regresní rovnice, není přesná. U každého člověka můžeme srovnat odhadovanou hodnotu a skutečnou hodnotu. Jejich rozdíl je reziduum. 9

10 Kdy můžu metodu použít Regresní analýza je parametrická metoda. Je proto zatížena několika podmínkami, z nichž nám bude většina zřejmě povědomých. 1) proměnná Y musí být metrická (pokud je alternativní, hledejte logistickou regresi) 2) proměnné X musí být metrické nebo alternativní (poprat se však dokážeme i s nominálními proměnnými) 3) proměnná Y musí mít normální rozdělení (pozn.: ve skutečnosti je důležitá normalita reziduí, nikoli proměnné Y, ale zůstaňme u tohoto zjednodušení). 4) vztahy mezi proměnnými jsou lineární (jiné vztahy metoda efektivně zkoumat neumí) 5) potřebujeme velký soubor. Hendl uvádí toto pravidlo, které se odvíjí od počtu prediktorů (k): a. nejméně *k jedinců k posouzení statistické významnosti celého modelu b. nejméně k jedinců k posouzení statistické významnosti jednotlivých prediktorů Nicméně jiní autoři uvádí jiná pravidla od 5*k po 40*k s ohledem na metodu vkládání prediktorů. S tím, že poměr 5*k je skutečně krajní hodnotou, kdy musí dokonale platit všechny podmínky. Obecně se dá řídit vzorcem 15*k. 6) rozptyl všech proměnných X musí být stejný pro jedince, co mají vysokou hodnotu proměnné Y i těch, co ji mají nízkou (tzv. homoskedasticita). Tedy rozptyl proměnné průměrná doba cvičení musí být zhruba stejný u lidí, co váží hodně, i u těch, co vážní málo. 7) prediktory nesmí být vysoce korelované (tzv. multikolinearita). Tedy korelace žádné z dvojic proměnných X by neměla překročit zdravou míru. Od hodnoty 0,8 bychom měli být na pozoru, hodnoty vyšší než 0,95 jsou nepřípustné. Vliv jednotlivých prediktorů pak nelze bezpečně odlišit. 8) v datech by neměly být přítomny odlehlé hodnoty (outliers). Na náš model totiž mají obrovský vliv, takže několik extrémních případů (např. tři špatně vyplněné dotazníky), můžou zcela změnit veškeré vztahy 10

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků) Základní výpočty pro MPPZ Teorie Aritmetický průměr = součet hodnot znaku zjištěných u všech jednotek souboru, dělený počtem všech jednotek souboru Modus = hodnota souboru s nejvyšší četností Medián =

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Cvičení ze statistiky - 3. Filip Děchtěrenko

Cvičení ze statistiky - 3. Filip Děchtěrenko Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

NEPARAMETRICKÉ TESTY

NEPARAMETRICKÉ TESTY NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky)

Více

Neparametrické metody

Neparametrické metody Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Návod na vypracování semestrálního projektu

Návod na vypracování semestrálního projektu Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Aplikovaná statistika v R - cvičení 3

Aplikovaná statistika v R - cvičení 3 Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

VÝBĚR A JEHO REPREZENTATIVNOST

VÝBĚR A JEHO REPREZENTATIVNOST VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:

Více

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava BIOSTATISTIKA VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot

Více

Stavový model a Kalmanův filtr

Stavový model a Kalmanův filtr Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více