STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

Rozměr: px
Začít zobrazení ze stránky:

Download "STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY"

Transkript

1 STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY Eva Reterová Olomouc 06

2 Fakulta zdravotnckých věd Unverzta Palackého v Olomouc Statstka pro nelékařské zdravotncké obory Eva Reterová Olomouc 06

3 Oponent: PhDr. Martn Šamaj, MBA doc. PhDr. Panajots Cakrpaloglu, Dr.Sc. Text neprošel jazykovou korekturou. Za obsahovou, jazykovou a stylstckou správnost odpovídá autor. Studjní text byl zpracován s podporou rozvojových projektů v rámc nsttuconálního plánu Unverzty Palackého v Olomouc, projektu FRUP_06_043 Inovace předmětů vědy a výzkumu, odborných ošetřovatelských předmětů a předmětů organzace a řízení ve studjním oboru Ošetřovatelská péče v nterních oborech, včetně přípravy výukových materálů. Neoprávněné užtí tohoto díla je porušením autorských práv a může zakládat občanskoprávní, správněprávní, popř. trestněprávní odpovědnost. Eva Reterová, 06 Unverzta Palackého v Olomouc, 06 ISBN (onlne: PDF) DOI: /fzv První vydání

4 Obsah Obsah...3 Úvod z hstore statstky...5 Základní matematcké pojmy a operace...6. Množna a její prvky...6. Základní operace se součty...7 Popsná statstka...9. Základní statstcké pojmy...9. Statstcké třídění....3 Druhy četností....4 Normální Gaussovo rozdělení Soubory dat Statstcké charakterstky a parametry základního souboru Střední hodnoty základního souboru Míry varablty základního souboru Výběrové soubory Druhy výběrů Výběrové střední hodnoty Výběrové míry varablty Porovnání varablty Kvantlové rozdělení Statstcká závslost korelace Druhy korelací Pearsonova korelace pro metrcká data Spearmanova pořadová korelace Závslost mez alternatvním znaky Testování statstckých hypotéz Základní pojmy Parametrcké testy Fsherův F-test Studentovy t-testy Jednovýběrový t-test Dvouvýběrový t-test pro homogenní soubory Dvouvýběrový t-test pro nehomogenní soubory Párový t-test Studentův t-test rozdílu dvou relatvních hodnot Studentův t-test pro sgnfkantnost korelačního koefcentu Procentový z-test Testy χ Test shody χ Test nezávslost χ pro čtyřpolní tabulku (kontngenční tabulku ) a Φ koefcent

5 5.3.3 Test nezávslost χ pro kontngenční tabulku větší než (obecně pro tabulku r k) a kontngenční koefcent C Neparametrcké testy McNemarův test Bowkerův test symetre Mann-Whtneyův U-test Medánový test Wlcoxonův pořadový test pro párované hodnoty Znaménkový test Analýza rozptylu Parametrcká analýza rozptylu Neparametrcká analýza rozptylu Fredmannova analýza rozptylu pro k závslé výběry Kruskal-Wallsova analýza rozptylu Velkost výběrového souboru Příklady k procvčení...9 Výtah ze statstckých tabulek Referenční seznam...03 Význam použtých kon Studjní cíle kaptoly Klíčová slova kaptoly Výklad prezentace učva Příklad Kontrolní otázky a úkoly Klíč k otázkám a úkolům Referenční seznam ke kaptole 4

6 Úvod z hstore statstky Slovo statstka je odvozeno z latnského slova status, z něhož vznklo talské slovo statsta, které bylo poprvé použto v 6. století. Označovalo člověka, který se zabýval státním záležtostm. Statstka tedy na počátku byla kvanttatvním systémem sloužícím k popsu státních záležtostí a říkalo se jí poltcká artmetka. Poprvé j použl v 7. století v Angl londýnský obchodník John Graunt a rský přírodovědec Wllam Petty. Na ně navázal skotský velkostatkář John Snclar, který sepsal Statstckou zprávu o Skotsku. V ní se zabýval statstkou socálních jevů a demografckým záležtostm. Ke konc 9. století se ze statstky stává plnohodnotný akademcký obor. Zabývá se shromažďováním, klasfkací, popsem a nterpretací dat získaných př socálních průzkumech, vědeckých expermentech a klnckých zkouškách. Využívají se ndvduální odlšnost ve skupně zachycením varablty pomocí varačního rozpětí, rozptylu a směrodatné odchylky. Začínají se používat statstcké testy významnost k testování hypotéz. Matematcká statstka má analytcký charakter a může sloužt ke statstckým předpovědím. V roce 85 bylo v Angl zahájeno první úplné sčítání ldu. Zaznamenával se věk, pohlaví, zaměstnání a místo narození, zjšťoval se počet ldí slepých a hluchých. Toto první sčítání ldu přneslo podrobné nformace o úmrtích na konkrétní nemoc a ukázalo špatné hygencké podmínky v přeldněných městech. Za hlavní problém Angle se začal považovat hygencký stav měst. Za pomocí statstckých údajů začaly v tomto období v Angl rozsáhlé santární reformy a díky jejch úspěchům vzrostlo povědomí o významu shromažďování statstckých dat. Dáma s lampou se říkalo brtské ošetřovatelce Florence Nghtngaleové, vášnvé statstčce. Její zásluhou se z ošetřování nemocných stalo uznávané a vážené povolání. Za pomoc statstckých výsledků se jí podařlo prosadt santární reformy a tím zlepšt poměry ve válečných nemocncích a snížt úmrtnost pacentů. Za Krymské války se stala vrchní nspektorkou zdravotních sester anglckých všeobecných vojenských nemocnc v Turecku. Úřední shromažďování velkého množství statstckých dat umožnlo brtským statstkům zacílt statstcký systém tak, aby měřl zdraví obyvatelstva. Díky tomu pak došlo k poltckým reformám a k přjetí zákonů o veřejné zdravotní péč. Statstcké metody v dnešním pojetí se původně vyvnuly pro výzkum v přírodních vědách. Ve stále větším rozsahu však vstupují do metodky zdravotnckých a lékařských věd. Od začátku 0. století se statstka dostává stále více do oblast medcíny, ekonome poltky a stává se součástí každodenního žvota. Statstcké nformace mají vlv na žvoty ldí, ovlvňují lékařské postupy a jná důležtá rozhodnutí. Znalost statstky se dnes vyžaduje od všech pracovníků v těchto vědeckých oborech, kteří se podílejí na výzkumu. Zdravotníc a lékař potřebují statstcké metody k vyhodnocování svých emprckých zkoumání. Jejch cílem je nduktvně ověřt oprávněnost formulovaných hypotéz. Statstka jm umožňuje nejen plánování, ale také hodnocení vědeckých výzkumů a poskytuje postupy pro kvaltatvní a kvanttatvní pops nálezů zkoumání. Každý student by měl mít alespoň základní přehled a znalost statstckých metod, které jsou obsaženy v této příručce. V první část je důležté zopakovat a osvojt s základní matematcké poučky a pojmy, se kterým se pak dále pracuje. Po této úvodní část začíná vlastní statstka, která je rozdělena na popsnou statstku a na statstku nduktvní, která v sobě zahrnuje testování statstckých hypotéz. Jsou zde obsaženy nejdůležtější statstcké testy, parametrcké neparametrcké, které student využjí př zpracovávání svých výzkumů. Na příkladech je ukázán praktcký postup použtí těchto testů a analýza dat v programu Mcrosoft Excel. Doufám, že studentům tato příručka pomůže k lepšímu pochopení statstckých metod a že j využjí př zpracovávání výsledků svých dplomových prací. 5

7 Základní matematcké pojmy a operace. Množna a její prvky Základní matematcké pojmy a operace Po prostudování této kaptoly by vám měly být jasné pojmy známé ze střední školy, které jsou důležté pro další studum tohoto textu. Vzhledem k tomu, že s uvedeným termíny se budete dále setkávat, je velm důležté, abyste s byl jst, že jm opravdu rozumíte. V případě, že máte pochybnost, vraťte se k nejasným pojmům a znovu je nastudujte. Studjní cíle Cílem této kaptoly je přpomenout a osvojt s vybrané matematcké pojmy, se kterým statstka pracuje a které se budou objevovat v dalším textu. Klíčová slova Množna, operace se součty. Množna a její prvky Na začátku je dobré osvěžt s základní matematcké pojmy a operace, se kterým se ve statstce pracuje a které se budou neustále opakovat. Vychází se z pojmu množna. Podle G. Cantora, zakladatele důležtého oboru současné matematky, teore množn, je množna souhrn objektů, které jsou přesně určené a rozlštelné, a tvoří součást světa našch představ a myšlenek. Ve statstce množnou rozumíme souhrn rovnocenných jednců (předmětů nebo událostí), u kterých je možné pozorovat jeden nebo více znaků. Tto jednc (předměty nebo událost) se nazývají prvky množny. Množny označujeme velkým písmeny latnské abecedy, prvky množny malým písmeny s ndexy. Například množna M se skládá z prvků x,x,...x n, matematcký záps pak vypadá takto: M = {x,x,...x n }. O prvku x množny M řekneme, že x patří do množny M a symbolcky zapíšeme x M, jestlže prvek y nepatří do množny M, píšeme y M. Množna Prvky množny Některé množny mají svá pevná označení: N...množna přrozených čísel R...množna reálných čísel C...množna komplexních čísel 6

8 Základní matematcké pojmy a operace. Základní operace se součty. Základní operace se součty V matematcké statstce pracujeme se vzorc, které obsahují součet hodnot znaku. Pro součet byl zaveden symbol Σ (suma). n = x = x + x , =,,..., n x n (Pokud nebude uvedeno jnak, pak zkrácený záps bude vždy znamenat součet n = x = x + x , =,,..., n ). x n Suma se ve statstce používá nejčastěj ve vzorc pro výpočet artmetckého průměru: n x = x = n (x + x +...+x x n ), x = n Suma součtu (rozdílu) x a y : n =, =,,..., n ). (x ± y ) = (x ± y ) + (x ± y ) +...+(x ± y ) +...+(x n ± y n ) = = (x + x x x n ) ± ± (y + y y y n ) = n = x ± y = n = Suma součnů c.x, kde c je konstanta, kterou lze vytknout před symbol Σ : n = c x = c x + c x c x c x = c ( x + x x xn ) = c n x = Specální případ nastává, sčítáme-l pouze konstanty n = c= c + c c= n c Součet součnů hodnot dvou proměnných velčn za předpokladu, že každá proměnná nabývá jného počtu různých hodnot: m = n j = x y = x y + x y n = x y +... j + x y n + x y + x y x y j x y n x y + x y x y j x y n x m y + x m y x m y j x m y n Sčítáme zde množny všech kombnací a j, jejchž počet je m n. j 7

9 Základní matematcké pojmy a operace. Základní operace se součty Příklad Vypočítejte hodnotu z pro zadané hodnoty x a y. 5 = 5 ( x + y ) x z = = = 5 x =,, 3, 4, 5 y =, 4, 3,, x y x y x + y x x y Σ z = 5 ( x + y ) = = 5 = x y 5 x = 6 55 = =,04 Kontrolní otázky a úkoly. Co je to množna a kdo je zakladatel teore množn?. Jak se pracuje se znakem Σ? 3. Rozepšte a vypočítejte výraz z pro hodnoty: x =, 3, 4 y = 4, 3, z = 3 = x + y Klíč k otázkám a úkolům Odpověd k otázkám. a. najdete v textu. 3 z = 7 Referenční seznam CYHELSKÝ, L., KAHOUNOVÁ, J., HINDLS, R., 00. Elementární statstcká analýza. Praha: Manegement Press. ISBN REITEROVÁ, Eva, 0. Základy statstky pro studenty psychologe. Olomouc: UP. ISBN

10 Popsná statstka. Základní statstcké pojmy Popsná statstka K řešení různých problémů, ať už z oblast zdravotnctví nebo z jných vědních oblastí, většnou používáme číselné údaje, které pak zpracováváme pomocí metod matematcké statstky. Abychom mohl tyto metody použít, musíme s nejprve objasnt některé základní statstcké pojmy. Studjní cíle Cílem popsné statstky je určtým způsobem popsat a vyjádřt výsledky zkoumání. Není vhodné an často možné jednotlvě zprostředkovat všechny naměřené hodnoty. Jde o to, aby se výsledky shrnuly do jasné a srozumtelné formy, která by vyjádřla podstatu věc. Klíčová slova Základní soubor, hromadný jev, kategore znaku, tabulka četností. Základní statstcké pojmy Statstka se zabývá studem stuací, které se mohou opakovat. Toto opakování je dáno buď tím, že exstuje reálná populace objektů daného typu (např. populace pacentů s určtým typem onemocnění) nebo populace opakování dané stuace hromadný jev. Hromadné jevy se v ldské společnost se vyskytují v mnoha ndvduálních případech a jsou rozmístěny ve velkém prostoru a čase. Říkáme, že tyto jevy mají velkou varabltu proměnlvost - to znamená různý stupeň určté vlastnost. Chceme-l posthnout všechny pravdelnost a zákontost jevů ve společnost, musíme provádět pozorování velkých skupn celé populace. Termín populace se používá ve statstce ve dvojím smyslu. V matematcké statstce znamená statstcký soubor a v demograf označuje obyvatelstvo. Statstcký soubor je soubor, který se skládá ze statstckých jednotek. Mohou to být rozmanté věc, jevy nebo procesy, podle toho, čím se statstka zabývá, a které vyhovují daným krtérím věcným, časovým nebo prostorovým. Volba vhodných statstckých jednotek je důležtou součástí př vědeckém výzkumu. Statstckým souborem může být například soubor obyvatel České republky k určtému datu nebo soubor osob, jejchž chování sledujeme, soubor studentů na vysoké škole atd.. Abychom získal nějaký statstcký soubor, musíme pro- Hromadné jevy Populace Statstcký soubor 9

11 Popsná statstka. Základní statstcké pojmy vést řadu přímých č nepřímých pozorování. To je organzováno například jako terénní průzkum na základě nějaké statstcké procedury. Základní soubor je soubor všech statstckých jednotek, který charakterzují určté znaky. Statstcké znaky jsou velčny, které vyjadřují úrovně nebo stavy vlastností a vztahy mez nm. Znaky, které měříme, můžeme rozdělt do několka skupn na znaky časové, prostorové a věcné. Mez věcným znaky rozlšujeme takové, které lze vyjádřt slovně. Takové znaky se nazývají kvaltatvní nebo nomnální znaky a ptáme se na ně otázkou jaký nebo jak. Jestlže mají kvaltatvní znaky dvě obměny, říká se jm alternatvní (např. muž žena, starý mladý). Jestlže věcné znaky vyjadřujeme čísly, pak mluvíme o znacích kvanttatvních a ptáme se na ně otázkou kolk. Kvanttatvní znaky mohou být buď spojté, nebo nespojté dskrétní. Spojté znaky nabývají lbovolných reálných hodnot a dskrétní znaky pouze zolovaných hodnot. Ke spojtým hodnotám znaku dospějeme většnou měřením a k dskrétním počítáním. Zvláštním kvanttatvním znaky jsou znaky ntervalové. Přechod mez kvaltatvním a kvanttatvním znaky tvoří znaky ordnální nebol pořadové. Tyto znaky jsou věcně znaky kvaltatvním, ale formálně mají podobu vlastnost znaků kvanttatvních. Kategore znaku je skupna všech možností, varant a stavů znaku. Znak, který je určen svou kategorí se nazývá kategorzovaný znak. Kategore mohou být charakterzovány názvem kategore (textem), číslcem, nebo různým symboly. Statstcký pops se provádí ve třech různých formách: v tabulkách, v grafckém znázornění, pomocí popsných statstckých charakterstk (průměr, rozptyl). Základní soubor Statstcké znaky Kvaltatvní znaky Kvanttatvní znaky Ordnální znaky Kategore znaku Statstcký pops Příklad Máme popsat rozdělení souboru 4 pacentů podle krevních skupn. Slovy bychom mohl říct: Většna pacentů má krevní skupnu 0. Nebo V tomto souboru má 9 pacentů krevní skupnu 0, 5 pacentů má skupnu A, 6 skupnu B a 4 skupnu AB. Přehledněj toto můžeme vyjádřt v tabulce nebo grafem. Grafcké znázornění je přehlednější a jasněj ukazuje, jak jsou krevní skupny v souboru rozdělené. 0

12 Popsná statstka. Statstcké třídění Sloupcový graf graf četností Tabulka četností krevní skupny četnost 0 9 A 5 B 6 AB 4. Statstcké třídění Tabulka četností bude nepřehledná, jestlže máme zpracovat velké množství údajů. V tomto případě se snažíme zmenšt počet údajů tím, že shrneme vždy dvě nebo více sousedních hodnot do jedné třídy nebo do jednoho třídního ntervalu. Takto se získá větší přehlednost a jednoduchost. Př skupnovém rozdělení četností volíme třídy, skupny nebo ntervaly, do nchž třídíme základní data. Třída je množna všech hodnot, které leží mez určeným hrancem třídního ntervalu. Hrance třídy (hrance ntervalu) tvoří nejnžší a nejvyšší hodnota v dané třídě. Šířka třídy (nterval nebo rozpětí třídy) je u dskrétní proměnné počet měřtelných hodnot zahrnutých do třídy. Vypočítá se jako rozdíl dvou po sobě následujících středů tříd a označuje se h, h > 0. U třídních ntervalů volíme hrance ntervalů a jejch délku. Dolní (horní) hrance ntervalu udává, kterou nejnžší (nejvyšší) hodnotu do ntervalu ještě zařazujeme. Délkou ntervalu označujeme kladný rozdíl dvou po sobě jdoucích dolních (dh), případně horních (hh) hranc ntervalů. Délka ntervalů má být pokud možno stejně velká a označuje se. Třídní ntervaly je nutno volt tak, aby každý prvek mohl být zařazen do jednoho třídního ntervalu. Př volbě šrokých třídních ntervalů dostaneme malý počet tříd. Čím menší je šířka třídních ntervalů, tím větší je jejch počet. Třída Hrance třídy Šířka třídy

13 Popsná statstka.3 Druhy četností Příklad Určete dolní a horní hranc ntervalu (30 34) v tabulce: Tabulka ntervalového rozdělení četností Pro nterval (30 34) je dh = 9,5; hh = 34,5; = 5. nterval četnost Druhy četností. Absolutní četnost f udává počet prvků se stejnou obměnou statstckého znaku nebo s hodnotam spadajícím do určté třídy nebo ntervalu. Součtem všech absolutních četností dostaneme celkovou četnost v souboru rozsah souboru n= f k + f +...f k = f =. Relatvní četnost (procento výskytu) n f udává poměr absolutní četnost a rozsahu souboru. Součet všech relatvních k f četností je roven jedné =. n = 3. Absolutní kumulatvní četnost vyjadřuje součet všech předcházejících absolutních četností. 4. Relatvní kumulatvní četnost vyjadřuje součet všech předcházejících relatvních četností. Nejjednodušším zpracováním neuspořádaných výsledků je jejch seřazení podle velkost a přřazení příslušné četnost v tabulce. Tabulka četností s relatvním a kumulatvním četnostm Absolutní četnost Relatvní četnost Absolutní kumulatvní četnost Relatvní kumulatvní četnost Krevní skupny Krevní skupny Absolutní četnost Kumulatvní četnost Relatvní četnost Kumulatvní rel. četnost , ,5000 A 5 4 0, ,3333 B 6 0 5, ,3333 AB 4 4 6, ,0000

14 Popsná statstka.3 Druhy četností Příklad Postup př vytvoření tabulky četností a sloupcového grafu (hstogramu) v Excelu:. Krevní skupny musíme nahradt čísly (0 =, A =, B = 3, AB = 4). Do datové tabulky přdáme sloupec kategore 3. Klkneme na Analýzu dat v záložce Data a vybereme Hstogram, zadáme Vstupní oblast, Hrance tříd, Výstupní oblast a zatrhneme Popsky, Pareto, Kumulatvní procentuální podíl a Vytvořt graf. Kategore Četnost Kumul. % Kategore Četnost Kumul. % 9 37,50% 9 37,50% 5 58,33% 3 6 6,50% ,33% 5 83,33% ,00% ,00% Další 0 00,00% Další 0 00,00% Hstogram 3

15 Popsná statstka.4 Normální Gaussovo rozdělení.4 Normální Gaussovo rozdělení Př vyhodnocování kvanttatvních znaků podle jejch rozložení se setkáváme př velkém počtu měření se zcela určtým druhem rozložení, které se dá snadno poznat ze svého grafckého znázornění. Jedná se o Normální Gaussovo rozložení spojté náhodné velčny. Takovýmto rozložením četností se řídí především bologcké jevy a jevy týkající se člověka. Projevy ldí jsou ovlvněny mnoha podmínkam, které jsou navzájem nezávslé a mohou se vyskytovat zcela náhodně. Rozložení takových znaků má pak tyto vlastnost:. je symetrcké to znamená, že pozorované hodnoty se rozkládají stejnoměrně vlevo a vpravo od střední hodnoty.. je různě strmé a šroké, ale vždy obdržíme stejný tvar rozdělení, jestlže měřítko na vodorovné ose změníme tak, aby standardní odchylka σ = a průměr µ = 0. Ke grafu Gaussovy křvky se dostaneme z hstogramu četností: Normální Gaussovo rozložení Gaussova křvka jedna standardní odchylka od průměru (µ = 0, σ = ) 4

16 Popsná statstka.4 Normální Gaussovo rozdělení Tímto způsobem je tedy možno převést normální rozdělení na standardzované normální rozdělení, které se označuje N(0,). Pro standardzac normální náhodné velčny X s parametry μ a σ na náhodnou velčnu Z, která má parametry 0 a se používá transformační rovnce tvaru z = x µ. σ Tato rovnce k jakékolv hodnotě x náhodné velčny X udává normovanou hodnotu z náhodné velčny Z. V grafu normálního rozdělení platí, že v ntervalu (μ σ, μ+σ) leží 68 % všech hodnot, v ntervalu (μ σ, μ+σ) leží 95,6 % všech naměřených hodnot a v ntervalu (μ 3σ, μ+3σ) leží 99,7 % všech naměřených hodnot. Má-l náhodná velčna X rozdělení N (μ,σ), pak jsou hodnoty její frekvenční funkce (hustoty pravděpodobnost) vyjádřeny rovncí ( x σ µ ) f ( x) = e, σ π kde π = 3,4 a e je základ přrozených logartmů. Dstrbuční funkce Φ(Z) normálního standardzovaného rozdělení N(0,) má tvar Φ( z x z) = e π dx, kde z leží v ntervalu (-, ). Kontrolní otázky a úkoly. Defnujte hromadný jev.. V jakých formách se provádí statstcký pops? 3. Co je to hstogram? 4. S jakým druhy četností popsná statstka pracuje? 5. Popšte Gaussovu křvku Klíč k otázkám a úkolům Odpověd najdete v textu. Referenční seznam KUNDEROVÁ, P Úvod do teore pravděpodobnost a matematcké statstky. Olomouc: UP. ISBN REITEROVÁ, E. 0. Základy statstky pro studenty psychologe. Olomouc: UP. ISBN ŠŤASTNÝ, Z Matematcké a statstcké výpočty v Mcrosoft Excelu.Brno: Computer Press. ISBN X. 5

17 3 Soubory dat 3. Statstcké charakterstky a parametry základního souboru 3 Soubory dat Sbíráme nformace data nejen o ldech a jejch vlastnostech, ale o jejch čnnostech, vztazích a jevech mez nm. Různým skupnám dat říkáme soubory dat. Máme například zjstt názory studentů na blokový systém studa. K tomu můžeme použít buď soubor všech studentů z celé unverzty nebo pouze část studentů, kterou vybereme podle předem stanoveného pravdla ze souboru studentů na celé unverztě. Z tohoto dílčího souboru pak můžeme s určtou spolehlvostí vyslovt závěry nejen pro tento dílčí soubor, ale pro soubor všech studentů na celé unverztě. Studjní cíle V této kaptole bude po statstcké stránce popsán základní soubor a soubor výběrový. Parametry základního souboru a výběrové charakterstky sloužící k popsu jsou zde podrobně popsány a je vysvětlen jak jejch ruční výpočet, tak postup výpočtu v programu Mcrosoft Excel. Klíčová slova Základní soubor, výběrový soubor, střední hodnoty, artmetcký průměr, medán, modus, míra varablty, rozptyl, směrodatná odchylka, porovnání varablty, kvantlové rozdělení, velkost výběru 3. Statstcké charakterstky a parametry základního souboru Obecně rozlšujeme dva typy souborů:. Základní soubor (populace) ZS je množna všech prvků, která je vymezena cílem výzkumu. Pro tento soubor vyslovujeme závěry z výzkumného šetření.. Výběrový soubor (výběr, vzorek) VS je množna jednotek, které byly ze základního souboru vybrány podle předem stanovených pravdel. Pro tento výběrový soubor máme k dspozc data, která reprezentují soubor základní. To znamená, že výsledky zjštěné pro výběrový soubor můžeme zobecnt na soubor základní. Základní soubor Výběrový soubor 6

18 3 Soubory dat 3. Statstcké charakterstky a parametry základního souboru 3.. Střední hodnoty základního souboru Pro pops rozložení naměřených údajů v základním souboru slouží charakterstky polohy. Patří k nm artmetcký průměr, medán a modus. Artmetcký průměr základního souboru se značí μ a vypočítá n se podle vzorce µ =, kde x je -tá naměřená hodnota x n = v základním souboru a n je rozsah základního souboru. Další charakterstkou polohy je medán, který se značí M e. Je to naměřená hodnota, která se nachází ve středu řady všech hodnot základního souboru srovnaných podle velkost. Př lchém počtu měření odpovídá medán skutečné prostřední hodnotě, př sudém počtu měření je medán průměr ze dvou prostředních členů řady. Jestlže například řada obsahuje 5 naměřených hodnot, medán je 6. naměřená hodnota. Jestlže má řada 00 hodnot, pak medán leží mez 50. a 5. naměřenou hodnotou. Příklad V řadě jedenáct naměřených hodnot 5, 7, 8, 9, 9, 30, 3, 3, 33, 34, 34 je medán 6. člen řady tj. M e = 30. V řadě dvanáct naměřených hodnot 5, 8, 8, 9, 30, 30, 3, 3, 3, 3, 34, 35 je medán průměr ze dvou pro středních hodnot M e = = = 30, 5. Na rozdíl od artmetckého průměru má použtí medánu jako charakterstky polohy výhodu v tom, že se nemusí se počítat ze všech hodnot. Je nezávslý na maxmální a mnmální hodnotě základního souboru. Modus M o je hodnota, která se v rozdělení četností vyskytuje nejčastěj. Pokud se v řadě hodnot budou stejně často vyskytovat hodnoty s maxmální četností vedle sebe, modem bude jejch průměr. Jestlže v řadě exstují dvě navzájem nesousedící hodnoty s maxmálním četnostm, pak se obě tyto hodnoty uvádí jako modus a rozdělení se nazývá bmodální (dvojvrcholové). Artmetcký průměr Medán Modus Příklad V řadě 5, 8, 8, 9, 30, 30, 3, 3, 3, 3, 34, 35 je M o = 3 V řadě 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 8 je M o = 5,5 (artmetcký průměr čísel 5 a 6). V řadě 3, 4, 4, 5, 5, 5, 5, 6, 6, 7, 8, 8, 8, 8, 9 je M o = 5, M o = 8. 7

19 3 Soubory dat 3. Statstcké charakterstky a parametry základního souboru 3.. Míry varablty základního souboru = Je třeba mít také míry pro ndvduální rozdíly tzv. odchylky od střední hodnoty. Jestlže známe artmetcký průměr, pak se dá vypočítat odchylka od střední hodnoty pro každou naměřenou hodnotu δ x µ. Nejhrubší mírou, která se používá u malých souborů, je rozdíl mez největší a nejmenší naměřenou hodnotou. Tomuto rozdílu se říká varační rozpětí a vypočítá se podle vzorce R = max x mn x. Varační rozpětí je však velm závslé na náhodných vlvech, protože používá pouze dvou extrémních hodnot. Proto byly odvozeny míry rozptylu, které se počítají ze všech hodnot. Nejlepší mírou pro stupeň varablty rozložení je směrodatná odchylka σ a její druhá mocnna σ, která se nazývá rozptyl nebol varance. Rozptyl se vypočítá jako průměr druhých mocnn odchylek všech naměřených ( ) x µ = hodnot od jejch artmetckého průměru σ =. n n Varační rozpětí Směrodatná odchylka Rozptyl Směrodatná odchylka je pak odmocnna z tohoto vzorce ( x µ ) = σ = σ =. n Čím je tato hodnota větší, tím více je rozložení rozptýleno dál od průměru a čím je menší, tím více se naměřené hodnoty hromadí kolem průměru. Nejlépe se dá směrodatná odchylka a rozptyl vysvětlt na příkladě střeleckého terče. Je-l na terč vypáleno několk výstřelů rozptýlí se kolem středu. Střílel-l dobrý střelec, jsou vzdálenost od středu skoro všechny malé mají malý rozptyl. Jestlže však střílel špatný střelec, zásahy jsou od středu vzdáleny více jejch rozptyl je velký. Příklad Máme dvě skupny čísel, která mají stejný průměr. Rozdíl mez těmto skupnam se vyjádří mírou rozptylu.. skupna (x): x = 7, x = 8, x 3 = 9; μ = 8; n = 3 n σ = 3 = ( x ) µ n (7 8) = + (8 8) 3 + (9 8) = ( ) = = 0,67 3 8

20 3 Soubory dat 3. Výběrové soubory. skupna (y): y =, y = 0, y 3 = 3; μ = 8; n = 3 3. Výběrové soubory Číselné údaje, které charakterzují celou populac nebo celý základní soubor jsou střední hodnota μ, směrodatná odchylka σ a rozptyl σ. Tyto údaje se nazývají parametry základního souboru. Ve většně případů nejsme schopn zachytt všechny jevy, které patří do základního souboru. Není to možné jednak teoretcky, ale také praktcky. Některá měření vedou ke znčení nebo znehodnocení měřeného předmětu. Rozsah základních souborů bývá hodně velký. Měření na všech prvcích velkého základního souboru jsou přílš nákladná ve srovnání s hodnotou a významem získaných výsledků. Někdy je nutné znát výsledky dříve, než lze všechna měření provést. To jsou hlavní důvody proč jsme v prax odkázán na zkoumání výběrů a zjšťování výběrových parametrů, ze kterých se pak dají odhadnout parametry základního souboru. Výběrový průměr x, výběrová směrodatná odchylka s a výběrový rozptyl s jsou výběrové charakterstky a slouží ke statstckému ověřování hypotéz vztahujících se na základní soubor. Rozsah výběru udává počet prvků obsažených ve výběrovém souboru. Parametry základního souboru Výběrové parametry Výběrový průměr Výběrová směrodatná odchylka Výběrový rozptyl Př provádění výběrů ze základního souboru se mohou vyskytnout dva druhy problémů:. jak musíme postupovat, abychom dostal výběr, který by byl reprezentatvní vůč celému základnímu souboru;. jak je velká spolehlvost a přesnost výsledků získaných z dobrého reprezentatvního výběru. Reprezentatvní výběr lze ovšem sestavt jen na základě podrobných znalostí celého základního souboru, které zpravdla nemáme. Proto se používá tzv. náhodných výběrů, jejchž sestavení je založeno na podmínce, aby každý prvek základního souboru měl stejnou pravděpodobnost, že bude do výběru za- Reprezentatvní výběr 9

21 3 Soubory dat 3. Výběrové soubory hrnut. Náhodné výběry můžeme vytvořt za použtí náhodných čísel, která s můžeme vygenerovat na počítač nebo vybrat v tabulce náhodných čísel. Pokud nemáme k dspozc an jeden z těchto způsobů očíslujeme s prvky základního souboru a pak losujeme. Proces, kdy ze základního souboru vybíráme vzorek (výběr), nazýváme výběrové statstcké zjšťování. Proces opačný, kdy výsledky zjštěné ve výběrovém souboru přenášíme na soubor základní, nazýváme statstcká ndukce. Informace o základním souboru získáváme tedy pomocí výběrů, a to metodam tzv. statstcké ndukce. Statstcká ndukce znamená rozšíření závěrů, získaných zpracováním určtého počtu výsledků, které tvoří statstcký soubor, na soubor základní. Statstcká ndukce 3.. Druhy výběrů. Náhodný výběr Př náhodném výběru jednotlvých prvků ze základního souboru může dojít ke třem alternatvám: prvky vybíráme po jednom a vybrané vracíme zpět do základního souboru. Tím je zaručeno, že počet prvků, ze kterých vybíráme se nemění. Každý prvek má stejnou pravděpodobnost vybrání. Tento výběr se označuje jako náhodný výběr s opakováním; před provedením výběru mají všechny prvky stejnou pravděpodobnost, že budou vybrány. Po vybrání určtého prvku se pravděpodobnost pro ostatní prvky zvětšuje. Tomuto výběru se říká náhodný výběr bez opakování; výběr s různým pravděpodobnostm tzv. pravděpodobnostní výběr je založen na tom, že každý prvek má určtou předem danou pravděpodobnost vybrání, tyto pravděpodobnost jsou mez jednotlvým prvky různé.. Skupnový výběr Předpokladem použtí tohoto výběru je to, že základní soubor je uspořádán do přrozených nebo umělých skupn. Skupny ekonomcké, územní, organzační jsou skupny přrozené, skupnam umělým jsou například abecední seznamy, seznamy podle data narození, podle bydlště atd.. Vybírají se zde celé skupny prvků bez zřetele k jejch velkost. Například z abecedního seznamu se vyberou všechna příjmení začínající na písmeno D. Pak všechny osoby, kterým začíná příjmení na D, se stanou prvky výběru. Pro ostatní znaky jako datum narození, bydlště, zaměstnavatel atd. bude tento výběr velm různorodý, protože se nepředpokládá, že by se tyto znaky vázaly ke jménu. Náhodný výběr Skupnový výběr 0

22 3 Soubory dat 3. Výběrové soubory 3. Mechancký výběr Prvky základního souboru musí být uspořádány podle určtého znaku a postupuje se tak, že se rozdělí do stejně velkých podskupn podle rozsahu výběru, losováním se vybere jedno z čísel od do hodnoty rozsahu podskupn a z každé podskupny se vybere prvek, který má toto pořadí. 4. Oblastní (stratfkační) výběr Základní soubor je rozdělen do skupn oblastí, které musí být svým obsahem co nejvíce různorodé. Z každé oblast se pak vybere určté procento prvků. Výběr je pak úměrný velkost oblast. 5. Vícestupňový výběr Vychází se ze skupn nejvyššího řádu a pokračuje se v několka stupních až k elementárním jednotkám. 6. Záměrný výběr Od jných výběrů se lší tím, že o vybrání prvku ze základního souboru do vzorku rozhoduje každý výzkumník sám. Tento výběr je pak subjektvně ovlvněn. Jestlže výběry provede několk ldí nezávsle na sobě, budou se lšt výběrovým charakterstkam. Přesnost odhadovaných parametrů základního souboru pak záleží na odborném úsudku každého výzkumníka. Exstují tř způsoby záměrného výběru: výběrové jednotky se dostávají do výběru samy (např. v anketách), záměrný výběr průměrných jednotek, výběr metodou kvót zvolí se kontrolní znaky, které se vyskytují u každého prvku základního souboru a podle nch se výběr orentuje. Mechancký výběr Oblastní (stratfkační) výběr Vícestupňový výběr Záměrný výběr 3.. Výběrové střední hodnoty Stejně jako u popsu středních hodnot základního souboru používáme k popsu výběrových středních hodnot výběrový artmetcký průměr x, výběrový medán ~ x a výběrový modus xˆ. Někdy je potřebné shrnout závěry z více výběrů s různým rozsahem, abychom mohl charakterzovat soubor všech výběrů jedním ukazatelem například váženým artmetckým průměrem, který označujeme xv a vypočítáme jej z artmetckých průměrů jednotlvých výběrů podle vzorce x x n + x n x n k k k = v = = k n + n nk = x n n, kde x, =,,... k je artmetcký průměr -tého výběru a n je rozsah -tého výběru. Výběrový artmetcký průměr Výběrový medán Výběrový modus Vážený artmetcký průměr

23 3 Soubory dat 3. Výběrové soubory Někdy je v prax tendence počítat prostý artmetcký průměr z naměřených hodnot v různě velkých výběrech. To však vede k nesprávným a zkresleným výsledkům. Jestlže chceme shrnout výběry různého rozsahu do jednoho artmetckého průměru, musíme použít vážený artmetcký průměr. Příklad Ve dvou skupnách pacentů se zjšťovalo, kolk dní v určtém časovém období stráví v nemocnc. V první skupně byl průměr na jednoho pacenta 0 dní a ve druhé skupně 40 dní. Chceme zjstt průměrný počet dní hosptalzace v obou skupnách dohromady. Nejdříve budeme předpokládat stejný počet pacentů v obou skupnách a pak různě velké skupny.. n = n = 0 Prostý vážený artmetcký průměr se bude shodovat:. n = 00, n = 0 Průměrný počet dní hosptalzace v obou skupnách je dní. Prostřední hodnota členů výběru uspořádaného podle velkost je medán x ~. Modus xˆ je hodnota, která se v rozdělení četností vyskytuje nejčastěj. Př charakterzování č popsování výběrů se dává přednost výběrovému artmetckému průměru ze dvou důvodů. Udává jednoznačnou hodnotu, která se dá lehce vypočítat a spolehlvě př dostatečném rozsahu výběru odhaduje střední hodnotu základního souboru. Artmetcký průměr by se neměl používat u vícevrcholových (polymodálních) rozdělení, př extrémně malých výběrech a asymetrckých rozděleních. V těchto případech se doporučuje použít jnou charakterstku polohy např. medán. Medán je vhodný: př výběrech s malým četnostm, př asymetrckém rozdělení. Modus je vhodný př popsu vícevrcholových rozdělení. Medán Modus Vícevrcholová (polymodální) rozdělení

24 3 Soubory dat 3. Výběrové soubory 3..3 Výběrové míry varablty Výběrové rozpětí R = max x mn x. Udává rozdíl mez největší a nejmenší naměřenou hodnotou. Je tedy určené extrémním hodnotam ve výběru. Lépe charakterzují varabltu míry, jejchž základ tvoří rozdíl každé naměřené hodnoty a průměru x x (odchylka od průměru). Součet všech těchto odchylek ve výběru je roven nule a proto se používá tzv. průměrná odchylka, která se vypočítá jako průměr z absolutních hodnot odchylek všech naměřených n hodnot od artmetckého průměru: e = x x. n Ve výběru rozděleném do tříd odchylky od průměru vynásobíme příslušným četnostm: e = f k x x, n = kde f je četnost -té naměřené hodnoty (nebo -tého středu třídy) v tabulce četností, x je artmetcký průměr, k je počet tříd. = Výběrové rozpětí Příklad Vypočítejte průměrnou odchylku z následující tabulky: x f x x x x f x x 3,3,3,3 4 3,3,3 3, ,3 0,3 0, ,87 0,87 6,09 Σ 5,3 Výběrový rozptyl (varance) je součet druhých mocnn odchylek všech naměřených hodnot od artmetckého průměru vydělený jejch počtem s ( x x ) = n. Výběrový rozptyl 3

25 3 Soubory dat 3. Výběrové soubory Výběrová směrodatná odchylka je odmocnna z výběrového rozptylu: s = s = ( x x) n. Výběrová směrová odchylka Z každého výběrového souboru můžeme vypočítat ( ) odhad rozptylu základního souboru ˆ x x σ = n a odhad směrodatné odchylky základního souboru ( x ) ˆ x σ = n K výpočtu výběrového rozptylu se dá podobně jako u rozptylu základního souboru použít vzorce, v němž se nemusí počítat odchylky od průměru: ( x ) x s = n n Vzorec pro odhad rozptylu základního souboru: ˆ σ = x ( x ) n n Příklad Vypočítejte odhad rozptylu a výběrové směrodatné odchylky základního souboru z výběrového souboru naměřených hodnot u dvacet pacentů. x = 08 ( x ) = x = N = 0 Pacent x Pacent x S 64 S 60 S 48 S 43 S3 55 S3 67 S4 68 S4 70 S5 7 S5 65 S6 59 S6 55 S7 57 S7 56 S8 6 S8 64 S9 63 S9 6 S0 60 S0 60 Σ 08 4

26 3 Soubory dat 3. Výběrové soubory Výpočet popsných statstk v programu Mcrosoft Excel na datech z předchozího příkladu: Data Analýza dat Popsná statstka Pozn.: Hodnota u popsu #ODKAZ! znamená Varační rozpětí (= Maxmum Mnmum) 5

27 3 Soubory dat 3. Výběrové soubory V případě, že jsou naměřené hodnoty rozdělené do tříd s daným četnostm, počítáme odhad rozptylu základního souboru k podle vzorce: ˆ σ = f ( x x), n = kde x jsou naměřené hodnoty, f jsou jejch četnost, x je artmetcký průměr naměřených hodnot a n je jejch počet. Výběrový rozptyl a výběrová směrodatná odchylka nejsou ovlvněny náhodným extrémním hodnotam ve výběru, počítají se ze všech hodnot, spolehlvě odhadují rozptyl základního souboru a používají se pro testování statstckých hypotéz. Vzorec pro odhad rozptylu ve tvaru σˆ = k n = f ( x x) se používá pro malé výběry s jž vypočítaným artmetckým průměrem x. Pak se údaje zapsují do následující tabulky: x f ( x x) ( x x) f ( x x) k = f = n k = f ( x x) Příklad Vypočítejte odhad rozptylu a odhad směrodatné odchylky z dat v tabulce: x f ( x x) ( x x) f ( x x) 3,3 4,54 4,54 4 3,3,8 3, ,3 0,0 0, ,87 0,76 5,3 Σ 5 3,78 s = s = = Pokud není nutné počítat artmetcký průměr, pak se pro odhad rozptylu používá vzorec ˆ σ = n k k f x f x n( n ) = = 6

28 3 Soubory dat 3. Výběrové soubory a údaje se zapsují do tabulky: x x f f x f x k = f = n k = f x k = f x Příklad x f x f f x Σ Porovnání varablty Jestlže chceme zjstt, zda je určtý znak v jednom výběru rozptýlenější než stejný znak ve druhém výběru, můžeme porovnat rozptyly a směrodatné odchylky těchto výběrů pouze v případě, že jsou výběry stejně velké a mají přblžně stejné průměry. Můžeme také porovnávat varační koefcenty, které vypočítáme u každého výběru zvlášť, pak výběry mohou mít různý rozsah a odlšný průměr. Proto byl zaveden s Pearsonův varační koefcent V = 00, který se udává v %, x s je směrodatná výběrová odchylka a x je výběrový artmetcký průměr. Pearsonův varační koefcent Příklad U sta pacentů se zjšťoval počet zásahů př expermentu na reakčním přístroj. Počet zásahů je mírou kvalty výkonu. V tabulce jsou průměrné počty zásahů a směrodatné odchylky z., 5. a 0. pokusu. Chceme zjstt, zda se mění varablta ndvduálních výkonů během expermentu. 7

29 3 Soubory dat 3.3 Kvantlové rozdělení Pořadí pokusu x (zásahy) s V. 3, ,3 5.,6 4,65 0,6 0. 4,5 3,9 5,9 Můžeme říct, že varablta v počtu zásahů př expermentech klesá. Stupně volnost číslo n ve vzorc pro odhad rozptylu k (σ ˆ = f ( x x) ) se nazývá počet stupňů volnost. n n= Pokud máme k dspozc právě jedno pozorování (n = ), pak toto pozorování (tato naměřená hodnota) bude výběrovým průměrem a poskytne nám určtou nformac o průměru celé populace. Pokud k této naměřené hodnotě nemáme žádnou charakterstku varablty výběru (rozptyl, směrodatnou odchylku, varační koefcent), nemáme an žádnou nformac o varabltě populace. Když změříme výšku jednoho šestletého dítěte, pak tuto naměřenou hodnotu můžeme použít jako odhad průměrné výšky všech šestletých dětí, ale nebudeme vědět, v jakých mezích se tato výška pohybuje (např. od 5 do 5 cm). Jedno pozorování k popsu výběrového souboru nestačí. Pouze v případě, že n >, je možné usuzovat na rozptýlenost výběru. Podmínkou tedy je, že pro výpočet varablty musíme mít n jednotek nformací (naměřených hodnot). Proto číslo n je děltelem pro rozptyl a nazývá se počet stupňů volnost. Stupně volnost 3.3 Kvantlové rozdělení Všechny výše uvedené střední hodnoty nám udávají obecnou velkost znaku, které nabývají prvky ve výběru. Můžeme ještě použít další charakterstky, které sce nejsou středním hodnotam, ale přesto udávají svým způsobem polohu rozdělení četností a používají se k uspořádání výběrů podle velkostí. Říká se jm kvantly a dělí se na kvartly, decly a percently. Kvantl x p (p-procentní kvantl) je hodnota znaku, pro kterou platí, že nejméně p procent prvků ve výběru má hodnotu menší nebo rovnu x p a 00 p procent prvků má hodnotu větší nebo rovnu x p. Používají se tyto kvantly: medán x 50, dolní kvartl x 5, horní kvartl x 75, decly x 0, x 0,..., x 90 a percently x, x,..., x 99. Kvantl Dolní kvartl 8

30 3 Soubory dat 3.3 Kvantlové rozdělení Z tohoto popsu je vdět, že kvartly jsou dva, declů je devět a percentlů devadesát devět, x 00 udává maxmální naměřenou hodnotu. Někdy se dává výrazům kvartl, decl a percentl poněkud odlšný obsah. Říká-l se, že se student umístl v horním kvartlu rozdělení, znamená to, že jeho kvalfkace (počet dosažených bodů) jej zařazuje mez 5 % posluchačů s nejlepším výsledkem testu. Podobně jako medán dělí výběrový soubor na dvě polovny, dolní a horní kvartl rozdělují výběrový soubor na čtyř stejně velké část. Dolnímu kvartlu se říká 5% kvantl a značí se Q, hornímu kvartlu 75% kvantl a značí se Q. Ve výběru, kde nejsou naměřené hodnoty uspořádány do tříd, ale pouze podle velkost, příslušný kvantl získáme jako pořadí k-té hodnoty, vypočítané ze vztahu k = p u / 00, kde p je počet pozorování a u je úroveň kvantlu. Kvartl Decl Percentl Poznámka 95% kvantl standardzovaného normálního rozdělení N(0,) je z 95 =,69; 5% kvantl rozdělení N(0,) je z 5 =,69 (plyne ze symetre normálního rozdělení). Příklad Mějme dána následující čísla,,,, 5, 4, 4,, 3,,,. Pro určení kvantlů uspořádáme hodnoty podle velkost:,,,,,,,, 3, 4, 4, 5. Pořadí příslušného kvantlu pak vypočítáme podle výše uvedeného vzorce a zaokrouhlíme na celé číslo. Dolní kvartl je roven třetí hodnotě, protože 5/00 = 3 a je tedy. Horní kvartl je roven deváté hodnotě, protože 75/00 = 9 a je tedy 3. První decl je roven první hodnotě, protože 0/00 = a je tedy. Kvartlová odchylka Q = Q Q (mezkvartlový nterval) je nterval ohrančený horním a dolním kvartlem. V této oblast leží 50 % všech naměřených hodnot. Čím je kvartlová odchylka větší, tím jsou hodnoty více rozptýlené. Kvartlová odchylka 9

31 3 Soubory dat 3.3 Kvantlové rozdělení Výpočet percentlů v programu Mcrosoft Excel Data Analýza dat Pořadová statstka a percently 30

32 3 Soubory dat 3.3 Kvantlové rozdělení Kontrolní otázky a úkoly. Charakterzujte základní a výběrový soubor. Defnujte střední hodnoty základního a výběrového souboru 3. Jaké znáte míry varablty? 4. K čemu slouží Pearsonův varační koefcent? 5. Které kvantly se používají nejčastěj? Klíč k otázkám a úkolům Odpověd na otázky naleznete v textu Referenční seznam HANOUSEK, J., CHARAMZA, P. 99. Moderní metody zpracování dat. Praha: Grada. ISBN PROCHÁZKA, B. 05. Stručná bostatstka pro lékaře. Praha: Karolnum. ISBN

33 4 Statstcká závslost korelace 4. Druhy korelací 4 Statstcká závslost korelace Z přírodních věd známe závslost, kdy určté hodnotě jedné velčny odpovídá přesně daná hodnota druhé velčny, a to pro každou její hodnotu. To je případ tzv. funkční závslost, neboť vztah mez oběma velčnam se dá popsat matematckou funkcí. V prax se však setkáváme se závslostm, kde podobná jednoznačnost mez velčnam neexstuje, ale hodnotám nezávsle proměnné odpovídají hodnoty závsle proměnné. Například proměnná X je tělesná výška dětí stejného věku (v cm) a proměnná Y je hmotnost těchto dětí (v kg). Je třeba zjstt souvslost mez tělesnou výškou a hmotností měřených dětí. V tomto případě hovoříme o statstcké závslost a říkáme, že mez velčnam exstuje korelace. Podle toho, jakého typu jsou proměnné X a Y se rozhoduje, jaký druh statstckého výpočtu korelace se může použít. Funkční závslost Studjní cíle Cílem této kaptoly je seznámt studenty s výpočty korelačních koefcentů bez s pomocí programu Excel. Jsou zde uvedeny nejpoužívanější korelační koefcenty Pearsonův koefcent pro metrcká data, Spearmanův pořadový koefcent, korelace pro čtyřpolní tabulku a pro vícepolní kontngenční tabulku. Klíčová slova Pearsonova korelace, Spearmannova pořadová korelace, Φ koefcent, C koefcent kontngence 4. Druhy korelací V analýze závslostí mez dvěma proměnným se můžeme setkat s různým druhy korelací. Buď zjšťujeme závslost mez dvěma naměřeným (metrckým) proměnným, pak k výpočtu korelace použjeme Pearsonův korelační koefcent. Pokud pracujeme s pořadovým hodnotam, nebo př malém počtu měření převádíme metrcké proměnné na pořadové, pak k výpočtu korelace je vhodný Spearmanův pořadový korelační koefcent. Pro prác s četnostm u dvou alternatvních proměnných použjeme čtyřpolní koefcent korelace Φ a u kategorálních proměnných koefcent kontngence C pro vícepolní kontngenční tabulku. Pearsonův korelační koefcent Spearmanův pořadový korelační koefcent Čtyřpolní koefcent korelace Koefcent kontngence 3

34 4 Statstcká závslost korelace 4. Druhy korelací Dvojce korelovaných metrckých proměnných lze pokládat za souřadnce bodů v rovně a náhodný výběr se pak znázorňuje tzv. tečkovým dagramem. Na tomto grafckém znázornění lze pak zhruba poznat, o jaký typ statstcké závslost se jedná.. Lneární korelace (přímka se nazývá regresní přímka) Lneární korelace. Nelneární korelace (přímka se nazývá regresní křvka) Nelneární korelace 3. Případ statstcké nezávslost Statstcká nezávslost V analýze závslost mez dvěma nebo více proměnným jde o dvě základní úlohy: stanovt charakter a průběh regresní čáry to řeší regresní analýza, určt těsnost zjštěného vztahu a posoudt jeho statstckou významnost to řeší korelační analýza. Regresní analýza Korelační analýza Aby bylo možno použít koefcent korelace, musí být splněny dva základní předpoklady musí se jednat o lneární regres 33

35 4 Statstcká závslost korelace 4. Druhy korelací a základní soubor musí mít dvojrozměrné normální rozložení četností. Údaje pro dvojrozměrné rozdělení můžeme získat tak, že zjšťujeme na stejném prvku ve výběru dva znaky, a tak získáme dvě proměnné X a Y. Naměřené dvojce hodnot se zapsují do tabulky: Proměnná X Proměnná Y Prvky výběru (pokusné osoby) Proměnná X Proměnná Y A x y B x y C x3 y3 Mez dvěma proměnným mohou exstovat tyto souvslost:. Shoda velkým hodnotám X odpovídají velké hodnoty Y, malé hodnoty X se vyskytují společně s malým hodnotam Y. V tomto případě hovoříme o kladné korelac souvslost mez oběma proměnným.. Protklad velkým hodnotám X odpovídají malé hodnoty Y a obráceně. Exstuje zde záporná korelace mez proměnným X a Y. 3. Nezávslost hodnoty X a Y sobě navzájem neodpovídají. V tomto případě neexstuje mez proměnným žádná souvslost a říkáme, že proměnné spolu nekorelují. Shoda Protklad Nezávslost 4.. Pearsonova korelace pro metrcká data Korelac pro metrcká data používáme k určení, zda rozdíly v naměřených hodnotách dvou proměnných jsou ve vzájemném vztahu, zda korelují. Toto rozhodnutí je možné pomocí korelačního koefcentu, který se obvykle značí r. Korelační koefcent určuje stupeň vztahu mez dvěma proměnným a je vyjadřován hodnotou mez 0 a ( ). Žádný vztah znamená 0, úplná poztvní závslost je označena, úplná negatvní závslost. S růstem hodnoty r od 0 k ( ) se míra vztahu zvětšuje. Absolutní hodnota korelačního koefcentu nám udává míru vztahu. Jestlže máme pro obě proměnné X a Y k dspozc metrcké údaje, můžeme popsat stupeň jejch závslost pomocí Pearsonova korelačního koefcentu. Označuje se r a nabývá hodnot v ntervalu,+. Je-l r =, pak to znamená, že mez oběma proměnným je výrazně protkladný vztah negatvní korelace. Je-l r = +, pak mez proměnným exstuje poztvní lneární souvslost. Po- Pearsonův korelační koefcent 34

36 4 Statstcká závslost korelace 4. Druhy korelací kud obě proměnné nejsou v žádné souvslost, jsou rozptýlené nezávsle na sobě, korelační koefcent r = 0. Z velkost r se dá zjstt těsnost zkoumaného vztahu. Exstuje několk různých vzorců pro výpočet Pearsonova korelačního koefcentu. Matematcky jsou s rovnocenné a dají se odvozovat jeden od druhého.., kde se nazývá kovarance, s x a s y jsou výběrové směrodatné odchylky proměnných X a Y.., kde x a y jsou hodnoty proměnných X a Y, n je počet naměřených dvojc X a Y. U tohoto vzorce není nutné počítat průměry X a Y a jejch směrodatné odchylky. Používá se pro malé n a nízké naměřené hodnoty. 3. Př velkém počtu měření používáme rozdělení do tříd s udaným četnostm. Vzorec pro výpočet korelačního koefcentu pak vypadá takto:, kde f x a f y jsou četnost naměřených hodnot a x a y je četnost s jakou vystupuje -tá naměřená hodnota X s -tou hodnotou Y. Příklad U pět pacentů se měřl čas potřebný k jejch ošetření v prvním (X) a posledním (Y) dn hosptalzace. Chceme zjstt korelac naměřených časů v těchto dnech. Naměřené hodnoty a pomocné výpočty jsou v tabulce: Pacent X Y x x ( ) x x y y ( y y) A B C D E Σ x y x y 35

37 4 Statstcká závslost korelace 4. Druhy korelací. Použjeme vzorec, kde. Použjeme vzorec, který používá přímo naměřené hodnoty. Výpočet Pearsonova korelačního koefcentu v programu Excel Data Analýza dat Korelace zadat vstupní a výstupní oblast Ok 36

38 4 Statstcká závslost korelace 4. Druhy korelací Výsledná tabulka Váha (kg) Výška (cm) Váha (kg) Výška (cm) 0,77858 Poznámka Jedná se o Pearsonovu korelac, jný druh korelace Excel nepočítá. 4.. Spearmanova pořadová korelace Pořadová korelace je vhodná v případech, kdy můžeme pracovat s uspořádaným hodnotam. Jestlže je potřeba počítat korelac z metrcké proměnné X a ordnální proměnné Y, musí se vytvořt pořadí z naměřených metrckých hodnot a toto pořadí pak porovnávat s proměnnou Y. Stupeň souvslost mez oběma pořadím určuje Spearmanův koefcent pořadové korelace. Označuje se R a nabývá hodnot z ntervalu,+. 6 d Tento koefcent se vypočítá podle vzorce R =, n( n ) Spearmanův koefcent kde d je dference dvojce pořadí (rozdíl naměřených hodnot x a y ) a n je počet pořadí. Příklad Máme zjstt, zda exstuje souvslost mez klnckým stavem pacenta (X pořadí jeho stavu) a hodnotou sedmentace červených krvnek seřazenou do pořadí (Y). Hodnocení je v tabulce: x y d = x y d Σ 40 Z výsledku je zřejmý vyšší stupeň závslost mez klnckým stavem pacentů a pořadím sedmentace. 37

39 4 Statstcká závslost korelace 4. Druhy korelací 4..3 Závslost mez alternatvním znaky Alternatvní (dchotomcká) proměnná je taková proměnná, která může nabývat pouze dvou hodnot odpověd ano/ne, dobrý/špatný, muž/žena atd. Závslost mez dvěma alternatvním proměnným se počítá pomocí čtyřpolního koefcentu korelace z kontngenční tabulky (čtyřpolní tabulka). V jednotlvých polích tabulky jsou dány četnost alternatvních znaků: Alternatvní (dchotomcká) proměnná Znak II + Znak I + a b a + b c d c + d a + c b + d a + b + c + d + přítomnost znaku u sledované osoby nepřítomnost znaku u sledované osoby Čtyřpolní koefcent korelace se značí Φ (Φ,+ ) a vypočítá se podle vzorce, Čtyřpolní koefcent korelace kde a, b, c, d jsou četnost v jednotlvých polích tabulky. Příklad Šedesát pacentů (3 mužů a 9 žen) bylo podrobeno preventvní prohlídce. Podle hodnoty BMI byl pacent rozdělen na pacenty s normální váhou a s nadváhou. Exstuje souvslost mez pohlavím a nadváhou? Příslušné četnost jsou v tabulce. muž ženy normální váha nadváha a = 4 b = 7 a + b = 3 c = 0 d = 9 c + d = 9 a + c = 4 b + d = 36 a + b + c + d = 60 Koefcent souvslost mez pohlavím a nadváhou je 0,. Jelkož je koefcent malá hodnota, můžeme říct, že mez pohlavím a nadváhou v našem vzorku souvslost neexstuje. Pozn. Sgnfkantnost koefcentu se určuje pomocí testu χ pro čtyřpolní tabulku (vz kap. 6. ) Čtyřpolní tabulka v Excelu Vložení Kontngenční tabulka zadat oblast dat a výstupní oblast Celý postup vz Test nezávslost χ pro čtyřpolní tabulku. 38

40 4 Statstcká závslost korelace 4. Druhy korelací Kontrolní otázky a úkoly. Pro jaký typ proměnných používáme Pearsonův a Spearmanův korelační koefcent?. Který druh korelace je vhodný k výpočtu závslostí mez alternatvním proměnným? Klíč k otázkám a úkolům Odpověd na otázky najdete v textu. Referenční seznam CHRÁSKA, M Metody pedagogckého výzkumu. Základy kvanttatvního výzkumu. Praha: Grada. ISBN MELOUN, M., MILITKÝ, J Statstcká analýza expermentálních dat. Praha: Academa. ISBN REITEROVÁ, E. 0. Základy statstky pro studenty psychologe. Olomouc: UP. ISBN

41 5 Testování statstckých hypotéz 5. Základní pojmy 5 Testování statstckých hypotéz Popsná statstka charakterzuje výběry pomocí kvanttatvních charakterstk (středních hodnot, rozptylu, korelačních koefcentů, atd.). Testovací statstka určuje, zda se tyto ukazatele odlšují reálně nebo náhodně. O skutečný rozdíl se jedná tehdy, jestlže se charakterstky dvou nebo více výběrů natolk lší, že vedou k odhadu různých parametrů. Rozdíl mez výběrovým ukazatel je náhodný, jestlže je slučtelný s předpokladem, že příslušné výběry jsou z jednoho a toho samého základního souboru. Jestlže provedeme určtý výzkum a zjstíme charakterstky jednoho nebo více výběrů, pak pomocí těchto charakterstk zjšťujeme, zda výběry pocházejí ze stejného základního souboru nebo z různých základních souborů. Ptáme se, zda základní soubor má normální (Gaussovo) rozdělení četností nebo, zda je možné považovat sledovaný základní soubor za náhodně uspořádaný. Na tyto otázky odpovídáme pomocí statstckých testů. Testují se účnky nových léků, úspěšnost léčby pacentů, hledají se souvslost mez dávkou léku a velkostí odezvy, zjšťuje se, která ze dvou nebo více léčebných metod je nejúčnnější. Studjní cíle Cílem této kaptoly je seznámt studenty s postupem, který se používá př testování statstckých hypotéz a tento postup pak aplkovat na parametrcké a neparametrcké statstcké testy. Student by měl být schopn ze zadání poznat, jaký statstcký test na svá data použít. Klíčová slova Hypotéza, statstcká hypotéza, parametrcký test, neparametrcký test, analýza rozptylu, Studentovy t-testy, X testy 5. Základní pojmy Hypotéza je tvrzení nebo předpoklad, jímž se v rámc dané teore vyjádří určtá představa. Oprávněnost hypotéz prověřují pozorování a expermenty. Exstují velké hypotézy o vznku sluneční soustavy a celého vesmíru, o exstenc mmozemských cvlzací, ale také hypotézy, které tvrdí, že lék nebo terape má větší účnnost než jný lék nebo jná terapeutcká metoda. Hypotéza 40

42 5 Testování statstckých hypotéz 5. Základní pojmy Statstcká hypotéza je tvrzení o statstckých objektech, a protože předmětem zájmu ve statstce jsou soubory a zejména rozdělení četností znaků sledovaných v těchto souborech, bývá statstcká hypotéza tvrzením o těchto rozděleních. Statstckou hypotézou tedy rozumíme jakýkolv výrok nebo tvrzení o typu rozdělení jedné nebo více náhodných velčn. Statstcká hypotéza je vyjádřena smysluplnou oznamovací větou, o jejíž míře pravdvost můžeme usuzovat ze zjštěných hodnot. Úlohou teore testování statstckých hypotéz je vytváření vhodných metod, pomocí nchž je možné rozhodnout, zda je daná hypotéza pravdvá nebo ne. Jednou z forem hodnocení číselných dat je testování statstckých hypotéz na základě teore vypracované matematky Neumannem a Pearsonem. Pokud chceme formulovat statstckou hypotézu, musíme mít o zkoumané populac určté základní nformace. Například předpokládáme, že daná populace má normální rozdělení četností. V takovém případě se statstcká hypotéza vztahuje pouze na hodnoty dvou parametrů normálního rozdělení střední hodnoty (průměru µ) a standardní odchylky (σ). V jných případech víme o základním souboru populac jen to, že má spojté rozdělení. Statstcká hypotéza Mez některé základní typy statstckých hypotéz patří tato tvrzení:. zkoumaný výběr pochází z populace, která má určté teoretcké rozdělení;. dva zkoumané výběry pocházejí ze stejného základního souboru; 3. exstuje lneární závslost mez dvěma nebo více náhodným velčnam; 4. jedna nezávsle proměnná ovlvňuje sledovanou závsle proměnnou více než druhá. Pokud chceme zjstt, zda je daná hypotéza správná, je třeba vytvořt pravdlo, pomocí kterého, na základě výběrového souboru, získaného z populace, rozhodneme, zda hypotéza může být přjata nebo zda je třeba j zamítnout. Jným slovy, je třeba vytvořt pravdlo, které by každému výběrovému souboru přřazovalo jedno ze dvou možných rozhodnutí: hypotézu buď přjmout, nebo zamítnout. Toto pravdlo se nazývá statstckým testem. Statstcký test pro každý výběrový bod určí, máme-l testovanou hypotézu zamítnout nebo nkolv. To znamená, že bude jednoznačně určena jstá hodnota, která výběrový prostor (množnu možných rozhodnutí) rozdělí na dvě dsjunktní část, které nazýváme krtcký obor (ozn. W) nebo též obor zamítnutí a doplněk krtckého oboru (W ), kterému se také někdy říká obor přjetí. Hodnota (bod, mez), která rozděluje výběrový prostor na tyto dvě část, se nazývá krtcká hodnota. Statstcký test 4

43 5 Testování statstckých hypotéz 5. Základní pojmy Důležtým pojmem je tzv. nulová hypotéza (označuje se H 0 ). Nulovou hypotézu formulujeme na začátku každého testu tak, že například tvrdíme: srovnávané parametry, které odhadujeme z výběrových charakterstk jsou stejné; nebo výběrové hodnoty patří k populac o jstém rozdělení. Symbolcky zapsujeme nulové hypotézy takto:. H 0 : µ = µ 0 Populační průměr se rovná počátečnímu populačnímu průměru.. H 0 : µ = µ Průměrná hodnota populace, z níž byl pořízen první výběr je rovna průměrné hodnotě populace, z níž byl pořízen druhý výběr. 3. H 0 : H 0 : µ = µ =... = µ k = µ k Populační průměry z k populací jsou s rovny Nulová hypotéza Př testování statstckých hypotéz se předpokládá, že může platt buď nulová hypotéza H 0, nebo k ní alternatvní hypotéza H. Například k hypotéze H 0 : µ = µ 0 exstuje alternatvní hypotéza H : µ µ 0 tzv. dvoustranná hypotéza nebo dvě alternatvní jednostranné hypotézy H : µ > µ 0, H : µ < µ 0. Sestrojt test, který by ověřl správnost hypotézy H 0 pak znamená najít prncp, jak rozdělt výběrový prostor tj. množnu všech v úvahu přcházejících výběrů na dvě dsjunktní, navzájem se nepřekrývající podmnožny tak, aby jedna z nch zahrnula ty výběry, které lze očekávat za platnost hypotézy H, a druhá, aby naopak zahrnovala ty výběry, jejchž výskyt lze očekávat spíše za platnost hypotézy H 0. První podmnožna se nazývá krtcký obor a druhá doplněk krtckého oboru. Krtcký obor může být podle typu alternatvní hypotézy jednostranný nebo dvoustranný. Statstcký test je pak prováděn podle rozhodovacího pravdla: padne-l výběr, který dostaneme jako výsledek konkrétního pokusu do krtckého oboru, zamítá se nulová hypotéza H 0 jako nesprávná a jako správná se přjímá alternatva H ; padne-l výběr mmo krtcký obor, přjme se hypotéza H 0 jako správná. Toto rozhodovací pravdlo přřazuje každému expermentálnímu výsledku (tj. každému výběru) jedno ze dvou možných rozhodnutí. Stuace, které mohou nastat shrnuje následující tabulka: Skutečnost H 0 je správná + H 0 je nesprávná H 0 je správná + Test odhaduje skutečnost správně + H 0 je nesprávná Rozhodnutí (test) Test odhaduje skutečnost nesprávně (chyba. druhu β) Test odhaduje skutečnost nesprávně (chyba. druhu α) Test odhaduje skutečnost správně + 4

44 5 Testování statstckých hypotéz 5. Základní pojmy Ze čtyř možných stuací jsou dvě žádoucí a dvě nežádoucí. Pravděpodobnost chyb. a. druhu se nazývají rzka chyb a značí se α a β. Požadujeme, aby pravděpodobnost výskytu obou nežádoucích stuací byla mnmální. Chyba. druhu α znamená pravděpodobnost zamítnutí správné hypotézy H 0. Nazývá se hladna významnost zvoleného testu. Chyba. druhu β znamená pravděpodobnost přjetí nesprávné hypotézy neplatné H 0. Hladna významnost Hodnotě β říkáme síla nebo mohutnost testu a je to pravděpodobnost s jakou rozpoznáme nepravdvou hypotézu H 0. Snížení chyby jednoho druhu má za následek zvýšení chyby druhého druhu. Snížení hodnot chyb. a. druhu dosáhneme jedně zvětšením rozsahu výběru. Protože se však většnou změna rozsahu výběru nedá uskutečnt, volí se chyba. druhu α pevně podle povahy daného expermentu buď α = 0,05 nebo α = 0,0. Rzko chyb α a β musí být v rovnováze s rozsahem výběru.. Podle toho, jak se dosahuje této rovnováhy, lze rozlšovat dvě třídy testů testy s pevným rozsahem výběru a testy sekvenční. U testů s pevným rozsahem výběru se tento rozsah stanoví předem, před provedením pokusu spolu s rzkem chyb α a β. Druhou třídou testů jsou testy sekvenční, kdy se předepíše rzko chyby α a β a pokus se provádí tak dlouho, až se dospěje k rozhodnutí o oprávněnost č neplatnost nulové hypotézy. Rzko chyby α se nazývá hladna významnost (sgnfkance) testu. Celá testovací statstka je postavena na této myšlence: Hypotézu odmítneme pouze tehdy, jestlže výběry dávají výsledky, které jsou př platnost výchozí hypotézy nepravděpodobné. Př rozhodování o platnost hypotézy s můžeme stanovt různě přísná krtéra. Pokud stačí, že v průměru 5 ze sta případů bude úsudek nesprávný, tak se rozhodneme pro pravděpodobnost chyby α = 0,05 = 5 %. Pro zbylých 95 % případů bude výsledek statstcky významný (sgnfkantní). Jestlže krtérum ještě zpřísníme a budeme požadovat, aby pouze pro jeden ze sta případů byl úsudek nesprávný, pak se rozhodneme pro pravděpodobnost chyby α = 0,0 = % a výsledek bude statstcky významný pro 99 % případů. Jestlže statstcký test zamítne nulovou hypotézu H 0 jako nesprávnou, označí se výsledek jako statstcky významný (sgnfkantní), v opačném případě jako statstcky nevýznamný (nesgnfkantní). V tabulce je udána výrazová symbolka pro hladny významnost α = 0,05; 0,0 a 0,00. 43

45 5 Testování statstckých hypotéz 5. Parametrcké testy Pravděpod. chyby > 0,05 0,05 0,0 0,00 Slovní vyjádření nesgnfkantní sgnfkantní vysoce sgnfkantní velm vysoce sgnfkantní Písmenová symbolka n.s. s. v.s. v.v.s Grafcká symbolka * **. *** Postup používaný př testování nulových hypotéz:. Formulace nulové a příslušné alternatvní hypotézy.. Volba odpovídajícího testového krtéra (F-test, t-test). 3. Volba hladny významnost α (0,0 nebo 0,05). 4. Určení počtu stupňů volnost v. 5. Výpočet hodnoty testového krtéra (podle vzorce). 6. Nalezení krtcké (tabulkové) hodnoty k dané hladně významnost a k danému počtu stupňů volnost. 7. Porovnání hodnoty vypočítaného testového krtéra s krtckou hodnotou. 8. Rozhodnutí o zamítnutí č přjetí nulové hypotézy na základě tohoto porovnání. Příklad Výzkumný úkol: Zjstt rozdíl mez muž a ženam v kvaltě jejch žvota pomocí dotazníku WHOQOL-BREF, který se skládá ze čtyř domén: PR prostředí, SV socální vztahy, P prožívání, F fyzcké zdraví. Domény Muž průměr Ženy průměr t p významnost PR 4, 6,7 3,8 < 0,05 sgn SV 5,6 4,9,56 > 0,05 nsg P 5, 7,4,89 < 0,05 sgn F 6,7 5,8,94 > 0,05 nsg Pro formulac hypotéz jsou dvě možnost: a) Zformulovat jednu hypotézu pro celý dotazník H 0 : Mez muž a ženam v dotazníku kvalty žvota není sgnfkantní rozdíl. H A : Mez muž a ženam v dotazníku kvalty žvota je sgnfkantní rozdíl. Závěr V doménách PR a P byl zjštěn sgnfkantní rozdíl mez muž a ženam. Pro tyto domény H 0 zamítáme (H A přjímáme). Pro domény SV a F H 0 přjímáme (H A zamítáme). 44

46 5 Testování statstckých hypotéz b) Rozložt na čtyř samostatné hypotézy H 0 : V doméně PR není mez muž a ženam sgnfkantní rozdíl. H A : V doméně PR je mez muž a ženam sgnfkantní rozdíl. H 0 : V doméně SV není mez muž a ženam sgnfkantní rozdíl. H A : V doméně SV je mez muž a ženam sgnfkantní rozdíl. H 03 : V doméně P není mez muž a ženam sgnfkantní rozdíl. H A3 : V doméně P je mez muž a ženam sgnfkantní rozdíl. H 04 : V doméně F není mez muž a ženam sgnfkantní rozdíl. H A4 : V doméně F je mez muž a ženam sgnfkantní rozdíl. Závěr V doménách PR a P byl zjštěn sgnfkantní rozdíl mez muž a ženam zamítáme H 0 a H 03 (Přjímáme H A a H A3 ). 5. Parametrcké testy Parametrcký test vyžaduje určté podmínky, týkající se parametrů populace, ze které je pořízen výběr. Zpravdla se jedná o populac s normálním rozložením četností zkoumaného znaku. Grafem rozložení četností musí být Gaussova křvka normálního rozložení. V prax se často setkáváme s problémem ověření určtého předpokladu. Chceme se například přesvědčt, zda zkoumaný výběr pochází z daného základního souboru, nebo zda dva náhodné výběry pocházejí ze stejného nebo z různých základních souborů, nebo zda je možné považovat studovaný soubor za náhodně uspořádaný atd. Na tyto otázky odpovídáme pomocí parametrckých testů významnost. Je to skupna testů, ve které se ověřuje významnost rozdílu mez dvěma velčnam. Př testování záleží na volbě hladny významnost (podle přesnost jaké chceme v testu dosáhnout se volí α = 0,05 nebo 0,0), na formulac nulové hypotézy H 0 a na volbě vhodného testového krtéra (F-test, t-test). 5.. Fsherův F-test Tento parametrcký test významnost testuje hypotézy o populačním rozptylu. Umožňuje určt jak sgnfkantní je rozdíl mez dvěma rozptyly. Například, když máme zjstt, zda jsou dvě skupny osob homogenní nebo heterogenní př expermentálním zásahu. To znamená, že máme určt, zda pokusné osoby reagují na stejný zákrok velm podobně nebo hodně rozdílně. Homogenní soubor má malou varabltu (soubor je stejnorodý), v heterogenním souboru (nestejnorodém) jsou naměřená data značně rozptýlena. Je zde velká varablta těchto dat. Homogenní soubor Heterogenní soubor 45

47 5 Testování statstckých hypotéz 5. Parametrcké testy V souborech expermentálně naměřených hodnot je varablta způsobována dvěma zdroj:. přrozenou rozdílností objektů v populac (bologckou varabltou),. chybam měření, které způsobují, že př opakovaném měření jakékolv velčny na stejném objektu můžeme dostávat rozdílné hodnoty. Buď můžeme porovnávat přrozenou varabltu ve dvou populacích např. vyrovnanost sportovního výkonu u sedm a devítletých dětí nebo homogennost reakce na daný podnět u mužů a žen nebo porovnáváme varabltu způsobenou dvěma různým expermentálním zásahy. Například se porovnávají dvě vyšetření u stejných pacentů. Zjšťuje se pak varablta dat př opakovaném měření na stejném subjektu. Měla by být mnmální. Tento problém lze pak formulovat jako statstcký test hypotézy o rovnost dvou rozptylů, který testuje nulovou hypotézu H 0 : σ = σ. Musí se však předpokládat, že měřená velčna má normální Gaussovo rozdělení. Mějme dva výběry s rozsahy n a n a charakterstkam x, s a x, s, které byly odebrány ze dvou základních souborů s parametry µ, σ a µ, σ. U Fsherova F-testu se srovnávají dva rozptyly. K výpočtu testového krtéra F potřebujeme odhady rozptylů ZS a to odhad σ = S a odhad σ = S. ˆ S Hodnota F se pak vypočítá jako poměr F = S, přčemž do čtatele vkládáme větší z obou odhadů rozptylů, abychom pro velčnu F získal hodnotu F. Ke zjštění tabulkové hodnoty F na dané hladně významnost potřebujeme znát počty stupňů volnost v a v. V tomto případě je v = n a v = n. Ve statstckých tabulkách najdeme krtckou hodnotu F α ( ν, ν ), se kterou porovnáme vypočítané F. Je-l F F α ( ν, ν ), zamítáme nulovou hypotézu a můžeme tvrdt, že mez rozpyly obou výběrů je sgnfkantní rozdíl. Postup př testování:. Předpokládáme, že platí nulová hypotéza H 0 : σ = σ o rovnost rozptylů.. Zvolíme s hladnu významnost α (buď 0,05, nebo 0,0). S 3. Vypočítané testové krtérum F = porovnáme s krtckou S hodnotou F α (ν,ν ), kterou najdeme ve statstckých tabulkách. Pozor musí platt S > S. ˆ Testové krtérum 46

48 5 Testování statstckých hypotéz 5. Parametrcké testy 4. Jestlže zjstíme, že vypočítaná hodnota F < F α (ν,ν ), nastává případ, který jsme očekával a nulovou hypotézu o rovnost rozptylů nezamítáme. 6. Pokud F F α (ν,ν ) nebo P < 0,05 (v Excelu), zamítáme nulovou hypotézu a tvrdíme, že rozdíl mez rozptyly je statstcky významný na hladně významnost α, a tedy můžeme přjmout alternatvní hypotézu H 0 : σ σ. Příklad Posuďte, zda výběry pocházejí ze stejné populace. Odhady výběrových rozptylů jsou S = 64, S = 5 př počtech pozorování n = 30 v prvním výběru a n = 0 ve druhém výběru. Tabulková hodnota F α na hladně významnost α = 0,05 je pro stupně volnost ν = 9 a ν = 9 rovna Jelkož F > F α, zamítá se nulová hypotéza o rovnost rozptylů a můžeme říct, že mez rozptyly je statstcky významný rozdíl.. Fsherův F-test v programu Excel Data Analýza dat Dvouvýběrový F-test pro rozptyl 47

49 5 Testování statstckých hypotéz 5. Parametrcké testy Do vstupní oblast se zadává každý výběrový soubor zvlášť. Pokud chceme mít ve výsledcích pops sledovaných výběrů, zatrhneme Popsky. U F-testu se musí dávat pozor na pořadí zadávání souborů. Jako první musí být zadán soubor s větším rozptylem. 48

50 5 Testování statstckých hypotéz 5. Parametrcké testy Ve výsledcích se objeví artmetcký průměr, rozptyl, počet pozorování, rozdíl zde znamená počet stupňů volnost, Fsherovo F, P je pravděpodobnost, kterou srovnáváme s hladnou významnost α. Pokud P < 0,05, pak je potvrzen sgnfkantní rozdíl mez rozptyly sledovaných výběrových souborů. Sgnfkantní rozdíl můžeme také zjstt porovnáním F a F krt (). Je-l F > F krt (), pak je potvrzen sgnfkantní rozdíl mez rozptyly sledovaných výběrových souborů. 5.. Studentovy t-testy Studentovy t-testy jsou testy významnost rozdílu dvou průměrů. Podobně jako lze hodnott rozdíl mez dvěma rozptyly F-testem, můžeme testovat významnost rozdílu jných dvou velčn, například průměrů. Pomocí Studentova t-testu se nejčastěj řeší úloha, která se nazývá experment, to znamená, že všchn pacent, se kterým se pracuje, jsou zcela rovnocenní a lší se pouze náhodně. Například má být porovnán účnek dvou expermentálních zásahů, srovnává se účnek dvou různých léků nebo terapí, porovnává se efektvnost dvou různých léčebných programů, obtížnost dvou úkolů, výkonnost v nějaké sportovní dscplíně atd. Důležtým rysem, společným pro tyto stuace je, že přřazení vlastního expermentálního zásahu pokusnému objektu je provedeno náhodně. Podle typu alternatvní hypotézy můžeme t-testy dělt na jednostranné a dvoustranné. U dvoustranného testu se předpokládá, že nulovou hypotézu zamítáme, je-l odchylka od ní nepravděpodobně velká na jednu č druhou stranu. Alternatvní hypotéza se pak dá rozložt na dvě jednostranné hypotézy. Testy, o kterých zde bude řeč, se používají u dvou výběrů a jsou s dost podobné. Je proto nutné mez nm pečlvě volt. Záleží na počtu dat Studentovo rozdělení je vhodnější pro výběry o menším rozsahu, jnak se používá rozdělení Gaussovo. Záleží také na tom, zda se rozptyly výběrů statstcky významně lší nebo nkolv (zda jsou data heterogenní nebo homogenní), zda jsou naměřené hodnoty spárovány a také na tom, zda jsou nebo nejsou navzájem korelovány (zda se jedná o závslé nebo nezávslé výběry). Př testu významnost rozdílu dvou průměrů je nulovou hypotézou rovnost průměrů. Podle porovnávaných parametrů rozlšujeme pak tyto typy t-testů:. t-test rozdílu výběrového průměru a známého průměru základního souboru;. t-test pro srovnání rozdílu dvou středních hodnot: a) t-test pro rozdíl dvou výběrových průměrů, jestlže F-testem ověříme, že σ = σ ; Studentův t-test 49

51 5 Testování statstckých hypotéz 5. Parametrcké testy b) t-test pro rozdíl dvou výběrových průměrů, jestlže F-testem ověříme, že σ σ ; 3. párový t-test; 4. test rozdílu dvou relatvních hodnot Jednovýběrový t-test Tento test ověřuje, zda platí nulová hypotéza H 0 : x = µ. V prax se setkáváme s případy, kdy známe určtou konstantní hodnotu, kterou můžeme považovat za průměr základního souboru µ. Této hodnotě se říká referenční konstanta. Jestlže provedeme výběr ze základního souboru a vypočítáme výběrový průměr x, pak se ptáme, zda je nebo není statstcky významný (sgnfkantní) rozdíl mez výběrovým průměrem a průměrem základního souboru. Nulová hypotéza nám tvrdí, že průměr základního souboru a výběrový průměr se shodují (H 0 : x = µ ). Testovým krtérem je velčna př ν = n stupních volnost. t = x µ. s n Referenční konstanta Vypočítané t pak porovnáváme s krtckou hodnotou t α (ν). Je- l t > t α (ν) nebo P < 0,05 (v Excelu) zamítáme nulovou hypotézu a můžeme říct, že výběrový průměr se na zvolené hladně významnost statstcky významně lší od známé hodnoty průměru základního souboru. V opačném případě se nám potvrdí nulová hypotéza o rovnost výběrového průměru a průměru základního souboru. Předpokládá se, že základní soubor má normální rozdělení četností. Příklad Zjstěte, zda výběr dvacet pacentů, u nchž byly naměřeny hodnoty dané v tabulce, pochází ze základního souboru s průměrem µ = 58.. Zvolíme hladnu významnost α = 0,05. Výběrová směrodatná odchylka s = 7, výběrový průměr Pacent x Pacent x S 64 S 60 S 48 S 43 S3 55 S3 67 S4 68 S4 70 S5 7 S5 65 S6 59 S6 55 S7 57 S7 56 S8 6 S8 64 S9 63 S9 6 S0 60 S0 60 Σ 08 50

52 5 Testování statstckých hypotéz 5. Parametrcké testy 3. Ověříme, zda je sgnfkantní rozdíl mez výběrovým průměrem a průměrem ZS pomocí testového krtéra 4. Tabulková hodnota t α (ν) je. 5. Porovnáme vypočítanou hodnotu t s tabulkovou hodnotou t α (ν): t =,53 < t α (ν) =,093 pak nezamítáme nulovou hypotézu H0: a můžeme říct, že není statstcky významný rozdíl mez výběrovým průměrem a průměrem ZS. Zjstl jsme, že soubor dvacet subjektů je vybrán ze základního souboru s průměrem µ = Dvouvýběrový t-test pro homogenní soubory Budeme předpokládat, že platí nulová hypotéza, která říká, že rozdíly mez průměry dvou výběrů jsou způsobeny pouze náhodou: H 0 : x = x a že rozptyly obou základních souborů, ze kterých pocházejí výběry jsou stejné (musí se potvrdt F-testem). Oba výběry tedy budou pocházet z jedného základního souboru s průměrem µ a rozptylem σ. Za tohoto předpokladu budeme očekávat, že př častějším opakování pokusu se dvěma lbovolným výběry bude jednou průměr jedné skupny větší než průměr skupny druhé a obráceně. Protože poztvní a negatvní rozdíly jsou stejně pravděpodobné, měl by průměr rozdílů mez vždy dvěma výběrovým průměry být roven nule. Skutečně se zjstlo, že rozdíly x x, x x3, x x3,... mez průměry dvou náhodných výběrů z jednoho ZS mají normální rozložení s očekávaným průměrem µ d ( d = x x...dference) nebol µ d = µ x = 0 x. Chybový rozptyl rozdílu průměrů je roven př nezávslých výběrech součtu rozptylů obou výběrových průměrů: σ σ σ d = σ x x = σ x + σ x = + n n σ x stejně vel- Mají-l oba výběry stejný rozsah, pak jsou ké a vzorec se zjednoduší na tvar: σ = σ = σ x a Výběrová chyba rozdílu průměrů př výběrech o různém rozsahu d x σ n je pak σ σ σ = σ +. d x x = σ x + σ x = n n 5

53 5 Testování statstckých hypotéz 5. Parametrcké testy Výběrová chyba rozdílu průměrů př výběrech o stejném rozsahu je V konkrétním případě však nkdy neznáme rozptyl ZS, ale pouze dva jeho odhady rozptyly obou výběrů: s ˆ = = n σ ( x x ) a s = ˆ = n σ ( x x ) j Použjeme-l jako nejlepšího odhadu pro σ váženého artmetckého průměru z těchto obou rozptylů, dostaneme odhad ( ) ( ) x x + x j x σ =. Tuto hodnotu dosadíme n + n σ σ do vzorce σ d = + a dostaneme konečný vzorec pro n n výběrovou chybu rozdílů průměrů dvou výběrů jednoho souboru: σ d = x ( x ) ( x ) j + x j n n + n σ σ d =. n n. + n n (Pro ulehčení výpočtu se odchylky od průměru počítají přímo z naměřených hodnot:. ;.) V jednotkách Studentova t-rozložení bude X ( x x ) µ d t µ = =, jelkož µ d = µ x = 0 x, σ σ d pak bude mít testové krtérum Studentova t-testu pro dva nezávslé výběry tvar x x t = ( x ) ( ) x j x + x j n n + n + n n n Toto testové krtérum se používá v případě, že se F-testem prokáže rovnost rozptylů základních souborů. Vypočítanou hodnotu t dále porovnáme s tabulkovou hodnotou t α (ν) na hladně významnost α = 0,05 nebo α = 0,0 a př počtu stupňů volnost v = n + n. Je-l t < t α (ν) přjímáme nulovou hypotézu H 0 : x = x a můžeme říct, že mez výběrovým průměry není statstcky významný rozdíl. 5

54 5 Testování statstckých hypotéz 5. Parametrcké testy Je-l t > t α (ν), zamítáme H 0 a tvrdíme, že platí alternatvní hypotéza H : x x. V tomto případě je mez výběrovým průměry x, x statstcky významný (sgnfkantní) rozdíl. Příklad Máme zjstt, zda je statstcky významný rozdíl mez výsledky vyšetření mužů a žen. Muž skór-x x Ženy skór-x j x j M 5 5 F M F 484 M F M F M F M F M F M F M F M F M F F Σ F-testem prokážeme rovnost rozptylů ZS. Vypočítáme odhady rozptylů ZS: F = S S = 685,5 =, ,6 Jelkož F < F α (ν, ν ), přjímá se nulová hypotéza o rovnost rozptylů ZS. 53

55 5 Testování statstckých hypotéz 5. Parametrcké testy. Vypočítáme výběrové průměry a doplníme sumy v tabulce., n =, n = Dosadíme do vzorce pro výpočet testového krtéra t Studentova t-testu: Tuto vypočítanou hodnotu porovnáme s tabulkovou hodnotou t α (ν), ν =. Pro α = 0,05 je t 0,05 () =,08. Jelkož je t =,8 < t 0,05 () =,08 můžeme říct, že není statstcky významný rozdíl mez průměry skórů skupn mužů a žen Dvouvýběrový t-test pro nehomogenní soubory Je-l splněn požadavek, aby základní soubory měly alespoň přblžně normální rozdělení, a zjstí-l se F-testem, že mez rozptyly je statstcky významný rozdíl, používá se pro testování významnost rozdílu průměrů př nulové hypotéze H 0 : x = x testovacího krtéra x x t =. s s + n n Tuto hodnotu opět porovnáváme s krtckou hodnotou, která se pro tento případ označí t α * a musí se vypočítat podle vzorce s s t α + tα n n =, s s + n n kde t, α značí krtckou hodnotu t rozdělení pro ν = n stupňů volnost a t,, α krtckou hodnotu pro ν = n. Obě hodnoty se vyhledají ve statstckých tabulkách. Postup př testování významnost rozdílu průměrů, jestlže σ σ : a) zvolíme hladnu významnost α; b) z obou výběrů vypočítáme charakterstky x, s, x, s ; c) F-testem prokážeme, že zamítáme nulovou hypotézu H 0 : σ = σ, to znamená, že přjímáme alternatvní hypotézu H : σ σ ; t * α 54

56 5 Testování statstckých hypotéz 5. Parametrcké testy d) vypočítáme hodnotu testovacího krtéra t; e) ve statstckých tabulkách vyhledáme hodnoty t, α a t,, α pro ν = n a ν = n pro stupňů volnost; f) vypočítáme krtckou hodnotu t α* ; g) nulovou hypotézu H : x = x 0 zamítáme, když t > t α* ; v tom případě tvrdíme, že rozdíl průměrů dvou výběrů je statstcky významný na hladně významnost α. Studentovy t-testy v Excelu Před Studentovým t-testem nejprve ověříme rozptyly sledovaných výběrů. Data Analýza dat Dvouvýběrový F-test pro rozptyl Na základě výsledku F-testu určíme typ Studentova t-testu, v našem případě není sgnfkantní rozdíl mez rozptyly vybereme Dvouvýběrový t-test s rovností rozptylů. Zadávání dat je podobné jako u F-testu. Do pole pro hypotetcký rozdíl středních hodnot se vždy zadává nula. 55

57 5 Testování statstckých hypotéz 5. Parametrcké testy Ve výsledcích je kromě artmetckého průměru, rozptylů obou souborů a počtu pozorování uveden tzv. rozdíl, který ve skutečnost znamená počet stupňů volnost. Vypočítanou hodnotu Studentova t t-stat v absolutní hodnotě porovnáme s hodnotou t krt (), která představuje tabulkovou krtckou hodntu. Je-l t stat t krt (), pak přjímáme nulovou hypotézu a můžeme říct, že není sgnfkantní rozdíl v průměrech sledovaných 56

58 5 Testování statstckých hypotéz 5. Parametrcké testy souborů. Zda je nebo není statstcky významný rozdíl mez průměry poznáme také podle velkost pravděpodobnost P (T t) (), kterou porovnáme s hladnou významnost α = 0,05. Je-l P (T t) () > 0,05, pak výsledek není sgnfkantní není sgnfkantní rozdíl v průměrech sledovaných souborů. V případě, že F-test potvrdí sgnfkantní rozdíl mez rozptyly sledovaných souborů, použjeme Dvouvýběrový t-test s nerovností rozptylů Párový t-test Tento t-test se používá př testování hypotézy o tom, zda př měření nějaké velčny na subjektech nebo objektech došlo ke změně. Jedná se tedy o měření, která provádíme na jednom subjektu nebo objektu dvakrát, obvykle na začátku a na konc určtého procesu, nebo v případě, že každý prvek jednoho výběru tvoří pár s jedním zcela určtým prvkem výběru druhého. V těchto případech se bere místo dvou výběrů po n prvcích n párů měření. Protože párová měření jsou na sobě závslá, mluví se také o dvou závslých výběrech. U nch nemá význam počítat průměr hodnot jednoho výběru před sledovaným procesem a srovnávat jej s průměrem hodnot druhého výběru po tomto procesu, ale je nutno stanovt rozdíly naměřených hodnot v každém páru x x a s nm dále pracovat jako s náhodnou velčnou. Tyto rozdíly se značí d a nazývají se dference. Ptáme se pak, zda je průměrná hodnota vypočítaných rozdílů statstcky významně odlšná od nuly. Nulová hypotéza tedy zní: Průměr rozdílu naměřených hodnot ve dvou výběrech je nula. (H 0 : d = 0 ). Předpokládejme, že jsme ze dvou normálně rozdělených základních souborů s parametry µ, σ a µ, σ odebral po jednou výběru. Rozsahy obou výběrů jsou stejné (n = n = n ) a jejch prvky tvoří páry. Nulová hypotéza je v tomto případě H 0 : d = 0 (ekvv. H : x 0 = x ). Tuto hypotézu pak testujeme pomocí testového krtéra d. n _ n t =, kde d = n a s d je směrodatná odchylka pro rozdíly naměřených hodnot. Vypočítanou hodnotu t pak porovnáváme s krtckou hodnotou t α (ν), kterou pro zvolenou hladnu významnost α a počet stupňů volnost ν = n najdeme ve statstckých tabulkách. Je-l t < t α (ν), pak přjímáme nulovou hypotézu H 0 : d = 0. _ s d d = Párová měření Dference 57

59 5 Testování statstckých hypotéz 5. Parametrcké testy V opačném případě H 0 zamítáme a můžeme říct, že je mez výběrovým průměry statstcky významný rozdíl. Postup:. Zvolíme hladnu významnost α.. Vypočítáme rozdíly d mez naměřeným párovým hodnotam. Vypočítáme průměr d a směrodatnou odchylku s d těchto rozdílů. 3. Vypočítáme hodnotu testového krtéra t a stanovíme počet stupňů volnost ν. 4. Ve statstckých tabulkách vyhledáme pro dané νa zvolené α krtckou hodnotu t α (ν). 5. Na základě porovnání vypočítané hodnoty t a krtcké hodnoty t α nebo hodnoty P s hladnou významnost 0,05 (v Excelu) ne/zamítneme nulovou hypotézu H 0. Příklad Zjstěte, zda redukční deta způsobla sgnfkantní úbytek váhy u deset pacentů. Údaje o hmotnost na začátku dety a na jejím konc jsou v tabulce. Pacent Začátek dety Konec dety d d A B C D E F G H 7 7 I J Σ 38 8 _ n α = 0,05, d = d = 3, 8 n s d = ( ) d d = n n t = 5,7 > t α (ν) = t 0,0 (9) = 3,4 58

60 5 Testování statstckých hypotéz 5. Parametrcké testy Na základě porovnání t a t α zamítáme nulovou hypotézu a můžeme tvrdt, že deta způsobla sgnfkantní úbytek váhy. Párový t-test v Excelu Data Analýza dat Dvouvýběrový párový t-test na střední hodnotu. Zadávání dat a nterpretace výsledků je podobná jako u předcházejícího testu Studentův t-test rozdílu dvou relatvních hodnot V prax se často řeší otázka, zda se určtý jev vyskytuje v jednom výběru častěj než ve druhém. Údaje bývají uváděny formou relatvních hodnot. Ptáme se tedy, zda je ve výskytu nějakého jevu ve dvou výběrech statstcky významný rozdíl. Nejdříve stanovíme relatvní četnost výskytu sledovaného jevu v prvním m výběru f =, kde m n je počet případů, u nchž se zkoumaný jev vyskytl a n je počet všech sledovaných případů v prvním m výběru. Podobně stanovíme hodnotu f =, kde m n je počet případů, u nchž se zkoumaný jev vyskytl a n je počet všech sledovaných případů ve druhém výběru. V tomto případě testujeme nulovou hypotézu o tom, že oba výběry pocházejí ze stejného základního souboru. Neznámou hodnotu relatvního výskytu sledovaného jevu v základním souboru nahrazujeme jejím odhadem z četností obou výběrů podle vztahu ˆ m + m f =. n + n Nulovou hypotézu H 0 : f = f ověřujeme pomocí testového krtéra f f t =. fˆ( fˆ) + n n Tomuto testovému krtéru přísluší př dostatečně velkých n a n (větších než 30) normální rozdělení četností s nulovým průměrem a jednotkovou směrodatnou odchylkou. Testové krtérum tedy můžeme porovnat s krtckým hodnotam z α =,96 (pro α = 0,05) a z α =,58 ( pro α = 0,0). Jestlže t > z α, zamítneme nulovou hypotézu a tvrdíme, že se výskyt sledovaného jevu ve dvou výběrech statstcky významně lší na zvolené hladně významnost, tedy jným slovy, že oba výběry nepocházejí z téhož základního souboru. 59

61 5 Testování statstckých hypotéz 5. Parametrcké testy Příklad Byla řešena otázka, zda se určté onemocnění vyskytuje častěj u mužů než u žen. Po příslušném vyšetření bylo nalezeno 5 onemocnění u 54 mužů a 0 onemocnění u 47 žen z předem vybrané lokalty. Prokažte, zda je vyšší relatvní četnost onemocnění u mužů prot ženám statstcky významná.. α = 0,05. ; Jelkož t = 0,04 < z α =,96 pro α = 0,05, můžeme říct, že ve výskytu sledovaného onemocnění není statstcky významný rozdíl mez muž a ženam Studentův t-test pro sgnfkantnost korelačního koefcentu Statstckou významnost korelačního koefcentu je možno ověřovat Studentovým t-testem podle vzorce kde r je ověřovaný korelační koefcent, n je počet párových měření. Vypočítanou hodnotu t porovnáváme s tabulkovou hodnotou t α (ν), kde ν = n je počet stupňů volnost. Pokud Studentovo t přesahuje tabulkovou hodnotu na hladně významnost α = 0,05 nebo α = 0,0, je korelační koefcent sgnfkantní. Statstckou významnost korelace lze také vyhledat přímo ve statstckých tabulkách, kde pro počet párových měření n a hladnu významnost α nalezneme nejnžší hodnotu, které by měl korelační koefcent dosáhnout, aby byl sgnfkantní (vz Tabulka krtckých hodnot korelačního koefcentu) Procentový z-test Používá se pro zjštění statstcké významnost rozdílu mez procenty výskytu sledovaného jevu u dvou výběrových souborů. 60

62 5 Testování statstckých hypotéz 5. Parametrcké testy P procento výskytu sledovaného jevu v prvním výběru P procento výskytu sledovaného jevu ve druhém výběru n rozsah prvního výběru n rozsah druhého výběru Q = 00 P Q = 00 P Vypočítaná hodnota z se porovnává se standardzovanou hodnotou z α : z 0,05 =,96 z 0,0 =,58 z 0,00 = 3,9 Je-l z z α, pak je sgnfkantní rozdíl mez procenty sledovaného jevu ve dvou výběrech. Příklad Ve dvou nemocncích se sledovalo procento výskytu určté nemoc. V první nemocnc z celkového počtu 300 pacentů onemocnělo 5 %, ve druhé z celkového počtu 00 pacentů onemocnělo 35 %. Zjstěte, zda je sgnfkantní rozdíl v procentech výskytu onemocnění mez nemocncem. P = 5 % P = 35 % n = 300 (00 %) n = 00 (00 %) Q = 00 P = 00 5 = 85 Q = 00 P = = 65 Vypočítaná hodnota z se porovnává se standardzovanou hodnotou z 0,00 = 3,9; z z 0,00 Exstuje velm vysoce sgnfkantní rozdíl mez procenty sledovaného jevu ve sledovaných výběrech. 6

63 5 Testování statstckých hypotéz 5.3 Test shody χ Kontrolní otázky a úkoly. Defnujte pojem hypotéza a statstcká hypotéza. Jaký je rozdíl mez parametrckým a neparametrckým testy? 3. Které parametry testují Studentovy t-testy? Klíč k otázkám a úkolům Odpověd na otázky najdete v textu Referenční seznam HENDL, J Přehled statstckých metod zpracování dat. Praha: Portál. ISBN WALKER, I. 03. Výzkumné metody a statstka. Praha: Grada. ISBN ZVÁROVÁ, J. 00. Základy statstky pro bomedcínské obory. Praha: Karolnum. ISBN Testy χ Testy χ patří do samostatné skupny testů, které tvoří přechod mez parametrckým a neparametrckým metodam. Používají se př testování významnost rozdílu mez četnostm v kategorálních datech Test shody χ Test shody χ řeší otázku shody rozdělení. Tímto testem se ověřuje nulová hypotéza o tom, že emprcká pozorování jsou v souladu s předpoklady o pravděpodobnostním rozdělení určtého znaku. Oprávněnost hypotézy se ověřuje testovým krtérem, které zjšťuje rozdíly mez emprcky pozorovaným rozdělením četností a teoretckým rozdělením pravděpodobností. Toto krtérum zavedl Pearson proto se někdy tento test označuje jako Pearsonův χ. Př výpočtu χ předpokládáme, že výsledky pozorování roztřídíme určtým způsobem (např. skupnovým rozdělením četností). Tak získáme v jednotlvých třídách počty hodnot, které se označí jako expermentální četnost O, protože podávají nformac, ke které jsme dospěl expermentální cestou. Dále s musíme zvolt určté rozdělení, které budeme považovat za model pro náš výběr. Pomocí tohoto rozdělení stanovíme tzv. očekávané (modelové) četnost E. Smysl testu je pak v tom, že hodnotíme rozdíly mez jednotlvým četnostm expermentálním a očekávaným, tj rozdíly O E. Za nulovou hypotézu nám pak slouží Test shody χ Pearsonův χ Expermentální četnost Očekávané četnost 6

64 5 Testování statstckých hypotéz 5.3 Test shody χ předpoklad, že se expermentální a očekávané četnost lší pouze náhodně, tj. že mez nm není statstcky významný rozdíl. Postup:. Zvolíme hladnu významnost α.. Výsledky výběrového šetření roztřídíme do zvolených skupn. 3. Stanovíme hodnoty očekávaných četností v jednotlvých skupnách (nejčastěj se bere průměr expermentálních četností). ( O E ) 4. V každé skupně vypočítáme a tyto hodnoty sečteme. E 5. Ve statstckých tabulkách vyhledáme krtckou hodnotu χ (ν) α pro ν = k stupňů volnost. 6. Vypočítanou hodnotu testového krtéra porovnáme s tabulkovou hodnotou a na základě tohoto porovnání přjmeme nebo zamítneme nulovou hypotézu. Pokud χ > χ (P < 0,05 v Excelu), zamítáme nulovou hypotézu a můžeme tvrdt, že mez četnostm expermentálním α a očekávaným je statstcky významný rozdíl. Jednotlvé mezvýsledky se zapsují do tabulky: ( O -tá třída O E O E (O E ) E ) E... k Příklad 60krát házíme kostkou a výsledky zapsujeme do tabulky. Zjstěte, zda je kostka falešná. Číslo na kostce Počet padnutí O experm. četnost očekávaná ( O O četnost E E (O E ) E ) E , , , ,6 χ (5) =, 0,05 χ < χ (5) 0,05 Není sgnfkantní rozdíl v četnostech, kostka není falešná. Σ =, = χ 63

65 5 Testování statstckých hypotéz 5.3 Test shody χ Test shody χ v programu Excel Vložt funkc f x Statstcké Ok CHISQ.TEST Tato funkce nevrací výslednou hodnotu χ, ale pouze pravděpodobnost, kterou porovnáme s hladnou významnost α = 0,05 P = 0,8 > 0,05 výsledek není sgnfkantní. 64

66 5 Testování statstckých hypotéz 5.3 Test shody χ 5.3. Test nezávslost χ pro čtyřpolní tabulku (kontngenční tabulku ) a Φ koefcent Test nezávslost χ se používá v případě, když máme rozhodnout, zda exstuje významná souvslost mez dvěma alternatvním jevy, tj. jevy, které mohou nabývat jen dvou možných hodnot (např.: pohlaví muž žena, stav svobodný ženatý, léčba úspěšná neúspěšná, odpověď ano ne). Čtyřpolní tabulka vypadá takto: Jev X x x Řádkový součet y Jev Y a b a + b Sloupcový součet y c d c + d a + c b + d (a + b) + (c + d) = = (a + c) + (b + d) = n Test nezávslost Čtyřpolní tabulka a, b, c, d jsou příslušné četnost a + b, c + d, a + c, b + d jsou okrajové margnální součty Vypočítanou hodnotu χ porovnáme s tabulkovou hodnotou χ (ν), kde ν = (počet řádků zmenšený o vynásobený α počtem sloupců zmenšeným o ) a na základě porovnání přjmeme nebo zamítneme nulovou hypotézu o tom, že výběry pocházejí z téže populace. Pokud je výsledek sgnfkantní, pak má smysl vypočítat míru souvslost koefcent Φ. Vztah mez koefcentem Φ a χ se dá vyjádřt jako χ Φ =. n Příklad Ve výběru 00 pacentů (50 mužů a 50 žen) se zjšťovalo, kdo byl hosptalzován déle než 7 dní. Máme zjstt, zda exstuje souvslost mez pohlavím pacentů a délkou jejch hosptalzace a určt těsnost této souvslost pomocí Φ koefcentu. Jednotlvé četnost jsou dány v čtyřpolní tabulce. Pohlaví Hosptalzace < 7 dní > 7 dní Σ Muž ženy Σ Pomocí testu χ zjstíme, zda je mez oběma proměnným nenáhodný vztah (sgnfkantní rozdíl mez daným četnostm) a tedy, že výběry pocházejí z rozdílných populací. 65

67 5 Testování statstckých hypotéz 5.3 Test shody χ Tabulková hodnota je χ (ν) = χ () = 3,84 χ > χ () je α 0,05 0,05 sgnfkantní rozdíl mez skupnou mužů a žen exstuje souvslost mez pohlavím a hosptalzací. Těsnost této souvslost se určí pomocí Φ koefcentu Test nezávslost χ pro kontngenční tabulku větší než (obecně pro tabulku r k) a kontngenční koefcent C Př zachycování jevů pomocí dotazníku nebo rozhovoru se používá vícepolní kontngenční tabulka. Opět se rozhoduje o tom, zda exstuje významná souvslost mez dvěma jevy máme tedy opět dvě proměnné X a Y, ale každá z nch je ještě dělená do tříd. Četnost uvedené v kontngenční tabulce jsou expermentální (pozorované) četnost O. Očekávané četnost E se musí vypočítat ze řádkových a sloupcových (tzv. margnálních) součtů: Testové krtérum χ se pak vypočítá jako, kde n je počet naměřených hodnot. Vztah mez proměnným X a Y určuje koefcent kontngence C, který se vypočítá podle vzorce Tento koefcent může nabývat hodnot mez 0 a +. Na rozdíl od koefcentu Φ se koefcent C používá u lbovolných čtvercových nebo obdélníkových tabulek např. 4 3, 5 7 atd. r k j= = ( O j E ) E C j j =. χ. χ + n Vícepolní kontngenční tabulka Koefcent kongngence Příklad Bylo zkoumáno, zda exstuje souvslost mez vzděláním a bydlštěm pacentů. Výsledky dotazníkového šetření, které bylo provedeno u 50 pacentů, uvádí následující tabulka: Bydlště Stupeň vzdělání Základní Střední Vysokoškolské 3 Σ Malá vesnce Velká vesnce Malé město Velké město Σ

68 5 Testování statstckých hypotéz 5.3 Test shody χ K tomu, abychom mohl vypočítat testové krtérum χ, musíme vytvořt novou tabulku s očekávaným četnostm. Tyto četnost vypočítáme z okrajových součtů, které přísluší každé expermentální četnost v pol tabulky. Pro expermentální četnost v. pol tabulky O = 7 bude očekávaná četnost. Stejným způsobem vypočítáme ostatní četnost a zapíšeme je do nové tabulky: ( O O E O E (O E ) E ) E 7 6,6 0,4 0,6 0,0 6 4,8,,44 0,30 3,6 -,6,56 0,7 5 6,6 -,6,56 0,39 4 4,8-0,8 0,64 0,3 6 3,6,4 5,76,60 7 5,7,8,64 0,9 4 4,6-0,6 0,03 0,0 3, -,,5 0,40 3 3,08-0,08 0,0 0,00,4-0,4 0,06 0,03,68 0,3 0,0 0,06 Σ = χ = 3,94 Vypočítanou hodnotu χ porovnáme s tabulkovou hodnotou na hladně významnost α = 0,05 s počtem stupňů volnost ν = (k )(r ) = (4 )(3 ) = 6 což je,59. Porovnáním zjstíme, že vypočítaný χ = 3,94 < χ (6) =,59. Výsledná 0,05 hodnota testového krtéra χ není sgnfkantní, není nutné počítat koefcent C. Můžeme tedy konstatovat, že mez vzděláním a bydlštěm pacentů není statstcky významná souvslost. Tvorba kontngenční tabulky v Excelu Vložení Kontngenční tabulka Zadat oblast dat Exstující lst Ok Do vznklého obdélníku klknout pravým tlačítkem myš Možnost kontngenční tabulky Zobrazení zatrhnout Klascké rozložení Ok Pozn.: Výsledný χ a C koefcent z Excelu nevypočítáme, abychom získal p hodnotu, musíme dopočítat očekávané četnost a zadat je do funkce f x. 67

69 5 Testování statstckých hypotéz 5.3 Test shody χ 68

70 5 Testování statstckých hypotéz 5.3 Test shody χ Kontrolní otázky a úkoly. S jakým četnostm pracují testy χ?. Jak vypadá čtyřpolní tabulka a co zpracovává? 3. Z jakých proměnných se počítá koefcent kontngence C? Klíč k otázkám a úkolům Odpověd na otázky najdete v textu. Referenční seznam DUPAČ, V., HUŠKOVÁ, M. 03. Pravděpodobnost a matematcká statstka. Praha: Karolnum. ISBN ZVÁRA, K. 03. Základy statstky v prostředí R. Praha: Karolnum. ISBN

Statistická šetření a zpracování dat.

Statistická šetření a zpracování dat. Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

Energie elektrického pole

Energie elektrického pole Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

4. Třídění statistických dat pořádek v datech

4. Třídění statistických dat pořádek v datech 4. Třídění statstcých dat pořáde v datech Záladní členění statstcých řad: řada časová, řada prostorová, řada věcná věcná slovní řada, věcná číselná řada. Záladem statstcého třídění je uspořádání hodnot

Více

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové. Příprava na cvčení č.1 Čísla a artmetka Číselné soustavy Obraz čísla A v soustavě o základu z: m A ( Z ) a z (1) n kde: a je symbol (číslce) z je základ m je počet řádových míst, na kterých má základ kladný

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC 25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Náhodným vektorem rozumíme sloupcový vektor složený z náhodných veličin X = (X 1, X 2,

Náhodným vektorem rozumíme sloupcový vektor složený z náhodných veličin X = (X 1, X 2, Statstka I cvčení - 54-5 NÁHODNÝ VEKTOR Náhodným vektorem rozumíme sloupcový vektor složený z náhodných velčn = n který je charakterzován sdruženou smultánní dstrbuční unkcí ; F náhodný vektor s dskrétním

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

- 1 - Zdeněk Havel, Jan Hnízdil. Cvičení z Antropomotoriky. Obsah:

- 1 - Zdeněk Havel, Jan Hnízdil. Cvičení z Antropomotoriky. Obsah: - - Zdeněk Havel, Jan Hnízdl Cvčení z Antropomotorky Obsah: Úvod... S Základní charakterstky statstckých souborů...3 S Charakterstka základních výběrových technk a teoretcká rozložení četností...9 S 3

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

VÝBĚR A JEHO REPREZENTATIVNOST

VÝBĚR A JEHO REPREZENTATIVNOST VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Ladislav Pecen, Petr Kasík

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Ladislav Pecen, Petr Kasík Základy bostatstky a modelování lékařských dat Ladslav Pecen, Petr Kasík Předmluva V současnost se statstka uplatňuje téměř ve všech oblastech medcíny. Důvodem jsou jednak vznk rozsáhlých databází v rutnní

Více

Teorie efektivních trhů (E.Fama (1965))

Teorie efektivních trhů (E.Fama (1965)) Teore efektvních trhů (E.Fama (965)) Efektvní efektvní zpracování nových nformací Efektvní trh trh, který rychle a přesně absorbuje nové nf. Ceny II (akcí) náhodná procházka Předpoklady: na trhu partcpuje

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Kinetika spalovacích reakcí

Kinetika spalovacích reakcí Knetka spalovacích reakcí Základy knetky spalování - nauka o průběhu spalovacích reakcí a závslost rychlost reakcí na různých faktorech Hlavní faktory: - koncentrace reagujících látek - teplota - tlak

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jří Holčík, CSc. INVESTICE Insttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a analýz IV - pokračování KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI METRIKY PRO URČENÍ VZDÁLENOSTI

Více

Masarykova univerzita Ekonomicko správní fakulta

Masarykova univerzita Ekonomicko správní fakulta Masarykova unverzta Ekonomcko správní fakulta Fnanční matematka dstanční studjní opora Frantšek Čámský Brno 2005 Tento projekt byl realzován za fnanční podpory Evropské une v rámc programu SOCRATES Grundtvg.

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad 1 Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2 Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

LOGICKÉ OBVODY J I Ř Í K A L O U S E K

LOGICKÉ OBVODY J I Ř Í K A L O U S E K LOGICKÉ OBVODY J I Ř Í K A L O U S E K Ostrava 2006 Obsah předmětu 1. ČÍSELNÉ SOUSTAVY... 2 1.1. Číselné soustavy - úvod... 2 1.2. Rozdělení číselných soustav... 2 1.3. Polyadcké číselné soustavy... 2

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Metody matematické statistiky (NMAI 061)

Metody matematické statistiky (NMAI 061) Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Spojité regulátory - 1 -

Spojité regulátory - 1 - Spojté regulátory - 1 - SPOJIÉ EGULÁOY Nespojté regulátory mají většnou jednoduchou konstrukc a jsou levné, ale jsou nevhodné tím, že neudržují regulovanou velčnu přesně na žádané hodnotě, neboť regulovaná

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

APLIKOVANÁ STATISTIKA pro FRRMS

APLIKOVANÁ STATISTIKA pro FRRMS Mendelova zemědělská a lesncká unverzta v Brně Fakulta regonálního rozvoje a meznárodních studí APLIKOVANÁ STATISTIKA pro FRRMS Modul : Datový soubor zjšťování, prezentace a zpracování Prof. Ing. Bohuml

Více

Simulační metody hromadné obsluhy

Simulační metody hromadné obsluhy Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ 5. Odborná konference doktorského studa s meznárodní účastí Brno 003 POUŽITÍ METODY PERT PŘI ŘÍZEÍ PROJEKTŮ A USAGE OF PERT METHOD I PROJECT MAAGEMET Vladslav Grycz 1 Abstract PERT Method and Graph theory

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Obecné, centrální a normované momenty

Obecné, centrální a normované momenty Obecné, centrální a normované momenty Obsah kapitoly 4. Elementární statistické zpracování - parametrizace vhodnými empirickými parametry Studijní cíle Naučit se počítat centrální a normované momenty pomocí

Více

Solventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová

Solventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová 2. část Solventnost II Standardní vzorec pro výpočet solventnostního kaptálového požadavku Iva Justová Osnova Úvod Standardní vzorec Rzko selhání protstrany Závěr Vstupní údaje Vašíčkovo portfolo Alternatvní

Více

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Neřešené příklady k procvičení

Neřešené příklady k procvičení Vysoká škola báňská - Techncká unverzta Ostrava Fakulta elektrotechnky a nformatky Katedra aplkované matematky Neřešené příklady k procvčení Lenka Šmonová Ostrava, 2006 Následující sbírka neřešených příkladů

Více