Veterinární a farmaceutická univerzita Brno. Základy statistiky. pro studující veterinární medicíny a farmacie

Rozměr: px
Začít zobrazení ze stránky:

Download "Veterinární a farmaceutická univerzita Brno. Základy statistiky. pro studující veterinární medicíny a farmacie"

Transkript

1 Veteriárí a farmaceutická uiverzita Bro Základy statistiky pro studující veteriárí medicíy a farmacie Doc. RNDr. Iveta Bedáňová, Ph.D. Prof. MVDr. Vladimír Večerek, CSc. Bro, 007

2

3 Obsah Úvod Základí pojmy Pojem statistika Jev Statistický soubor Statistický zak Náhodá veličia Rozděleí áhodé veličiy Distribučí fukce.. 1 Typy rozděleí áhodé veličiy (spojitá veličia) Pravděpodobostí rozděleí pro základí soubory Gaussovo ormálí rozděleí 4.1. Normovaé ormálí rozděleí Nezámé rozděleí. 8. Pravděpodobostí rozděleí pro výběrové soubory Studetovo t-rozděleí Pearsoovo -rozděleí Fisher-Sedecorovo F-rozděleí 3 3 Popisé charakteristiky statistických souborů Středí hodoty Středí hodota (aritmetický průměr) Geometrický průměr Harmoický průměr Mediá Modus Charakteristiky variability Variačí rozpětí Rozptyl (variace) Směrodatá odchylka Variačí koeficiet Středí chyba průměru Odhady parametrů základího souboru) Odhad parametrů souboru s Gaussovým ormálím rozděleím Odhad parametru (středí hodota) Odhad parametru (rozptyl) Odhad parametrů souboru s ezámým rozděleím Odhad mediáu Vylučováí extrémích hodot souboru Vylučováí extrémích hodot u souboru s ormálím rozděleím Orietačí vyloučeí extrémích hodot Grubbsův test extrémích odchylek Vylučováí extrémích hodot u souboru s ezámým rozděleím Dixoův test extrémích odchylek

4 6 Testováí statistických hypotéz Experimet Teorie testováí statistických hypotéz Klasifikace testů podle typů statistických dat Testováí ormality Chí-kvadrát test dobré shody Parametrické testy Testováí rozdílu rozptylů:f-test Testováí rozdílu středích hodot: Studetův t-test Porováí základího a výběrového souboru (jedovýběrový t-test) Porováí dvou výběrových souborů (dvojvýběrový t-test) Testováí rozdílu více středích hodot Neparametrické testy Ma-Whiteyův pořadový test Wilcoxoův test Zamékový test Hodoceí závislosti kvatitativích zaků Fukčí a statistická závislost Lieárí korelačí závislost Regresí aalýza Korelačí aalýza Testováí výzamosti korelačího koeficietu Nelieárí korelačí závislost Spearmaův koeficiet pořadové korelace Kvalitativí zaky Pojem pravděpodobost Kategoriálí data Aalýza kategoriálích dat Test rozdílu empirické a teoretické četosti Test rozdílu (a více) empirických četostí Testováí závislosti kvalitativích zaků Kotigečí tabulka x Kotigečí tabulka k x m Příloha Statistické tabulky

5 Úvod Statistika je discipliou, která des tvoří ezbytou součást studia všech biologických oborů a oborů avazujících a biologii tj. především lékařských oborů, ať už humáí medicíy ebo medicíy veteriárí, dále farmaceutických oborů, zemědělských, ekologických, hygieických, potraviářských a řady dalších. Výzam této aplikovaé statistiky (biostatistiky) vyplývá z podstaty získáváí, zpracováí, prezetace a iterpretace dat v biologických a lékařských oborech, kdy bez uplatěí statistiky by vzik mohých lékařských zalostí a zkušeostí byl zatíže řadou chyb a omylů, a kdy bez zalosti statistiky by zalost i zkušeost emohla být správě iterpretováa. Praktický dopad výzamu statistiky pro studety veteriárí medicíy a farmacie se promítá především do oblasti výzkumu a vývoje v lékařských a farmaceutických oborech, ale i do oblasti kliické veteriárí praxe a oblasti hygiey a ekologie při dozoru ad potraviami živočišého původu. Výuka statistiky a VFU Bro je zaměřea zejméa a schopost studetů samostatě řešit kokrétí problémy veteriárí medicíy a farmacie s využitím metod biostatistiky a dále a praktické zvládutí ěkterých obecých i speciálích postupů obsluhy osobích počítačů při jejich využití pro statistické úlohy. Text této publikace je urče především studetům veteriárí medicíy a farmacie a Veteriárí a farmaceutické uiverzitě Bro, ale může být užitečou pomůckou i pro ostatí zájemce o statistiku v oblasti biologických a lékařských oborů. Nepředpokládá žádé předchozí zalosti statistických a matematických postupů a může sloužit jako základí učebice biostatistiky, protože představuje základí statistické pojmy a vysvětluje statistické metody a jejich použití formou, která je přístupá i ematematicky orietovaým čteářům. Zvláští důraz se v tomto textu klade a srozumitelost a praktické použití jedotlivých metod. Tomu poěkud ustupuje a ěkterých místech přesost matematickostatistické termoologie a symboliky. Obsah je rozděle do 10 kapitol. Úvodí kapitoly jsou věováy vysvětleí základích statistických pojmů, výpočtům ejužívaějších statistických charakteristik a popisu ejdůležitějších teoretických rozděleí používaých v tomto textu. Navazující kapitoly se věují popisu, vysvětleí a praktickému uplatěí ejčastěji používaých statistických testů (parametrických i eparametrických) a dále metod statistické aalýzy korelačích závislostí biologických zaků. Závěrečá kapitola je zaměřea a statistické hodoceí kvalitativích (kategoriálích) dat používaých v lékařské a biologické statistice. Všechy metody jsou doplěy ázorými příklady pro demostraci praktického uplatěí popisovaých postupů, které lze často zpracovat pouze za použití běžých elektroických kalkulaček. V současé době je však většiou řada statistických aalýz prováděa za pomoci specifického softwaru a proto je učebí text a závěr doplě i řadou odkazů a www zdroje pro vhodý volě dostupý i komerčí statistický software, který eklade a biologicky orietovaé odboríky přehaé ároky v oblasti vlastích statistických výpočtů. Doufáme, že teto učebí text bude i přes svou stručou formu sloužit jako užitečá pomůcka eje studetům veteriárí medicíy a farmacie, ale i dalším případým zájemcům o statistiku v oblasti biologických a lékařských oborů. Bro, srpe 007 Autoři 5

6 6

7 Kapitola 1 Základí pojmy 1.1 Pojem statistika Objasěí pojmu statistika je poměrě obtížé, přestože v současé době sad každý ěco o statistice ví, a má tedy o í ějakou představu. V běžé řeči se slovem statistika často míí zázorňováí číselých údajů přehledou formou pomocí grafů či tabulek. V této podobě se s í setkáváme apř. v masových médiích v souvislosti s volbami, růzými aketami a průzkumy veřejého míěí ebo ve zprávách o vývoji ekoomiky. Jidy čláek v oviách hovoří o statistickém prokázáí, že kouřeí způsobuje rakoviu. V odborém časopisu se lékaři dovídají o posledích studiích, jež dokazují hypotézu, že apř. ově objeveý léčivý preparát je opravdu účiý při sižováí hladiy cholesterolu v krvi. Je možé závěrům studie věřit? Co to je statistický důkaz? V každé defiici statistiky je obsažeo, že se zabývá hromadými jevy. Jsou to takové skutečosti, které se vyskytují mohokrát a mohou se zovu opakovat. Obrovskou úlohu v procesu vzikáí moderí statistiky v XIX. století sehrál belgický matematik, astroom a statistik Lambert Adolphe Jacques Quételet ( ). Pěstoval statistiku jako disciplíu, která má ejeom pozorovat a popisovat hromadé jevy v sociálí oblasti, ale má se je i sažit vysvětlovat v tom smyslu, že má podle příkladu přírodích věd hledat mezi imi příčié vztahy. Quételet se zasloužil ejeom o vývoj vědecké statistiky, ale i o velké obohaceí statistické praxe. V Belgii, kde byl od roku 1841 předsedou statistického úřadu, se pod jeho vedeím provádělo sčítáí lidu s moha moderími prvky. Kromě Quételeta měly velký vliv a utvářeí statistiky v XIX. století i jié osobosti, jako apř. Němec Karl Kies ( ) se spisem Die Statistik als selbstadige Wisseschaft (Statistika jako samostatá věda), vydaým v roce Postupě začalo docházet k popisováí a aalyzováí hromadých jevů pomocí čísel i v oblastech přírodích a techických, zvláště pak v biologii, atropologii, meteorologii, fyzice apod. Na rozvoji statistiky ve XX. století se podílela dlouhá řada velmi výzamých vědců, apř. Fracis Galto ( ), který položil základy zkoumáí vztahů mezi hromadými jevy, dále Karl Pearso ( ), který zkostruoval řadu origiálích statistických měr a postupů, Roald A. Fisher ( ), který se výzamě zasloužil zejméa o rozvoj testováí statistických hypotéz a dále William S. Gosset ( Studet, ), který vyviul eparametrickou statistiku pro situace, kdy elze předpokládat ormálí rozděleí dat. Čiost těchto vědců, jejich dalších současíků a ásledovíků vedla k tomu, že se a přelomu tisíciletí pod pojmem statistika rozumí auka, jak získávat iformace z umerických dat. Je to disciplía, která pomáhá při přípravě a provedeí výzkumu a při vyhodocováí výsledků. Jako ástroj vědy, poskytuje statistika 7

8 prostředky a kocepty, které umožňují pracovat s výsledky tak, abychom porozuměli určitému problému. V užším slova smyslu je možo pod pojmem statistika rozumět: a) údaje (data) zejméa číselé (ale i sloví) a jejich souhry o hromadých jevech, které ajdeme v ejrůzějších statistických publikacích, ale zvláště v růzých statistických ročekách a v přílohách statistických časopisů; b) čiost spočívající v získávaí dat o hromadých jevech (počítáí, měřeí, vážeí a zazameáváí), v jejich roztřiďováí, shrováí, grafickém zázorňováí, v kostrukci a výpočtu jejich charakteristik, ve vytvářeí jejich soustav a v jejich zveřejňováí a zejméa pak v jejich aalýze; c) věda, která zkoumá zákoitosti (podstaté pravidelosti) hromadých jevů, resp. souhr vědeckých metod sběru, zpracováí (tříděí, shrováí a zpřehledňováí) a aalyzováí dat (včetě vytvářeí závěrů a rozumých rozhodutí a základě takového rozboru). Podle výzamého didaktika statistiky Davida S. Moora (1997) můžeme praxi statistiky rozdělit a tři části: získáváí dat, aalýzu dat a statistické usuzováí. Získáváí dat zahruje metody pro sběr dat, jež zodpoví předem daou otázku (hypotézu). Základí přístupy k výběru měřeých objektů, k ávrhu experimetů a k validizaci istrumetů pro získáváí dat jsou výzamým příspěvkem statistiky. Aalýza dat představuje orgaizaci dat a popis dat prostředictvím grafů, umerických souhrů a dalších matematicky propracovaých prostředků. Někdy se této oblasti říká popisá statistika. Teto ázev je trochu zkreslující. Moore zdůrazňuje exploračí fukci této části statistiky a její dyamickou povahu. Počítačová revoluce vrátila popisou a exploračí aalýzu dat do cetra statistické praxe. Statistické usuzováí (iferece, idukce) jde za sama data a usiluje o získáí závěrů o širším uiverzu jevů. Neprovádí jeom závěry, ale dodává k im i zhodoceí, jak jsou tyto závěry spolehlivé. K tomu používá pravděpodobostí pojmy. Tomuto způsobu práce s daty se říká také iferečí statistika. Metody této části patří k matematicky ejáročějším z celé statistiky. Výzam statistického testováí hypotéz ebo používáí itervalů spolehlivosti je však uté posuzovat v závislosti a oprávěosti aplikace těchto metod, a e podle jejich matematické složitosti. Pro statistiku, aplikovaou a zkoumáí hromadých jevů v oblasti biologických a avazujících věd, se používá termí biostatistika. Nutost používáí statistických metod v této oblasti je dáa specifickými vlastostmi a charakteristickými rysy biologického materiálu. Všechy životí procesy a projevy živých orgaismů jsou ve svém celku velmi složité a promělivé, obsahují moho vitřích vzájemě působících sil a proto je jejich hodoceí často velice komplikovaé. Živé orgaismy se vyzačují začou geeticky podmíěou variabilitou, která působí řadu problémů při sledováí, měřeí a získáváí dat v experimetech s biologickými objekty a především při vyhodocováí těchto experimetů, itrerpretaci jejich výsledků a vyvozováí závěrů. Problémy v této oblasti dokáže do určité míry vyřešit statistika, která umoží zohledit velkou variabilitu biologického materiálu a v eposledí míře i prvek áhody, který je zde vždy přítome a elze ho při experimetech zcela vyloučit. Použití statistických metod je tedy při práci s 8

9 biologickým materiálem vždy ezbytě uté především při vyhodocováí výsledků získaých v experimetech a a jejich základě i a pro formulováí obecě platých závěrů, které pravdivě vypovídají o sledovaých jevech. Využití biostatistiky pro veteriárí lékařství a farmacii: 1) Výzkum: vyhodoceí dat získaých v experimetech, apř. při ověřováí účiosti ových léků, léčebých preparátů, medikovaých krmých směsí, ale i ových léčebých postupů a použitých metod atd. Statistické metody hodoceí jsou schopy potvrdit ebo vyvrátit hypotézy, které si v experimetech staovíme (viz Kapitola 6 Statistické testováí hypotéz). ) Zobecěí pozatků z kliické praxe: vyhodocováí výsledků pozorováí z kliické praxe apř. sledováí a porováváí výskytu oemocěí v růzých skupiách lidí, zvířat, v regioech, obdobích apod. Sledujeme apř. zvýšeou emocost v určitém chovu (resp. v regiou, v období) a po statistickém porováí s emocostí v jiých chovech (resp. v jiém regiou, v období) můžeme usoudit, zda je pozorovaé zvýšeí emocosti áhodé ebo je způsobeo jiými vlivy (apř. změou krmeí, metodiky ošetřováí, hygieickými podmíkami, ročím obdobím, ifekcí atd.)? 3) Vyhodoceí laboratorích aalýz, hodoceí a porováí vzorků (oblast hygiey potravi, testováí zdravotí ezávadosti, kotrola výroby léčiv, ad.) 4) Publikováí výsledků experimetálích prací v odboré a vědecké literatuře, diplomové, disertačí práce, výzkumé zprávy ap. (obecě platé závěry experimetálích prací lze vyvozovat pouze a základě statistického vyhodoceí získaých dat). 1. Jev Při koáí pokusů a pozorováí v přírodích vědách (biologii a medicíě) usilujeme zpravidla o to, abychom z výsledku pokusů ebo pozorováí mohli vyslovit obecě platé závěry o zkoumaém předmětu. Proto od pokusů požadujeme reprodukovatelost a pozorováí provádíme a rozsáhlých souborech vzájemě rovoceých objektů. V praxi postupujeme většiou tak, že si předem určíme ějaký pevý komplex podmíek, apř. soubor pravidel pro provedeí jistého pokusu (druh a kvalita zákroku, druh, stáří, váhu, pohlaví pokusých zvířat a další podmíky při biologickém experimetu) a pokusy ebo pozorováí provádíme v rámci tohoto pevého komplexu podmíek. Můžeme tedy říci, že pokusy ebo jedotlivá pozorováí jsou realizací předem daého pevého komplexu podmíek. Každý proces probíhající v přírodě v daém okamžiku svého trváí se projevuje určitým výsledkem. Výsledek tohoto procesu (pokusu ebo pozorováí) je ozačová jako jev. Soubor podmíek, za ichž proces probíhá, určuje jaký jev astae. Jevy, které se vyskytují za určitých podmíek opakovaě ve velkém počtu (astávají při ezávisle opakovaé realizaci pevého komplexu podmíek), jsou azýváy hromadými jevy (apř. hromadým jevem je chřipková epidemie v zimím období ebo výskyt určité choroby ve stáji dojic). Podle jistoty výskytu jevů lze hromadé jevy rozdělit a: 9

10 1) determiistické jevy které za určitých podmíek astaou s aprostou jistotou (jevy jisté), ebo eastaou (jevy emožé). Např. při opakovaém zahříváí vody a 100 C při tlaku 101,3 kpa je výsledkem vždy pára hromadý jev jistý, výsledek voda hromadý jev emožý. ) áhodé jevy které za určitých podmíek mohou astat, ale emusí hromadý jev áhodý. Náhodé jevy elze před provedeím pokusu ebo pozorováí zcela přesě předvídat. Např. při chovu dojic za určitých podmíek ve stáji je výsledkem vzik oemocěí dojic (hromadý jev áhodý), protože výsledek je u ěkolika dojic oemocěí určitou chorobou, ostatí dojice touto určitou chorobou emocé ejsou. Tj. jev oemocěí dojice určitou chorobou mohl astat (a astal, u ěkolika dojic choroba zjištěa byla), ale emusel (a také eastal, u ostatích dojic choroba zjištěa ebyla). Náhodost jevu je dáa tím, že kromě určitého pevého komplexu podmíek, za ichž proces (pokus ebo pozorováí) probíhá (a směřuje k jevu), existují ještě další epodchyceé podmíky (tzv. áhodí čiitelé), které se vymykají jakékoli kotrole a ovlivňují proces tak, že výsledek elze předem jedozačě určit. Náhodé čiitele představuje velké možství epatrých vlivů, které obvykle podchytit elze, které však průběh procesu ovlivňují, a tím i jeho výsledek (jev). Proto výsledky opakovaých pokusů ejsou vždy přesě stejé i když je pevý komplex podmíek jejich prováděí co ejpečlivěji kotrolová. Podobě je tomu i při koáí pozorováí a rozsáhlých souborech vzájemě rovoceých jediců. Velké možství epatrých idividiálích odchylek pozorovaých jediců tu opět způsobuje epředvídatelé kolísáí ve výsledcích pozorováí. Např. při chovu dojic je oemocěí dojic určitou chorobou áhodý jev, který je ovlivňová epodchyceými podmíkami, jako je kvalita krmeí, mikroklima ve stáji, úroveň ošetřováí apod. Přestože astáí ebo eastáí určitého jevu je zcela áhodé, protože je ovlivňováo áhodými čiiteli, přesto výskyt áhodých jevů podléhá určitým zákoitostem. Na základě těchto zákoitostí lze pak předvídat výskyt určitého áhodého jevu. Odhad výskytu áhodého jevu má velký výzam v humáí i veteriárí medicíě. Např. odhad výskytu určité emoci v určité lokalitě ebo v určitém období, odhad projevu určité emoci a tím i možost jejího rozpozáí, odhad úspěšosti léčby určité emoci apod Statistický soubor Jak již bylo uvedeo výše, statistika se zabývá hromadými jevy, tedy takovými skutečosti, které se vyskytují mohokrát a mohou se zovu opakovat. V podstatě existují dva druhy hromadých jevů. Jede z ich je výsledkem velkého počtu opakovaých pozorováí (vážeí, měřeí) určité vlastosti jedoho objektu. Zde je koečým cílem jedak zjištěí (ebo alespoň maximálí přiblížeí) skutečého stavu daé vlastosti daého objektu, jedak posouzeí přesosti pozorovatele (váhy, měřícího přístroje apod.). Může jít apř. o řadu meřeí extikce roztoku o určité kocetraci při kalibraci fotometru ebo řadu měřeí tělesé výšky jedé určité osoby apod. Častějším druhem hromadého jevu (a který soustředí hlaví pozorost biostatistika) je ějaká vlastost určité možiy, sestávající z velkého počtu prvků (živých jediců), z ichž každý má v ějaké míře daou vlastost. Protikladem hromadého jevu je idividuálí jev, tj. jedo pozorováí vlastosti jedoho prvku. Hraice mezi idividuálím a hromadým jevem eí ostrá, takže hromadý jev elze defiovat přísě exaktě. Jde o pojem velmi relativí. Lze říci, že 10

11 vlastost jedoho až čtyř prvků eí možo považovat za hromadý jev. Jde pouze o jede až čtyři idividuálí jevy. Na druhé straě lze a základě zkušeostí kostatovat, že uvažuje-li se 30 a více prvků, může se zpravidla mluvit již o hromadých jevech, protože při tomto a vyšším počtu lze předpokládat, že to, co je ve zkoumaých vlastostech prvků podstaté (pravidelé, společé, zákoité), zatlačí do pozadí a převáží to, co je u ěkterých jedotlivých prvků áhodě idividuálí. Zkoumáí vlastostí pěti až ecelých třiceti prvků tvoří jakousi přechodou oblast mezi prostým popisem skupiy idividuálích jevů a poodhalováím zákoitostí hromadých jevů. Studium hromadých jevů předpokládá defiováí možiy prvků, z ichž každý má celou řadu vlastostí, z ichž ěkteré jsou u každého prvku daé možiy zcela stejé a jié se u jedotlivých prvků mohou vyskytovat v růzé míře. Jsou-li idetické vlastosti prvků určité možiy přesě staovey, mluví se o daé možiě, vytvořeé z prvků s těmito přesě staoveými shodými vlastostmi jako o statistickém souboru. Statistickým souborem v oblasti biostatistiky může být apř. možia zvířat, lidí, buěk, rostli, mikroorgaismů apod. Prvky statistického souboru jsou idividuálími ositeli vlastostí daého statistického souboru. Počet čleů v souboru se azývá rozsah daého statistického souboru. Ke statistickému souboru lze přistupovat jako k základímu ebo jako výběrovému. Základí soubor (eboli populace) je soubor všech prvků (jediců), u ichž se sledovaý zak může vyskytovat. Teto soubor je vlastím cílem statistického zkoumáí. Obsahuje teoreticky všechy hodoty, které mohou být při sledováí daé vlastosti teoreticky získáy. Tz. jde o oblast zkoumáí, kterou chápeme jako souhr hodot, které tuto oblast tvoří. Počet čleů v základím souboru (rozsah) ozačujeme N. Teto rozsah může být koečý i ekoečý především z časového hlediska: a) koečý kdy oblast zkoumáí je přesě vymezea, apř.: počet dojic ve určité stáji, kde sledujeme hladiu močoviy v krevím séru zvířat ebo počet absolvetů VFU v roce 00 (počet čleů N u takové populace je přesě staovitelý). b) ekoečý kdy oblast zkoumáí je vymezea prakticky ekoečě, případě ji elze vymezit časově. Např.: počet všech prasat v Evropě (ve světě), kde sledujeme hmotost ebo počet absolvetů VFU (počet čleů N je promělivý, elze ho přesě zjistit). Z praktického hlediska je rozsah základího souboru pro potřeby statistického zpracováí (výpočetí vzorce) vždy uvažová a ozačová jako N=. Protože populace má zpravidla velmi začý rozsah, zjištěí zkoumaých vlastostí u všech jejích čleů ebývá mohdy prakticky vůbec uskutečitelé ebo bývá esmírě pracé a velmi ákladé. Proto se většiou daé sledováí (měřeí, experimet) provede je u vybraých jediců ze základího souboru, kteří jsou pouhou částí populace, tj. pouze jakýmsi jejím vzorkem - tvoří tzv. výběrový soubor. Výběrový soubor (výběr) je soubor určitého počtu jediců vybraých ze základího souboru, u kterých je provedeo praktické sledováí (měřeí) zkoumaé vlastosti (případě provede experimet). Výběrový soubor by měl být co ejlepším představitelem (reprezetatem) základího souboru, eboť právě a základě pozáí vlastostí výběrového souboru se usuzuje a 11

12 vlastosti celé populace ( statistická idukce vyvozováí závěrů). Aby byl výběrový soubor dostatečě reprezetativí, je uto provádět výběr čleů do tohoto souboru áhodě. Náhodý výběr zameá, že jedici souboru (aměřeé hodoty) byly vybráy ezávisle tak, aby všichi jedici základího souboru (hodoty, které jsou k dispozici) měly stejou možost být do výběru zahruty. Absolutě áhodý výběr ze základího souboru do výběrového souboru eexistuje. Náhodost výběru je vždy ovlivěa určitou chybou při vybíráí. K vybíráí se proto používají způsoby, které chybu při vybíráí zmešují co ejvíce. Nejlépe se áhodosti dosáhe při výběru s použitím tabulky áhodých čísel (viz Příloha: Tab. č.1 Náhodá čísla). Tabulky áhodých čísel obsahují číslice 0 až 9 seřazeé áhodým způsobem, tj. ezávisle za sebou. Tabulky áhodých čísel bývají sestavey pomocí ějakého záhodňovacího procesu, který produkuje všechy číslice se stejou pravděpodobostí a ezávisle a předchozích výsledcích. Jsou to apř. losováí z osudí aj. Každá tabulka áhodých čísel se po jejím sestaveí podrobuje řadě zkoušek, zda eobsahuje ějaké eáhodosti, jako je apříklad příliš častý výskyt ěkteré číslice, (tabulky áhodých čísel mají obsahovat všechy číslice zhruba stejě krát), cyklické opakováí ěkterých čísel apod. Ai po těchto kotrolách emusí být tabulky bezvadé, eboť áhodost mohla být porušea jiým (ekotrolovatelým) způsobem. Uiverzálí test áhodosti, který by prozkoumal áhodost z hlediska všech jejich vlastostí, eexistuje. Tabulky áhodých čísel se používají v případě, kdy je třeba dosáhout áhodého seřazeí a ebo, v případě, kdy je třeba zabezpečit áhodost vybíráí. V tabulce áhodých čísel jsou tedy zjištěé hodoty diskrétí áhodé veličiy abývající hodot 0,1,,3,...,9, každé s pravděpodobostí 0,1. Tato áhodá čísla lze seskupit do dvojic, trojic apod, čímž vzikou hodoty 00, 01, 0, 03,...,99 a každé se dosáhe s pravděpodobostí 0,01, ebo hodoty 000, 001, 00, 003,...,999 a každé se dosáhe s pravděpodobostí 0,001. Náhodého výběru ze základího souboru se za pomoci tabulek áhodých čísel dosáhe apř. takto: všechy hodoty základího souboru, které jsou pro výběr k dispozici, se po řadě očíslují (0 až posledí hodota základího souboru - apř. 7). Do výběrového souboru se vezme zvoleý počet "" (apř. = 5) hodot ze základího souboru, a to těch, jejichž čísla se shodují s posloupostí prvých "" áhodých čísel připadajících v úvahu počíaje od libovolého místa tabulky áhodých čísel. Například: Z chovu 7 ovcí je třeba áhodě vybrat 5 zvířat k vyšetřeí. Zvířat v chovu se očíslují za sebou 0, 1,, 3,...7. Z tabulky áhodých čísel se postupě od libovolého místa (po řádcích ebo sloupcích) čtou postupě za sebou dvoumístá čísla, apř.: od začátku 6. řádku: 0, 89, 08, 16, 94, 85, 3, 9. Do výběrového souboru k vyšetřeí se tedy zařadí zvířata ze základího souboru s pořadovými čísly 0, 08, 16, 53, 9. Čísla 89, 94, 85 a 83 se při výběru vyechají, protože ovce s takovými pořadovými čísly v základím souboru ejsou. 1.4 Statistický zak V biologickém a medicíském výzkumu jsme odkázái a zkoumáí přírodích áhodých jevů. Zpravidla však emůžeme zkoumat jevy jako takové, ale sažíme se vybrat zak, ebo skupiu zaků, které zkoumaý jev určitým způsobem popisují projevují se určitými biologickými vlastostmi u zkoumaých jediců. Můžeme tedy říci, že statistický zak je odraz (ozačeí) určité vlastosti, kterou má v té či oé míře každý čle sledovaého souboru zkoumaých jediců (statistického souboru). Mírou daé vlastosti (statistického zaku) u každého 1

13 člea souboru je hodota (sloví ebo číselá) daého zaku. Těchto hodot je pro daý statistický zak tolik, kolik čleů patří do daého souboru zkoumaých jediců. Počet hodot jedoho statistického zaku je tedy rove rozsahu souboru. Každá jedotlivá hodota se často azývá též pozorováí, protože je ozačeím stupě daé vlastosti (vyjádřeé daým zakem) pozorovaého u každého člea souboru. Počet pozorováí jedoho zaku je tak samozřejmě stejý s rozsahem souboru. Zázamy o hodotách jedoho ebo více zaků v určitém statistickém souboru azýváme statistickými údaji (daty). O hodotách statistického zaku ve smyslu vyjádřeí růzého stupě sledovaé vlastosti mluvíme jako o obměách eboli variatách zaku. Pro každou jedotlivou hodotu (variatu) zaku používáme ozačeí x i (hodota aměřeá u i-tého jedice v souboru). Daý statistický zak v daém smyslu může abýt buď pouze jedé variaty, ebo častěji dvou či více variat. Takový zak, který abývá v daém statistickém souboru pouze jedé variaty, se azývá shodý. Je to tedy kostata, která je obvykle součástí defiice daého statistického souboru (apř. zak příslušost ke sledovaému souboru pacietů ebo příslušost k daému chovu dojic ). Obvykle statistické zaky abývají více ež jedé obměy. Např. zak pohlaví abývá dvou variat (samčí, samičí ebo mužské, žeské), zak věk v letech ebo tělesá hmotost může abývat moha růzých obmě u sledovaých jediců. Tyto statistické zaky, které abývají v daém statistickém souboru více ež jedé variaty, jsou proměými (variabilími) statistickými zaky. Stručě je azýváme proměé. Ty jsou pak hlavím předmětem statistického zkoumáí. Proměé (statistické zaky) lze klasifikovat podle velmi moha hledisek. Jako prví se abízí hledisko vyjádřeí hodot proměé slovy ebo určitými čísly. Podle ěj čleíme proměé a sloví a číselé. Sloví proměé se ěkdy azývají alfabetické, ale ejčastěji kategoriálí (roztříděím čleů statistického souboru podle takovéto proměé vzikají totiž skupiy eboli kategorie). Číselé proměé se jmeují umerické. Ve začé části odboré literatury (a také při praktickém využití) se kategoriálí proměé azývají kvalitativími zaky a umerické proměé bývají azýváy kvatitativími zaky. Na klasifikaci proměých (statistických zaků) a sloví a číselé úzce avazuje tříděí podle hlediska typu vztahů mezi obměami a hodotami proměých. Pomocí hodot, kterých proměá (statistický zak) abývá, je možo kvatifikovat sledovaou vlastost jediců statistického souboru. Podle stupě kvatifikace rozezáváme čtyři typy statistických zaků podle toho, zda jsme u dvou hodot zaků x 1 a x schopi iterpretovat jejich: rovost x 1 = x uspořádáí x 1 < x rozdíl x 1 - x podíl x 1 / x Na základě tohoto hlediska tedy dostaeme ásledující skupiy zaků: a) zaky omiálí (od latiského slova ome ve smyslu jméo, ázev, pojmeováí) zaky s ejižším stupěm kvatifikace. Jsme u ich schopi iterpretovat je rovost, případě erovost (zak je přítome u daého jedice ebo eí přítome). O dvou hodotách omiálího zaku lze tedy pouze kostatovat, že jsou buď stejé ebo že jsou růzé (apř. jedici mají růzé pohlaví, ale elze říci že by samčí pohlaví bylo více ež samičí pohlaví ebo aopak). Nomiálí zaky mohou abývat buď je dvou možostí projevu (alterativí omiálí 13

14 zaky apř. stav orgaismu: zdravý emocý, pohlaví: samčí - samičí) ebo více možostí projevu (možé omiálí zaky barva očí: modrá hědá šedá zeleá). Růzé možosti projevu omiálích zaků jsou často azýváy kategoriemi a pro omiálí zaky se proto ěkdy používá také pojem kategoriálí data. b) zaky ordiálí (od latiského slova ordatio ve smyslu pořadí) eboli pořadové zaky jsou ty, o jejichž obměách lze eje říci, že jsou růzé, ale lze je jedozačě seřadit od ejmeší variaty do ejvětší (ebo aopak). Hodoty těchto zaků tak vyjadřují vzestupé ebo sestupé uspořádáí itezity zkoumaé vlastosti a jsou určey subjektivě hodotitelem. Typickým příkladem je školí klasifikace ebo hodoceí pomocí bodů v růzých soutěžích (degustace, boitace apod.). Při klasifikaci určíme, že jedičkář je lepší ež dvojkař, ale to ezameá, že je mezi imi stejý výkoostí rozdíl jako mezi dvojkařem a trojkařem. Rozdíl dvou obmě ebo hodot ordiálího zaku začí rozdíl v pořadí těchto obmě ebo hodot. Toto srováí hodot pořadového zaku rozdílem má smysl a je plě postačitelé. Naproti tomu emá smysl ebo je adbytečé či klamé srováí hodot pořadového zaku podílem. c) zaky metrické eboli kardiálí (od latiského slova cardialis, které má výzamy stěžejí, hlaví) jsou zaky s ejvyšším stupěm kvatifikace, dávají ejvíce iformací z dat. Jsou to zaky, o jejichž dvou variatách lze říci eje, že jsou růzé (jako u omiálích zaků) a že je jeda z ich větší ež druhá (jako u ordiálích zaků), ale lze i přesě změřit o kolik je jeda obměa větší ež druhá. Kardiálí zaky jsou vždy číselé - jsou iterpretováy číselou hodotou aměřeou objektivím měřítkem. Vyjadřují přitom eje seřazeí (jako ordiálí zaky), ale i velikost měřeých vlastostí čleů daého statistického souboru. Metrickými eboli kardiálími zaky jsou apř. tělesá hmotost, objem plic, délka kočetiy, kocetrace látky, aktivita ezymu, tělesá teplota apod.). Kardiálí zaky lze dále dělit a: c 1 ) - itervalové zaky: jsme u ich schopi iterpretovat rozdíl dvou hodot. Stejý iterval mezi jedou a druhou dvojicí hodot vyjadřuje i stejý rozdíl v itezitě zkoumaé vlastosti (apř. rozdíl mezi teplotou 37 C a 38 C je stejý jeko mezi 38 C a 39 C). c ) - poměrové zaky: mimo rozdílu jsme schopi iterpretovat i podíl hodot (apř. váží-li dospělý člověk 80 kg a dítě pouze 10 kg, můžeme smysluplě říci, že dospělý člověk je 8x těžší ež dítě). Podle typu zaků bychom také měli používat odpovídajících statistických metod. U omiálích zaků je amístě použití růzých typů tříděí a kotigečích tabulek, u ordiálích zaků pořadových statistik a testů (koeficiet pořadové korelace, mediáy, eparametrické pořadové testy ad.). Většia statistických metod je zaměřea a zaky itervalové a poměrové, kde lze iterpretovat aritmetický průměr, korelačí koeficiet a parametrické testy. Základí pravidlo pro použití statistických metod je ásledující: Data zaků a vyšším stupi kvatifikace lze zpracovat metodami určeými pro ižší stupeň kvatifikace, ovšem za ceu ztráty iformace. Opačý postup možý eí, protože hrozí zaášeím libovůle do koečých výsledků. 14

15 Podle tohoto pravidla je tedy možo použít metody primárě určeé pro zaky s ižším stupěm kvatifikace v ěkterých situacích i pro zaky s vyšším stupěm kvatifikace, ovšem za ceu ztráty iformace z dat (takové použití je tedy vhodé pouze pro orietačí hodoceí). Opačým způsobem to však ejde, tz. u zaků s ižší kvatifikací elze použít metod primárě určeých pro zaky s vyšší kvatifikací. Tyto metody jsou totiž více přesé, proto vyžadují moho iformací z dat a tyto iformace u epřesých zaků s ižší kvatifikací emáme. Dalším důležitým kritériem tříděí statistických zaků (proměých) je formálí hledisko podle ěj je možo rozlišit statistické zaky a: a) zaky espojité (diskrétí) takové zaky, které abývají je určitých hodot z ějakého reálého itervalu. Např.: počet mláďat ve vrhu, počet seseých vajec, počet emocých v určitém období ebo lokalitě atd. (může být 1 jediec, 4 jedici, ale e 1,5 jedice). Speciálím případem diskrétích zaků jsou zaky alterativí, abývající pouze hodot: ao - e, zdravý - emocý, přežije - epřežije. b) zaky spojité teoreticky mohou abývat všech hodot v rámci určitého reálého itervalu (tělesá hmotost, výška, teplota, aktivita ezymu). Prakticky emusí být spojitost těchto zaků doslová přesost jejich hodot závisí a měřítku použitém pro měřeí těchto zaků (apř. hmotost dojic budeme měřit s přesostí maximálě celých kg, emá smysl měřit v meších jedotkách). 1.5 Náhodá veličia Statistický zak zkoumaého áhodého jevu (apř. experimetu) lze popsat pomocí veličiy (tj. projev zaku číselě vyjádřeý). Tato veličia za určitých podmíek (tj. za určitých podchyceých podmíek) vlivem áhodých čiitelů (tj. vlivem určitých epodchyceých podmíek) abývá růzých hodot. Ozačujeme ji proto pojmem áhodá veličia. Náhodou veličiu tedy můžeme defiovat jako číselé vyjádřeí výsledku áhodého jevu projevu kvatitativího ebo kvalitativího zaku, který je předmětem zkoumáí. Např.: Jedoduchým ukazatelem zdravotího stavu je tělesá teplota. Překročí-li tělesá teplota u člověka výrazě 37 C je to zpravidla eklamým ukazatelem edobrého zdravotího stavu. Jedoduše zjistitelá áhodá veličia jako je tělesá teplota ás iformuje o výskytu velmi složitého áhodého jevu emoci. Přirozeě popis áhodého jevu pomocí sado zjistitelých áhodých veliči skrývá v sobě začé ebezpečí jeho zploštěí a musí se proto používat s ejvětší opatrostí. Komplikovaé přírodí jevy áhodého charakteru emůžeme obvykle pomocí áhodých veliči zcela dokoale vyjádřit. Zdálivé upřesěí vyšetřovaého jevu (emoci) jeho převedeím a číselé vyjádřeí pomocí áhodých veliči (teplota aj.) zameá ěkdy jeho podstaté ochuzeí ebo zkresleí jeho obsahu a může vést i ke zcela esprávým závěrům o původě zkoumaém jevu. a) Diskrétí (espojitá) áhodá veličia taková, která může abývat pouze jedotlivých hodot (celých čísel) z koečého ebo ekoečého itervalu, tz. může se měit je po skocích. Např. espojitá áhodá veličia je počet arozeých mláďat v králičím vrhu, počet emocých zvířat ve stádě, počet seseých vajec ve sůšce, počet obilek v klase. 15

16 b) Spojitá áhodá veličia taková, která může abývat všech hodot z koečého ebo ekoečého itervalu, tz. může se měit spojitě bez skoků. Např. spojitá áhodá veličia je tělesá hmotost, teplota těla, kocetrace glukózy v krevím séru, objem adojeého mléka, délka chlupu stříbré lišky apod. Spojitou áhodou veličiu můžeme převést a espojitou tak, že její průběh rozdělíme do itervalů a každý iterval ebude reprezetovat ekoečě hodot, jak je tomu u spojité áhodé veličiy, ale je jeda hodota, obvykle středí hodota itervalu. Např. spojitou áhodou veličiu dojivost dojice abývající všech hodot, apř. od 5 do 15 kg rozdělíme do itervalů 5-7 kg, 7-9 kg, 9-11 kg, kg, kg a tak získáme espojitou áhodou veličiu abývající hodot 6, 8, 10, 1, 14 kg. Nespojitou áhodou veličiu a spojitou obvykle epřevádíme, protože bychom se mohli dopustit emožých závěrů. Např. espojitou áhodou veličiu počet mláďat v králičím vrhu elze převést a spojitou áhodou veličiu, protože počet mláďat 5,35 ve vrhu je emožý (0,35 mláděte emůže astat) Rozděleí áhodé veličiy Z praktického hlediska představuje áhodá veličia všecha data získaá měřeím sledovaého statistického zaku v ějakém pozorováí (experimetu). Prvím krokem při statistickém zpracováí a vyhodoceí těchto dat (áhodé veličiy) bývá roztříděí a uspořádáí aměřeých hodot do přehledé formy (variačí řady, tabulky četostí, grafy). Pojmem variačí řada je ozačováa řada všech hodot (variat) áhodé veličiy, seřazeých vzestupě ebo sestupě. Při opakováém výskytu ěkterých hodot ve variačí řadě používáme pojem četost variaty (počet opakováí daé hodoty, frekvece hodoty). Pro další popisou charakteristiku zkoumaé áhodé veličiy je možo dále použít zhuštěou formu vypočteých zpřehledňujících parametrů a statistik, které používáme pro stručý popis statistických souborů. Přestože áhodá veličia abývá růzých hodot vlivem áhodých čiitelů, přesto výskyt hodot áhodé veličiy podléhá určitým zákoitostem. Zákoitost výskytu hodot áhodé veličiy vyplývá z rozděleí hodot áhodé veličiy. Rozděleí áhodé veličiy vyjadřuje výskyt (četost, frekveci) hodot áhodé veličiy v závislosti a daé hodotě áhodé veličiy. To je důležité pro vytvořeí představy, jak jsou růzé hodoty áhodé veličiy a číselé ose měřeé veličiy rozmístěy. Naopak a základě zalosti rozděleí hodot áhodé veličiy lze pak předvídat výskyt určité hodoty áhodé veličiy. Rozděleí četostí se vyjadřuje poěkud rozdílým způsobem u diskrétích a spojitých veliči. A) Diskrétí (espojitá) áhodá veličia abývá je určitých hodot (ejčastěji celých čísel). Grafickým vyjádřeí rozděleí diskrétí áhodé veličiy je úsečkový graf rozděleí četostí jedotlivých hodot. Např. při sledováí počtu mláďat u výběrového souboru dvaácti vrhů králíků ( = 1) byly pozorováy ásledující počty mláďat, uspořádaé do variačí řady:, 3, 4, 4, 5, 5, 5, 6, 6, 7, 7, 8 16

17 Příklad grafického vyjádřeí rozděleí četostí této variačí řady je zobraze a obr. č Obr. č. 1.1 Rozděleí četostí diskrétí áhodé veličiy B) Spojitá áhodá veličia teoreticky může abývat všech hodot v rámci určitého reálého itervalu. Pro lepší přehledost a zjedodušeí takovéto spojité variačí řady (hlavě u velkých souborů) se při grafickém vyjádřeí rozděleí spojité áhodé veličiy hodoty této veličiy rozdělují do tříd. Třída je přesě defiovaý projev zaku. Představuje přesé vymezeí (přesé defiováí) itervalu hodot áhodé veličiy, přičemž jedotlivé variačí třídy v jedom souboru dat mají obvykle stejou velikost. Každý jediec tedy patří do určitého itervalu třídy. Třída je reprezetováa ejčastěji jediou hodotou středem třídy (ebo itervalem vymezujícím třídu) a počtem hodot zjištěých pro daou třídu. Výskyt hodoty áhodé veličiy v daé třídě je ozačová pojmem četost (frekvece) třídy. Zjišťuje se tak, že se spočítá kolik hodot se v daé třídě vyskytuje, a teto počet představuje četost třídy. Podle vyjádřeí četosti rozlišujeme: a) absolutí četost hodota, která vyjadřuje, kolik hodot se v daé třídě vyskytuje b) relativí četost hodota, která vyjadřuje poměr (%) výskytu hodot v daé třídě k celkovému počtu hodot ve všech třídách (v celém výběrovém souboru). Na rozdíl od áhodých veliči kvalitativích zaků, kdy se třídy vytváří přirozeě (vyplývají z projevu zaku apř. barva srsti králíků má třídy: bílá, šedá, stříbrá, čerá apod.), pro áhodou veličiu kvatitativího zaku se třídy vytváří uměle tj. vytváří je člověk, protože evyplývyjí z projevu zaku. Např. pro hmotost králíků se třídy vytvoří uměle tak, že se přesě vymezí itervaly pro hodoty hmotosti apř. 1,00-1,50 kg, 1,51-,00 kg,,01-,50 kg,,51-3,00 kg, 3,01-3,50 kg, 3,51-4,00 kg. Při řazeí do tříd je vždy uto vycházet z přesosti měřeí původích hodot a meze itervalů tříd staovit tak, aby o každé hodotě sledovaého zaku bylo jasé, do které třídy patří. 17

18 Při staoveí počtu tříd se vždy uplatňuje subjektiví prvek. Počet tříd emá být příliš velký (pracost výpočtů) ai příliš malý (ztráta charakteristických vlastostí materiálu). Za ejvhodější můžeme obvykle považovat tříd. Počet tříd ad 0 je příliš velký, pod 6 příliš malý. Orietačě lze počet tříd staovit podle rozsahu výběrového souboru takto: do 100 jediců do 500 jediců ad 500 jediců 6 9 tříd tříd 16 0 tříd Pro přesější staoveí tříd je vhodé dodržovat ěkteré hlaví zásady, podle ichž se řazeí do tříd (tříděí, grupováí) provádí: U aměřeých dat zjistíme ejmeší a ejvětší číselou hodotu a provedeme jejich odečteí. Tím získáme variačí rozpětí, které rozdělíme a určitý počet stejě velkých dílů. Ve výše uvedeém příkladu pro hmotostí králíků bychom tedy dostali: 4,00-1,00=3,00 kg dělíme 6 (zvoleý počet tříd) a dostaeme 0,5 kg jako velikost třídího itervalu. Všechy hodoty, které jsou v jedotlivých dílech (třídách) obsažey, pak reprezetuje hodota jediá (střed třídy). Rozdíl mezi dvěma po sobě ásledujícími středy tříd azýváme délkou itervalu (třídy). V zásadě by měla být u všech skupi stejá. Jestliže je uto vzhledem k zpracovávaému biologickému materiálu užít estejé délky itervalů, je vhodé staovit pravidelě se zvětšující ebo zmešující itervaly. Při staoveí výchozího bodu a počtu setříděých hodot proměých dbáme a to, aby středy itervalů padly pokud možo a celá čísla, čímž se začě ušetří práce při výpočtech. Pro zjištěí četostí vytvořeých tříd můžeme v praxi použít apříklad čárkovací metodu rozděleí četostí ve třídách, tak jak je uvedeo v Tab V tabulce jsou uvedey četosti hmotostí desetideích kuřat, vážeých s přesostí a celý gram, u výběrového souboru 100 áhodě vybraých kuřat. Tab.1.1 Čárkovací metoda rozděleí četostí ve třídách Váha v g Četost / / //// //// //// //// //// //// //// //// //// //// //// //// //// // //// //// //// //// //// //// /// / Celkem 100 Čárkovací metoda je jedak rychlá, jedak v uvedeé formě přímo přehledě azačuje tvar rozděleí četostí. Podle této tabulky můžeme pak rozděleí četostí zázorit ěkterým z diagramů pro spojitou áhodou veličiu (histogram, polygo). 18

19 Histogram představuje grafické vyjádřeí rozděleí spojité áhodé veličiy, ve kterém jsou a ose x vyzačey třídí itervaly a ad každým itervalem je sestroje obdélík (sloupec), jež vyjadřuje absolutí ebo relativí četost pro daý třídí iterval. Polygo představuje grafické vyjádřeí rozděleí spojité áhodé veličiy, ve kterém jsou a ose x vyzačey středy třídích itervalů a ad každým itervalem je ve středu třídy sestroje bod, jež vyjadřuje absolutí ebo relativí četost pro daý třídí iterval. Body jsou spojey lieárě. Příklad grafického vyjádřeí rozděleí četostí spojité áhodé veličiy (hmotost) pomocí histogramu a polygou je zobraze a obr. č. 1.. Obr. č. 1. Rozděleí četostí spojité áhodé veličiy Polygo jako typ grafického vyjádřeí rozděleí četostí je často používá jak pro spojitou tak i diskrétí veličiu (u této pak lieárě spojujeme vrcholy úseček úsečkového grafu). Polygo tak představuje ejčastější typ grafického vyjádřeí rozděleí četostí áhodých veliči kvatitativích statistických zaků. Tvar polygou je specifický pro každý kokrétí výběrový soubor, a kterém bylo provedeo sledováí daé áhodé veličiy. Pro polygo proto často používáme pojem empirická křivka rozděleí áhodé veličiy. Při opakovaém měřeí stejé áhodé veličiy u jediců z jiého výběrového souboru, který byl vybrá z téže populace dostaeme poěkud jiý tvar empirické křivky (projev geeticky podmíěé variability jediců výběrového souboru). Všechy empirické křivky pro možé výběry z téže populace se pohybují přibližě okolo teoretické křivky, která je spojitě vyhlazeá a popisuje pravděpodobostí rozděleí áhodé veličiy u celého základího souboru. Tuto křivku pravděpodobostího rozděleí sledovaé háhodé veličiy elze získat a základě výsledků praktických měřeí, můžeme ji pouze teoreticky předpokládat a odhadovat její tvar a základě empirických křivek výběrových souborů z daé populace. Křivka pravděpodobostího rozděleí áhodé veličiy by teoreticky vzikla ekoečým zvětšováím výběrového souboru při ekoečém zmešeí tříd. Přitom čím větší bude výběrový soubor, tím přesěji se bude blížit empirická křivka skutečému tvaru křivky 19

20 teoretické pro daou áhodou veličiu. Protože u ekoečě velkého základího souboru elze použít pojem absolutí četost (a ose y), jako tomu bylo v případě empirických křivek četostí pro výběrové soubory, je u teoretické křivky rozděleí používá a ose y pojem hustota pravděpodobosti f(x) pro výskyt jedotlivých hodot x i sledovaé veličiy X.. Tato pravděpodobostí fukce vyjadřuje pravděpodobost, že áhodá veličia X abude hodoty x (viz dále). Příklad grafického vyjádřeí pravděpodobostího rozděleí spojité áhodé veličiy (hmotost) pomocí teoretické křivky rozděleí v základím souboru (ZS) ve vztahu k empirickým křivkám rozděleí četostí daé áhodé veličiy ve výběrových souborech (VS) je zobraze a obr. č Obr. č. 1.3 Rozděleí pravděpodobostí áhodé veličiy Typy pravděpodobostích rozděleí Velká řada biologických zaků odpovídá ormálímu (Gaussovu) rozděleí pravděpodobostí, které je symetrické většia hodot v populaci je rozmístěa kolem středí hodoty a aopak extrémě ízké a vysoké hodoty mají v populaci ejižší pravděpodobost výskytu. Některé z biologických zaků (apř. v medicíě) však tomuto rozděleí eodpovídají křivky jejich pravděpodobostích rozděleí pak mohou abývat růzých tvarů (asymetrické, epravidelé ap.). Příklady růzých typů pravděpodobostích rozděleí pro spojitou áhodou veličiu jsou uvedey a obr Obr. 1.4 Růzé typy pravděpodobostích rozděleí spojité áhodé veličiy a) Normálí, symetrické (Gaussovo) 0

21 b) Asymetrické (vrchol křivky posuut doleva, doprava) ad b) Extrémí (pouze klesající, stoupající) c) Nezámé (epravidelé, dvou- i vícevrcholové) Distribučí fukce Rozděleí pravděpodobostí áhodé veličiy vyjadřuje pravděpodobost výskytu hodoty áhodé veličiy v závislosti a její hodotě. Kromě pravděpodobostí fukce f (x) hustota pravděpodobosti ji můžeme vyjádřit i distribučí fukcí F(x). Z teoretického hlediska představuje distribučí fukce F(x) ejúplější popis pravděpodobostího chováí diskrétí ebo spojité áhodé proměé X. Distribučí fukce F(x) vyjadřuje pravděpodobost, že áhodá proměá (veličia X) abude hodoty meší (případě rové) ež určitá hodota x. Distribučí fukce F(x i ) je tedy vždy přiřazea ke kokrétí hodotě áhodé veličiy x i. V symbolech můžeme distribučí fukci vyjádřit ásledově: F(x i ) = P(X x i ) Distribučí fukce je defiováa pro všecha reálá čísla x, má tedy smysl pro hodoty v itervalu: - < x < +. Pro tato reálá čísla pak distribučí fikce F(x i ) může abývat hodot v itervalu 0 ; +1. Tyto hraičí hodoty itervalu dostaeme při dosazeí extrémích hodot x (tz. x = - a x = +) za x i. Dostaeme tedy: F(-) = 0, protože pravděpodobost P(X -) je emožá F(+) = 1, protože pravděpodobost P(X +) je jistá 1

22 Distribučí fukce F(x) je fukce eklesající, tedy když x i < x j, pak F(x i ) F(x j ). Distribučí fukce F(x) může být ebo emusí být spojitá. Jestliže je F(x) spojitá fukce, pak příslušá áhodá proměá je spojitá. Pro počítáí pravděpodobostí platí vzorce: P(x 1 < X x ) = F(x ) F(x 1 ) P(X > x) =1 F(x) Chováí diskrétí áhodé veličiy lze popsat pravděpodobostí fukcí p(x)= P(X = x). Záme-li pravděpodobostí fukci, umíme dopočítat distribučí fukci, a aopak. Chováí spojité áhodé veličiy lze popsat podobým ekvivaletem pravděpodobostí fukce. Má-li F(x) pro všecha x derivaci, azýváme tuto derivaci hustotou pravděpodobosti eboli frekvečí fukcí f(x) áhodé proměé X (viz obr. č.1.3 a obr. č.1.5). Hustota pravděpodobosti f(x) vykazuje podobé vlastosti jako p(x) = P(X = x) u diskrétích áhodých proměých. Distribučí fukce spojité áhodé proměé, pokud existuje její hustota, se spočítá pomocí itegrace: x F ( x) f ( x) dx Pro diskrétí áhodou proměou spočítáme její distribučí fukci jedoduše pomocí pravděpodobostí fukce jako součet hodot pravděpodobostí fukce: F ( x) x x i p i Což zameá, že distribučí fukce má v bodě x hodotu součtu těch pravděpodobostí jedotlivých hodot x i, které jsou meší ebo rové x. Distribučí fukci F(x i ) lze graficky vyjádřit jako plochu pod křivkou pravděpodobostího rozděleí, ohraičeou v hodotě x i. Příklad pro grafické vyjádřeí distribučí fukce F(x i ) Gausssova ormálího rozděleí, defiovaé pro bod x i je zobrazea a obr. č.1.5 (vyšrafovaá část plochy pod křivkou). Obr. č. 1.5 Distribučí fukce F(x i ) Hustota pravděpodobosti

23 Na výše uvedeém grafu je zázorě příklad distribučí fukce pro Gaussovo ormálí rozděleí v bodě x i, který je rove středí hodotě populace (mediáu). Celková plocha pod křivkou zde symbolicky vyjadřuje celou populaci (100% jediců), zatímco vyšrafovaá část plochy pod křivkou zobrazuje distribučí fukci v bodě x i. Distribučí fukce zde tedy symbolicky popisuje podíl jediců, kteří mají svoje hodoty meší (případě rové) ež je hodota x i. V tomto případě je to 50% populace (distribučí fukce F(x i ) = 0,5). Hodoty distribučích fukcí odpovídající růzým hodotám x jsou pro ejdůležitější a ejběžější typy rozděleí spojitých i espojitých veliči již spočítáy, zaesey ve statistických tabulkách a lze je využívat pro statistické výpočty (viz Příloha Tab. č. Distribučí fukce ormovaého ormálího rozděleí). S pojmem distribučí fukce úzce souvisí pojem kvatil. Kvatil je libovolá hodota áhodé proměé (sledovaého zaku) x, která rozděluje soubor dat a dvě části : - podíl hodot ižších (případě rových) ež je kvatil - podíl hodot vyšších ež je kvatil. Kvatil x p s hladiou p spojité áhodé proměé X s distribučí fukcí F je defiová rovicí: F(x p ) = p Což zameá, že každému kvatilu (libovolé hodotě áhodé proměé) x p, je defiováa jeho odpovídající distribučí fukce F(x p ), kterou vyjadřujeme v podobě pravděpodobosti p (v grafickém vyjádřeí je to část plochy pod křivkou pravděpodobostího rozděleí, ohraičeá kvatilem x p ). Např. 0% kvatil (x 0, ) je hodota, která rozdělí plochu pod křivkou pravděpodobostího rozděleí tak, že 0% souboru má hodoty sledovaé proměé meší (případě rové) ež kvatil x 0, a 80% souboru má hodoty větší ež kvatil x 0,. Mezi kvatily zaujímá výzamé místo 50% kvatil, tzv. mediá (x 0,5 ), který čleí statistický soubor a dvě stejě četé poloviy. Odděluje 50% ízkých hodot sledovaého statistického zaku (áhodé proměé) od 50% vysokých hodot zaku v souboru. Jiými důležitými kvatily používaými ve statistice jsou kvartily (x 0,5, x 0,5, x 0,75 ), které rozdělují soubor hodot áhodé proměé a čtvrtiy, dále decily, percetily ad. 3

24 Kapitola Typy rozděleí áhodé veličiy (spojitá veličia) V kapitole 1 jsme pozali, jakým způsobem získáme empirickou křivku rozděleí četostí hodot sledovaé áhodé veličiy u výběrového souboru a víme, že empirické křivky rozděleí daé veličiy u růzých výběrových souborů vybraých z téže populace, lze použít pro odhadováí tvaru teoretické křivky pravděpodobostího rozděleí sledovaé veličiy v celém základím souboru. Pravděpodobostí rozděleí pro růzé áhodé veličiy může teoreticky abývat ekoečě moho růzých tvarů křivek (apř. ormálí, asymetrické, extrémí, epravidelé aj. rozděleí). V ásledující kapitole bude uvede výběr ěkterých ejčastěji používaých typů pravděpodobostích rozděleí, důležitých při statistické aalýze biologických a medicíských dat. Z praktického hlediska můžeme rozlišit dvě skupiy pravděpodobostích rozděleí rozděleí používaá ve statistice pro popis rozděleí áhodých veliči u základích souborů a rozděleí používaá pro popis rozděleí áhodých veliči u výběrových souborů.. 1 Pravděpodobostí rozděleí pro základí soubory Pro popis áhodých veliči, s kterými pracujeme ve statistice u základích souborů, používáme ejčastěji ásledující pravděpodobostí rozděleí: Gaussovo ormálí rozděleí, ormovaé ormálí rozděleí, ezámé rozděleí..1.1 Gaussovo ormálí rozděleí Při statistické aalýze biologických a medicíských dat zaujímá Gaussovo ormálí rozděleí zcela výsadí postaveí. Normálím rozděleím se řídí velké možství áhodých veliči v biologii (ebo je zde alespoň předpokládáo), apř. tělesé rozměry áhodě vybraé osoby, váha áhodě vybraé myši, délka zadí kočetiy u áhodě vybraého laboratorího králíka, kapacita plic u áhodě vybraého pacieta, hmotost vejce u áhodě vybraé osice apod. Při statistické aalýze bývá ormalita rozděleí podmíkou použití těch ejúčiějších statistických metod, takže ěkdy je uto provádět trasformaci áhodých veliči tak, aby získaly ormálí rozděleí. Moho sledovaých biologických proměých, které se tímto rozděleím vůbec eřídí, můžeme také aproximativě (tz. s uspokojivým přiblížeím) modelovat pomocí tohoto rozděleí, především u statistických souborů s velkým počtem jediců. Vzik ormálího rozděleí si můžeme představit takto: kdyby ebylo áhodých vlivů, abyla by ějaká sledovaá veličia (apř. tělesá výška v kolektivu dospělých osob) kostatí hodotu. Představme si yí, že do hry vstupuje velké možství drobých a ezávislých 4

25 áhodých vlivů v 1, v, v 3,., jejichž hodoty mírě kolísají kolem uly (a tělesou výšku každé z osob působila během růstu řada impulsů, z ichž každý sám o sobě přispěl k celkové výšce epatrou hodotou v i ). Předpokládejme, že tyto áhodé vlivy se ke kostatě přičítají, přičemž se tedy i sledovaá veličia stae áhodou. X = + v 1 +v +v 3. Tato áhodá veličia X má v celém základím souboru ormálí rozděleí závislé a středí hodotě a směrodaté odchylce > 0, která charakterizuje variabilitu áhodé veličiy X (blíže viz kap. 3: Popisé charakteristiky statistických souborů). Grafickým vyjádřeím Gaussova ormálího rozděleí je zvoovitá křivka, symetrická kolem středí hodoty ( parametr polohy udává polohu křivky a ose x). Šířku křivky v tzv. iflexím bodě (bod obratu křivky) udává směrodatá odchylka ( parametr rozptýleí ). Příklad grafického vyjádřeí Gaussova ormálího rozděleí pro áhodou veličiu (apř. těleá výška) je uvede a obr. č..1. Obr..1 Gaussovo ormálí rozděleí pravděpodobostí X = spojitá áhodá veličia (tělesá výška) f(x)= hustota pravděpodobosti áhodé veličiy X = středí hodota áhodé veličiy X = směrodatá odchylka áhodé veličiy X 5

26 Jak je vidět z grafu, tvar křivky Gaussova ormálího rozděleí je ovlivě a plě charakterizová parametry a. Zkráceě můžeme ozačit Gaussovo ormálí rozděleí se středí hodotou a směrodatou odchylkou symbolem GNR (; ). Přesější iterpretaci parametru rozptýleí přibližují vztahy, které uvádějí pravděpodobosti růzých itervalů kolem středu rozděleí. Pro každé Gaussovo ormálí rozděleí GNR (; ) platí: V rozmezí hodot 1 se vyskytuje 68,3 % všech jediců populace. V rozmezí hodot se vyskytuje 95,5 % všech jediců populace. V rozmezí hodot 3 se vyskytuje 99,7 % všech jediců populace. Výskyt zbývajících 0,3 % hodot souboru (oba extrémí koce osy x) je tak málo pravděpodobý, že z hlediska statistiky jsou takové hodoty považováy za chybu měřeí ( extrémí hodoty ) a vylučují se z dalšího hodoceí (blíže viz Grubbsův test v kap. 5 Vylučováí extrémích hodot souboru)..1. Normovaé ormálí rozděleí Zvláští místo ve třídě ormálích rozděleí zaujímá ormovaé (eboli stadardizovaé) ormálí rozděleí. Zkráceě ho lze ozačit symbolem NNR (0; 1). Je to tedy ormálí rozděleí se středí hodotou, která je rova 0 a směrodatou odchylkou, která je rova vždy 1. Někdy se toto rozděleí azývá U-rozděleí (případě Z-rozděleí), protože je defiováo pro teoreticky odvozeou veličiu U, kterou dostaeme trasformací původí áhodé veličiy X tak, že od í odečteme středí hodotu celé populace a rozdíl vydělíme směrodatou odchylkou: U X X měřeá áhodá veličia (absolutí hodoty zaku x i ) s GNR o parametrech a U ormovaá veličia (relativí hodoty u i ) s NNR o parametrech (N) = 0 a (N) = 1 Trasformací získaé hodoty ormovaé veličiy U jsou relativí (bezrozměré), přičemž každá hodota u i udává počet směrodatých odchylek od středí hodoty 0. Například pro hodotu x = 115 z původí veličiy s Gaussovým ormálím rozděleím se středí hodotou 100 a směrodatou odchylkou 15 je pomocí výše uvedeé trasformace vypočítáa hodota u = +1, která také zameá, že hodota 115 leží jedu směrodatou odchylku ad průměrem. Pro hodotu x = 85, z původí veličiy s Gaussovým ormálím rozděleím se středí hodotou 100 a směrodatou odchylkou 15 by byla vypočteá hodota u = -1, která bude zameat, že hodota 85 leží jedu směrodatou odchylku pod průměrem. Příklad grafického vyjádřeí ormovaého ormálího rozděleí pro áhodou veličiu U je uvede a obr. č... 6

27 Obr.. Normovaé ormálí rozděleí pravděpodobostí U = ormovaá áhodá veličia získaá trasformací f(u)= hustota pravděpodobosti ormovaé áhodé veličiy U = středí hodota ormovaé áhodé veličiy U = směrodatá odchylka ormovaé áhodé veličiy U Tvar křivky ormovaého rozděleí je prakticky shodý tvarem křivky Gaussova ormálího rozděleí křivka je zvoovitá, symetrická kolem středí hodoty. Liší se pouze posuem a ose x (střed souměrosti křivky NNR, tz středí hodota je posuuta do hodoty 0) a jedotkovou šířkou (směrodatá odchylka = 1). Podobě platí i shoda v procetuelím zastoupeí výskytu hodot v itervalech daých směrodatými odchylkami symetricky kolem středí hodoty. Normovaé hodoty veličiy U spolu s jejich distribučími fukcemi F(u) jsou tabelováy ve statistických tabulkách (viz Příloha Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí). Distribučí fukce ormovaého ormálího rozděleí je možo využívat při zjišťováí pravděpodobosti, že daá hodota pade do určitého itervalu (viz příklad.1). Příklad.1: Předpokládejme, že váha laboratorích myší v chovu má přibližě GNR okolo = 95 g se směrodatou odchylkou = 14 g. 7

28 Postup řešeí: Jaký podíl myší v tomto chovu přesáhe váhu 10 g? 1. Trasformace sledovaé veličiy (hodota 10 g) a ormovaou hodotu u: u i , Ve statistických tabulkách (Příloha Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí) ajdeme pro u i = 1,79 distribučí fukci F(u i ) = 0,963 (tato vyjadřuje pravděpodobost, že ormovaá áhodá veličia U bude meší ež je hodota 1,79). ež 1,79: 3. Dopočtem do 1 získáme pravděpodobost, že ormovaá áhodá veličia U bude větší 1-0,963 = 0,037 = 3,7 % Závěr: Ve sledovaém chovu přesáhe 3,7 % myší váhu 10 g..1.3 Nezámé rozděleí Některé statistické zaky (spojité áhodé veličiy) sledovaé v biologických a lékařských vědách eodpovídají Gaussovu ormálímu rozděleí pravděpodobostí mají pak obvykle růzě epravidelou křivku rozděleí, často vícevrcholovou a asymetrickou. Hovoříme o tzv. ezámém rozděleí pravděpodobostí, které pro epravidelost křivky elze popsat přesými parametry, určujícími střed symetrie ai šířku křivky, jako tomu bylo u Gausova ormálího rozděleí. Pro popis ezámého rozděleí je používáa jediá charakteristika mediá ~. Mediá je považová za střed ezámého rozděleí, šířku křivky ezámého rozděleí elze pro její epravidelost určovat. Protože je mediá defiová jako 50 % kvatil, dělí plochu pod křivkou rozděleí a poloviy, symbolicky zázorňující podíl jediců (50 %) v populaci, kteří mají hodoty sledovaého zaku ižší ež mediá a podíl jediců (50 %) v populaci, kteří mají hodoty sledovaého zaku vyšší ež mediá. Příklady grafického vyjádřeí ezámého rozděleí pro spojitou áhodou veličiu jsou uvedey a obr. č..3. Obr..3 Nezámé rozděleí pravděpodobostí 8

29 . Pravděpodobostí rozděleí pro výběrové soubory V rámci statistické aalýzy počítáme z dat sledovaých áhodých veliči růzé statistiky (určité fukce ormálě rozděleých áhodých veliči) a provádíme jejich iterpretaci pomocí metod statistického usuzováí (statistické idukce). Cílem statistického usuzováí je získat představu o vlastostech zkoumaých jevů a úrovi celé populace a to a základě dat získaých z jedoho ebo ěkolika výběrových souborů. O statistické idukci budou pojedávat ásledující kapitoly (viz kap. Odhady parametrů statistických souborů, Testováí statistických hypotéz ad.). V této kapitole popíšeme áhodé chováí ěkterých důležitých statistik, které používáme v oblasti statistického usuzováí při práci s výběrovými soubory. Jiými slovy, budeme se zabývat pravděpodobostím rozděleím těchto statistik. Tyto pozatky ám pomohou při výkladu postupů a metod statistického usuzováí. Výběrové rozděleí statistiky je pravděpodobostí rozděleí hodot, které statistika abývá ve všech možých výběrech o daém rozsahu ze specifikovaé populace. Kdybychom provedli kompletí výběr všech jediců z populace a spočítali pro sledovaou proměou popisé statistiky (apř. průměr ebo směrodatou odchylku), zjistili bychom parametry jejího statistického chováí zcela přesě. V případě, že máme k dispozici pouze výběr z populace o rozsahu jediců, vypočítáme pomocí ěho jeom odhady parametrů rozděleí. Tyto odhady jsou statistikami a budou se pravděpodobě lišit od skutečých hodot parametrů. Jestliže provedeme další výběr z téže populace, ové statistiky se budou lišit také od těch, jež jsme spočítali z prvího výběru. Tyto diferece jsou zámé pod ázvem výběrová variabilita. Takto pojatou statistiku lze jistě považovat za áhodou proměou. Její rozděleí azýváme výběrové rozděleí. Pro popis áhodých veliči (statistik), s kterými pracujeme v matematicko-statistických úlohách a základě výběrových souborů, používáme ejčastěji ásledující pravděpodobostí rozděleí: Studetovo t-rozděleí, (čti chí-kvadrát) rozděleí (Pearsoovo) a F-rozděleí (Fisher- Sedecorovo)...1 Studetovo t-rozděleí Studetovo rozděleí platí pro teoreticky odvozeou veličiu t, která vzike trasformací ormálího rozděleí (áhodé veličiy X), podobě jako tomu bylo u ormovaého ormálího rozděleí, kde jsme však zali směrodatou odchylku celé populace. V případě, kdy pracujeme s výběrovými soubory z populace, u které ezáme skutečou směrodatou odchylku a pouze ji odhadujeme pomocí výběrové směrodaté odchylky s, používáme ásledující trasformaci: X t s Trasformací vytvořeá veličia t se řídí Studetovým t-rozděleím a používáme ji ve statistice apř. při výpočtech spojeých s testováím rozdílu průměrů (středích hodot). (t-rozděleí bylo publikováo v r agl. chemikem W.S.Gossetem pod pseudoymem Studet ) Studetovo t-rozděleí zohledňuje ve svém grafickém vyjádřeí a při statistických výpočtech chybu výběrových souborů, která je způsobea omezeým počtem jediců výběrového souboru vzhledem k celé populaci. 9

30 Příklady grafického vyjádřeí Studetova t-rozděleí pro růzě velké výběrové soubory jsou uvedey a obr. č..4. Obr..4 Studetovo t-rozděleí t = t-statistika (áhodá veličia získaá trasformací) f(t) = hustota pravděpodobosti t-statistiky = rozsah výběrového souboru = počet stupňů volosti výběrového souboru (viz íže) Studetovo t-rozděleí je podobé ormovaému ormálímu rozděleí v tom, že je symetrické kolem uly a má zvoovitý tvar. Na rozdíl od ěho je však Studetovo t-rozděleí tvořeo celou třídou rozděleí (skupiou křivek), používaých pro růzé výběrové soubory. Šířka křivky t-rozděleí je specifická pro jedotlivé výběry podle velikosti výběrového souboru (přesěji podle stupňů volosti výběrového souboru: = -1). U malých výběrů je křivka ižší a širší, aopak při zvětšováí ve výběru se křivka zvyšuje a zužuje (přesá šířka je dáa vztahem: /-). V případě ekoečého zvětšeí výběrového souboru ( = ), splye křivka Studetova t- rozděleí s ormovaým ormálím rozděleím pro základí soubor, kde = 0 a = 1. Jiými slovy, s rostoucím se tvar t-rozděleí aproximativě blíží k ormálímu rozděleí. Naopak, čím meší bude výběrový soubor, tím rozdílější bude tvar křivky (plošší a širší) oproti ormálímu rozděleí. Hodoty t-rozděleí jsou tabelováy ve statistických tabulkách v podobě ejčastěji používaých kvatilů, které odpovídají určitým distribučím fukcím, zohledňujícím pravděpodobost chyby při statistických výpočtech (viz Příloha Tab. č. 3: Kvatily t 1-α/ () Studetova t-rozděleí). Tyto specifické kvatily t-rozděleí jsou pak využíváy apř. jako: kritické hodoty při statistickém testováí rozdílu průměrů (viz kap. 7 Parametrické testy: Studetův t-test) koeficiety při výpočtu itervalů spolehlivosti průměru (viz kap. 4 Odhady parametrů základího souboru). 30

31 .. Pearsoovo rozděleí (chí-kvadrát rozděleí) Pearsoovo rozděleí je defiováo pro teoreticky odvozeou veličiu, kterou používáme ve statistice při výpočtech spojeých apř. s testováím rozdílů četostí souborů v oblasti omiálích (kategoriálích) statistických zaků ebo při zkoumáí variability rozptylu a v moha dalších situacích. Rozděleí poprvé odvodil K. Pearso kolem roku 1900, kdy avrhl -test dobré shody pro kategoriálí data. Toto rozděleí má pouze jede parametr, který azýváme stupě volosti (). Počet stupňů volosti má úzký vztah k velikosti sledovaého výběrového souboru, případě k počtu tříd v tomto souboru. Příklady grafického vyjádřeí Pearsoova -rozděleí pro růzé výběrové soubory jsou uvedey a obr. č..5. Obr..5 Pearsoovo rozděleí (chí-kvadrát rozděleí) = chí-kvadrát statistika f( )= hustota pravděpodobosti -statistiky = počet stupňů volosti výběrového souboru Křivka je asymetrická, začíající v ule, rychle stoupající podél osy y a poté pozvola klesající směrem doprava v kladé části osy x. U malých výběrů je asymetrie a výška křivky začá a aopak u velkých souborů se křivka stává symetričtější a plošší - podobá ormálímu rozděleí ( ormalizace rozděleí: při vysokých počtech je možo -rozděleí aproximovat ormálím rozděleím). Hodoty statistiky jsou tabelováy ve statistických tabulkách v podobě ejčastěji používaých kvatilů (viz Příloha Tab. č. 4a, b Kritické hodoty rozděleí ) a používají se ve statistických výpočtech apř. jako: kritické hodoty při statistickém testováí rozdílu četostí (viz kap. 6 Testováí hypotéz: -test) koeficiety při výpočtu itervalů spolehlivosti pro rozptyl, příp. směrodatou odchylku (viz kap. 4 Odhady parametrů základího souboru). 31

32 ..3 Fisher-Sedecorovo F-rozděleí Také F-rozděleí, pojmeovaé po R.A.Fisherovi a G.W.Sedecorovi, ašlo uplatěí při popisu áhodého chováí testovacích statistik. F-rozděleí je defiováo pro teoreticky odvozeou veličiu F, kterou používáme ve statistice při výpočtech spojeých s testováím rozdílu rozptylů. Základem je saha popsat variabilitu poměru výběrových rozptylů (s 1 a s ), jež se vypočítaly z dat dvou ezávislých áhodých výběrů. Podobě jako u rozděleí, musí být data ormálě rozděleá. Navíc se předpokládá, že data pocházejí z populací, které mají stejý teoretický rozptyl. Pak platí, že hodoty s 1 / s mají rozděleí F se stupi volosti 1 = 1-1 a = -1, kde 1 a jsou rozsahy výběrových souborů. Tvar křivky F-rozděleí tedy závisí a dvou parametrech 1 a. Teoreticky je F-rozděleí s 1 a stupi volosti odvozeo jako podíl dvou ezávislých -rozděleí s 1 a stupi volosti. Příklady grafického vyjádřeí F-rozděleí pro růzé výběrové soubory v závislosti a stupích volosti jsou uvedey a obr. č..6. Jak je možo vidět z obrázku, křivka F-rozděleí je asymetrická, začíající v ule, v krátkém úseku stoupající podél osy y a po obratu pozvola klesající směrem doprava v kladé části osy x. U malých výběrů je asymetrie velká a křivka ízká a aopak u velkých souborů se křivka stává symetričtější a vyšší (podobá ormálímu rozděleí ormalizace rozděleí při vysokých počtech ). Platí tedy stejé pravidlo, jako u rozděleí, že při velkém rozsahu výběrových souborů lze F-rozděleí aproximovat ormálím rozděleím). Hodoty F veličiy jsou tabelováy ve statistických tabulkách v podobě ejčastěji používaých kvatilů (Příloha Tab. č. 8 Kvatily Fisher-Sedecorova rozděleí) a používají se apř. jako kritické hodoty při statistickém testováí rozdílu rozptylů (viz kap. 7 Parametrické testy: F-test). Obr..6 Fisher-Sedecorovo F rozděleí F = F-statistika získaá podílem výběrových rozptylů f(f) = hustota pravděpodobosti F-statistiky 1, = počet stupňů volosti výběrových souborů 3

33 Kapitola 3 Popisé charakteristiky statistických souborů Cílem statistického zpracováí údajů je: a základě získaých dat výběrového souboru (výběrových souborů) získat představu o vlastostech zkoumaých jevů a úrovi základího souboru (celé populace). Prvím krokem je obvykle roztříděí aměřeých dat výběrového souboru podle hodot aalyzovaého zaku a sestaveí tabulek a grafů četostí, které poskytou základí iformace o souboru a výchozí materiál pro další statistické metody hodoceí sledovaého zaku. Následuje hlubší aalýza, kdy se sažíme pomocí určitých jedozačě defiovaých parametrů (statistických charakteristik) shrout iformace o vlastostech základího souboru do jedoho ebo ěkolika čísel. Pro charakteristiku vlastostí základího souboru je možo použít ěkolik popisých statistických charakteristik (parametrů). Např. jedou z typických vlastostí velkého počtu základích souborů (populací) je vlastost, že převážá většia hodot sledovaých statistických zaků v těchto populacích se vyskytuje přibližě uprostřed rozmezí měřitelých pozorováí celé populace. Proto by bylo vhodé pro každou populaci vyjádřit ějaký idikátor průměru hodot sledovaé veličiy jako jedu ze základích popisých charakteristik základího souboru. Tyto idikátory, udávající iformaci o tom, kde se achází střed souboru, se obecě azývají středí hodoty (patří k im apř. aritmetický průměr, mediá a další parametry uvedeé íže). Další důležitou vlastostí statistických souborů je rozptýleí hodot sledovaé veličiy kolem středu souboru. Některé statistické zaky mohou být velmi promělivé (variabilí) ve svých hodotách v populaci, jié aopak vykazují velmi úzkou kocetraci pozorovaých hodot kolem středu celé populace. Statistické charakteristiky popisující vlastosti, které se týkají se rozptýleí hodot v souboru se obecě azývají míry variability (promělivosti). Patří k im apř. variačí rozpětí, rozptyl, směrodatá odchylka ad. Pro popisé charakteristiky statistických souborů jako jsou středí hodoty ebo míry variability je používá pojem parametr, pokud se jedá o popis či charakteristiku základího souboru (populace) a jejich přesé staoveí pro sledovaé biologické zaky a vlastosti populací je cílem popisé statistiky. Jak již bylo zmíěo dříve, ejsme bohužel obvykle v praxi schopi obsáhou do statistického šetřeí celou populaci, tak aby bylo možo přesě staovit skutečé hodoty těchto popisých parametrů. Proto postupujeme tak, že ze základího souboru vybereme jede ebo ěkolik výběrových souborů a z těchto výběrových dat vypočteme tzv. výběrové charakteristiky, které se pak používají při odhadováí skutečých parametrů základího souboru. Výpočtem odhadů přesých hodot parametrů základího souboru se zabývají speciálí statistické metody odhadováí parametrů (viz kap. 4 Odhady parametrů základího souboru) Podle zavedeé statistické kovece se používají pro ozačováí skutečých (přesých) parametrů populace řecká písmea a pro ozačováí výběrových charakteristik (odhadů skutečých parametrů) písmea latiské abecedy. 33

34 Mezi ejčastěji používaé charakteristiky středu statistického souboru patří: středí hodota (aritmetický průměr), mediá, modus, geometrický průměr. Mezi ejčastěji používaé charakteristiky variability souboru patří: variačí rozpětí, rozptyl, směrodatá odchylka, variačí koeficiet, středí chyba průměru (směrodatá chyba průměru) Středí hodoty V základích i výběrových souborech je možo obvykle alézt převážou většiu hodot sledovaého statistického zaku (především biologických vlastostí) přibližě v místě, kde se achází střed celého rozmezí pozorovaých hodot. Pro vyjádřeí této kocetrace hodot blízko středu souboru se používají středí hodoty, které slouží zároveň i jako charakteristiky (ukazetele) polohy sledovaé áhodé veličiy a vodorové ose v pravoúhlé soustavě souřadic. Ukazatel polohy vyjadřuje vzdáleost středí hodoty od bodu 0 (počátku souřadicových os). To je důležité pro představu, kde se áhodá veličia a její rozděleí četostí (pravděpodobostí) vyskytuje a ose x. Např. ukazatel polohy pro hmotost laboratorích králíků apř.,6 kg při krmé dietě bez podáí stimulujících přípravků říká, že ve srováí s ukazatelem polohy 3, kg pro králíky s podáím stimulujících přípravků, je hmotost králíků po podáí stimulujících přípravků více vpravo, tz. hmotost těchto králíků je vyšší Středí hodota (aritmetický průměr, The Arithmetic Mea, AVG - average) Ozačeí: (základí soubor), x (výběrový soubor) Pojem středí hodota je obvykle používá, máme-li a mysli přesý parametr popisující skutečý střed (průměr) základího souboru, kdežto pojem aritmetický průměr je vymeze v obvyklé termiologii pro průměr výběrového souboru. Středí hodota (aritmetický průměr) je defiová jako fukce všech hodot daé proměé, kdy součet všech hodot áhodé proměé x i dělíme jejich počtem. Vypočteý průměr pak udává, jaká stejá část z úhru hodot sledovaé číselé proměé připadá a jedu jedotku souboru (jedoho jedice). Má smysl všude, kde má ějaký iformačí smysl součet hodot sledovaé áhodé proměé. Výpočet středí hodoty (průměru) pro základí soubor: i 1 N xi Středí hodota představuje přesý (skutečý) parametr základího souboru a její výpočet je možý pouze teoreticky, protože počet hodot základího souboru (N) eí většiou přesě zám (teoreticky je rove ). Pro odhad teoretické skutečé středí hodoty základího souboru se používá aritmetický průměr x, který lze empiricky vypočítat pro výběrový soubor, s použitím koečého počtu jediců áhodě vybraých ze základího souboru: x i 1 xi 34

35 Příklad 3.1: Předpokládejme, že jsme v experimetu dostali řadu 17 čleů: 5,, 5, 7, 13, 4, 10, 9, 5, 6, 8, 3, 5, 9, 6, 4, 5 Variačí řada:, 3, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9,10, 13 Výpočet aritmetického průměru: x i1 xi 106 6,4 17 Z vypočteé hodoty vidíme, že aritmetický průměr emusí být (oproti mediáu ebo modusu) skutečě se vyskytující obměou daé proměé. Má však řadu důležitých vlastostí, které emá apř. mediá. K im patří apř.: Průměr je ovlivě extrémími hodotami, pokud se v souboru vyskytují (eboli: při změě kterékoli hodoty x i se měí i průměr souboru). Pod pojmem extrémí hodoty souboru rozumíme tzv. odlehlá pozorováí, což bývá obvykle jeda ebo ěkolik málo hodot áhodé proměé, které jsou oproti ostatím zjištěým hodotám příliš malé ebo příliš velké. Průměr je správou charakteristikou středu souboru pouze tehdy, je-li soubor z hlediska zkoumaého zaku dostatečě stejorodý (odpovídá Gaussovu ormálímu rozděleí pravděpodobostí). V ostatích případech, hlavě při malém rozsahu souboru, může být aritmetický průměr zkresle případými extrémími hodotami souboru a eí pak správou charakteristikou středu souboru (to platí i v případě epravidelých či vícevrcholových rozděleí četostí). Vyásobí-li se aritmetický průměr rozsahem souboru, získá se vždy součet hodot daé proměé (ahradíme-li jedotlivé hodoty zaku jejich průměrem, součet souboru se ezměí): x i. x Tato vlastost vyplývá přímo z defiice aritmetického průměru. Součet odchylek jedotlivých hodot sledovaé proměé od jejich aritmetického průměru je vždy ulový: x i x 0 Tato vlastost vyplývá bezprostředě z předchozí vlastosti a tím i z defiice aritmetického průměru. Přičte-li se ke všem hodotám (odečte-li se od všech hodot) proměé X libovolá kladá hodota a, potom je i aritmetický průměr větší (meší) o tuto kostatu: X a xi a xi a x a i1 i1 Násobí-li se všechy hodoty proměé X eulovou kostatou (g 0), potom je i aritmetický průměr zásobe touto kostatou. X. g 1 1 xi g g xi x. g i1 i1 35

36 Aritmetický průměr, počítaý výše uvedeým způsobem z řady hodot x i jejich součtem a ásledým děleím počtem hodot, se azývá prostý (jedoduchý) aritmetický průměr. Jestliže máme pro výpočet průměru k dispozici již sestaveou tabulku četostí (záme rozděleí četostí), můžeme počítat x podle vzorce vážeého aritmetického průměru, v ěmž jedotlivé variaty zaku ásobíme jejich četostmi výskytu. Toho lze využít především u spojitých veliči, kde pracujeme s třídami a jejich četostmi. Pokud počet tříd ozačíme k, středy třídy v tomto případě představují jedotlivé hodoty x i, které ásobíme četostmi jedotlivých tříd (f i ), čímž dostaeme vážeý aritmetický průměr: x k i 1 x i. f i Při tomto způsobu výpočtu aritmetického průměru, jsou jedotlivým variatám proměé X přisuzováy růzé závažosti (váhy), daé v tomto případě absolutími četostmi jejich výskytu v jedotlivých třídách. Na závěr je vhodé připomeout, že výše uvedeé vlastosti aritmetického průměru jsou zcela obecé, tz. mají pochopitelě plou platost eje pro prostý aritmetický průměr, ale i pro aritmetický průměr vážeý. Kromě aritmetického průměru (prostého či vážeého), patří do skupiy průměrů, tz. středích hodot, které jsou fukcí všech hodot daé proměé a jsou tedy ovlivěy případými extrémími hodotami souboru, také geometrický průměr, harmoický průměr, kvadratický průměr aj. Tyto středí hodoty jsou však jako popisé statistické charakteristiky souboru používáy v mohem meší míře a pouze ve speciálích situacích Geometrický průměr (The Geometric Mea) Ozačeí: G (základí soubor), x G (výběrový soubor) Geometrický průměr řady kladých hodot x i je defiová jako -tá odmocia ze součiu všech hodot: x x x.... G 1 x Geometrický průměr má smysl všude, kde má ějaký iformačí smysl souči hodot proměé. Z praktického hlediska platí, že logaritmus geometrického průměru je rove aritmetickému průměru logaritmovaých hodot souboru. Geometrický průměr je tedy možo využít apř. v korelačím počtu (hodoceí závislosti kvatitativích zaků viz kap. 9), kdy po trasformaci hodot sledovaé proměé pracujeme s logaritmy původě aměřeých hodot. Příklad 3. : Pro data z příkladu 3. 1 bychom dostali ásledující výpočet geometrického průměru (metodou atilogaritmováí průměru logaritmů aměřeých hodot): x G 36

37 1 log x G 17 1, , log log 3 log 4... log13 0, ,4771 0, ,11394 Atilog 0,75318 = x G = 5,665 Při srováí tohoto vypočteého geometrického průměru s aritmetickým průměrem vypočteým pro stejá data (Příklad 3.1), můžeme potvrdit, že obecě platí zásada, že geometrický průměr poslouposti estejých kladých hodot je meší ež jejich aritmetický průměr Harmoický průměr (The Harmoic Mea) Ozačeí: 1 i1 x H 1 xi H (základí soubor), 1 x x H (výběrový soubor) Harmoický průměr řady kladých hodot x i je defiová jako počet těchto hodot, děleý součtem převráceých hodot: xh 1 x i1 i Harmoický průměr má smysl všude, kde má ějaký iformačí smysl součet převráceých hodot proměé. Ze vzorce pro výpočet je zřejmé, že převráceá hodota harmoického průměru je aritmetickým průměrem převráceých hodot proměé x i. Platí tedy vztah: Harmoický průměr lze využít apř. v situacích, kdy je potřeba zjistit dobu utou průměrě ke staoveí ějakého úkou, kdy všichi jedici souboru provádějí daé úkoy současě. Harmoický průměr pak představuje průměrou délku času pro takový úko. Výpočet se provádí z praktického hlediska tak, že se hodoty x i (jedotlivé časy potřebé pro provedeí daého úkou) převedou a převráceé hodoty 1/x i, vypočte se aritmetický průměr těchto převráceých hodot podle pravé části výše uvedeého vztahu a doba potřebá průměrě ke staoveí daého úkou x H se získá jako převráceá hodota v levé části uvedeé rovice Mediá (The Media) Ozačeí: ~ (základí soubor), x ~ (výběrový soubor) Mediá je defiová jako taková hodota variačí řady uspořádaé podle velikosti, která rozděluje řadu a dvě stejě velké části co do počtu hodot tak, že hodoty daé proměév jedé části jsou meší (případě rovy) ež mediá, v druhé pak větší ež mediá. Je to tedy prostředí hodota variačí řady souboru v případě lichého počtu hodot v řadě. Při sudém rozsahu souboru 37

38 existují dvě prostředí hodoty variačí řady. V tomto případě se mediá defiuje jako aritmetický průměr (polovičí součet) těchto dvou prostředích hodot. U větších souborů je vhodé vypočítat čle variačí řady, který je mediáem (pořadové číslo člea řady), pomocí ásledujícího vzorce: Pořadové číslo : 1 Příklad 3. 3: Řada hodot uvedeých v Příkladu 3.1 má 17 čleů. Pro výpočet mediáu je uto seřadit tato hodoty do variačí řady podle velikosti. Mediá bude pak tvoře prostředím tj. devátým čleem v uspořádaé řadě hodot. Devátý čle představuje hodota 5, je tedy x ~ = 5. Pořadové číslo pro čle řady, který je mediáem by se vypočetlo jako: Pokud bychom si odmysleli v této řadě prví hodotu (), abychom dostali sudou řadu čleů, pak by pro zbývajících 16 čleů řady 3, 4, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9, 10, 13 jsou prostředí hodoty osmá a devátá (tedy 5 a 6), jejichž průměr je 5,5 a je tedy mediáem této variačí řady hodot. Pořadové číslo pro teto mediá by se vypočetlo jako: Vlastosti mediáu: ,5 Z defiice mediáu a uvedeých výpočtů je patré, že mediá je kokrétí hodota (respektive ěkdy polovičí součet dvou kokrétích hodot), která eí přímo ovlivěa velikostí všech hodot daé proměé (eí fukcí všech hodot proměé). To má ěkdy své výhody. Je to zejméa v případě, kdy se vyskytují áhodě jeda ebo ěkolik málo mimořádě extrémích (oproti ostatím hodotám příliš malých ebo příliš velkých) hodot proměé. V tomto případě je vhodé, že mediá (podobě jako modus) a rozdíl od průměru, eí těmito odlehlými pozorováími ovlivěy a poskytuje tak dobrou představu o objektiví poloze prostředí hodoty a tím i o úrovi hodot sledovaé proměé. Mediá můžeme defiovat i jako 50% kvatil rozděleí sledovaé proměé (rozděluje soubor a stejě četé poloviy: hodoty meší ež mediá a hodoty větší ež mediá). Lze ho tedy použít jako vhodou charakteristiku středu souboru i v případě veliči s ezámým rozděleím (epravidelým, vícevrcholovým apod.) Modus (The Mode) Ozačeí: ˆ (základí soubor), xˆ (výběrový soubor) Modus je defiová jako ejčastěji se vyskytující hodota proměé v souboru (hodota s ejvětší četostí). Vždy odpovídá vrcholu křivky rozděleí. V tabulce rozděleí četostí (apř. tab.1.1) se modus určí jedoduše z hodoty zaku s ejvětší četostí. Pro data v uvedeém příkladu 3.1 je modem hodota 5. Vyskytuje se v řadě 5krát, zatímco četost ostatích hodot je meší. 38

39 V rozděleích četostí, kde jsou jedotlivé hodoty řazey do tříd s třídími itervaly (tj. u itervalového rozděleí četostí), mluvíme o modálím itervalu (třída s ejvyšší četostí). Vlastosti modu: Z defiice modu je patré, že modus je kokrétí hodota, která eí přímo ovlivěa velikostí všech hodot daé proměé (eí fukcí všech hodot proměé). Proto modus (podobě jako mediá) eí zkresle případými extrémími hodotami souboru. Lze ho tedy použít jako vhodou charakteristiku středu souboru i v případě veliči s ezámým rozděleím (epravidelým, vícevrcholovým apod.) 3. Charakteristiky variability (promělivosti souboru) Statistické zaky jako číselé proměé jsou a rozdíl od kostat, které mají ulovou variabilitu, vždy variabilí (promělivé). Růzé proměé, resp. stejé proměé v růzých statistických souborech mají zpravidla růzý stupeň variability. Malý stupeň variability (blízký ulové variabilitě) zameá malou vzájemou růzost hodot daé proměé, a tedy velkou podobost těchto hodot, což zároveň sigalizuje, že středí hodota (průměr), mediá a případě i modus jsou v tomto případě dobrými charakteristikami obecé velikosti hodot daé proměé v daém souboru. Naopak vysoká variabilita začí velkou vzájemou odlišost hodot daé proměé, což zároveň sigalizuje, že vypočítaé parametry středu souboru ejsou v tomto případě dobrými charakteristikami obecé výše hodot daé proměé v daém souboru. Středí hodoty (průměr, mediá, modus) jako ukazatel polohy udávají pouze iformaci o poloze statistického souboru a číselé ose, ale eudávají, jak jsou hodoty v souboru rozptýley (kolísáí kolem středu), případě, zda existují v souboru tzv. extrémí hodoty. Tuto iformaci poskytují tzv. míry variability (charakteristiky variability), které vyjadřují rozmístěí hodot daé proměé okolo středí hodoty celého souboru. Míry variability slouží tedy jako ukazatel rozptýleí, kterým lze charakterizovat (spolu s ukazetelem polohy) rozděleí četostí hodot (pravděpodobostí) sledovaé proměé ve statistickém souboru. K měřeí stupě variability ve statistickém souboru se používá ěkolik charakteristik variability, které jsou vesměs kocipováy tak, že jejich ulová hodota zameá kostatost ebo jiak řečeo ulovou variabilitu, kdežto jejich vyšší kladé hodoty azačují zpravidla, že jde o vyšší stupeň variability. Je tedy jasé, že žádá z charakteristik variability emůže abýt záporou číselou hodotu Variačí rozpětí (The Rage) Variačí rozpětí R (z aglického slova rage rozsah, rozpětí) řady čísel je defiováo jako rozdíl mezi ejvětší a ejmeší hodotou řady (rozdíl mezi ejvětší a ejmeší hodotou zaku v souboru): R = x max x mi 39

40 Variačí rozpětí je velmi přibližou charakteristikou variability hodot sledovaé umerické proměé, eboť je příliš ovlivěo velikostí extrémích hodot, které mohou být mohdy odlehlými pozorováími. Teto edostatek R překoávají rozpětí kvatilů, z ichž ejpoužívaější je kvartilové rozpětí R q : R q = x 0,75 x 0,5 Je zřejmé, že variačí rozpětí ai kvatilová rozpětí eberou při charakterizováí variability v úvahu velikost všech hodot sledovaé umerické proměé, což je mohdy pociťováo jako závažý edostatek. Te překoávají charakteristiky variability, které jsou fukcí všech pozorováí. Nejpoužívaější z ich jsou ty, které jsou založey a součtu čtverců odchylek jedotlivých hodot x i od aritmetického průměru (( xi ) pro základí soubory ebo( x i x) pro výběrové soubory). Tyto charakteristiky variability jsou považováy obvykle za ejdokoalejší, eboť avazují a dříve vedeé vlastosti aritmetického průměru. Jde o rozptyl (variaci) a směrodatou odchylku (SD stadardí deviaci, z agl. stadard deviatio). 3.. Rozptyl (variace, The variace) Ozačeí: (základí soubor), s (výběrový soubor) Rozptyl řady hodot x 1, x, x je defiová (pohlíži-li se a daý soubor jako a populaci, kde = N) jako aritmetický průměr čtverců odchylek jedotlivých hodot sledovaé proměé x i od průměru celého souboru: N xi i1 N (rozptyl základího souboru) Pohlíží-li se a daý soubor jako a výběrový (vzorek ze základího souboru), potom mluvíme o výběrovém rozptylu s, který slouží jako odhad skutečého rozptylu populace a jeho výpočet se poěkud liší. U výběrového rozptylu se ve jmeovateli zlomku používá výraz (-1), který ozačujeme jako počet stupňů volosti výběrového souboru (blíže viz kap. 4: Odhady parametrů základího souboru). Použitím tohoto výrazu (-1) místo prosté velikosti souboru docílíme přesějšího odhadu skutečé hodoty populačího rozptylu, především při výpočtu a základě malých výběrových souborů: s i1 1 x x i (rozptyl výběrového souboru) Je zřejmé, že rozdíl mezi rozptylem a jedé straě a výběrovým rozptylem s a druhé straě je při velkém rozsahu souboru ( > 30) prakticky zaedbatelý. Zároveň je jasé, že z rozptylu získáme ásobeím /-1 výběrový rozptyl s a také aopak: z výběrového rozptylu s získáme ásobeím (-1)/ rozptyl základího souboru. 40

41 Při praktických výpočtech podle výše uvedeého vzorce výběrového rozptylu by byl postup příliš zdlouhavý (především u velkých výběrových souborů), proto je možo pro usaděí použít ještě jiou variatu vzorce pro výpočet výběrového rozptylu: s i1 x i x i1 1 i Výpočet podle tohoto vzorce ( výpočtový tvar rozptylu ) je při praktickém postupu mohem jedodušší, protože a rozdíl od předchozí variaty vzorce pro výběrový rozptyl zahruje méě výpočetích úkoů, což sižuje pravděpodobost možých chyb v případě ručích výpočtů. Vlastosti rozptylu: Jestliže jsou všechy hodoty souboru stejé, potom je variabilita hodot sledovaé proměé v souboru ulová a výběrový rozptyl s = 0. Velikost rozptylu se zvyšuje při zvětšující se variabilitě hodot sledovaé proměé. Protože rozptyl je odvoze od součtu čtverců odchylek jedotlivých hodot od průměru souboru, emůže ikdy ebývat záporých hodot. Přičte-li se ke všem hodotám (odečte-li se od všech hodot) proměé X libovolá kladá kostata a, potom se rozptyl ezměí: X a x a x a 1 i1 i Z této vlastosti plye, že rozptyl epovažuje za změu variability žádý případ, při ěmž se eměí absolutí rozdíly mezi jedotlivými hodotami. Charakterizuje tak tzv. absolutí variabilitu, k jejímuž zvětšeí (zmešeí) dochází pouze tehdy, zvětšují-li se (zmešují-li se) absolutí rozdíly mezi jedotlivými hodotami daé číselé proměé. Násobí-li se (dělí-li se) všechy hodoty proměé eulovou kostatou g, potom je rozptyl zásobe (vyděle) čtvercem této kostaty: 1. i g. g X g. x g. X i1 Z defiice rozptylu je zřejmé, že rozptyl je uvede ve čtvercích měrých jedotek hodot sledovaých číselých proměých. Např.: jestliže budou hodoty sledovaé proměé vyjádřey v gramech, také jejich rozptyl bude v gramech. Jestliže hodoty sledovaé proměé budou vyjádřey v cm, rozptyl těchto hodot bude vyjádře v (cm ), bez ohledu a to, že takové jedotky emají žádý fyzikálí výzam. Vyjádřeí rozptylu ve čtvercích měrých jedotek je jedím z hlavích důvodů, že se při praktickém měřeí variability přeměňuje rozptyl a stadardí deviaci (směrodatou odchylku), která má stejé měré jedotky jako hodoty sledovaé proměé. 41

42 3..3 Směrodatá odchylka (stadardí deviace, Stadard Deviatio - SD) Ozačeí: (základí soubor), s (výběrový soubor) Směrodatá odchylka je defiováa jako (kladá) druhá odmocia z rozptylu, tj. resp. jako pro základí soubor, s s pro výběrový soubor. Výpočet směrodaté odchylky pro základí soubor je tedy: N i1 x i N ebo x i N x N i a výpočet výběrové směrodaté odchylky pro výběrový soubor je: s i1 x i x 1 ebo s xi x 1 i Vlastosti směrodaté odchylky: Směrodatá odchylka má stejé měré jedotky jako sledovaá číselá proměá ve statistickém souboru (odmocěím rozptylu se čtverce měrých jedotek číselých proměých v rozptylech převedou zpět do lieárího tvaru). Jak vyplývá z výše uvedeé defiice, směrodatá odchylka může abývat vždy pouze kladých hodot. Ozačíme-li ve vzorci směrodaté odchylky proměé X odchylky hodot této proměé od aritmetického průměru jako x x d, i = 1,,,, pak je ze vzorce směrodaté odchylky: i i i1 x x i i1 d i patré, že směrodatá odchylka je kvadratickým průměrem z odchylek jedotlivých hodot od jejich aritmetického průměru. A právě tato skutečost je dalším důvodem zavedeí směrodaté odchylky jako míry absolutí variability, eboť umožňuje iterpretovat vypočítaou směrodatou odchylku v tom smyslu, že udává, jak se v průměru v daém statistickém souboru odchylují hodoty sledovaé proměé od aritmetického průměru souboru. 4

43 Příklad 3. 4: Byla sledováa hmotost králíků v laboratorím chovu. Vážeím áhodě vybraých 1 králíků z tohoto chovu byly zjištěy ásledující hmotosti (v kg):,7; 3,1;,9;,7; 3,0;,8;,9;,9; 3,1; 3,3;,8;,7. Jak velkou směrodatou odchylku vykazují zjištěé hodoty hmotostí od aritmetického průměru hmotosti v tomto chovu? = 1 x i1 x i 34,9,9083 kg 1 s i1 x i x i1 1 i (34,9) 101, ,0354 kg s s 0,0354 0, 1881 kg Závěr: Směrodatá odchylka, kterou vykazují zjištěé hmotosti vybraých králíků od průměré hmotosti králíků v chovu (,9083 kg) je 0,1881 kg. Charakteristiky absolutí variability (zejméa směrodatá odchylka) jsou esporě velmi vhodé pro srováí variability hodot ordiálích statistických zaků (proměých) ve dvou případě více souborech, eboť odlišosti obmě ordiálích proměých jsou plě charakterizováy jejich absolutímo rozdíly. Jiak řečeo: celková variabilita hodot ordiálí proměé je totožá s absolutí variabilitou. Jiak je tomu u kardiálích statistických zaků, kdy pociťujeme, že celková variabilita hodot kardiálí proměé eí dostatečě charakterizováa měrami absolutí variability. Tak apř. hodoty tělesé hmotosti kg u 50% králíků a 3 kg u druhé poloviy jediců jedoho souboru mají stejou absolutí variabilitu jako hmotosti ve druhém souboru (apř. selata), kde má polovia jediců hmotost 5 kg a zbytek 53 kg, přestože absolutí rozdíl 1 kg je relativě začý u souboru králíků, ale tetýž absolutí rozdíl je u souboru selat relativě zaedbatelý. V souboru selat je tedy zřejmě celková variabilita ižší. Podobé elogičosti při srováváí variability pomocí charakteristik absolutí variability u kardiálích proměých vedly k tomu, že byly zavedey charakteristiky relativí variability, které jsou vesměs defiováy jako míry absolutí variability, děleé ějakou středí hodotou, ejčastěji aritmetickým průměrem. Nejpoužívaější charakteristikou relativí variability je variačí koeficiet (koeficiet variace) Variačí koeficiet ( relativí směrodatá odchylka, The Coefficiet of Variatio) Variačí koeficiet používáme, máme-li vzájemě srovávat variabilitu dvou ebo více souborů s podstatě odlišou úroví hodot. Jak bylo uvedeo výše, těžko lze srovávat pomocí prosté směrodaté odchylky apř. variabilitu tělesé hmotosti v kg u králíků a selat ebo dokoce 43

44 variabilitu váhy kuřat v gramech a variabilitu váhy jatečého skotu v kg ebo metrických cetech. V těchto případech musíme odstrait vliv obecé úrově daých hodot. Děláme to tak, že směrodatou odchylku dělíme středí hodou, od které byly počítáy odchylky pro součet čtverců, obvykle tedy při praktických výpočtech aritmetickým průměrem výběrového souboru. Výsledek se obyčejě vyjadřuje v procetech (po vyásobeí 100). Variačí koeficiet, který ozačujeme ejčastěji jako V, je tedy defiová pro základí soubor jako: 100 V [%] Pro výběrový soubor vypočteme prakticky variačí koeficiet podle vzorce: V s 100 [%] x Vlastosti variačího koeficietu: Variačí koeficiet je relativí mírou variability a tedy eí ovlivě absolutími hodotami sledovaého statistického zaku jako směrodatá odchylka. V případě vyjádřeí v procetech, variačí koeficiet udává, z kolika procet se podílí směrodatá odchylka a aritmetickém průměru. Přičte-li se ke všem hodotám (odečte-li se od všech hodot) daé proměé libovolá kladá kostata a, potom se variačí koeficiet zmeší (zvětší). Platí tedy : V ( X a) resp.: V ( X a) V x a x V x a x Z těchto vlastostí plye, že při stejé absolutí variabilitě v růzých souborech může být aprosto růzá relativí variabilita, eboť při X a ( X X a ) je současě V(X + a) < V(X) < V(X - a) Násobí-li (dělí-li) se všechy hodoty proměé X eulovou kostatou g, potom se variačí koeficiet ezměí. Platí tedy: V ( g. X ) g. V g. x x Příklad 3.5: Jsou dáy dva výběrové soubory A a B: A: 1, 11, 11, 1, 14, 14, 14, 7 B: 1,, 3, 5, 9, 10, 13, 16, 17, 1,, 3, 7 44

45 Můžeme vidět, že oba výběry mají stejé variačí rozpětí a mají také stejý aritmetický průměr ( x 13 ). Přesto se jedá o dva zcela rozdílé soubory čísel. Směrodaté odchylky reprezetující míru absolutí variability souborů se avzájem poěkud liší: u souboru A je hodota směrodaté odchylky 7,09 a u souboru B je to 8,76. Odpovídající variačí koeficiety obou souborů tedy jsou (v procetech): 7, Pro soubor A: V 54,5 % 13 8, Pro soubor B: V 67,4 % 13 Vidíme tedy, že absolutí i relativí variabilita je u obou souborů přibližě srovatelá. U těchto souborů, které mají stejou obecou úroveň, eí uto variačí koeficiet počítat. Chcemeli však s imi srovávat variabilitu řady hodot z příkladu.4, je teto výpočet utý. Pro hodoty z příkladu.4 dostaeme: V 0, ,9083 6,5 % Váhy laboratorích králíků z příkladu 3.4 tedy kolísají pouze o 6,5 % okolo průměru, což můžeme považovat za velmi ízkou variabilitu. Naopak u souborů zvoleých čísel A a B v příkladu 3.5 je variabilita již dosti vysoká Středí chyba průměru (Stadard Error of Mea - SE, SEM) Ozačeí: x (základí soubor), s x (výběrový soubor) Mezi často používaé relativí míry variability lze dále zařadit i tzv. středí eboli směrodatou chybu průměru, často ozačovaou (především v zahraičí odboré literatuře) zkratkou SE (příp. SEM) z aglického výrazu Stadard Error of Mea. Středí chyba průměru eměří rozptýleost původí áhodé proměé, ale rozptýleost vypočítaého aritmetického průměru v růzých výběrových souborech vybraých z jedoho základího souboru. Středí (směrodatá) chyba průměru je teoreticky defiováa jako směrodatá odchylka všech možých výběrových průměrů z jedé populace, vypočítaých pro výběry o rozsahu čleů. Středí chyba průměru tedy vyjadřuje kolísáí výběrových průměrů kolem teoretické (skutečé) středí hodoty v celém základím souboru. Jak vyplývá z defiice, středí chyba průměru závisí jedak a rozptylu základího souboru ( ), jedak a rozsahu výběrového souboru (): x 45

46 Protože obvykle ezáme skutečou hodotu rozptylu celého základího souboru, používáme v praxi výpočet pro výběrovou středí chybu průměru podle vzorce: s x s Výběrová středí chyba průměru ( x s ) může být použita jako míra přesosti, s jakou výběrový aritmetický průměr x odhaduje skutečou středí hodotu. Prakticky se používá pro výpočet itervalů spolehlivosti aritmetického průměru u výběrových souborů (blíže viz kap. 4: Odhady parametrů základího souboru). 46

47 Kapitola 4 Odhady parametrů základího souboru Jak již bylo řečeo, v praxi obvykle zkoumáme vlastosti základího souboru populace prostředictvím výběrových dat, tj. hodot zkoumaého statistického zaku (případě i více zaků) získaých při výběrovém statistickém šetřeí. Na základě těchto dat pak provádíme zevšeobecňující úsudek, tz. usuzujeme a obecější skutečosti, které se týkají celé populace. Jedá se tedy o iduktiví uvažováí, které s sebou ese riziko esprávého úsudku. Toto riziko omylu je tím větší, čím je základí soubor z hlediska sledovaého zaku variabilější a čím je méě reprezetativí výběrový soubor. Jeho sížeí je možo dosáhout za určitých podmíek zvětšeím rozsahu výběru. Při tomto procesu zevšeobecňováí je třeba vyloučit subjektiví vlivy a provádět ho pomocí objektivích metod matematické statistiky. Matematicko-statistické metody vycházejí z předpokladu, že výběrová data byla pořízea áhodým výběrem, tj. takovým výběrem, kdy o tom, zda určitý čle základího souboru bude vybrá či ikoli, rozhoduje pouze áhoda. Teto předpoklad umožňuje využívat teorii pravděpodobosti, pokud je to možé kvatifikovat (ebo předem volit) riziko omylu a tak hodotit přesost a spolehlivost získaých výsledků. Iduktiví usuzováí pomocí matematicko-statistických metod se ěkdy azívá statistická idukce. Jedou ze základích úloh statistického usuzováí (statistické idukce) je odhadováí ezámých parametrů základího souboru pomocí údajů získaých áhodým výběrem z daého základího souboru. Důležitým rysem statistické metody odhadováí je její pravděpodobostí charakter (při jakémkoli úsudku, který o základím souboru učiíme a základě údajů získaých áhodým výběrem, musíme počítat s možostí, že teto úsudek je chybý). Číselé charakteristiky výběrových souborů se poěkud liší od charakteristik základího souboru a také charakteristiky růzých výběrových souborů z téže populace jsou růzé, což je způsobeo variabilitou ve složeí růzých áhodě vybraých výběrových souborů. Podle typu rozděleí, kterým se řídí základí soubor (Gaussovo ormálí rozděleí ebo ezámé rozděleí) je možo a základě dat výběrových souborů z tohoto rozděleí zjistit růzé charakteristiky (apř. průměr, směrodatá odchylka - u ormálího rozděleí; mediá - u ezámého rozděleí), které se v jistém smyslu blíží k odpovídajícím charakteristikám základího souboru (jsou jejich odhadem). Odhad parametrů základího souboru a základě charakteristik výběrových souborů lze provést v zásadě dvěma způsoby (metodami): bodovým ebo itervalovým odhadem. 1) Bodový odhad bodovým odhadem odhadujeme ezámý parametr základího souboru pomocí jediého čísla, bodu. Bodovým odhadem parametru základího souboru jsou popisé statistiky (charakteristiky) výběrového souboru, protože rozděleí četostí výskytu hodot v áhodém výběru je odrazem rozděleí pravděpodobostí výskytu hodot v základím souboru. 47

48 Při bodovém odhadu tedy a základě dat výběrového souboru prohlašujeme, že ezámý parametr základího souboru se rová určité (vypočteé) hodotě sledovaé áhodé veličiy. ) Itervalový odhad itervalovým odhadem odhadujeme ezámý parametr základího souboru pomocí dolí a horí hraice itervalu hodot, mezi imiž se parametr základího souboru achází s určitou (zvoleou) pravděpodobostí. Na základě dat výběrového souboru určujeme oblast číselých hodot sledovaé áhodé proměé (tzv. iterval spolehlivosti, kofidečí iterval), v íž leží s dostatečou pravděpodobostí ezámý parametr základího souboru. Itervalové odhady parametrů základího souboru umožňují vyjádřit chybu, kterou je odhad parametru základího souboru a základě statistik výběrového souboru zatíže. Chyba odhadu je dáa tím, že charakteristiky (statistiky) výběrového souboru jsou áhodé veličiy. Např. vybereme-li ze základího souboru 10 hodot do výběrového souboru a provedeme bodový odhad parametru základího souboru a vybereme-li ze základího souboru jiých 10 hodot do výběrového souboru a provedeme opět bodový odhad parametru získáme hodotu, která se může lišit od předchozího odhadu, i když se jedá o dva výběry ze stejého základího souboru. Každý bodový odhad parametru základího souboru pomocí statistiky výběrového souboru je tedy zatíže určitou chybou odhadu, epřesostí. Tato chyba je tím meší, čím větší je rozsah výběrového souboru. 4.1 Odhad parametrů souboru s Gaussovým ormálím rozděleím U souborů dat, které se řídí ormálím rozděleím pravděpodobostí lze odhadovat dva parametry, používaé pro charakteristiku Gaussovy křivky: parametr µ (středí hodota) a parametr (směrodatá odchylka), případě (rozptyl) Odhad parametru µ (středí hodota) Bodový odhad µ: Bodovým odhadem parametru (středí hodota) základího souboru s Gaussovým ormálím rozděleím je aritmetický průměr x vypočítaý a základě dat výběrového souboru. Můžeme tedy psát: µ x i 1 xi Itervalový odhad µ: Itervalový odhad spočívá ve výpočtu dolí a horí meze itervalu spolehlivosti (m 1, m ), mezi imiž se středí hodota (parametr µ) základího souboru achází s určitou (zvoleou) pravděpodobostí : m1, x sx t1 t 1-/ - koeficiet spolehlivosti (1-/ kvatil Studetova rozděleí), který odpovídá určité (zvoleé) pravděpodobosti chyby, s jakou provádíme itervalový odhad (pro biologická data volíme zpravidla = 0,05, při požadavku větší přesosti můžeme volit = 0,01). Zvoleá 48

49 pravděpodobost chyby tak určuje tzv. hladiu výzamosti, a které je odhad provádě a udává zároveň spolehlivost (1-) počítaého itervalového odhadu. Při zvoleí pravděpodobosti chyby = 0,05, tedy metodou itervalového odhadu vypočítáme kofidečí iterval se spolehlivostí 95 %. Koeficiet spolehlivosti vyhledáme v tabulkách kvatilů Studetova rozděleí podle zvoleé chyby a stupňů volosti = -1 výběrového souboru (viz Příloha Tab. č. 3 Kvatily Studetova t-rozděleí). s x - středí chyba průměru Středí chyba průměru vyjadřuje kolísáí výběrových průměrů kolem skutečé středí hodoty základího souboru: Středí chyba průměru: s 4.1. Odhad parametru (rozptyl) Bodový odhad : x s x Bodovým odhadem parametru (rozptyl) základího souboru s Gaussovým ormálím rozděleím je výběrový rozptyl s, vypočteý a základě dat výběrového souboru. Můžeme tedy psát: s i1 x i x i1 1 i Výraz -1 ve jmeovateli zlomku se azývá počet stupňů volosti (v) výběrového souboru. Je mírou provázaosti hodot souboru - ukazuje počet ezávislých veliči, které se vyskytují v defiici daého parametru (při výpočtu rozptylu s už záme x souboru - hodoty souboru jsou tímto průměrem určitým způsobem "vázáy", mají pouze -1 stupňů volosti). Záme-li totiž hodotu x určitého souboru s "" prvky, můžeme všem prvkům přidělit libovolé hodoty kromě hodoty -té, která je určea již průměrem. Např. u souboru s pěti čley, který má průměr x =5, můžeme určit libovolě třeba tyto hodoty: 1, 6, 73, 14. Aby však soubor měl skutečě průměr 5, musí být pátá hodota staovea vzhledem k průměru - tak, aby x i = 15 (5x5). Pátý čle tedy eí volý, volé jsou je 5-1=4 čley (obecě -1). Říkáme, že po výpočtu průměru má soubor ještě -1 stupňů volosti. Poz.: Výrazem -1 se odlišuje výpočet odhadu rozptylu: s (výběrové charakteristiky) od defiice skutečého parametru (pro základí soubor). Použitím výrazu -1 při výpočtu se zohledí chyba výběrového souboru vůči základímu souboru (čím meší je ve výběrovém souboru, tím větší je jeho chyba, a tím dostaeme i výrazě odlišou hodotu výběrového rozptylu s od skutečého parametru ). 49

50 Itervalový odhad : Itervalový odhad spočívá ve výpočtu dolí a horí meze itervalu spolehlivosti (m 1, m ), mezi imiž se rozptyl (parametr ) základího souboru achází s určitou (zvoleou) pravděpodobostí : m 1 1. s 1 / ( ) m 1. s / ( ) 1, - koeficiety spolehlivosti: tabulkové hodoty - kvatily rozděleí pro zvoleé a daé = -1 (viz Příloha Tab. č.4a, 4b Kritické hodoty rozděleí) Příklad 4. 1: Byla sledováa hmotost laboratorích králíků v chovu. Vážeím áhodě vybraých 1 králíků z tohoto chovu byly zjištěy ásledující hmotosti (v kg):,7; 3,1;,9;,7; 3,0;,8;,9;,9; 3,1; 3,3;,8;,7. Metodou bodového a itervalového odhadu zjistěte, jaká je průměrá hmotost králíků v tomto chovu a jaký je rozptyl této hmotosti. = 1 Bodový odhad parametru (středí hodota) a parametru (rozptyl) pro hmotosti králíků v chovu: x i1 x i 34,9,9083 kg 1 s i1 x i x i1 1 i (34,9) 101, ,0354 kg Itervalový odhad parametru (středí hodota) a hladiě výzamosti α = 0,05 (tj. 95 % meze m 1, m pro iterval spolehlivosti): s 0,1881.,01 m1 x. t1 / ( 1),9083, 7887kg 1 s 0,1881.,01 m1 x. t1 / ( 1),9083 3, 078 kg 1 Itervalový odhad parametru (rozptyl) a hladiě výzamosti α = 0,05 (tj. 95 % meze m 1, m pro iterval spolehlivosti): 50

51 m m s. 1 1 / ( 0,0354. (1 1) 1,9 1 1) s. 1 0,0354. (1 1) / ( 1) 3,8 1 Závěr: 0,0178 kg 0,1019 kg Průměrá hmotost králíků v laboratorím chovu leží s 95 % pravděpodobostí v itervalu,7887; 3,078 kg, bodovým odhadem hmotosti králíků v chovu je hmotost,9083 kg. Rozptyl hmotosti králíků v chovu je s 95 % pravděpodobostí v itervalu 0,0178; 0,1019 kg, bodovým odhadem rozptylu hmotosti králíků v chovu je hodota 0,0354 kg. 4. Odhad parametrů souboru s ezámým rozděleím Pro charakteristiku souborů s ezámým rozděleím četostí emůžeme použít parametry µ a (jejich křivka rozděleí může být epravidelá, obvykle asymetrická, ěkdy vícevrcholová). Za střed křivky je tady možo považovat mediá ~, šířku křivky elze pro její epravidelost určovat. Mediá je výstižější středí hodotou ež aritmetický průměr i u souborů, v ichž se vyskytují ojediělé extrémí hodoty - tyto ovlivňují aritmetický průměr, který pak esprávě charakterizuje střed souboru, kdežto mediá eí extrémími hodotami ovlivě. Hodota skutečého parametru mediáu základího souboru ~ je odhadová pomocí výběrového mediáu x ~, vypočteého a základě dat výběrového souboru vybraého z daé populace (bodový odhad mediáu) a pomocí kofidečího itervalu pro mediá (itervalový odhad mediáu) Odhad mediáu ~ Bodový odhad ~ : Bodovým odhadem mediáu ~ základího souboru s ezámým rozděleím je výběrový mediá x ~, vypočteý a základě dat výběrového souboru. Z defiice mediáu můžeme tedy odvodit: Výběrový mediá u souboru s lichým počtem hodot je rove prostředí hodotě vzestupé variačí řady. Výběrový mediá u souboru se sudým počtem hodot je rove aritmetickému průměru dvou prostředích hodot. U větších výběrových souborů lze vypočítat pořadí hodoty, která je výběrovým mediáem, jako: R x 1 Rx - pořadové číslo výběrového mediáu ve variačí řadě (liché i sudé). 51

52 Itervalový odhad ~ : Itervalový odhad spočívá ve zjištěí dolí a horí meze itervalu spolehlivosti (m 1, m ), mezi imiž se mediá ~ základího souboru achází s určitou (zvoleou) pravděpodobostí: Dolí a horí mez itervalu (m 1,m ) spolehlivosti mediáu jsou hodoty odvozeé z tabulek tak, že se podle počtu prvků výběrového souboru () a zvoleé pravděpodobosti chyby vyhledá v tabulce pořadové číslo pro dolí (horí) mez a toto pořadové číslo se ahradí hodotou, která mu odpovídá ve variačí řadě hodot výběrového souboru. Příklad 4. : Byla sledováa tělesá hmotost u výběrového souboru 14 psů určitého plemee. Zjistěte iterval spolehlivosti pro skutečou hodotu mediáu základího souboru hodot tělesé hmotosti u daého plemee. Zjištěé hopdoty (v kg): 14.1; 16,4; 16,8; 14,3; 1,3; 14,9; 15,3; 1,8; 15,6; 13,5; 16,0; 16,; 17,1; 17,0 Postup: 1) Podle velikosti výběrového souboru a zvoleé hladiy výzamosti vyhledáme v tabulkách pořadová čísla pro dolí a horí mez itervalu spolehlivosti pro mediá: = 14 = 0.05 Tab. 4.1 Pořadí pro dolí a horí mez itervalu spolehlivosti mediáu (část tabulky, = 0.05) Dolí mez Horí mez : : : : : : ) Seřadíme aměřeé hodoty do vzestupé variačí řady (Tab. 4.). 3) Nahradíme alezeá pořadová čísla (3 a 1) skutečými hodotami variačí řady aměřeých hodot tyto pak tvoří iterval spolehlivosti mediáu: : : : 5

53 Tab. 4. Variačí řada výběru ( = 14) s vyzačeými mezemi m 1 a m pro iterval spolehlivosti mediáu. x 1 1,3 x 1,8 x 3 13,5 x 4 14,1 x 5 14,3 x 6 14,9 x 7 15,3 x 8 15,6 x 9 16,0 x 10 16, x 11 16,4 x 1 16,8 x 13 17,0 x 14 17,1 5) Výpočet bodového odhadu mediáu: 14 1 Pořadové číslo mediáu: R x 7, 5 Mediá: ~ 15,3 15,6 x 15, 45 kg Závěr: Skutečá hodota tělesé hmotosti psů daého plemee je v itervalu od 13,5 do 16,8 kg (se spolehlivostí a 95 %). Nejpravděpodobější skutečou hodotou mediáu tělesé hmotosti psů daého plemee je hodota 15,45 kg. 53

54 Kapitola 5 Vylučováí extrémích hodot souboru Při sledováí biologických jevů bychom měli brát v úvahu jakoukoli hodotu získaou při pozorováí, ěkdy se však a pozadí více méě stejorodých hodot objeví hodota silě odlišá může to být vliv ějakého ového, euvažovaého faktoru ebo chyba, způsobeá apř. při měřeí, v metodice apod. Takovou chybu (hrubá chyba) je uto odlišit od chyby áhodé, která způsobuje výskyt zdálivě odlišých hodot v souboru tyto však vzikají vlivem přirozeé variability biologického materiálu. Takové hodoty je třeba při statistickém zpracováí brát do úvahy, kdežto hodoty způsobeé hrubou chybou je uto ze souboru vyloučit. Zde je třeba si uvědomit zásadí věc: k vyloučeí hodoty ze souboru jsme oprávěi je tehdy, je-li velmi epravděpodobé, že tato hodota pochází z téhož základího souboru jako ostatí hodoty výběrového souboru. V pricipu existují dvě možosti takového zjištěí. Předě můžeme ěkdy již během sledováí (experimetu) zjistit, že při získáváí ěkteré z hodot došlo k porušeí podmíek, za ichž má sledováí probíhat (apř. okamžitý výpadek elektrického proudu či jiá ehoda). Takový údaj je ovšem uté ze souboru vyloučit, a to bez ohledu a jeho číselou hodotu. Druhá možost je, že sice k porušeí podmíek došlo, ale ejsme si toho vědomi; pak ás a to může upozorit jediě případá atypičost hodoty sledovaé veličiy. Posoudit, zda se jedá o atypickou (tj. odlehlou, extrémí) hodotu je však možé pouze tehdy, víme-li, jaký typ rozděleí sledovaá áhodá veličia má; bez této zalosti ztrácí pojem odlehlost smysl. K objektivímu posouzeí, zda zjištěá zdálivě odlehlá hodota patří do souboru, lze použít statistických testů (a základě zalosti rozděleí daého souboru): Grubbsův test pro testováí souborů odpovídajících ormálímu rozděleí Dixoův test (Q test) pro testováí souborů s ezámým rozděleím (případě souborů s malým počtem měřeí) 5.1 Vylučováí extrémích hodot u souboru s ormálím rozděleím Vyloučeí extrémích hodot u souborů dat s Gaussovým ormálím rozděleím lze provést orietačě ebo pomocí výpočtu testovacího kritéria a ásledým porováím s tabulkovou kritickou hodotou (Grubbsův test) Orietačí vyloučeí extrémích hodot Jestliže odchylka libovolé hodoty variačí řady od aritmetického průměru x, vypočítaého z hodot souboru s vyloučeím extrémě odlišé hodoty, převyšuje více ež 3x směrodatou odchylku s vypočteou ze souboru bez extrémí hodoty, považujeme tuto hodotu za etypickou a můžeme ji vyloučit z dalšího zpracováí. 54

55 Postup: Z výběrových dat vypočítáme aritmetický průměr x a směrodatou odchylku s ze souboru bez podezřelé hodoty. Jestliže odchylka podezřelé hodoty od x (bez ohledu a zaméko) překračuje 3s, pak tuto hodotu vyloučíme. Jestliže je odchylka podezřelé hodoty od x meší ež 3s, pak i tuto hodotu musíme zahrout do výběrového souboru a dále pak počítáme ový aritmetický průměr x a směrodatou odchylku s, již s touto hodotou. Tyto ové výběrové charakteristiky používáme pro další aalýzu daého výběrového souboru Grubbsův test extrémích odchylek Grubbsův test se používá pro objektiví vylučováí extrémích hodot a základě vypočteého testovacího kritéria u souborů dat, které odpovídají Gaussovu ormálímu rozděleí pravděpodobostí sledovaé áhodé veličiy. Postup: 1) Seřadíme hodoty výběrového souboru do vzestupé variačí řady. ) Vypočteme aritmetický průměr x a směrodatou odchylku s ze všech hodot souboru. 3) Vypočítáme testovací kritérium pro prví (případě posledí -tou) hodotu variačí řady: T 1 x x s 1 T x x s 4) Vypočteé testovací kritérium porováme s tabulkovou kritickou hodotou pro příslušé výběrového souboru a zvoleou α pro Grubbsův test (viz Příloha Tab. č. 5 Kritické hodoty T ; α T 1; α pro Grubbsův test): Pokud T 1(,α) > T krit. prví (případě posledí) hodotu variačí řady vyloučíme ze souboru a musíme vypočítat ový průměr x a směrodatou odchylku s již bez této extrémí hodoty. Pokud T 1(,α) T krit. prví (posledí) hodota variačí řady patří do souboru a vyloučit ji emůžeme (eí extrémě odlehlou hodotou). Příklad 5.1: Při vyšetřováí chovu dojic bylo provedeo a výběru 1 dojic staoveí glukózy v krevím séru. Zjistěte, zda-li ejmeší popřípadě ejvětší hodota výběru eí od ostatích hodot odlehlá, tz. zda-li je i tato hodota pro chov dojic charakteristická. Postup: 1) Hodoty výběrového souboru seřadíme vzestupě do variačí řady (mmol.l -1 ): 0,9,8,9 3,0 3,1 3,1 3, 3,3 3,7 3,8 4, 6,8 ) Vypočteme aritmetický průměr x a směrodatou odchylku s ze všech hodot souboru: x 3,4 s = 1,338 55

56 3) Vypočítáme testovací kritérium pro miimum a maximum: T x x,5 1, s 1,868 T x x s 3,4 1,338,541 4) Vyhledáme v tabulkách kritických hodot Grubbsova testu kritickou hodotu pro zvoleé α = 0,05 a počet hodot = 1: T krit.=,387 5) Závěr: T 1 T krit., tz. že ejižší hodota eí odlehlá, tz. její velikost eí ovlivěa hrubou chybou, ale pouze áhodou chybou způsobující vychýleí hodoty pouze v rámci ostatích hodot souboru. T > T krit., tz. že ejvyšší hodota je odlehlá (extrémí), tz. její velikost je ovlivěa hrubou chybou a e pouze áhodou chybou. Tuto ejvyšší hodotu, tz. 6,8 mmol.l -1, je tedy třeba za souboru měřeí vyloučit. 5. Vylučováí extrémích hodot u souboru s ezámým rozděleím Vyloučeí extrémích hodot u souborů dat s ezámým rozděleím lze provést pomocí výpočtu testovacího kritéria a ásledým porováím s tabulkovou kritickou hodotou (Dixoův test) Dixoův test extrémích odchylek Při výpočtu testovacího kritéria se využívá variačí rozpětí souboru (R = x max -x mi ). Výhodou Dixoova testu je použití i u souborů s malým počtem hodot. Postup: 1) Vytvoříme variačí řadu podle velikosti hodot: x 1, x, x 3,..x -1, x ) Vypočteme testovací kritérium pro 1., případě posledí (-tou) hodotu řady: Q 1 x x R 1 Q x x R 1 3) Vypočteé testovací kritérium porováme s tabulkovou kritickou hodotou pro příslušé výběrového souboru a zvoleou α pro Dixoův test: Pokud Q 1() > Q krit. prví (posledí) hodotu variačí řady vyloučíme Pokud Q 1() Q krit. prví (posledí) hodotu variačí řady emůžeme vyloučit (hodota patří do souboru) Příklad 5.: Při vyšetřováí chovu dojic bylo provedeo u výběru 10 dojic staoveí obsahu močoviy v moči. Zjistěte, zda-li ejmeší, popřípadě ejvětší hodota výběru eí od ostatích odlehlá, tz. zda-li je i tato hodota pro chov charakteristická. 56

57 Postup: 1) Hodoty výběrového souboru seřadíme do vzestupé variačí řady (mmol.l -1 ): ) Vypočítáme testovací kritérium: x x x x Q 1 0,010 Q 0, 818 R R ) Vyhledáme v tabulkách kritických hodot Dixoova testu (Příloha: Tabulka č.6 Kritické hodoty prom Dixoův test) kritickou hodotu pro zvoleé α = 0,05 a počet hodot = 10: Q krit.= 0,41 4) Závěr: Q 1 Q krit, tz. že ejižší hodota eí odlehlá tz. její velikost eí ovlivěa hrubou chybou, ale pouze áhodou chybou způsobující vychýleí hodoty pouze v rámci ostatích hodot souboru. Q > Q krit., tz. že ejvyšší hodota je odlehlá tz. její velikost je ovlivěa hrubou chybou, případě cíleým působeím určitého vlivu a ikoli pouze áhodou chybou. Tuto hodotu je proto třeba při celkovém hodoceí chovu z áhodého výběru vyloučit. 57

58 Kapitola 6 Testováí statistických hypotéz Testováí statistických hypotéz představuje jedu z ejdůležitějších součástí biostatistiky především z pohledu praktického využití metod statistického usuzováí v oblasti vyhodocováí experimetálích dat v biologickém a medicíském výzkumu. Hlavím cílem statistického usuzováí je získat závěry o vlastostech celé populace a základě sledováí a prováděí experimetů a výběrových souborech z této populace. Statistickou aalýzou získaých výběrových dat jsme pak schopi rozhodout o platosti určitého obecého tvrzeí (statistické hypotézy) a úrovi celé populace. 6.1 Experimet Pojmem experimet ozačujeme studii, v íž badatel zkoumá pomocí záměrých změ působících podmíek, jaké změy byly vyvoláy u jedé ebo více skupi jediců ebo jiých pokusých jedotek. Změou působících podmíek rozumíme apř. provedeí určitého pokusého zásahu (itervece) ebo ošetřeí. Tzv. přirozeé experimety využívají ezáměrých změ působících podmíek. Jestliže sledujeme rozdílost mezi dvěma ebo více skupiami, mluvíme o komparativím experimetu. Pro popis změ podmíek, které badatel v experimetu studuje, využíváme pojem ezávisle proměých. Badatel sleduje, jak růzé hodoty ezávisle proměých, jejichž hodoty záměrě volí, ovlivňují cílovou sledovaou proměou (závisle proměou). Cílem experimetálího sledováí je specifikace vztahu mezi závisle proměou a ezávisle proměou (případě ezávisle proměými). Nezávisle proměé jsou ěkdy azýváy faktory a jejich hodoty úrověmi faktorů. Pokusý zásah ebo ošetřeí představuje kombiaci specifických hodot faktorů. Statistickými metodami pak posuzujeme, zda odchylky mezi skupiami vzikly v důsledku áhody, ebo vlivem aplikovaého pokusého zásahu. Experimet je provádě a sledovaých jedotkách (živých jedicích), které experimetátor řadí do růzých skupi (výběrových souborů) podle použité pokusé itervece. V ejjedodušším experimetu výzkumík vybere jedu skupiu a aplikuje a jedicích z této skupiy daý typ pokusého zásahu ebo ošetřeí (apř. určitý typ diety ebo terapie), přičemž hodotu závisle proměé měří buď jeom po experimetu, ebo i před ím. Nejčastějším typem experimetu je však tzv. komparativí experimet, kdy badatel pracuje miimálě se dvěma skupiami tzv. kotrolí a pokusou skupiou. Kotrolí skupia obvykle sestává z jediců, kteří ejsou vystavei pokusé iterveci, jejíž účiky jsou studováy. Skupia vystaveá zkoumaému typu pokusého zásahu se azývá experimetálí (pokusá) skupia. Ostatí podmíky jsou pokud možo u obou skupi udržováy stejé, takže vziklé rozdílosti lze přičíst pouze a vrub zkoumaého pokusého zásahu. V ěkterých případech (především v humáí medicíě) je kotrolí skupia ošetřea placebem tedy ošetřeím, jež je z biologického hlediska zcela eúčié. Experimetátor totiž musí počítat s tzv. efektem placeba, jež způsobuje, že jedici reagují a jakékoliv ošetřeí i v případě, že se použije placebo. Psychologické působeí vědomí, 58

59 že bylo provedeo ošetřeí, může způsobit fyziologické ebo psychické změy. Proto je vhodé ošetřit kotrolí skupiu placebovou áhražkou, aby bylo možo odhadout velikost placebového efektu v daé situaci a provést pravdivější srováí obou skupi. Moho experimetálích studií je možo provést cestou tzv. párového pokusu, kdy provádíme měřeí idetických jediců jedou před pokusem a podruhé po pokusu. Příklad takového přístupu představuje apř. vstupí test a závěrečý test a stejých studetech ve škole, meřeí krevího tlaku stejých jediců před medikací a pod jejím vlivem ebo měřeí tělesé hmotosti před fyzickou zátěží a po í. Někdy musíme zát kotext výzkumu, abychom rozlišili takto spárovaá data ( závislé výběry ) od dat získaých měřeím dvou ezávislých stejě velkých skupi ( ezávislé výběry ). Experimety je možo provádět i s ěkolika ošetřeými skupiami. V ěkterých případech srovávacích experimetů emáme kotrolí skupiu bez itervece, ale všechy skupiy jsou ošetřey ějakým způsobem a pak tyto skupiy porováváme mezi sebou. V složitějších experimetech je možo záměrě měit více ovlivňujících ezávisle proměých. Při prováděí experimetu je důležité avrhout plá experimetu tak, aby jedotlivé ovlivňující proměé epůsobily vzájemě rušivě. Můžeme říci, že dvě proměé jsou v rušivém vztahu, pokud emůžeme oddělit jejich účiek a sledovaou závisle proměou. Potecioálí rušivou proměou v experimetu může být i tzv. skrytá proměá, kterou ezáme a v rámci probíhající studie ji tedy esledujeme. Tato ezámá skrytá proměá může ovlivňovat sledovaou závisle proměou. V každém experimetu se samozřejmě skryté proměé vyskytují ěkteré mají rušivý charakter, jié ikoliv. Například, když provádíme testováí účiosti ového léku proti vysokému krevímu tlaku, považujeme za ezávisle proměou dávku aplikovaého léku a závisle proměou aměřeou hodotu systolického tlaku. Protože je kreví tlak veličiou začě ovlivěou věkem, může věk (pokud ho v experimetu ebereme v úvahu) působit jako skrytá rušivá proměá. Jestliže jsou ovšem jedici do kotrolí i experimetálí skupiy vybírái áhodým výběrem bez ohledu a věk, můžeme říci, že áhodé přiřazeí jediců do skupi kotrolovalo působeí vlivu věku jako rušivé proměé. V tomto případě pak můžeme přisoudit případé vziklé rozdílosti krevího tlaku mezi skupiami účiku sledovaého ového léku a a základě statistického testu pak můžeme prohlásit účiek ového léku za prokázáý. Při prováděí experimetů je dále uté mít a paměti tzv. homogeitu pozorováí, čímž rozumíme okolost, že měřeé zaky se a zkoumaých jedicích musí zachycovat jedotým způsobem u všech pozorovaých skupi. Proto se určují přesé postupy měřeí, laboratorí postupy a vylučují se subjektiví vlivy a pozorováí jak u hodotitele (experimetátora), tak u hodoceého. Vyloučeí subjektivího vlivu a pozorováí (především při výzkumech v humáí medicíě) se dosahuje slepými pokusy eboli maskováím či zaslepeím. Při jedoduchém slepém pokusu se měřeý jediec edozví, jaká forma ošetřeí je u ěho provedea. Jedoduchý slepý pokus bývá vhodý tehdy, když data pocházejí ze subjektivích pozorováí jediců (bolest, celkový pocit apod.). Jestliže existuje možost, že i badatel (hodotitel) podléhá subjektivím vlivům, apř. rád by upředostil ěkteré ošetřeí, pak teto dojem může přeést i a hodoceého a tím ovlivit jeho posuzováí výsledků. Tomuto kombiovaému jevu se předchází dvojitým slepým pokusem, kdy badatel, který získává data, ai testovaý jediec eví, u koho byl použit hodoceý pokusý zásah. Je zřejmé, že slepé pokusy ejsou vždy praktické a pro mohé otázky ai uté (především ve veteriárí medicíě). 59

60 V eposledí řadě je uté při prováděí experimetů mít vždy a zřeteli i tzv. homogeitu okolostí itervece (pokusého zásahu). Tímto termíem rozumíme požadavek, že srovávaé skupiy se od sebe esmí lišit podmíkami průběhu pokusé itervece až a zak, který určuje důvod pro koáí daého experimetu. 6. Teorie testováí statistických hypotéz Testováí statistických hypotéz patří spolu s metodami teorie odhadu k ejdůležitějším postupům statistického usuzováí (statistické idukce). V případě, kdy záme typ rozděleí sledovaé áhodé veličiy v základím souboru, je základí úlohou statistické idukce čiit a základě výběrových dat úsudky o ezámých parametrech rozděleí, případě úsudky o ějaké fukci těchto parametrů. Často existují o základím souboru určité předpoklady, které chceme a základě výběrových dat ověřit. Tyto předpoklady, které se mohou týkat ezámých parametrů, daých fukcí parametrů, ale také tvaru rozděleí a dalších vlastostí základího souboru, můžeme formulovat jako statistické hypotézy. Úlohou statistické idukce pak je rozhodout a základě iformací získaých z áhodých výběrů, zda určitou hypotézu přijmeme ebo zamíteme. Postupy, které vedou k tomuto rozhodutí, azýváme testováí hypotéz. Hypotézy mohou být růzé, týkají se buď rozděleí pravděpodobostí sledovaého zaku v základím souboru, ebo ěkterého z parametrů (popisé charakteristiky) tohoto rozděleí. Statistickou hypotézou může být apř. tvrzeí: daý áhodý výběr pochází z ormálího rozděleí áhodé výběry pocházejí ze stejého rozděleí áhodé výběry jsou z rozděleí, která mají stejou středí hodotu, rozptyl, apod. Rozhodovací pravidlo, kterým přiřadíme rozhodutí o platosti či eplatosti hypotézy, se azývá statistický test. Pokud se statistické hypotézy týkají ezámých parametrů (daých fukcí parametrů) a při prováděí testů hypotéz vycházíme ze zámého rozděleí sledovaé áhodé veličiy v základím souboru (ejčastěji Gaussovo ormálí rozděleí), hovoříme obvykle o parametrických testech. Hypotézy se pak obvykle týkají parametrů ormálího rozděleí středí hodota a rozptyl ) a výpočty se opírají o odhady těchto parametrů z výběrových souborů (aritmetický průměr x a výběrový rozptyl s ). Jestliže se statistické hypotézy týkají obecých vlastostí základího souboru a příslušý test evyžaduje zalost typu rozděleí v základím souboru, hovoříme o eparametrických testech. V tomto případě tedy pracujeme s výběry, které pocházejí z ezámého rozděleí a testovaou statistickou hypotézou obvykle bývá shoda rozděleí dvou souborů. Výpočty se opírají o pořadová čísla aměřeých hodot sledovaé veličiy u výběrových souborů.. Proceduru testováí statistické hypotézy (výzkumé otázky v rámci experimetu) lze schematicky rozložit do ásledujících kroků: 1. Formulace výzkumé otázky ve formě ulové a alterativí statistické hypotézy. Zvoleí hladiy výzamosti (přijatelé úrově chyby testováí) 3. Výpočet testovacího kritéria (testovací statistiky) 4. Závěr (rozhodutí o platosti statistické hypotézy) 60

61 Krok 1: Formulace statistické hypotézy Prví krok při statistickém testováí spočívá ve formulováí výzkumé otázky v podobě ulové, resp. alterativí hypotézy, které klademe při testováí proti sobě: 1) ulová hypotéza (ozačeá H 0 ) tvrzeí, které obvykle vyjadřuje žádý eboli ulový rozdíl mezi testovaými soubory dat (jiými slovy lze říci, že jakýkoli alezeý rozdíl mezi soubory lze přičíst přirozeé variabilitě dat). Nulovou hypotézou mohou být určitá tvrzeí o parametrech základího souboru, apř., že daý parametr je rove určité hodotě: = kost., že dva parametry se rovají: 1, 1, apod. Obvykle jsou to hypotézy, které by badatel při vyhodocováí experimetu rád spíše zamítl. ) alterativí hypotéza (ozačeá H 1 ) - popírá platost ulové hypotézy H 0. Obvykle se vyjadřuje jako existece diferece mezi soubory ebo existece závislosti mezi proměými. Nejčastěji jde o logický opak ulové hypotézy, tz. apř.: kost., 1 ebo 1. Někdy však můžeme mít důvod pracovat i s tzv. jedostraou alterativí hypotézou. Jestliže ulová hypotéza říká, že eexistuje rozdíl mezi středími hodotami pro dvě populace, pak jedostraá alterativí hypotéza může apř. tvrdit, že druhá populace má středí hodotu vyšší (ebo aopak ižší). Naproti tomu tzv. oboustraá alterativí hypotéza, tvrdí, že existuje jakýkoliv rozdíl, tz. rozdíl směrem k větším i meším hodotám. Pokud při statistickém testováí edokážeme opak, předpokládáme, že platí ulová hypotéza. Např.: Máme v experimetu skupiy zvířat, jedu pokusou (P) a druhou kotrolí (K). U pokusé skupiy sledujeme apř. působeí léku a oemocěí, jímž jsou postižey stejě obě skupiy. Kdybychom lék epoužili, měly by výsledky měřeí v obou skupiách být zhruba stejé (v průměru). V tomto případě bychom tvrdili, že obě skupiy zvířat patří do téhož základího souboru, a že rozdíl mezi imi je ulový (platí tedy ulová hypotéza o shodě středích hodot obou souborů - H 0 : 1 ). Hypotézu vždy vyslovujeme obecě o celých populacích, proto používáme symboly teoretických parametrů - středích hodot 1,. Dostaeme-li v experimetu u ošetřeé skupiy P (při aplikaci léku) výsledky výrazě odlišé (v průměru) oproti skupiě kotrolí (K - eošetřeo), pak ulovou hypotézu zamítáme a přijmeme alterativí hypotézu - že skupia P patří do jiého základího souboru ež skupia K, tz., že účiek zkoumaého léku je prokazatelý (ovlivil pokusou skupiu a změil její průměr ve srováí s kotrolí skupiou). V případě, že výsledky se prakticky ebudou lišit (budou se vyskytovat je áhodé rozdíly, způsobeé variabilitou biologického materiálu), přijmeme H 0, tz. prohlásíme lék za eúčiý. Krok : Zvoleí hladiy výzamosti (chyby α) Druhý krok při testováí statistických hypotéz spočívá v určeí hladiy výzamosti testu (chyba α), což je pravděpodobost, že se zamíte ulová hypotéza, ačkoliv oa platí. Tato hladia výzamosti α odpovídá míře ochoty experimetátora smířit se s výskytem této chyby při testováí a volí se pochopitelě dostatečě malá. Je třeba si uvědomit, že testovaou hypotézu vždy přijímáme ebo zamítáme a základě výsledků áhodého výběru, a proto může být zamítutí i ezamítutí hypotézy H 0 správé, ale i esprávé. Obecě se můžeme dopustit jedé ze chyb: - chyba 1. druhu - zamíteme hypotézu H 0, když platí - chyba. druhu ß - esprávě přijmeme hypotézu H 0, když eplatí 61

62 Naší sahou je samozřejmě volit test tak, aby pravděpodobost chyb 1. a. druhu byla co ejmeší. Uiverzálí test miimalizující obě chyby však eexistuje, protože chyby spolu souvisí (čím větší je, tím meší je a aopak). Musíme tedy volit kompromis: zpravidla se postupuje tak, že si předem zvolíme chybu (hladia výzamosti testu) a to dostatečě ízkou pro biologická data se používá 0,05 (příp.0,01) a tím dostaeme 95% (99%) jistotu správého rozhodutí. Chybu emáme možost ovlivit, je dáa velikostí zvoleé chyby. Částečě lze ale redukovat velikost obou chyb současě, a to zvětšeím rozsahu výběrových souborů použitých pro testováí hypotézy. Pravděpodobost 1-ß je defiováa také jako síla testu ebo "rozlišovací schopost" testu. Představuje pravděpodobost, že správě zamíteme ulovou hypotézu H 0, když eplatí. Síla testu závisí a předem zvoleé hladiě výzamosti testu (chyba ) a to tak, že s klesající hladiou výzamosti síla testu klesá. Chybu 1. druhu a chybu. druhu ß při testováí statistických hypotéz přehledě sumarizuje tabulka č Tab. č. 6.1 Chyby a ß při testováí hypotéz ROZHODNUTÍ SKUTEČNOST H 0 PLATÍ H 0 NEPLATÍ ZAMÍTÁME H 0 Chyba I.druhu SPRÁVNĚ 1- (síla testu) NEZAMÍTÁME H 0 SPRÁVNĚ 1- Chyba II.druhu Jak již bylo řečeo výše, při testováí statistických hypotéz postupujeme prakticky tak, že předem zvolíme dostatečě ízkou pravděpodobost chyby 1. druhu α (hladiu výzamosti) a tím zároveň určíme i velikost chyby. druhu, protože obě chyby spolu avzájem souvisí. Vzájemý vztah mezi chybou 1. druhu α a chybou. druhu v závislosti a předem zvoleé hladiě výzamosti zázorňuje obr Obr Vztah mezi chybou 1. druhu α a chybou. druhu 6

63 Krok 3: Výpočet testovacího kritéria Rozhodutí o platosti (eplatosti) ulové hypotézy provádíme a základě výpočtu testovacího kritéra (testovací statistiky), která slouží jako základ pro provedeí úvah o výsledém závěru testu ( doporučeí ). Existuje moho testovacích statistik, výpočet závisí a povaze dat a testovaé hypotéze. U parametrických testů používáme k výpočtu testovacího kritéria odhady parametrů a z výběrových souborů ( x, s ), u eparametrických testů pořadová čísla aměřeých hodot výběrových souborů. Testovací kritéria se řídí růzými typy rozděleí (podle toho, jakou hypotézu testujeme). Jako testovací kritérium mohou sloužit apř. veličiy: t (Studetův t-test pro testováí rozdílu středích hodot) F (F-test pro testováí rozdílu rozptylů) ( - test pro testováí rozdílu četostí souborů) Obor hodot testovacího kritéria rozdělujeme při testováí hypotéz a části: 1) kritický obor - takový obor hodot, který svědčí ve prospěch alterativí hypotézy H 1. Vypočteme-li tedy z výběrových dat hodotu testovacího kritéria, která pade do tohoto oboru, přijmeme hypotézu H 1 (zamítáme H 0 ). ) obor přijetí - pade-li vypočteá hodota testovacího kritéria do tohoto oboru, pak testovaou ulovou hypotézu H 0 ezamíteme. Vymezeí kritického oboru a oboru přijetí se provádí pomocí kritických hodot testovacího kritéria. Jako kritické hodoty testovacího kritéria slouží specifické kvatily příslušých rozděleí (apř. t-rozděleí, F-rozděleí, -rozděleí) související se zvoleou hladiou výzamosti α pro daý test. Obvykle se používají kvatily 1-α/ (případě 1-α) příslušého rozděleí (ejčastěji tedy 97,5% a 99,5% kvatil - podle zvoleé pravděpodobosti chyby: 5% ebo 1%). Tyto kvatily (kritické hodoty) pro růzá rozděleí používaá jako testovací statistiky, jsou tabelováy ve statistických tabulkách a jejich hodota závisí a zvoleé chybě α a počtu stupňů volosti = -1 (v případě eparametrických testů pouze a rozsahu ) výběrových souborů použitých při testováí. Příklad vymezeí kritického oboru a oboru přijetí ulové hypotézy pomocí kritických hodot u testovacího kritéria pro t-rozděleí (Studetův t-test pro testováí rozdílu středích hodot) je zázorě a obrázku 6.. Obr. 6. Obor hodot pro testovací kritérium t : 63

64 t - testovací kritérium f(t) hustota pravděpodobosti testovacího kritétia α - zvoleá hladia výzamosti (chyba 1. druhu) t 1-α/ kvatil 1-α/ t-rozděleí (kritická hodota při testováí) Krok 4: Závěr testováí Posledí krok při testováí statistických hypotéz představuje formulace závěru testováí ( doporučeí ). Lze to provést dvěma způsoby: srováme vypočteou testovací statistiku s kritickou hodotou ebo ji převedeme do pravděpodobostí škály a tzv. hodotu pravděpodobosti p. Prví způsob posouzeí je velmi ázorý. Provedeí spočívá v přímém srováí vypočteé testovací statistiky (testovacího kritéria) s kritickou hodotou, která se určuje v závislosti a zvoleé hladiě výzamosti α. Jestliže se hodota vypočteé testovací statistiky ocite v kritickém oboru ( překročí kritickou hodotu ), zameá to, že existuje evidece pro zamítutí ulové hypotézy (tz. že jsme potvrdili rozdíl ). Naopak, pokud se vypočteá testovací statistika ocite uvitř oboru přijetí H 0, emůžeme zamítout ulovou hypotézu a tedy předpokládáme, že platí. V souvislosti s tímto způsobem uvažováí je uté podotkout, že ezamítutí (přijetí) ulové hypotézy ještě ezameá její důkaz. Spíše to zameá, že emáme dosti evidece k jejímu zamítutí. Při druhém způsobu formulace závěru testováí převádíme testovací statistiku do pravděpodobostí škály a počítáme pravděpodobost p, která odpovídá a otázku: Jestliže ulová hypotéza platí, jaká je pravděpodobost, že získáme právě vypočítaou hodotu ebo ještě eobvyklejší hodotu testovací statistiky? Hodota p tedy kvatifikuje pravděpodobost realizace hodoty testovací statistiky, pokud ulová hypotéza platí. Takže pravidlo pro formulaci závěru je pak ásledující: Jestliže p-hodota je meší ež hladia výzamosti α (chyba α), zamítáme ulovou hypotézu H 0. Symbolicky lze použít závěr: p < 0,05 statisticky výzamý rozdíl ebo p < 0,01 statisticky vysoce výzamý rozdíl Jestliže je p-hodota větší ež hladia výzamosti α (chyba α), ulovou hypotézu H 0 emůžeme zamítout a tedy předpokládáme, že platí. Symbolicky lze psát: p > 0,05 ( statisticky evýzamý rozdíl ) Klasifikace testů podle typů statistických dat Při statistické aalýze sledovaých áhodých veliči (statistických zaků) pomocí statistických testů je vždy důležité vybrat vhodou a odpovídající metodu testováí pro příslušý typ statistických dat. V prví kapitole jsme se sezámili se třemi základími typy statistických zaků: zaky omiálí (kategoriálí data), ordiálí (pořadová data) a kardiálí (metrická data). Nomiálí a ordiálí statistické zaky představují již ze své podstaty data diskrétí (espojitá), kdežto kardiálí zaky mohou být představováy daty spojitými i diskrétími. Každý z těchto typů 64

65 statistických zaků přitom vyžaduje pro své hodoceí a statistické testováí specifické metody a postupy odpovídající povaze těchto dat. a) Testováí kategoriálích dat V případě porováváí dvou áhodých veliči, které jsou představováy kategoriálími daty (omiálími zaky), používáme hodoceí rozdílu četostí těchto zaků v souborech, a to četosti empirické a teoretické. Četosti jsou uspořádáy do tabulky, kde jeda ze sledovaých áhodých veliči představuje řádky a druhá sloupce daé tabulky. Dále testujeme tvrzeí, že četosti jedé veličiy určitým způsobem podmiňují četosti druhé veličiy, tz. že obě sledovaé veličiy jsou a sobě závislé. Aalýzu těchto závislostí omiálích dat, stejě jako aalýzu rozdílů mezi četostmi omiálích zaků provádíme pomocí chí-kvadrát testů (viz kap. 10: -test, kotigečí tabulky). b) Testováí pořadových dat Při porováváí dvou souborů pořadových dat vytváříme směsý výběr variačí řadu uspořádaých hodot z obou souborů, v ěmž přidělíme jedotlivým hodotám pořadová čísla. Následě vypočítáme součty pořadových čísel zvlášť pro hodoty pocházejícím z jedoho i z druhého souboru. Pokud se porovávaé soubory dat výrazě eliší, oba součty pořadí dávají přibližě stejou hodotu. Naopak, při výrazé odlišosti obou souborů dat, součet pořadí pro hodoty jedoho souboru bude velmi odlišý od součtu pořadí pro hodoty druhého souboru. Testováí pořadových dat je reprezetováo eparametrickými testy, které jsou používáy pro testováí hypotéz u ordiálích zaků, u kardiálích zaků diskrétí povahy a u kardiálích spojitých zaků v souborech, které eodpovídají ormálímu rozděleí pravděpodobostí, tz. mají ezámé rozděleí (viz kap. 8 Neparametrické testy). Hypotézy testovaé eparametrickými testy se týkají pouze obecých vlastostí rozděleí, apř. shody dvou křivek rozděleí, přičemž epředpokládají ormalitu dat. c) Testováí spojitých dat s ormálím rozděleím V případě porováváí dvou souborů spojitých áhodých veliči, které odpovídají ormálímu rozděleí pravděpodobostí, používáme parametrické testy, které testují hypotézy týkající se parametrů ormálího rozděleí, tz. středí hodoty a rozptylu. Výpočty se opírají o odhady těchto parametrů z výběrových souborů. Nejčastěji ás zajímá hypotéza o shodě dvou středích hodot, kterou je možo testovat pomocí Studetova t-testu, v ěmž a základě výběrových průměrů a rozptylů počítáme testovací kritérium t (testovací statistika s t-rozděleím). Při porováí s tabulkovou kritickou hodotou t krit. pak rozhodeme o statistické výzamosti rozdílu obou srovávaých středích hodot (viz kap. 7 Parametrické testy) Testováí ormality Jak jsme již pozali v předchozím výkladu, použití většiy metod a postupů v idukčí statistice je specifické pro růzé typy statistických dat. Postupy statistického hodoceí se liší především podle toho, jaké zalosti máme o typu rozděleí sledovaé áhodé veličiy v základím souboru. Proto je uté provést jako jede z prvích kroků při statistickém testováí tzv. test ormality, tj. zjištěí, zda soubor dat sledovaé áhodé veličiy odpovídá Gaussovu ormálímu rozděleí pravděpodobostí, či ikoli (v tomto případě pak pracujeme s ezámým rozděleím). 65

66 Přesto, že většia běžě používaých statistických metod vychází z předpokladu ormality dat, eí test ormality zdaleka běžou statistickou metodou, jak by se dalo očekávat. Důvody k tomu jsou zřejmě dva. Prví spočívá v relativí pracosti tohoto procesu, jehož výpočet bez počítače, případě programovatelé kalkulačky, je časově velmi áročý a druhý spočívá ve skutečosti, že při dostatečě velkých souborech ( > 30) je většia testů a podmíku ormality poměrě málo citlivá. Protože však ěkteré testy splěí podmíky ormality striktě vyžadují, uvedeme si alespoň jede z použitelých testů ormality - test dobré shody, který je vedle testu šikmosti a špičatosti ormálího rozděleí jedím z ejpoužívaějších testů ormality dat Chí-kvadrát test dobré shody Test dobré shody používáme obecě k testováí shody četostí (především u omiálích zaků - kategoriálích dat), ale můžeme ho použít i k otestováí shody rozděleí četostí u zaků kvatitativích, a to metodou porováí distribučí fukce sledovaé spojité áhodé veličiy s distribučí fukcí ormovaého ormálího rozděleí. test dobré shody je založe a posouzeí rozdílu mezi skutečými (empirickými) četostmi výskytu hodot ve výběrovém souboru a očekávaými (teoretickými) četostmi, odpovídajícími příslušému předpokládaému rozděleí pravděpodobostí (Gaussovu ormálímu rozděleí). test rozhoduje, zda je rozdíl mezi empirickými a teoretickými četostmi způsobe pouze áhodě a výběrový soubor pochází z populace s ormálím rozděleím, ebo je rozdíl atolik velký, že je způsobe tím, že výběrový soubor epochází z populace odpovídající Gaussovu ormálímu rozděleí, ale z ějakého jiého ezámého rozděleí. Za předpokladu platosti ulové hypotézy, že testovaá áhodá veličia má ormálí rozděleí ( ulový rozdíl od tohoto rozděleí ), má testovací statistika: m i1 ei oi oi Pearsoovo rozděleí o stupích volosti, kde ei představuje pozorovaé četosti v jedotlivých třídách výběrového souboru a oi teoretické četosti odvozeé výpočtem pomocí tabulek distribučích fukcí ormovaého ormálího rozděleí. Počet stupňů volosti =m-k-1, kde m je počet tříd výběrového souboru a k je počet počet parametrů ormálího rozděleí, které ezáme, a musíme je odhadout z výběrového souboru. Jedotlivé kroky celého testováí ejlépe objasí ásledující schéma postupu: Např.: při sledováí hmotosti králíků máme rozhodout, zda áhodý výběr o 1000 kusech odpovídá Gaussovu ormálímu rozděleí s těmito parametry: = 3,75 kg, = 0,5 kg (kterým se řídí základí soubor). Při testu vycházíme z těchto údajů: Výběrový soubor: x 1, x, x 3,... x 1000 ( = 1000) Základí soubor: = 3,75, =0,5 1) Zvolíme itervaly tříd sledovaé veličiy (d i - dolí mez, h i - horí mez), apř. po 0,5 kg ( i - číslo třídy) ) Zjistí se absolutí četost empirická ei v jedotlivých třídách výběrového souboru. 66

67 3) Vypočítá se absolutí četost teoretická (očekávaá pro ormálí rozděleí) - oi v jedotlivých třídách ásledujícím postupem: a) pro hodoty d i a h i vypočítáme relativí hodoty ormovaé veličiy u di a u hi : u di d i u hi hi b) pro u di a u hi se zjistí v tabulkách hodoty distribučí fukce : F(u di ), F(u hi ) (viz Příloha: Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí) c) pro každou třídu se zjistí teoretická pravděpodobost jako rozdíl distribučí fukce pro horí a dolí mez daé třídy: p oi = F(u hi ) - F(u di ) d) pro každou třídu se vypočítá očekávaá absolutí četost (přepočtem a velikost sledovaého výběrového souboru): oi =. p oi 4) Vypočítá se testovací kritérium (statistika) : m i1 ei oi oi m počet tříd 5) Vypočítaý porováme s tabulkovou hodotou (1-,) - kritická hodota při zvoleé hladiě výzamosti (apř.: 0,05) a = m-k-1 stupích volosti (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ). 6) Je-li (1-,) můžeme vyslovit závěr, že rozdíl mezi empirickou a teoretickou četostí je statisticky evýzamý, tz. že byl způsobe pouze áhodými čiiteli a výběrový soubor pochází z populace s ormálím rozděleím (byla potvrzea shoda s teoretickým předpokladem a sledovaou veličiu můžeme považovat za veličiu s ormálím rozdělemím). Je-li > (1-,) zameá to, že jsme prokázali statisticky výzamý rozdíl mezi empirickou a teoreticky očekávaou četostí pro ormálí rozděleí, tj. teto rozdíl eí způsobe je áhodými čiiteli, ale byl způsobe tím, že výběrový soubor pochází z jiého rozděleí ež ormálího (ebyla potvrzea shoda s teoretickým předpokladem a sledovaou veličiu emůžeme považovat za veličiu s ormálím rozděleím). V případě, že testem dobré shody prokážeme, že sledovaou veličiu můžeme považovat za veličiu s ormálím rozdělemím, pro charakteristiku a další testováí této veličiy můžeme použít použít parametrické metody. V opačém případě, kdy test dobré shody ukáže, že sledovaou 67

68 veličiu emůžeme považovat za veličiu s ormálím rozdělemím, pak pro charakteristiku a další testováí této veličiy je uto použít ezámé rozděleí a eparametrické metody. Jak již bylo uvedeo dříve, výpočetí postup při prováděí chí-kvadrát testu dobré shody je časově poměrě áročý a detailí sezámeí s tímto postupem bude prakticky demostrováo a cvičeích. 68

69 Kapitola 7 Parametrické testy Zřejmě ejčastější úlohou při aalýze experimetálích dat v oblasti biostatistiky je testováí rozdílů mezi dvěma výběrovými soubory za účelem zjištěí, zda existuje rozdíl mezi populacemi, z kterých výběry pocházejí. Nejčastěji testujeme hypotézy o parametrech µ a Gaussova ormálího rozděleí pomocí parametrických testů. Protože je za ejdůležitější parametr populace s ormálím rozděleím považováa středí hodota, je základí otázkou kladeou obvykle při parametrickém testováí experimetálích dat otázka, zda-li se dva výběry shodují ve svém průměru (tj. zda pocházejí z populace s toutéž středí hodotou) ebo zda-li sledovaý výběr má určitou kokrétí hodotu průměru (tj. zda pochází z populace s touto kokrétí středí hodotou). Další otázkou kladeou při parametrickém testováí mohou být dále hypotézy týkající se rozdílu rozptylů mezi dvěma populacemi při hodoceí vlivu pokusých zásahů a variabilitu sledovaé veličiy. Předpokladem použití parametrických testů je splěí ormality dat sledovaých veliči. Mezi parametrické testy se řadí především Studetův t-test pro testováí rozdílu dvou středích hodot a F-test pro testováí rozdílu dvou rozptylů Testováí rozdílu rozptylů: F-test Testem rozhodujeme, zda pokusý zásah má vliv a promělivost (rozptyl ) zkoumaé áhodé veličiy v populaci. Je důležitý i pro porováí přesosti dvou metod měřeí (apř. v laboratořích). Nulovou hypotézu kladeou v F-testu můžeme symbolicky vyjádřit ásledujícím zápisem: H 0 : 1 = Při testu vycházíme z dat dvou výběrových souborů, které jsou předmětem srováváí (typicky pokusý a kotrolí soubor). O každém z těchto souborů předpokládáme, že pochází z populace s určitými parametry µ a : Výběr 1: ( 1 prvků) vybrá ze základího souboru s parametry µ 1 a 1 Výběr : ( prvků) vybrá ze základího souboru s parametry µ a Postup: 1) Vypočteme výběrové rozptyly s 1 a s : s 1 1 xi xi 1 1 s x i 1 x i ) Staovíme počet stupňů volosti obou výběrů: 69

70 v 1 = 1-1 ( pro s 1 ) v = - 1 ( pro s ) 3) Vypočteme testovací kritérium (statistiku) F: větší z rozptylů (s 1, s ) F = meší z rozptylů (s 1, s ) 4) Nechť v v je počet stupňů volosti většího z rozptylů a v M je počet stupňů volosti mešího z rozptylů. 5) Zvolíme hladiu výzamosti. Ve statistických tabulkách (viz Příloha: Tab. č. 7 Kvatily F 0,975 ( V, M ) Fisher- Sedecorova rozděleí) vyhledáme kritickou hodotu F krit. = 1 - / kvatil F-rozděleí o (v V,v M ) stupích volosti a porováme s vypočteou statistikou F. Je-li F > F krit. => zamítáme ulovou hypotézu H 0 ( 1 = ). Jiými slovy to tedy zameá, že rozptyly obou souborů se statisticky výzamě liší (tj. výběry pocházejí ze dvou růzých základích souborů s rozdílými rozptyly 1 a ). Symbolicky lze teto závěr psát: p < 0,05 (příp. p < 0,01 podle zvoleé hladiy výzamosti ). Je-li F < F krit. => emůžeme zamítout hypotézu H 0. Zameá to tedy, že rozptyly obou souborů se statisticky výzamě eliší (tj. výběry pochází ze stejého základího souboru se společým rozptylem ). Symbolicky lze závěr psát: p > 0,05. Příklad 7.1: Byl zjišťová vliv ového veteriárího přípravku a hladiu AST v krevím séru dojic. U výběrového souboru 10 jediců byl přípravek apliková a poté byly změřey hladiy AST v krevím séru těchto dojic. Jako kotrolí soubor byly použity hodoty AST v krevím séru u 10 jediců, kterým přípravek apliková ebyl. Má přípravek vliv a rozptyl aktivity AST? Zjištěé hodoty v mol/l: Bez přípravku: 0,409; 0,345; 0,39; 0,377; 0,398; 0,381; 0,400; 0,405; 0,30; 0,337 S přípravkem: 0,341; 0,30; 0,504; 0,45; 0,309; 0,375; 0,479; 0,43; 0,311; 0,333 Postup: 1) Vypočteme výběrové rozptyly s 1 a s : Kotrola: s 1 = 0,0015 Přípavek: s = 0,

71 ) Vypočteme testovací kritérium: s F s 1 0, ,618 0,0015 3) Staovíme počet stupňů volosti obou výběrů: v 1 = 1-1 = 9 ( pro s 1 ) v = - 1 = 9 ( pro s ) 4) Kritická hodota při hladiě výzamosti α = 0,05 je: F krit (0,975, 9, 9) = 4,06 5) Protože vypočítaé F > F krit. můžeme vyslovit závěr, že byl zjiště statisticky výzamý rozdíl mezi rozptyly (tz. 1 ) a hladiě výzamosti 5%. Závěr: Sledovaý veteriárí přípravek má vliv a změu rozptylu aktivity AST v krevím séru dojic (p < 0,05). 7. Testováí rozdílu středích hodot: Studetův t-test Studetův t-test je ejčastěji používaým parametrickým testem - používá se pro testováí rozdílu středích hodot. Podle statistické výzamosti prokazovaého rozdílu středích hodot (ejčastěji mezi pokusou a kotrolí skupiou) usuzujeme a účiost provedeého pokusého zásahu aplikovaého ve sledovaém experimetu. Výpočet testovacího kritéria t vychází z odhadů parametrů a u výběrových souborů: x a s. Vypočteé testovací kritérium porováme s tabulkovou kritickou hodotou (1-/ kvatil Studetova t-rozděleí pro daé a zvoleé ). Podle toho, jaká data (soubory) máme k dispozici pro porováváí, rozlišujeme ěkolik variat t-testu: Porováí základího a výběrového souboru (jedovýběrový t-test) Jedovýběrový t-test používáme pro hodoceí experimetů, kdy záme středí hodotu u základího souboru (apř. fyziologické hodoty sledovaé veličiy) tuto je pak možo považovat za kostatu. V experimetu pak ověřujeme hypotézu, že sledovaý výběrový soubor, u ěhož byla provedea aplikace testovaého pokusého zásahu, pochází z populace, která má stejou středí hodotu jako tato zámá kostata. Nulovou hypotézu kladeou v této variatě t- testu můžeme symbolicky vyjádřit ásledujícím zápisem: H 0 : = kost. Při testu vycházíme z dat sledovaého výběrového souboru, u kterého předpokládáme, že pochází z populace s určitými parametry µ a a dále ze zámé středí hodoty základího souboru, která je rova určité (zámé) kostatě. 71

72 Postup: 1) Vypočteme aritmetický průměr a rozptyl výběrového souboru (počet čleů: ). ) Vypočteme testovací kritérium (statistiku) t: t x s x - průměr výběrového souboru - středí hodota základího souboru s rozptyl výběrového souboru počet čleů výběrového souboru 3) Staovíme počet stupňů volosti výběrového souboru: = 1 4) Vypočteé t porováme s tabulkovou kritickou hodotou t 1-/(), kde = -1 a volíme 0,05 ebo 0,01 (viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí): Je-li t t 1-/() statisticky evýzamý rozdíl testovaých parametrů při zvoleé (ulová hypotéza H 0 platí, tz. výběrový soubor pochází z populace se zámou středí hodotou = kost.). Můžeme tedy říci, že aplikovaý pokusý zásah byl eúčiý, protože ebyla ovlivěa středí hodota souboru při aplikaci zásahu (symbolicky: p > 0,05). Je-li t t 1-/() statisticky výzamý rozdíl testovaých parametrů (při hladiě výzamosti = 0,05) ebo statisticky vysoce výzamý rozdíl (při = 0,01) (ulovou hypotézu H 0 elze přijmout, tz. výběrový soubor epochází s populace se zámou středí hodotou a pochází z jié populace, kde kost.). Můžeme tedy říci, že pokusý zásah byl účiý, protože způsobil změu středí hodoty u pokusého souboru ve srováí se zámou kostatí středí hodotou (p < 0,05 resp. p < 0,01). Příklad 7.: V chovu dojic je středí hodota hladiy glukózy v krevím séru = 3,1 mmoll -1. Po aplikaci eergetického přípravku do krmiva u souboru 10 áhodě vybraých dojic byly zjištěy ásledující hladiy glukózy v krevím séru v mmoll -1 : 3,1;,7; 3,3; 3,1; 3,1; 3,; 3,0;,8;,9;,7. Má použitý přípravek vliv a hladiu glukózy krevího séra u dojic? 7

73 Postup: 1) Vypočteme aritmetický průměr a rozptyl výběrového souboru: x,99 s 0,079 s 0,043 ) Zámá středí hodota základího souboru: = 3.1 mmoll -1. 3) Staovíme počet stupňů volosti: = 1 = 9 4) Vypočítáme testovací kritérium t: t x μ s,99 3,1 0, ,578 5) Kritická hodota z tabulek (Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí): t (0,975; 9) =,6 6) Porováme vypočítaé testovací kritérium s kritickou hodotou: Protože vypočítaé t < t krit. můžeme vyslovit závěr, že byl zjiště statisticky evýzamý rozdíl mezi průměry a hladiě výzamosti 5% (p > 0,05). (ulovou hypotézu H 0 ezamítáme, tz. že sledovaý výběr pochází z populace se zámou středí hodotou = 3.1). Závěr: Použitý eergetický přípravek emá vliv a hladiu glukózy krevího séra u dojic (p > 0,05). 7.. Porováí dvou výběrových souborů (dvojvýběrový t-test) Tato variata Studetova t-testu se používá pro hodoceí experimetů, kde ezáme středí hodotu základího souboru, a vycházíme proto pouze z výběrových dat souborů. Tato data mohou být představováa buď dvěma měřeími provedeými opakovaě u jedé skupiy jediců (typicky měřeí před aplikací pokusého zásahu a po aplikaci tzv. párový pokus eboli závislé výběry ) ebo dvěma ezávislými skupiami měřeí ( epárový pokus eboli ezávislé výběry ). Testovaou ulovou hypotézu v případě dvojvýběrového t-testu můžeme symbolicky vyjádřit ásledujícím zápisem: H 0 : 1 = A) Párový pokus Párovým t-testem porováváme data, která tvoří spárovaé variačí řady, tz. že pocházejí ze subjektů, které byly podrobey dvěma měřeím. U jedoho výběrového souboru 73

74 jsou provedea měřeí: 1. měřeí před aplikací pokusého zásahu,. po aplikaci pokusého zásahu (případě měřeí dvou polovi každého odebraého vzorku, přičemž každá polovia je ošetřea růzým způsobem). Takto získaé hodoty tvoří páry a reprezetují při testováí jak kotrolí tak i pokusou skupiu porovávaých dat. V testu vycházíme z rozdílů aměřeých párových hodot u srovávaých variačích řad. Testujeme hypotézu, že středí hodota měřeí před pokusem a po pokuse se rovají (případě že rozdíl středích hodot párových měřeí je ulový). Postup: 1) Vypočteme rozdíly párových hodot u výběrového souboru ( - počet párů) a ze zjištěých rozdílů vypočítáme aritmetický průměr x a směrodatou odchylku s (resp. rozptyl s ). ) Vypočteme testovací kritérium (statistiku) t: t x s 3) Staovíme počet stupňů volosti výběrového souboru: = -1 4) Vypočteé t porováme s tabulkovou kritickou hodotou t 1-/(), kde = -1 a volíme 0,05 ebo 0,01 (viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí): Je-li t t 1-/() statisticky evýzamý rozdíl testovaých parametrů při zvoleé. Nulová hypotéza H 0 platí, tz. že středí hodota měřeí před pokusem se eliší od středí hodoty měřeí po pokusu. Můžeme tedy říci, že aplikovaý pokusý zásah byl eúčiý, protože ebyla ovlivěa středí hodota měřeí provedeého po aplikaci zásahu (p > 0,05). Je-li t t 1-/() statisticky výzamý rozdíl testovaých parametrů (při hladiě výzamosti = 0,05) ebo statisticky vysoce výzamý rozdíl (při = 0,01) Zamítáme ulovou hypotézu H 0. Zameá to tedy že středí hodota měřeí před pokusem se liší od středí hodoty měřeí po pokusu. Můžeme tedy říci, že pokusý zásah byl účiý, protože způsobil změu středí hodoty u měřeí provedeého po aplikaci pokusého zásahu ve srováí se středí hodotou zjištěou před aplikací zásahu (p < 0,05 resp. p < 0,01). Příklad 7.3: Zjistěte, zda režim s fyzickou zátěží způsobí změu hmotosti u laboratorích potkaů poté, co byli režimu podrobei. Změy hmotosti u 1 pokusých jediců (váha po zátěži míus váha před zátěží) v g: 0,; -0,5; -1,3; -1,6; -0,7; 0,4; -0,1; 0,0; -0,6; -1,1; -1,; -0,8. 74

75 Postup: 1) Vypočítáme aritmetický průměr a rozptyl rozdílů párových hodot: x 0,61 g s 0,4008 g ) Vypočteme testovací kritérium pro párový t-test: t x s 0,61 0, ,389 3) Staovíme počet stupňů volosti výběrového souboru: = -1 = 11 4) Kritické hodoty alezeé v tabulkách pro zvoleou hladiu výzamosti (viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí): t (0,975; 11) =,01 t (0,995; 11) = 3,106 5) Vypočteé t porováme s tabulkovou kritickou hodotou t 1-/() : Protože vypočítaé t > t (0.995; 11) můžeme vyslovit závěr, že byl zjiště statisticky vysoce výzamý rozdíl mezi průměry párových hodot a hladiě výzamosti α = 0,01. Závěr: Režim s fyzickou zátěží způsobí vysoce výzamý úbytek hmotosti u laboratorích potkamů (p < 0,01). B) Nepárový pokus Nepárovým t-testem porováváme data, která tvoří dva ezávislé výběry, tz. že pocházejí ze dvou růzých skupi subjektů. Typicky jde o porováí hodot pokusé skupiy (kde byl apliková pokusý zásah) a kotrolí skupiy (bez aplikace pokusého zásahu). Testujeme ulovou hypotézu, že středí hodota 1 populace, ze které pochází pokusý výběr a středí hodota populace, ze které pochází kotrolí výběr se shodují. V testu vycházíme z odhadů parametrů obou srovávaých populací, tj. aritmetického průměru a výběrového rozptylu u pokusého a kotrolího výběru. Postup: 1) U výběrových souborů vypočteme výběrové charakteristiky: 1. výběrový soubor (počet čleů 1 ) : x 1, s 1. výběrový soubor (počet čleů ) : x, s 75

76 ) Oba soubory mohou pocházet z populací, které mají stejý ebo aopak růzý rozptylem hodot sledovaé veličiy. Protože růzá variabilita dat ovlivňuje provedeí epárového t-testu, je ejprve uto otestovat rozdíl rozptylů obou souborů (ulovou hypotézu H 0 : 1 = ) pomocí F-testu: F = větší z rozptylů (s 1, s ) meší z rozptylů (s 1, s ) 3) Staovíme stupě volosti pro F-test: stupě volosti čitatele (většího rozptylu): V = (1,) 1 stupě volosti jmeovatele (mešího rozptylu): M = (1,) 1 4) Ve statistických tabulkách (viz Příloha: Tab. č. 7 Kvatily F 0,975 ( V, M ) Fisher- Sedecorova rozděleí) vyhledáme kritickou hodotu F krit. = 1 - / kvatil F-rozděleí o (v V,v M ) stupích volosti pro zvoleou hladiu výzamosti α = 0,05. Podle výsledku F-testu rozhodeme o dalším postupu pro epárový t-test: 5a) Je-li F F 0,975 (V, M) tz. že platí H 0 : 1 =. Oba výběrové soubory pocházejí z populací se shodým rozptylem. V tomto případě zvolíme pro testováí rozdílu středích hodot epárový t-test pro shodé rozptyly: t x x 1 1 s s Staovíme stupě volosti pro t-test: = V případě shodého počtu čleů v obou výběrových souborech (Pro 1 = = ), je možo výpočet testovacího kritéria i stupňů volosti zjedodušit: Pro 1 = = : t x s 1 1 x s = (-1). 5b) Je-li F > F 0,975 (V, M) tz. že eplatí ulová hypotéza, tedy 1. Oba výběry pocházejí z populací s růzým rozptylem. V tomto případě zvolíme pro testováí rozdílu středích hodot epárový t-test pro růzé rozptyly: 76

77 Nepárový t-test pro růzé rozptyly: t x s1 x 1 1 s Staovíme stupě volosti pro t-test: s1 1 s s 1 s (Pro 1, > 30: = ) V případě shodého počtu čleů v obou výběrových souborech (Pro 1 = = ), je možo výpočet testovacího kritéria zjedodušit: Pro 1 = = : t x s 1 1 x s 6) Vypočteé t porováme s tabulkovou kritickou hodotou t 1-/(), alezeou podle daého a zvoleé hladiy výzamosti (0,05 ebo 0,01) - viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí: Je-li t t 1-/() statisticky evýzamý rozdíl testovaých parametrů při zvoleé (ulová hypotéza H 0 platí, tz. že středí hodota pokusého souboru se eliší od středí hodoty kotrolího souboru). Můžeme tedy říci, že aplikovaý pokusý zásah byl eúčiý, protože ebyla ovlivěa středí hodota pokusého souboru vlivem aplikace zásahu ve srováí se středí hodotou kotrolího souboru (p > 0,05). Je-li t t 1-/() statisticky výzamý rozdíl testovaých parametrů (při hladiě výzamosti = 0,05) ebo statisticky vysoce výzamý rozdíl (při = 0,01) (ulovou hypotézu H 0 zamítáme, tz. že středí hodota pokusého souboru se liší od středí hodoty kotrolího souboru). Můžeme tedy říci, že pokusý zásah byl účiý, protože způsobil změu středí hodoty u pokusého souboru vlivem aplikace pokusého zásahu ve srováí se středí hodotou zjištěou u kotrolého souboru (p < 0,05 resp. p < 0,01). 77

78 Příklad 7.4: Byl sledová účiek ového preparátu a změu doby srážlivosti krve (v miutách) u prasat. Preparát byl apliková u pokusého souboru 7 jediců a byly aměřey tyto doby srážlivosti krve: 9,9; 9,0; 11,1; 9,6; 8,7; 10,4; 9,5. U kotrolí skupiy 7 jediců (bez aplikace přípravku) byly aměřey ásledující doby srážlivosti krve: 8,8; 8,4; 7,9; 8,7; 9,1; 9,6; 8,7. Zjistěte, zda přípravek má vliv a dobu srážlivosti krve? Postup: 1) Vypočteme aritmetický průměr a rozptyl a stupě volosti obou výběrových souborů: Pokusý: x 9,74 mi 7 Kotrolí: s x s 1 1 0,670 mi 8,74 mi 0,83mi 6 ) Vypočteme testovací statistiku pro F-test: 3) Vyhledáme kritickou hodotu pro F-test: F krit. (0,975; 6,6) = 5,80 (viz Příloha: Tab. č. 7 Kvatily F 0,975 ( V, M ) Fisher-Sedecorova rozděleí) Protože F < F krit. platí H 0 o shodě rozptylů: 1 = 4) Vypočteme testivací kritérium pro epárový t-test pro shodé rozptyly: ,670 F 0,83,367 t x s 1 1 x s 9,743 8,743 3,834 0,61 5) Staovíme počet stupňů volosti pro t-test: = ( 1). = 1 6) Kritické hodoty pro t-test: t krit. (0,975; 1) =,179 t krit. (0,995; 1) = 3,055 (viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí) 7) Porováme vypočteé testovací kritérium t s tabulkovými kritickými hodotami pro růzé hladiy výzamosti α: Protože t > t krit. (0,995 1) eplatí ulová hypotéza H 0, tz. byl prokázá statisticky vysoce výzamý rozdíl mezi středími hodotami obou souborů a hladiě výzamosti α = 0,01. 8) Závěr: Testovaý přípravek má vysoce výzamý vliv a prodloužeí doby srážlivosti krve u prasat (p < 0,01). 78

79 7. 3 Testováí rozdílu více středích hodot V experimetech se často vyskytuje situace, kdy pracujeme s ěkolika skupiami, které byly podrobey působeí růzých podmíek (faktorů), jejichž účiek je předmětem ašeho sledováí. Podmíky působící a jedotlivé skupiy reprezetují v těchto případech růzé pokusé zásahy (z ichž jede může představovat stadardí ošetřeí, které slouží jako kotrola). V těchto situacích potřebujeme zjistit, zda existují rozdíly mezi těmito skupiami, tz. potřebujeme porovat jejich průměry avzájem pro všechy možé páry skupi (případě pouze středí hodoty pokusých skupiy oproti kotrole). Statistické metody, které toto víceásobé porováváí středích hodot umožňují, jsou soustředěy pod souhrým ázvem aalýza rozptylu (ANOVA Aalysis of Variace). Název této statistické metody je odvoze ze skutečosti, že metoda je založea a vztazích rozptylů porovávaých výběrových souborů (testováí shody středích hodot se vlastě převádí a testováí shody dvou rozptylů (F-test). Pro validí použití metody aalýzy rozptylu pro testováí rozdílu více středích hodot musí být splěy ásledující předpoklady: - ezávislost měřeí (všecha měřeí musí být ezávislá uvitř skupi i mezi skupiami) - ormalita dat (hodoty v každé skupiě musí alespoň přibližě odpovídat Gaussovu ormálímu rozděleí) - homogeita rozptylů uvitř skupi (rozptyly ve všech skupiách musí být alespoň přibližě shodé) Obecě spočívá základí fukce aalýzy rozptylu v posouzeí hlavích a iterakčích efektů kategoriálích ezávislých proměých a závisle proměou (proměé) kvatitativího typu. Nezávisle proměé v aalýze rozptylu často azýváme faktory a jejich hodoty úrově faktorů ebo kategorie. Nejjedodušším případem aalýzy rozptylu je jedofaktorová aalýza rozptylu (aalýza rozptylu při jedoduchém tříděí, oe-way ANOVA), kdy aalyzujeme účiek jedoho faktoru a zkoumaou závisle proměou. Jde o zobecěou aalogii případu zjišťováí rozdílu průměrů mezi dvěma ezávislými skupiami pomocí epárového t-testu. V případě jedofaktorové aalýzy rozptylu jde o zjišťováí rozdílů průměrů mezi více skupiami (které reprezetují jedotlivé úrově eboli kategorie sledovaého faktoru) prostředictvím výpočtu testovacího kritéria F. Zkoumá se, zda skupiy vytvořeé klasifikačím faktorem jsou si podobé, ebo zda jedotlivé průměry tvoří ějaké idetifikovatelé shluky (homogeí podskupiy s podobými hodotami). Jestliže má působící faktor jeom dvě kategorie (úrově), úloha je totožá s testováím rovosti průměrů ve dvou ezávislých výběrech pomocí t-testu. Příkladem situace, která je vhodá pro statistické řešeí pomocí aalýzy rozptylu jedoduchého tříděí může být apř. krmý experimet, v ěmž sledujeme působeí vlivu růzých přípravků (A a B) použitých jako aditiva do krmiva a zvyšováí váhových přírůstků u kuřat. V pokusu jsou zastavey 3 skupiy kuřat: skup. K kotrola (stadardí krmá směs), skup.a přídavek přípravku A, skup.b přídavek přípravku B. Sledujeme tedy jede faktor se třemi úrověmi (K, A, B). Po ukočeí výkrmu, poražeí a zvážeí kuřat je u skupi A a B zjištěa zvýšeá průměrá hmotost. Máme statisticky vyhodotit, zda zvýšeý průměr hmotosti kuřat u těchto skupi ve srováí s kotrolou byl způsobe přidáváím přípravků A a B ebo zda se jedá pouze o áhodé zvýšeí. Testujeme tedy ulovou hypotézu, že středí hodoty všech tří 79

80 skupi se rovají a testováí provádíme a základě aalýzy vztahů mezi rozptyly v jedotlivých skupiách tedy pomocí F-testu, který představuje základ výpočtů při aalýze rozptylu. Základí statistikou počítaou v aalýze rozptylu je obecě testovací kritérium F, pomocí ěhož se testuje hypotéza, zda průměry ve skupiách určeých působícím faktorem (příp. faktory) se od sebe liší více ež a základě působeí přirozeé variability (áhodého kolísáí). Počítaá testovací statistika F zohledňuje variabilitu výběrových průměrů a zároveň přirozeou variabilitu závislé áhodé proměé. Pro lepší ázorost si můžeme představit, že celkovou variabilitu (rozptyl) zkoumaé proměé lze rozdělit a dvě složky: rozptyl mezi skupiami (tz. rozptyl výběrových průměrů kolem společého průměru, tj. vážeého průměru ze všech výběrových průměrů) a rozptyl uvitř skupi (tj. rozptyl mezi jedici ve stejé skupiě). Rozptyl uvitř skupi je podmíě přirozeou variabilitou jedotlivých hodot uvitř skupi, tz. pro ás ezámou složkou celkové variability, kterou považujeme za áhodé vlivy. O rozptylu mezi skupiami předpokládáme, že je způsobe jedak pokusým zásahem (působícími faktory) a jedak opět áhodými vlivy. Při porováí obou rozptylů poměrem (pomocí F-testu) pak můžeme testovat ulovou hypotézu o shodě těchto rozptylů. Výpočet F-statistiky v aalýze rozptylu můžeme zapsat v obecé formě: F rozptyl "mezi skupiami" rozptyl "uvitř skupi" Protože předpokládáme, že áhodé vlivy působí stejou měrou mezi skupiami i uvitř skupi, můžeme případý rozdíl v rozptylech zjištěý F-testem připsat a vrub působícího pokusého zásahu. Vypočteé tetovací kritérium F porováme s tabulkovou kritickou hodotou (Tab. č. 7 Kvatily F 0,975 ( V, M ) Fisher-Sedecorova rozděleí) a pokud celková variabilita měřeá pomocí F-statistiky překročí tuto kritickou hodotu, zamíteme hypotézu o shodě rozptylů a tím i ulovou hypotézu aalýzy rozptylu, že středí hodoty sledovaých skupi se eliší (při jedoduchém tříděí je to hypotéza H 0 : 1 = = 3 =.. = m, kde m je počet srovávaých skupi). V tomto případě platí alterativí hypotéza H 1 : Ne všechy středí hodoty jsou stejé (tj. alespoň jeda ze středích hodoty se liší od ostatích). Pokud zamíteme ulovou hypotézu o shodě testovaých středích hodot, ještě ám to ic eříká o rozdílech mezi jedotlivými průměry. Proto je uté, v případě, že aalýza rozptylu zamíte globálí ulovou hypotézu, doplit rozbor ještě dalšími metodami ásledého zkoumáí existujících rozdílů. Tyto tzv. multikomparativí testy (testy pro mohoásobé porováváí) pak dávají výsledkem statistickou výzamost jedotlivých rozdílů středích hodot u všech možých párů porovávaých skupi. Mezi ejčastěji používaé testy pro mohoásobé porováí všech dvojic skupi v experimetu avzájem patří apř. Tukey-test, Sheffe-test, Studet-Neuma-Keulstest (SNK test) ad. V případě, kdy jeda ze skupi v experimetu slouží jako kotrolí skupia (bez aplikace pokusého zásahu), může ám jít pouze o porováí středích hodot pokusých skupi vzhledem k této kotrole - pro tuto situaci je vhodý apř. Duett-test. Každý z testů pro mohoásobé porováváí má trochu jié vlastosti, liší se především tím, jak ošetřují při testováí velikost chyby 1. druhu α (hladiu výzamosti testu). Některé z testů, apř. Tukey-HSD test ( hoestly sigificat differece test) jsou spíše kozervativí, tz. že si udržují za dosti volých předpokladů požadovaou hladiu výzamosti v celém experimetu a díky tomu, že provádějí příslušá rozhodutí zpravidla a meší hladiě výzamosti, edovolí, aby pravděpodobost chyby α ekotrolovatelě vzrostla. Jié testy, apř. LSD test (least 80

81 sigificat differece test) jsou spíše liberálí, tz. že je u ich velmi pravděpodobé zamítutí ulové hypotézy o shodě porovávaých dvojic středích hodot (jiými slovy, můžeme u ich sado získat statistickou výzamost rozdílů testovaých dvojic středích hodot). Je třeba si však uvědomit, že tyto výsledé výzamosti mohou být ěkdy falešé, protože liberálí testy edostatečě upravují (tj. esižují) hladiu výzamosti při testováí rozdílů u jedotlivých dvojic skupi. Chyba 1. druhu α v celém experimetu tak může eúměrě vzrůst. Často se v praxi setkáváme s pokusy, ve kterých esledujeme je jede, ale více působících faktorů, apř. vliv krmeí a plemee, vliv léku v růzých stádiích oemocěí, vliv živé půdy a způsobu kultivace a růst zárodků, vliv růzých druhů atibiotik a jejich dávky apod. Pokud zkoumáme vliv dvou a více faktorů působích a závisle proměou, hovoříme o vícefaktorové aalýze rozptylu. Při tomto postupu rozlišujeme mezi hlavími efekty a efekty, které jsou způsobey iterakcemi mezi faktory při působeí a závisle proměou. Hlaví efekt je přímý efekt faktoru a závisle proměou. Iterakčí efekt představuje spojeý efekt kombiace dvou ebo více faktorů a závisle proměou. Nejjedodušším případem vícefaktorové aalýzy rozptylu je aalýza rozptylu dvojého tříděí (two-way ANOVA), při íž zkoumáme vliv dvou faktorů a závisle proměou. Pomocí aalýzy rozptylu dvojého tříděí aalyzujeme často tzv. blokové experimety, při ichž zkoumáme vliv určitého faktoru (ozačeého apř. A), který pláovitě měíme, zatímco druhý faktor (ozačeý jako B) považujeme za vliv rušivý. Při aalýze se sažíme vliv rušivého faktoru oddělit od vlivu faktoru A. Proto se při prováděí takového experimetu ejdříve sledovaé objekty (apř. pacieti s peumoií) rozdělí do tzv. bloků podle úrově faktoru B (apř. dávka atibiotika) a uvitř bloku se objekty áhodě přiřadí k úrovím faktoru A (apř. druh použitého atibiotika). Aalýzou rozptylu pak studujeme rozdíl mezi účikem jedotlivých druhů atibiotik podávaých v růzých dávkách. Iterpretace výsledků aalýzy rozptylu pro dvojé tříděí závisí silě a přítomostí iterakcí mezi faktory. Iterakce jsou jediým podstatým problémem při zobecěí postupu jedoduché aalýzy rozptylu pro použití při hodoceí působeí více faktorů. Koečá iterpretace výsledků aylýzy rozptylu dvojého (i víceásobého) tříděí pak spočívá ve vyhodoceí vlivu kombiací hlavích a iterakčích efektů působících v experimetu. Komplexí problematika aalýzy rozptylu a podrobější popis jedotlivých metod a postupů shrovaých pod pojmem aalýza rozptylu (včetě všech jejích variat a ásledých multikomparativích testů) je začě složitá a přesahuje rozsahový rámec tohoto učebího textu. Odkazujeme proto případé zájemce o detailější studium této problematiky a další statistickou literaturu. 81

82 Kapitola 8 Neparametrické testy Neparametrické testy se používají pro porováí souborů statistických dat, u ichž elze předpokládat ormálí rozděleí pravděpodobostí sledovaého zaku áhodá veličia má ezámé rozděleí, které elze charakterizovat pomocí parametrů µ a. Nulová hypotéza, kterou testujeme v eparametrických testech se týká pouze obecých vlastostí rozděleí sledovaé veličiy ve statistických souborech. Zjišťujeme, zda se shoduje ebo eshoduje rozděleí četostí sledovaých veliči, tz. testujeme hulovou hypotézu, která tvrdí, že se shoduje tvar křivky rozděleí v porovávaých souborech dat. Výpočty u eparametrických testů vycházejí z pořadových čísel jedotlivých hodot variačí řady ("pořadové testy"), mohou být proto použity i u dat, která emají přesý číselý výzam a jsou ve skutečosti je pořadím. Neparametrické testy jsou vhodé pro i ordiálí zaky, jež jsou hodocey subjektiví stupicí hodot, která představuje v podstatě pořadová čísla (apř. bodováí v chovatelských soutěžích, školí klasifikace, zámky při boitacích, degustačích soutěžích, stupice pro chováí zvířete v experimetu apod.). Využití eparametrických testů je obecější ež u parametrických testů, protože je lze použít jak pro data, která eodpovídají ormálímu rozděleí pravděpodobostí, tak i pro data, která ormálímu rozděleí odpovídají. V tomto případě se používají eparametrické testy obvykle k orietačímu hodoceí, kdy se pro testováí epoužijí původí aměřeá data, ale pouze jejich pořadová čísla ve variačí řadě vytvořeé určitým postupem z hodot obou porovávaých souborů. Výpočty jsou obvykle začě jedodušší, ale přesost a rozlišovací schopost (síla testu) eparametrických testů eí tak vysoká jako u testů parametrických tz., že mezi testovaými soubory musí existovat výrazý rozdíl, aby byl prokázá v testu jako statisticky výzamý Ma-Whiteyův pořadový test Používá se pro hodoceí epárových pokusů, kdy porováváme růzé výběrové soubory (A, B). Testujeme hypotézu, že veličia X odpovídající pokusému zásahu A a veličia Y odpovídající pokusému zásahu B (ebo kotrole) mají totéž rozděleí pravděpodobostí. Přitom veličiy X a Y emusí odpovídat Gaussovu ormálímu rozděleí, stačí předpoklad, že jsou spojité. Měřeí a pokusých jedotkách po zásahu A ozačíme x 1, x, x 3,...x 1 (veličia X) a měřeí a pokusých jedotkách po zásahu B ozačíme y 1, y, y 3,...y (veličia Y). Pak všecha měřeí uspořádáme bez ohledu a to, ze které skupiy pocházejí vzestupě podle velikosti, čímž získáme tzv. směsý výběr (veličia z): z 1 < z < z 3 <...< z ( = 1 + ). Jedotlivým hodotám přiřadíme pořadí (od 1. do.). Pokud se ebo více hodot ve směsém výběru shodují, přiřadíme jim tzv. průměré pořadí (apř. pokud jsou 1. a. hodota z 1 i z stejé, tak obě dostaou pořadové číslo 1,5. Toto bylo vypočteo z původích pořadí jako jejich průměr: (1. +.)/ = 1,5). 8

83 Neliší-li se pokusé zásahy, pak by veličiy X a Y měly mít shodé rozděleí pravděpodobostí a tím i průměré pořadí (v ideálím případě by ve směsém výběru ásledovaly za sebou vždy stejé hodoty- jeda ze skupiy A a druhá ze skupiy B ). V tomto případě, ale i v případě alespoň částečé shody souborů bychom tedy měli dostat pro každou skupiu (A, B) zhruba stejý součet pořadových čísel. Ozačíme: R A - součet pořadí příslušejících hodotám veličiy X R B - součet pořadí příslušejících hodotám veličiy Y Přitom platí, že součet všech pořadí ( = 1 + ) musí odpovídat součtu číslic od 1 do podle * ( 1) vzorce: RA RB U rozsáhlých souborů, kde je sčítáí všech pořadových čísel směsého výběru pro obě skupiy pracé, můžeme a základě výše uvedeého vztahu použít ásledující ulehčeí výpočtu: sečteme je pořadová čísla u jedé skupiy a u druhé skupiy pak součet pořadí odvodíme z tohoto vztahu. U Vypočteme testovací statistiky: * ( 1) 1 1 A 1 * R A B 1 B U * * ( 1) R Výpočet je opět možo usadit, protože platí ásledující vztah mezi oběma statistikami: U A + U B = 1 * Jako testovací kritérium použijeme meší z čísel U A a U B, tj.: U = mi (U A,U B ) a porováme ho s tabulkovou kritickou hodotou Ma - Whiteyova testu pro příslušé 1, a zvoleou hladiu výzamosti (viz Příloha: Tabulka č. 8 Kritické hodoty Ma-Whiteyova testu). Je-li U < U (, 1, ) => zamítáme hypotézu H 0 o shodosti rozděleí veliči X a Y, tj. rovosti vlivu pokusých zásahů a zkoumaou veličiu. Je-li U > U (, 1, ) => emůžeme zamítout hypotézu H 0 shodosti rozděleí veliči X a Y, tj. rovosti vlivu pokusých zásahů a zkoumaou veličiu. Příklad 8.1: Byl sledová vliv vitamíového doplňku do krmiva a zvyšováí váhových přírůstků u selat. U 19 z 38 áhodě vybraých selat byl apliková vitamíový přípravek v krmé směsi (pokusý zásah B ). Váhové přírůstky v kg pro stadardí směs (pokusý zásah A ) byly ásledující: ,5 9,5 33, , , ,5 3,5 Váhové přírůstky po pokusém zásahu B (vitamíový doplěk) byly (v kg): 3,5 30, , , ,5 40 4, ,

84 Postup: 1) Vytvoříme směsý výběr seřazeím všech hodot z obou souborů vzestupě do jedé variačí řady. Směsý výběr: 7 9 9, , ,5...4, Pokusý zásah: A A A A B B A... B B B ) Přidělíme pořadová čísla: Pořadí: ) Vypočteme součty pořadí pro pokusý zásah A a pokusý zásah B : R A =8 R B = 38.39/ - 8 = 459 4) Vypočteme testovací statistiky U A a U B : U A = / U B = U A = 9 5) Jako testovací kritérium vybereme meší ze statistik U A a U B : Test. kritérium: U = mi (69, 9) = 9 6) Vyhledáme tabulkové kritické hodoty pro Ma-Whiteyův test (viz Příloha: Tabulka č. 8 Kritické hodoty Ma-Whiteyova testu). 5% tabulková kritická hodota pro 1 = = 19 je 113,0. 1% tabulková kritická hodota pro 1 = = 19 je 93,1. 7) Porováme vypočteé testovací kritérium U s tabulkovou kritickou hodotou: Protože U < 93,1, zamítáme hypotézu shodosti vlivů pokusých zásahů A a B 8) Závěr: Protože se porovávaé způsoby výkrmů (pokusý zásah A a B ) statisticky vysoce výzamě liší (p < 0,01), zameá to, že vitamíový doplěk statisticky vysoce výzamě zvyšuje hmotostí přírůstky u selat. 8. Wilcoxoův test Používá se pro hodoceí párových pokusů (tz. měřeí provedaá a jedom výběrovém souboru). Testuje hypotézu rovosti distribučích fukcí a základě ověřeí symetrického rozložeí sledovaé veličiy. V testu vycházíme z párových hodot dvou měřeí a jedom výběrovém souboru: veličiy X a X (obvykle měřeí před a po pokusém zásahu, případě měřeí dvou polovi každého odebraého vzorku ošetřeých růzým způsobem). Zjistíme rozdíly mezi párovými hodotami (veličia Z) ěkteré rozdíly budou kladé, jié záporé a v případě shody párových hodot budou rozdíly ulové). Nulové rozdíly z dalšího hodoceí vyřazujeme (ejde o to, zjistit, co je v souborech stejé, ale aopak to, co je rozdílé). Neulové rozdíly uspořádáme vzestupě bez ohledu a zaméko: 84

85 Např.: +z 3 < +z 1 < -z 5 < -z 4 < +z 6 <... Každému rozdílu přiřadíme pořadí (stejým hodotám průměré pořadí): ( - počet párů s eulovým rozdílem) Testujeme hypotézu, že rozdíly jsou rozložey symetricky kolem 0, tz., že součet kladých a záporých rozdílů by měl být rove 0 (v případě, že platí shoda rozděleí obou veliči X a X ). Proto by se také eměl příliš lišit součet pořadí kladých a záporých rozdílů. Ozačíme: W + - součet pořadí odpovídajících kladým rozdílům W - - součet pořadí odpovídajících záporým rozdílům Přitom platí: * ( 1) W W (možo použít pro usaděí výpočtu) Jako testovací kritérium slouží meší z obou součtů W + a W -, můžeme tedy psát: W = mi (W +, W - ). Porováme vypočteé testovací kritérium W s tabelovaou kritickou hodotou pro příslušé a zvoleou hladiu výzamosti (viz Příloha: Tab. č. 9 Kritické hodoty pro Wilcoxoův test): Je-li W < W (, ) => zamítáme hypotézu o shodosti rozděleí veličiy X a X symetrického rozložeí + a - rozdílů párových hodot (tz. že pokusý zásah je účiý hodoty před a po pokusu se liší ve svém rozděleí). Je-li W > W (, ) => emůžeme zamítout hypotézu o shodosti rozděleí veličiy X a X, tj. symetrického rozložeí + a - rozdílů párových hodot (tz. že pokusý zásah je eúčiý hodoty před a po pokusu se eliší ve svém rozděleí). tj. Příklad 8.: Zhodoťte výsledky testu streptokokové ákazy po ošetřeí dvěma preparáty (A a B). Od = 8 pacietů byly odebráy vzorky stěrů a rozděley každý a poloviu. Prví polovia byla ošetřea atibiotikem A, druhá atibiotikem B. Poté byla provedea kultivace a Petriho miskách a zjišťováy rozdíly v počtu koloií v obou řadách A a B. Uspořádaé rozdíly: Zjistěte, zda se preparáty A a B liší ve své účiosti. Postup: 1) Přidělíme uspořádaým rozdílům pořadová čísla: 85

86 Uspořádaé rozdíly: Pořadí rozdílů: (u 1. až 3. rozdílu použito průměré pořadí: 6/3=.) ) Sečteme pořadová čísla pro kladé a záporé rozdíly: W - = W + = 8 * 9 / - = 34 3) Jako testovací kritérium vybereme meší z obou součtů: Test. kritérium: W = mi (, 34) = 4) Vyhledáme tabulkovou kritickou hodotu pro příslušé = 8 (počet eulových rozdílů) a zvoleou hladiu výzamosti = 0,05 (viz Příloha: Tab. č. 9 Kritické hodoty pro Wilcoxoův test): kritická hodota je 3,7. 5) Porováme vypočítaé testovací kritérium s tabulkovou kritickou hodotou: Protože W = < 3,7 zamítáme hypotézu o shodě rozděleí párových veliči. 6) Závěr: Přípravky A a B se statisticky výzamě liší ve své účiosti (p < 0,05) Zamékový test Používá se pro párové pokusy v případech, kdy studovaou veličiu emůžeme přesě měřit. V testu epoužíváme žádé aměřeé hodoty, stačí ám rozhodutí, zda pokusý zásah A zapůsobil více či méě ež pokusý zásah B. Pro svou jedoduchost se zamékový test používá zejméa k orietačímu hodoceí předběžých pokusů, apř. v mikrobiologii. Pricipielě jde o zjedodušeý Wilcoxoův test, kdy epoužíváme hodoty rozdílů, ale pouze jejich zaméka. Máme-li párových pokusých jedotek (apř. řady Petriho misek s rozdílě ošetřeými kulturami A, B) zjistíme rozdíly mezi párovými jedotkami (apř. vizuelě posoudíme hustotu árůstu kultur). Zjištěé rozdíly pak tvoří dvourozměrou veličiu (X, X ). Při porováí každého páru pokudých jedotek mohou astat tři případy: X > X - pokusý zásah A zapůsobil více ež B (ozačíme zamékem +) X < X - tz., že pokusý zásah A zapůsobil méě ež B (ozačíme zamékem -) X = X - pokusý zásah A zapůsobil stejě jako B (ulový rozdíl vyřadíme z hodoceí) V dalším postupu vycházíme z úvahy, že shodují-li se pokusé zásahy A a B ve svém působeí, pak by se měl rovat počet kladých a záporých zaméek (v ideálím případě aprosté shody obou pokusých zásahů by byly všechy rozdíly ulové). Ozačíme: m + - počet kladých rozdílů (zaméek) m - - počet záporých rozdílů (zaméek) 86

87 Při sčítáí zaméek ve velmi rozsáhlých souborech lze opět využít zjedodušeí postupu, protože platí vztah: * ( 1) m m, kde je počet eulových rozdílů. Jako testovací kritérium slouží meší z obou součtů m + a m -, můžeme tedy psát: Testovací kritérium: m = mi (m +,m - ) Vypočteé testovací kritérium m porováme s tabulkovou kritickou hodotou pro příslušé (počet eulových rozdílů) a zvoleou hladiu výzamosti (viz Příloha: Tabulka č. 10 Kritické hodoty pto zamékový test): Je-li m < m (, ) => zamíteme hypotézu o shodě vlivů pokusých zásahů A a B Je-li m > m (, ) => emůžeme zamítou hypotézu o shodě vlivů pokusých zásahů A a B Příklad 8. 3: Od = 15 pacietů byly odebráy vzorky moči. Na prví poloviu každého odběru byl apliková Furatoi (F) a a druhou Peicilí (P). Po 4 hod. kultivaci byl sledová počet bakterií v 1. a. poloviě každého odběru. Zjistěte, zda se Furatoi a Peicilí liší ve své účiosti. Postup: 1) Posoudíme rozdíly mezi párovými jedotkami: u 13 případů byl počet bakterií meší u F ež u P (tz. F < P) u 1 případu byl počet bakt. větší u F ež u P (tz. F > P) u 1 případu ebylo možo rozhodout (tz. F = P) ) Sečteme kladá a záporá zaméka: m + = 13 m - = 1 Opravíme rozsah souboru: eulové rozdíly = 14 3) Jako testovací kritérium slouží meší z obou součtů m + a m -, můžeme tedy psát: Test. kritérium: m = mi(13, 1) = 1 4) Kritická hodota pro = 0,05 a = 14 párů je (viz Příloha: Tabulka č. 10 Kritické hodoty pto zamékový test). 5) Vypočteé testovací kritérium m porováme s tabulkovou kritickou hodotou pro příslušé (počet eulových rozdílů) a zvoleou hladiu výzamosti : Protože m < zamítáme hypotézu shodého působeí obou pokusých zásahů. 6) Závěr: Byl prokázá statisticky výzamý rozdíl (p < 0,05) v účiosti Furatoiu a Peicilíu a růst bakterií ve vzorcích moči pacietů. 87

88 Kapitola 9 Hodoceí závislosti kvatitativích zaků Sledováím vztahů mezi a více áhodými proměými (statistickými zaky) u jedoho souboru se zabývá vícerozměrá statistika (v případě závislosti veliči je to dvojrozměrá statistika). Říkáme, že dvě veličiy jsou závislé, pokud spolu jejich hodoty avzájem určitým systematickým způsobem korespodují (odpovídají si). Např. je evidetí, že lidé s velkou tělesou výškou mají obvykle také vyšší tělesou hmotost ež lidé s ižším vzrůstem; proto můžeme říci, že výška a váha (tělesá hmotost) u lidí jsou dvě závislé áhodé veličiy. Závislosti dvou áhodých veliči ve statistice řeší dvojrozměrá statistika, jejímž úkolem je popsat vhodým způsobem vzájemý vztah obou veliči a kvatifikovat ho pomocí určitých parametrů (koeficietů). Vztahy mezi áhodými veličiami, které obvykle sledujeme v oblasti biologických a medicíských věd, emají ryze fukčě determiistický charakter. Proto je uté použít pro jejich aalýzu statistické metody. V ašem výkladu budeme klást důraz a vztahy mezi proměými, kterými se zabývá dvojrozměrá statistika. Příslušá oblast statistiky hodotící závislosti kvatitativích statistických zaků (spojitých veliči) se azývá korelačí a regresí aalýza. Korelačí aalýza zkoumá vztahy proměých pomocí růzých měr závislosti, které azýváme korelačí koeficiety. Pomocí korelačích koeficietů je kvatitativě vyjádřea těsost (síla) vzájemé závislosti obou sledovaých proměých. Regresí aalýza studuje jaký vztah existuje mezi proměými (lieárí, kvadratický, logaritmický apod.) a jak se měí závislá proměá Y v závislosti a změách ji podmiňující (ezávislé) proměé X. Jde tu tedy o jedostraou závislost, a rozdíl od korelačí aalýzy, která studuje dvoustraý recipročí vztah obou áhodých proměých Fukčí a statistická závislost Vztahy mezi proměými můžeme obecě rozdělit do dvou základích skupi: 1) Fukčí závislost, která je typická pro vztahy mezi proměými v exaktích vědách, jako je apř. matematika ebo fyzika. Jde o takovou závislost, kdy každé číselé hodotě jedé proměé x i odpovídá přesě jeda hodota druhé proměé y i. Veličiu X považujeme za tzv. ezávislou proměou a veličiu Y pak za tzv. závislou proměou. Tuto fukčí závislost mezi veličiami lze přesě popsat určitou rovicí (vzorcem). Fukčí závislost dvou veliči je výrazem pevého příčiého vztahu, který eí ovlivě žádými áhodými čiiteli, tz. že hodoty závislé veličiy Y jsou determiováy a měí se pouze v závislosti a změách hodot ji podmiňující ezávislé veličiy X. Příkladem fukčí závislosti mezi proměými může být apř. vztah mezi poloměrem kruhu (r ezávislá veličia) a obvodem kruhu (závislá veličia). Teto vztah můžeme vyjádřit pomocí zámé rovice y = r. U závislostí je vždy vhodé provést i grafickou iterpretaci. Vyeseím dat obou proměých do souřadicového systému (apř. a milimetrový papír ebo 88

89 zobrazeím a displeji počítače pomocí vhodého softwaru) získáme tzv. XY graf daé závislosti. Pro výše uvedeý příklad fukčí závislosti mezi poloměrem kruhu a jeho obvodem (lieárí závislost) bychom dostali graf přímky (Obr. č. 9. 1). Obr Graf lieárí závislosti y = πr. Dalším příkladem fukčí závislosti mezi proměými mohou být růzé typy závislostí elieárích, kam patří apř. závislost: - kvadratická, popsaá rovicí: y ax bx c Grafickým vyjádřeím kvadratické závislosti mezi proměými X a Y jsou růzé typy parabol ( parabolická závislost ). b - hyperbolická, popsaá rovicí: y c x Jde o závislost epřímou, jejímž grafickým vyjádřeím jsou růzé typy hyperbol (vždy klesající fukce). - logaritmická, popsaá rovicí: y = log x - expoeciálí, popsaá rovicí: y = a x Druhou skupiu závislostí mezi dvěma proměými tvoří: ) Statistická (korelačí) závislost, která je typická pro vztahy mezi proměými (statistickými zaky) sledovaými v biologii, lékařství a dalších málo exaktích vědách. Tady fukčí závislost mezi veličiami prakticky eexistuje, většia přírodích jevů má charakter velmi promělivý a estálý, jde tu většiou o spojeí celého komplexu růzých příči a účiků včetě působeí áhodých vlivů, které ejsme schopi při sledováí vyloučit. Z toho vyplývá i charakter závislostí mezi áhodými veličiami v biologických a lékařských vědách. Tato závislost má 89

90 relativí charakter a používáme pro i pojem statistická ebo také stochastická či korelačí závislost. Korelačí závislost představuje více méě volou závislost, kdy vztah mezi proměými (přírodími jevy) je takový, že existece (změa) jedé proměé či proměých vyvolává existeci (změu) jié proměé či proměých je s určitou pravděpodobostí ( zaky spolu korelují ). Jedié číselé hodotě x i jedé veličiy (ezávislé proměé) může v případě korelačí závislosti odpovídat celá řada áhodých hodot druhé veličiy y i (závislá proměá). Grafickým vyjádřeím korelačího vztahu je tzv. bodový diagram ebo také dvojrozměrý bodový graf, který získáme vyeseím dat obou áhodých veliči do souřadicového sytému XY. Získáme tím základí představu o společém rozděleí obou proměých. Každý bod odpovídá jedomu páru měřeí, tzv. korelačí dvojici (x i, y i ). Příklad bodového diagramu můžeme vidět a obrázku 9., který zázorňuje grafické vyjádřeí korelačího vztahu mezi tělesou výškou a tělesou hmotostí u lidí (jedici s větší výškou mají obvykle i větší váhu a aopak). Obr. 9. Bodový diagram pro korelačí závislost (tělesá výška a hmotost) y i (tělesá hmotost) x i (výška) Podle charakteru rozložeí bodů v bodovém diagramu můžeme odhadovat, zda je mezi proměými silá či spíše volější závislost, aebo jestli jsou a sobě obě sledovaé veličiy evidetě ezávislé. Jsou-li body v bodovém diagramu seskupey podél ěkterého směru (říkáme, že tvoří tzv. korelačí pás ), svědčí to o přítomosti určitého vztahu mezi sledovaými proměými. Korelačí závislost přitom může být buď přímá ( pozitiví korelace obr. 9. 3) ebo epřímá ( egativí korelace obr. 9. 4). 90

91 Obr. 9.3 Přímá korelace Obr. 9.4 Nepřímá korelace y y x x Jsou-li body v bodovém diagramu rozložey víceméě rovoměrě po celé ploše, je to důkazem toho, že závislost mezi oběma sledovaými proměými je velmi slabá, případě vůbec eexistuje. Říkáme, že veličiy spolu ekorelují, případě, že mají ulovou korelaci (Obr. 9. 5). Obr. 9.5 Nulová korelace y x Máme-li co ejvýstižěji charakterizovat a popsat korelačí vztah mezi dvěma áhodými veličiami v biostatistice, tak se sažíme zjistit, jestli se jejich statistická závislost blíží k ěkteré fukčí závislosti a pokusíme se ji určitou abstrakcí převést a fukčí (provádíme odhad ejbližší fukčí závislost tzv. aproximaci). Tuto ejbližší fukčí závislost pak vyjádříme rovicí. Zjišťováím ejvýstižější fukčí závislosti, která by byla vhodá pro popis daého korelačího vztahu se zabývá regresí aalýza, o které budeme pojedávat íže. Úkolem je výpočet tzv. regresích koeficietů pro rovici ejvýstižější fukce, která se použije pro popis sledovaé korelačí závislosti. Podle charakteru rozložeí bodů v bodovém diagramu můžeme rozlišit dva typy základích korelačích závislostí mezi dvěma áhodými proměými: lieárí ebo elieárí závislost (Obr. 9. 6). Tyto dva typy korelačí závislosti se liší ve svém způsobu a použité metodice statistického hodoceí. 91

92 Obr Lieárí (a) a elieárí (b) korelačí závislost 9. Lieárí korelačí závislost Lieárí regresí fukce představuje jedu z ejčastěji používaých fukcí, kterou používáme pro popis a hodoceí korelačích vztahů mezi dvěma áhodými veličiami v oblasti biostatistiky. Postup hodoceí lieárí korelačí závislosti obvykle sestává z ěkolika ásledujících kroků: 1) Kostrukce tzv. empirické křivky, která popisuje sledovaý korelačí vztah a úrovi výběrového souboru, a kterém bylo provedeo měřeí obou veliči. Tato křivka slouží jako odhad skutečé závislosti (lieárí regresí fukce), která je předpokládáa pro celý základí soubor. Data pro sestrojeí empirické křivky získáme tak, že pro stejou hodotu ezávislé proměé x i zjistíme měřeím ěkolik áhodých hodot závislé proměé y i (získáme korelačí dvojice ). Jako příklad můžeme uvést měřeí tělesé výšky a váhy u áhodého výběru osob, kdy měřeím každého jedice získáme dvě hodoty (výšku a váhu), tedy korelačích dvojic (x i, y i ). Pak vypočteme aritmetické průměry z hodot y i odpovídajících téže hodotě x i a tyto průměry propojíme křivkou, kterou azýváme empirická. (Obr. 9.7). Obr Empirická křivka pro korelačí vztah 9

93 ) Sestrojeí teoretické přímky, tj. přímky, proložeé bodovým diagramem tak, že se co ejvíce blíží všem bodům představuje tedy ejbližší regresí fukci. Tato lieárí regresí fukce je pak používáa pro popis skutečé závislosti sledovaých veliči a úrovi celého základího souboru. Pro určeí ejvhodější lieárí regresí fukce je uto vypočítat odhady regresích koeficietů k a q daé rovice pro teoretickou přímku: y kx q Koeficiety k a q určují svojí hodotou vlastosti daé přímky (sklo a posu): k (směrice přímky, sklo) = tg α (úhel, který svírá přímka s osou x) q (posu přímky) určuje průsečík přímky s osou y Vždy je uto mít a paměti, že regresí koeficiety k a q vypočteé z dat výběrového souboru jsou pouze odhadem přesých koeficietů teoretické regresí fukce, která jedozačě popisuje skutečou závislost sledovaých veliči a úrovi celé populace. Obrázky 9. 8 a 9. 9 zázorňují vlastosti přímky, které jsou určey koefickiety k a q v rovici lieárí regresí fukce. Obr Regresí koeficiet k určuje sklo přímky x +k -k y Pokud má koeficiet k kladou hodotu, jedá se o přímou lieárí závislost mezi proměými X a Y - přímka bude v tomto případě stoupající. Pokud bude hodota koeficietu k záporá, jedá se o epřímou lieárí závislost mezi proměými X a Y - přímka bude v tomto případě klesající. Obr Regresí koeficiet q určuje průsečík přímky s osou y x -q +q y V případě kladé hodoty koeficietu q protíá přímka osu y ad počátkem souřadicových os, v případě záporé hodoty koeficietu q protíá přímka osu y pod počátkem souřadicových os. 93

94 9.. 1 Regresí aalýza Regresí aalýza představuje statistickou metodu, která je používáa pro výpočet odhadů koeficietů lieárí regresí fukce: y kx q. Vycházíme z datového materiálu v podobě uspořádaých dvojic číselých údajů pro proměé X a Y - korelačích dvojic (x i, y i ), aměřeých u výběrového souboru o rozsahu čleů. Regresí koeficiety lieárí regresí fukce odhadujeme metodou ejmeších čtverců. Název je odvoze z postupu, který miimalizuje sečteé čtverce vertikálích vzdáleostí datových bodů v bodovém diagramu od proložeé teoretické přímky. Regresí koeficiet k pro lieárí regresí fukci vypočteme vztahem: k x y x y i i i i x x i i Regresí koeficiet q pro lieárí regresí fukci vypočteme vztahem: q y k i x i x i, y i korelačí dvojice počet korelačích dvojic Po výpočtu regresích koeficietů lieárí fukce, je uto určit souřadice dvou bodů, aby bylo možo sestrojit teoretickou regresí přímku. Zvolíme libovolou hodotu x 1 a vypočteme pomocí zámé regresí rovice odpovídající hodotu závislé proměé: y 1 = k. x 1 + q. Podobě zvolíme libovolou jiou hodotu x a vypočteme pomocí rovice odpovídající hodotu y = k. x + q. Obr Sestrojeí teoretické regresí přímky y i y y 1 x 1 x x i 9.. Korelačí aalýza Korelačí aalýza představuje statistickou metodu, která je používáa pro zjištěí těsosti závislosti (síly vztahu) dvou áhodých spojitých proměých. V ejobecějším smyslu, slovo korelace ozačuje míru stupě asociace dvou veliči. Říkáme, že dvě veličiy jsou korelovaé 94

95 (asociovaé), jestliže určité hodoty jedé veličiy mají tedeci se vyskytovat společě s určitými hodotami druhé veličiy. Jde tu tedy o dvoustraý recipročí vztah dvou áhodých proměých X a Y, kdy emá smysl uvažovat, že jeda z proměých je závislá a druhá ezávislá; obě jsou závislé vzájemě. Je to apř. vzájemý vztah mezi délkou předích a zadích kočeti, vztah mezi délkou křídla a délkou ocasu u ptáků ebo vztah mezi hladiou glukózy a kortikosterou v krevím séru. Míra asociace dvou áhodých proměých může sahat od eexistece korelace (všechy hodoty proměé Y se vyskytují stejě pravděpodobě s každou hodotou proměé X) až po absolutí korelaci (s daou hodotou proměé X, se vyskytuje právě jeda hodota proměé Y). Pro kvatitativí vyjádřeí těsosti vztahu dvou korelovaých veliči byla avržea řada koeficietů, které se liší podle typů proměých, pro které se používají. Pro korelaci mezi dvěma spojitými áhodými proměými X a Y je ejdůležitější a ejčastěji používaou mírou síly vztahu Pearsoův korelačí koeficiet r. Počítáme jej z párových hodot - korelačích dvojic (x i, y i ) aměřeých a jedicích áhodě vybraých z populace. Protože při výpočtu využíváme odchylek jedotlivých hodot x i, y i od průměrů obou veliči x, y, je ěkdy pro teto koeficiet používá termí parametrický korelačí koeficiet. Podmíkou použití Pearsoova korelačího koeficietu je přitom ormálí rozděleí obou áhodých proměých X a Y (tzv. dvouormálí rozděleí). Korelačí koeficiet r pro lieárí korelačí závislost vypočteme vztahem: r x i x. yi y x x y y i i Korelačí koeficiet r abývá hodot v itervalu -1 ; +1. Čím větší je absolutí hodota r, tím těsější je korelace mezi oběma proměými. Kladá hodota korelačího koeficietu vyjadřuje positiví korelaci mezi veličiami, záporá hodota korelačího koeficietu vyjadřuje egativí korelaci obou veliči. Pokud je hodota korelačího koeficietu rova ule, korelačí závislost mezi veličiami eexistuje. Korelačí koeficiet r = +1 vyjadřuje úplou (lieárí) přímou závislost veliči (stoupající přímka), korelačí koeficiet r = -1 ozačuje úplou (lieárí) epřímou závislost veliči (klesající přímka). Obr Bodové diagramy pro korelaci s růzou hodotou r y y y x x x Neexistující korelace Přímá (pozitiví) korelace Nepřímá (egativí) korelace r = 0 r > 0 r < 0 95

96 9.. 3 Testováí výzamosti korelačího koeficietu Je třeba si uvědomit, že korelačí koeficiet r, který počítáme z dat korelačích dvojic aměřeých u výběrového souboru představuje pouze odhad skutečého korelačího koeficietu ozačovaého jako, který předpokládáme v celé populaci. Pokud tedy chceme přesě vědět, zda korelačí vztah v populaci opravdu existuje, je uto výběrový korelačí koeficiet r, jako každý výběrový parametr, testovat. Za předpokladu, že áhodý výběr, ze kterého je korelačí koeficiet počítá, má dvouormálí rozděleí, lze výzamost korelačího koeficietu r testovat pomocí t-testu, kdy testujeme hypotézu ezávislosti (H 0 : = 0). Testovací statistiku pro t-test vypočteme podle vztahu: t r s r kde r = výběrový korelačí koeficiet s r = středí chyba korelačího koeficietu, vypočteá podle vztahu: s r 1 r Vypočteé testovací kritérium t porováme s tabulovaou kritickou hodotou t (viz Příloha: Tab. č. 3 Kvatily t 1-α/ () Studetova t-rozděleí ) pro zvoleou hladiu výzamosti a daé stupě volosti v = - : Je-li t > t 1-/() => zamítáme hypotézu ezávislosti sledovaých veliči (korelačí koeficiet r je výzamý a hladiě ) Je-li t < t 1-/() => emůžeme zamítout hypotézu ezávislosti sledovaých veliči (korelačí koeficiet r je evýzamý a hladiě ) Nelieárí korelačí závislost Výpočet elieárích regresích rovic bez využití výpočetí techiky (statistický software s abídkou tzv. polyomiálích regresí) je začě amáhavý, proto se v praxi většiou převádí elieárí závislost a lieárí pomocí vhodé trasformace původích hodot (apř. logaritmováím, vhodou substitucí ap). Jiou, poměrě často používaou možostí řešeí elieárích závislostí mezi áhodými proměými v biostatistice je použití výpočtu Spearmaova korelačího koeficietu Spearmaův koeficiet pořadové korelace Jedá se o eparametrickou metodu, která využívá při výpočtu pořadí hodot sledovaých veliči, a kterou lze použít pro popis jakékoliv závislosti (lieárí i elieárí). Spearmaův korelačí koeficiet, jehož teoretickou hodotu začíme Sp, používáme pro měřeí síly vztahu 96

97 veliči X a Y, když emůžeme předpokládat liearitu očekávaého vztahu ebo ormálí rozděleí proměých X a Y. Závislost proměých může mít obecě vzestupý ebo sestupý charakter. Jestliže je r Sp = 1, resp. r Sp = -1, párové hodoty (x i, y i ) leží a ějaké vzestupé, resp. klesající fukci. Pro malé rozsahy je výpočet Spearmaova korelačího koeficietu méě pracý ež výpočet Pearsoova parametrického korelačího koeficietu. Proto je možo ho použít i k hodoceí lieárích závislostí; jeho použití je tu však spíše orietačí (využívá méě iformací z dat) a a rozdíl od parametrického koeficietu je méě účiý. Výpočet Spearmaova korelačího koeficietu vychází z pořadových čísel proměých x i a y i (korelačích dvojic) aměřeých u jediců výběrového souboru. Jsou-li hodoty proměých x i a y i seřazey vzestupě do dvou řad a každé hodotě je přiděleo pořadí, pak koeficiet pořadové korelace je dá vztahem: kde r Sp. D i = rozdíl mezi pořadím hodot x i a y i příslušých korelačích dvojic = počet korelačíchdvojic 1 i 6 D.( 1) Vypočteý koeficiet porováme s tabelovaými kritickými hodotami Spearmaova korelačího koeficietu pro zvoleé a daé (viz Příloha Tabulka č. 1 Kritické hodoty Spearmaova korelačího koeficietu r Sp : Je-li r Sp > r Sp(α, ) => koeficiet pořadové korelace je výzamý a hladiě (korelace sledovaých veliči v populaci existuje) Je-li r Sp < r Sp(α, ) => koeficiet pořadové korelace je evýzamý a hladiě (korelace sledovaých veliči v populaci eexistuje) Příklad 9. 1: U 10 pacietů byl sledová vztah mezi ph moči (x i ) a hladiou K + iotů (mmol.l -1 ) v krevím séru (y i ). Existuje závislost těchto ukazatelů? Zjištěé údaje jsou shruty do ásledující tabulky: Paciet č ph moči 5,9 7,00 6,90 6,05 6,80 6,10 6,00 6,50 7,0 6,1 K + ioty 4,0 4,8 4,9 4, 4,8 4,9 4,0 4,3 4,5 4,7 Postup: 1. Seřadíme vzestupě hodoty x i a y i do dvou variačích řad tím zjistíme pořadí jedotlivých hodot x i a y i. Vyskytou-li se stejé hodoty ve variačí řadě, přidělíme každé z ich tzv. průměré pořadí - apř. seřazeá variačí řada hodot pro hladiu K + iotů má prví dvě hodoty stejé (4,0 mmol.l -1 ), tz., že obě hodoty dostaou pořadové číslo 1,5., které bylo vypočteo jako průměr z pořadí Sestavíme tabulku podle pořadí hodot x i a y i pro každou korelačí dvojici : 97

98 Paciet č ph moči K + ioty 1,5. 7,5. 9, ,5. 9,5. 1, Sestavíme tabulku vypočteých rozdílů pořadí D i proměé x i a proměé y i a rozdíly umocíme a druhou: Rozdíl pořadí D i +0,5-1,5 +1,5 0 +0,5 +5,5-0,5 -,0-5,0 +1,0 D i 0,5,5,5 0 0,5 30,5 0,5 4,00 5,0 1,0 4. Vypočteme součet moci rozdílů pořadí: D 65, 50 i 5. Vypočteme Spearmaův korelačí koeficiet r Sp : r 6*65, *(100 1) Sp. 0, Vypočteý koeficiet porováme s tabulkou výzamosti koeficietů pořadové korelace pro =10 a zvoleou chybu (Příloha: Tab. č. 11 Kritické hodoty Spearmaova korelačího koeficietu r Sp ): Kritická hodota r Sp(0,05,10) = 0,564 0,603 > r Sp(0,05,10) korelačí koeficiet je statisticky výzamý Závěr: Protože koeficiet pořadové korelace je statisticky výzamý, zameá to, že byla prokázáa vzájemá korelace mezi ph moči a hladiou K + iotů v krevím séru u sledovaých pacietů (p < 0,05). 98

99 Kapitola 10 Kvalitativí zaky (Kategoriálí data) Pojem pravděpodobost Aby bylo možo předvídat výskyt áhodé veličiy a tím řešit úlohy v praxi, je třeba vyjádřit jistotu (stupeň jistoty), s íž lze předpokládat, že se daá áhodá veličia vyskyte. Tato jistota, s íž lze předpokládat, že se daá áhodá veličia vyskyte se ozačuje pojmem pravděpodobost áhodé veličiy. Pravděpodobost áhodé veličiy se vyjadřuje číslem, které abývá všech hodot v itervalu od 0 do +1, kde 0 vyjadřuje výskyt áhodé veličiy emožý, a 1 vyjadřuje výskyt áhodé veličiy jistý. Pravděpodobost áhodé veličiy lze určit dvojím způsobem - klasickým ebo statistickým. 1) Klasická defiice pravděpodobosti - může-li jede proces (áhodá veličia) vykázat "" výsledků (hodot), které jsou stejě možé, a jestliže "m" z těchto výsledků (hodot) jsou výsledkem (hodotou) "A" pak pravděpodobost výsledku (hodoty) "A" je P(A) = m/. Této klasické defiice pravděpodobosti lze užít je pro případ, že všechy výsledky (hodoty) daého procesu (áhodé veličiy) jsou stejě možé. Například při arozeí dítěte je možý "" = počet výsledků, které jsou stejě pravděpodobé. "m" = 1 počet z těchto výsledků je výsledkem "A", tj. výsledkem kdy se arodí chlapec. Pak pravděpodobost arozeí chlapce je ½ = 0,5. Například při hodu kostkou je možý "" = 6 počet výsledků, které jsou stejě pravděpodobé. "m" = 1 počet z těchto výsledků je výsledkem "A", tj. výsledkem kdy pade číslo 4. Pak pravděpodobost padutí čísla 4 při hodu kostkou je 1/6 = 0,166. Nelze však již určit pravděpodobost padutí čísla 4 při hodu kostkou, je-li jeda straa kostky zatížea. Pak výsledky při hodu kostkou ejsou stejě možé a elze proto tímto způsobem určit pravděpodobost padutí čísla 4, protože při zatížeí stray je výsledek číslo 4 více možý ež ostatí a elze určit akolik. ) Statistická defiice pravděpodobosti - opakujeme-li ""-krát ezávisle daý proces a astae-li při tomto opakováí výsledek (hodota) "A" "m"-krát, pak při dostatečě velkém počtu ezávislých opakováí daého procesu, je pravděpodobost výsledku (hodoty) "A" rova P(A)=lim m/. Této klasické defiice pravděpodobosti lze užít i pro případ, že všechy výsledky (hodoty) daého procesu (áhodé veličiy) ejsou stejě možé. Například při arozeí dětí bylo 5 04 výsledkem "A", tj. výsledkem kdy se arodí chlapec. Pak pravděpodobost arozeí chlapce je 504/ = 0,

100 Například při hodech kostkou bylo 175 výsledkem "A", tj. výsledkem kdy padlo číslo 4. Pak pravděpodobost padutí čísla 4 při hodu kostkou je 175/1000 = 0,175. Lze však určit i pravděpodobost padutí čísla 4 při hodu kostkou, je-li jeda straa kostky zatížea. Při hodech kostkou při zatížeí stray s číslem byl výsledek číslo 4 více možý ež ostatí a číslo 4 padlo 41 krát. Pak pravděpodobost padutí čísla 4 při hodu kostkou je 41/1000 = 0,41. Statistická a klasická defiice pravděpodobosti ejsou v rozporu. Určíme-li P(A) klasickým způsobem (je-li to možé), pak při určováí P(A) statistickým způsobem dojdeme téměř jistě k témuž číslu ebo k číslu velmi blízkému. Rozdíl mezi oběma způsoby určováí (výpočtu) pravděpodobosti spočívá v tom, že při klasickém určováí pravděpodobosti se vychází z vlastostí zkoumaého jevu (tz. z podílu počtu výsledků možých "" a počtu výsledků přízivých pro jev "A" "m", tz. klasickou pravděpodobost lze určit před začástkem procesu. Při statistickém určováí pravděpodobosti se vychází z výsledků skutečě proběhlých procesů, tz. z počtu opakováí procesů "" a počtu astáí daého jevu "A" v těchto opakováích "m", tz. statistickou pravděpodobost lze určit až a základě skutečě proběhlých procesů. Zjištěé hodoty pro klasickou i statistickou pravděpodobost musí být shodé (jedá se o jedu a tutéž pravděpodobost). Nejsou-li shodé, pak je rozdíl způsobe chybou : a) buď při určováí klasické pravděpodobosti, kdy apříklad výsledky považovaé za stejě možé, stejě možé ejsou, b) ebo při určováí statistické pravděpodobosti byl počet opakováí procesů "" malý (tj. "" se eblížilo k ekoeču, popřípadě jié hodotě koečé pro daý jev) a výsledek byl zkresle áhodou chybou. Takto lze také vysvětlit rozdíl mezi klasickou pravděpodobostí arozeí chlapce (0,5) a statistickou pravděpodobostí (0,504). Buď eí stejá pravděpodobost pro arozeí chlapce a děvčete, ebo je počet ""= pro určeí statistické pravděpodobosti arozeí chlapce malý a zvýšeím apříklad a ""= by se tato pravděpodobost přiblížila k hodotě 0, Kategoriálí data Jak jsme již pozali v prví kapitole, pojmem kategoriálí data ozačujeme tzv. omiálí statistické zaky (kvalitativí zaky), u ichž emůžeme zjistit měřitelé hodoty, ale určujeme pouze rovost či růzost ( jediec daou kvalitu splňuje ebo e ). Kvalitativím zakem v biostatistice může být apříklad barva očí, typ srsti, výskyt oemocěí, provedeí vakciace, přítomost aatomické aomálie aj. Kvalitativí statistické zaky mohou abývat růzých možostí svého projevu tyto možosti projevu azýváme kategorie (kvalitativí třídy). Kategorie omiálích zaků reprezetují jedotlivé variaty kvalitativího zaku. Některé kvalitativí zaky mohou abývat buď je dvou možostí svého projevu (variat) tyto zaky azýváme alterativí omiálí zaky (apř. stav orgaismu: zdravý emocý, pohlaví: samčí samičí, provedeí vakciace: vakciová evakciová apod.). Jié kvalitativí zaky mohou abývat více možostí svého projevu (variat) tyto zaky azýváme možé omiálí zaky (apř.: barva očí: modrá hědá šedá zeleá, typ strti: krátkostrstý dlouhosrstý hrubostrstý apod.). 100

101 Při sledováí výskytu kvalitativího zaku (áhodého přírodího jevu) u daého jedice ve statistickém souboru je pro každou kategorii sledovaého zaku možo iterpretovat pouze stavy: Náhodý jev astae (s pravděpodobostí p) Náhodý jev eastae (s pravděpodobostí q) Platí přitom, že p + q = 1 (tyto pravděpodobosti vyplňují celý pravděpodobostí prostor tz., že emůže astat jiá možost ež tyto dva stavy). Pro tyto dva stavy je často používáo symbolické vyjádřeí pomocí hodot apř.: 0-1, ao-e, A-N, pravda-epravda, apod. Pro kvalitativí zaky je charakteristické biomické rozděleí četostí, které je odvozeo z výpočtu pravděpodobosti výskytu sledovaého zaku u výběrového souboru při daém počtu jediců v souboru (). Nejčastěji se s tímto rozděleím setkáváme apř. při statistických výpočtech spojeých se staoveím četosti oemocěí v růzě velkých skupiách jediců. Pokud provádíme sledováí ějakého áhodého jevu (kvalitativího zaku) u výběrového souboru o určité velikosti ( čleů), je možo zjistit, s jakou pravděpodobostí (P) astae sledovaý áhodý jev u určitého počtu (k) jediců v tomto výběrovém souboru. Např.: Pokud budeme sledovat u výběrového souboru o rozsahu = 10 čleů výskyt určitého oemocěí, které se vyskytuje v populaci s pravděpodobostí p = 0,1, bude ás zajímat otázka, jaká je pravděpodobost P, že v tomto výběrovém souboru oemocí určitý počet k jediců z celkového počtu? Tyto pravděpodobosti lze přesě vypočítat pro jedotlivé hodoty k podle ásledujícího vztahu: kde výraz P ( k) k. p k. q k ad k = biomický koeficiet. k Hodotu biomického koeficietu lze pro růzé dvojice a k alézt ve statistických tabulkách ebo ho lze vypočítat podle ásledujícího vztahu: k Přitom platí: 1 0! k!.( k)! Pro výše uvedeá data ( = 10, p = 0,1) dostaeme výpočtem ásledující pravděpodobosti P(k) pro růzé hodoty k = 0, 1,, 10: 101

102 k (počet emocých) P(k) p 0. q 10 = ,347 = 0, p 1. q 9 = 10. 0,1. 0,387 = 0, p. q 8 = 45. 0,01. 0,4305 = 0, , , , p 9. q 1 = 10. 0, ,9 = 0, p 10. q 0 = 1. 0, = 0, Vypočteé pravděpodobosti P(k) je možo prezetovat grafickým vyjádřeím, které představuje biomické rozděleí (viz obr ). Jeho tvar je vždy specifický pro kokrétí výběrový soubor, a kterém bylo provedeo sledováí a závisí a počtu čleů tohoto výběrového souboru () a pravděpodobosti (p) výskytu sledovaého áhodého jevu v celé populaci, z které byl vybrá výběrový soubor. Obr. č Příklad grafického vyjádřeí biomického rozděleí Při malém počtu čleů výběrového souboru () je při daé pravděpodobosti p pro výskyt sledovaého áhodého jevu v populaci tvar biomického rozděleí asymetrický a výsledé pravděpodobosti P(k) pro jedotlivé variaty k (počet jediců odpovídající sledovaému jevu) v tomto výběru jsou relativě vysoké (jejich součet je vždy rove 1). 10

103 Naopak při zvětšováí počtu čleů výběrového souboru a stejé pravděpodobosti p pro výskyt sledovaého áhodého jevu v populaci, abývá biomické rozděleí větší symetrie ( ormalizace dat ) a výsledé pravděpodobosti P(k) pro jedotlivé variaty k ve výběrovém souboru jsou relativě ízké (celkový součet 1 je zde získá součtem moha dílčích pravděpodobostí P(k), z ichž každá má relativě ízkou hodotu). Příklady dvou růzých tvarů biomického rozděleí pro růzě velké výběrové soubory ( = 4 a = 0) a stejou pravděpodobost výskytu sledovaého áhodého jevu v populaci p = 0,7 jsou uvedey a obrázku 10.. Při srováí obou biomických rozděleí a obrázku a) a b) je možo vysledovat zákoitosti chováí biomického rozděleí popsaé v předchozím odstavci: při zvětšujícím se rozsahu výběrového souboru dochází k tzv. ormalizaci dat, kdy se biomické rozděleí svým tvarem přibližuje Gausovu ormálímu rozděleí. Toho je možo využívat i při výpočtech v oblasti statistiky kvalitativích zaků, kdy lze v ěkterých případech (při vysokých počtech ) aproximovat biomické rozděleí ormálím rozděleím. Obr. č. 10. Srováí biomického rozděleí pro růzě velké výběry (a, b) P(k) P(k) k k a) = 4 b) = 0 p = 0,7 p = 0, Aalýza kategoriálích dat Při výpočtech spojeých se sledováím kvalitativích statistických zaků vycházíme z pravděpodobosti výskytu daého zaku v populaci a z četostí jediců odpovídajících jedotlivým kategoriím (kvalitativím třídám) sledovaého omiálího zaku ve výběrových souborech. Získaá kategoriálí data zachycujeme pomocí jedo-, dvou- ebo vícerozměrých 103

104 tabulek četostí (případě relativích četostí, procet). Každý rozměr (dimeze) tabulky odpovídá klasifikaci do kategorií podle určitého kvalitativího zaku. Při zkoumáí četostí kategoriálích dat stojíme před podobými úkoly jako v případě dat metrických. Můžeme porovávat četosti výskytu sledovaého kvalitativího zaku ve výběrovém souboru, se statistickou pravděpodobostí výskytu tohoto zaku, která je teoreticky zámá pro celou populaci. Můžeme také porovávat četosti výskytu sledovaého zaku mezi dvěma, případě i více výběrovými soubory ebo zjišťovat sílu závislosti jedotlivých kvalitativích zaků mezi sebou. Základím statistickým postupem, který je ejčastěji využívá při aalýze kategoriálích dat je -test (Chí kvadrát test) pro testováí rozdílů četostí (jak mezi soubory, tak i pro zjišťováí závislosti kvalitativích zaků). Při výpočtech spojeých s aalýzou kategoriálích dat pomocí -testu pracujeme s ásledujícím ozačeím četostí: e - empirická (pozorovaá) četost výskytu zaku (platí pro výběrový soubor) o - očekávaá (teoretická) četost výskytu zaku (platí pro populaci) Poměr empirické četosti výskytu zaku ve výběrovém souboru k celkovému počtu jediců ve výběru představuje relativí četost zaku (empirickou pravděpodobost výskytu daého zaku - p e ): e pe Při ekoečém zvětšováí rozsahu výběrového souboru dostaeme v limitě tzv. statistickou (teoretickou) pravděpodobost výskytu zaku - p o (očekávaou pravděpodobost, předpokládaou pro celý základí soubor). Pro ekoečě velký počet jediců v populaci (N = ) elze statistickou pravděpodobost prakticky vypočítat, můžeme ji pouze odhadovat a základě empirické pravděpodobosti. Čím větší je počet jediců ve výběrovém souboru, a kterém provádíme sledováí, tím více se hodota empirické pravděpodobosti (p e ) blíží k skutečé hodotě teoretické pravděpodobosti (p o ): p o o N Testováí rozdílů četostí se (obecě) provádí -testem. Rozdíl mezi empirickými (pozorovaými) a teoretickými (očekávaými) četostmi zachycuje testovací statistika, která má tvar: kde m i1 ei oi oi m = počet kvalitativích tříd (kategorií) představujících variaty kvalitativího zaku ei = empirická četost (data z výběrového souboru) oi = očekávaá četost (teoretická, zámá pro základí soubor) 104

105 Protože platí, že e = p e. a o = p o., lze použít (v ěkterých situacích je pro výpočty výhodější) i výraz : m i1 ei oi Je-li vypočteá statistika = 0, zameá to, že pozorovaé a teoretické četosti jsou přesě stejé. Čím větší je hodota, tím větší je esouhlas mezi empirickou ( e ) a teoretickou ( o ) četostí v jedotlivých třídách. Pro posouzeí statistické výzamosti rozdílu srovávaých četostí porováme vypočteý s tabulkovou kritickou hodotou 1- (). Jako kritické hodoty pro test slouží 1- kvatily - rozděleí při = m-1 stupích volosti (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ). Pokud vypočteá statistika (testovací kritérium) přesáhe tabulkovou kritickou hodotu 1- (), prohlásíme, že pozorovaé četosti ei esouhlasí statisticky výzamě s teoreticky očekávaými četostmi oi a hladiě výzamosti Test rozdílu empirické a teoretické četosti Tímto testem porováváme experimetálě získaé (empirické) četosti sledovaého kvalitativího zaku pozorovaé ve výběrovém souboru o rozsahu jediců s teoretickou (statistickou) četostí, kterou záme apř. z literatury ebo z dlouhodobých pozorováí. Test rozdílu empirické a teoretické četosti se ejčastěji používá při srováváí výskytu ějakého áhodého jevu kvalitativího zaku (apř. výskyt oemocěí) ve sledovaém výběrovém souboru vzhledem k výskytu tohoto áhodého jevu v celé populaci. Jiým příkladem je použití v geetice při výpočtech spojeých s porováváím empirických četostí pozorovaých v geetických pokusech s očekávaými četostmi teoreticky zámými (štěpé poměry dle Medela). Příklad 10. 1: V chovu 146 telat bylo ve 13 případech zjištěo oemoceí eteritidou. V celé populaci je výskyt tohoto oemocěí u telat podle dlouhodobých sledováí 4,5%. Liší se výskyt eteritidy ve sledovaém chovu vzhledem k celé populaci? Postup: U výběrového i základího souboru můžeme rozlišit kategorie (třídy): Nemocá zvířata Zdravá zvířata 1) Z dat pro výběrový soubor ( = 146, eteritis: 13 x) a pro populaci (p o = 4,5% = 0,045) sestavíme tabulku četostí pro obě kategorie: 105

106 Třídy: Nemocý Zdravý Empirické četosti ( e ) : Očekávaé četosti: 6,57 139,43 (výpočet: o = p o. ) (0, =6,57) (0, =139,43) resp. (146-6,57=139,43) ) Vypočteme testovací kritérium: ( ei oi oi ) (13 6,57) 6,57 3) Staovíme stupě volosti: v = m-1 = 1 ( ,43) 139,43 6,5895 4) Zvolíme hladiu výzamosti α a vyhledáme v tabulkách kritickou hodotu odpovídající této hladiě výzamosti a daému stupi volosti: 0,95(1)= 3,84 5) Porováme vypočítaé testovací kritérium s tabulkovou kritickou hodotou (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ): Vypočítaý > 0,95(1) => rozdíl mezi empirickou a teoretickou četostí je statisticky výzamý a hladiě výzamosti 0,05 6) Závěr: Pozorovaá četost výskytu oemocěí ve sledovaé stáji se statisticky výzamě (p < 0,05) liší vzhledem k celé populaci (výskyt eteritidy je ve sledovaé stáji vyšší). Příklad 10. : V pokusech s křížeím rostli hrachu byly sledováy barva a tvar semee. V experimetu se vyštěpily 4 kvalitativí třídy: kulatá žlutá semea: 315 kulatá zeleá semea: 108 ( ei ) hraatá žlutá semea: 101 hraatá zeleá semea: 3 = 556 Z předpokladu geetické ezávislosti barvy a tvaru semee a domiace kulatosti respektive žluté barvy (podle Medelových zákoů) vyplývá, že by štěpý poměr měl být 9:3:3:1. Odpovídá áš pokus Medelovým zákoům? Postup: 1) Ze štěpého poměru odvodíme očekávaé pravděpodobosti p oi pro výskyt potomků (seme) v jedotlivých třídách: 9/16 : 3/16 : 3/16 : 1/16 106

107 ) Vypočítáme očekávaé četosti v jedotlivých třídách ( oi = p oi. ) : o1 : 9/16.556= o3 : 3/16.556= o : 3/16.556= o4 : 1/16.556= ) Vypočítáme testovací kritérium: 4 i1 ei oi ,47 31,75 104,5 104,5 34,5 3) Staovíme stupě volosti: v = m-1 = 3 4) Zvolíme hladiu výzamosti α a vyhledáme v tabulkách kritickou hodotu odpovídající této hladiě výzamosti a daému stupi volosti: 0,95(3)= ) Porováme vypočítaé testovací kritérium s tabulkovou kritickou hodotou (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ): Vypočítaý < 0,95(3) => rozdíly v četostech v jedotlivých třídách ejsou statisticky výzamé. 6) Závěr: Pozorovaé četosti v ašem experimetu odpovídají teoretickému předpokladu podle Medelových zákoů (p > 0,05) Test rozdílu (a více) empirických četostí Ne vždy testujeme empirické četosti proti teoreticky očekávaým četostem podle ějaké teorie. Častěji potřebujeme porovat i více skupi empirických četostí mezi sebou a rozhodout, zda se skupiy ve svých četostech liší. V testu tedy pracujeme se skupiami četostí (ejméě dvě, ale i více), a přitom každá skupia má ěkolik (ejméě dvě, ale i více) kvalitativích tříd. Na rozdíl od předchozího případu (test rozdílu empirické a teoretické četosti), kdy jsme měli k dispozici pouze jedu skupiu s ěkolika kvalitativími třídami a testovali jsme četosti uvitř této skupiy proti teoreticky zámým četostem, yí testujeme četosti mezi více skupiami avzájem. Skupiy reprezetují áhodé výběrové soubory, které porováváme mezi sebou, obdobě, jako tomu bylo při porováváí souborů kvatitativích dat. Data (zjištěé pozorovaé četosti) pro testováí rozdílu empirických četostí uspořádáme do tabulek četostí, v ichž každý řádek a sloupec odpovídá klasifikaci do kategorií podle určitého kvalitativího zaku (resp. skupiám a třídám). Testováí rozdílu empirických četostí pak provádíme vzhledem k vlastím součtům v tabulce. V tabulce četostí ozačíme: k počet řádků (skupi) a četosti ve skupiách i m počet sloupců (tříd) a četosti ve třídách j Při uspořádáí četostí v tabulce používáme pro ozačeí četostí (empirických i očekávaých) v jedotlivých buňkách tabulky symbol ij, kde idexy i, j přiřazují daou četost k odpovídajícímu řádku (skupiě) a sloupci (třídě) v tabulce. Pro každou buňku tabulky 107

108 (pozorovaou empirickou četost eij ) vypočítáme odpovídající očekávaou četost oij (utou pro test) pomocí součtů empirických četostí v řádcích a sloupcích tabulky (viz příklad 10. 3). Po výpočtu testovacího kritéria zámý způsobem, porováme vypočteý s tabulkovou kritickou hodotou 1- (), abychom posoudili statistickou výzamost rozdílu srovávaých četostí. Jako kritické hodoty pro test slouží 1- kvatily - rozděleí při = (k-1). (m-1) stupích volosti (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ). Pokud vypočteá statistika (testovací kritérium) přesáhe tabulkovou kritickou hodotu 1- (), prohlásíme, že empirické četosti pozorovaé v jedotlivých skupiách se statisticky výzamě liší a hladiě výzamosti. Příklad 10. 3: Byly sledováy počty mrtvě a živě arozeých selat ve 3 chovech (A,B,C) v kraji. Liší se mortalita selat v chovech A, B a C? Zjištěé výsledky výskytu živě a mrtvě arozeých selat v jedotlivých chovech jsou shruty v ásledující tabulce: 3 skupiy (A,B,C) obecě k, (i) třídy (živé,mrtvé) - obecě m, (j) k m Živé Mrtvé A 96 5 B 11 C Do tabulky jsou zapsáy pozorovaé empirické četosti ( oij ) Pro každou buňku tabulky (empirickou četost eij ) musíme vypočítat odpovídající očekávaou četost oij ze součtů řádků s sloupců v tabulce: k m Živé Mrtvé Skup. (s i ) A 96 (100,34) 5 (0,66) 11 B 11 (118,59) (4,41) 143 C 89 (87,07) 16 (17,93) 105 Tř. (t j ) () 108

109 Teoretické četosti ( oij ) pro každé políčko tabulky vypočítáme podle vzorce: si. t j oij kde: = celkový počet jediců ve sledovaém výběru (kotigečí tabulce) s i = součet empirických četostí v řádku i t j = součet empirických četostí ve sloupci j (Např. pro buňku v 1. ř. a 1. sl.: o11 100, 34 ) 369 Vypočítáme testovací charakteristiku : 4 i1 ei oi , ,34 0,66 118,59 4,41 87,07 17,93 Staovíme počet stupňů volosti: v = (k-1).(m-1) = Vyhledáme tabulkovou kritickou hodotou pro zvoleou hladiu výzamosti a staoveé stupě volosti (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ): 0,95() = 5,99 Porováme vypočteý s tabulkovou kritickou hodotou: < 0,95() => mezi sledovaými četostmi eí statisticky výzamý rozdíl Závěr: Počet mrtvě a živě arozeých selat se mezi sledovaými chovy A, B a C statisticky výzamě eliší (p > 0,05) Testováí závislosti kvalitativích zaků (kotigečí tabulky) Závislost (ezávislost) a více kvalitativích zaků zjišťujeme opět statistickou aalýzou četostích tabulek a testujeme pomocí -testu. Výpočet vychází z empirických a teoretických četostí současého výskytu sledovaých zaků v souboru. Pozorovaé empirické četosti sestavíme do tzv. kotigečí tabulky (kotigece = souvislost), jejíž velikost se řídí počtem sledovaých zaků: tabulka x - ejjedodušší případ, při sledováí závislost mezi kvalitativími zaky (obecě jevy A a B) tabulka k x m - při sledováí závislost mezi skupiou zaků (jevů) A 1 -A k a skupiou jevů B 1 -B m Testujeme přitom hypotézu ezávislosti H 0 : četosti ve skupiách (četosti jedé kvalitativí proměé - řádky) jsou ezávislé a četostech ve třídách (četostech druhé kvalitativí proměé - sloupce). Hypotézu testujeme pomocí test a vypočteé testovací kritérium porováme s tabulkovou kritickou hodotou 1-, (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ), kdy stupě volosti staovíme jako = (k-1). (m-1) : 109

110 Je-li > mezi sledovaými jevy existuje statisticky výzamá závislost 1- () Je-li závislost mezi sledovaými jevy eí statisticky výzamá 1- () Kotigečí tabulka x Kotigečí tabulka x je speciálím případem obecé kotigečí tabulky četostí k x m, kdy sledujeme závislost pouze kvalitativích proměých, kdy každá má pouze kategorie, takže vziká ejjedodušší typ tabulky četostí, která má pouze řádky a sloupce. Kotigečí tabulkou x můžeme zjišťovat apř., zda spolu souvisí aplikace vakcíy a přežíváí myší v pokuse po experimetálí ákaze (tz. je vakcía účiá?) Testujeme ulovou hypotézu H 0 : jevy (vakciace a přežití) spolu esouvisí. Postup: 1.jev - aplikace vakcíy (A-ao, A -e).jev - přežití v pokuse (B-ao, B -e) B B celkem A a b A c d a + b c + d celkem a + c b + d = a + b + c + d a - počet myší splňujících A a B (vakciováy a přežily) b - počet myší splňujících A a B (vakciováy a epřežily) c - počet myší splňujících A a B (evakciováy a přežily) d - počet myší splňujících A a B (evakciováy a epřežily) (empirické četosti) - celkový počet myší v pokuse Testovací kritérium:.( a. d b. c) ( a b).( c d).( a c).( b d) Stupě volosti: ( k 1).( m 1) 1 Porováme vypočítaou testovací charakteristiku s tabulkovou kritickou hodotou (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ): Je-li > 1- () => zamítáme hypotézu ezávislosti jevů A a B (zameá to tedy, že vakciace myší výzamě ovlivňuje přežíváí myší v pokusu) Je-li 1- () => emůžeme zamítout ulovou hypotézu o ezávislosti (zameá to tedy, že vakciace esouvisí s přežíváím myší v pokusu) 110

111 Příklad 10. 4: V experimetu byla zjišťováa účiost ového atiparazitárího preparátu. U výběrového souboru 50 psů byl preparát apliková 5 jedicům, zbývajících 5 jediců preparát edostalo. Zjištěé výskyty parazitárího apadeí u pokusých jediců jsou shruty v ásledující tabulce: Aplikace prep. Bez aplikace prep. Součet Pozitiví Negativí Součet Testovací kritérium :.( ) (15 9).(10 16).(15 10).(9 16),885 Stupě volosti: =1 Kritická hodota 0,95 (1) = 3,84 (viz Příl.: Tab. č. 4a Kritické hodoty rozděleí ) < 0,95 (1) emůžeme zamítout H 0, tz., že četosti v řádcích jsou ezávislé a četostech ve sloupcích (p >0.05). Závěr: Aplikace testovaého atiparazitárího preparátu esouvisí s výskytem parazitárího apadeí u psů (preparát eí účiý) Kotigečí tabulka k x m Kotigečí tabulkou k x m testujeme hypotézu ezávislosti skupi áhodých kvalitativích jevů: skupiy jevů A 1 -A k a skupiy jevů B 1 -B m. Při celkovém počtu jediců v souboru, ozačíme obecě eij pozorovaé (empirické) četosti společého výskytu jevů A i a B j a četosti sestavíme do tabulky k x m : B 1... B j... B m A 1 e11... e1j... e1m a 1 : : : : : : : : : : A i ei1... eij... eim a i : : : : : : : : : : A k ek1... ekj... ekm a k b 1... b j... b m kde a i, b j = součty četostí v příslušých řádcích a sloupcích 111

112 Postup používaý pro aalýzu kotigečí tabulky k x m je v pricipu shodý s postupem řešeí tabulek četostí, který jsme pozali v souvislosti s testováím rozdílu empirických četostí (Viz kap Test rozdílu (a více) empirických četostí). Prostředictvím testováí rozdílů mezi empirickými a teoretickými četostmi v kotigečí tabulce k x m testujeme pomocí testu ulovou hypotézu ezávislosti dvou kvalitativích proměých (skupi jevů). Může jít apříklad o zjišťováí souvislosti mezi výskytem krevích skupi a ěkterých chorob u lidí, souvislosti mezi ročím obdobím a výskytem určitých parazitóz u volě žijící zvěře či souvislost mezi růzými krmými dietami a výskytem alimetárích potíží u skotu aj. Příklad ásledující kotigečí tabulky k x m, která schematicky zobrazuje pozorovaé empirické četosti eij, bychom apř. použili pro řešeí situace, kdy ás zajímá otázka, zda výskyt určitých oemocěí (Nemoc č.1 a č.) je spoje s výskytem určitého plemee skotu (Plemeo A, B, C). Testujeme tedy ulovou hypotézu ezávislosti skupi kvalitativích jevů (proměých A i a B j ): Proměá A i Plemeo skotu (A, B, C) Proměá B j Oemocěí (Nemoc č.1, č.) k m Nemoc č.1 Nemoc č. A e11 e1 B e1 e C e31 e3 Postup pro řešeí této kotigečí tabulky je prakticky shodý s postupem, který je uvede v Příkladu Postup: Pro každou empirickou četost eij ejprve vypočteme odpovídající teoretickou četost oij, očekávaou v případě ezávislosti jevů A 1-k a B 1-m ze součtů empirických četostí v řádcích (ozačey a i ) a sloupcích (ozačey b j ) tabulky ásledujícím postupem: oij ai. b kde ozačuje celkový součet empirických četostí v tabulce j Staovíme stupě volosti = (k-1).(m-1) a zvolíme hladiu výzamosti α. Vypočteme testovací kritérium: m i1 ei oi oi 11

113 Pokud je vypočítaá hodota testovacího kritéria ízká, svědčí to o ezávislosti testovaých kvalitativích proměých. Naopak, vyšší hodota vypočteého testovacího kritéria idikuje určitou souvislost mezi oběma skupiami sledovaých kvalitativích jevů. Pro zjištěí statistické výzamosti zjištěé závislosti porováme vypočítaou testovací charakteristiku s tabulkovou kritickou hodotou () (viz Příloha: Tab. č. 4a Kritické hodoty rozděleí ): Je-li > 1- () => zamítáme hypotézu ezávislosti skupi jevů A i a B j. Je-li 1- () => emůžeme zamítout hypotézu ezávislosti obou skupi jevů 113

114 Příloha Statistické tabulky Sezam tabulek: Tabulka č. 1 Náhodá čísla Tabulka č. Distribučí fukce F(u) ormovaého ormálího rozděleí Tabulka č. 3 Kvatily t 1-α/ () Studetova t-rozděleí Tabulka č. 4a Kritické hodoty -rozděleí (pravá straa rozděleí kvatily 1-α -rozděleí) Tabulka č. 4b Kritické hodoty -rozděleí (levá straa rozděleí kvatily α -rozděleí) Tabulka č. 5 Kritické hodoty T ; α T 1; α pro Grubbsův test Tabulka č. 6 Kritické hodoty Q ; α Q 1; α pro Dixoův test Tabulka č. 7 Kvatily F 0,975 ( V, M ) Fisher-Sedecorova rozděleí Tabulka č. 8 Kritické hodoty Ma-Whiteyova testu Tabulka č. 9 Kritické hodoty pro Wilcoxoův test Tabulka č. 10 Kritické hodoty pto zamékový test Tabulka č. 11 Kritické hodoty Spearmaova korelačího koeficietu r Sp 114

115 Tab. č. 1 Náhodá čísla (uspořádaá do bloků pouze pro lepší přehledost)

116 Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí (0 k v tabulce zameá k za sebou ásledujících ul a 9 k k za sebou ásledujících devítek) u 0,00 0, 01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09-0,0 0, , ,49 0 0, , , , ,47 1 0, , ,1 0,460 0,456 0, , , , , ,43 5 0,48 6 0,44 7-0, 0,40 7 0, ,41 9 0, ,405 0, , , , , ,3 0,38 1 0, , , , ,363 0, , ,35 0 0, ,4 0, , ,337 0, , ,36 4 0,3 8 0,319 0, ,31 1-0,5 0, , , ,98 1 0,94 6 0,91 0,87 7 0,84 3 0,81 0 0,77 6-0,6 0,74 3 0,70 9 0,67 6 0,64 3 0,61 1 0,57 8 0,54 6 0,51 4 0,48 3 0,45 1-0,7 0,4 0 0,38 9 0,35 8 0,3 7 0,9 7 0,6 6 0,3 6 0,0 6 0,17 7 0,14 8-0,8 0,11 9 0,09 0 0,06 1 0,03 3 0,00 5 0, , ,19 0, , ,9 0, , , ,176 0, , , , , , ,0 0, ,156 0, , ,149 0, , ,14 3 0, , ,1 0, , , ,19 0,17 1 0,15 1 0,13 0 0,11 0 0, , , 0, , ,111 0, , , , ,10 0 0, , ,3 0, , , , , , , , , ,08 6-1,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , ,05 6 0, , , , , , , ,7 0, , ,04 7 0, , , , , , , ,8 0, , , , , , , , , , ,9 0,08 7 0, , , , , , ,04 4 0, ,

117 Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí 1. pokračováí u 0,00 0, 01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09 -,0 0,0 75 0,0 0, , , , , , , , ,1 0, , , , , , , , , , , 0, , , , , ,01 0, , , , ,3 0, , , , , , , , , , ,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , , , , , , , , , ,7 0, , , , , , , , , , ,8 0, , , ,0 37 0,0 56 0, , ,0 05 0, , ,9 0, , , , , , , , , , ,0 0, , , , , , , , , , ,1 0, , , , , , , , , , , 0, , , , , , , , , , ,3 0, , , , , , , , , , ,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , , , , , , , , , ,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , , ,0 0, , , , , , , , , , ,1 0, , , , , , , , , , , 0, , , , , , , , , , ,3 0, , , , , , , , , , ,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , , , , , , , , ,

118 Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí. pokračováí u 0,00 0, 01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09-4,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , , ,0 0, , , ,51 0 0, , ,53 9 0,57 9 0, , ,1 0, , , , , , , , , , , 0, ,583 0, , , , ,60 6 0, , , ,3 0, ,61 7 0,65 5 0,69 3 0, , , , , , ,4 0, , ,66 8 0, , , ,677 0, , , ,5 0, , , , , , ,71 3 0, , ,7 4 0,6 0,75 7 0,79 1 0,73 4 0, , ,74 0, , , , ,7 0, , ,764 0, , , , , ,78 3 0,785 0,8 0, , , , , ,80 3 0, , , , ,9 0, , ,81 0,83 8 0,86 4 0,88 9 0, , , , ,0 0, , , , , , , , , ,86 1 1,1 0, , , , ,87 9 0, , , , , , 0, , , , ,89 5 0, ,896 0, , , ,3 0, , , , , , , , , , ,4 0, , ,9 0 0, , , , ,99 0, , ,5 0, , , , ,938 0, , , , , ,6 0, , , , , , , , , , ,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , ,976 70,0 0, , , , , , , , , ,981 69,1 0, , , , , ,984 0, , , ,985 74, 0, , , , , , , , , ,

119 Tab. č. Distribučí fukce F(u) ormovaého ormálího rozděleí 3. pokračováí u 0,00 0, 01 0,0 0,03 0,04 0,05 0,06 0,07 0,08 0,09,3 0, , , , , , , , , , ,4 0, ,9 04 0,9 40 0, , , , , , , ,5 0, , , , , , , , , ,9 5 01,6 0, , , , , , , , , ,9 6 47,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , , ,0 0, , , , , , , , , , ,1 0, , , , , , , , , , , 0, , , , , , , , , , ,3 0, , , , , , , , , , ,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , , , , , , , , , ,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , , ,0 0, , , , , , , , , , ,1 0, , , , , , , , , , , 0, , , , , , , , , , ,3 0, , , , , , , , , , ,4 0, , , , , , , , , , ,5 0, , , , , , , , , , ,6 0, , , , , , , , , , ,7 0, , , , , , , , , , ,8 0, , , , , , , , , , ,9 0, , , , , , , , , ,

120 Tab. č. 3 Kvatily t 1-α/ () Studetova t rozděleí St. volosti 0,80 0,90 0,95 0,975 0,9875 0, ,376 3,078 6,314 1,706 5,45 63,657 1,061 1,886,90 4,303 6,05 9,95 3 0,978 1,638,353 3,18 4,176 5,841 4,941 1,533,13,776 3,495 4,604 5,90 1,476,015,571 3,163 4,03 6,906 1,440 1,943,447,969 3,707 7,896 1,415 1,895,365,841 3,499 8,889 1,397 1,860,306,75 3,355 9,883 1,383 1,833,6,685 3,50 10,879 1,37 1,81,8,634 3,169 11,876 1,363 1,796,01,593 3,106 1,873 1,356 1,78,179,560 3,055 13,870 1,350 1,771,160,533 3,01 14,868 1,345 1,761,145,510,977 15,866 1,341 1,753,131,490,947 16,865 1,337 1,746,10,473,91 17,863 1,333 1,740,110,458,898 18,86 1,330 1,734,101,445,878 19,861 1,38 1,79,093,433,861 0,860 1,35 1,75,086,43,845 1,859 1,33 1,71,080,414,831,858 1,31 1,717,074,406,819 3,858 1,319 1,714,069,398,807 4,857 1,318 1,711,064,391,797 5,856 1,316 1,708,060,385,787 6,856 1,315 1,706,056,379,779 7,855 1,314 1,703,05,373,771 8,855 1,313 1,701,048,368,763 9,854 1,311 1,699,045,364,756 30,854 1,310 1,697,04,360,750 35,85 1,306 1,690,030,34,74 40,851 1,303 1,684,01,39,704 45,850 1,301 1,680,014,319,690 50,849 1,99 1,676,008,310,678 55,849 1,97 1,673,004,304,669 60,848 1,96 1,671,000,99,660 70,847 1,94 1,667 1,994,90,648 80,847 1,93 1,665 1,989,84,638 90,846 1,91 1,66 1,986,79, ,846 1,90 1,661 1,98,76,65 10,845 1,89 1,658 1,980,70,617,8416 1,816 1,6448 1,9600,414,

121 Tab. č. 4a Kritické hodoty rozděleí (pravý koec rozděleí) Kvatily 1-α: 0,95 0,975 0,99 0,995 0, ,84 5,0 6,63 7,88 10,81 5,99 7,38 9,1 10,60 13,80 3 7,81 9,35 11,34 1,84 16,6 4 9,49 11,14 13,8 14,86 18, ,07 1,83 15,08 16,75 0,5 6 1,59 14,45 16,81 18,54, ,07 16,01 18,47 0,8 4, ,51 17,53 0,09 1,95 6, ,9 19,0 1,67 3,59 7, ,31 0,48 3,1 5,19 9, ,68 1,9 4,7 6,75 31,9 1 1,03 3,34 6, 8,30 3,9 13,36 4,74 7,69 9,8 34, ,69 6,1 9,14 31,3 36,1 15 5,00 7,49 30,57 3,81 37, ,30 8,84 3,00 34,7 39,4 17 7,59 30,19 33,41 35,7 40, ,87 31,53 34,80 37,16 4, ,14 3,85 36,19 38,58 43, ,41 34,17 37,57 39,99 45,31 1 3,67 35,48 38,94 41,40 46,80 33,9 36,78 40,9 4,80 48,5 3 35,17 38,08 41,64 44,19 49, ,41 39,36 4,97 45,56 51, ,65 40,65 44,31 46,93 5, ,88 41,9 45,64 48,30 54, ,11 43,0 46,97 49,65 55, ,34 44,46 48,8 51,00 56,87 9 4,56 45,7 49,59 5,34 58, ,77 46,98 50,89 53,68 59, ,80 53,0 57,34 60,7 66, ,76 59,34 63,69 66,76 73, ,51 71,4 76,16 79,50 86, ,08 83,30 88,38 91,96 99, ,53 95,0 100,43 104, 11, ,88 106,63 11,3 116,3 14, ,34 19,56 135,81 140,16 149,41 11

Deskriptivní statistika 1

Deskriptivní statistika 1 Deskriptiví statistika 1 1 Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 1145/2004. Základí charakteristiky souboru Pro lepší představu používáme k popisu vlastostí zkoumaého jevu určité charakteristiky

Více

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna. 6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola

Více

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková Základy statistiky Zpracováí pokusých dat Praktické příklady Kristia Somerlíková Data v biologii Zak ebo skupia zaků popisuje přírodí jevy, úlohou výzkumíka je vybrat takovou skupiu zaků, které charakterizují

Více

P2: Statistické zpracování dat

P2: Statistické zpracování dat P: Statistické zpracováí dat Úvodem - Statistika: věda, zabývající se shromažďováím, tříděím a ásledým popisem velkých datových souborů. - Základem statistiky je teorie pravděpodobosti, založeá a popisu

Více

12. N á h o d n ý v ý b ě r

12. N á h o d n ý v ý b ě r 12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých

Více

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.). STATISTIKA Statistické šetřeí Proveďte a vyhodoťte statistické šetřeí:. Zvolte si statistický soubor. 2. Zvolte si určitý zak (zaky), které budete vyhodocovat. 3. Určete absolutí a relativí četosti zaků,

Více

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti. 10 Cvičeí 10 Statistický soubor. Náhodý výběr a výběrové statistiky aritmetický průměr, geometrický průměr, výběrový rozptyl,...). Bodové odhady parametrů. Itervalové odhady parametrů. Jedostraé a oboustraé

Více

Závislost slovních znaků

Závislost slovních znaků Závislost slovích zaků Závislost slovích (kvalitativích) zaků Obměy slovího zaku Alterativí zaky Možé zaky Tříděí věcé sloví řady: seřazeí obmě je subjektiví záležitostí (podle abecedy), možé i objektiví

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017 Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí

Více

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson STATISTIKA Statistika se těší pochybému vyzameáí tím, že je ejvíce epochopeým vědím oborem. H. Leviso Charakterizace statistického souboru Statistický soubor Prvek souboru Zak prvku kvatitativí teplota,

Více

Odhady parametrů 1. Odhady parametrů

Odhady parametrů 1. Odhady parametrů Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě:

Více

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou 1 Zápis číselých hodot a ejistoty měřeí Zápis číselých hodot Naměřeé hodoty zapisujeme jako číselý údaj s určitým koečým počtem číslic. Očekáváme, že všechy zapsaé číslice jsou správé a vyjadřují tak i

Více

Náhodný výběr 1. Náhodný výběr

Náhodný výběr 1. Náhodný výběr Náhodý výběr 1 Náhodý výběr Matematická statistika poskytuje metody pro popis veliči áhodého charakteru pomocí jejich pozorovaých hodot, přesěji řečeo jde o určeí důležitých vlastostí rozděleí pravděpodobosti

Více

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Statistika v biomedicísk ském m výzkumu a ve zdravotictví Prof. RNDr. Jaa Zvárov rová,, DrSc. EuroMISE Cetrum Ústav iformatiky AV ČR R v.v.i. Proč se používaj vají statistické metody v biomedicíě Biomedicísk

Více

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojího ižeýrství Ústav strojíreské techologie ISBN 978-80-214-4352-5 VYSOCE PŘESNÉ METODY OBRÁBĚNÍ doc. Ig. Jaroslav PROKOP, CSc. 1 1 Fakulta strojího ižeýrství,

Více

2. Náhodná veličina. je konečná nebo spočetná množina;

2. Náhodná veličina. je konečná nebo spočetná množina; . Náhodá veličia Většia áhodých pokusů koaých v přírodích ebo společeských vědách má iterpretaci pomocí reálé hodoty. Při takovýchto dějích přiřazujeme tedy reálá čísla áhodým jevům. Proto je důležité

Více

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL Elea Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy POPISNÁ STATISTIKA V PROGRAMU MS EXCEL RYCHLÝ NÁHLED KAPITOLY Žádý výzkum se v deší době evyhe statistickému zpracováí dat. Je jedo,

Více

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví Statistika v biomedicísk ském výzkumu a ve zdravotictví Prof. RNDr. Jaa Zvárov rová,, DrSc. EuroMISE Cetrum Ústav iformatiky AV ČR R v.v.i. Literatura Edice Biomedicísk ská statistika vydáva vaá a Uiverzitě

Více

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem Popisá statistika - zavedeí pojmů Popisá statistika - zavedeí pojmů Soubor idividuálích údajů o objektech azýváme základí soubor ebo také populace. Zkoumaé objekty jsou tzv. statistické jedotky a sledujeme

Více

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby. ováí - Hru IV /6 ováí Hru IV Mila RůžR ůžička, Josef Jureka,, Zbyěk k Hrubý zbyek.hruby hruby@fs.cvut.cz ováí - Hru IV /6 ravděpodobostí úavové diagramy s uvažováím předpětí R - plocha ve čtyřrozměrém

Více

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti 1 Základí statistické zpracováí dat 1.1 Základí pojmy Populace (základí soubor) je soubor objektů (statistických jedotek), který je vymeze jejich výčtem ebo charakterizací jejich vlastostí, může být proto

Více

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU) ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU) Základy teorie pravděpodobosti měřeí chyba měřeí Provádíme kvalifikovaý odhad áhodá systematická výsledek ejistota výsledku Základy teorie pravděpodobosti

Více

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/ Teto projekt je spolufiacová Evropským sociálím fodem a Státím rozpočtem ČR IoBio CZ..07/2.2.00/28.008 Připravil: Ig. Vlastimil Vala, CSc. Metody zkoumáí ekoomických jevů Kapitola straa 3 Metoda Z řeckého

Více

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů: Odhady parametrů polohy a rozptýleí pro často se vyskytující rozděleí dat v laboratoři se vyčíslují podle ásledujících vztahů: a : Laplaceovo (oboustraé expoeciálí rozděleí se vyskytuje v případech, kdy

Více

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou 4. Testováí statistických hypotéz Úvod Při práci s daty se mohdy spokojujeme s itervalovým či bodovým odhadem parametrů populace. V mohých případech se však uchylujeme k jiému postupu, většiou jde o případy,

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 6. KAPITOLA CENTRÁLNÍ LIMITNÍ VĚTA 6.11.2017 Opakováí: Čebyševova erovost příklad Pravděpodobost vyrobeí zmetku je 0,5. Odhaděte pravděpodobost,

Více

1. Základy počtu pravděpodobnosti:

1. Základy počtu pravděpodobnosti: www.cz-milka.et. Základy počtu pravděpodobosti: Přehled pojmů Jev áhodý jev, který v závislosti a áhodě může, ale emusí při uskutečňováí daého komplexu podmíek astat. Náhoda souhr drobých, ezjistitelých

Více

13 Popisná statistika

13 Popisná statistika 13 Popisá statistika 13.1 Jedorozměrý statistický soubor Statistický soubor je možia všech prvků, které jsou předmětem statistického zkoumáí. Každý z prvků je statistickou jedotkou. Prvky tvořící statistický

Více

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE 1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE V této kapitole se dozvíte: jak je axiomaticky defiová vektor a vektorový prostor včetě defiice sčítáí vektorů a ásobeí vektorů skalárem;

Více

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů. Náhodu bychom mohli defiovat jako součet velkého počtu drobých epozaých vlivů. V rámci přírodích věd se setkáváme s pokusy typu za určitých podmíek vždy astae určitý důsledek. Např. jestliže za ormálího

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Bodové a itervalové odhady Nechť X je áhodá proměá, která má distribučí fukci F(x, ϑ). Předpokládejme, že záme tvar distribučí fukce (víme jaké má rozděleí) a ezáme parametr

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Náhodá veličia Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 45/004. Náhodá veličia Většia áhodých pokusů má jako výsledky reálá čísla. Budeme tedy dále áhodou veličiou rozumět proměou, která

Více

6. P o p i s n á s t a t i s t i k a

6. P o p i s n á s t a t i s t i k a 6. P o p i s á s t a t i s t i k a 6.. Pozámka: Při statistickém zkoumáí ás zajímají hromadé jevy a procesy, u kterých zkoumáme zákoitosti, které se projevují u velkého počtu prvků. Prvky zkoumáí azýváme

Více

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu Cvičeí 6: Bodové a itervalové odhady středí hodoty, rozptylu a koeficietu korelace, test hypotézy o středí hodotě při zámém rozptylu Příklad : Bylo zkoumáo 9 vzorků půdy s růzým obsahem fosforu (veličia

Více

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu Cvičeí 6: Výpočet středí hodoty a rozptylu, bodové a itervalové odhady středí hodoty a rozptylu Příklad 1: Postupě se zkouší spolehlivost čtyř přístrojů Další se zkouší je tehdy, když předchozí je spolehlivý

Více

MATICOVÉ HRY MATICOVÝCH HER

MATICOVÉ HRY MATICOVÝCH HER MATICOVÉ HRY FORMULACE, KONCEPCE ŘEŠENÍ, SMÍŠENÉ ROZŠÍŘENÍ MATICOVÝCH HER, ZÁKLADNÍ VĚTA MATICOVÝCH HER CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ? Teorie her je ekoomická vědí disciplía, která se zabývá studiem

Více

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications) Základy datové aalýzy, modelového vývojářství a statistického učeí (Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applicatios) Lukáš Pastorek POZOR: Autor upozorňuje, že se jedá

Více

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter. Statistika Cíle: Chápat pomy statistický soubor, rozsah souboru, statistická edotka, statistický zak, umět sestavit tabulku rozděleí četostí, umět zázorit spoicový diagram a sloupcový diagram / kruhový

Více

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti Předáška VI. Itervalové odhady Motivace Směrodatá odchylka a směrodatá chyba Cetrálí limití věta Itervaly spolehlivosti Opakováí estraé a MLE Jaký je pricip estraých odhadů? Jaký je pricip odhadů metodou

Více

Základní požadavky a pravidla měření

Základní požadavky a pravidla měření Základí požadavky a pravidla měřeí Základí požadavky pro správé měřeí jsou: bezpečost práce teoretické a praktické zalosti získaé přípravou a měřeí přesost a spolehlivost měřeí optimálí orgaizace průběhu

Více

2 STEJNORODOST BETONU KONSTRUKCE

2 STEJNORODOST BETONU KONSTRUKCE STEJNORODOST BETONU KONSTRUKCE Cíl kapitoly a časová áročost studia V této kapitole se sezámíte s možostmi hodoceí stejorodosti betou železobetoové kostrukce a prakticky provedete jede z možých způsobů

Více

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy Měřeí statistické závislosti, korelace, regrese Prof. RNDr. Jaa Zvárov rová,, DrSc. MĚŘENÍZÁVISLOSTI Cílem statistické aalýzy vepidemiologii bývá eje staovit, zda oemocěí závisí a výskytu rizikového faktoru,

Více

Statistika pro metrologii

Statistika pro metrologii Statistika pro metrologii T. Rössler Teto projekt je spolufiacová Evropským sociálím fodem a státím rozpočtem České republiky v rámci projektu Vzděláváí výzkumých pracovíků v Regioálím cetru pokročilých

Více

Úloha II.S... odhadnutelná

Úloha II.S... odhadnutelná Úloha II.S... odhadutelá 10 bodů; průměr 7,17; řešilo 35 studetů a) Zkuste vlastími slovy popsat, k čemu slouží itervalový odhad středí hodoty v ormálím rozděleí a uveďte jeho fyzikálí iterpretaci (postačí

Více

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika Co e to statistika? Statistické hodoceí výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Statistika e ako bikiy. Odhalí téměř vše, ale to edůležitěší ám zůstae skryto. (autor ezámý) Statistika uda e, má

Více

IAJCE Přednáška č. 12

IAJCE Přednáška č. 12 Složitost je úvod do problematiky Úvod praktická realizace algoritmu = omezeí zejméa: o časem o velikostí paměti složitost = vztah daého algoritmu k daým prostředkům: časová složitost každé možiě vstupích

Více

Zhodnocení přesnosti měření

Zhodnocení přesnosti měření Zhodoceí přesosti měřeí 1. Chyby měřeí Měřeím emůžeme ikdy zjistit skutečou (pravou) hodotu s měřeé veličiy. To je způsobeo edokoalostí metod měřeí, měřicích přístrojů, lidských smyslů i proměých podmíek

Více

Elementární zpracování statistického souboru

Elementární zpracování statistického souboru Elemetárí zpracováí statistického souboru Obsah kapitoly 4. Elemetárí statistické zpracováí - parametrizace vhodými empirickými parametry Studijí cíle Naučit se výsledky měřeí parametrizovat vhodými empirickými

Více

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc Statistika Statistické fukce v tabulkových kalkulátorech MSO Excel a OO.o Calc Základí pojmy tabulkových kalkulátorů Cílem eí vyložit pojmy tabulkových kalkulátorů, ale je defiovat pojmy vyskytující se

Více

STATISTIKA PRO EKONOMY

STATISTIKA PRO EKONOMY EDICE UČEBNÍCH TEXTŮ STATISTIKA PRO EKONOMY EDUARD SOUČEK V Y S O K Á Š K O L A E K O N O M I E A M A N A G E M E N T U Eduard Souček Statistika pro ekoomy UČEBNÍ TEXT VYSOKÁ ŠKOLA EKONOMIE A MANAGEMENTU

Více

Intervalové odhady parametrů některých rozdělení.

Intervalové odhady parametrů některých rozdělení. 4. Itervalové odhady parametrů rozděleí. Jedou ze základích úloh mtematické statistiky je staoveí hodot parametrů rozděleí, ze kterého máme k dispozici áhodý výběr. Nejčastěji hledáme odhady dvou druhů:

Více

Matematika I, část II

Matematika I, část II 1. FUNKCE Průvodce studiem V deím životě, v přírodě, v techice a hlavě v matematice se eustále setkáváme s fukčími závislostmi jedé veličiy (apř. y) a druhé (apř. x). Tak apř. cea jízdeky druhé třídy osobího

Více

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých 9 Limití věty. V aplikacích teorie pravděpodobosti (matematická statistika, metody Mote Carlo se užívají tvrzeí vět o kovergeci posloupostí áhodých veliči. Podle povahy kovergece se limití věty teorie

Více

Pravděpodobnostní modely

Pravděpodobnostní modely Pravděpodobostí modely Meu: QCEpert Pravděpodobostí modely Modul hledá metodou maimálí věrohodosti (MLE Maimum Likelihood Estimate) statistický model (rozděleí) který ejlépe popisuje data. Je přitom k

Více

1 ROVNOMĚRNOST BETONU KONSTRUKCE

1 ROVNOMĚRNOST BETONU KONSTRUKCE ROVNOMĚRNOST BETONU KONSTRUKCE Cíl kapitoly a časová áročost studia V této kapitole se sezámíte s možostmi hodoceí rovoměrosti betou železobetoové kostrukce a prakticky provedete jede z možých způsobů

Více

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky Téma 6.: Základí pojmy matematické statistiky Vlastosti důležitých statistik odvozeých z jedorozměrého áhodého výběru: Nechť X,..., X je áhodý výběr z rozložeí se středí hodotou μ, rozptylem σ a distribučí

Více

3. Lineární diferenciální rovnice úvod do teorie

3. Lineární diferenciální rovnice úvod do teorie 3 338 8: Josef Hekrdla lieárí difereciálí rovice úvod do teorie 3 Lieárí difereciálí rovice úvod do teorie Defiice 3 (lieárí difereciálí rovice) Lieárí difereciálí rovice -tého řádu je rovice, která se

Více

1. Základy měření neelektrických veličin

1. Základy měření neelektrických veličin . Základy měřeí eelektrických veliči.. Měřicí řetězec Měřicí řetězec (měřicí soustava) je soubor měřicích čleů (jedotek) účelě uspořádaých tak, aby bylo ožě split požadovaý úkol měřeí, tj. získat iformaci

Více

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly. 0. KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Dovedosti :. Chápat pojem faktoriál a ovládat operace s faktoriály.. Zát defiici kombiačího čísla a základí vlastosti kombiačích čísel. Ovládat jedoduché operace

Více

8.2.1 Aritmetická posloupnost I

8.2.1 Aritmetická posloupnost I 8.2. Aritmetická posloupost I Předpoklady: 80, 802, 803, 807 Pedagogická pozámka: V hodiě rozdělím třídu a dvě skupiy a každá z ich dělá jede z prvích dvou příkladů. Čley posloupostí pak při kotrole vypíšu

Více

8. Analýza rozptylu.

8. Analýza rozptylu. 8. Aalýza rozptylu. Lieárí model je popis závislosti, který je využívá v řadě disciplí matematické statistiky. Uvedeme jeho popis a tvrzeí, která budeme využívat. Setkáme se s ím jedak v aalýze rozptylu,

Více

6. Posloupnosti a jejich limity, řady

6. Posloupnosti a jejich limity, řady Moderí techologie ve studiu aplikovaé fyziky CZ..07/..00/07.008 6. Poslouposti a jejich limity, řady Posloupost je speciálí, důležitý příklad fukce. Při praktickém měřeí hodot určité fyzikálí veličiy dostáváme

Více

1.3. POLYNOMY. V této kapitole se dozvíte:

1.3. POLYNOMY. V této kapitole se dozvíte: 1.3. POLYNOMY V této kapitole se dozvíte: co rozumíme pod pojmem polyom ebo-li mohočle -tého stupě jak provádět základí početí úkoy s polyomy, kokrétě součet a rozdíl polyomů, ásobeí, umocňováí a děleí

Více

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Pravděpodobnostní model doby setrvání ministra školství ve funkci Pravděpodobostí model doby setrváí miistra školství ve fukci Základí statistická iferece Data Zdro: http://www.msmt.cz/miisterstvo/miistri-skolstvi-od-roku-848. Ke statistickému zpracováí byla vzata pozorováí

Více

NEPARAMETRICKÉ METODY

NEPARAMETRICKÉ METODY NEPARAMETRICKÉ METODY Jsou to metody, dy předmětem testu hypotézy eí tvrzeí o hodotě parametru ějaého orétího rozděleí, ale ulová hypotéza je formulováa obecěji, apř. jao shoda rozděleí ebo ezávislost

Více

10.3 GEOMERTICKÝ PRŮMĚR

10.3 GEOMERTICKÝ PRŮMĚR Středí hodoty, geometrický průměr Aleš Drobík straa 1 10.3 GEOMERTICKÝ PRŮMĚR V matematice se geometrický průměr prostý staoví obdobě jako aritmetický průměr prostý, pouze operace jsou o řád vyšší: místo

Více

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení Odhad parametru p biomického rozděleí a test hypotézy o tomto parametru Test hypotézy o parametru p biomického rozděleí Motivačí úloha Předpokládejme, že v důsledku realizace jistého áhodého pokusu P dochází

Více

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika České vysoké učeí techické v Praze Fakulta dopraví Semestrálí práce Statistika Čekáí vlaku ve staicích a trase Klado Ostrovec Praha Masarykovo ádraží Zouzalová Barbora 2 35 Michálek Tomáš 2 35 sk. 2 35

Více

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika) Kvatová a statistická fyzika (Termodyamika a statistická fyzika) Boltzmaovo - Gibbsovo rozděleí - ilustračí příklad Pro ilustraci odvozeí rozděleí eergií v kaoickém asámblu uvažujme ásledující příklad.

Více

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n Petra Suryková Modelováí křivek základím prvkem teorie křivek v počítačové grafice křivky polyomiálí Q( t) a a t... a t polyomiálí křivky můžeme sado vyčíslit sado diferecovatelé lze z ich skládat křivky

Více

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ 3..- 4.. 2009 DIVYP Bro, s.r.o., Filipova, 635 00 Bro, http://www.divypbro.cz UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ autoři: prof. Ig. Mila Holický, PhD., DrSc., Ig. Karel Jug, Ph.D., doc. Ig. Jaa Marková,

Více

1 Úvod { }.[ ] A= A A, (1.1)

1 Úvod { }.[ ] A= A A, (1.1) Obsah Obsah... Úvod... 3 Základí pojmy počtu pravděpodobosti... 7. Základí statistické pojmy... 7. Fukce áhodých veliči... 8.3 Charakteristiky áhodých veliči... 0.4 Některá rozděleí pravděpodobosti....5

Více

8.1.3 Rekurentní zadání posloupnosti I

8.1.3 Rekurentní zadání posloupnosti I 8.. Rekuretí zadáí poslouposti I Předpoklady: 80, 80 Pedagogická pozámka: Podle mých zkušeostí je pro studety pochopitelější zavádět rekuretí posloupost takto (sado kotrolovatelou ukázkou), ež dosazováím

Více

OVMT Přesnost měření a teorie chyb

OVMT Přesnost měření a teorie chyb Přesost měřeí a teorie chyb Základí pojmy Naměřeé údaje ejsou ikdy absolutě přesé, protože skutečé podmíky pro měřeí se odlišují od ideálích. Při každém měřeí vzikají odchylky od správých hodot chyby.

Více

1. Měření ve fyzice, soustava jednotek SI

1. Měření ve fyzice, soustava jednotek SI 1. Měřeí ve fyzice, soustava jedotek SI Fyzika je vědí obor, který zkoumá zákoitosti přírodích jevů. Pozámka: Získáváí pozatků ve fyzice: 1. pozorováí - sledováí určitého jevu v jeho přirozeých podmíkách,

Více

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test, varianta C)

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test, varianta C) Přijímací řízeí pro akademický rok 24/ a magisterský studijí program: PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemý test, variata C) Zde alepte své uiverzití číslo U každé otázky či podotázky v ásledujícím

Více

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý. evost a životost - Hr III EVNOT a ŽIVOTNOT Hr III Mila Růžička, Josef Jreka, Zbyěk Hrbý zbyek.hrby@fs.cvt.cz evost a životost - Hr III tatistické metody vyhodocováí dat evost a životost - Hr III 3 tatistické

Více

Pravděpodobnost a statistika - absolutní minumum

Pravděpodobnost a statistika - absolutní minumum Pravděpodobost a statistika - absolutí miumum Jaromír Šrámek 4108, 1.LF, UK Obsah 1. Základy počtu pravděpodobosti 1.1 Defiice pravděpodobosti 1.2 Náhodé veličiy a jejich popis 1.3 Číselé charakteristiky

Více

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním Lekce Itervalový odhad Itervalový odhad je jedou ze stadardích statistických techik Cílem je sestrojit iterval (kofidečí iterval, iterval spolehlivosti, který s vysokou a avíc předem daou pravděpodobostí

Více

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými Pravděpodobost vs. Teorie pravděpodobosti pracuje s jedou ebo více teoretickými áhodými veličiami, jejichž je zámo odvozovali jsme y těchto atd. Šárka Hudecová Katedra pravděpodobosti a matematické Matematicko-fyzikálí

Více

Úloha III.S... limitní

Úloha III.S... limitní Úloha III.S... limití 10 bodů; průměr 7,81; řešilo 6 studetů a) Zkuste vlastími slovy popsat postup kostrukce itervalových odhadů středí hodoty v případě obecého rozděleí měřeých dat (postačí vlastími

Více

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací 3. Náhodý výběr Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých realizací

Více

Popisná statistika. Zdeněk Janák 9. prosince 2007

Popisná statistika. Zdeněk Janák 9. prosince 2007 Popisá statistika Zdeěk Jaák jaak@physics.mui.cz 9. prosice 007 Výsledkem měřeí atmosférické extikce z pozorováí komet a observatoři Skalaté Pleso jsou tyto hodoty extikčích koeficietů ve vlové délce 46

Více

Sekvenční logické obvody(lso)

Sekvenční logické obvody(lso) Sekvečí logické obvody(lso) 1. Logické sekvečí obvody, tzv. paměťové čley, jsou obvody u kterých výstupí stavy ezávisí je a okamžitých hodotách vstupích sigálů, ale jsou závislé i a předcházejících hodotách

Více

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6 Středoškolská techika 00 Setkáí a prezetace prací středoškolských studetů a ČVUT STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6 Pavel Husa Gymázium Jiřího z Poděbrad Studetská 66/II

Více

Vzorový příklad na rozhodování BPH_ZMAN

Vzorový příklad na rozhodování BPH_ZMAN Vzorový příklad a rozhodováí BPH_ZMAN Základí charakteristiky a začeí symbol verbálí vyjádřeí iterval C g g-tý cíl g = 1,.. s V i i-tá variata i = 1,.. m K j j-té kriterium j = 1,.. v j x ij u ij váha

Více

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Přednáška VIII. Testování hypotéz o kvantitativních proměnných Předáška VIII. Testováí hypotéz o kvatitativích proměých Úvodí pozámky Testy o parametrech rozděleí Testy o parametrech rozděleí Permutačí testy Opakováí hypotézy Co jsou to hypotézy a jak je staovujeme?

Více

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti Úvod Opakováí Poslouposti Příklady Matematika 1 Katedra matematiky, Fakulta stavebí ČVUT v Praze středa 10-11:40 posluchára D-1122 2012 / 13 Úvod Opakováí Poslouposti Příklady Úvod Opakováí Poslouposti

Více

Iterační výpočty projekt č. 2

Iterační výpočty projekt č. 2 Dokumetace k projektu pro předměty IZP a IUS Iteračí výpočty projekt č. 5..007 Autor: Václav Uhlíř, xuhlir04@stud.fit.vutbr.cz Fakulta Iformačích Techologii Vysoké Učeí Techické v Brě Obsah. Úvodí defiice.....

Více

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností 4.2 Elemetárí statstcké zpracováí Výsledkem statstckého zjšťováí (. etapa statstcké čost) jsou euspořádaá, epřehledá data. Proto 2. etapa statstcké čost zpracováí, začíá většou jejch utříděím, zpřehleděím.

Více

BAKALÁŘSKÁ STA I. + II.

BAKALÁŘSKÁ STA I. + II. Statistika I. - Teorie ) Statistika - Číselé údaje o hromadých jevech. Praktická čiost - sběr, zpracováí a vyhodocováí statistických údajů - Teoretická disciplía - metody k odhalováí zákoitostí při působeí

Více

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT Základy práce s tabulkou Výukový modul III. Iovace a zkvalitěí výuky prostředictvím ICT Téma III..3, pracoví list 3 Techická měřeí v MS Ecel Průměry a četosti, odchylky změřeých hodot. Ig. Jiří Chobot

Více

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014. Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95

Více

1 PSE Definice základních pojmů. (ω je elementární jev: A ω (A ω) nebo (A );

1 PSE Definice základních pojmů. (ω je elementární jev: A ω (A ω) nebo (A ); 1 PSE 1 Náhodý pokus, áhodý jev. Operace s jevy. Defiice pravděpodobosti jevu, vlastosti ppsti. Klasická defiice pravděpodobosti a její použití, základí kombiatorické vzorce. 1.1 Teoretická část 1.1.1

Více

2 EXPLORATORNÍ ANALÝZA

2 EXPLORATORNÍ ANALÝZA Počet automobilů Ig. Martia Litschmaová EXPLORATORNÍ ANALÝZA.1. Níže uvedeá data představují částečý výsledek zazameaý při průzkumu zatížeí jedé z ostravských křižovatek, a to barvu projíždějících automobilů.

Více

9. Měření závislostí ve statistice Pevná a volná závislost

9. Měření závislostí ve statistice Pevná a volná závislost Dráha [m] 9. Měřeí závislostí ve statistice Měřeí závislostí ve statistice se zabývá především zkoumáím vzájemé závislosti statistických zaků vícerozměrých souborů. Závislosti přitom mohou být apříklad

Více

6. FUNKCE A POSLOUPNOSTI

6. FUNKCE A POSLOUPNOSTI 6. FUNKCE A POSLOUPNOSTI Fukce Dovedosti:. Základí pozatky o fukcích -Chápat defiici fukce,obvyklý způsob jejího zadáváí a pojmy defiičí obor hodot fukce. U fukcí zadaých předpisem umět správě operovat

Více

Číselné charakteristiky náhodných veličin

Číselné charakteristiky náhodných veličin Číselé charakteristiky áhodých veliči Motivace Doposud jsme pozali fukcioálí charakteristiky áhodých veliči (apř. distribučí fukce, pravděpodobostí fukce, hustota pravděpodobosti), které plě popisují pravděpodobostí

Více

Mendelova univerzita v Brně Statistika projekt

Mendelova univerzita v Brně Statistika projekt Medelova uverzta v Brě Statstka projekt Vypracoval: Marek Hučík Obsah 1. Úvod... 3. Skupové tříděí... 3 o Data:... 3 o Počet hodot:... 3 o Varačí rozpětí:... 3 o Počet tříd:... 4 o Šířka tervalu:... 4

Více

U klasifikace podle minimální vzdálenosti je nutno zvolit:

U klasifikace podle minimální vzdálenosti je nutno zvolit: .3. Klasifikace podle miimálí vzdáleosti Tato podkapitola je věováa popisu podstaty klasifikace podle miimálí vzdáleosti, jež úzce souvisí s klasifikací pomocí etaloů klasifikačích tříd. Představíme si

Více