Základy statistiky Zpracováí pokusých dat Praktické příklady Kristia Somerlíková
Data v biologii Zak ebo skupia zaků popisuje přírodí jevy, úlohou výzkumíka je vybrat takovou skupiu zaků, které charakterizují šetřeý přírodí jev ejlépe. Biometrika v této volbě emůže většiou pomoci, statistická aalýza však může zpětě posoudit, s jakou spolehlivostí podchycují měřeé zaky zkoumaý přírodí jev a vybrat z možiy sledovaých zaků skupiu ejvhodější k popisu jevů. Věcý výzam dat může být kvatifiková v růzé míře a podle toho rozezáváme růzé typy zaků: - omiálí: jsme schopi věcě iterpretovat je rovost x = x 2 popř. erovost x x2dvou hodot, protože hodoty zde představují pouhé smluveé kódy kvalitativích pojmeováí. - ordiálí: kromě rovosti jsme schopi iterpretovat i erovost x > x 2 popř. x < x2, protože jejich hodoty vyjadřují ějaké vzestupé ebo sestupé uspořádáí itezity zkoumaé vlastosti. - itervalové: kromě rovosti a uspořádáí jsem schopi věcě iterpretovat i rozdíl x x 2 dvou hodot, protože stejý iterval mezi jedou dvojicí hodot a jiou dvojicí hodot u ich vyjadřuje i stejý rozdíl v itezitě zkoumaé vlastosti. x - poměrové: avíc jsme schopi iterpretovat i podíl dvou hodot, je i stejý podíl v extezitě zkoumaé vlastosti. x2 Itervalové a poměrové zaky se společě azývají kardiálími, protože jsou spojeé s existecí měré jedotky.
Užití statistických metod je růzě adekvátí u růzých typů zaků: Nomiálí zaky růzé typy tříděí, kotigečí tabulky Ordiálí zaky pořadové statistiky (kvatily, mediá, koeficiety pořadové korelace) Itervalové zaky většia statistických metod (aritm. průměr, korelačí koeficiet) Poměrové zaky geometrický průměr, Základí pravidlo: Data zaku a vyšším stupi kvatifikace lze zpracovat metodami určeými pro ižší stupeň kvatifikace, avšak za ceu ztráty původí iformace. Opak (zpracováí dat zaku a ižším stupi kvatifikace metodami určeými pro stupeň vyšší) hrozí zaášeím statistikovy libovůle do koečých výsledků.
Základí pojmy Experimetálí jedotka objekt, a kterém provádíme šetřeí (velikost sůšky jedotlivých pleme slepic exp. jedotkou je slepice, ikoliv vejce). Záhoděí áhodý výběr ze studovaé populace je základem pro jakýkoliv hodotý statistický test (osoba zcela ezalá podstaty experimetu, áhodý klíč výběru, výběr aslepo). Populace soubor pokusých jedotek, a kterých provádíme potřebá měřeí.
Přesost a opakovatelost Přesost bývá defiováa pomocí rozdílu měřeéči počítaé hodoty od hodoty přesé. Opakovatelost charakterizuje schopost pozorovatele obdržet stejé hodoty opakovaým měřeím stejého objektu. Přesost lze zlepšit opakovaým měřeím stejou ebo jiou metodou. Opakovaé měřeí pomůže vyloučit hrubé chyby ve čteí, zápisu či přeosu dat. Zaky s velkou promělivostí stačí měřit méě přesě ež zaky méě promělivé. Př. Neseřízeé, ale citlivé váhy mohou dávat přesé, ale eopakovatelé výsledky, zatímco ecitlivé, ale dobře seřízeé, váhy mohou dávat opakovatelé, ale epřesé výsledky.
Soukromý zemědělec vlastí stádo mléčého skotu tří růzých pleme růzého stáří. Jeho hlavím produktem je mléko, vede si deí zázamy o produkci jedotlivých krav.. Navrhěte tabulku rozděleí četostí z uvedeých dat. Dopočítejte relativí četost a kumulativí četosti. Grafické zobrazeí četostí. 2. Nalezěte výzamé kocetračí křivky. hodoty variačí řady. Aalýza struktury. Sestrojeí Lorezovy 3. Vypočítejte z uvedeých dat charakteristiky obecé úrově a charakteristiky variability. Pracujte s daty tříděými i etříděými. 4. Výpočet regresí úlohy. Výpočet idexu korelace. Grafické zázorěí regresí fukce. 5. Výpočet sdružeých regresích přímek a korelačího koeficietu. Grafické zázorěí přímek. 6. Měřeí závislosti slovích zaků. Výpočet koeficietů kotigece a asociace. 7. Středí a přípustá chyba výběru, staoveí rozsahu výběrového souboru. 8. Výpočet kofidečích itervalů pro středí hodotu, rozptyl a směrodatou odchylku, jejich grafické zobrazeí. 9. Testováí homogeity rozptylu, t testy: testováí výzamosti rozdílu dvou střeích hodot u ezávislých i závislých souborů. 0. Jedofaktorová a vícefaktorová aalýza rozptylu.. Metody ásledého testováí.
Bylo áhodě vybráo 62 krav tří pleme růzého věku ve druhé fázi laktace. Hodoty deího ádoje jsou: 35 38 42 40 44 36 32 35 34 39 39 38 40 4 42 Deí ádoj u áhodě vybraých dojic (l) 40 29 29 9 43 30 3 8 4 32 3 4 3 32 40 28 29 40 32 20 4 32 9 39 28 8 44 29 7 42 30 9 43 27 9 4 30 6 38 36 7 37 29 2 4 30 5
Postup při variačím tříděí. Hodoty uspořádat vzestupě 2. Seskupeí do itervalů stejé šířky do 00 prvků 6-9 itervalů do 500 prvků 0-5 itervalů ad 500 prvků 6 20 itervalů 3. Šířka itervalu h=r/k R = Xmax - Xmi (variačí rozpětí) 4. Hraice itervalů musí být vyzačey jedozačě, prví a posledí iterval může být urče pouze jedou hraicí (otevřeý iterval) zachyceí extrémích hodot 5. Tříděí (čárkovací metodou) //// /// 6. Střed itervalu - průměr dolí a horí hraice itervalu (ezávislý a hodotách zařazeých jedotek), formálě ahrazuje idividuálí hodoty patřící do určité třídy, reprezetuje úroveň třídy 7. Zjistíme absolutí četost jedotlivých itervalů i 8. Vypočteme relativíčetosti pi, [%], 9. Kumulativí četosti ki, kpi 0. Graf histogram četostí (sloupkový graf) úsečkový (ve středech itervalů) polygo četostí (spojicový - spojuje vrcholy úsečkového grafu)
Výzamé hodoty variačí řady. uspořádat řadu 2. roztřídit řadu 3. miimálí hodota 4. maximálí hodota (extrémí hodoty, chyby měřeí) 5. typická modálí hodota - hodota s ejvětší četostí (modálí třída) 6. kvatily - rozdělují řadu v určitém poměru četostí a) dolí kvartil x0,25 b) prostředí kvartil x0,50 (mediá) c) horí kvartil x0,75 kvartily rozdělují soubor a 4 části (jsou 3) oktily rozdělují soubor a 8 částí (je jich 7) decily a 0 částí (9) sedecily a 6 částí (5) percetily a 00 částí (99)
Charakteristiky obecé úrově a variability Aritmetický průměr Mediá Modus Rozptyl Směrodatá odchylka Variačí koeficiet x = s i= = 2 x s x = s v x 2 x x i ( xi x) i= sx = 00 x 2 s x = 2 x k i= k = i= x i i 2 ( xi x) i
Jedoduchá regrese - vystihuje průběh závislosti hodot zaku Y a zaku X X... ezávisle proměá, vysvětlující proměá Y... závisle proměá, vysvětlovaá proměá rozměrý zak přímka 2 rozměrý zak rovia Předpoklad: záme tvar závislosti, který můžeme určit:. z bodového diagramu 2. logickým rozborem situace Regresí fukce: Předpoklad: Fukce je lieárí v parametrech: f 0 (x)... f m (x) = regresory b 0... b m = regresí parametry určujeme METODOU NEJMENŠÍCH ČTVERCŮ Regresí fukce je tedy fukcí m+ ezámých parametrů b 0, b,..., b m, jejíž hodoty musíme alézt tak, aby bylo splěo kritérium ejmeších čtverců:. Extrém této fukce ajdeme tak, že ajdeme prví parciálí derivace postupě podle všech m+ ezámých parametrů, položíme je rovy ule a vziklou soustavu lieárí ormálích rovic řešíme.