Protokol č. DĚDIČNOST KVALITATIVNÍCH VLASTNOSTÍ ) Jednorozměrné rozdělení fenotypové charakteristiky (hodnoty) populace ) Vícerozměrné rozdělení korelační a regresní počet pro dvě sledované vlastnosti ad ) Mějme ve výběrovém souboru 0 králic kalifornského plemene, u kterých známe počet živě narozených mláďat. Naším úkolem je vypočítat v tomto vzorku jednotlivé fenotypové ukazatele (statistické charakteristiky). Příslušné údaje s naznačeným postupem výpočtu uvádí tab.. Tab.. Určení základních fenotypových ukazatelů (živě narozená mláďata 0 králic) Pořadová číslo n mláďat ve vrhu králice 0 + + + =0 =0 =0 králíčat králíčat Zjištěné hodnoty obvykle zapisujeme v pořadí : ; s, V. v našem případě tedy: = ± 0, živě narozených králíčat s =, živě narozených králíčat V% =,% Poznámka: Při práci s velkými čísly, příp. s čísly desetinnými zpravidla hodnotu s zjišťujeme takto:
ad ) Korelace, regrese, koeficient pořadové korelace, rovnice regresní přímky včetně grafického znázornění Tab. : Základní údaje o obvodu hrudníku (x, v cm) a živé hmotnosti (y, v kg) pro stanovení korelačního a obou regresních koeficientů Poř. č. x Y 0 0 0 + + + + + + + 0 0 0 (B) 00 (C) (A) n = 0, x = 0 cm, y = kg, = cm, = 0 kg A = B= = C= = 00 r = r mezi obvodem hrudníku a živou hmotností byla zjištěna kladná závislost vyjádřena korelačním koeficientem (r=0,) při zvýšení obvodu hrudníku u plemenných býčků (v. měsíci stáří) v průměru cm, zvýší se jejich živá hmotnost v průměru o kg při zvýšení živé hmotnosti plemenných býčků (v. měsíci stáří) v průměru o kg, zvýší se jejich obvod hrudníku v průměru o 0, cm. Výpočet korelačního, regresních koeficientů není úplně přesný, k určité chybě ve výpočtu dochází v souvislosti s početností a representativností zpracovaného výběru. Měřítkem chyby je střední chyba korelačního koeficientu (s r ) a stření chyby koeficientů regresních (s bx/y, s by/x ). Tyto střední chyby (vzorce a dosažené údaje našeho příkladu) počítáme následující způsobem: Střední chyba je jedním z měřítek průkaznosti vypočteného koeficientu. Jestliže dvojnásobek (lépe, když ani trojnásobek) střední chyby nedosahuje příslušného koeficientu, lze tento korelační, popřípadě regresní koeficient považovat za průkazný.
Vraťme se k příkladu, ve kterém jsem sledovali u plemenných býků vztah mezi obvodem hrudníku (x) a jejich živou hmotností (y): = cm b y/x = kg = 0 kg b x/y = 0, cm A sestavme rovnice obou regresních přímek: Závislá proměnná y (živá hmotnost) na x: Závislá proměnná x (obvod hrudníku) na y: b = b y/x = b = b x/y =0, a = b a = b a = 0 = 0 a = 0, 0 =, = a + bx = 0 + x = a + by =, + y x = cm y = kg = 0 + = kg =, + =, cm x = cm y = cm = 0 + = kg =, + = 0, cm Pomocí těchto vypočtených hodnot vyneseme v bodovém poli 0xy obě statistické regresní přímky. Tyto přímky se potínají v průměrných hodnotách x a y, úhel, který spolu svírají, vyjadřuje výši korelačního koeficientu (v našem případě r = 0,). Hodnotě r = odpovídá splývání regresních přímek s úhlem 0 (funkční závislost, která je extrémním případem závislosti statistické), nulová korelace je charakterizována úhlem 0. Poznámka ke grafickému znázornění lineární stochastické závislosti pomocí sdružených regresních přímek:
a (absolutní člen) úsek osy regresní přímky b (regresní koeficient) směrnice regresní přímky Součet rozdílu teoretických a skutečných (empirických hodnot) tzn. vzdáleností jednotlivých průsečíků xy a regresní přímky je vždy = 0;platí pro jakoukoliv přímku v ose souřadnic 0xy. Pouze pro dvě přímky platí tzv. kritérium nejmenších čtverců: součet čtverců odchylek (vzdáleností) mezi jednotlivými průsečíky xy a regresní přímkou je nejmenší. Pro: xˆ a by se jedná o součet čtverců délky úseček mezi průsečíky xy jednotlivých náhodných proměnných x a y a regresní přímkou, přičemž uvažované úsečky jsou rovnoběžné s osou x. Pro: yˆ a bx úsečky jsou rovnoběžné s osou y. Výpočet koeficientu pořadové korelace (R). V praktickém příkladě budeme zjišťovat hodnotu pro procentický obsah tuku v mléce krav mezi prvou a druhou laktací. Potřebné údaje pro výpočet udává následující tabulka. Dosazením hodnoty d.=, a počtu pozorování (n=) do uvedného vzorce dostáváme: ( d ), R 0, n ( n ) ( ) Tabulka: Údaje o tučnosti mléka (v%) z prvou a druhou laktaci soužící pro výpočet koeficientu pořadové korelace Číslo Tučnost Pořadí d = x y d
krávy. laktace (x). laktace (y). laktace (x). lakatce (y) 0,0,,,,,,,,,,,0,,00,0,,,,,,,,0,,,0 0, 0, + + +, + + +,,,, Tabulky
Úkoly pro samostatnou práci: Úkol č. : Následující tabulka uvádí hodnoty živé hmotnosti (x) a hmotnosti střiže (y) ve výběrovém souboru deseti ovcí. Pro oba tyto ukazatele vypočítejte hlaví statistické charakteristiky a určete, která ze sledovaných vlastností se vyznačuje větší vyrovnaností: Vlastnost Pořadové číslo ovce 0 Živá hmotnost (x) 0 0 0 0 Hmotnost střiže (y),0,,0,,0,,0,0,,0 Poznámka: obě vlastnosti v kg Úkol č. : Pomocí korelačního koeficientu r, koeficientu pořadové korelace R a obou regresních koeficientů (b x/y a b y/x ) vyjádřete vztah mezi výše uvedenými vlastnostmi. Průkaznost korelačního koeficientu r a oba regresní koeficienty ověřte výpočtem středních chyb. Vztah mezi vlastnostmi x a y rovněž vyjádřete rovnicemi příslušných regresních přímek a vynesením těchto přímek do osy souřadnic 0 xy. Úkol č. : Vztah mezi jatečnou délkou těla (x) a výškou hřbetního špeku (y) u jedné z populací prasat je charakterizován těmito hodnotami: x =, cm y =, cm b y/x = 0, cm b x/y =, cm r xy = 0, Jaké závěry lze z hodnot korelačního a obou regresních koeficientů učinit? Doplňte tento vztah výpočtem obou rovnic regresních přímek a vynesením těchto přímek do osy souřadnic 0 xy.