8. STATISTICKÝ SOUBOR SE DVĚMA ARGUMETY Stattcký oubor e dvěma argument Průvodce tudem Vužeme znalotí z předchozí kaptol, která poednávala o tattckém ouboru edním argumentem a rozšíříme e. Předpokládané znalot Pom z předchozích kaptol. Cíle Cílem této kaptol e eznámt e tattckým ouborem e dvěma argument a eho charaktertkam. Výklad 8.. Stattcký oubor e dvěma argument Vezměme v úvahu tattcký oubor rozahu. U každého prvku ledume hodnot dvou tattckých znaků, dvou argumentů X, Y. Tak vznkne tattcký oubor e dvěma argument.stattcké znak ledované oučaně na každém tattckém prvku (notel) mohou být dkrétní nebo poté. Budou ná pochoptelně zaímat hodnot každého znaku amotatně, ale ak ou rozložen různé kombnace obou znaků. Tak např. u ouboru ldí ná mohou zaímat dva antropologcké znak, tělená výška a tělená váha. Výrobce oděvů nezaímá en rozložení výšek, ale multánně vah, neboť rozměr oblečení muí být úměrně vráběn pro všechn možné etuící kombnace hodnot těchto znaků. Zadání dvorozměrné dkrétní náhodné velčn e možno provét v podtatě dvoím způobem, a to buď pomocí tzv. četnotní plošné tabulk e dvěma vtup a nebo lneární tabulkou dvoc (, ), kde a ou ednotlvé realzace náhodných velčn X a Y. Počet výktů konkrétní dvoce (, ) e nazývá četnot (abolutní) f,.
Stattcký oubor e dvěma argument Podíl f, ϕ e pak četnot relatvní. Druhý záp vadřue funkční hodnotu, emprcké funkce rozložení pravděpodobnot dvorozměrné náhodné velčn, eíž realzac tattcký oubor předtavue. Zadání plošnou tabulkou e běžněší pro rozáhleší oubor dat, u nchž opakování výktu ednotlvých dvoc e čatěší. Takto např. vpadá zadání v ecelu: Zaveďme náleduící označení: X \ Y k n f f f k f n M f f f k f n M Pro okraové um platí: m f m f m f mk f mn M m k n M n m f, f... margnální četnot hodnot a k k k k a celkem e: m n n m f M k k k k
Stattcký oubor e dvěma argument Pro poouzení vlatnotí náhodné dvorozměrné velčn e používaí opět momentové charaktertk analogcké velčnám edním argumentem. Tak počáteční moment (r + )-tého tupně e defnován ako čílo r r r,, ϕ,, m f kdž čítání proběhne pře všechn hodnot a ako ve výše uvedené četnotní tabulce. Pro menší oubor, které nemaí mnoho tených dvoc, e vhodněší zadání lneární tabulkou: (příklad ouboru, který e zadán lneární tabulkou)
Moment pak vpočteme ednoduše: Stattcký oubor e dvěma argument m r r, Centrální moment (r + )-tého tupně e defnován vztahem r r r, (,0) ( 0, ), (,0) ( 0, ) ϕ, n m m f m m Ze všech možných momentů e v podtatě používaí en prvé a druhé. Jech význam už vlatně většnou známe: m,0 m 0, n e třední hodnota velčn bez ohledu na chování velčn e třední hodnota velčn bez ohledu na chování velčn e rozptl (varance) velčn bez ohledu na rozptýlenot velčn,0 n 0, analogck Rozptýlenot obou velčn ve všech ech vzáemných kombnacích pothue míšený moment druhého tupně ( )( ) n, cov. f. f. normovaná bezrozměrná forma n,... tzv. kovarance, eíž cov r e koefcent (lneární) korelace. Jeho význam a nterpretac poznáme. v kaptole 9. Přímý výpočet momentů lze pohodlně provét u momentů počátečních, takže e, obzvláště u ručního počítání, výhodné odvodt vztah: n m m,0,0,0 n m m 0, 0, 0, n m m m,,,0 0, analogck ako u momentů ednorozměrné náhodné velčn. Je-l oubor zadán lneární tabulkou pomocí dvoc (, ), lze např. koefcent korelace vpočít podle vzorce upraveného do tvaru:
r ( ( ) ). ( ) ( ). Stattcký oubor e dvěma argument Vícerozměrný tattcký oubor velm čato charakterzueme tzv. kovaranční matcí cov cov, rep. eí normovanou formou, korelační matcí r r. Jech důležtot však e proevue hlavně v případě mnoharozměrných náhodných velčn. Poznámka Uvedené vzorce lze amozřemě přímo použít k výpočtu defnovaných velčn, ale e zřemé, že programové vbavení oučaných počítačů kýtá daleko pohodlněší cetu, ak výledk zíkat. Ideální e v tomto případě použtí lbovolného tabulkového kalkulátoru. Protudute náleduící řešené příklad. Sledute, ak e dá vužít klacké tabelační čnnot ecelu pokročleších technk př prác tzv. matcovým operacem. Řešení příkladů, echž zadání me ledoval v tetu: Řešené úloh Příklad 8... Vpočtěte charaktertk tattckého ouboru e dvěma argument. Zadání v Ecelu:
Řešení: V ecelu me vpočetl potřebné oučt: Stattcký oubor e dvěma argument Střední hodnot: m,0..59800 48, 540 m0,. M. 030 40,80 540 Rozptl:. n,0 m,0 m,0 m,0.3449 00 00 48, 7587, 65 540 n m m. M m 0, 0, 0, 0,. 40,8 68,8 540 989900 Směrodatné odchlk: 7587, 65 3, 6 68,8,99 Kovarance: cov n,. f. 47500 48,.40,8 534,49 Koefcent korelace: cov 534, 49 r 0,89 3, 6.,99
Stattcký oubor e dvěma argument Předchozí úlohu můžete otevřít vřešenou v Ecelu. Příklad 8... Vpočtěte číelné charaktertk tattckého ouboru e dvěma argument, který e zadán lneární tabulkou: 7 3 87 93 4 4 90 93 50 54 64 7 308 34 8 7 36 30 43 54 54 59 5 8 38 37 37 440 44 50 503 506 5 556 60 64 56 63 46 4 33 40 4 8 53 38 66 Řešení: Vše potřebné opět vpočteme např. v Ecelu: Střední hodnot: m,0. 7989 39,56 5 m0,. 073 4, 9 5
Rozptl: Stattcký oubor e dvěma argument n m m. m,0,0,0,0. 39,56 3 745,3 337599 7 5 n m m. m 0, 0, 0, 0,. 5945 4,9 75,67 5 Směrodatné odchlk: 3745,37 80,96 75, 67 6, 60 Kovarance: cov n,.. (v tomto případě).34950 39,56.4,9 54,48 5 Koefcent korelace: cov 54, 48 r 0,085 80,96.6, 60 Tuto úlohu můžete otevřít vřešenou v Ecelu. Poznámka Př řešení předchozího příkladu me mohl použít předdefnovaných funkcí v Ecelu, ak blo ukázáno v 6. kaptole, příkladu 6... nebo doplňkového nátroe Analýza dat obdobným způobem, ak blo popáno v 7. kaptole, příkladu 7.3.. Poznámka I kdž me e doud věnoval zpracování tattckého ouboru, který akob bl realzací dvorozměrné dkrétní náhodné velčn, e zřemé, že práce e potou velčnou e nutně muí na tento případ převét. Realzace poté velčn e proeví vznkem číelné hodnot zadané určtou přenotí nebo něakým způobem zaokrouhlené. Z praktckých důvodů e také někd vhodné hodnot ednotlvých argumentů určtým způobem etřídt, roztřídt do
Stattcký oubor e dvěma argument tříd a umožnt tak vlatně přechod k dkrétním velčnám reprezentovaným třed použtých tříd. A pak předešlé potup ou dokonale použtelné. Problém velkot chb, které e takovým zaokrouhlením dopouštíme, e ovšem nutno zohlednt. U ednorozměrného ouboru ou známé korekce, které ohledem na šířku tříd umožní opravt vpočtené charaktertk (Shepardov korekce). U vícerozměrných šetření e takové korekce neprováděí. Poznameneme eště, že v dnešní době, kd zpracování tattckých ouborů teně věřueme počítačům, není problém předběžné úprav dat (např. tříděním a ted zaokrouhlováním) tak podtatný, neboť počítačové potup neou na množtví nebo numercké "nevhodnot" dat tak závlé a e možné pracovat přímo prvotním dat.
Stattcký oubor e dvěma argument Úloh k amotatnému řešení 8.. U tudentů.ročníku bl zaznamenán výledk zkoušek z matematk, fzk a programování. Jou uveden ve formě troc čílc, z nchž první e známka z matematk, druhá z fzk a třetí z programování: 3 3 4 3 3 43 3 4 3 3 3 33 3 3 3 3 3 33 34 3 3 33 3 34 33 33 33 33 3 3 4 4 34 3 3 33 33 33 33 3 3 34 33 3 33 33 33 33 34 33 33 333 33 33 334 333 333 333 33 334 334 33 33 333 33 33 33 333 333 333 33 33 334 333 333 333 333 333 33 333 334 333 333 333 33 333 334 333 343 343 34 343 344 343 343 343 44 434 443 43 43 43 433 44 443 443 443 443 443 44 444 444 444 444 444 a) Vtvořte tattcký oubor dvěma argument, z nchž X bude znamenat výledek zkoušk z matematk a Y výledek zkoušk z fzk a určete eho charaktertk. b) Vtvořte tattcký oubor dvěma argument, z nchž X bude znamenat výledek zkoušk z matematk a Y výledek zkoušk z programování a určete eho charaktertk. 8.. U 30 zákrků blo zštěno táří tromu v letech (argument X) a klzeň v tém roce v kg (argument Y). Podle údaů v tabulce určete charaktertk tohoto ouboru. X\Y 4 5 6 7 8 9 0 3 6 0 0 0 0 0 0 0 4 0 5 0 0 0 0 0 5 0 0 0 8 3 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 8 5 4 8 0 0 0 0 4 6 8 0 9 0 3 0 0 0 0
Stattcký oubor e dvěma argument Výledk úloh k amotatnému řešení Výledk: 8.. a),64;,69; 0,75; 0,8; k 0,354; r 0, 45; regrení přímk: 0,47 +,445; 0,43 +, 48 ; Φ 4 30 ; 0,663; 0,883; p 0,479; p 0,47 b),637;,607; 0,75; 0,787; k 0,95; r 0, 384 ; regrení přímk: 0,393 +,57; 0,374 +, 66 ; Φ 48 ; 0,3; 0,; p 0,39; p 0,388 8.. 6,53; 8,5; 3,; 3,59; k,; r 0, 34; regrení přímk: 0,37 + 5,74; 0,3 + 4, 0 ; Φ 53 ; 0,75; 3,4; p 0,95; p 0,5