Lece 3 Pop datového ouboru Zatím jme hovořl převážě o zjšťováí dat a jejch zpracováí Údaje datového ouboru popují aždý případ zvlášť Ní e pouíme vužít údaje tomu, abchom zobecl určté tpcé vlatot datového ouboru jao celu Velč, teré e vzačují tím, že jedým čílem vjadřují určtou vlatot datového ouboru jao celu, e azývají ouhré (tattcé) charatert V ouvlot hromadým dat můžeme lšet apř výro tpu výše šod př ehodě amou je všší, ež př havár oobího automoblu, přčemž to utě ezameá, že aždá ehoda amou je pojea všší šodou, ež teráol ehoda oobího automoblu tato vlatot úroveň e projevuje je jao určtá tedece, terá je lépe rozpozatelá př rotoucím rozahu datových ouborů, výše pojtého u rodých domů vazuje meší promělvot, ež je tomu u pojtého domů, teré jou urče ájemímu bdleí, přčemž promělvot varabltu můžeme zatím zjedodušeě chápat třeba jao vzdáleot mez ejmeší a ejvětší hodotou datového ouboru (ejžším a ejvšším placeým pojtým v daé ategor emovtotí) Nejdůležtějším vlatotm datového ouboru je jeho úroveň a varablta Tto vlatot vjadřujeme pomocí ouhrých charatert úrově a varablt V úrov a varabltě e mohou datové oubor více č méě hodovat, ebo aopa lšt artmetcý průměr; ametre; ovarace; protá forma; průměr; robutí charaterta; rozptl; měrodatá odchla; polečý průměr; polečý rozptl; úroveň; varablta; varačí oefcet; vážeá forma 3 Úroveň a varablta datového ouboru Na obr 3 vdíme dva datové oubor (ozačeé A, B), teré bl třídě tervalovým tříděím Oba oubor jou prezetová protředctvím htogramů relatvích četotí Z obr 3 zřetel- Obr 3 Dva datové oubor lšící e v úrov a varabltě Relatví četot A B Hodot zau 9
ě vplývá, že datový oubor A má žší úroveň a oučaě všší varabltu, ež datový oubor B Soubor A vazuje prot ouboru B převahu žších hodot, oučaě vša malá čát hodot tohoto ouboru je všší, ež ejvšší hodota ouboru B (eplatí ted, že aždá hodota ouboru A je žší ež teráol hodota ouboru B) Vzdáleot (varačí rozpětí) mez mmálí a mamálí hodotou, a ted promělvot jeho hodot, je u ouboru A přblžě dvarát větší, ež u ouboru B 3 Měřeí a charatert úrově Ke změřeí úrově datového ouboru můžeme z doud zámých velč vužít medá a modu Pro medá je charatertcá poloha uvtř datového ouboru je jeho protředí hodotou Modu zae ouví četotí výtu (čato ejvětší četot vazují právě varat ebo terval ěde uprotřed tříděého datového ouboru, dž to eí 00% pravdlem) Žádá z obou jmeovaých charatert eí odvozea od všech hodot datového ouboru, rají hodot dooce a charatertu emají žádý vlv Přílad 3 Vlatot medáu jao charatert úrově Použjeme upřádaý datový oubor : 3, 0, 4,,3,,, 45 z příladu 3 Jeho medá je ( ) 0,50 ( ) rove Ja e změí medá, ahradíme-l 45 apř hodotou 450? Medá e ezměí, protože ereaguje a etrémí hodot datového ouboru Charatert taovou vlatotí azýváme robutí charatert Vraťte + Přílad rozšřte o varatu [ ] 9 četotí rovou jedé a prozoumejte, ja e v této ouvlot zachová tpcá hodota (modu) Svoje pozorováí zobecěte e příladu 3 a datový oubor í rozšřte o hodotu 450 Určete medá tato rozšířeého datového ouboru Charatert, teré buď ereagují vůbec ebo je epatrě a etrémí hodot datového ouboru, e azývají robutí charatert Tto charatert mají v ěterých čátech tatt začý výzam Nejdůležtějším charatertam úrově jou ovšem charatert, jejchž hodot jou fucem všech hodot datového ouboru a teré e azývají průměr Běžě e uvádí ěol druhů průměrů, apř průměr artmetcý, geometrcý ebo harmocý Nejobecější použtí má artmetcý průměr ( pruhem), zatímco otatí druh průměrů e používají je v určtých zvláštích tuacích Pro artmetcý průměr platí tzv určující vlatot, terou můžeme formulovat tato: a můžeme j přepat jao + + + + + +, z čehož artmetcý průměr Vzhledem tomu, že př výpočtu vužíváme protý oučet hodot datového ouboru, azývá e tato forma protou formou artmetcého průměru 0
Vlatot artmetcého průměru artmetcý průměr je rozměrá velča a lze ho určt z jaýchol reálých hodot, artmetcý průměr otat je rove této otatě, odchl hodot datového ouboru od artmetcého průměru e ompezují (jao bezprotředí důlede určující vlatot) a platí ( ) 0 (artmetcý průměr je těžštěm datového ouboru), ouhlaě vlatotm těžště platí ( c) ( ) + ( c) a ejmeší možou hodotu ted oučet čtverců odchle abývá, je-l c, je-l za Y X + c, de, c jou otat, platí taé ( je-l za W X ± Y, je oučaě w ±, je-l dáo dílčích ouborů rozah, pa polečý průměr těchto dílčích ouborů je rove,,,,, a dílčím průměr + c) + c, Určete Čemu e rove oučet odchle hodot datového ouboru 45,, 3,4,,0,, 3 od artmetcého průměru a od medáu? Čemu jou rov oučt čtverců těchto odchle? Jaý vztah je mez oběma oučt čtverců? (3 ) : průměrou teplotu ve C, jetlže průměrá teplota čla 444 F Mez oběma teplotím tupcem je vztah F,8 C + 3 Protou formu artmetcého průměru vužíváme př měřeí úrově etříděých dat Jou-l data předem zpracováa pomocí bodového ebo tervalového tříděí, vužíváme artmetcý průměr ve vážeé formě Hodot jou v případě bodového tříděí varat a v případě tervalového tříděí třed tervalů Jde o tutéž charatertu, pouze o jou formu vjádřeí I a vážeý artmetcý průměr e ted vztahují dříve uvedeé vlatot artmetcého průměru Artmetcý průměr ve vážeé formě relatví četot, p, p, de je abolutí a a je počet varat ebo počet třídcích tervalů Vážeou formu artmetcého průměru vužíváme př měřeí úrově tříděých dat p je Přílad 3 V tab 3 vpočteme vážeý artmetcý průměr pro počet záahů obluh v průběhu mě v příladu a pro výš šod (v t Kč) v příladu Uážeme př tom použtí abolutích relatvích četotí
Tab 3 Počet záahů obluh Pracoví tabula pro výpočet vážeého artmetcého průměru Výše šod (t Kč) p p 0 3 4 5 6 8 4 0 5 4 6 40 80 0 60 00 40 0,76 0,30 0,8 0,5 0,046 0,034,04 4,80 6,6 8,40 9,0 8,6 5 57 0,999 97,76 V prvím případě určíme 57, 8, což je průměrý počet záahů obluh v průběhu mě 5 Ve druhém případě včteme v oučtovém řádu poledího loupce přímo hodotu 97,76, což je průměrá výše šod v t Kč Mez oběma výled je ovšem záadí rozdíl Zatímco průměrý počet záahů je urče přeě, průměrá výše šod je pouze odhadem utečé hodot, terou bchom taovl z původích etříděých dat (důlede zavedeí tředů tervalů jao hodot reprezetujících celý terval) Vzájemá poloha artmetcého průměru, modu a medáu určuje tvar rozděleí četotí, poud jde o jeho metr, rep ametr U metrcého rozděleí četotí platí ˆ 0, 50 Máme zde ovšem a ml tattcou metr, ol metr příě geometrcou U ametrcých rozděleí bude ˆ < u levotraě eouměrého rozděleí četotí, < ˆ u pravotraě eouměrého rozděleí četotí Smetre č ametre datového ouboru je jeho další měřtelou tattcou vlatotí Jejím měřeím e ovšem ebudeme zabývat Vjádřete e metr/ametr rozděleí četotí počtu záahů obluh a rozděleí četotí výše šod ta, že porováte artmetcé průměr a tpcé hodot obou rozděleí Zotrolujte, zda grafcá zázorěí rozděleí četotí a obr a jou geometrc v ouladu vašm závěr 33 Měřeí a charatert varablt Varablta je poěud omplovaější vlatotí Protože j můžeme chápat růzě (vzdáleot mez mmálí a mamálí hodotou je je ejprmtvější pojetí varablt), etuje celá řada tattcých charatert varablt, jejchž určeí je ložtější, ež tomu blo u měřeí úrově Bezourečě ejdůležtější (a v moha měrech uátí) charatertou varablt je průměrá čtvercová odchla olem artmetcého průměru, azývaá rozptl Rozptl v proté formě je urče pro měřeí varablt u etříděých dat a taovíme ho (pro datový oubor zau X) v ouladu jeho defcí
Vjádřete ( ), po úpravě lově výzam zápu! Alteratvě pro ozačeí rozptlu zau X můžeme použít mbol lova varace) Vlatot rozptlu var (var je zratou rozptl je rozměrá charaterta (jao čtverec má rozměr, terý je čtvercem rozměru zau X) a lze ho určt z lbovolých reálých hodot, rozptl, jao čtverec, je vžd ezáporý, ule je rove př výpočtu z otat, rozptl je v ouladu e čtvrtou vlatotí artmetcého průměru ejmeší průměrou čtvercovou odchlou, je-l za Y X + c, de, c jou otat, platí var var, je-l za W X ± Y, je var w ( w w) var + var ± cov (zdůrazňujeme zaméo + mez oběma rozptl, přčemž mez za je ± ), cov ( )( ), cov 0, je tzv ovarace zaů X, Y, jejíž hodota ouví upořádáím hodot hodot př růzém upořádáí vedou růzé hodotě ovarace),, do dvojc (tejé je-l dáo dílčích ouborů rozah,,,,,, dílčím průměr a dílčím rozptl, polečý rozptl těchto dílčích ouborů ( ) + + přčemž prví čítaec reprezetuje průměrý rozptl uvtř dílčích ouborů a druhý čítaec rozptl dílčích průměrů olem polečého průměru ( ), Přílad 33 Demotrujeme ejdůležtější z uvedeých vlatotí rozptlu Mějme dva datové oubor pro 5,, 3, 4, 5 : 57,, 9,, 3 : Je zřejmé, že mez hodotam obou ouborů je vztah + 3 Rozptl var var 4 8 ( var, tejě jao rozptl aždé pětce po obě jdoucích číel, mez mž jou jedotové rozdíl, o čemž e můžete ado převědčt) Hodot w + : 6, 9,, 5, 8 a jejch rozptl je rove 8 (převědčte e o tom!) Rozptl var w 8 + 8 + cov, z čehož cov 4 3
Uveďme í hodot v verzím pořadí, tj : 5, 4, 3,, Hodot w : 0,,, 3, 4 a jejch rozptl var w + 8 + cov, z čehož cov 4 Vdíme, že hodota ovarace záví a způobu upořádáí hodot ve dvojcích Vtvořme í polečý datový oubor z :,,3,4,5,5,7,9,, 3 Jeho rozptl je var z 69 Průměrý rozptl uvtř dílčích ouborů je ( 5 + 8 5) 5 Rozdíl 69 5 64 je 0 rozptl mez dílčím oubor Demotrujte aalogc vlatot artmetcého průměru Použjte data z příladu 33 Pratcý výpočet rozptlu v proté formě (tejě jao artmetcého průměru) provedeme pomocí alulač (téměř aždá tto charatert dooce přímo umí ), případě v MS Ecelu vložeím fuce VAR (ebo PRŮMĚR) Nevýhodou rozptlu je jeho rozměr Proto e čato ahrazuje druhou odmocou, měrodatou odchlou vpočtea Rozměr měrodaté odchl odpovídá rozměru zau X, ze terého je Varabltu je rověž možo měřt bezrozměrou (rep v % vjádřeou) charatertou varačím oefcetem v ebo 00 00 v (%) Jaým způobem přeformulujeme poledí tř vlatot rozptlu pro měrodatou odchlu a varačí oefcet? (3 ) Rozptl ve vážeé formě je urče pro data, terá bla předem zpracováa pomocí bodového ebo tervalového tříděí Výzam hodot jme objal v ouvlot vážeým artmetcým průměrem Teto rozptl je ted Přílad 34 ( ), po úpravě V tab 3 vpočteme vážeý rozptl pro počet záahů obluh v průběhu mě z příladu a pro výš šod (v t Kč) z příladu Uážeme př tom použtí abolutích relatvích četotí obou varat vzorce rozptlu Vužjeme vpočteé vážeé průměr z příladu 3 Tab 3 Počet záahů obluh Pracoví tabula pro výpočet rozptlu ve vážeé formě ( ) Výše šod (t Kč) p p 0 3 4 5 6 8 4 0,3968 8,90 0,4704 4,47,8336 40 80 0 60 00 40 0,76 0,30 0,8 0,5 0,046 0,034 44,6 984,0 339, 944,0 840,0 958,4 5 35,0400 0,999 307, V tabulce vdíme, že e všecha číla v průběhu výpočtu jou jedoduchá Je třeba věovat pozorot zaorouhlováí; ěteré hodot mohou být zae poměrě voé 4
V prvím případě určíme 35, 0400, 406, což je rozptl počtu záahů obluh v průběhu 5 mě Ve druhém případě 307, 97, 76 750, 8, což je rozptl výše šod v (t Kč) Mez oběma výled je ovšem tejý rozdíl jao u průměrů Zatímco rozptl počtu záahů je urče přeě, rozptl výše šod je pouze odhadem utečé hodot, terou bchom taovl z původích etříděých dat (důlede zavedeí tředů tervalů jao hodot reprezetujících celý terval) Navíc v obou případech chbí ázorá předtava o velot varablt, vzhledem evhovující měré jedotce výledu Vážeá forma rozptlu má tejé vlatot jao forma protá a lze z í podobě určt měrodatou odchlu a varačí oefcet Který z obou datových ouborů v příladu 34 vazuje větší varabltu? Lze to vůbec vzhledem růzým měrým jedotám určt? (3 3) Průměrá a protředí abolutí odchla od medáu Podobě, jao je průměrá čtvercová odchla od artmetcého průměru rozptl ejmeší průměrou čtvercovou odchlou, platí pro abolutí odchl od medáu 0,50 c pro 0, 50 c Zavedeí abolutích odchle je alteratvou e vadratcým odchlám, přčemž polečým mlem obou oceptů je zamezeí vzájemé ompezace ladých a záporých odchle od přílušé otat Srovejte právě uvedeou vlatot odpovídající vlatotí ) (! Průměrá abolutí odchla od medáu MAAD 0,50 (zde uvedea v proté formě) je další z možých rozměrých charatert varablt Zatímco rozptl (a měrodatá odchla) více reagují a větší odchl od průměru (v důledu toho, že odchl e umocňují a druhou), průměrá abolutí odchla od medáu tuto vlatot emá Abolutí odchl od medáu eí bezpodmíečě uto průměrovat Alteratví, tetorát robutí, charatertou varablt je protředí (medáová) abolutí odchla od medáu MAD Přílad 35 Pro datové oubor :,,3,4, 5 :,,3,4,5, 50 vpočteme rozptl, měrodatou odchlu, varačí oefcet, průměrou a protředí abolutí odchlu od medáu Pro prví datový oubor: 3; ;,4; 00v 47,%; MAAD,0; MAD 0,50 Pro druhý datový oubor: 0,83; 3,5; 308,47; 7,56; 00v 6, %; MAAD 8,83; MAD 0,50,5 5
Porováím charatert úrově a varablt pro oba datové oubor vdíme, že ejmeší rozdíl zazameáváme u robutích charatert medáu a protředí abolutí odchl od medáu, teré ejou ovlvě přítomotí/epřítomotí hodot 50 Σ Každý datový oubor jao cele vazuje určté tattcé vlatot Nejdůležtějším vlatotm datového ouboru jou jeho úroveň a varablta 3 Vlatot datového ouboru měříme pomocí ouhrých tattcých charatert 4 Souhré charatert e vtují v proté ebo vážeé formě, a to v ávazot a evetuálí předchozí tříděí datového ouboru 5 Nejdůležtější charatertou úrově je artmetcý průměr 6 Nejdůležtější charatertou varablt je rozptl 7 Charatertam varablt odvozeým od rozptlu jou měrodatá odchla a varačí oefcet 8 V určtém otetu mají jao charatert varablt začý výzam abolutí odchl olem medáu (3 ) Součet odchle od průměru (4) je rove ule Součet odchle od medáu () je rove 6 Součt čtverců odchle jou 654 a 686 Rozdíl mez m je 3 8(4 +),, (3 ) w elze vjádřt pomocí, z dílčích měrodatých odchle elze počítat polečou Z v elze určt tejé jao pro měrodatou odchlu v, eboť v Další dvě odpověd jou + c (3 3) Varablta obou datových ouborů je přblžě tejá, oba varačí oefcet doahují hodot lehce ad 50 % Poračujte v řešeí úolu z předešlé lece Vpočtěte vážeý artmetcý průměr, rozptl, měrodatou odchlu a varačí oefcet počtu bodů a hrací otce Poračujte v řešeí úolu z předešlé lece Vpočtěte vážeý artmetcý průměr, rozptl, měrodatou odchlu a varačí oefcet 5 3 Zopaujte přílad 33 Př tom zaveďte 0, w 4 Platí + c Záte ˆ, 0, 50 Určete ˆ, 0, 50 5 Z trojů bl u edm provede oprav Průměrá cea oprav přpadající a jede troj (pro všech trojů) je 8 t Kč Jaá bla utečá průměrá cea o- prav (pro utečě opravovaé troje) Použjte poledí z vlatotí artmetcého průměru 6 Datový oubor př bodovém tříděí rozšíříme o jedu varatu četotí, terá je hodou oolotí ežší hodotou ouboru Která charaterta úrově e zcela jtě změí, terá zcela jtě ezměí (poud etuje) a terá e může, ale emuí změt? 6
7 Co e tae artmetcým průměrem, medáem, modem, rozptlem, měrodatou odchlou a varačím oefcetem, poud e aždá hodota datového ouboru zvýší o 0 %/íží o 30 % 8 Jaou vlatot datového ouboru b mohla měřt charaterta otruovaá jao vzdáleot dolího a horího vartlu (rozpětí vartlů)? Hodí e í ozačeí robutí charaterta? 9 Jaou vlatot datového ouboru b mohla měřt charaterta založeá a rozdílu ˆ (včetě zaméa)? 0 Lze pomocí rabcových grafů (přílad 5) rovat úroveň a varabltu datových ouborů? Lze e vjádřt jejch metr č ametr? 7