Aplikovaná statistika

Rozměr: px
Začít zobrazení ze stránky:

Download "Aplikovaná statistika"

Transkript

1 Aplikovaná statistika Studijnı materia ly Brno 2013 RNDr. Rudolf Schwarz, CSc.

2 Pravde podobnost Popisna statistika Statisticka indukce Regrese, korelace Hospoda r ska statistika Casove r ady Pro listova nı dokumentem NEpouz ıv ejte kolec ko mys i! Nebo zvolte na sledujı cı moz nost: Full Screen Úvodem se pokusme spolec ne zodpove de t ota zku, kterou poloz il profesor Disman ve sve knize [2, str.92]: Kolik vran musı me pozorovat, abychom mohli spolehlive r ı ci, z e vs echny vra ny jsou c erne? Odpove ď na takovou stupidnı ota zku je stras ne jednoducha a znı : Přece všechny! Ovs em jak to prove st, abychom mohli pozorovat vs echny vra ny na cele m sve te? Pr i r es enı tohoto proble mu se vyskytne cela r ada ota zek. Zde je pouze ne kolik ma lo z nich: Vybrane statisticke tabulky Pr edmluva Literatura Za ve r

3 Kolik pozorovatelů musıḿe vyslat a do jakých míst tere nu? Stac ı na tomto mıśte skutec ne pouze jeden pozorovatel?

4 Pravde podobnost Popisna statistika Statisticka indukce Regrese, korelace Hospoda r ska statistika Casove r ady Kolik pozorovatelů musı me vyslat a do jakých míst tere nu? Stac ı na tomto mı ste skutec ne pouze jeden pozorovatel? Jak majı by t vybaveni? Minima lne za pisnı kem a tuz kou, ale hodil by se i dalekohled, svac inka, ochrana pr ed nepr ı znivy m poc ası m, a kdovı co jes te. A co z toho lze vu bec realizovat pouze na za klade nads enı dobrovolnı ku a co jiz mi, jakoz to zadavatele vy zkumu, musı me za inancovat? Vybrane statisticke tabulky Pr edmluva Literatura Za ve r

5 Pravde podobnost Popisna statistika Statisticka indukce Regrese, korelace Hospoda r ska statistika Casove r ady Kolik pozorovatelů musı me vyslat a do jakých míst tere nu? Stac ı na tomto mı ste skutec ne pouze jeden pozorovatel? Jak majı by t vybaveni? Minima lne za pisnı kem a tuz kou, ale hodil by se i dalekohled, svac inka, ochrana pr ed nepr ı znivy m poc ası m, a kdovı co jes te. A co z toho lze vu bec realizovat pouze na za klade nads enı dobrovolnı ku a co jiz mi, jakoz to zadavatele vy zkumu, musı me za inancovat? Jsou na mi oslovenı dobrovolnı ornitologove vu bec schopni zjistit barvu kaz dic ke vra ny? Nemu z e se sta t, z e ne ktera vra na (i vı ce) pr ece jenom unikne ostr ı z ı m zraku m vyslany ch pozorovatelu? Vybrane statisticke tabulky Pr edmluva Literatura Za ve r

6 Zdrave lidske oko doka z e rozlis it vıće jak 16 milio nu barevny ch odstıńu. Kolik z nich budeme považovat za c ernou? Je antracitova jes te c erna nebo jiz nenı? A budou v tom vs ichni pozorovatele jednotni?

7 Zdrave lidske oko doka z e rozlis it vıće jak 16 milio nu barevny ch odstıńu. Kolik z nich budeme považovat za c ernou? Je antracitova jes te c erna nebo jiz nenı? A budou v tom vs ichni pozorovatele jednotni? Z toho vs eho co jsme uvedli, plyne na sledujıćı za ve r. Asi nikdy nebudeme schopni získat údaje o barvě VŠECH vran. Takz e na za klade dostupny ch informacı nezby va nez konstatovat, z e většina vran je černých. To je ale tvrzenı pravde podobnostnı ho charakteru! Jak se za ve ry pravde podobnostnı ho charakteru nakla dat, se dozvı te v prvnı kapitole te to pr ıŕuc ky o aplikovane statistice, ktera se zaby va PRAVDĚPODOBNOSTÍ. O pravde podobnosti se ne kdy hovor ı, jako o teoreticke m za kladu statistiky. A co prakticky provedeme s navra tivs ıḿi se za pisnıḱy dobrovolny ch ornitologu, je na plnı kapitoly o POPISNÉ STATISTICE. Na ota zku, zda mu z eme z te chto za pisnıḱu (tedy z informacı pouze o ne ktery ch vrana ch), vyvozovat za ve ry, ktere platı pro celou populaci vran, napr ıḱlad: tolik a tolik procent vran má jinou barvu, se pokusıḿe najı t odpove ď v kapitole zaby vajıćı se STATISTICKOU INDUKCÍ. Vz dyť jak pravı stara vinar ska moudrost: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a hned víme, na čem jsme. A neplatı na hodou, z e u mlads ıćh vran je ve ts ı podıĺ jedincu s jinou barvou jak c ernou nez u stars ıćh vran? Existuje vu bec ne jaka souvislost mezi barevnostı a ve kem u vran? Jake lze c init za ve ry o vztazıćh mezi velic inami, neboli analyzovat za vislosti, bude probıŕa no v kapitole zkoumajıćı REGRESI a KORE- LACI.

8 Pokud se nas e poznatky o vrana ch v c ase vyvı jejı (napr ıḱlad v zime je jine barevne sloz enı jak v le te ), dosta va me se do oblasti ČASOVÝCH ŘAD, coz je dals ı kapitola tohoto kurzu. A abychom nezu stali pouze u vran, pr ida me jes te kapitolu o HOSPODÁŘSKÉ STATISTICE, kde budeme pomocı indexu srovna vat ekonomicke jevy. Vzhledem ke skutec nosti, z e zıśkane hodnoty jednotlivy ch znaku (barva konkre tnı vra ny), nejsou v surove podobe (za pisnıḱy pozorovatelu ) nic ıḿ jiny m nez chaotickou a neuspor a danou horou u daju, nelze z nich bez dals ı ho zpracova nı vyc ıśt prakticky z a dne uz itec ne informace. Statistika si klade za cıĺ informace a za konitosti, ktere pr ıṕadne existujı mezi ne ktery mi hodnotami (a na poc a tku mohou by t skryty) odhalit. To znamena uspor a dat prome nne (jejich pozorovane hodnoty) do na zorne js ı graicke c i tabulkove formy a popsat je pr ıṕadne ne kolika ma lo hodnotami, ktere by obsahovaly co nejve ts ı mnoz stvı informacı obsaz eny ch v pu vodnıḿ souboru dat. V praxi ve ts inou nema me tolik c asu, energie a inancı (viz pr ıḱlad o c erny ch vrana ch), abychom mohli pro uc ine nı kvaliikovane ho rozhodnutı prozkoumat vs echny u daje vztahujıćı se k analyzovane mu proble mu. V mnoha oborech se proto setka me s pru zkumy opıŕajıćıḿi se o relativne malou c a st (vy be r, vzorek) za kladnı ho souboru. Statistika pak na za klade teorie pravde podobnosti pouz ı va postupy, pomocı nichz mu z eme, sice s urc ity m (odhadnutelny m) rizikem, na za klade vlastnostı vzorku usuzovat na vlastnosti cele ho za kladnı ho souboru. Po zvládnutí této příručky byste měli být schopni popsat problémy, při kterých hraje roli náhoda. A dále je umět řešit pomocí prostředků a nástrojů teorie pravděpodobnosti.

9 U vod do Teorie pravděpodobnosti

10 Obsah kapitoly: Teorie pravděpodobnos 1. Pokusy a jevy Elementa rnı jev Operace s elementa rnıḿi jevy Pravděpodobnost Statisticka Klasicka Kombinatorika Geometricka Axiomaticka Vlastnosti pravde podobnosti U plna pravde podobnost a Bayesu v vzorec Náhodné veličiny Za kladnı pojmy Distribuc nı funkce F(x) Na hodne velic iny diskre tnı ho typu Pr ıḱlad Na hodne velic iny spojite ho typu Číselné charakterisky náhodných veličin Str ednı hodnota E(X) Pr ıḱlad Rozptyl D(X), sme rodatna odchylka

11 5. Používaná rozdělení náhodných veličin Za kladnı pojmy Diskre tnı na hodna velic ina ne ktera jejı rozde lenı Binomicke rozde lenı Hypergeometricke rozde lenı Spojita na hodna velic ina ne ktera jejı rozde lenı Norma lnı rozde lenı Rovnome rne rozde lenı Exponencia lnı rozde lenı Intenzita poruch Náhodné vektory Sdruz ena distribuc nı funkce Margina lnı distribuc nı funkce Kontingenc nı tabulka Cıśelne charakteristiky na hodne ho vektoru Kovariance, korelac nı koeicient Pr ıḱlad: kontingenc nı tabulka a korelac nı koeicient Pr ıḱlad: E(X) a D(X) libovolne ho rozde lenı Závěr kapitoly Vztah pravděpodobnos a stasky 90

12 1. Pokusy a jevy Pokusem nazveme uskutec ne nı (vy sledek ¹) pr esne popsane ho komplexu podmıńek (napr. hod mincı na rovnou desku, zhotovenı dane ho vy robku pr edepsany m zpu sobem, provedenı chirurgicke ho za kroku, zahr ı va nı vody, vy skyt poc tu hnıźd na jednotlivy ch stromech apod.). Pr edpokla da se, z e pokus lze (alespon teoreticky) za stejny ch podmıńek neomezene opakovat. R ıḱa me pak, z e se prova dı hromadná stejnorodá operace. Za konitostmi, ktere lze pr i te chto (opakovany ch) pokusech pozorovat, se zaby va teorie pravde podobnosti. Pokud nenı pokus za stejny ch podmıńek opakovatelny napr ıḱlad poc et narozeny ch de tı v CR v letos nıḿ roce je pokus, ktery je pozorovatelny pouze jednou hovor ıḿe o subjektivnı pravde podobnosti. Jevem pak nazveme kaz dy vy sledek nebo du sledek pokusu. Cıĺem pokusu (experimentu) je stanovenı (spra vne urc enı ) jevu. Tedy napr ıḱlad zme r enı spra vne a dostatec ne pr esne hodnoty hledane velic iny. Správnos vy sledku rozumıḿe, z e soubor experimenta lnıćh (zıśkany ch, zme r eny ch) hodnot je rozpty len v blıźkosti skutec ne hodnoty, napr ıḱlad obsahu dane la tky v roztoku. Přesnost pak vyjadr uje, jak velike je rozpty lenı zıśkany ch hodnot pr i opakova nı experimentu. Pr i jake mkoliv me r enı se nikdy nevyhneme tomu, aby hodnoty (vy sledek) byly zatıź eny chybou. Obvykle se chyby de lı do tr ı skupin. ¹ Takove to pozorova nı nazy va me pokusem, ac koliv je z uvedeny ch pr ıḱladu zr ejme, z e nemusı jı t o skutec ny pokus, ktery je r ıźeny pozorovatelem. Napr ıḱlad pr i ekonomicky ch pokusech si nemu z eme libovolne nastavovat hodnotu inlace, produktivity pra ce, u rokove mıŕy, aj.

13 Hrubé chyby vznikajı z r ady pr ıć in (za vada na pr ıśtroji, chyba obsluhy, ) a jsou zapr ıć ine ny nejc aste ji jednora zovy m de jem. Systemacké chyby (soustavne ) pravidelne a soustavne zate z ujı vy sledek pokusu a to vz dy jednıḿ sme rem (hod fales nou hracı kostkou) a jsou kvantiikovatelne. Jsou zapr ıć ine ny napr ıḱlad chybnou kalibracı pr ıśtroje, nedodrz enıḿ podmıńek pokusu,. Náhodné chyby jimz se nikdy nevyhneme. Jsou zapr ıć ine ny nejru zne js ıḿi na hodny mi vlivy a obvykle jde o chyby male, ktere majı vliv na pr esnost vy sledku. Ne ktere dals ı chyby mohou vzniknout pr i zpracova nı vy sledku (napr ıḱlad zaokrouhlovacı chyby). Poznamenejme ale, z e jestliz e musı by t podmıńky pokusu pr esne vymezeny, neznamena to jes te, z e musı by t vyjmenova ny vyc erpa vajıćıḿ zpu sobem. Napr ıḱlad pr i se riove vy robe dane ho produktu nemusı by t vyjmenova na teplota a vlhkost vzduchu, atmosfe ricky tlak, kolıśa nı kvality surovin v pr ıṕustny ch mezıćh, kolıśa nı pozornosti pracovnıḱa pr i pra ci, male rozdıĺy v opotr ebenı strojnı ho zar ıźenı, atd. Determiniscký pokus konc ı jediny m vy sledkem (zahr ejeme chemicky c istou vodu na 100 C pr i norma lnıḿ tlaku voda vr e). Náhodný pokus (stochasticky ) konc ı jednıḿ vy sledkem z ne kolika moz ny ch ². V dals ıḿ se zame r ıḿe pouze na na hodne pokusy, proto budeme c asto slovıć ko na hodny vynecha vat a mluvit pouze o pokusu. ² Ani pr i opakova nı pokusu, jehoz vy sledek urc ujeme me r enıḿ, nezıśka me vz dy stejnou hodnotu. Zıśkane vy sledky jednotlivy ch me r enı se budou (v idea lnıḿ pr ıṕade ) lis it v du sledku na hodny ch chyb. Jednotliva experimenta lnı me r enı budou pr edstavova na realizacemi na hodne velic iny. Pr i posuzova nı experimenta lnıćh dat vycha zıḿe z pr edstavy, z e signa l me r ene velic iny je zatıź en na hodnou chybou (s umem), pr ic emz jednıḿ z nejdu lez ite js ıćh u kolu statistiky je najı t vhodny model popisujıćı chova nı s umu a odhadnout spra vnou hodnotu signa lu. V tomto bode pak nasta va setka nı experimenta lnı ho me r enı s matematickou statistikou a teoriı pravde podobnosti. [Otyepka, M., Bana s, P., Otyepkova, E. Základy zpracování dat. Str. 2. Dostupne z:

14 Náhoda jako pojem. Kdyz r ekneme, z e provedeme hod regule rnı mincı, ma me vs eobecnou pr edstavu o tom, jak tento pokus prova dıḿe. Neuvaz ujeme jiz ale tr eba o tom, z jake ho materia lu je zhotovena, z jake vy s ky a jaky m zpu sobem hod provedeme, neuvaz ujeme vlhkost vzduchu, tlak vzduchu a jeho proude nı apod. Protoz e nemusıḿe zna t vs echny faktory, ktere vy sledek pokusu ovlivn ujı, nebo je jich pr ıĺis mnoho, abychom je do svy ch u vah vs echny zakomponovali, zahrnujeme jejich vliv pod pojem na hoda. Jakmile byl pokus proveden, mu z eme rozhodnout, zda jev o ktery se zajıḿa me (napr. padnutı lıćnı strany pr i hodu mincı, kvalita zhotovene ho vy robku, u spe s nost provedene operace, ) nastal nebo nenastal. Jevy, ktere mohou pr i realizaci pokusu nastat, de lıḿe na tr i skupiny: Jistý jev nastane pr i kaz de m pokusu (pr i hodu klasickou kostkou padne c ıślo ve ts ı nez NULA). Náhodný jev mu z e, ale take nemusı pr i realizaci pokusu nastat (pr i hodu klasickou kostkou padne c ıślo TR I). Nemožný jev pr i z a dne m pokusu nenastane (pr i hodu klasickou kostkou padne c ıślo DESET). Da le ne kdy jes te potr ebujeme ru zne jevy mezi sebou kombinovat. Napr ıḱlad pr i jednom hodu uvedenou kostkou, kdy jako vy sledek mu z e by t hozenı pouze ne ktere ho z te chto c ıśel {1, 2, 3, 4, 5, 6}: Jev A padne c ıślo TR I nebo padne c ıślo PE T (padne TROJKA nebo PE TKA). Jev B padne c ıślo sudé (padne DVOJKA nebo CTYR KA nebo SESTKA). Jev C padne c ıślo sude a zároveň padne c ıślo ve ts ı nez c tyr i (padne SESTKA). Jev D nepadne c ıślo JEDNA (padne DVOJKA nebo TROJKA nebo CTYR KA nebo ). Jev E nepadne JEDNICKA ani nepadne DVOJKA (padne TROJKA nebo CTYR KA nebo ). Jevy (tak jako ve vy s e uvedene m pr ıḱladu) budeme oznac ovat velky mi pıśmeny latinske abecedy, pr ı padne opatr eny mi indexy. Vy jimku ma pouze Ω jisty jev a nemoz ny jev.

15 Elementární jev je takovy jev, ktery nelze rozloz it na mens ı c a stec ne jevy, proto ru zne elementa rnı jevy nemohou nastat souc asne (ani jeden z vy s e uvedeny ch jevu A, B, C, D a E nenı elementa rnı ). Pr i hodu kostkou je napr ıḱlad elementa rnıḿ jevem padnutı SESTKY. Vs echny elementa rnı jevy dohromady tvor ı u plnou skupinu (soubor, mnoz inu) základního prostoru, coz jsou vs echny moz ne vy sledky uvaz ovane ho pokusu. Pokud vezmeme vhodny syste m A podmnoz in tohoto za kladnı ho prostoru spln ujıćı na sledujıćı podmıńky (za kladnı prostor je prvkem A; s libovolny m jevem A patr ıćıḿ do A i jeho opac ny jev A musı patr it do A; s libovolny mi jevy A a B i jejich sjednocenı musı patr it do A sjednocení jevů a opačný jev bude vysvětleno vzápětí), nazveme tento syste m A polem ³ jevu jevovým polem. Implikace jevů A B R ıḱa me, z e jev A implikuje jev B (jev A ma za du sledek jev B), jestliz e jev B nastane v realizaci pokusu vz dy, kdyz v realizaci pokusu nastane jev A. Rovnost jevů A = B R ıḱa me, z e jevy A a B jsou si rovny, jestliz e A B a za roven B A. Jinak r ec eno, jestliz e jev A nastane v realizaci pokusu vz dy, kdyz nastane v realizaci pokusu jev B a nikdy jindy. Průnik jevů A B (společné nastoupení všech jevů) je jev, ktery nastane pra ve tehdy, kdyz v realizaci pokusu nastane jev A a za roven jev B. Sjednocení jevů A B (nastoupení alespoň jednoho z jevů) je jev, ktery nastane pra ve tehdy, kdyz v realizaci pokusu nastane jev A nebo jev B (nebo i oba spolec ne ). ³ Termıń pole ma zde vy znam algebraicke struktury (komutativnı ho te lesa).

16 Rozdíl jevů A B je jev, ktery nastane pra ve tehdy, kdyz v realizaci pokusu nastane jev A a v realizaci pokusu nenastane jev B. Opačný jev A (komplementární, ne kdy oznac ujeme non A) je jev, ktery v realizaci pokusu nastane pra ve tehdy, kdyz v realizaci pokusu nenastane jev A. Poznamenejme, z e platı A B = A B A = Ω A Casto si vy s e uvedene vztahy zna zorn ujeme pomocı tak zvany ch Vennových diagramů. Napr ıḱlad takto mu z eme zakreslit pru nik (je vybarven) jevu A B nebo rozdıĺ jevu A B.

17 2. Pravděpodobnost Vy sledek na hodne ho pokusu nelze s jistotou pr edpove de t. Ne ktere vy sledky vs ak nasta vajı c aste ji, ne ktere me ne c asto, ne ktere velmi zr ı dka. Pr i velky ch se riıćh opakova nı vs ak i tyto na hodne pokusy (pr esne ji jejich vy sledky) vykazujı urc ite za konitosti a pravidelnosti. Cílem teorie pravděpodobnosti je pra ve studium te chto za konitostı, jejich popsa nı a vytvor enı pravidel pro urc enı mıŕy poc etnosti vy skytu te chto jevu. S te mito za konitostmi se be z ne setka va me, aniz bychom si to mnohdy uve domovali. Napr ıḱlad kaz dy vı, c i intuitivne tus ı, z e pr i hodu mincı ma stejnou s anci rub i lıć a z e tudıź pr i velke m poc tu pokusu budou nejspıś padat stejne c asto (pokud nenı mince za me rne ne jak upravena ). Stejne tak ze statisticky ch roc enek lze snadno zjistit, z e podıĺ chlapcu narozeny ch v jednotlivy ch letech vzhledem k celkove mu poc tu narozeny ch de tı se pohybuje okolo 51,5 %. Pr estoz e v jednotlivy ch pr ıṕadech nelze pohlavı dı te te pr edpove de t, mu z eme pome rne pr esne odhadnout, kolik se narodı chlapcu z celkove ho poc tu narozeny ch de tı. Z uvedeny ch pr ıḱladu vyply va, z e relativnı c etnosti ne ktery ch jevu se s rostoucıḿ poc tem opakova nı usta lı na urc ity ch c ıślech. Tento u kaz budeme nazy vat stabilitou relativních četností. Tato stabilita relativnıćh c etnostı je empiricky m za kladem pojmu pravděpodobnost jevu. Zaby vejme se pokusem, pr i ne mz mu z e nastat jev, ktery oznac ıḿe pıśmenem A. Povedeme jednu se rii n opakova nı tohoto pokusu za stejny ch podmıńek. Poc et vy skytu jevu A, ktery na m r ıḱa, kolikra t be hem se rie opakovany ch pokusu jev A nastal, oznac ıḿe m. ⁴ Cıślo m nazy va me (absolutnı ) četností jevu A a c ıślo m n relativní četností jevu A. ⁴ f(a) = m je vlastne funkcı, ktera jevu A pr ide luje pr irozene c ıślo vyjadr ujıćı poc et vy skytu jevu A pr i opakovane m prova de nı pokusu. Zobecne nı te to mys lenky vede na axiomaticke zavedenı pravde podobnosti.

18 Jestliz e provedeme ne kolik se riı (prvnı se rie me la n opakova nı a jev A se vyskytl v m z nich, ve druhe se rii se jev A vyskytl m kra t z n opakova nı, vy sledky tr etı se rie oznac me m, n, ) vy s e uvedeny ch opakova nı pokusu, pak lze obvykle pozorovat, z e relativnı c etnosti v jednotlivy ch se riıćh kolıśajı a ustalujı se kolem jiste ho c ıśla, ktere nazy va me pravděpodobností jevu A a oznac ujeme P(A). Tedy symbolicky mu z eme psa t s por adovy m c ıślem i. m n P(A). Je zr ejme, z e 0 Potom zr ejme take 0 P(A) 1. 1 pro jaky koukoliv se rii pokusu Pojem kolísání lze v pojetı teorie pravde podobnosti cha pat tak, z e odchylky (rozdıĺy) relativnıćh c etnostı od pravde podobnostı za visı na na hode. Cıślo P(A) lze interpretovat tak, z e pr i ne kolika (mnoha) opakova nıćh pokusu (pr ic emz v kaz de m z te chto pokusu mu z e nastat jev A), jev A nastane asi ve P(A) 100 % te chto pokusu. Stascká (von Misesova deinice zpu sob urc enı ) pravde podobnosti. Oznac ıḿe-li jako v pr edchozıćh u vaha ch relativní četnost hromadne ho (pokus za stejny ch podmıńek nkra t opakujeme) jevu A, pr ic emz v te to se rii nastal jev A mkra t, pak m P(A) = lim n = lim kolikra t nastal jev A poc et pokusu počet vs ech pokusu (1) Misesu v pr ıśtup k pravde podobnosti je zaloz en na empiricke m zkouma nı, jez vede k pozorova nı stability relativnıćh c etnostı. Umoz n uje urc it pravde podobnost jevu v pr ıṕade, z e nenı zna mo jeho bliz s ı chova nı (tedy jake jsou elementa rnı jevy, pr i ktery ch zkoumany jev nasta va, a jejich pravde podobnosti). Jestliz e je na hodny pokus libovolne kra t (alespon teoreticky) opakovatelny za stejny ch statisticky ch podmıńek (napr ıḱlad hod kostkou c i mincı, ), pak lze pravde podobnost jevu odhadnout na za klade poc tu jevu pr ıźnivy ch vy sledku pokusu.

19 Tento odhad je tıḿ pr esne js ı, c ıḿ je poc et realizacı na hodne ho pokusu (n) vys s ı. Statisticka deinice pravde podobnosti na m napr ıḱlad umoz n uje odhadnout pravde podobnost toho, z e padne s estka na nepoctive ( cinknute ) kostce. Obra zek 1: Pr evzat z [9, str. 48] Za vislost relativnı c etnosti padnutı s estky na nepoctive kostce = kolikra t padla SESTKA poc et VSECH pokusu

20 Klasická (Laplaceova deinice) pravde podobnosti. Pokud ma me konec ny poc et m elementa rnıćh jevu a všechny tyto elementa rnı jevy jsou stejně možné, pak pravde podobnost jevu A, ktery nastane pr i p te chto elementa rnıćh jevech urc ıḿe pomocı vzorce P(A) = p m = příznivé pr ıṕady vs echny možné Pr edpoklad, z e vs echny vy sledky pokusu majı stejnou pravde podobnost vy skytu, je moz na pochopitelny, ale v praxi ma lo obvykly. Ma loktera hracı kostka je totiz natolik idea lnı, aby na nı c ıśla padala se stejnou pravde podobnostı. Proto jsme dr ı ve uvedli i statistický zpu sob zavedenı pravde podobnosti. Uvaz ujme nynı napr ıḱlad jev A, z e na normální hrací kostce padne šestka. Jak bude (podle pr edchozıćh u vah) hledání pravděpodobnosti tohoto jevu P(A) =?, tedy padnu šestky ve skutec nosti vypadat? Stascky zavedená pravděpodobnost (empiricka ) vycha zı z experimentu. Kostkou mnohokrát hodıḿe a urc ıḿe relativnı c etnost jevu A, kterou budeme povaz ovat za nejleps ı odhad pravde podobnosti tohoto jevu P(A). Viz obra zek 1, kde v prvnıḿ hodu s estka NEpadla, ve druhe m PADLA, ve tr etıḿ NEpadla, Pro spra vnou kostu se da oc eka vat, z e se tento odhad bude blıź it jedne s estine. Pro fales nou kostku na obra zku 1 je to pr ibliz ne 0,4. Klasicky zavedená pravděpodobnost (teoreticka ) vycha zı z obecny ch vlastnostı dane situace. V pr ıṕade kostky abstrahuje od jejı nedokonalosti a bude ji povaz ovat za idea lnı, na ktere vs echny hodnoty padajı se stejnou pravde podobnostı. Potom lze k vy poc tu pravde podobnosti vyuz ı t klasicke deinice a vy sledkem je zna ma hodnota jedna šestina. P(A) = 1/6. Vs imne te si, z e oba pohledy jsou pouze pr ibliz ne. Ani jeden z nich neurc ı pravde podobnost naprosto pr esne, ale pouze se k nı pr iblıź ı. Jsou to tedy pouhe modely skutečnosti, skutec ne ho chova nı zkoumane kostky. (2)

21 U empirického pr ıśtupu přesnost vy sledku závisí na počtu provedeny ch pokusů (experimentu, hodu kostkou). Cıḿ vıće pokusu, tıḿ pr esne js ı lze oc eka vat vy sledek. U teoreckého pr ıśtupu přesnost vy sledku závisí na zvolene abstrakci (idealizaci, zjednodus enı ) cele ho proble mu. Cıḿ ve ts ı abstrakce, tıḿ jednodus s ı vy poc et, ale tıḿ me ne pr esny vy sledek. Ktery pr ıśtup tedy zvolit? To vz dy za visı na: Informacıćh, ktere ma me k dispozici: Zna me vs echny elementa rnı jevy? Jsou elementa rnı jevy skutec ne stejne moz ne? Moz nostech provedenı experimentu: Da se pokus opakovat? Je provedenı pokusu na roc ne na prostr edky, na c as? A na dals ıćh souvisejıćıćh faktorech. Souvislost obou pr ıśtupu (jejichz vy sledky se ve ts inou od sebe pr ıĺis nelis ı ) pak vede k na sledujıćıḿu tvrzenı : PRAVDĚPODOBNOST JE TEORIÍ STATISTIKY A STATISTIKA JE PRAXÍ TEORIE PRAVDĚPODOB- NOSTI. [3, str. 176]

22 Kombinatorika Jestliz e je poc et elementa rnıćh jevu (vs echny moz ne ) velky, je obtıź ne je vypisovat vs echny. Pokud potr ebujeme zna t pouze jejich poc et, pak ho lze c asto urc it pomocı kombinatorických schémat (viz tabulka 1). Nejdr ı ve pr ipomen me, z e vy raz k! (c teme: ká ), kde k je pr irozene c ıślo (1, 2, 3, ), poc ı ta me takto: k! = k (k 1)!, pr ic emz 0! = 1. Určete 5! Řešení: 5! = 5 4!, 4! = 4 3!, 3! = 3 2!, 2! = 2 1!, 1! = 1 0! = 1 1 = 1 Tedy: 5! = 5 4! = 5 (4 3! ) = 5 [4 (3 2! )] = 5 {4 [3 (2 1! )]} = 5 4 {3 [2 (1)]} = = = 120. V kombinatoricky ch sche matech uvedeny ch v na sledujıćı tabulce pr edpokla da me, z e je da no k prvku, z nichz vytva r ıḿe skupiny po r prvcıćh (nebo-li vy be r tr ı dy r z k prvku ). Poc et takto vytvor eny ch skupin za lez ı jednak na tom, jak jsou prvky ve skupine uspořádány (zda je významné, z e jeden prvek stojı pr ed druhy m c ıślo 12 je jine nez c ıślo 21 i kdyz v obou jsou stejne cifry jednic ka a dvojka nebo není významné c a stku 7 Kc zaplatıḿe napr ıḱlad tak, z e na pult poloz ıḿe dvoukorunu a pe tikorunu, pr ic emz nenı vy znamne, kterou poloz ıḿe jako prvnı, nebo dokonce da me-li obe mince spolec ne ) a potom jes te na tom, zda se kaz dy z prvku mu z e libovolne kra t opakovat nebo ne. V prvnıḿ sloupci na sledujıćı tabulky je podmıńka, zda za lez ı na por adı prvku ve skupine. Ve druhe m sloupci je podmıńka, zda se prvky ve skupine mohou libovolne kra t opakovat. Ve tr etıḿ sloupci je na zev skupiny a ve c tvrte m jejı oznac enı a poc et te chto skupin. Kdyz si shrneme, co zna te ze str ednı skoly: uspořádaný vy be r variace: V (k) neuspořádaný vy be r kombinace: C (k) V (k) = P(k) permutace: P(k) = k!

23 Tabulka 1: Kombinatoricka sche mata POŘADÍ Prvky se Oznac enı skupiny Název skupiny je podstatne OPAKUJÍ Počet skupin ano ne variace V (k) = ano ano variace s opakova nıḿ V (k) = k k! (k r)! ne ne kombinace C (k) = k r = k! r! (k r)! k + r 1 ne ano kombinace s opakova nıḿ C(k) = = r (k + r 1)! r! (k 1)! Geometrická (deinice) pravde podobnosti. Pokud existuje nekonečně mnoho stejne moz ny ch elementa rnıćh jevu (vs echny tyto elementa rnı jevy dohromady oznac ujeme Ω), mu z eme je zna zornit jako c a st pr ıḿky, roviny, prostoru nebo c asu, pr ic emz jaky koliv jev A je ope t (mens ı pokud to nenı jev jisty ) c a stı takto zna zorne ne pr ıḿky, roviny, prostoru nebo c asu. Tyto c a sti lze me r it (je to de lka, plocha, objem, apod.) a tuto mıŕu oznac me μ. Potom pravde podobnost, z e nastane jev A je P(A) = μ(a) μ(ω) kde μ(ω), coz je mıŕa za kladnı ho prostoru (vs ech elementa rnıćh jevu dohromady) je vz dy ve ts ı nez nula. Tedy nulou nikdy nede lıḿe! (3)

24 Příklad: Dva milenci se dohodli [5, str. 17], z e se potkajı na stanovene m mıśte v sobotu mezi druhou a tr etı hodinou odpoledne. Po sve m pr ıćhodu bude kaz dy z milencu c ekat na pr ıćhod druhe ho pr esne 20 minut a kdyz se nedoc ka, tak odejde. Pr edpokla da se, z e pr ıćhod kaz de ho z milencu je v sobotu od 14 hodin do 15 hodin stejne moz ny. Jaka je pravde podobnost, z e milenci a) se doc kajı jeden druhe ho; b) pr ijdou ve stejnou dobu. Řešení: Pokusem je zjis te nı doby, kdy kaz dy z milencu pr is el na mıśto schu zky. Oznac me dobu pr ıćhodu prvnı ho z milencu (mezi 14. a 15. hodinou) x a dobu pr ıćhodu druhe ho milence y, kdy u daje jsou v minuta ch. Potom lze vy sledky pokusu vyja dr it dvojicemi c ıśel [x; y] (mu z eme si je pr edstavit jako body roviny viz sousednı obra zek, ktery byl pr evzat z [5, str. 17]), kde 0 x 60 a 0 y 60. Poc a tek soustavy sour adnic je ve 14:00 hod. Za kladnı prostor Ω lze zna zornit c tvercem s de lkou strany 60 minut. Potom mıŕa za kladnı ho prostoru je rovna obsahu c tverce, tedy μ (Ω) = = 3600 jednotek. Protoz e poc ı ta me plochu (obsah c a sti roviny), budeme mıŕu oznac ovat indexem dva. Jev A milenci se sejdou. Tento jev nastane pra ve tehdy, kdyz rozdıĺ v doba ch pr ıćhodu milencu nepr esa hne 20 minut. Tedy platı : x y 20. Jev A je vyznac en stıńovany m obrazcem ohranic eny m pr ıḿkou y = x + 20 a y = x 20. Jeho mıŕa je μ (A) = = 2000 jednotek (od plochy c tverce odec teme plochu dvou shodny ch troju helnıḱu ). Dle vzorce (3) pro vy poc et geometricke pravde podobnosti: P(A) = μ (A) μ (Ω) = ,556

25 Jev B milenci pr ijdou ve stejnou dobu. Tedy x = y, coz je rovnice pr ıḿky, na obra zku u hlopr ıć ka c tverce spojujıćı body [0; 0] a [60; 60]. Protoz e plos ny obsah u sec ky je roven nule, bude mıŕa jevu B nula μ (B) = 0. Pak dle vzorce (3) pro vy poc et geometricke pravde podobnosti: P(B) = μ (B) μ (Ω) = = 0 Vypoc tene pravde podobnosti lze interpretovat takto: Během většího počtu sobot se asi v 55,6 % milenci setkají a prakticky žádnou sobotu nepřijdou přesně ve stejnou dobu, i když to není vyloučeno. Poznamenejme, z e sice pravde podobnost P(B) = 0, ale protoz e jev B mu z e nastat, nenı to nemoz ny jev. Pr ipomen me, z e nemožným nazy va me jev, ktery nemůže nastat a pr ir azujeme mu nulovou pravde podobnost. Axiomacká (Kolmogorovova deinice) pravde podobnosti. Pravde podobnost P je funkce (viz pozna mka 4), ktera kaz de mu jevu A patr ıćıḿu do pole jevu pr ir azuje rea lne neza porne c ıślo ⁵ nejvy s e rovne jedne, tedy 0 P(A) 1, pr ic emz funkce P ma na sledujıćı vlastnosti: ⁵ Takto stanovena pravde podobnost (statisticka, klasicka i geometricka deinice pravde podobnosti pr edstavujı pouze specia lnı, v praxi vs ak c asto pouz ı vane, pr ıṕady axiomaticke deinice) je z nas eho hlediska vhodna pro pochopenı toho, jak se pravde podobnost chova pr i vy poc tech. Vs imne te si, z e axiomaticky syste m vymezuje vlastnosti pravde podobnosti, neuda va vs ak z a dny na vod k jejıḿu urc enı (jak ji spoc ı tat).

26 Vlastnos pravděpodobnos Jistý jev P(Ω) = 1 Pro jevy A, B a C ze za kladnı ho prostoru platı : Nemožný jev P( ) = 0 Neslučitelné jevy Pro libovolne jevy A a B, ktere nemajı spolec ny pru nik (tedy platı A B = A nebo jinak A B = ) je P(A B) = P(A) + P(B) Implikace jevů kdyz A B Opačný jev P( A) = 1 P(A) pak P(A) P(B) Rozdíl jevů P(A B) = P(A) P(A B) Sjednocení jevů P(A B) = P(A) + P(B) P(A B) P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C} + P(A B C)) Průnik jevů (jejich spolec ne nastoupenı ) P(A B) = viz upraveny vzorec (5) Bernoulliovo schéma Jestliz e pr i urc ite m pokusu mu z e nastat jev A s pravde podobnostı p /tedy P(A) = p/ a pr i n opakova nı tohoto pokusu za stejny ch podmıńek se tato pravde podobnost p neme nı, pak takove opakova nı pokusu nazy va me Bernoulliovou posloupností nezávislých pokusů ⁶. Potom jev A (jev A nastane pr i tomto opakova nı pr esne k-kra t) bude mı t na sledujıćı pravde podobnost: P(A ) = n k p (1 p), k = 0, 1, 2,, n. (4) ⁶ Zobecnıḿe-li u vahu tak, z e budeme popisovat poc et na hodny ch uda lostı v ne jake m pevne m c asove m intervalu, tak pr i splne nı urc ity ch podmıńek (viz [9, str. 160] ordinarita, stacionarita, neza visle pr ıŕu stky, bezna slednost) dostaneme tak zvany Poissonu v proces, ktery m se v te to pr ıŕuc ce nebudeme zaby vat.

27 Podmíněná pravděpodobnost Prozatıḿ jsme rozebıŕali pokusy typu, z e hodıḿe homogennı hracı kostkou tvaru krychle a zkouma me pravde podobnost, kdy padne napr ıḱlad SESTKA (tento jev oznac ıḿe A). Nynı potr ebuje zave st ne jakou dopln ujıćı informaci. Napr ıḱlad jaka je pravde podobnost, z e padla zmıńe na s estka, kdyz vıḿ (za pr edpokladu), z e padlo sude c ıślo (tento jev oznac ıḿe B). Nezajıḿa me se o pravde podobnost, vztahujıćı se k podmıńka m pu vodnı ho pokusu, ale na jinou pravde podobnost, vztahujıćı se k podmıńka m pokusu, ktere jsou doplne ny o pr edpoklad, z e nastal jev B. Tuto jinou pravde podobnost oznac ıḿe P(A B) a nazveme ji podmíněnou pravděpodobností. Je to pravde podobnost, z e nastane jev A za pr edpokladu, z e jev B jiz nastal ⁷. Tento pr ıḱlad, ve ktere m se vyskytuje pouze ne kolik ma lo moz nostı, mu z eme poc ı tat pr ıḿo pomocı rozkladu na elementa rnı jevy. Je jedina pr ıźniva moz nost, a to, z e padla s estka. Kdyz vıḿe, z e padlo sude c ıślo, tak vs echny moz nosti jsou tr i (dvojka, c tyr ka, s estka). Tedy podle vzorce (2) pro vy poc et klasicke pravde podobnosti P(A B) = 1. Kdyz jej zevs eobecnıḿe, pak z vıćero podobny ch pr ıḱladu dostaneme 3 na sledujıćı vzorec: P(A B) = P(A B) P(B), pokud P(B) > 0. (5) Pravděpodobnost průniku A B dvou jevu je po u prave vzorce (5) rovna P(A B) = P(B) P(A B) a stejne tak P(A B) = P(B A) = P(A) P(B A) ⁷ Napr ıḱlad pravde podobnost kolize za jake hokoliv poc ası coby nepodmıńe na pravde podonost a pravde podobnost kolize podmıńe na vy skytem na ledı.

28 Nezávislost dvou jevů A, B. Jestliz e pro dva jevy platı pak r ıḱa me, z e jev A nenı za visly na jevu B. P(A B) = P(A) nebo P(B) = 0 Jestliz e je jev A neza visly na jevu B, pak je take jev B neza visly na jevu A. R ıḱa me, z e jevy A a B jsou vzájemně nezávislé. Jsou-li jevy A a B vza jemne neza visle, pak platı : P( A B) = P( A), P(A B) = P(A), P( A B) = P( A) Take mu z eme r ıći, z e dva jevy A a B jsou vza jemne neza visle pra ve tehdy, kdyz P(A B) = P(A) P(B) (6) Příklad: Podle informacı spra vce s kolnı poc ı tac ove sı te vıḿe, z e be hem sta provoznıćh hodin je poc ı tac ova sı ť v průměru nedostupna : 6 minut v du sledku vy padku serveru (kdy server nereaguje na poz adavky klientu ) a 2 minuty v du sledku poruchy (odstavenı ) elektricke rozvodne sı te 230 V (nefungujı pr ıṕojne body sı te ). Serveru se to nety ka, protoz e nepr etrz ity zdroj napa jenı UPS udrz ı server v provozu neza visle na stavu rozvodne elektricke sı te minima lne 10 minut. Urc ete pravde podobnost, z e v dany okamz ik (konkre tnı minutu) nebudeme moci vyuz ı vat s kolnı poc ı tac ovou sı ť v du sledku jejı nedostupnosti.

29 Řešení: Nejdr ı ve si oznac ıḿe jednotlive jevy: V Vy padek serveru E odstavenı rozvodne Elektricke sı te 230 V Jev oznac ujıćı skutec nost, z e se nebudeme moci pr ipojit do s kolnı poc ı tac ove sı te, ať jiz pro vy padek serveru nebo pro pr erus enı doda vky elektricke energie, je vlastne sjednocenıḿ uvedeny ch jevu. Tedy se pta me, jaka je pravde podobnost P(V E) =? Pravde podobnosti uvedeny ch jevu (po pr evedenı na spolec ne jednotky minuty) jsou na sledujıćı : P(V) = 6 minut ze sta hodin = = 0,001 P(E) = 2 minuty ze sta hodin = = 0,000 3 P(V E) = P(V) + P(E) P(V E) /dr ı ve uvedena vlastnost pravde podobnosti/ Zby va na m tedy urc it pravde podobnost P(V E). Jinak r ec eno: Zajıḿa na s, jaka je pravde podobnost, z e rozvodna elektricka sı ť bude odstavena pra ve v okamz iku (ve stejne minute ), kdy je server nedostupny v du sledku jeho vy padku. Tedy, kdy oba jevy nastoupı spolec ne (souc asne pru nik jevu ). Protoz e jevy V a E jsou vza jemne neza visle (doda vka elektricke energie nenı podmıńe na stavem serveru) podle vzorce (6) platı : P(V E) = P(V) P(E) = 0,001 0,000 3 = 0, A konec ne : P(V E) = 0, , , , ,001 = 0,1 % V dany okamz ik nebudeme moci vyuz ı vat s kolnı poc ı tac ovou sı ť s pravde podobnostı rovnou desetine procenta ⁸. ⁸ V praxi, pokud se nejedna o bezpečnost jaderné elektrárny, lety do kosmu apod. je vy poc et pravde podobnosti s pr esnostı na desetiny procenta naprosto dostac ujıćı.

30 Úplná pravděpodobnost Pokud nesluc itelne jevy H, H,, H vypln ujı celý za kladnı prostor jevu (jevove pole), pak pro libovolny jev A platı P(A) = P(H ) P(A H ) (7) coz cha peme tak, z e za kladnı prostor je rozde len mezi takzvane hypote zy H a sledovany jev A (jeho c a st) mu z e nastat spolec ne vz dy jen s jedinou z nich (obra zek pr evzat z [4]). U pravou vzorce (7) dosta va me na sledujıćı Bayesova věta Pokud nesluc itelne jevy H, H,, H vypln ujı celý za kladnı prostor jevu (jevove pole), pak pro libovolny jev A platı P(H A) = P(H ) P(A H ) P(A) Bayesu v vzorec pouz ı va me tehdy, chceme-li z vy skytu jevu A pr i realizaci pokusu odhadnout, jak se jednotlive hypote zy podıĺely na vy skytu jevu A. Pravde podobnosti P(H ), i = 1, 2,, n, nazy va me apriorními pravde podobnostmi jevu H, tj. pravde podobnostmi uskutec ne nı hypote zy H pr ed pokusem. Pravde podobnosti P(H A), i = 1, 2,, n, nazy va me aposteriorními pravde podobnostmi jevu H, tj. pravde podobnostmi uskutec ne nı hypote zy H po provedenı pokusu, pr i ne mz jev A nastal. Mu z eme tedy r ıći, z e tento vzorec na m umoz n uje da vat pozde js ı (aposteriornı ) zkus enosti do souladu s pu vodnıḿi (apriornıḿi) pr edpoklady, pr ıṕadne jak takove zkus enosti zme nı souc asne hodnocenı situace oproti pu vodnıḿ pr edpokladu m. Vyuz itı Bayesova vzorce naznac ıḿe na pr ıḱladu z medicıńske praxe. [14, str.193] (8)

31 Pr edstavme si pacienta, ktery urc ite trpı jednou z nemocı A c i B. Na za klade dosavadnıćh znalostı (anamne za, klinicky stav, ) vıḿe, z e nemoc A se vyskytuje s pravde podobnostı 0,8; nemoc B s pravde podobnostı 0,2. Le kar nechal u pacienta prove st zkous ku enzymu v se ru, o nıź vıḿe, z e u nemoci A je pozitivnı v 90 % pr ıṕadu a u nemoci B jen ve 20 % pr ıṕadu. Tento test me l negativnı vy sledek. Jak je tıḿ ovlivne na le kar ova diagno za tohoto pacienta? Jak v takovy ch pr ıṕadech postupovat, ukazuje nebo na sledujıćı dva pr ıḱlady. Doporuc uji pr ec ıśt take rozbor Monty Hallova proble mu na Wikipedii. Je samozr ejme, z e take pro Bayesu v vzorec platı, z e za ve ry nemohou mı t pru kazne js ı vypovı dacı schopnost, nez jim pr edpoklady (premisy) dovolı. Vy sledek nemu z e by t spolehlive js ı nez odhadovane pravde podobnosti pr edpokladu. V praxi je to vs ak bohuz el c asto tak, z e pro apriornı pravde podobnost jsou k dispozici jen zcela nespolehlive odhady nebo dokonce protichu dne u daje. Příklad 1. [5, Pr ıḱlad , str. 30] Pr i automaticke m vymy va nı lahvı je dobr e vymyty ch 98 % z nich. Po vymytı se vs echny la hve jes te kontrolujı v automaticke prohlıź ec ce, ktera propustı 3 % s patne vymyty ch lahvı a vra tı k nove mu promytı 5 % dobr e vymyty ch lahvı. Kolik procent lahvı se znovu vymy va? P(láhev neprošla kontrolou) =? A kolik procent lahvı, z te ch co nepros ly kontrolou, bylo dobr e vymyto? P(láhev byla dobře vymyta přestože neprošla kontrolou) =?

32 Řešení: Pr i popisu vy sledku pokusu (vymývání láhve a kontrolu vymytí dohromady) pouz ijeme na sledujıćı oznac enı : V la hev je dokonale vymyta ; P kontrola vymytou la hev propustı. Dals ı pr ıṕady popıś eme pomocı opac ny ch jevu, kde jev V znac ı, z e la hev nebyla dobr e vymyta a P oznac uje, z e kontrola la hev nepropustı a vra tı ji k nove mu vymytı. Je zr ejme, z e jevy V a V vypln ujı cely za kladnı prostor jevu. Nic jine ho, nez z e la hev je dobr e nebo nenı dobr e vymyta, nemu z e nastat. Podle pr edchozı ho znac enı tedy ma me i = 2 a H = V, H = V. Vs e je nejleps ı zaznamena vat do pr ehledne ho sche matu, kde na pomyslne spojnici mezi jednotlivy mi jevy (zleva doprava) budeme vypisovat pravde podobnosti, s jaky mi nastal jev vpravo. A tohle bylo zada no: jednotliva láhev P(V) = 0,98 P( V) = 0,02 V vymytá dokonale P(V) + P( V) = 1 V nevymyta dokonale špatně vymytá P(P V) = 0,95 P( P V) = 0,05 P(P V) = 0,03 P(P V) = 0,97 P propuštěna P(P V) + P( P V) = 1 P nepropus te na vrácena P propuštěna P(P V) + P( P V) = 1 P nepropus te na Protoz e souc et pravde podobnostı musı by t jedna vrácena Pak je vra ceno P( P ) = P(V) P( P V) + P( V) P( P V) = 0,98 0,05 + 0,02 0,97 = 0,068 4,

33 Řešení: Pr i popisu vy sledku pokusu (vymývání láhve a kontrolu vymytí dohromady) pouz ijeme na sledujıćı oznac enı : V la hev je dokonale vymyta ; P kontrola vymytou la hev propustı. Dals ı pr ıṕady popıś eme pomocı opac ny ch jevu, kde jev V znac ı, z e la hev nebyla dobr e vymyta a P oznac uje, z e kontrola la hev nepropustı a vra tı ji k nove mu vymytı. Je zr ejme, z e jevy V a V vypln ujı cely za kladnı prostor jevu. Nic jine ho, nez z e la hev je dobr e nebo nenı dobr e vymyta, nemu z e nastat. Podle pr edchozı ho znac enı tedy ma me i = 2 a H = V, H = V. Vs e je nejleps ı zaznamena vat do pr ehledne ho sche matu, kde na pomyslne spojnici mezi jednotlivy mi jevy (zleva doprava) budeme vypisovat pravde podobnosti, s jaky mi nastal jev vpravo. A tohle bylo zada no: jednotliva láhev P(V) = 0,98 P( V) = 0,02 V vymytá dokonale P(V) + P( V) = 1 V nevymyta dokonale špatně vymytá P(P V) = 0,95 P( P V) = 0,05 P(P V) = 0,03 P(P V) = 0,97 P propuštěna P(P V) + P( P V) = 1 P nepropus te na vrácena P propuštěna P(P V) + P( P V) = 1 P nepropus te na Protoz e souc et pravde podobnostı musı by t jedna vrácena Pak je vra ceno P( P ) = P(V) P( P V) + P( V) P( P V) = 0,98 0,05 + 0,02 0,97 = 0,068 4,

34 Řešení: Pr i popisu vy sledku pokusu (vymývání láhve a kontrolu vymytí dohromady) pouz ijeme na sledujıćı oznac enı : V la hev je dokonale vymyta ; P kontrola vymytou la hev propustı. Dals ı pr ıṕady popıś eme pomocı opac ny ch jevu, kde jev V znac ı, z e la hev nebyla dobr e vymyta a P oznac uje, z e kontrola la hev nepropustı a vra tı ji k nove mu vymytı. Je zr ejme, z e jevy V a V vypln ujı cely za kladnı prostor jevu. Nic jine ho, nez z e la hev je dobr e nebo nenı dobr e vymyta, nemu z e nastat. Podle pr edchozı ho znac enı tedy ma me i = 2 a H = V, H = V. Vs e je nejleps ı zaznamena vat do pr ehledne ho sche matu, kde na pomyslne spojnici mezi jednotlivy mi jevy (zleva doprava) budeme vypisovat pravde podobnosti, s jaky mi nastal jev vpravo. A tohle bylo zada no: jednotliva láhev P(V) = 0,98 P( V) = 0,02 V vymytá dokonale P(V) + P( V) = 1 V nevymyta dokonale špatně vymytá P(P V) = 0,95 P( P V) = 0,05 P(P V) = 0,03 P(P V) = 0,97 P propuštěna P(P V) + P( P V) = 1 P nepropus te na vrácena P propuštěna P(P V) + P( P V) = 1 P nepropus te na Protoz e souc et pravde podobnostı musı by t jedna vrácena Pak je vra ceno P( P ) = P(V) P( P V) + P( V) P( P V) = 0,98 0,05 + 0,02 0,97 = 0,068 4

35 Řešení: Pr i popisu vy sledku pokusu (vymývání láhve a kontrolu vymytí dohromady) pouz ijeme na sledujıćı oznac enı : V la hev je dokonale vymyta ; P kontrola vymytou la hev propustı. Dals ı pr ıṕady popıś eme pomocı opac ny ch jevu, kde jev V znac ı, z e la hev nebyla dobr e vymyta a P oznac uje, z e kontrola la hev nepropustı a vra tı ji k nove mu vymytı. Je zr ejme, z e jevy V a V vypln ujı cely za kladnı prostor jevu. Nic jine ho, nez z e la hev je dobr e nebo nenı dobr e vymyta, nemu z e nastat. Podle pr edchozı ho znac enı tedy ma me i = 2 a H = V, H = V. Vs e je nejleps ı zaznamena vat do pr ehledne ho sche matu, kde na pomyslne spojnici mezi jednotlivy mi jevy (zleva doprava) budeme vypisovat pravde podobnosti, s jaky mi nastal jev vpravo. A tohle bylo zada no: jednotliva láhev P(V) = 0,98 P( V) = 0,02 V vymytá dokonale P(V) + P( V) = 1 V nevymyta dokonale špatně vymytá P(P V) = 0,95 P( P V) = 0,05 P(P V) = 0,03 P(P V) = 0,97 P propuštěna P(P V) + P( P V) = 1 P nepropus te na vrácena P propuštěna P(P V) + P( P V) = 1 P nepropus te na Protoz e souc et pravde podobnostı musı by t jedna vrácena Pak je vra ceno P( P ) = P(V) P( P V) + P( V) P( P V) = 0,98 0,05 + 0,02 0,97 = 0,068 4

36 coz znamena, z e asi necely ch sedm procent (6,84 %) lahvı se znovu vymy va. A kolik procent lahvı, z te ch co nepros ly kontrolou, bylo dobr e vymyto? Tedy: P(la hev byla dobr e vymyta za podmıńky, z e nepros la kontrolou) =? To urc ıḿe podle Bayesova vzorce (8) P(V P ) = P(V) P( P V) = P( P ) 0,98 0,05 0,068 4 = 0,716, coz znamena, z e asi 72 % (pr esne ji 71,6) z nove vymy vany ch lahvı se vymy va zbytec ne. A protoz e v matematice (a tıḿ take v pravde podobnosti) nemu z e vy sledek za viset na pıśmenech, ktera pouz ijeme na oznac enı ne c eho, ukaz me si podobny pr ıḱlad jes te jednou. Příklad 2. Banka ma pro styk s klienty dve poboc ky, VELKOU a malou. Velka poboc ka poskytuje 70 % vs ech u ve ru te to banky a mezi jejıḿi smlouvami o poskytnutı u ve ru je 5 %, ktere byly uzavr eny s pra vnicky mi osobami. Mala poboc ka poskytuje zbytek u ve ru a z tohoto zbytku c inı smlouvy o u ve ru uzavr ene s pra vnicky mi osobami 15 %. Banka se rozhodla prove st nama tkovou kontrolu poskytnuty ch u ve ru. Pr i te to kontrole je na hodne vybra na jedna u ve rova smlouva. Urc ete pravde podobnost, z e: A) na hodne vybrana smlouva byla uzavr ena s pra vnickou osobou; B) pokud byla vybra na smlouva uzavr ena s pra vnickou osobou, pak poskytnutı tohoto u ve ru realizovala velka poboc ka.

37 Řešení: Oznac me si jevy a jejich pravde podobnosti, ktere plynou pr ıḿo ze zada nı : P P V M P(V) = 0,70 P(M) = 0,30 P(P V) = 0,05 P( P V) = 0,95 P(P M) = 0,15 P( P M) = 0,85 u ve ry banky u ve r byl poskytnut Pra vnicke osobe u ve r NEbyl poskytnut pra vnicke osobe komukoliv jine mu jak pra vnicke osobe u ve r realizovala Velka poboc ka u ve r realizovala Mala poboc ka protoz e 70 % u ve ru poskytuje velka poboc ka protoz e zbytek ( = 30) % poskytuje mala poboc ka velka poboc ka uzavr ela 5 % smluv s pra vnicky mi osobami velka poboc ka uzavr ela (100 5 = 95) % jiny ch smluv mala poboc ka uzavr ela 15 % smluv s pra vnicky mi osobami mala poboc ka uzavr ela ( = 85) % jiny ch smluv P(V) = 0,7 velka poboc ka P(M) = 0,3 mala poboc ka P(P V) = 0,05 sml. s pra vnickou osobou P( P V) = 0,95 jina smlouva P(P M) = 0,15 sml. s pra vnickou osobou P( P M) = 0,85 jina smlouva A) Urc ete pravde podobnost, z e na hodne vybrana smlouva byla uzavr ena s pra vnickou osobou, v nas ı symbolice P(P ) =? Kdyz projdeme vs echny cesty (v grafu) na jejichz konci je jev P, hodnoty v každé z cest (smlouvy jedne poboc ky) mezi sebou násobíme (plyne z upravene ho vztahu (5) na pravde podobnost pru niku /spolec ne nastoupenı / jevu ) P(A B) = P(A B) P(B) a hodnoty cely ch cest mezi sebou sečítáme (plyne z pravde podobnosti sjednocenı jevu ) P(A B) = P(A) + P(B) P(A B),

38 dosta va me vzorec (7) na u plnou pravde podobnost (protoz e jevy V a M vypln ujı cely za kladnı prostor dals ı poboc ku banka nema ). Jevy V a M jsou vza jemne nesluc itelne (jednu smlouvu nemohly uzavr ı t obe poboc ky spolec ne ) P(V} {M) = 0 P(P V} {P M) = 0 P(P ) = P(P V} {P M) = P(P V) + P(P M) P(P V} {P M) = = P(P V) + P(P M) 0 = P(P V) P(V) + P(P M) P(M) = 0,05 0,7 + 0,15 0,3 = 0,08 Na hodne vybrana smlouva bude s pravde podobnostı 8 % uzavr ena s pra vnickou osobou. Nebo jinak r ec eno: Ze sta na hodne vybrany ch smluv jich osm bude pravde podobne uzavr eno s pra vnickou osobou. B) Byla vybra na smlouva uzavr ena s pra vnickou osobou. Urc ete (aposteriornı ) pravde podobnost, z e poskytnutı tohoto u ve ru realizovala velka poboc ka, v nas ı symbolice P(V P ) =? Podle Bayesova vzorce (8) P(V P ) = P(V) P(P V) P(P ) = 0,7 0,05 0,08 = 0,035 0,08 = 0,437 5 S pravde podobnostı te me r 44 % na hodne vybranou smlouvu s pra vnickou osobou uzavıŕala velka poboc ka. Nebo jinak: Nejpravde podobne ji c tyr icet c tyr i smluv uzavr eny ch s pra vnickou osobou (ze sta na hodne vybrany ch smluv) bylo realizova no na velke poboc ce.

39 3. Náhodné veličiny 3.1. Základní pojmy Az doposud jsme se zaby vali ota zkou, zda pr i uvaz ovane m pokusu nastanou c i nenastanou urc ite jevy a jak lze vypoc ı tat jejich pravde podobnost. Avs ak ve ve ts ine pokusu se jejich vy sledky vyjadr ujı c ıśly, jejichz hodnoty za visı na na hode. Napr ıḱlad: vy s ka muz u v populaci, poc et obdrz eny ch bodu pr i zkous ce, spotr eba pohonny ch hmot pr i ujetı 100 km, poc et nemocny ch, kter ı pr ijdou k le kar i be hem dne, doba bezporuchove funkce pr ıśtroje, poc et za sahu pr i str elbe do terc e, skutec na cena postavene ho domu, atd. Velic iny, ktere vy sledku m pokusu jednoznac ne pr ir azujı rea lna c ıśla a jejichz hodnoty za visı na na hode, se nazy vajı náhodné veličiny. Pravde podobnost, z e na hodna velic ina X nabyla hodnoty x tedy nastal jev, ktery oznac ujeme {X = x} zapıś eme P(X = x). Sestavıḿe-li seznam vs ech moz ny ch dvojic [x ; P(X = x )], nazveme ho rozdělením pravděpodobnosti (jake hodnoty a s jakou pravde podobnostı mu z e na hodna velic ina naby vat).

40 Na hodne velic iny se tradic ne oznac ujı velky mi pıśmeny latinske abecedy, napr ıḱlad X, Y, T a podobne. Hodnoty na hodny ch velic in jsou (rea lna ) c ıśla pr ir azena urc ity m zpu sobem vy sledku m uvaz ovane ho pokusu. My se budeme zaby vat na hodny mi velic inami pouze te chto typu : Diskrétního typu jejichz oborem hodnot jsou izolovane body (napr ıḱlad poc et vy robku ). Spojitého typu jejichz oborem hodnot jsou hodnoty z ne jake ho intervalu, pr ic emz kaz dy bod z tohoto intervalu ma nulovou pravde podobnost (napr ıḱlad vzda lenost, teplota). Mimo vy s e uvedeny ch typu na hodny ch velic in existujı jes te dals ı typy (zejme na na hodna velic ina smíšeného typu, jejıź hodnoty vytvor ı jisty interval, pr ic emz ne ktery bod z tohoto intervalu ma nenulovou pravde podobnost), te mi se vs ak zaby vat nebudeme. Na hodna velic ina tedy naby va pr i dane m pokusu urc ite hodnoty, pr ic emz pr edem nevıḿe, jaka hodnota to bude. Jestliz e ale provedeme ve ts ı poc et te chto pokusu, pak lze pozorovat, z e vy skyty jednotlivy ch hodnot na hodne velic iny vykazujı jiste za konitosti, (jejı pravde podobnost je ne jak rozde lena), coz lze popsat pomocı tak zvany ch zákonů rozdělení pravde podobnosti. Ty urc ujı pravde podobnosti, s jaky mi na hodna prome nna nabude urc itou hodnotu nebo ne jake hodnoty z urc ite ho intervalu. Nejobecne js ıḿ z te chto za konu rozde lenı je distribuc nı funkce Distribuční funkcí F(x) na hodne velic iny X nazy va me (rea lnou) funkci, pro kterou platı F(x) = P(X x). (9) Distribuc nı funkce F(x) tedy vyjadr uje pravde podobnost, s jakou na hodna velic ina X nabude hodnot z intervalu ( ; x.

41 Příklad: Znac ı -li na hodna velic ina X vy s ku (v cm) muz u v populaci, pak hodnota F(170) = 0,45 uda va, z e asi 45 % muz u v populaci ma vy s ku do 170 cm vc etne. Vlastnos distribuční funkce F(x) na hodne velic iny X F(x) 1 2. Distribuc nı funkce je neklesajıćı funkcı pro kaz da dve rea lna c ıśla x < x platı : F(x ) F(x ) 3. Distribuc nı funkce je spojita zprava pro kaz de rea lne c ıślo x platı : lim F(x + h) = F(x) 4. lim F(x) = 0 a lim F(x) = 1 Poznamenejme, z e tyto vlastnosti plne distribuc nı funkci ⁹ charakterizujı. Ne kdy se distribuc nı funkce deinuje jako pravde podobnost, z e na hodna velic ina X nabude hodnot ostře menších než x, tj. F(x) = P(X < x) ¹⁰. Pak se uvedene vlastnosti distribuc nı funkce az na tr etı vlastnost nezme nı. V pr ıṕade, z e pr ipous tıḿe rovnost, je funkce F(x) spojita zleva. Poznámka: Pravde podobnost, z e na hodna velic ina X nabude ne ktere hodnoty z intervalu x ; x ), lze urc it na sledovne : P(x < X x ) = F(x ) F(x ). (10) ⁹ Inverznı funkce k distribuc nı funkci se nazy va kvantilová funkce a znac ı se Q = F. Kvantil x je velic ina pro kterou platı F(x ) = p. Napr ıḱlad x, je 95% kvantil, tedy takova hodnota, pro kterou je distribuc nı funkce rovna 0,95 a kterou na hodna velic ina pr ekroc ı s 5% pravde podobnostı. ¹⁰ My pr ipous tıḿe rovnost zejme na kvu li analogii s kumulativnı c etnosti c ıśelne ho statisticke ho znaku.

42 Náhodné veličiny diskrétního typu Ne kdy zkra cene r ıḱa me jen diskrétní náhodné veličiny. Jak jsme jiz dr ı ve uvedli, jejich oborem hodnot jsou izolovane body. Toto sice nenı exaktnı deinice, ale na m plne postac uje. Pravděpodobnostní funkcí f(x) diskrétní na hodne velic iny X nazy va me (rea lnou) funkci, pro kterou platı f(x ) = P(X = x ). Casto pr i za pisu pravde podobnostnı funkce symbol f(x ) vynecha va me a tuto funkci oznac ujeme pouze P(X = x). Cıśla P(X = x ) jsou hodnoty pravde podobnostnı funkce. Jejich vy znam je v tom, z e kolem nich kolıśajı relativnı c etnosti hodnot na hodne velic iny X, vypoc tene ze se riı pokusu. Pro pravde podobnostnı funkci platı : 1. 0 P(X = x) 1, protoz e pravde podobnost naby va hodnot pouze z intervalu 0 ; 1 2. Pro vs echny ostatnı rea lna c ıśla x, nepatřící do oboru hodnot velic iny X, je pravde podobnostnı funkce rovna nule. 3. P(X = x ) = 1, pro vs echna x z oboru hodnot na hodne velic iny X. Ze vztahu (9) vyply va, z e Distribuční funkci diskrétní na hodne velic iny X lze pro kaz de rea lne c ıślo x vyja dr it pr edpisem F(x) = P(X = x ), (11)

43 ktery vyjadr uje, z e sc ı ta me pravde podobnosti P(X = x ) ve vs ech bodech x, lez ıćıćh v intervalu ( ; x. Spojenıḿ vzorcu (10) a (11) dosta va me P(X J) = P(X = x ), (12) coz vyjadr uje: pravde podobnost, z e diskre tnı na hodna velic ina X nabude ne ktere hodnoty z intervalu J urc ıḿe tak, z e sec teme pravde podobnosti P(X = x ) disjunktnı jevu {X = x }, kde body x lez ı v intervalu J. Distribuc nı funkci diskre tnı na hodne velic iny lze zna zornit stupn ovitou funkcı, majıćı v bodech x skoky o velikostech P(X = x ). Mimo te chto bodu naby va konstantnıćh hodnot. Zna me-li hodnoty distribuc nı funkce, pak hodnoty pravde podobnostnı funkce jsou rovny velikostem skoku distribuc nı funkce. Příklad: Sportovnı str elec ma tr i na boje. Na terc vystr elı postupne tr ikra t, pr ic emz str elbu ukonc ı buď za sahem terc e (pr i ne mz je terc znic en a on nema na CO str ıĺet) nebo spotr ebova nıḿ vs ech na boju (jiz nema CIM str ıĺet). Pravde podobnost za sahu prvnıḿ vy str elem je 0,6 a po kaz de m vy str elu se zvy s ı o 0,1 (tak zvane se zastr eluje). Jake jsou za kony rozde lenı pro poc et zbyly ch na boju? Řešení: Pokus je postupna str elba na terc konc ıćı prvnıḿ za sahem nebo spotr ebova nıḿ vs ech na boju. Jevy, ktere pr i pokusu mohou nastat uvedeme pro pr ehlednost v na sledujıćı tabulce. Vyja dr ıḿe je pomocı elementa rnıćh jevu Z (pruhem nad pıśmenem budeme tak jako dr ı ve oznac ovat opac ny jev).

44 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

45 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

46 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

47 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

48 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

49 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

50 Jevy z pravd. P(X = z) F(z) Z Z Z 0 0,024 0,12 0,12 Z Z Z 0 0,096 Z Z 1 0,28 0,28 0,4 Z 2 0,6 0, jev Z : terc je Zasaz en vy str elem s por adovy m c ıślem i (i = 1, 2, 3), jev Z : terc není zasaz en vy str elem s por adovy m c ıślem i. Do druhe ho sloupce tabulky (oznac eny m pıśmenem z) zapıś eme poc et zbyly ch (nespotr ebovany ch) na boju. Dle zada nı : P(Z ) = 0,6, P(Z ) = 0,7, P(Z ) = 0,8. Potom P( Z ) = 0,4, P( Z ) = 0,3, P( Z ) = 0,2 a P({ Z Z Z }) = P( Z ) P( Z ) P( Z ) protoz e jde o neza visle jevy (to jestli str elec druhy m vy str elem terc zasa hne, nenı ovlivne no jeho prvnıḿ vy str elem, ) Vs imne te si, z e kdyz na hodna velic ina X pr ir azuje vy sledku m pokusu tote z c ıślo, je hodnota pravde podobnostnı funkce v tomto c ıśle rovna souc tu pravde podobnostı te chto vy sledku. Ukaz me si ne ktere vy sledky z tabulky: Hodnota P(X = 2) = 0,6 r ıḱa, z e pokud by se tento pokus opakoval vícekrát, tak asi v 60 % te chto pokusu zu stanou str elci dva na boje. Cıślo F(0) = P(X 0) = 0,12 znac ı, z e asi ve 12 % te chto pokusu zu stane str elci z a dny a me ne tedy z a dny na boj. Z tabulky lze zıśkat i dals ı informace. Tr eba pravde podobnost, z e str elci zu stane alespon jeden (jeden nebo dva) na boj. Tento jev oznac ıḿe {X 1} a jeho pravde podobnost vypoc teme podle vzorce (12), kdy: P(X 1) = P(X = 1) + P(X = 2) = 0,28 + 0,6 = 0,88. To znac ı, z e asi v 88 % pokusu zu stane str elci aspon jeden na boj.

51 Jestliz e se da le zajıḿa me o to, kolik procent z pokusu, v nichz zbyl str elci alespon jeden na boj, pr ipada na jev, z e str elci zu stane pra ve jeden na boj, pak tyto pravde podobnosti vypoc teme pomocı vzorce (5) pro podmıńe nou pravde podobnost. P(X = 1 X 1) = P({X = 1} {X 1}) P(X 1) = P(X = 1) P(X 1) = 0,28 0,88 0,318, coz lze interpretovat takto: V te ch pokusech, v nichz zbyl str elci alespon jeden na boj, je asi 31,8 % pokusu, v nichz mu zbyl pra ve jeden na boj. Náhodné veličiny spojitého typu Ne kdy zkra cene r ıḱa me jen spojité náhodné veličiny mohou (jak jsme uvedli na zac a tku kapitoly) naby vat libovolny ch hodnot z dane ho intervalu. Toto sice take nenı exaktnı deinice (stejne jako v pr ıṕade diskre tnı na hodne velic iny), ale na m ope t plne postac uje. Take u spojite na hodne velic iny se uz ı va k jejıḿu popisu distribuční funkce F(x), kterou jsme zavedli vzorcem (9) a na sledne odvodili vzorec (10) pro vy poc et pravde podobnosti, z e na hodna velic ina X nabude ne jake hodnoty z dane ho intervalu. A protoz e spojita na hodna velic ina mu z e naby vat libovolne ( spojita ) hodnoty (na rozdıĺ od diskre tnı velic iny, ktera mu z e naby vat jen ne ktery ch izolovany ch hodnot), mu z eme take uvaz ovany interval sta le zmens ovat, az bude mı t nekonečně malou s ıŕ ku ( limita). Tedy vzorec (10) mu z eme take psa t: lim P(x < X x + h) = lim[f(x + h) F(x)] Pokud dane limity budeme vyc ıślovat pro h 0, tak se leva strana rovnice bude blıź it k na sledujıćı pravde podobnosti P(x < X x + h) P(X = x) a prava strana rovnice se bude blıź it k nule:

52 F(x + h) F(x) 0 (pro h 0). Tedy z toho plyne, z e P(X = x) = 0 coz odpovı da skutec nosti, z e oborem hodnot spojity ch na hodny ch velic in je ne jaky interval, pr ic emz kaz dy bod z tohoto intervalu ma nulovou pravde podobnost ¹¹. Proto nema smysl poc ı tat u spojite na hodne velic iny pravde podobnostnı funkci, kterou jsme zavedli u diskre tnıćh na hodny ch velic in, ale na za klade pravde podobnostnı funkce zava dıḿe jinou funkci, kterou nazy va me hustota pravděpodobnosti ¹² nebo take ne kdy frekvenční funkce. Hustota pravděpodobnos spojité na hodne velic iny X na intervalu a; b je na sledujıćı funkce: f(x) = lim P(x < X x + h) h = F (x) kde pro x a; b je f(x) = 0; x, x + h a; b. F(x) je distribuc nı funkce na hodne velic iny X, a ¹¹ Neznamena to vs ak, z e na hodna velic ina X nemu z e hodnotu x nikdy dosa hnout. Ale je to matematicke vystiz enı faktu, z e hodnot, ktery ch na hodna velic ina X naby t mu z e, je tak velke mnoz stvı, z e pravděpodobnost, z e nabyde pra ve jednu, konke tne vybranou, je příliš nepatrná, v limitě nulová. ¹² Protoz e hustotu pravde podobnosti zava dıḿe jako na sledujıćı (specia lnı ) limitu, ktera se nazy va (jak vıḿe z kurzu o diferencia lnıḿ poc tu) derivace distribuc nı funkce, mu z e se sta t, z e pro ne kterou hodnotu x je hodnota hustoty ve ts ı jak jedna: f(x) > 1. Uvedena limita vs ak z a dnou pravde podobnost nevyjadr uje. Vždy ale bude hustota pravde podobnosti nezáporná (0 f(x), x), protoz e distribuc nı funkce je neklesajıćı (viz jejı druha vlastnost).

53 Distribuční funkci u spojite na hodne velic iny urc ujeme analogicky jako u diskre tnı na hodne velic iny, kde jsme pouz ı vali vzorec (11). Pouze si musıḿe uve domit, z e nynı mıśto pravde podobnostnı funkce P(X = x) ma me k dispozici hustotu pravde podobnosti f(x) a (sumou) vlastne sc ı ta me nekonečně mnoho nekonečně malých velic in, coz vede na na sledujıćı integra l ¹³: Distribuční funkce spojité na hodne velic iny X je na sledujıćı (primitivnı ) funkce F(x) = kde f(t) je hustotou pravde podobnosti te to na hodne velic iny. f(t) dt (13) Spojenıḿ vzorcu (10) a (13) dosta va me vzorec pro vy poc et pravde podobnosti, kdy spojita na hodna velic ina X nabude ne ktere hodnoty z intervalu J = x ; x (J = (x ; x ), J = x ; x ), J = (x ; x ) P(X J) = f(x)dx = F(x ) F(x ). (14) Z vlastnostı integra lu plyne, z e vu bec neza lez ı na tom, zda je interval J uzavr eny, otevr eny nebo polootevr eny. Protoz e hustotu pravde podobnosti f(x) v bode x zıśka me z distribuc nı funkce F(x) jejı derivacı, f(x) = F (x) (15) ¹³ Pr i prakticke m vy poc tu se dolnı mez nahrazuje skutec nou dolnı mezı, od ktere je na hodna velic ina X deinova na.

54 spoc ı va vy znam hustoty pravde podobnosti v tom, z e vyjadr uje velikost okamz ite zme ny distribuc nı funkce v dane m bode, tedy okamz itou velikost na ru stu (c i poklesu) pravde podobnosti v tomto bode. Nebo jes te jinak jak hustě jsou ostatnı hodnoty na hodne velic iny X rozmıśte ny okolo tohoto bodu. Jako pr ıḱlad uveďme na hodnou velic inu X, ktera oznac uje vy s ku na hodne vybrane ho muz e v populaci Ceske republiky. Pokud bychom rozde lili vs echny tyto muz e podle jejich vy s ek do intervalu po deseti centimetrech, pak do kaz de ho z te chto intervalu padne velmi mnoho muz u, ale v intervalu (180 cm ; 190 cm) jich bude podstatne vıće jak napr ıḱlad v intervalu (140 cm ; 150 cm). Hustota pravde podobnosti u spojite na hodne velic iny je analogicka pravde podobnostnı funkci u diskre tnı na hodne velic iny. Ovs em teď to jiz nejsou izolovane body, ale na ne jake m intervalu spojita kr ivka. Podobne i distribuc nı funkce jiz nebude rozkouskovana. Hustota pravde podobnosti spojite na hodne velic iny Distribuc nı funkce spojite na hodne velic iny Mu z eme take r ıći, z e na hodna velic ina je spojita, pokud ma spojitou distribuc nı funkci.

55 4. Číselné charakterisky náhodných veličin Distribuc nı funkce F(x) s pravde podobnostnı funkcı P(X = x) (u spojite na hodne velic iny je to hustota pravde podobnosti) popisujı rozde lenı pravde podobnostı hodnot pr ıślus ne diskre tnı na hodne velic iny X vyc erpa vajıćıḿ zpu sobem. Tyto funkce jsou vs ak c asto pome rne sloz ite a jejich urc enı pracne. Proto je ne kdy vy hodne shrnout celkovou informaci o na hodne velic ine do ne kolika c ıśel, ktera charakterizujı dals ı jejı vlastnosti a umoz n ujı srovna va nı ru zny ch na hodny ch velic in. Tato c ıśla se nazy vajı charakteristikami náhodné veličiny. Obra zek 2: Rozde lenı spojity ch na hodny ch prome nny ch, ktere se odlis ujı polohou variabilitou (rozpty lenıḿ) šikmostí My si uvedeme pouze str ednı hodnotu, rozptyl a sme rodatnou odchylku. Dals ı charakteristiky, ktere charakterizujı podrobne js ı vlastnosti na hodne velic iny (napr ıḱlad koeicient s ikmosti a koeicient s pic atosti) uva de t nebudeme.

56 Střední hodnota E(X) (take oc eka vana hodnota, expected value) je pro diskre tnı na hodnou prome nnou deinova na vztahem a pro spojitou na hodnou prome nnou vztahem E(X) = x P(X = x ) (16) E(X) = Pr edpokla da me, z e jak suma tak integra l konvergujı. x f(x)dx Str ednı hodnota charakterizuje polohu hodnot na hodne prome nne, podobne jako aritmeticky pru me r ve statistice nebo te z is te ve fyzice. Str ednı hodnotu si mu z eme pr edstavit jako pomyslny str ed oboru hodnot na hodne velic iny X, kolem ktere ho kolıśajı jednotlive hodnoty te to velic iny. Vlastnos střední hodnoty E(X) (pokud uvedene str ednı hodnoty existujı ) pro libovolne konstanty a, b, c a na hodne velic iny X a Y jsou tyto: 1. E(a) = a 2. E(b X ± c Y) = b E(X) ± c E(Y) 3. E(X Y) = E(X) E(Y), pokud jsou X a Y nezávislé. V na sledujıćıḿ pr ıḱladu uka z eme uz itec nost znalosti vy poc tu str ednı hodnoty v hazardnı hr e.

57 Příklad Hra c vsadı c a stku a korun na uc ite c ıślo na hracı kostce. Jinak r ec eno zvolı si jedno c ıślo z na sledujıćıćh s esti: {1, 2, 3, 4, 5, 6}. Pote banke r hodı tři kostky. Jestliz e vsazene c ıślo nepadne na z a dne kostce, vklad propada. Kdyz vsazene c ıślo padne na r kostka ch, pak hra c dostane výhru (r a) korun a vsazenou částku zpět. Je tato hra pro hra c e vy hodna? Řešení: Hod kostkou povaz ujeme za pokus. Padne-li na prvnı kostce vsazene c ıślo, pak tento jev, ktery oznac ıḿe A (na druhe B a na tr etı C), ma pravde podobnost. Hod tr emi kostkami, pokud se prova dı regule rne, povaz ujeme za Bernoulliovu posloupnost neza visly ch pokusu, kde n = 3. Oznac ıḿe-li D jev, z e pr i hodu tr emi kostkami je na k kostka ch vsazene c ıślo (k = 0, 1, 2, 3), lze pravde podobnost tohoto jevu oznac enou P(D ) spoc ı tat pomocı vzorce (4). Jevy D (sloz ene z elementa rnıćh jevu A, B, C) a jejich pravde podobnosti P(D ) jsou v prvnıćh dvou sloupcıćh na sledujıćı tabulky. Na hodnou velic inou X (jejı jednotlive moz ne hodnoty x ) oznac me c a stku, kterou hra c po kaz de hr e obdrz ı. Jejı hodnoty pr ir azene vy sledku m pokusu D napıś eme do tr etı ho sloupce. V pr ıṕade prohry nic (nula), v pr ıṕade, z e uhodne, tak vy hru a vklad. Ve c tvrte m sloupci jsou hodnoty pravde podobnosti P(X = x ) na hodne velic iny X, ktere odpovı dajı pravde podobnosti vy sledku m pr ıślus ny ch jevu. Podle vzorce (16) je str ednı hodnota E(X) = a rovna souc tu hodnot v poslednıḿ sloupci. Jako krite rium vy hodnosti hry lze vzı t rozdıĺ mezi str ednı hodnotou vyplaceny ch c a stek a vsazenou c a stkou a. Podle tohoto krite ria dostaneme: E(X) a = 199a a 0, a. 216 Protoz e rozdıĺ mezi str ednı hodnotou vyplaceny ch c a stek a vsazenou c a stkou a je pr ibliz ne je tato hra pro hra c e nevy hodna (ale pro banke r e je naopak vy hodna ), protoz e ze vsazene c a stky

58 k D P(D ) x P(X = x ) x P(X = x ) 1 D = A B C 0 a D = A B C 3 1 a + a 3 D = A B C 3 2 a + a 4 D = A B C 3 a + a 0 = 0 2a = 3a = 4a = ma by t 1 vy hra + vklad 1 Poznámka: V prvnıḿ sloupci tabulky jsme pro pr ehlednost zapsali pouze D = A B C, ale spra vne by me lo by t D = (A B C) ( A B C) ( A B C), protoz e vsazene c ıślo mohlo padnout na prvnı kostce, ale take mohlo padnout na druhe kostce a take mohlo padnout na tr etı. Podobne pro jev D. Proto jsou pr ıślus ne pravde podobnosti na sobene trojkou. v kaz de hr e (usuzujeme z hodnoty E(X) v pru me ru pr i mnoha opakova nıćh) ztra cı hra c pru - me rne necely ch 8 % sve ho vkladu.

59 Rozptyl D(X) (take variance var(x) c i disperze) zavedeme jako D(X) = E{[X E(X)] }. Z vlastnostı str ednı hodnoty plyne: Pro diskre tnı na hodnou prome nnou pak platı D(X) = E(X ) [E(X)]. (17) D(X) = [x E(x)] P(X = x ) = x P(X = x ) [E(X)] a pro spojitou na hodnou prome nnou platı D(X) = [x E(x)] f(x)dx = x f(x)dx [E(X)] Pr edpokla da me, z e jak sumy tak integra ly konvergujı. Rozptyl vyjadr uje, jak mnoho jsou hodnoty na hodne prome nne rozpty leny kolem str ednı hodnoty. Rozptyl vycha zı v kvadraticky ch jednotka ch, pr ic emz zvy razn uje extre my (va hu te ch bodu, ktere jsou vıće vzda leny od str ednı hodnoty). Abychom srovnali tyto jednotky, poc ı ta me jes te charakteristiku zvanou sme rodatna odchylka. Ta ma jednotky shodne s jednotkami E(X). Směrodatná odchylka σ(x) je deinova na jako druha odmocnina z rozptylu. σ(x) = D(X)

60 5. Používaná rozdělení náhodných veličin 5.1. Opakování již dříve uvedených pojmů Souhrn vs ech hodnot, ktery ch na hodna velic ina mu z e naby vat, se nazy va obor hodnot náhodné veličiny. Ne ktere na hodne velic iny naby vajı pouze izolovany ch hodnot (napr ıḱlad vy sledek hodu kostkou). Takovou na hodnou velic inu nazy va me diskrétní. Jindy tvor ı obor hodnot na hodne velic iny ne jaky c ıśelny interval (napr ıḱlad kurs koruny vu c i euru). V takove m pr ıṕade hovor ıḿe o spojité na hodne velic ine. O diskre tnı i spojite na hodne velic ine jsme jiz mluvili, ale opakova nı vu bec nenı na s kodu. Chceme-li popsat chova nı na hodne velic iny, nestac ı pouze uve st obor hodnot, ktery ch mu z e naby vat. Ne ktere hodnoty z oboru se totiz mohou vyskytovat s ve ts ı, jine s mens ı pravde podobnostı. Pravidlo, ktery m se tato pravde podobnost r ı dı, se nazy va zákon rozdělení (rozloz enı ) na hodne velic iny. Zákon rozdělení je vlastne pravidlo (funkce, pr edpis), ktere kaz de hodnote (nebo skupine hodnot) z oboru hodnot na hodne velic iny pr ir azuje pravde podobnost jejich vy skytu. V konkre tnı statisticke praxi se vycha zı z toho, z e velke skupiny na hodny ch pokusu majı stejne pravde podobnostnı chova nı, ktere za visı na jejich charakteru. Probereme nynı postupne ne ktere typy rozde lenı pravde podobnosti, ktere majı na hodne velic iny, popisujıćı v jiste m smyslu analogicke na hodne pokusy. Na pr ıḱladech budeme vz dy ilustrovat za kladnı situace Diskrétní náhodná veličina některá její rozdělení Za kon rozde lenı diskrétní na hodne velic iny X lze nejjednodus eji vyja dr it pomocı pravde podobnostnı funkce, o ktere jsme jiz mluvili. Druhou moz nostı, jak vyja dr it rozloz enı pravde podobnosti diskre tnı na hodne velic iny X, je pomocı distribuc nı funkce F(x), coz jsme si jiz take r ıḱali.

61 Binomické rozdělení Binomicke rozde lenı ma na hodna velic ina X, ktera pr edstavuje k vy skytu dane ho jevu v posloupnosti n neza visly ch pokusu, pr ic emz p je pravde podobnost (sta le stejna ) nastoupenı dane ho jevu v jedine m pokusu. Jeho pravděpodobnostní funkce je da na (viz vzorec (4)) vztahem a charakteristiky jsou P(X = k) = n k p (1 p) (18) E(X) = n p D(X) = n p (1 p) (19) Binomicke rozde lenı si mu z eme pr edstavit jako DVOU hodnotové tedy dany jev buď nastal, nebo dany jev nenastal. Nic jine ho nepr icha zı v u vahu. Binomicke se nazy va proto, z e hodnoty funkce P(X = k) urc ene podle vzorce (18) jsou c leny v binomicke m rozvoji vy razu [p + (1 p)]. Poznámka Protoz e jsou vy poc ty hodnot ( ) p (1 p) pro velka n a k poc etne znac ne na roc ne, lze k jejich vy poc tu m pouz ı t poc ı tac ove programy (napr. Excel 2010), pr ıṕadne lze pro velmi velky rozsah pokusu (n je v r a du stovek a vıć) toto rozde lenı dıḱy centra lnı limitnı ve te aproximovat norma lnıḿ rozde lenıḿ N(E; D), o ktere m bude r ec da le. Příklad skripta [4, c ıślo 23]. V krabici jsou dve zelene a tr i c erne koule. Na hodne vybereme jednu, zjistıḿe jejı barvu a vrátíme kouli do krabice. Toto provedeme jes te dvakra t. Na hodna velic ina X pr edstavuje poc et vybrany ch c erny ch koulı.

62 Příklad. Je pravde podobne js ı vyhra t v tenise se stejne silny m souper em tři zápasy ze čtyř nebo je pravde podobne js ı vyhra t šest zápasů z osmi? Řešení: Tenisove za pasy jsou vlastne opakovane neza visle pokusy. Mohou nastat pouze dva vy sledky v jednom utka nı : buďto vyhrajeme nebo prohrajeme. Hrajeme-li se stejne silny m souper em, je pravde podobnost vy hry v kaz de m za pase p = 0,5. V jine m za pase je zase 0,5 neme nı se. Tedy na hodna velic ina X, ktera urc uje poc et vyhrany ch za pasu ma binomicke rozde lenı. 3 ze 4 Do vzorce (18): P(X = k) = ( ) p (1 p) dosadıḿe k = 3, n = 4 a p = 0,5. P(X = 3) = 4 3 0,5 (1 0,5) = 4! 3! (4 3)! 0,5 0,5 = 4 3! 3! 1 0,5 = 4 0,062 5 = 0,25 6 z 8 Do vzorce (18) dosadıḿe k = 6, n = 8 a p = 0,5. P(X = 6) = 8 6 8! 0,5 (1 0,5) = 6! (8 6)! 0,5 0,5 = 8 7 6! 0,5 = 0, ! 2! Je tedy pravde podobne js ı zvı te zit ve tr ech za pasech ze c tyr. V praxi se ale mimo pr ıṕadu kdy mu z eme rozhodnout naprosto pr esne, kolikra t dany jev nastal a kolikra t dany jev nenastal (Napr ıḱlad: Danou kr iz ovatkou za dany c as projelo a automobilu se spalovacıḿ motorem. Jestliz e b z nich me lo benzıńovy motor, pak a b me lo jiny typ motoru: naftový, na LPG, na vodík, ) vyskytujı take pr ıṕady typu: Pr i bour ce bylo XYZ blesku a kolik blesku NEBYLO? V sobotu se v porodnici narodilo ZYX de tı a kolik se jich NENARODILO? atd. V te chto pr ıṕadech nemu z eme binomicke rozde lenı pouz ı t. Proto jsou zna ma i jina rozde lenı pravde podobnosti (napr ıḱlad Poissonovo), nez my si uva dıḿe.

63 Hypergeometrické rozdělení kontrola jakos Hypergeometricke rozde lenı ma na hodna velic ina X, ktera pr edstavuje poc et k prvku s vlastnostı A ve skupine n prvku vybrany ch z mnoz iny N prvku, z nichz M ma vlastnost A. Jeho pravděpodobnostní funkce je da na vztahem P(X = k) = M M N k n k N n (20) a charakteristiky jsou E(X) = n M N D(X) = n M N 1 M N n N N 1 Hypergeometricke rozde lenı (ne kdy pouz ı va me i termıń statisticky vy be r bez opakova nı ) se pouz ı va napr ıḱlad ve statisticke kontrole jakosti (hlavne pr i zkouma nı jakosti male ho poc tu vy robku, nebo kdyz kontrola ma charakter destrukc nı zkous ky pr i kontrole je vy robek znic en) a jako pravde podobnostnı model ne ktery ch her (napr. Sportka apod.). A protoz e nema smysl kontrolovat jeden vy robek tr ikra t (vy be r bez opakova nı ), jde vlastne o to, z e na hodne vybrane prvky urc ene ke kontrole nevracıḿe zpe t do za kladnı ho souboru, ktery je tvor en vs emi vy robky. Jednotlive pokusy jsou pak za visle (pravde podobnost vy skytu vlastnosti A v urc ite m pokusu za visı na vy sledcıćh v pr edcha zejıćıćh pokusech).

64 Poznámka Jestliz e rozsah N je velky a n a M/N se neme nı, blıź ı se hypergeometricke rozde lenı binomicke mu. To znamena, z e pro velka N mu z eme zanedbat rozdıĺ mezi vy be rem bez vracenı a s vracenıḿ. V praxi se rozhodujeme podle hodnoty tak zvane ho výběrového poměru (n/n). Je-li tento pome r mens ı nez 0,05, lze hypergeometricke rozde lenı nahradit binomicky m s parametry n a p = M/N. Příklad skripta [4, c ıślo 24]. Mezi devı ti (N) z a rovkami urc eny mi k pevnostnıḿ zkous ka m jsou tr i (M) niz s ı jakosti, ktere zkous ky nevydrz ı. Tedy ostatnı (N M) z a rovky by pevnostnı zkous ky me ly vydrz et. Jaka je pravde podobnost, z e mezi c tyr mi (n) na hodne vybrany mi z a rovkami nebude z a dna (k) niz s ı jakosti? Vraťme se nynı (o jednu kapitolu moudr ejs ı ) ope t k pr edchozıḿu pr ıḱladu c. 23 ktery jsme r es ili v souvislosti s binomicky m rozde lenıḿ a uvaz ujme jej ve dvou modiikacıćh (pone kud upravıḿe zada nı ve skriptech): Příklad skripta [4, c ıślo 23]. V krabici jsou dve zelene a tr i c erne koule. Na hodne vybereme jednu, zjistıḿe jejı barvu a: 1. vrátíme ji do krabice X ma binomicke rozde lenı ; 2. NEvrátíme ji do krabice X ma hypergeometricke rozde lenı. Toto provedeme jes te dvakra t. Na hodna velic ina X pr edstavuje poc et vybrany ch c erny ch koulı.

65 5.3. Spojitá náhodná veličina některá její rozdělení Normální rozdělení Norma lnı rozde lenı N(μ, σ ) ma na hodna velic ina X, jejıź kolıśa nı je zpu sobeno mnoha drobny mi neza visly mi vlivy, z nichz z a dny samostatne nenı vy znamny. Jeho hustota pravděpodobnosti je da na vztahem f(x) = 1 σ 2π () e kde < x < a charakteristiky jsou E(X) = μ D(X) = σ Norma lnı rozde lenı ¹⁴ majı mnohe na hodne velic iny procentove zme ny v cena ch akciı na dobr e fungujıćıćh trzıćh, devizove vy platnı pome ry me n, chyby me r enı, rozme ry vy robku pr i hromadne vy robe, rozptyl pr i str elbe a mnohe jevy ve fyzice, v biologii, v medicıńe. Obecne lze r ıći, z e je pouz itelne vs ude tam, kde hodnoty na hodne velic iny jsou ovlivne ny pu sobenıḿ velke ho poc tu nepatrny ch, vza jemne neza visly ch nebo slabe za visly ch na hodny ch vlivu. Graf funkce f(x) popisujıćı hustotu pravde podobnosti norma lnı ho rozde lenı se nazy va Gaussova kr ivka ¹⁵ (Gaussu v klobouk, zvonova funkce, angl. bell curve ). Je charakteristicka tıḿ, z e: ¹⁴ Neznamena to, z e by ostatnı rozde lenı byla nenormální c i abnormální. Na zev pouze vyjadr uje skutec nost, z e vs echny soubory o velke m rozsahu, ktere byly zkouma ny v dobe, kdy se tento na zev ujal, me ly (alespon pr ibliz ne ) toto rozde lenı (soubory o mens ıćh rozsazıćh se tehdy nezkoumaly). Bylo proto pr irozene ( normální ) oc eka vat, z e i dals ı v budoucnu studovane soubory budou mı ti toto rozde lenı. ¹⁵ V roce 1733 uver ejnil Abraham de Moivre spisek, ve ktere popsal rovnici te to kr ivky. Kr ivka (i jejı rovnice) upadla v zapomenutı a byla znovuobjevena jako kr ivka chyb Laplaceem (se za porny mi chybami se vypor a dal pomocı absolutnı hodnoty) a Gaussem (za porne zname nko u chyb odstranil umocne nıḿ na druhou) [14, str ].

66 je symetricka kolem svisle pr ıḿky procha zejıćı bodem μ v ne mz ma funkce f(x) globa lnı (absolutnı ) maximum; ve vzda lenostech σ vlevo a vpravo od bodu μ ma funkce f(x) inlexnı body; tec ny funkce f(x) sestrojene v bodech μ ± σ protıńajı vodorovnou osu v bodech μ ± 2 σ; ve vzda lenostech 3 σ se funkce f(x) te me r doty ka vodorovne osy. Gaussova kr ivka Parametr σ uda va horizonta lnı vzda lenost inlexnıćh bodu od str ednı hodnoty a tıḿ i šířku křivky.

67 Pro norma lnı rozde lenı platı pravidlo tří sigma, kdy do intervalu μ 3 σ; μ + 3 σ padne pr ibliz ne 99,7 % vs ech hodnot na hodne prome nne X. Tedy v uvedene m intervalu 3 σ (3 σ na kaz dou stranu od str ednı hodnoty tento interval ma de lku rovnu 6 σ, proto se ne kdy mu z ete setkat i s jeho oznac ova nıḿ s est sigma ) jsou prakticky vs echny hodnoty tohoto rozde lenı. Toto pravidlo 3σ je jednıḿ ze za kladnıćh principu, na nichz stojı kontrola kvality a jakosti (SPC Statisitics Process Control, ISO normy pro SPC). Navıć: do intervalu μ 2 σ; μ + 2 σ padne pr ibliz ne 95 % hodnot a do intervalu μ σ; μ + σ pr ibliz ne 68,3 % hodnot. Norma lnı rozde lenı je nejdu lez ite js ıḿ rozde lenıḿ spojite na hodne prome nne. Jeho vy znam zvys uje to, z e se jıḿ dajı (za urc ity ch podmıńek) aproximovat i jina rozde lenı, ať spojite c i diskre tnı na hodne prome nne (napr ıḱlad binomicke, chı kvadra t, Poissonovo, Studentovo). Jak jste si vs imli, doposud jsme neuvedli distribuc nı funkci norma lnı ho rozde lenı, ktery z to integra l neumıḿe analyticky vypoc ı tat. Pokud si vzpomene na aplikace urc ite ho integra lu, ktere byly probıŕa ny ve druhe m semetru v pr edme tu Matematika 2, tak urc ity m integra lem urc ujeme velikost rovinne plochy (ve vedlejs ıḿ obra zku vybarvene ialove ) ohranic ene zdola souřadnou osou x, shora hustotou pravděpodobnosti f(t), zprava hodnotou x a vlevo jde plocha az do mıńus nekonec na. F(x) = f(t) dt

68 A proc se tolik zajıḿa me o hodnotu distribuc nı funkce? Protoz e pomocı nı a podle vzorce (14) doka z eme urc it pravde podobnost, z e na hodna prome nna X patr ı do ne jake ho intervalu. Napr ıḱlad P(μ 3 σ < X < μ + 3 σ) = (x μ) 1 σ 2π e 2σ dx = F(μ + 3 σ) F(μ 3 σ) 0,997 coz je pravidlo tří sigma, ktere jsme uvedli na pr edchozı strane. Numericky vy poc et integra lu uvedene ho v pr edchozıḿ pr ıḱladu by va souc a stı nejru zne js ıćh poc ı tac ovy ch programu. A pro specia lnı pr ıṕad norma lnı ho rozloz enı s nulovou str ednı hodnotou (μ = 0) a sme rodatnou odchylkou rovnou jedne (σ = 1) /takove rozde lenı se nazy va normované/ existujı statisticke tabulky hodnot. Zavedeme-li substituci u =, ktera uda va o kolik směrodatných odchylek je hodnota x vzdálena od střední hodnoty, pr evedeme libovolne norma lnı rozde lenı na normovane, jehoz distribuc nı funkci oznac ujeme F (u) nebo Φ(u). Příklad. Pro norma lnı rozde lenı s parametry μ = 84,4 a σ = 36 poz adujeme najı t hodnotu distribuc nı funkce v c ıśle 77,5. Jinak r ec eno: F(77,5) = P(X 77,5) =? Postup si uka z eme jak pomocı tabulek, tak i pomocı poc ı tac ove ho (tabulkove ho) programu. 1. Stascké tabulky. F,, F ( 0, ) 1 F (0,192) 1 0, , Programové vybavení. V tabulkove m programu Excel 2010 irmy Microsoft do r a dku vzorcu zada me hodnoty: =NORM.DIST(x;μ;σ;PRAVDA)

69 Jes te pohodlne ji nalezneme hodnotu distribuc nı funkce F(x) norma lnı ho rozde lenı pomocı nabı dky funkcı Příklad skripta [4, c ıślo 28]. Obsah ampulky s le kem je na hodnou velic inou s rozde lenıḿ N(10; 0,1 ) v cm. Ve ts ina jevu v pr ıŕode (bohuz el ne tak docela automaticky ve spolec ensky ch ve da ch) ma toto norma l- nı rozloz enı. Na strome je nejme ne hodne maly ch lıśtku. S pr iby vajıćı velikostı stromovy ch listu jejich frekvence naru sta a dosa hne maxima u listu str ednı velikosti. Kdyz velikost listu pr ekroc ı pru me rnou hodnotu, jejich c etnost uby va a ope t, jako tomu bylo s nejmens ıḿi lıśtky, nejme ne bude te ch nejve ts ıćh stromovy ch listu. Podobne rozloz enı (distribuci) i kdyz ne tak soustavne objevıḿe i u r ady socia lnıćh jevu : vy s e pr ı jmu, poc et de tı v rodine, le ta s kolnı ho vzde la nı, Ne kdy by va norma lnı rozde lenı take oznac ova no jako zákon chyb.

70 Rovnoměrné rozdělení Rovnome rne rozde lenı na intervalu a; b ma na hodna velic ina X, jejıź hodnota je u me rna de lce podintervalu, do ne hoz ma padnout a neza visı na umıśte nı podintervalu v intervalu a; b. Jeho hustota pravděpodobnosti je da na vztahem a charakteristiky jsou f(x) = 1 b a E(X) = a + b 2 kde D(X) = a < x < b (b a) 12 Jde o rozde lenı, jehoz hustota pravde podobnosti je konstantnı na ne jake m intervalu a; b a vs ude jinde je nulova. Kr ivka popisujıćı hustotu pravde podobnosti je na intervalu a; b u sec ka rovnobe z na s osou x. Rovnome rne rozde lenı popisuje napr ıḱlad chyby pr i zaokrouhlova nı c ıśel, doby c eka nı na uskutec ne nı jevu opakujıćı ho se v pravidelny ch c asovy ch intervalech apod. Příklad skripta [4, c ıślo 25]. Tramvaje pr ijıź de jı do zasta vky ve 12 minutovy ch intervalech. Doba c eka nı na pr ı jezd tramvaje je na hodna prome nna X.

71 Exponenciální rozdělení Exponencia lnı rozde lenı E(A; σ) ma na hodna velic ina X, ktera pr edstavuje dobu, be hem nıź nastane sledovany jev. Jeho hustota pravděpodobnosti je da na vztahem f(x) = 1 e σ pro x > A 0 jinak (21) a charakteristiky jsou E(X) = A + σ D(X) = σ Exponencia lnı rozde lenı ma s irokou pouz itelnost, zejme na v teorii hromadne obsluhy (teorie front) ¹⁶, v teorii spolehlivosti, v teorii obnovy atd. Na hodnou velic inou X by va obvykle doba, be hem nıź nastane sledovany jev (napr ıḱlad porucha pr ıśtroje, pr ıćhod za kaznıḱa do opravny, atd.). Cıślo A znac ı poc a tec nı ¹⁶ Pr ıćhod cestujıćı ho v dany c as na zasta vku MHD lze povaz ovat za na hodnou velic inu, ktera ma exponencia lnı rozde lenı. Zpoc a tku to vypada tak, z e autobusy (trolejbusy, tramvaje) jezdı podle jıźdnı ho r a du a na jednotlivy ch zasta vka ch pr icha zejı na hodne rozde leni cestujıćı jednou kra tce ne kolik po sobe a pak urc itou dobu zase nikdo. Teď k tomu pr istoupı dals ı se rie na hodny ch jevu. Napr.: hustota provozu, pove trnostnı podmıńky (v mlze se asi jezdı pomaleji), Pozde ji se zpoc a tku neza visle jevy stanou navza jem za visly mi a mu z eme se dostat do na sledujıćı spira ly. Napr.: autobus zu stane sta t na c ervenou a tıḿ pr iby va c ekajıćıćh na nejbliz s ı zasta vce. Jejich odbavenı (na stup a pozde ji i vy stup) trva de le, doby sta nı autobusu v zasta vce jsou nadpru me rne, jıźdnı r a d jiz nelze dodrz et, na dals ıćh zasta vka ch se nahromadı jes te vıće c ekajıćıćh cestujıćıćh atd. A co s tím? Zme nıḿe napr ıś te jıźdnı r a d, nasadıḿe autobusy disponujıćı s irs ıḿi (pr ıṕadne vıćero) dver mi, nasadıḿe velkokapacitnı autobusy, nebo vıće autobusu bude jezdit v krats ıćh intervalech,?

72 dobu, az do ktere sledovany jev nastat nemu z e. Parametr A se c asto interpretuje jako parametr posunutí rozde lenı na ose x. Parametr σ se ne kdy nazy va parametr měřítka a jeho pr evra cena hodnota = λ se ne kdy nazy va (pru me rna ) rychlost výskytu dane uda losti. V ne ktery ch pr ıṕadech (napr ıḱlad c eka nı na poruchu zar ıźenı ) ma na hodna velic ina X vy znam doby z ivota zkoumane ho zar ıźenı, pr ic emz je bez pame ti, neboť platı : Pravde podobnost toho, z e jev X nastane po ne jake dobe je stejna, jako by se do te doby nic nede lo. Exponencia lnı rozde lenı je z te chto du vodu vhodne k popisu rozde lenı doby z ivota te ch zar ıźenı, u nichz docha zı k porus e ze zcela na hodny ch (vne js ıćh) pr ıć in, nikoliv napr ıḱlad vlivem sta rnutı materia lu. Doby z ivota mnohy ch strojnıćh souc a stı a jiny ch zar ıźenı zvla s te takovy ch, u nichz se projevuje mechanicke opotr ebova nı a u nava materia lu majı Weibullovo rozde lenı (s pame tı ), ktery m se take nebudeme zaby vat. Příklad skripta [4, c ıślo 29]. Doba do poruchy zar ıźenı se r ı dı exponencia lnıḿ rozde lenıḿ se str ednı hodnotou 8 hodin. Intenzita poruch Modelujeme-li dobu do vy skytu uda losti (z ivotnost, dobu do poruchy, dobu do na vratu onemocne nı, dobu do pr ıćhodu za kaznıḱa apod.), pouz ı va me krome hustoty pravde podobnosti a distribuc nı funkce take funkci zna mou pod na zvem intenzita poruch (hazardnı funkce, angl. hazard function ).

73 Intenzitu poruch λ(t) zava dıḿe pro neza pornou na hodnou velic inu X se spojity m rozde lenıḿ popsany m distribuc nı funkcı F(t), kde F(t) 1 t (tedy F(t) < 1) takto: λ(t) = F (t) 1 F(t) Pr edstavuje-li na hodna velic ina X dobu do poruchy ne jake ho zar ıźenı, pak pravde podobnost, z e pokud do c asu t nedos lo k z a dne porus e, tak k nı dojde v na sledujıćıḿ kra tke m u seku de lky Δt, je pr ibliz ne rovna λ(t) Δt. Specia lne pro na hodnou prome nnou s exponenciálním rozdělením, jejıź hustota pravde podobnosti je da na vztahem (21) platı, z e (22) λ(t) = 1 σ = konstanta, pro t > A, coz jednodus e ove r ıḿe tak, z e vztah (21 popisuje funkci hustoty) dosadıḿe do vztahu (22 platı pro distribuc nı funkci) za vyuz itı vzorcu (15) a (13): λ(t) = f(t) 1 f(x) dx = 1 e σ 1 1 e dx σ = 1 e σ 1 + e = 1 e σ 1 + e e = 1 e σ 1 + e 1 = 1 σ Ma -li doba do vy skytu uda losti exponencia lnı rozde lenı, pak je intenzita poruch konstantnı. Coz mimo jine znamena, z e nenı za visla na de lce pr edcha zejıćı ho provozu sledovane ho syste mu. Tedy jsme skutec ne opra vne ni, tak jako na pr edchozı strane, tvrdit, z e c eka nı na poruchu zar ıźenı je rozde lenı bez pame ti.

74 Pokud bychom skutec ne sledovali c etnost poruch ne jake ho druhu vy robku, nejspıś e by zakreslena kr ivka intenzity poruch me la tr i c a sti: I. V prvnıḿ u seku kr ivka intenzity poruch klesa. Odpovı dajıćı c asovy interval se nazy va období časných poruch (obdobı za be hu, poc a tec nı ho provozu, osvojova nı, de tsky ch nemocı ). Pr ıć inou zvy s ene intenzity poruch v tomto obdobı jsou poruchy v du sledku vy robnıćh vad, nespra vne monta z e, chyb pr i na vrhu, pr i vy robe apod. II. Ve druhe m u seku docha zı k be z ne mu vyuz ı va nı zabe hnute ho vy robku, k porucha m docha zı ve ts inou z vne js ıćh pr ıć in, nedocha zı k opotr ebenı, ktere by zme nilo funkc nı vlastnosti vy robku. Pr ıślus ny c asovy interval se nazy va období normálního užití, c i obdobı stabilnı ho z ivota. Intenzita poruch je v tomto období přibližně konstantní. III. Ve tr etıḿ u seku procesy sta rnutı a opotr ebenı me nı funkc nı vlastnosti vy robku, projevujı se nastr a dane otr esy vy robku z obdobı II, trhliny materia lu a intenzita poruch vzru sta. Pr ıślus ny c asovy interval se nazy va období poruch v důsledku stárnutí a opotřebení. Intenzitu poruch modelujeme v jednotlivy ch u secıćh ve ts inou pomocı ru zny ch rozde lenı. Pouze ve druhe m u seku pouz ı va me v te to kapitole probıŕane exponencia lnı rozde lenı. A pouze v tomto druhe m u seku jde o rozde lenı bez pame ti. A to jes te ne u vs ech druhu vy robku. Jiz zmin ovane Weibullovo rozde lenı je obecne js ı nez exponencia lnı rozde lenı a proto je mnohem lexibilne js ı. Umoz n uje tak modelovat dobu do vy skytu uda losti i u syste mu, ktere jsou v I. obdobı c asny ch poruch nebo ve III. obdobı sta rnutı (tedy tam, kde se projevuje mechanicke opotr ebenı nebo u nava materia lu). Exponencia lnı rozde lenı je specia lnıḿ typem Weibullova rozde lenı.

75 6. Náhodné vektory Az doposud jsme se zaby vali na hodnou velic inou, ktera vy sledku pokusu pr ir azovala jedno rea lne c ıślo. Jestliz e je vy sledek pokusu vyja dr en ne kolika rea lny mi c ıśly, za visly mi na na hode, cha peme tato c ıśla jako hodnoty jiste ho syste mu na hodny ch velic in a pouz ı va me pro ne pojem náhodný vektor. Uveďme pr ıḱlady na hodny ch vektoru : vy s ka X, hmotnost X, ve k X a inteligenc nı kvocient X muz e ve tr ı de pr edstavujı sloz ky na hodne ho vektoru X = (X ; X ; X ; X ); doba zame stna nı X a vy s ka platu Y zame stnancu dane ho podniku jsou sloz ky na hodne ho vektoru Z = (X; Y); zna mka X, kterou student zıśkal z matematiky v prvnıḿ semestru a zna mka X, kterou student zıśkal z matematiky ve druhe m semestru jsou sloz ky na hodne ho vektoru Y = (X ; X ). u daje zaznamena vane meteorologickou sondou (výška; tlak; teplota; rosný bod). Jednotlive na hodne velic iny v ra mci na hodne ho vektoru mohou by t naprosto neza visle (napr ıḱlad ve k X a inteligenc nı kvocient X v prvnıḿ pr ıḱladu), mohou vs ak take mı t silnou vazbu (napr ıḱlad výška a tlak v poslednıḿ pr ıḱladu). Pro jednoduchost se v na sledujıćıḿ omezıḿe na dvousloz kovy na hodny vektor. (simulta nnı distribuc nı funkce) na hodny ch velic in X a Y je vyja dr ena vzta- Sdružená distribuční funkce hem F(x, y) = P(X x; Y y)

76 Sdruz ena distribuc nı funkce ¹⁷ ma obdobne vlastnosti jako distribuc nı funkce jedne prome nne 1. 0 F(x, y) 1 2. Distribuc nı funkce je neklesajıćı funkcı v kaz de prome nne. 3. Distribuc nı funkce je spojita zprava v kaz de prome nne. 4. lim F(x, y) = 0 a lim F(x, y) = 1,, Chceme-li urc it distribuc nı funkci sloz ky X (pr ıṕadne sloz ky Y) na hodne ho vektoru, mluvıḿe o Marginální distribuční funkci ktera ma tvar F (x) = P(X x; Y libovolne ) = lim F(x, y) F (y) = P(X libovolne ; Y y) = lim F(x, y) Z tohoto vyja dr enı da le plyne, z e v pr ıṕade diskre tnı ho na hodne ho vektoru s pravde podobnostnı funkci P(x ; y ) mu z eme zıśkat na sledujıćı vztahy pro marginální pravděpodobnosti P (x) = P(X = x; Y = y ) P (y) = P(X = x ; Y = y) ¹⁷ Poznamenejme, z e ve vy razu P(X x; Y y) se podle tradice pouz ı va str ednıḱ (c a rka) ve vy znamu pru niku jevu. Spra vne js ı je tedy za pis: P({X x} {Y y}) nebo P((X x) (Y y))

77 Obdobne pro spojity na hodny vektor s hustotou f(x, y) zıśka me vztahy pro margina lnı hustoty pravde podobnosti f (x) = f (y) = f(x, y)dy f(x, y)dx Konngenční (korelační) tabulka V pr ıṕade diskre tnı ho dvousloz kove ho na hodne ho vektoru s konec ny m poc tem hodnot se sdruz ena pravde podobnostnı funkce c asto prezentuje prostr ednictvıḿ kontingenc nı tabulky ¹⁸ (viz na sledujıćı pr ıḱlad). V te to tabulce se mimo sdruz ene pravde podobnostnı funkce (uprostr ed tabulky) rovne z uva dı v poslednıḿ r a dku a v poslednıḿ sloupci margina lnı pravde podobnostnı funkce. Ve statistice takovou tabulku ne kdy nazy va me korelac nı. [3, str. 121] ¹⁸ Slovo kontingenge se do statistiky dostalo pr es anglic tinu z latiny [14, str. 310] znamena te me r doslova setkání, spojení. V takove tabulce se tedy zaznamena vajı vy sledky, ktere vycha zejı ze spojenı dvou r ad znaku.

78 Číselné charakterisky náhodného vektoru Pokud bychom si jednotlive vs ıḿali pouze sloz ek na hodne ho vektoru, pak pro každou složku jiz umı me podle vzorce (16) urc it střední hodnotu a podle vzorce (17) rozptyl. Nynı si k nim pr ida me jes te dals ı charakteristiky pouz ı vane pro stanovenı mıŕy vazby ¹⁹ mezi na hodny mi velic inami. A stejne jako u kontingenc nı tabulky se omezıḿe pouze na na hodne vektory, jejichz obe na hodne prome nne jsou diskre tnı ho typu. Margina lnı str ednı hodnoty a rozptyly popisujı pouze charakteristiky rozde lenı jednotlivy ch na hodny ch velic in, ner ıḱajı vs ak nic o te snosti vztahu mezi obe ma velic inami. K charakteristika m, ktere me r ı te snost (= mıŕu) lineární vazby mezi na hodny mi velic inami X a Y patr ı na sledujıćı dve charakteristiky: kovariance a koeicient korelace ²⁰. Zdu razne me, z e ani jedna z charakteristik me r ıćıćh te snost vazby nic ner ıḱa o vztahu příčina účinek. Jenom vypovı dajı, z e mezi te mito prome nny mi existuje tak a tak silna vazba. Potom si musı odbornıḱ v pr ıślus ne oblasti la mat hlavu, ktery du sledek je zpu soben kterou pr ıć inou. Kovariance cov(x, Y) je str ednı hodnota souc inu odchylek na hodny ch velic in X a Y od jejich str ednıćh hodnot: cov(x, Y) = E {[X E(X)] [Y E(Y)]} vlastnosti () = E(X Y) E(X) E(Y) ¹⁹ Pr edstavme si, z e me r ıḿe vy s ku X a va hu Y dospe le ho c love ka. Ze zkus enosti vıḿe, z e zhruba r ec eno: čím je někdo vyšší, tím je těžší. Ale jiste zna me i vy jimky z tohoto pravidla. Jednak malé-tlusté a take vysoké-hubené lidi. Za vislost mezi vy s kou a va hou tedy nenı pr esna funkc nı za vislost, jak ji zna me z matematiky, ale je to za vislost jine ho druhu, tzv. statistická. A pokud vy s ku a va hu vıće dospe ly ch osob zaznamena me do sour adne soustavy (osa x vy s ka, osa y va ha), kde kaz de mu c love ku odpovı da jeden bod v rovine (zde pra zdne kolec ko), mu z eme obdrz et obra zek podobny tomuto. ²⁰ Koeicient korelace (korelační koeicient) je pro me r enı te snosti vztahu mezi X a Y vhodne js ı charakteristikou nez kovariance, protoz e je jednak bezrozme rny a jednak je normova n. Platı : ρ(x, Y) 1.

79 Korelační (Pearsonův) koeficient ρ(x, Y) urc uje mıŕu (jak je silna za vislost) lineárních závislostí na hodny ch velic in X a Y. cov(x, Y) ρ(x, Y) = kde D(X) D(Y) 0, jinak ρ(x, Y) = 0. D(X) D(Y) 1 ρ(x, Y) 1 Kdyz ρ(x, Y) = 0 pak velic iny X a Y jsou nekorelovane. Ovs em mohou by t za visle (kvadraticky, exponencia lne c i jinak), pouze neleží na přímce. Kdyz ρ(x, Y) > 0, pak hovor ıḿe o kladne (pr ıḿe, pozitivnı ) korelaci; roste-li X, tak Y nejspıś e take roste. Jinak: Pro velke hodnoty X lze oc eka vat spıś e velke hodnoty Y a pro male hodnoty X lze oc eka vat spıś e male hodnoty Y. Kdyz ρ(x, Y) < 0, pak hovor ıḿe o za porne (nepr ıḿe, negativnı ) korelaci; roste-li X, tak Y naopak spıś e klesá. Pro velke hodnoty X lze oc eka vat spıś e male hodnoty Y a pro male hodnoty X lze oc eka vat spıś e velke hodnoty Y. Hodnoty ρ(x, Y) blıźke ±1 znamenajı silnou lineární závislost. Velic iny X a Y te me r lez ı na pr ıḿce. Hodnoty ρ(x, Y) blıźke 0 znamenajı slabou lineární závislost mezi velic inami X a Y. V mnoha pr ıṕadech vs ak nelze na prvnı pohled urc it, zda hodnotu korelac nı ho koeicientu uz mu - z eme povaz ovat za blıźkou 1 (nebo 1 c i 0 ) a potom je nutne vy znamnost (blízkost k ne c emu) korelac nı ho koeicientu testovat (viz kapitola o testova nı hypote z).

80 Příklad: Ha zıḿe jednou mincı třikrát po sobě. Sestavte kontingenc nı tabulku a urc ete (jednoduchy ) korelac nı koeicient (mıŕu linea rnı za vislosti) pro tyto na hodne velic iny: X poc et pokusu, nez padne prvnı RUB; Y poc et po sobe padly ch RUBu. Na hodny vektor V = (X, Y). Řešení: Ha zıḿe tr ikra t (zajıḿajı na s trojice) mincı (v jednom hodu dva moz ne vy sledky Rub Lıć), pr ic emz klidne mohou padnout dva LICe po sobe (prvky se mohou opakovat). Shrnuto: jde o skupiny trojic ze dvou prvku, ktere se mohou opakovat a pr itom za lez ı na por adı, protoz e rozlis ujeme, o jaky hod s lo. Tedy podle tabulky kombinatoricky ch skupin jde o variace tr etı tr ı dy (r = 3) ze dvou prvku (k = 2) s opakova nıḿ, proto V (2) = 2 = 8. Protoz e moz nostı nenı tak mnoho, vypis me si schematicky vs echny moz ne vy sledky tr ı hodu 3 Rub RRR; 2 Rub RRL, RLR, LRR; 1 Rub RLL, LRL, LLR; žádný Rub LLL X poc et pokusu, nez padne prvnı RUB; Y poc et po sobe padly ch RUBu. a urc eme, ktere elementa rnı jevy vyhovujı dany m hodnota m na hodny ch velic in X a Y.

81 X = 0 (jiz v prvnıḿ hodu padl RUB) RRR, RRL, RLR, RLL X = 1 (az ve druhe m hodu padl RUB) LRR, LRL X = 2 (az ve tr etıḿ hodu padl RUB) LLR X = 3 (vu bec nepadl RUB) LLL Y = 0 (vu bec nepadl RUB) LLL Y = 1 (po kaz de m RUBu nepadl dals ı RUB) RLR, RLL, LRL, LLR Y = 2 (po kaz dy ch dvou RUBech nepadl dals ı RUB) RRL, LRR Y = 3 (pokaz de padl RUB) RRR Uve domme si, z e jde o neza visle pokusy (padnutı RUBu v prvnıḿ hodu nijak neovlivnı to, co padne v hodu na sledujıćıḿ), kde p = 0,5 (pravde podobnost padnutı RUBu), mu z eme tedy podle vzorce (6) pr ıḿo spoc ı tat pravde podobnosti jednotlivy ch elementa rnıćh jevu, napr ıḱlad: P({RLR}) = 0,5 (1 0,5) 0,5 = 0,125, podobne pro vs echny ostatnı. Je zr ejme, z e všechny trojice mají stejnou pravděpodobnost. Da le napr ıḱlad: P(X = 0; Y = 1) = P({RRR, RRL, RLR, RLL} {RLR, RLL, LRL, LLR}) = P({RLR, RLL}) A protoz e elementa rnı jevy jsou navza jem nesluc itelne (kdyz padne RUB, nemu z e ve stejne m hodu za roven padnout LIC) P({RLR, RLL}) = P({RLR}) + P({RLL}) = 0, ,125 = 2 0,125 = 0,25 Nynı jiz zkonstruujeme levou kontingenc nı tabulku, do ktere vypıś eme nejdr ı ve elementa rnı jevy, ktere vyhovujı pr ıślus ny m podmıńka m. Pak do prave tabulky doplnıḿe patr ic ne pravde podobnosti.

82 Y RLR, RLL RRL RRR 1 LRL LRR X 2 LLR 3 LLL X Y P (x) 0 0 0,25 0,125 0,125 0, ,125 0, , , , , ,125 P (y) 0,125 0,5 0,25 0,125 1 Ma me urc it koeicient korelace, na ktery potr ebujeme zna t kovarianci a margina lnı vy be rove rozptyly. Pro vy poc et vy be rove ho rozptylu zase podle (17) je nutne zna t str ednı hodnoty. Napr ıḱlad pro E(X) vyuz ijeme podle (16) s ede oznac ene hodnoty v prvnıḿ a poslednıḿ sloupci prave tabulky, pro E(Y) zase z lute oznac ene hodnoty a pro E(X Y) neobarvene hodnoty v tabulce. E(X) = 0 0, , , ,125 = 0 + 0,25 + 0,25 + 0,375 = 0,875 E(Y) = 0 0, , , ,125 = 0 + 0,5 + 0,5 + 0,375 = 1,375 E(X Y) = , , , = 0,625 Pro kovarianci platı : cov(x, Y) = 0,625 0,875 1,375 = 0, Pro ostatní charakteristiky můžeme postupovat obdobně. Práci strojům! Podstatne me ne pracne je vyuz itı skutec nosti, z e ne ktere poc ı tac ove programy umı poc ı tat poz adovane charakteristiky. Pokud napr ıḱlad vy s e uvedene hodnoty (sour adnice bodu ) pr epıś eme do Excelu 2010, mu z eme si us etr it dals ı pra ci (s dosazova nı do vzorcu a jejich vyc ıślova nıḿ) a nechat funkci CORREL, ať uka z e, co umı. Levou kontingenc nı tabulku pr epıś eme do Excelu 2010 (podle na sledujıćı ho leve ho obra zku) ve tvaru, kolikra t se pr ıślus ny bod [X; Y] vyskytuje. Vidıḿe, z e [0 ; 1] je dvakra t a body [0 ; 2], [0 ; 3], [1 ; 1], [1 ; 2], [2 ; 1] a [3 ; 0] jedenkra t.

83 Na za klade hodnoty korelac nı ho koeicientu ρ 0,6 mu z eme r ıći, z e mezi na hodny mi velic inami X a Y existuje str edne silna negativnı korelace. Je tedy pravde podobne, z e s ru stem X bude Y klesat (linea rne ). Na oc eka vanou ota zku: Umí Excel 2010 počítat i další charakteristiky? existuje take oc eka vana odpove ď: UMÍ (viz vedlejs ı obra zek pro c eskou verzi Excelu 2010).

84 Příklad Zjiste te str ednı hodnotu a sme rodatnou odchylku na hodne velic iny (skripta [4, pr ıḱlad 19]), ktera popisuje poc et padly ch LICU pr i souc asne m hodu c tyr mi rozlišitelnými mincemi (skripta [4, pr ıḱlad 15]) nebo ha z eme jednou mincı c tyr ikra t po sobe. Řešení Pravde podobnost, z e padne lıć pr i hodu jednou mincı je 0, 5. Tote z platı pro rub mince. Ha z eme-li c tyr mi mincemi, musı to platit pro kaz dou z nich. Proto napr ıḱlad padnutı lıću na vs ech c tyr ech mincıćh ma pravde podobnost 0, 5 0, 5 0, 5 0, 5 = 0, Vs echny moz nosti si mu z eme sche maticky zna zornit, kdyz oznac ıḿe L jev, z e padne lıć a R jev, z e padne rub. RRLL RLRL RRRL RLLR RLLL RRLR LRRL LRLL RLRR LRLR LLRL RRRR LRRR LLRR LLLR LLLL coz mu z eme zaznamenat v na sledujıćı tabulce, kde str ednı hodnotu znac ıḿe E(X) a rozptyl D(X). Poznámka: Pokud si uve domıḿe, z e jde o binomicke rozde lenı, kde n = 4 (ha z eme c tyr mi mincemi), p = 0,5 (pravde podobnost padnutı LICE), mu z eme podle vzorce (19) pr ıḿo spoc ı tat poz adovane charakteristiky. E(X) = 4 0,5 = 2, D(X) = 4 0,5 (1 0,5) = 1. My budeme postupovat tak, jako bychom to neve de li. Alespon vıḿe, co na m ma vyjı t.

85 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X)

86 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X)

87 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X)

88 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X)

89 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X)

90 k x P(X = x ) x.p(x = x ) x E(X) [x E(X)] [x E(X)].P(X = x ) 1 0 0, , ,25 0, , ,375 0, ,25 0, , , , , E(X) D(X) (popisná) Staska Nynı vyjde me z pr edpokladu, z e na m nenı zna mo, z e vy s e uvedeny pr ıḱlad popisuje poc et padly ch líců pr i souc asne m hodu c tyr mi rozlis itelny mi mincemi. Proto ani netus ıḿe, z e by mohlo jı t o binomicke rozde lenı. Máme pouze tato sesbíraná data: Zpracování (stasckého) materiálu ktera poskla da me a zapıś eme do tabulky. Zajıḿa na s, jake charakteristiky (pr ıślus ne vzorce uvedeme v na sledujıćı kapitole) mu z eme z takto sesbıŕany ch hodnot (a zapsany ch do tabulky) zıśkat.

91 Pokud zobecnıḿe poznatky z pr edchozı ho pr ıḱladu (a take to, co jsme se dozve de li v te to kapitole o pravde podobnosti) mu z eme r ıći, z e okolo na s existuje spousta ve cı, jevu a uda lostı, ktere nelze pr edvı dat, protoz e jsou du sledkem na hody. Ota zkami na hody a na hodny ch de ju se zaby vajı dve disciplıńy: teorie pravde podobnosti a matematicka statistika. Teorie pravděpodobnos je matematicka disciplıńa, jejıź logicka struktura je budova na axiomaticky. To znamena, z e jejı za klad tvor ı ne kolik tvrzenı (tak zvany ch axiomu ), ktera vyjadr ujı za kladnı vlastnosti axiomatizovane velic iny a vs echna dals ı tvrzenı jsou z nich odvozena deduktivne. Syste m axiomu vznika abstrakcı z pozorovany ch skutec nostı rea lne ho sve ta. Axiomy se nedokazujı, povaz ujı se za prove r ene dlouhou lidskou zkus enostı. Pr edstavme si to tak, z e ma me perfektne popsán model (v minule pr ıṕade to bylo souc asne ha zenı c tyr mi rozlis itelny mi mincemi). Pta me se: Jak dopadne následující pokus hod? Kolik padne LICU? Staska (matematicka ) je naproti tomu ve da, ktera zahrnuje studium dat vykazujıćıćh na hodna kolıśa nı, ať uz jde o data zıśkana pec live pr ipraveny m pokusem provedeny m pod sta lou kontrolou experimenta lnıćh podmıńek v laborator i, c i o data provoznı. Statistika jako ve da se da le zaby va ota zkami zıśka va nı dat, jejich analy zou a formulova nıḿ za ve ru o pokusech a experimentech, nebo za ve ru pr i rozhodova nı zaloz ene m na datech. Takz e nynı ma me ne kolik (dostatek) vy sledku realizace ne jake ho de je (tolikra t padl napr ıḱlad LIC) a pta me se: Jaké vlastnosti má model, který co nejlépe popisuje daný děj? Mu z eme z dat usoudit, z e ha z eme rozlis itelny mi mincemi (za visı na por adı variace) nebo stejny mi mincemi (neza visı na por adı kombinace)? A co jes te mu z eme usoudit? Obecne se matematicka statistika snaz ı formulovat za ve ry a tvrzenı o pozorovany ch velic ina ch, ktere plynou z vy sledku pokusu, me r enı nebo pozorova nı, ktere vykazujı jiste na hodne chova nı.

92 Zatıḿco teorie pravde podobnosti usuzuje z vytvor ene ho pravde podobnostnı ho modelu zkoumane ho de je na vy sledky jeho jednotlivy ch realizacı, statistika odhaduje vlastnosti zkoumane ho de je, u ktere ho nezna me model na za klade dat, zjis te ny ch z jeho jednotlivy ch realizacı. Da vno pr ed prvnıḿi elementa rnıḿi u vahami o poc tu pravde podobnosti (hazardnı hry) a jes te pr ed prvnıḿ (statisticky m) zkouma nıḿ u daju o obyvatelstvu, byly zna my dva jevy, ktere vlastne pr edstavujı synte zu teorie pravde podobnosti a statistiky. Sázky a pozde ji loterie, kde hlavne u velky ch loteriı podnikatel (ve ts inou sta t) zprostr edkuje bez vlastnı ho rizika vyrovna nı mezi mnoz stvıḿ sa zejıćıćh. Poc etne male dıĺc ı pr ıśpe vky (sa zky, cena losu, ) jsou po sra z ce na kladu a danı odevzda ny do rukou te ch několika málo, kter ı me li s te stı. Pojištění pracuje na stejne m principu. Cetne male dıĺc ı c a stky (pojistne ) jsou po sra z ce na kladu a zisku odevzda ny te m několika málo, kdo majı dostat na hradu za utrpe nou s kodu. Jisty rozdıĺ tady ale je. Zatıḿco u loteriı se mezi vy herce rozde lı pouze tolik, kolik se vybralo (navıć ponıź ene o na klady a dane ) u pojis te nı se pr i vzniku pojistne uda losti vypla cı pr edem pevne stanovene ods kodne. Proto si musejı pojis ťovacı spolec nosti velmi dobr e rozva z it, jak velky kapita l musejı mı t k dispozici. Jen na za klade mlhavých pr edstav o c etnosti s kod, (data, ktera jsou k dispozici viz pr edchozı pr ıḱlad), mu z eme oc eka vat dva stejne nepr ı jemne omyly: Buď podcenıḿe c etnost s kod, poz adujeme nıźke pojistne, ale pr itom musıḿe v pr ıṕade s kodnı uda losti hodne vypla cet u padek irmy. Nebo z opatrnosti nasadıḿe pojistne pr ıĺis vysoko a z poc a tku vyde la va me vıće nez dost. Brzy vs ak ztratıḿe za kaznıḱy, kter ı pr ejdou ke spra vne ji kalkulujıćı a tıḿ lacine js ı konkurenci. A vystavuji se u padku v jes te ve ts ı mıŕ e, protoz e pr edpokladem fungujıćı ho pojis te nı je pokud moz no velky poc et pojis te ny ch.

93 Proto musejı pojis ťovny vıće kalkulovat nez irmy provozujıćı loterie. Snahou pojis ťoven je, co nejvıće konkretizovat svoje pr edstavy o s kodny ch uda lostech tak, aby tyto pr edstavy co nejve rne ji odpovı daly realite. A tomu na sledne pr izpu sobit svu j podnikatelsky za me r. Pr edpokladem pro vznik pojis te nı bylo pozna nı, z e jiste s kodnı uda losti se vyskytujı s pr ibliz ne odhadnutelnou c etnostı. Pak pr is el dals ı logicky krok. Kdyz vıḿe, z e v pru me ru napr ıḱlad každá desátá loď ztroskota, je moz no s kodu vyrovnat tak, z e kaz dy vlastnıḱ lodi zaplatı desetinu hodnoty (lodı a zboz ı pr i kaz de plavbe ) jako pojistne. Jiz ve c tvrte m stoletı pr ed nas ıḿ letopoc tem [14, str. 255], kdy ostrov Rhodos ovla dl lodnı plavbu ve vy chodnıḿ Str edomor ı a vytvor il poc a tky obchodnı ho a na mor nı ho pra va, vznikla prvnı u prava rozde lenı ztra ty pr i vyhazova nı zboz ı pr es palubu v pr ıṕade nebezpec ı na mor i. U prava, ktera byla pozde ji jako lex Rhodia de iactu (rho dsky za kon o odlehc ova nı lodi potopenıḿ zboz ı ) pr evzat do r ıḿske ho pra va. Uvedeny za kon se zakla dal na te to situaci. Obchodnı loď je naloz ena zboz ıḿ, ktere patr ı vıće obchodnıḱu m. Dostane se do bour e a musı se zbavit (alespon c a sti) na kladu, aby se nepotopila. Lodnı posa dka popadne, co jı pra ve pr ijde pod ruku a co se da zvla s ť snadno (nebo co je zvla s ť te z ke ) hodit pr es palubu a pokrac uje (i kdyz s pr ıṕadny mi obtıź emi) v plavbe do pr ıśtavu. Za chrana lodi, muz stva a c asto i ve ts iny zboz ı byla moz na jen za podmıńky, z e bylo obe tova no (c a st nebo vs echno) zboz ı jednoho (nebo vıće) obchodnıḱu. A me li by by t pra ve oni pos kozeni, aby ostatnı nepr is li k u jme? Lex Rhodia se iactu rozhodl tak, z e se s koda rovnome rne rozde lı na vs echny, kdo me li za jem na za chrane lodi a na kladu. Od tohoto za konem upravene ho de lenı s kody po hava rii je pouze maly krok k dobrovolne mu předchozímu placenı pojistne ho za dopravovane zboz ı. Na klady pr itom velmi podstatne klesnou, protoz e se pojistne platı i za ty lodnı pr epravy, ktere skonc ı beze ztra t. Musıḿe ale rozlis ovat dve ve ci, ktere se velmi lehce sme s ujı : matematicky objektivne oc eka vanou hodnotu (kaz da desa ta loď ztroskota ) a subjektivnı osobnı riziko (co z toho pro mne plyne, pokud to bude moje loď?).

94 U vod do Popisné statistiky

95 Obsah kapitoly: Popisná staska 1. Co je to staska? Za kladnı pojmy Číselné charakterisky stasckých souborů Charakteristiky polohy Modus, media n Aritmeticky, geometricky, harmonicky a chronologicky pru me r Charakteristiky rozptylu (variability) Rozptyl (vy be rovy ), sme rodatna odchylka Pr ıḱlad Vc etne odlehly ch (extre mnıćh) hodnot Oc is te na data Zpracování stasckého materiálu Mens ı vzorek Rozsa hly vzorek Tr ı de nı dat tabulka Dals ı sloupce tabulky Urc enı c ıśelny ch charakteristik Využi programu Excel Základy zpracování kvalitavních dat 163

96 6. Závěr kapitoly Etapy stascké práce 169

97 1. Co je to staska? Popisná statistika ²¹ by va prvnıḿ krokem k odhalenı informacı skryty ch ve velke m mnoz stvı prome nny ch a jejich variant. Statistika (jako ve dnı disciplıńa) si klade za cıĺ informace a za konitosti, ktere pr ıṕadne existujı mezi ne ktery mi hodnotami (a na poc a tku mohou by t skryty) odhalit. To znamena uspor a dat prome nne (jejich pozorovane hodnoty) do na zorne js ı formy (graf tabulka) a popsat je ne kolika ma lo hodnotami (proto prome nne podle potr eby sdruz ujeme do tr ı d viz pozna mka pod obra zkem 3), ktere by obsahovaly co nejve ts ı mnoz stvı informacı obsaz eny ch v pu vodnıḿ souboru. Nynı si na pr ıḱladu uka z eme ne ktere u lohy statistiky a pr ıśtup k jejich r es enı. Vy robce souc a stek zme nil technologii vy roby. Chce zjistit, jaka je z ivotnost souc a stek vyra be ny ch touto novou technologiı a zda se tato z ivotnost vy znamne lis ı od z ivotnosti souc a stek vyra be ny ch dr ı ve js ıḿ zpu sobem. Je zr ejme, z e nema smysl zjis ťovat z ivotnost kaz de vyrobene souc a stky. Trvalo by to jednak dlouho a po provedenı zkous ek by nebylo co proda vat. Vy robce proto volı na sledujıćı postup: Ze se rie vyra be ny ch souc a stek vybere urc ity poc et souc a stek a na takto vybrany ch souc a stka ch provede zkous ky z ivotnosti. Ze zıśkany ch hodnot z ivotnosti pak urc ı parametry, ktere nejle pe charakterizujı z ivotnost vybrane ho souboru souc a stek. Tyto charakteristiky pak slouz ı jako podklad pro za ve ry ty kajıćı se z ivotnosti cele vyrobene se rie. Ste z ejnıḿ u kolem je najı t postup, aby vy sledky ktere zıśka na vzorku, byly co nejvıće podobne te m, ktere by zıśkal po prozkouma nı vs ech vyrobeny ch souc a stek. Prvnı ve c, ktera na s s ota zkou pr esnosti napadne, ²¹ Vyvinula se z pu vodnıćh starove ky ch sc ı ta nı obyvatel a majetku.

98 je mı t vzorek co nejve ts ı. Ale tento postup ma sva u skalı, z nichz na ne ktera jsme jiz pouka zali (napr ıḱlad pokud je pr i testova nı souc a stka znic ena, nelze ji prodat). Vyvsta vajı pak napr ıḱlad na sledujıćı ota zky: Jaka je z ivotnost souc a stek vyra be ny ch zme ne nou technologiı? Je vy razny rozdıĺ mezi z ivotnostı souc a stek vyra be ny ch obe ma zpu soby? Jaky je pravde podobnostnı za kon pro rozde lenı doby z ivotnosti souc a stek? Vhodny m matematicky m na strojem pro r es enı te chto a dals ıćh ota zek je (matematicka ) statistika, jejıḿz hlavnıḿ u kolem je rozbor dat (zıśkany ch z vys etr ova nı skupiny prvku ) a rozs ıŕ enı za ve ru zıśkany ch z tohoto vys etr ova nı na cely soubor (populaci). Statistika to je sběr a zpracování dat Základní pojmy Znak (náhodná veličina). Prvky (statistické jednotky), na nichz prova dıḿe statisticka s etr enı, majı ne ktere vlastnosti (znaky) spolec ne a lis ı se v jednom nebo vıće znacıćh o jejichz vlastnosti se zajıḿa me. V našem příkladě ke spolec ny m znaku m vy s e zmıńe ny ch souc a stek poc ı ta me to, z e jsou vyrobeny ze stejne ho materia lu, v urc ite tova rne, danou technologiı, atd. Znak v ne mz se lis ı je napr ıḱlad jejich z ivotnost. Statistickou jednotkou je v tomto pr ıṕade vyrobena souc a stka. Pojmem zpravodajská jednotka (irma, obec, doma cnost, ) oznac uje sta tnı statistika subjekty, ktere v souladu s pr ıślus nou legislativou majı vu c i sta tu takzvanou zpravodajskou povinnost (musejı ne co hla sit).

99 Základní soubor (populace) ²² obsahuje vs echny objekty, ktere chceme poznat. Jinak r ec eno, je to soubor jednotek, o ktere m pr edpokla da me, z e jsou pro ne j nas e za ve ry platne. V našem příkladu tvor ı za kladnı soubor vs echny souc a stky, ktere byly nebo jes te budou vyrobeny. Výběrový soubor (vzorek) obsahuje pouze objekty skutec ne vys etr ene, nebo-li skupinu jednotek, ktere skutec ne pozorujeme. V našem příkladu je vy be rovy soubor tvor en souc a stkami, na nichz probe hly zkous ky. Abychom byli schopni z chova nı vzorku pr edpovı dat chova nı populace, musı struktura vzorku imitovat (napodobovat) sloz enı populace tak pr esne, jak je to jen moz ne ²³. Lze pr edpokla dat, z e s rostoucı velikostı vzorku se rozdıĺ mezi strukturou populace a vzorku zmens uje. Skutec ne ; nejdr ı ve rychle, pak pomaleji a pomaleji. U plne shody mezi strukturou populace a vzorku dosa hneme teprve tehdy, kdyz jsme zahrnuli vs echny elementy populace do vzorku. Datový soubor je tvor en s etr enıḿ zıśkany mi u daji, ktery m r ıḱa me hromadná data nebo jenom data. V našem příkladu zjis te ne hodnoty z ivotnosti na vybrany ch souc a stka ch tvor ı datovy soubor. ²² Na zev populace se tradic ne pouz ı va proto, z e prapu vodne se statistikou rozume la c innost, spoc ı vajıćı ve zjis ťova nı stavu ne jake ho u zemı a spıś e stavu obyvatelstva na tomto u zemı aby me la vrchnost pr edstavu, kolik prostr edku napr ıḱlad zıśka na danıćh, kolik muz u si mu z e dovolit povolat do zbrane apod. Za pr ıḱlad takove ho statisticke ho zjis ťova nı mu z e slouz it sc ı ta nı lidu, ktere v roce Kristova narozenı nechal prove st cıśar Augustus (viz Bible, Druha kniha Samuelova, kapitola 24 a Luka s ovo evangelium, kapitola 2). A protoz e to, co se tehdy zkoumalo bylo obyvatelstvo dane ho u zemı, zauz ı val se na zev populace, ktery nynı sta le pouz ı va me pro za kladnı soubor i kdyz v hleda c ku pozornosti námi popisovaného příkladu jsou vyra be ne souc a stky. ²³ Jen si zkuste pr edstavit, jake hodnoty o c ase stra vene m na internetu zıśka te v domovech pro seniory nebo na vysokos kolsky ch kolejıćh.

100 Poznámka. Aby se pr i r es enı u loh statistiky mohlo vyuz ı t metod teorie pravde podobnosti, vycha zı se z na sledujıćıćh u vah: Princip realizace pravde podobnostnı ho modelu statisticke ho zkouma nı, to je zıśka nı statisticky dat a vhodny ch charakteristik. Protoz e hodnoty znaku naby vajı pu sobenıḿ na hodny ch vlivu na jednotlivy ch objektech ru zny ch hodnot, povaz ujeme znak za na hodnou velic inu, kterou oznac ıḿe X. Proto pr edpokla da me, z e zıśkana data jsou realizacemi te to na hodne velic iny X (vys etr ovane ho znaku), ktera ma distribuc nı funkci F(X), kterou ovs em nezna me. Abychom zıśkali informace o rozde lenı te to na hodne velic iny v cele m za kladnıḿ souboru (populaci), provedeme ne kolik (tıḿ vlastne sestrojıḿe vzorek uskutec n ujeme vy be r) vza jemne neza visly ch pokusu (me r enı, pozorova nı, ) pr i nichz sledujeme realizace te to na hodne velic iny (jake jsou vy sledky jednotlivy ch pokusu ). Z hodnot zıśkany ch ze vzorku (datovy soubor) vypoc teme empirické charakteristiky (my zna me str ednı hodnotu E(X) a rozptyl D(X)) a empirické zákony rozdělení (napr ıḱlad distribuc nı funkci F(x)). Pomocı nich pak odhadujeme hledane charakteristiky a za kony rozde lenı na hodne velic iny X. Napr ıḱlad pru me rny plat 20 obc anu CR je na hodna velic ina, kterou oznac me X. Vy poc tem pru me rne ho platu (stanovenıḿ str ednı hodnoty E(X) z 20 platu ) konkrétních 20 obc anu (Ferda, Marie, ) zıśka me jednu realizaci tohoto pru me ru. Vy poc tem pru me rne ho platu jine ho vzorku 20 obc anu CR (Lojzic ka, Josef, ) zıśka me jinou realizaci pru me ru. Princip pravděpodobnostního modelu pouz ite ho pro vyvozenı za ve ru vyply vajıćıćh ze zıśkany ch statisticky ch u daju a charakteristik. Ma -li ale datovy soubor poda vat dobrou informaci o vlastnostech za kladnı ho souboru, musı by t vy be r objektu prova de n na hodne, pr ic emz ma mı t kaz dy objekt v za kladnıḿ souboru stejnou moz nost by t vybra n. Protoz e objekty ve vy be rove m souboru byly vybra ny na hodne, lze oc eka vat, z e pr i

101 jiny ch vy be rech dostaneme jiny datovy soubor. A ten bude mı t jine empiricke charakteristiky a jine empiricke za kony rozde lenı, i kdyz charakteristiky a za kon rozloz enı cele populace (za kladnı ho souboru) jsou sta le stejne. Zıśkane hodnoty vzorku (x, x,, x ) lze tedy povaz ovat za realizace na hodne ho vektoru (X, X,, X ), jehoz sloz ky X jsou vza jemne neza visle na hodne velic iny. Empiricke charakteristiky (str ednı hodnota, rozptyl), obecne oznac ene b, ktere jsou funkcemi hodnot vzorku, pak povaz ujeme za realizace jisty ch na hodny ch velic in B. Protoz e b = (x, x,, x ), bude B = (X, X,, X ). Takto sestrojene na hodne velic iny B nazy va me obecne statistikami (nebo výběrovými charakteristikami) a jejich hodnoty, ktere naby vajı na statisticke m souboru nazy va me pozorované hodnoty statistiky nebo empirickými charakteristikami. S ne ktery mi statistikami (vy be rovy mi charakteristikami) se nynı sezna mıḿe.

102 2. Číselné charakterisky stasckých souborů Pr edstavte si situaci, z e ma te k dispozici statisticky soubor o pome rne velke m rozsahu a stojı te pr ed ota zkou co s nıḿ, jak jej co nejvy stiz ne ji popsat. Cıśelne hodnoty, ktery mi takovy to rozsa hly soubor nahradıḿe, postihujı za kladnı vlastnosti tohoto souboru a my jim budeme r ıḱat statisticke charakteristiky (statistiky). Jsou to jednoc ıśelne charakteristiky, ktere charakterizujı vs echny hodnoty zkoumane velic iny v cele m souboru jediny m c ıślem. Jde zejme na o pru me rnou hodnotu velic iny v cele m souboru napr ıḱlad pru me rnou vy s ku studenta ve tr ı de. Krome pru me rne hodnoty velic iny se pouz ı vajı i dals ı obdobne míry polohy (mıŕy u rovne ) velic iny v dane m souboru, napr ıḱlad prostr ednı hodnota z name r eny ch hodnot uspor a dany ch podle velikosti apod. Vedle urc enı ne jake mıŕy polohy je dals ıḿ za kladnıḿ u kolem pr i zpracova nı name r eny ch hodnot zıśka nı alespon hrube informace o tom, jak jsou hodnoty zkoumane velic iny rozde leny mezi jednotlive objekty souboru, jak mnoho se tyto hodnoty na jednotlivy ch objektech od sebe navza jem lis ı, jak mnoho jsou rozpty leny kolem hodnoty pru me rne. Aby bylo moz ne tuto rozpty lenost c i variabilitu velic iny charakterizovat jednou hodnotou, jednıḿ c ıślem, byly vyvinuty ru zne míry variability zkoumane velic iny v dane m souboru. Vs echny ne jaky m zpu sobem zhruba uda vajı pru me rnou odchylku hodnot na hodne velic iny name r eny ch na jednotlivy ch objektech od pru me rne hodnoty te to velic iny v cele m souboru. Napr e klad se zjis ťuje, o kolik se pru me rne lis ı vy s ka studenta ze tr ı dy od pru me rne vy s ky vs ech studentu z dane tr ı dy.

103 Charakterisky polohy data: Tyto charakteristiky vyjadr ujı pomyslny str ed prome nne. Modus: x u diskre tnı prome nne je nejčastější hodnota (nejc aste ji se vyskytujıćı ; ta, ktera ma nejvys s ı c etnost) = 2. Dvojka se v dany ch datech vyskytuje tr ikra t. Medián: to: Pouze tato charakteristika je pouz itelna u jmenných nominálních prome nny ch, ktere naby vajı rovnocenny ch variant. Proto je nelze je ani porovna vat, ani ser adit. Napr ıḱlad: pohlavı, na rodnost, znac ka hodinek, barva svetru, V tomto pr ıṕade pr edstavuje typicke ho reprezentanta (hodnotu prome nne ), ktery chova nı souboru ovlivn uje nejvıće, protoz e se vyskytuje nejvıće kra t. U spojite prome nne nelze modus takto urc ovat, ale v te to pr ıŕuc ce se tıḿ nebudeme tra pit. Existence dvou a vıće modu ve vy be ru obvykle signalizuje nesourodost (heterogenitu) hodnot prome nne. Tuto nesourodost by va moz ne odstranit rozde lenıḿ souboru na podsoubory roztr ı de nıḿ podle ne ktere ho jine ho znaku (napr ıḱlad dvoumoda lnı znak výška člověka lze roztr ı dit podle pohlavı na dva unimoda lnı (jsou urc eny jednoznac ne ) znaky vy s ka z en a vy s ka muz u ). x je prostřední hodnota z name r eny ch hodnot uspořádaných podle velikosti. Pr esne ji je prostřední hodnota pr i liche m poc tu prvku ; jakákoliv hodnota mezi prostr ednıḿi hodnotami (i vc etne nich) pr i sude m poc tu prvku. Nejc aste ji (pokud ma smysl ho urc ovat) bereme aritmetický průměr z te chto prostr ednıćh hodnot. O ne m si vıće r ekneme za chvıĺi. Tedy pro nas e zadana data ope t 2.

104 Media n lze pouz ı t u pořadových ordinálních prome nny ch, u ktery ch lze stanovit por adı a tıḿ je vza jemne porovna vat (pouze na za klade por adı ) nebo ser adit. Napr ıḱlad: zna mka ve s kole, velikost ode vu (S, M, L, XL), medaile ve sportovnıćh soute z ıćh (zlata, str ı brna, bronzova ), Ne kdy ovs em mu z eme mı t proble m s aritmeticky m pru me rem prostr ednıćh hodnot. Na sledujıćı c tyr i charakteristiky s na zvem nějaký průměr pouz ı va me pouze u (kvantitativnıćh) prome nny ch, ktere lze vyja dr it c ıśly a pak je pomocı te chto c ıśel porovna vat. Tedy ma smysl se pta t O KOLIK je jeden prvek leps ı nez druhy, pr ıṕadne KOLIKRAT je jeden prvek leps ı nez druhy, Data: Aritmecký průměr: x = x = 1 n x = n x = = = 11 5 = 2,2 Geometrický průměr: pro x > 0 Harmonický průměr: pro x > 0 Chronologický průměr: x = x = x = x = = = 32 = 2 x = n x = = n = = (n 1) (x + 2x + + 2x + x ) = ,818

105 Obra zek 3: Pr evzat z [14] Zkoumane osoby byly zar azeny do tříd (skupin) podle jejich velikosti (v metrech)! Napr ıḱlad pro druhou skupinu zleva: vys s ıćh jak 162,5 cm a niz s ıćh jak 167,5 cm jich bylo pe t.

106 1 17 ( ) = 2 (5 1) 8 = 2,125 kde x x x x Několik poznámek 1. Uve domte si, z e poz adavek, aby me lo smysl se pta t o kolik, kolikrát,, je opra vne ny (vy znamny, du lez ity, pra vnıći pouz ı vajı termıń relevantnı ). Forma lne sice mu z eme napr ıḱlad modre barve pr ir adit jednic ku a c ervene barve dvojku. Ovs em jiz nemu z eme pro jeden svetr barvy hodnoty 1 a pro druhy barvy hodnoty 2 tvrdit, z e v pru me ru ma me dva svetry v barve 1,5. Toto tvrzenı postra da smysl. 2. Pr estoz e to tak na prvnı pohled vypada, aritmeticky pru me r nenı vz dy pro vy poc et pru me ru vy be rove ho souboru nejvhodne js ı. Pracujeme-li, napr ıḱlad, s prome nnou pr edstavujıćı relativnı zme ny (ru stove indexy, cenove indexy, ), pouz ı va me geometricky pru me r. Pro vy poc et pru me ru v pr ı padech, kdy prome nna ma charakter c a sti z celku (u lohy o spolec ne pra ci, ne ktere u lohy o pohybu, ), pouz ı va me pru me r harmonicky. 3. Forma lne bychom sice mohli i pro za porne hodnoty pouz ı t v urc ity ch pr ıṕadech vzorec pro geometricky pru me r (musı by t deinova na odmocnina) a stejne tak vzorec pro harmonicky pru me r.

107 Napr ıḱlad pro hodnoty 4, 2, 1 dosta va me: x = ( 4) ( 2) (1) = 8 = 2, coz je naprosto mimo zadane hodnoty, proto tento vy sledek nemu z e pr edstavovat pru me r zadany ch hodnot. x = = 1 = 4 1 Obdobne pro hodnoty 1, 2, 4 = 4, coz je ope t naprosto mimo zadane hodnoty, x = = 1 x = ( 1) (2) (4) = 8 = 2 = 4 1 = 4 Proto se pr idrz ıḿe obecne uzna vane za sady, z e jak geometricky pru me r, tak harmonicky pru me r budeme poc ı tat pouze pro kladné hodnoty sledovane prome nne, coz je jak v pr ıṕade indexů (budou probıŕa ny v kapitole o hospoda r ske statistice) tak v pr ıṕade společné práce automaticky splne no. 4. Vzhledem k tomu, z e kaz dy z pru me ru se stanovuje ze vs ech hodnot prome nne, nese maximum informacı o vy be rove m souboru. Na druhe strane je vs ak chronologicky, ale hlavne aritmeticky pru - me r velmi citlivy na tzv. odlehla pozorova nı, coz jsou hodnoty, ktere se mimor a dne lis ı od ostatnıćh a doka z ı proto vychy lit aritmeticky pru me r natolik, z e pr esta va dany vy be r dobr e reprezentovat. Viz na sledujıćı pr ıḱlad. 5. Vzpomenete-li si napr ıḱlad na norma lnı rozde lenı, mu z eme jej nynı pr esne ji charakterizovat a r ı ci o ne m, z e norma lnı rozde lenı je jednomoda lnı rozde lenı, symetricke kolem str ednı hodnoty μ, pr ic emz tato str ednı hodnota je rovna modu a media nu.

108 Kvanly Kvantily (srovnej s jiz dr ı ve uvedenou kvantilovou funkcı ) jsou statistiky, ktere charakterizujı polohu jednotlivy ch hodnot v ra mci prome nne. Podobne jako modus, jsou i kvantily rezistentnı (odolne ) vu - c i odlehly m pozorova nıḿ. Obecne je kvantil deinova n jako hodnota, ktera rozde luje vy be rovy soubor uspořádaný podle velikosti na dve c a sti: 1. c a st obsahuje hodnoty, ktere jsou mens ı nez dany kvantil anebo stejne ; 2. c a st obsahuje hodnoty, ktere jsou ve ts ı nebo rovny dane mu kvantilu. Pro urc enı kvantilu je proto nutne vy be r uspor a dat od nejmens ı hodnoty k nejve ts ı. Kvantil prome nne x, ktery odde luje 100p % mens ıćh hodnot od zbytku souboru, tedy od 100(1 p) % hodnot, nazy va me 100p % kvantilem a znac ıḿe jej x. Zejme na v souvislosti s hodnocenıḿ normovany ch testu (SCIO testy, biometricke normy, ) se c asto setka va me s vyja dr enıḿ: Patříte do xyz. percentilu [8, str. 43], pr ic emz xyz je cele c ıślo od jedne do sta. Napr ıḱlad Patříte do 80. percentilu znamena, z e nejme ne 79 % a nejvy s e 80 % u c astnıḱu testu dosa hlo nižšího vy sledku nez vy. x, kvanl jiz zna me. Jmenuje se medián, kdy polovina (50 %) vs ech hodnot je mens ıćh nebo stejny ch jako x, a polovina je ve ts ıćh anebo se rovna tomuto media nu. Aritmeticky pru me r (stejne jako jine podobne reprezentace str ednıćh hodnot) nebo u daje v procentech ²⁴ redukujı informaci o mnoha prvcıćh vzorku do jednoho jedine ho u daje. A to je pe kne silna redukce, pr i ktere mu z eme ztratit du lez ity druh informace. Jaka koliv charakteristika polohy proto potr e- ²⁴ [2, str. 186] Po aplikaci prepara tu B se 33,3 % kur at uzdravilo, 33,3 % uhynulo a o zby vajıćıćh 33,3 % nejsme schopni poskytnout uspokojujıćı informaci, protoz e se na m dosud nepodar ilo to třetí kur e chytit.

109 buje ke spra vne mu vyhodnocenı konkre tnı situace jes te jeden rozme r (u daj). Alespon hrubou informaci o tom, jak jsou hodnoty zkoumane velic iny rozde leny mezi jednotlive objekty souboru, jak mnoho se tyto hodnoty na jednotlivy ch objektech od sebe navza jem lis ı, jak mnoho jsou rozpty leny kolem hodnoty pru me rne. Aby bylo moz ne tuto rozpty lenost c i variabilitu velic iny charakterizovat jednou hodnotou, jednıḿ c ıślem, byly vyvinuty ru zne mıŕy variability zkoumane velic iny v dane m souboru. Vs echny ne jaky m zpu sobem zhruba uda vajı pru me rnou odchylku hodnot na hodne velic iny name r eny ch na jednotlivy ch objektech od pru me rne hodnoty te to velic iny v cele m souboru. Napr ıḱlad se zjis ťuje, o kolik se pru me rne lis ı hmotnost kapra vylovene ho v rybnıḱu od pru me rne va hy vs ech kapru z tohoto rybnıḱu. Variabilitu vy be rovy ch charakteristik pr itom ovlivn ujı tr i faktory [8, str. 106]: 1. rozsah populace N; 2. rozsah vy be ru n; 3. zpu sob zıśka nı na hodne ho vy be ru. Mıŕy variability charakterizujı me r enou velic inu v cele m dane m souboru objektu jednıḿ c ıślem z hlediska velikosti kolıśa nı hodnot te to velic iny. Je moz no z nich ihned usoudit, jak mnoho jsou tyto hodnoty v souboru rozpty lene, jsou-li v pru me ru hodne c i ma lo vzda lene od pru me rne hodnoty velic iny v souboru.

110 Charakterisky rozptylu (variability) data: Vıḿe, z e pro tyto hodnoty platı : x = 2,2, coz je aritmetický průměr. Ten na m vs ak nic ner ıḱa o rozloz enı jednotlivy ch hodnot prome nne kolem tohoto str edu, tj. o variabilitě proměnné. Je zr ejme, z e c ıḿ ve ts ı je rozpty lenost hodnot prome nne kolem jejı ho pomyslne ho str edu, tıḿ mens ı je schopnost tohoto str edu reprezentovat celou prome nnou (viz pivnı hrdina). Rozptyl (výběrový): S = 1 n 1 x n x nebo: S = 1 n 1 [x x] [( ) 5 2,2 ] =, =, =, = 1, [(1 2,2) + (2 2,2) + (2 2,2) + (2 2,2) + (4 2,2) ] = = (,) (,) (,) (,) (,) =,,, =, = 1,2 Nevy hodou pouz itı (vy be rove ho) rozptylu jakoz to mıŕy variability je to, z e rozme r te to charakteristiky je druhou mocninou rozme ru prome nne. Napr ıḱlad je-li prome nnou dennı trz ba uvedena v Kc, bude vy be rovy rozptyl te to prome nne vyja dr en v Kc. Tento nedostatek odstran uje dals ı mıŕa variability, a tou je: Směrodatná odchylka (výběrová): S = S = 1,2 1,095 Nevy hodou (vy be rove ho) rozptylu i (vy be rove ) sme rodatne odchylky je ta skutec nost, z e neumoz n ujı porovna vat variabilitu prome nny ch vyja dr eny ch v ru zny ch jednotka ch. Ktera prome nna ma ve ts ı variabilitu vy s ka nebo hmotnost dospe le ho jedince? Na tuto ota zku na m da odpove ď na sledujıćı charakteristika, a tou je:

111 Variační koeficient: V = S x = 1,095 0, % 2,2 Variac nı koeicient je bezrozme rny, uva dıḿe jej c asto v procentech. Zhruba uda va, jakou c a st aritmeticke ho pru ume ru pr edstavuje sme rodatna odchylka. Ma smysl jej urc ovat pouze pro prome nne naby vajıćıćh vy hradne kladných hodnot: tedy pro x > 0. Variační rozpě: R = x x = 4 1 = 3 Toto variac nı rozpe tı vs ak z du vodu jeho pr ıĺis ne citlivosti k pr ıṕadny m ojedine ly m extre mnıḿ hodnota m nenı moc dobry m odhadem variability. Proto ne kdy pouz ı va me i kvartilove (c i mezikvartilove ) rozpe tı, ktere je rozdıĺem hornı ho a dolnı ho kvartilu, tedy rozdıĺem 75% a 25% kvantilu: R = x, x,. Na sledujıćı charakteristiku (pru me rnou absolutnı odchylku), uva dıḿe pouze pro u plnost, abychom si uka zali, z e se v praxi vyuz ı vajı dve metody, jak zajistit kladny vy sledek. U (vy be rove ho) rozptylu rozdıĺ umocnıḿe na druhou, u absolutnı (vy be rove ) odchylky pouz ijeme absolutnı hodnotu a protoz e to je pru me rna odchylka, urc ıḿe jejı aritmeticky pru me r. A protoz e je to vy be rova odchylka, de lıḿe o jednic ku zmens eny m poc tem prvku. Průměrná absolutní odchylka (výběrová): d = 1 n 1 x x 1 4 ( 1 2, , , , ,2 ) = 1 4 (1, ,2 + 1,8) = 1 3,6 = 0,9 4

112 Další charakterisky (napr ıḱlad s ikmost, s pic atost a dals ı ) si nebudeme uva de t. Vzorce podle nichz se urc ujı tyto charakteristiky jsou pome rne sloz ite a proto se podle nich ruc ne ve ts inou nepoc ı ta. By vajı souc a stı programu pro zpracova nı statisticky ch dat. Napr ıḱlad Excel 2010: oznac uje stupen asymetric nosti rozde le- Šikmost (koeicient skosu; angl. skewness ) =SKEW(data) nı velic iny kolem jejı str ednı hodnoty. Špičatost (koeicient excesu; angl. kurtois ) =KURT(data) urc uje relativnı strmost nebo plochost rozde lenı v porovna nı s normovany m norma lnıḿ rozde lenıḿ. Vy znam ne ktery ch empiricky ch (spoc ı tany ch z hodnot vzorku, vy be ru) charakteristik pro cely za kladnı soubor (populaci) je na sledujıćı : aritmeticky pru me r x vzorku je (nejleps ıḿ) c ıśelny m odhadem str ednı hodnoty E(X) za kladnı ho souboru (populace), vy be rovy rozptyl S vzorku je (nejleps ıḿ) c ıśelny m odhadem rozptylu D(X) za kladnı ho souboru, jak si pozde ji uka z eme. Ota zky spojene s pr esnostı te chto odhadu (co je vlastne nejleps ıḿ odhadem), pokud ma za kladnı soubor norma lnı rozde lenı, budou r es eny v kapitole o intervalovy ch odhadech. [14, str.92]: Statistika bez použití rozumu dává nesmysly a to neplatı jen o statistice. Ma m-li hodnoty prome nne hmotnosti zaokrouhlovane na kilogramy, asi nema smysl jaky koliv pru me r te to prome nne poc ı tat na gramy. Sme rodatnou odchylku jakoz to mıŕu nejistoty me r enı zaokrouhlujeme nahoru na maxima lne dve (ve ts inou) az tr i platne cifry.

113 Rozšíření poznatků o rozptylu. Analy za rozptylu (ANOVA analysis of variance byla vyvinuta R. A. Fisherem na poc a tku 20. stoletı ), kterou se podrobne ji nebudeme zaby vat, je zaloz ena na pr edstave, z e variabilita (prome nlivost, rozpty lenı, disperze), se kterou kolıśajı hodnoty sledovane na hodne velic iny kolem str ednı hodnoty jejı ho rozde lenı, vznika jako du sledek ru zny ch vlivu, z nichz kaz dy pr ispı va k te to celkove variabilite urc ity m podıĺem. Celkovy rozptyl (kvadra t sme rodatne odchylky) jako mıŕu variability lze pak rozc lenit na dıĺc ı rozptyly na lez ejıćı te mto jednotlivy m vlivu m faktoru m. Napr ıḱlad na s zajıḿa variabilita me sıć nıćh platu pobıŕany ch ve sta te. Platy jsou rozpty leny kolem str ednı hodnoty rozde lenı a rozpty lenı je vyvola va no (nebo nas e pr edstava je, z e by mohlo by t vyvola va no) mnoha vlivy faktory. Jeden z nich (ktery na s enormne zajıḿa ) je ekonomicka sfe ra, v nıź jsou platy vypla ceny. V ra mci tohoto faktoru mu z eme napr. rozlis ovat zame stnance ze zeme de lstvı, sta tnı zame stnance, zame stnance z oblasti pene z nictvı, z oblasti sluz eb, z potravina r ske ho pru myslu atd. Existujı dals ı faktory, ktere ovlivn ujı hodnotu platu a jejich zme ny pr ispı vajı k prome nlivosti platu. Faktor vzde la nı zame stnance (za kladnı, str edos kolske a vysokos kolske ) nebo ru zna doba zame stna nı, umıśte nı podniku podle kraju, podle velikosti obcı, faktor pohlavı zame stnance a dals ı. Analy za rozptylu v pru myslovy ch aplikacıćh umoz n uje posoudit vliv ru zny ch faktoru na vy robnı proces, hodnotit vliv pouz itı ru zny ch druhu surovin na jakost produkce apod. V ekonomicky ch aplikacıćh pak umoz n uje posoudit vliv ru zny ch faktoru na hospoda r sky proces, hodnotit u c inky ru zny ch pr ijaty ch opatr enı apod.

114 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

115 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

116 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

117 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

118 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

119 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

120 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

121 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

122 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

123 Charakterisky polohy (průměrů x) a rozptylu setříděného vzorku Variační rozpětí: R = = Modus: x = Medián: x = Aritmetický průměr: x = 82,32 ( ) Geometrický průměr: x 32, Harmonický průměr: x 24,26 Chronologický průměr: x 60,54 ( ) () Výběrový rozptyl : S Směrodatná odchylka : S = [( ) 25 82,32 ]

124 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

125 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

126 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

127 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

128 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

129 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

130 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

131 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

132 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

133 Stejný vzorek s vynechanou poslední (extrémní) hodnotou Variační rozpětí: R = = 140 (dr ı ve 1 190) Modus: x = 18 (dr ı ve 18) Medián: x = 27,5 (dr ı ve 29) Aritmetický průměr : x = 35,75 (dr ı ve 82,32) ( ) Geometrický průměr : x 28,17 (dr ı ve 32,73) Harmonický průměr : x 23,31 (dr ı ve 24,26) Chronologický průměr : x 33,83 (dr ı ve 60,54) ( ) () Výběrový rozptyl : S 923 (dr ı ve ) Směrodatná odchylka : S = (235) [( ) 24 35,75 ]

134 Robustnost charakterisk polohy vůči extrémním hodnotám Za velmi dobre mıŕy polohy se pra vem povaz ujı modus ( x, nejc etne js ı hodnota) a media n ( x, prostr ednı hodnota), protoz e nejsou pr ıḿo ovlivne ny velikostı vs ech hodnot. To ma vy hodu zejme na tehdy, kdyz se ve vy be ru (tak jako v pr edchozıḿ pr ıḱlade ) vyskytuje na hodne jedna nebo ne kolik ma lo mimor a dne extre mnıćh hodnot (vzhledem k ostatnıḿ hodnota m pr ıĺis velky ch nebo pr ıĺis maly ch). V te chto pr ıṕadech nejsou modus ani media n ovlivne ny te mito odlehly mi hodnotami a poskytujı tak dobrou pr edstavu o objektivnı poloze nejc aste js ı a prostr ednı hodnoty a tıḿ i o u rovni (poloze) hodnot sledovane prome nne. Ne kdy se vs ak necitlivost (robustnost) te chto me r povaz uje za jistou nevy hodu. Tuto nevy hodu pr ekona vajı ne ktere průměry, coz jsou str ednı hodnoty deinovane tak, z e jsou funkcı vs ech hodnot dane prome nne, takz e jsou vıće citlive na odlehle hodnoty (hodnoty, ktere se mimor a dne lis ı od ostatnıćh a doka z ı proto pru me r vychy lit natolik, z e pr esta va dany vy be r reprezentovat): hlavne aritmeticky da le pak kvadraticky x a chronologicky x (z te ch, ktere jsme si uva de li), x (ten jsme si neuva de li). Naopak geometricky pru me r x a harmonicky pru me r x nejsou pr ıĺis citlive vu c i ne kolika ma lo extre mnıḿ hodnota m, jak jsme demonstrovali na pr edchozıćh dvou pr ıḱladech. Pokud o ne ktere hodnote prome nne rozhodneme, z e je odlehly m pozorova nıḿ (napr ıḱlad analogiı s pravidlem 3 σ, kdy za odlehle pozorova nı povaz ujeme to, ktere je od aritmeticke ho pru me ru vzda leno vıće jak trojna sobek sme rodatne odchylky), je nutne jes te urc it, proc je toto pozorova nı odlehle. V pr ıṕade, z e zna me pr ıć inu a pr edpokla da me, z e tato jiz nenastane (pr eklep v za pisu, prokazatelne selha nı lidı c i techniky, technologicke chyby), jsme opra vne ni tato pozorova nı vylouc it z dals ı ho zpracova nı, takzvane očistit data. V ostatnıćh pr ıṕadech je nutne zva z it, zda se vylouc enıḿ odlehly ch pozorova nı nepr ipravıḿe o du - lez ite informace o jevech vyskytujıćıćh se s nıźkou c etnostı.

135 3. Zpracování stasckého materiálu Jak jsme jiz uvedli na zac a tku te to kapitoly, u kolem popisne statistiky je, uspor a dat pozorovane hodnoty prome nne do na zorne js ı formy (tabulka) a popsat je ne kolika ma lo hodnotami (c ıśelny mi charakteristikami), ktere by obsahovaly co nejve ts ı mnoz stvı informacı obsaz eny ch v pu vodnıḿ souboru. Jak se to prova dı prakticky, si nynı uka z eme Menší vzorek Ma me k dispozici na sledujıćı data (u daje), o ktery ch na m nenı zna mo, z e pocha zejı z pr ıḱladu popisujı cı ho poc et padly ch líců pr i souc asne m hodu c tyr mi rozlis itelny mi mincemi. Proto ani netus ıḿe, z e by mohlo jı t o binomicke rozde lenı. Máme pouze tato sesbíraná data: ktera setr ı dıḿe a zapıś eme do na sledujıćı tabulky. Kaz da v datech vyskytujıćı se cifra bude mı t svu j vlastnı sloupec ek. cifra poc et vy skytu Zajıḿa na s, jak mu z eme urc it poz adovane c ıśelne charakteristiky z takto zıśkany ch a do tabulky zapsany ch hodnot. Protoz e bychom pr ida vali dals ı r a dky s mezivy sledky, je le pe psa t tabulku svisle a potom mu z eme pr ida vat sloupce dle libosti. Poznámka Pokud by pr ıṕadny ch r a dku v tabulce me lo by t vıće (viz na sledujıćı pr ıḱlad) a tabulka by se sta vala nepr ehlenou, zar adıḿe vz dy podobne hodnoty do jedne tr ı dy (viz obra zek)

136 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

137 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

138 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

139 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

140 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

141 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

142 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

143 = 32 tr ı da reprezentant c etnost x index k x n n x x (x x) n (x x) n= k oznac uje c ıślo r a dku tabulky, navıć jej nazveme třídou. x nazveme reprezentantem te to tr ı dy. Četnost n uda va, kolikra t se dany reprezentant x v souboru dat vyskytuje. Pokud bychom c etnost pode lili poc tem prvku (n /n), dostaneme relativní četnost (v procentech). Srovnej s klasickou pravde podobnostı : příznivé pr ıṕady vs echny možné aritmeticky pru me r x = 1 n x = 1 n n x = = 2 (vy be rovy ) rozptyl S = 1 n 1 (x x) = 1 n 1 n (x x) = ,

144 3.2. Rozsáhlý vzorek Nıź e uvedena data zar aďte do tr ı d a pote vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ Postup pr i ruc nıḿ zpracova nı : 1. Nalezneme nejmens ı a nejve ts ı prvek a urc ıḿe variační rozpětí vzorku. 2. Rozhodneme se, do kolika (minimum je pe t tr ı d a maximum 20 tr ı d; nejc aste ji 8 az 13) jak velkých tříd (doporuc uje se, aby tr ı dy me ly stejnou de lku) budeme data zar azovat. Pokud se zvolı maly poc et tr ı d, dojde pr i tr ı de nı k vy razne ztra te informace o pru be hu pu vodnı ho znaku. Pokud se naopak zvolı pr ıĺis velky poc et tr ı d (s maly mi c etnostmi), bude vznikla tabulka nepr ehledna. De lku intervalu (tr ı dy) volıḿe tak, aby hranice intervalu byla dobr e zapamatovatelna (pr ıṕadne zaokrouhlena ) c ıśla ²⁵, intervaly jednoznac ne pokry valy cely obor hodnot popisovane ho znaku (nesmı se sta t, z e by ne ktera hodnota nepatr ila do z a dne tr ı dy) a oba krajnı intervaly rozde lenı me ly nenulove c etnosti. 3. Zac neme vypln ovat na sledujıćı tabulku rozde lenı c etnostı, kterou doplnıḿe o dals ı sloupce hodnot, pomocı ktery ch pak urc ıḿe poz adovane c ıśelne charakteristiky. ²⁵ Jindy zase rade ji poz adujeme, aby reprezentanti jednotlivy ch tr ı d (ve ts inou str edy te chto tr ı d) byla dobr e zapamatovatelna (pr ıṕadne zaokrouhlena ) c ıśla (viz obra zek).

145 Třídění dat Nejdr ı ve data zar aďte do devíti tr ı d ad 1. Variac nı rozpe tı : R = x x = = 148. ad 2. Chceme-li data rozde lit do 9 tříd (148 9 = 16,4), volıḿe šířku třídy 17. Pak: 9 17 R = 5, coz rozde lıḿe na obe strany: 5 2 = 2,5. Prvnı tr ı da bude potom mı t počátek: x 2,5 = 9,5 a konec: 9,5 + s ıŕ ka tr ı dy = 9, = 26,5. ad 3. Vs e budeme zapisovat do tabulky. k tr ı da interval šířky 17 ( poc a tek ; konec=poc a tek+17 ) 1 ( x 2,5 ; 26,5 = /12 2,5/ + 17 ) 2 ( 26,5 ; 43,5 = 26, ) 3 ( 43,5 ; 43, ) 4 ( 60,5 ; ) 5 ( ; ) 6 ( ; ) 7 ( ; ) 8 ( ; ) 9 ( ; x + 2, 5 )

146 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

147 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

148 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

149 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

150 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

151 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337

152 Třídění dat Po zar azenı dat do devı ti tr ı d vypoc ı tejte nejprve aritmeticky pru me r a (vy be rovy ) rozptyl Kolik prvku do kaz de tr ı dy patr ı? Cetnost dane tr ı dy si oznac ıḿe n. Jake ho bude mı t tr ı da reprezentanta (my si zvolıḿe str ed)? Do tabulky doplnıḿe dals ı potr ebne sloupce. k tr ı da c etnost x n x n (x x ) n 1 (9,5 ; 26,5) 12; ,92 2 (26,5 ; 43,5) ,72 3 (43,5 ; 60,5) ,84 4 (60,5 ; 77,5) ,80 5 (77,5 ; 94,5) ,60 6 (94,5 ; 111,5) ,80 7 (111,5 ; 128,5) ,08 8 (128,5 ; 145,5) ,52 9 (145,5 ; 162,5) ,64 n= ,92 Aritmetický průměr x = 1 n x n = ,4 42 Výběrový rozptyl S = = 1 n 1 (x x ) n = , , S 1337 Budeme-li poz adovat i dals ı c ıśelne charakteristiky, doplnıḿe tabulku o dals ı potr ebne sloupce.

153 Určení číselných charakterisk Vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ. k tr ı da x c etnost n x n x n x x 1 (9,5 ; 26,5) ,148 0,111 2 (26,5 ; 43,5) ,184 0,057 3 (43,5 ; 60,5) ,332 0,173 4 (60,5 ; 77,5) ,655 0,072 5 (77,5 ; 94,5) ,888 0,116 6 (94,5 ; 111,5) ,736 0,049 7 (111,5 ; 128,5) ,408 0,025 8 (128,5 ; 145,5) ,264 0,015 9 (145,5 ; 162,5) ,616 0,026 n= ,644 75,638 n

154 Určení číselných charakterisk Vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ. k tr ı da x c etnost n x n x n x x 1 (9,5 ; 26,5) ,148 0,111 2 (26,5 ; 43,5) ,184 0,057 3 (43,5 ; 60,5) ,332 0,173 4 (60,5 ; 77,5) ,655 0,072 5 (77,5 ; 94,5) ,888 0,116 6 (94,5 ; 111,5) ,736 0,049 7 (111,5 ; 128,5) ,408 0,025 8 (128,5 ; 145,5) ,264 0,015 9 (145,5 ; 162,5) ,616 0,026 n= ,644 75,638 n

155 Určení číselných charakterisk Vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ. k tr ı da x c etnost n x n x n x x 1 (9,5 ; 26,5) ,148 0,111 2 (26,5 ; 43,5) ,184 0,057 3 (43,5 ; 60,5) ,332 0,173 4 (60,5 ; 77,5) ,655 0,072 5 (77,5 ; 94,5) ,888 0,116 6 (94,5 ; 111,5) ,736 0,049 7 (111,5 ; 128,5) ,408 0,025 8 (128,5 ; 145,5) ,264 0,015 9 (145,5 ; 162,5) ,616 0,026 n= ,644 75,638 n

156 Určení číselných charakterisk Vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ. k tr ı da x c etnost n x n x n x x 1 (9,5 ; 26,5) ,148 0,111 2 (26,5 ; 43,5) ,184 0,057 3 (43,5 ; 60,5) ,332 0,173 4 (60,5 ; 77,5) ,655 0,072 5 (77,5 ; 94,5) ,888 0,116 6 (94,5 ; 111,5) ,736 0,049 7 (111,5 ; 128,5) ,408 0,025 8 (128,5 ; 145,5) ,264 0,015 9 (145,5 ; 162,5) ,616 0,026 n= ,644 75,638 n Tedy: n = n = 42 x n = 3544 x n = n x = 75,638 = 0,644 x

157 Tedy: n = n = 42 x n = 3544 x n = n x = 75,638 = 0,644 x Vypoc ı tejte aritmeticky pru me r, geometricky pru me r, harmonicky pru me r, (vy be rovy ) rozptyl, sme rodatnou odchylku, variac nı koeicient a sestavte interval 3σ. Určení dalších charakterisk Geometrický průměr: Harmonický průměr: x = x 75,6 x = n = 42 0,644 65,2 Rozptyl: S = 1 n 1 x n n x = ( ,381 ) Směrodatná odchylka: S = S = ( 40) Variační koeficient: V = S = 37 x 84,4 0,44 Interval 3σ (pouze pro normální rozdělení!) = x 3 S ; x + 3 S = 25 ; 194 Poznámka: Mohli jsme take volit napr ıḱlad 10 tr ı d o rozpe tı 16. Tıḿ bychom sice me li hranice celoc ı selne, ale me li bychom tr ı dy ( 74 ; 90 ) a ( 90 ; 106 ). A do ktere z nich potom zar adıḿe c ıślo 90, ktere se jenom v prvnıḿ r a dku zadany ch dat vyskytuje dvakra t a potom jes te jednou ve druhe m r a dku? Tomuto proble mu jsme se dıḱy neceloc ıśelny m hranicıḿ vyhnuli.

158 4. Využi programu Excel 2010 Velky vy znam pro rozvoj a vyuz itı statisticky ch metod me l na stup vy poc etnı techniky, zejme na osobnıćh poc ı tac u. Poc ı tac vı te zı nad c love kem pr edevs ıḿ v te ch u konech, ktere jsou pro c love ka tradic ne nejzdlouhave js ı pr i tr ı de nı, vyhleda va nı a vy poc tech s velky m mnoz stvıḿ dat. Takz e napr ıḱlad vypln ova nı pr edchozı tabulky bychom zvla dli za pouz itı Excelu s pone kud mens ıḿ u silıḿ. Stac ı napsat vs echny hodnoty do sloupce pod sebe, na karte [Data] v za loz ce [Seřadit a filtrovat] zvolit nabı dku [Filtr], rozbalit nabı dku pod objevivs ıḿ se [trojúhelníkem],

159 vybrat si vhodnou funkci (napr ıḱlad) a nechat si ser adit data podle velikosti. Tıḿ lehce urc ıḿe nejmens ı a nejve ts ı prvek a mu z eme stanovovat tr ı dy. Pokud na s zajıḿa četnost konkre tnı tr ı dy (tedy kolik a jaky ch konkre tne je v nı prvku ) napr ıḱlad prvnı tr ı dy ( 9,5 ; 26,5 ) naprosto stejny m postupem si vybereme pouze jinou vhodnou funkci.

160 Mohli bychom postupovat i jinak. Vedle dat (mohou by t ser azena podle velikosti anebo v pu vodnıḿ por adı tak, jak byla zada na na dals ı postup to nema naprosto vliv) do jine ho sloupce napıś eme hornı hranice jednotlivy ch tr ı d. Potom volıḿe na sledujıćı poloz ky menu: [Data] [Analýza] [Analýza dat] [Histogram] ²⁶ ²⁶ Pokud vy s e uvedenou nabı dku [Histogram] nemu z eme najı t, pravde podobne tento doplne k na konkre tnıḿ poc ı tac i nenı nainstalova n. V tom pr ıṕade postupujeme na sledovne : [Soubor] [Možnos] [Doplňky] [Spravovat] Doplňky aplikace Excel [Přejít] a pr ida me Analycké nástroje [OK].

161 a doplnıḿe patr ic ne parametry (nejle pe oznac ova nıḿ oblastı pomocı mys i): [Vstupní oblast] sloupcovy vektor, ve ktere m jsou zadana data; [Hranice tříd] sloupcovy vektor, do ktere ho jsme zadali hornı hranice vs ech tr ı d. Poznámka: Pokud bychom nezadali hornı hranici poslednı tr ı dy, c etnost te to poslednı tr ı dy by se objevila v r a dku oznac ene m Další. Takhle je tam uvedena NULA. [Výstupní oblast] oznac uje levou hornı bun ku, od ktere program Excel zac ne vypisovat tabulku c etnostı jednotlivy ch tr ı d (viz na sledujıćı obra zek).

162 Do nove vznikle tabulky pak stac ı dopsat pr ıṕadne poc a tky, ale hlavne reprezentanty jednotlivy ch tr ı d a do dals ıćh sloupcu pak doplnit dals ı hodnoty podle vztahu tak, jak jsme je vypln ovali ruc ne. Poznámka: U c elem tohoto kurzu nenı c tena r e nauc it bravurne ovla dat konkre tnı statisticky software, ale umoz nit mu pochopenı a zvla dnutı dane problematiky tak, aby byl schopen si poradit i v pr ıṕadech, kdy v dosahu nema pr ıślus ne poc ı tac ove vybavenı, na ktere byl zauc en. To znamena, z e v dals ıḿ nebudeme pr ıĺis c asto uva de t jednotlive statisticke funkce ²⁷, ale zmıńıḿe se o nich pouze tam, kde to bude z didakticke ho hlediska vhodne (napr ıḱlad na hrada statisticky ch tabulek). Pr ednost budeme da vat be z ny m funkcıḿ tabulkovy ch kalkula toru pr i dosazova nı do uvedeny ch vzorcu. ²⁷ Jen napr ıḱlad pro vy poc et rozptylu uva dı Excel 2010 tyto 4 moz nosti: VAR.P, VAR.S, VARA a VARPA. A kdo si nenı jist tıḿ, co vlastne chce poc ı tat, ma tedy pouze 25% pravde podobnost, z e zvolı tu spra vnou z nich. Navıć Excel 2007 disponuje jedinou funkcı pro vy poc et rozptylu. Tedy s kaz dou novou verzı ne jake ho programu to znamena neusta lou kontrolu toho, co vlastne poc ı ta m a nove uc enı se obsluhy programu.

163 5. Základy zpracování kvalitavních dat Doposud jsme se zaby vali pouze na hodny mi velic inami, jejichz hodnoty lze smysluplne vyja dr it c ıśelne, pr ic emz c ıśelne hodnoty te chto velic in majı skutec ne vy znam c ıśel hodnot, nikoliv pouze c ıślic, symbolu, znaku nebo pouze por adı c i uspor a da nı. Takove to velic iny se ve ts inou nazy vajı kvantitativní (c ıśelne, numericke, ne kdy te z kardina lnı ). Pr esne ji r ec eno: Kantitativní se nazývají ty veličiny, u nichž rozdíl a případně i podíl (pome r) dvou změřených hodnot těchto veličin má reálný význam. [12, str. 137] Ne vs echny na hodne velic iny jsou kvantitativnı. Nekvantitativnı velic iny se nejc aste ji oznac ujı jako velic iny kvalitativní. My jsme na ne narazili jiz pr i povı da nı o charakteristika ch polohy, kde jsme mimo jine r ıḱali, z e: modus je pouz itelny u jmenných nominálních prome nny ch, ktere naby vajı rovnocenny ch variant. Proto je nelze je ani porovna vat, ani ser adit. Napr ıḱlad: pohlavı, na rodnost, znac ka hodinek, barva svetru, medián lze pouz ı t u pořadových ordinálních prome nny ch, u ktery ch lze stanovit por adı a tıḿ je vza jemne porovna vat (pouze na za klade por adı ) nebo ser adit. Napr ıḱlad: zna mka ve s kole, velikost ode vu (S, M, L, XL), medaile ve sportovnıćh soute z ıćh (zlata, str ı brna, bronzova ), Kvalitativnı na hodne velic iny jsou ze sve podstaty cha pa ny jako diskre tnı na hodne velic iny. Mnoho statisticky ch metod vypracovany ch pro kvantitativnı velic iny (kvantitativnı data) nelze pouz ı t pro velic iny kvalitativnı (napr ıḱlad u nomina lnıćh velic in nema z a dny smysl i zcela be z ny pojem str ednı hodnoty). Pro analy zu nomina lnıćh a ordina lnıćh na hodny ch velic in se pouz ı vajı buď upravene metody pro velic iny kvantitativnı, nebo metody zcela specia lnı.

164 Pome rne c asto se vyskytujıćı statistickou u lohou je rozhodnout, zda dve na hodne velic iny, ktere nejsou kvantitativnı, spolu ne jak vy znamne souvisı, zda jsou c i nejsou vza jemne za visle. Pr itom mu z e jı t jak o velic iny nomina lnı (jmenne ), tak i ordina lnı (por adove ). Rozhodnutı o za vislosti c i neza vislosti dvou kvalitativnıćh na hodny ch velic in je moz ne uc init pomocı testu nezávislosti v kontingenční tabulce. Příklad [12, str. 138]: Ma me rozhodnout, zda je chuť urc ite ho druhu vıńa ne jak ovlivne na materiálem na doby (sudu, tanku, demiz onu, ), ve ktere bylo vıńo skladováno. Oznac ıḿe X materia l na doby s hodnotami dr evo, sklo, kov a plast. Da le oznac ıḿe Y chuť dane ho druhu vıńa, hodnocenou znalcem na tr ı hodnotove s ka le hodnotami pp podpru me rna, Pr Pru me rna a np nadpru me rna. X a Y jsou zr ejme kvalitativnı na hodne velic iny, pr ic emz chuť Y je velic ina ordina lnı (por adova ) a materia l sudu X je velic ina pouze nomina lnı (jmenna ). Pro posouzenı za vislosti te chto dvou velic in expert posuzoval chuť vıńa celkem v 1097 na doba ch z ru zny ch materia lu. Vy sledky jsou uvedeny v na sledujıćı kontingenc nı tabulce, v nıź jsou jiz dopoc teny r a dkove a sloupcove souc ty (srovnej s levou tabulkou). materia l na doby chuť vıńa stanovena expertem pp podpru me rna Pr Pru me rna np nadpru me rna d r evo s klo k ov p last Z tabulky lze ihned zjistit, z e napr ıḱlad sklene ny ch na dob s vıńem nadpru me rne chuti bylo 16, plastovy ch s pru me rnou chutı 130 atd. Z r a dkovy ch a sloupcovy ch souc tu (na prave m a spodnıḿ okraji tabul-

165 ky) mu z eme zjistit napr ıḱlad, z e vs ech kovovy ch na dob bylo 413, vs ech na dob s podpru me rnou chutı vıńa bylo 407 atd. Nas ıḿ u kolem je otestovat (viz testy statisticky ch hypote z) na hladine vy znamnosti α = 1 % nulovou hypote zu H : chuť vıńa neza visı na materia lu na doby, ve ktere bylo vıńo skladova no, proti alternative H : tyto dve velic iny nejsou neza visle. Je velmi vhodne [12, str. 144] urc it nejprve c ıśelne hypoteticke c etnosti jednotlivy ch polıć ek, tedy hodnoty n, = r, s (kde r je r a dkovy a s sloupcovy index) a tyto hypoteticke c etnosti (v za vorce) vepsat pr ıḿo do kontingenc nı tabulky pod pr ıślus ne c etnosti skutec ne napozorovane. n, = n n = 99,80 n n 1 097, = n n = 79,06 n materia l na doby d s k p chuť vıńa pp Pr np n = (99,80) (117,70) (51,49) (44,89) (52,94) (23,16) (153,23) (180,71) (79,06) (109,08) (128,64) (56,28) n = V nas em pr ıṕade jde o dvourozme rny test dobre shody, ktery je analogiı pozde ji uva de ne ho testu chı kvadra t. Testove krite rium potom je χ = + (,), 30,176. (n, n, ) n, + (,), = (100 99,8) + 99,8 + + (,), Obor pr ijetı hypote zy je I = 0 ; χ [(r 1) (s 1)] 16,812 I, = 0 ; χ,(3 2) = 0 ; χ,(12) Protoz e χ I, mu z eme s velkou spolehlivostı (99 %) prohla sit, z e chuť vıńa za visı (statisticky) vy znamne na materia lu na doby.

166 V uvedene m pr ıḱladu jsme mohli spolehlive tvrdit, z e chuť vıńa za visı na materia lu na doby, ve ktere bylo vıńo dels ı dobu uskladne no. Dals ı pr irozenou ota zkou by po proka za nı za vislosti samozr ejme me lo by t, jakým způsobem, závisí chuť vína na materiálu nádoby? jaky materia l pu sobı na chuť pr ıźnive, jaky nepr ıźnive, pr ıṕadne neutra lne? Jiny mi slovy, v jaky ch polıć cıćh kontingenc nı tabulky je pozorovana c etnost vy razne mens ı c i vy razne ve ts ı nez by me la by t v pr ıṕade neza vislosti. Ktere kombinace chuti a materia lu jsou vy razne me ne c etne, nez kdyby chuť neza visela na materia lu? Ktere jsou naopak vy razne c etne js ı? Jes te jinak: ktera polıć ka jsou zodpove dna za zamı tnutı hypote zy neza vislosti? Aniz bychom uva de li pr esne statisticke postupy pro rozhodova nı, kdy je v jednotlivy ch polıć cıćh pozorovaná c etnost výrazně jiná nez c etnost hypoteticka (předpokládaná), naznac ıḿe zde mys lenku takove analy zy za vislosti, spolehlive pr edtıḿ testem neza vislosti proka zane (ne kdy se take mluvı o analy ze polıć ek kontingenc nı tabulky). Z porovna nı skutec ne pozorovany ch a hypoteticky ch c etnostı polıć ek kontingenc nı tabulky mu z eme c asto uc init alespon zhruba ne jake za ve ry o typu proka zane za vislosti [12, str. 145]. Pokusme se o to pro situaci z pr edchozı ho pr ıḱladu a porovnejme napozorovane (skutec ne ) a hypoteticke (pr edpokla dane ) c etnosti polıć ek v tabulce (budeme postupovat po r a dcıćh odspodu): Ze 4. řádku je vide t, z e bylo pozorova no vy razne vıće (nez kdyby byla chuť neza visla na materia lu) plastovy ch na dob s podpru me rnou chutı vıńa (124 mıśto zhruba 109), naopak vy razne me ne nez pr i neza vislosti bylo plastovy ch na dob s nadpru me rnou chutı (40 mıśto zhruba 56). Poc ty plastovy ch na dob s pru me rnou chutı se vy razne nelis ı. Z toho mu z eme usoudit, z e zr ejme plastovy materia l zvys uje poc et vzorku s podpru me rnou chutı na u kor vzorku s chutı nadpru me rnou. Tedy z e plast zr ejme zhors uje chuť vıńa. Ze 3. řádku je obdobne vide t, z e je vy razne me ne nez pr i neza vislosti kovovy ch na dob s pru me rnou chutı vıńa a naopak vy razne vıće te chto na dob s nadpru me rnou chutı. Kovovy ch na dob s podpru me rnou

167 chutı je pr ibliz ne stejne. Kov tedy zr ejme zvys uje poc et nadpru me rny ch vzorku na u kor pru me rny ch zleps uje pru me rnou chuť. Ze 2. řádku se da usoudit, z e sklo zvys uje poc et pru me rny ch vzorku na u kor vzorku podpru me rny ch i nadpru me rny ch zpru me rn uje chuť. Z 1. řádku je vide t, z e u dr eve ny ch na dob se pozorovane poc ty na dob s jednotlivy mi chute mi vıńa te me r nelis ı od poc tu pr edpokla dany ch, oc eka vany ch pr i neza vislosti. Lze usuzovat, z e dr evo neovlivn uje vy razne chuť vıńa. Pr esny ch postupu (obdobny ch vy s e jen zhruba naznac ene interpretaci vy sledku ) v pr ıṕade zamı tnutı hypote zy neza vislosti je v literatur e cela r ada. Ne ktere z nich v podstate pouze urc ujı, co znamena pojem vy razna odlis nost pozorovane a pr edpokla dane c etnosti v polıć ku tabulky. Nejpouz ı vane js ı je asi tak zvane znaménkové schéma, ktere dopln uje zname nko PLUS a MÍNUS do te ch polıć ek tabulky, u ktery ch se pr ıślus ny m specia lnıḿ testem (na zadane hladine vy znamnosti α) spolehlive proka z e, z e pozorovana c etnost polıć ka je ve ts ı, pr ıṕadne mens ı, nez by me la by t pr i hypote ze neza vislosti. Pro zájemce. Uve domme si, z e v uvedene m pr ıḱladu chceme proka zat nezávislost dvou veličin X a Y, nebo-li odmı tnout jejich za vislost. Pokud se to nepodar ı, budeme konstatovat, z e velic iny jsou za visle jedna na druhe. Pr evedeme-li nas i u vahu do terminologie pravde podobnosti jevu, pak jev X znamena, z e u na hodne vybrane ho vzorku vıńa se budeme zajıḿat o materia l na doby, v jake bylo dane vıńo uskladne no;

168 Y znamena, z e u na hodne vybrane ho vzorku vıńa se budeme zajıḿat o to, jakou ma chuť a na s potom zajıḿa, zda jsou tyto dva jevy vzájemně nezávislé. Za pr edpokladu, z e jsou tyto jevy vza jemne neza visle, mu z eme podle vzorce (6) pr ıḿo spoc ı tat pravde podobnosti jednotlivy ch polıć ek v tabulce (srovnej s pravou tabulkou). Ke stanovenı jednotlivy ch ptavde podobnostı vyuz ijeme vzorce (1) pro statistickou deinici pravde podobnosti. Potom napr ıḱlad P(d pp) () = P(d) P(pP) () = n n n n = n n n a teoreticka (oc eka vana, hypoteticka ) c etnost vypoc tena podle upravene ho vzorce (1) pr i platnosti pr edpokladu neza vislosti je: n, = n P(d pp) = n n n n = n n n Podmínky použi testu. Uva dı se [12, str. 143], z e popsany test neza vislosti v kontingenc nı tabulce, se da bez ve ts ıćh chyb pouz ı t jen v te ch pr ıṕadech, kdy je hypotetická četnost každého políčka alespoň 1 a alespon pro 80 % polıć ek je tento odhad hypoteticke c etnosti alespon 5. K dosaz enı te chto poz adavku lze c asto (ma -li to ne jaky rea lny du vod) slouc it ne ktere dve i vıće sousednıćh hodnot velic iny X nebo Y do hodnoty jedine, pr ıṕadne ne kterou ma lo c etnou hodnotu zcela vypustit. Tıḿ vznikne mens ı kontingenc nı tabulka s obecne ve ts ıḿi hypoteticky mi c etnostmi polıć ek.

169 Etapy stascké práce Pr i statisticke pra ci se ve ts inou rozlis ujı c tyr i kroky: Formulace problému. Co chceme zjistit, koho (pr ıṕadne c eho) se dany proble m ty ka. Šetření (sbe r dat). V pr edchozıḿ pr ıḱladu jsme data obdrz eli s lo o sestavenı druhotne statistiky. Zpracování bylo podstatou pr edchozı ho pr ıḱladu sestavenı tabulky a urc enı c ıśelny ch charakteristik. Tedy analýza shroma z de ny ch dat vedoucı k zıśka nı potr ebne informace. Vyhodnocení zıśkane informace bude probıŕa no v na sledujıćıćh kapitola ch. Daleko nejdu lez ite js ı c a stı pra ce se zda by t vyhodnocenı tıḿ se zpravidla zaby vajı uc ebnice statistiky nejpodrobne ji. Nesmıḿe vs ak zapomenout na elementa rnı pravdu: žádná statistika nemůže být lepší než její surovina [14, str. 133], tak jako nemu z e by t spra vny u sudek, jsou-li nespra vne pr edpoklady (z nepravdy klidne mu z e vyply vat pravda, jak se uc ı ve vy rokove logice). Stejne tak jsou k nic emu nejobtıź ne js ı poc etnı operace, kdyz c ıśelny materia l je hned od poc a tku nespra vny nebo nedostac ujıćı. A co je jes te hors ı poc etnı chyby lze opravit, nevhodne metody zpracova nı mohou by t nahrazeny leps ıḿi. Ovs em pokud je prvotnı za znam u daju chybny, ve ts inou jiz s tıḿ nejde nic de lat. Co tedy mu z eme ude lat, abychom tomu v praxi pr edes li? Prvnı ota zkou je, zda vıḿe, co vlastne chceme. Nenı tomu tak vz dy, protoz e mnohe statisticke u daje u r ady shromaz ďujı v oc eka va nı, z e pozde ji mohou poslouz it jako cenne podklady, aniz se v dane m okamz iku da pr esne r ıći, co se vlastne hleda. Kdyz je moz ne pouz ı t bohate ho materia lu u r ednıćh statistik a pouze je zapotr ebı jej uspor a dat z jine ho hlediska, mluvıḿe o sestavení druhotné statistiky. Protikladem tomu je zhotovení prvotní statistiky, kde musıḿe nejprve u daje zıśkat zjis ťova nıḿ a prove st jejich c lene nı (tr ı de nı ) a kdy se nepouz ı va u daju, ktere jsou k dispozici.

170 Pozorova nıḿ, sc ı ta nıḿ a me r enıḿ mohou statistikove zıśkat jen zlomek c ıśelne ho materia lu. Sta le znovu se ukazuje jako nezbytne pouz ı t anketnı ho s etr enı (dotazova nı ). Pro rozlehle oblasti pru zkumu trhu a ver ejne ho mıńe nı je to samozr ejme, neboť trh se skla da z vıće nebo me ne koupe chtivy ch lidı, jejichz ochota kupovat se ma prozkoumat. A mıńe nı (zcela subjektivnı pr edstava) je me r itelne pouze tak, kdyz se projevı ne jakou akcı (napr ıḱlad odevzda nıḿ hlasu pr i volba ch). Ovšem pozor! Zpracova vane (ne kaz - Obra zek 4: Pr evzat z [14]

171 dy je odevzda ) anketnı odpove di nemusejı pr edstavovat vy be r pr esne odpovı dajıćı za kladnıḿu souboru, ze ktere ho byl vybra n. Takz e mu z eme obdrz et zkreslene vy sledky. Cıĺem tohoto kurzu je nauc it se statistiky c ıśt, kriticky je posuzovat a pokusit se odhalovat statistiky chybne nebo ve dome zkreslene. Poznámka. Slovu statistika by va da va n nejru zne js ı vy znam. Jednou jsou to vyplne ne statisticke vy kazy c i dotaznıḱy, pr ıś te tak nazveme nejru zne js ı c ıśelne u daje uver ejne ne ve sde lovacıćh prostr edcıćh. Oicia lne lze slovo statistika pouz ı vat nejme ne ve tr ech pojetıćh: Číselné údaje o hromadny ch jevech. Prakcká činnost spoc ı vajıćı ve sbe ru, zpracova nı a vyhodnocova nı dat. Teorecká disciplína zaby vajıćı se metodami vyhodnocenı hromadny ch jevu. A to je ta sloz ita matematika, kterou pr enecha me profesiona lnıḿ statistiku m. My si dopr ejeme toho pr epychu, z e mu z eme vy sledky jejich pra ce (za splne nı pr edpokladu ) s du ve rou vyuz ı vat. A proc jsme v cele te to kapitole mluvili o za kladnıḿ souboru (populaci), vy be rovy ch souborech, empiricky ch charakteristika ch c i empiricky ch za konech rozde lenı? Vy be rove s etr enı (nezkouma me celou populaci, ny brz pouze jejı vybranou c a st) samozr ejme nedosahuje pr esnosti, jakou by na m pr ineslo zkouma nı cele populace. Proc tedy da vat pr ednost pouz itı vy be ru? Úspora času i finančních prostředků a fyzicka proveditelnost vu bec, zejme na u rozsa hle populace. Destrukvní testy me r enı pevnosti, z ivotnosti, Odpove zte si sami, k c emu by vedlo testova nı cele populace. Základní soubor nemusí být vždy dostupný napr ıḱlad pr edvolebnı pru zkumy.

172 A tady nara z ıḿe i na limity statistiky. Ty nejsou, paradoxne, v matematicky ch metoda ch, ny brz pr edevs ıḿ ve sbe ru dat. Nejve ts ıḿ proble mem by va sestavenı vy be rove ho souboru tak, aby co nejle pe promı tal vlastnosti cele populace (volby, test integrovany ch obvodu na jedne desce, vy be r vy robku pro pr ejıḿku pohodlnost ) a pak take lidsky faktor (placene dotaznıḱy, snaha upravit u daje tak, aby odpovı daly poz adavku m nadr ıźene ho).

173 U vod do Statistické indukce

174 Obsah kapitoly: Stascká indukce 1. Bodové odhady parametrů Intervalové odhady parametrů 179 Str ednı hodnota μ populace s norma lnıḿ rozde lenıḿ Rozptyl σ populace s norma lnıḿ rozde lenıḿ Testy stasckých hypotéz Postup pr i testova nı hypote z Klasicke testova nı Vybrane parametricke testy Test o str ednı hodnote μ norma lnı ho rozde lenı Test o rozptylu σ norma lnı ho rozde lenı Vybrane testy shody Pr ıḱlad: χ test dobre shody (Pearsonu v) Pr ıḱlad: Kolmogorovu v Smirnovu v jednovy be rovy test shody Příklad bodový a intervalový odhad střední hodnoty, test velikos střední hodnoty 222 Volba testovy ch krite riı Pouz itı testovy ch krite riı Závěr kapitoly Čistý test významnos 249

175 Úvod kapitoly Za kladnı u lohou matematicke statistiky je zobecne nı (zvane v tomto oboru statisticka indukce c i statisticke usuzova nı ): zkouma se, jak informace zjis te ne o prvcıćh vy be ru zobecnit na celou populaci ²⁸. Za u c elem, abychom zıśkali pr edstavu o vlastnostech za kladnı ho souboru (populace) a nemuseli vys etr ovat vs echny jeho prvky ²⁹, vybereme na hodny m zpu sobem, vza jemne neza visle n prvku ze za kladnı ho souboru. Dostaneme tak vzorek n prvku (x, x,, x ), pro ne hoz hodnoty zkoumane ho znaku zjistı me ³⁰. Nebo-li vypoc teme empirické charakteristiky (statistiky). Podle vy sledku vy be rovy ch zkouma nı si poma ha me pr i rozhodova nı typu: tato nerovnome rnost vy roby nemu z e by t jen nahodila, tento le k se zda by t vy znamne u c inne js ı, tuto zda nlivou shodu dvou jevu je moz no vysve tlit pu sobenıḿ na hody. Pouz ı vane metody se opıŕajı o za kon velky ch c ıśel a pr ı buzne ve ty teorie pravde podobnosti (coz pr esahuje ra mec te to příručky); ty ukazujı, z e pr i rostoucıḿ rozsahu reprezentativnı ho vy be ru se empiricke charakteristiky vy be ru (bodovy odhad) obvykle limitne blıź ı skutec ny m hodnota m na cele populaci. Matematicka statistika za roven stanovuje, jak pr esny tento odhad pro dana data je (intervalovy odhad), anebo testuje, zda vlastnosti vzorku jsou sluc itelne s pr edpoklady o chova nı cele populace (testova nı statisticky ch hypote z). Uve domme si, z e na rozdıĺ od charakteristik za kladnı ho souboru, ktere jsou konstanty, jsou empiricke vy be rove charakteristiky (nebo-li charakteristiky vypoc tene z provedene ho vy be ru) náhodnými veličinami, protoz e jejich hodnoty mohou by t pro kaz dy vy be r rozdıĺne. ²⁸ HENDL, J. Přehled statistických metod zpracování dat. Praha : Porta l, 2004, str. 18. ISBN ²⁹ Du vody, proc nezkouma me cely za kladnı soubor, jsme uva de li na za ve r pr edchozı kapitoly nazvane Popisna statistika. ³⁰ Ovs em takovy ch vy be ru z jednoho za kladnı ho souboru mu z eme prove st vıće a pokaz de dostaneme jiny vzorek. Takz e empiricke charakteristiky ru zny ch vzorku nemusejı by t stejne. V te to kapitole budeme zkoumat vztahy, mezi rozde lenıḿ pravde podobnosti konkre tnı ho znaku za kladnı ho souboru a rozde lenıḿ pravde podobnosti stejne ho znaku v jednotlivy ch vy be rech vytahovany ch ze za kladnı ho souboru.

176 Bodové odhady (vybraných) parametrů Bodovy m odhadem charakteristiky za kladnı ho statisticke ho souboru rozumıḿe takove číslo, ktere hodnote toho parametru odpovı da. Bodovy odhad (odhad jedinou hodnotou) na s zda nlive napln uje jistotou pr esne stanovene ho c ıśla, ktere na m umoz n uje bez proble mu s tıḿto odhadem pracovat; napr ıḱlad jej srovna vat s ne jaky m pr edepsany m limitem. Opak je ovs em pravdou! Protoz e bodovy odhad se prakticky nikdy nemu z e streit do odhadovane hodnoty a pr i opakovane m urc enı odhadu s jiny m vy be rem dostaneme te me r vz dy jinou hodnotu odhadu. Zpravidla lze z vy be rove ho souboru vypoc ı tat ne kolik ru zny ch (vy be rovy ch) charakteristik, pomocı nichz mu z eme odhadovat nezna my parametr za kladnı ho souboru (populace). Napr ıḱlad str ednı hodnotu symetricke ho za kladnı ho souboru mu z eme odhadnout tak, z e ze vzorku (vy be ru) urc ıḿe aritmeticky pru me r (pr ıṕadne jiny pru me r), modus nebo media n. Tyto vy be rove charakteristiky ale neposkytujı stejne kvalitnı odhady. Vhodná výběrová charakteristika (k provedenı odhadu pr ıślus ne ho parametru za kladnı ho souboru) spln uje na sledujıćı krite ria (ma vhodne vlastnosti). Je: konzistentní pro velky poc et dat ve vzorku je ma lo pravde podobne, z e odhad se vy znamne lis ı od zkoumane charakteristiky; nestranná (nevychy lena, nezkreslena ) vybereme-li jiny vzorek, odhady se sice budou lis it, ale jejich pru me r je velmi blıźky zkoumane charakteristice. Jinak r ec eno: pouz ita charakteristika systematicky nenadhodnocuje ani nepodhodnocuje odhadovany parametr. vydatná (eicientnı ) nestranny odhad, jehoz rozptyl je nejmens ı mezi vs emi nestranny mi odhady pr ı slus ne ho parametru

177 dostatečná obsahuje ves kerou informaci o sledovane m parametru, kterou mu z e vy be rovy soubor poskytnout. Znamena to, z e z a dny jiny parametr neobsahuje ve ts ı mnoz stvı informace o vy be rove m souboru. Existuje r ada metod, pomocı nichz lze zıśka vat bodove odhady. Mezi nejzna me js ı patr ı metoda nejmens ıćh c tvercu, momentova metoda nebo metoda maxima lnı ve rohodnosti. Bliz s ı informace o teorii odhadu lze zıśkat v pr ıślus ne literatur e. Ukazuje se (za kon velky ch c ıśel a spol.), z e pro za kladnı soubor s normálním rozdělením platı : μ: Aritmetický průměr x vzorku (vy be ru) je nejleps ı (ve smyslu vy s e zmıńe ny ch vlastnostı ) bodovy odhad střední hodnoty μ za kladnı ho souboru (populace) s norma lnıḿ rozde lenıḿ. σ: Podobne ze vzorku (vy be ru) zjis te na empiricka charakteristika výběrová směrodatná odchylka S je nejleps ı odhad sme rodatne odchylky σ za kladnı ho souboru s norma lnıḿ rozde lenıḿ. Analogicke za ve ry platı i pro jine charakteristiky, pr ıṕadne i pro jina rozde lenı za kladnı ho souboru. Jak jsme jiz uvedli, bodovy m odhadem se nikdy nemu z e pr esne streit do spra vne hodnoty hledane ho parametru. Mu z eme jen pr edpokla dat, z e se odhadovane spra vne hodnote vıće c i me ne pr iblıź il. Je tedy vhodne js ı pokusit se zachytit odhadovanou hodnotu v urc ite m rozmezı (intervalu, ktery hledany parametr pokry va ) kolem bodove ho odhadu, protoz e bodovy odhad obvykle neposkytuje z a dnou pr edstavu o pr esnosti (spolehlivosti) zıśkane aproximace. Pr itom termıń spolehlivost 90 % ve ts inou odpovı da pr edstave, z e vy pove ď bodove ho odhadu je z 90 % spra vna. Pr itom ve dome pr ipous tıḿe 10% chybu. Cele to ale mu z eme r ıći take jinak: Vy sledek (bodovy odhad) je statisticky významný na hladině 10 %, protoz e by jen c irou na hodou nenastal v 90 % pr ıṕadu. To je pravde podobnost jistoty, ktera vymezuje take interval spolehlivosti.

178 Proto se poc ı ta takzvany intervalovy odhad, jehoz vy sledkem je interval spolehlivosti (konidenc nı interval), tedy interval, v ne mz se s jistou pr edem zadanou pravde podobnostı nacha zı hodnota hledane statistiky za kladnı populace. Pr itom stanovenı intervalu spolehlivosti (jeho s ıŕ ka rozpe tı ) vu bec neza visı na velikosti populace. Jedine velikost vzorku a jeho homogenita ovlivn ujı velikost chyby. Pr edstavme si na sledujıćı pr ıṕad. Zkouma me ty dennı konzumaci piva ve dvou skupina ch studentu. skupina I poc et piv skupina II poc et piv 1. student student student student student 8 40 Souc et: Aritmeticky pru me r: 8 8 Pro obe skupiny jsme obdrz eli zcela shodny pru me r, 8 piv za ty den. Je zr ejme, z e pru me r 8 reprezentuje skupinu I perfektne. Ale skupina II je vlastne skupina abstinentů, do které se vloudil jediný pivní hrdina, ktery se snaz ı udrz et pru me rnou konzumaci piva na u rovni srovnatelne se skupinou I. Je nesporne, z e rozdıĺ mezi dve ma pru me ry signalizuje pr ı tomnost souvislosti mezi prome nnou, podle ktere byli jedinci rozde leni do dvou vy be ru, a prome nnou popsanou jako pru me r. Proble m je jenom v tom, jak zjistit, z e ten rozdıĺ mezi dve ma pru me ry je dostatec ne vy znamny. Teď jiz vıḿe, z e nestac ı vzı t v u vahu jen velikost vzorku, ale i to, jak je vzorek (a potaz mo cela populace) homogennı.

179 My jsme jiz ne ktere intervalove odhady pro soubory s norma lnıḿ rozde lenıḿ zmin ovali, kdyz jsme v pravidle tří sigma uva de li, z e se v tomto intervalu nacha zı pr ibliz ne 99,7 % vs ech hodnot na hodne prome nne. Lze to interpretovat take tak, z e se spolehlivostı 99,7 % padne str ednı hodnota μ do tohoto intervalu. Podobne pravidlo dvou sigma urc uje interval, ktery pr ibliz ne s 95% spolehlivostı vymezuje str ednı hodnotu μ dane ho souboru. Dals ı intervalove odhady si uka z eme nynı. Intervalové odhady (vybraných) parametrů Intervalovy m odhadem charakteristiky (parametru) za kladnı ho statisticke ho souboru rozumıḿe interval spolehlivosti (konidenc nı interval), ktery tuto charakteristiku (s velkou pravde podobnostı spolehlivost odhadu) pokry va (charakteristika v tomto intervalu lez ı ). 95% spolehlivost znamena ³¹, z e skutec na proporce zkoumane ho znaku existujıćı v populaci (za kladnıḿ souboru), se nale za s pravde podobnostı 95 % uvnitr stanovene ho intervalu spolehlivosti (kon- idenc nı ho intervalu). Kdybychom vytvor ili 100 vzorku obdobne velikosti, pravde podobne jen v pe ti vzorcıćh by bylo moz ne, z e skutec na proporce zkoumane ho znaku by lez ela POD nebo NAD (proste vne ) vypoc ı tany m konidenc nıḿ intervalem (intervalem spolehlivosti). ³¹ Zda postac ı 95 % jistoty c i nikoliv, nelze r ıći vs eobecne. O tom je zapotr ebı rozhodnout v kaz de m jednotlive m pr ıṕadu samostatne. Jestliz e chceme dosa hnout vys s ı spolehlivosti, je nutne zkoumat ve ts ı vy be rove soubory. Jestliz e se nema vydat moc pene z a postac ı -li pr ibliz ny pr ehled (jako napr ıḱlad u mnohy ch ota zek pru zkumu trhu) je postac ujıćı 90 % c i jes te niz s ı hodnota. Jde-li o zvla s te velmi za vaz ne rozhodnutı (medicıńa, letectvı, atd.) bude snaha dosa hnout i vys s ı pravde podobnosti jak 99 %.

180 Je zr ejme, z e c ıḿ vys s ı spolehlivost odhadu poz adujeme, tıḿ s irs ı interval spolehlivosti bude (hledana hodnota se v ne m musı nacha zet s vys s ı pravde podobnosti). Bohuz el to vs ak ubıŕa na jeho vypovı dacı schopnosti, jeho významnost klesa. Uvědomte si, jaká je vypovídací schopnost informace, že průměrný věk všech lidí na zemi leží se 100% spolehlivostí v intervalu od 0 do 195 let. Proto v praxi vz dy hleda me kompromis mezi spolehlivostı a vy znamnostı (vypovı dacı schopnosti). Oznac ıḿe-li spolehlivost odhadu (1 α), pak α se nazy va hladinou významnosti. Je zr ejme, z e s rostoucı spolehlivostı odhadu klesa hladina vy znamnosti. Intervaly spolehlivosti konstruujeme jako jednostranné (du lez ita je pouze jedna mez; odhadujemeli napr ıḱlad de lku z ivota ne jake ho zar ıźenı, je pro na s du lez ita pouze dolnı mez pak mluvıḿe o levostranne m intervalu spolehlivosti / v pr ıṕade hornı meze pak pravostranne m) nebo dvoustranné. Zajıḿajı -li na s obe meze odhadu (dolnı i hornı ), konstruujeme oboustranny interval spolehlivosti. Ve ts inou tyto meze urc ujeme tak, aby pravde podobnost, z e parametr populace (za kladnı ho souboru) lez ı pod dolnı mezı, byla stejna jako pravde podobnost, z e lez ı nad hornı mezı a byla rovna. Pozor! Dolní (horní) mez dvoustranne ho intervalu spolehlivosti nenı stejna jako mez u levostranného (pravostranného) intervalu spolehlivosti. Obecne metody konstrukce intervalu spolehlivosti jsou znac ne na roc ne. Pro nas e u c ely se omezıḿe na dvoustranné intervaly spolehlivosti pro parametry normálního rozdělení, ktere jsou dobr e prozkoumane (i proto se tak c asto setka me s poz adavkem na normalitu zpracova vany ch dat). Normalita (pr edpoklad, z e data pocha zejı z norma lnı ho rozde lenı ) je hlavnıḿ pr edpokladem o datech v drtive ve ts ine analy z a testu. Ověření normality si za chvıĺi uka z eme pomocı testu shody (pr ile havosti). Zopakujme, z e 90% interval spolehlivosti odhadu str ednı hodnoty bude s pravde podobnostı 90 % obsahovat skutec nou str ednı hodnotu za kladnı ho souboru μ.

181 Střední hodnota μ. Ma me na hodny vy be r z populace s normálním rozdělením N(μ; σ ), u ktere ho nezna me ani str ednı hodnotu μ, ani roptyl σ. Potom str ednı hodnota μ se 100(1 α)% spolehlivostı padne do intervalu x S n t (n 1); S x + n t (n 1) kde: x je aritmeticky pru me r dane ho vzorku, S je vy be rova sme rodatna odchylka (druha odmocnina vy be rove ho rozptylu) vzorku, n je rozsah vzorku (poc et zıśkany ch dat, ktera ma me k dispozici) a t je kvantil Studentova rozde lenı, ktery najdeme ve statisticky ch tabulka ch, nebo pomocı Excelu 2010: =T.INV.2T(α;n). Napr ıḱlad pro hladinu vy znamnosti α = 5 % a n = 16 takto: Tedy α je c ıślo, ktere je kladné a blízké nule ³². Vs imne te si, z e pr i konstantnıḿ rozsahu vy be ru se s rostoucı spolehlivostı (α se zmens uje hodnota kvantilu t roste) s ıŕ ka intervalu zve ts uje. Naopak, s rostoucıḿ rozsahem na hodne ho vy be ru n s ıŕ ka intervalu klesa (de lıḿe ve ts ıḿ c ıślem a take hodnota kvantilu t klesa ), takz e se odhad zpr esn uje (pr i ³² Proc volıḿe parametr α blıźky nule? Pr edstavme si na sledujıćı situaci: Pr ed trestnıḿ sena tem stojı obvine ny, coz ovs em mu z e by t jak zloc inec, ktery projedna vany trestny c in skutec ne spa chal, tak bezu honny c love k, ktery s projedna vany m trestny m c inem nema naprosto nic spolec ne ho. Vyneseny rozsudek mu z e dopadnout c tyr mi zpu soby. Dva z nich jsou spra vne a tudıź oc eka vane (1. potresta nı zloc ince, 2. osvobozenı nevinne ho) a ve dvou soud pochybil (3. osvobozenı zloc ince, 4. potresta nı nevinne ho). Zvla s te poslednı (c tvrty ) pr ıṕad ma z hlediska odsouzene ho fata lnı du sledky. Proto se v praxi snaz ıḿe co nejvıće omezit vy skyt tohoto druhu chyb. Vıće o chyba ch a jejich druzıćh uvedeme v kapitole Testy statistických hypotéz.

182 konstantnı spolehlivosti). Da le pokud je rozsah vy be ru velky (v r a du stovek a vıć), lze mıśto kriticky ch hodnot Studentova rozde lenı (dıḱy centra lnı limitnı ve te ) pouz ı t kriticke hodnoty norma lnı ho rozde lenı. Rozptyl σ. Ma me na hodny vy be r z populace s normálním rozdělením N(μ; σ ) u ktere ho nezna me ani str ednı hodnotu μ, ani rozptyl σ. Potom rozptyl σ se 100(1 α)% spolehlivostı (α kladné blízké nule) padne do intervalu (n 1) S (n 1) S χ ; (n 1) χ (n 1) kde: S je vy be rovy rozptyl zkoumane ho vzorku, n je rozsah vzorku (poc et zıśkany ch dat, ktera ma me k dispozici) a χ je kvantil rozde lenı chı kvadra t, ktery najdeme ve statisticky ch tabulka ch, nebo pomocı Excelu 2010: =CHISQ.INV.RT(α;n). Napr ıḱlad pro hladinu vy znamnosti α = 1 % a n = 5 takto: V pr ıṕade jiny ch charakteristik nebo charakteristik pro jina rozloz enı za kladnı ho statisticke ho souboru (populace) odkazujeme za jemce na pr ıślus nou literaturu.

183 3. Testy stasckých hypotéz Jako uka zku typicke ho statisticke ho uvaz ova nı uvedeme na u vod bez pr esny ch statisticky ch formulacı na sledujıćı příklad: [12, str. 72] Ma me minci, o ktere chceme rozhodnout, zda je c i nenı férová (symetricka, homogennı, ). Statistickou metodou to lze prove st na sledujıćıḿ zpu sobem. Hodıḿe nkra t touto mincı a zjistıḿe, kolikra t z te chto n hodu padne Lıć. Z odstavce o binomicke m rozde lenı vıḿe, z e poc et lıću v n hodech mincı je na hodna velic ina X s binomicky m rozde lenıḿ pravde podobnosti s parametry n a p, kde p je pravde podobnost, z e v jednom hodu padne lıć. Jestliz e je mince férová, je p = 1 2. Nenı -li mince fe rova, je p. R ekne me, z e jsme provedli pokus a mincı hodili krát, pr ic emz lıć padl krát. Nynı uvaz ujeme na sledovne. Jestliz e je mince fe rova, ma na hodna velic ina X (poc et lıću v hodech) binomické rozdělení s parametry n = 10000, p = 0,5. Na s zajıḿa hodnota P(X > 5 100). Proc, to vysve tlıḿe v za ve ru pr ıḱladu. Jedno řešení: P(X > 5 100) = 1 P(X 5 100) = 1 F(5 100), kde F(5 100) je hodnota distribuc nı funkce binomicke ho rozde lenı, ovs em distribuc nı funkce nenı v te to pr ıŕuc ce pro binomicke rozde lenı uvedena. Hodnotu F(5 100) mu z eme (za předpokladu, že je mince férová) urc it napr ıḱlad takto: 1. Spoc ı ta me vs ech c lenu binomicke ho rozvoje ( ) 0,5 (1 0,5) podle vzorce (18) pro kaz de k od nuly do deseti tisıć.

184 2. Zıśkane hodnoty poskla da me podle velikosti a budeme hledat pr ıślus ny kvantil. Další řešení: Nebo mu z eme zkusit spoc ı tat hledanou prave podobnost pr ıḿo podle vzorce (18) P(X > 5 100) = P(X = k) = ,5 (1 0,5) = k Je vıće nez zr ejme, z e oba uvedene postupy jsou velmi pracne. Proto zkusıḿe na sledujıćı vylepšené první řešení podle [12]. Protoz e jde v nas em pr ıṕade o velmi velky poc et pokusu (r a dove desetitisıće), mu z eme podle pozna mky pod binomicky m rozde lenıḿ a s vyuz itıḿ vzorcu (19) pouz ı t distribuc nı funkci norma lnı ho rozde lenı s parametry N( ,5 ; ,5 0,5) = N(5 000; 2 500) nebo take N(5 000; 50 ) a potom P(X > 5 100) = 1 P(X 5 100) = 1 F(5 100) = 1 F = 1 F 50 (2) = zde vyuz ijeme tabelovane hodnoty distribuc nı funkce normovane ho norma lnı ho rozde lenı nebo bez provedene ho normova nı napr ıḱlad Excel 2010: =NORM.DIST(5 100;5 000;50;1) = 1 0, (Excel = 0, ) 0,023 = 2,3 % Poslednıḿ postupem na m po zaokrouhlenı vys la hodnota pravde podobnosti P(X > 5 100) = 2,3 %. Jiny mi slovy. Pravde podobnost, z e poc et lıću v hodech se lis ı od pru me rne hodnoty o vıće nez o 100, je pouze 4,6 %, protoz e P( X > 100) = P(X > 5 100) + P(X < 4 900) = 2,3 % + 2,3 % = 4,6 %

185 Tedy za pr edpokladu, z e mince je fe rova a poc et lıću v nas ich hodech byl (tedy poc et, ktery se lis il o vıće nez o 100 od oc eka vane hodnoty 5 000), nastal jeden z těch výsledků našeho pokusu, které byly před pokusem velmi nepravděpodobné (me ly pravde podobnost pouze 4,6 %). Předpoklad, z e mince je fe rova, tedy asi neplatí a proto rozhodneme, z e mince fe rova nenı. Ve statistice se r ıḱa, z e spolehlivost tohoto zamı tave ho rozhodnutı je velka, v tomto pr ıṕade konkre tne 95,4 % (coz urc ıḿe: 100 % 4,6 %). Tento zpu sob uvaz ova nı je typicky pro mnoho statisticky ch metod, specia lne pro tzv. testova nı hypote z. V tomto pr ıḱladu jsme stanovili hypote zu mince je férová a na za klade vy sledku pokusu ( hodu mincı ) jsme tuto hypote zu dostatec ne spolehlive (95,6 %) zamı tli. Mezi dals ı vy znamne ota zky pr i zpracova nı dat patr ı u vahy typu: Spln ujı data charakter norma lnı ho rozde lenı? Lis ı se hodnoty name r ene technikem A a technikem B? Lis ı se hodnoty zıśkane v ru zny ch c asovy ch intervalech? Lis ı se hodnoty zıśkane v mıśtech A a B? Lis ı se obsah u c inne la tky v le c ivu od deklarovane hodnoty? Lis ı se vy sledky zıśkane metodami A a B? K r es enı te chto (a jim podobny ch) ota zek vyuz ı va me metody testova nı statisticky ch hypote z, s jejichz pomocı lze hledat odpove di a c init za ve ry. V dals ıḿ nebudeme vytva r et takove testy, ale nauc ıḿe se pouz ı vat ne ktere z existujıćıćh. Tvorba testu se pak zme nı vlastne ve vy be r vhodne ho pouz ı vane ho testu pr i r es enı dane ho proble mu a aplikova nı vybrane ho testu na dany pr ıṕad.

186 Stasckou hypotézou rozumıḿe kaz dy (jaky koliv) pr edpoklad ³³ o nezna me vlastnosti rozloz enı na hodne prome nne cele ho za kladnı ho statisticke ho souboru. Pravdivost pr edpokladu mu z eme ove r ovat pomocı vy be ru por ıźene ho z uvaz ovane ho za kladnı ho souboru. Toto ověřování nazy va me testováním hypotézy. Ve ts inou na s zajıḿa, zda (z vy be ru) zıśkane empiricke charakteristiky, dostatec ne pr esne (pravdive ) popisujı odpovı dajıćı charakteristiky za kladnı ho souboru. V praxi c asto poz adujeme urc it, jak ma by t rozsa hly vy be r (vzorek), ktery by zabezpec il, abychom pr ı pustnou chybu odhadu urc ili s danou spolehlivostı. Příklad. Kupujıćı nechce platit za zajıće v pytli a chce dojednat přejímací kontrolu. Kupující pr evezme zboz ı jen tehdy, jestliže v náhodném výběru určitého rozsahu nepřekročí počet nevyhovujících kusů dohodnutý počet. Prodávající by naproti tomu me l ve de t, na jaky druh pr ejıḿacı (odbe ratelske ) kontroly mu z e pr istoupit a kdy se ma la kave objedna vky rade ji vzda t. Me l by totiz by t (na za klade be z ne vy robnı ³⁴ kontroly) schopen posoudit, do jake mıŕy asi jeho zboz ı odpovı da poz adavku m kupujıćı ho. Zcela bez proble mu je idea lnı pr ıṕad absolutne bezvadny ch se riı, protoz e nenı -li v za kladnıḿ souboru ani jediny vadny kus, nemu z e se objevit ani ve vzorku. Spıś e je ale nutno vycha zet z realisticke ho pr edpokladu, z e ves kere vyra be ne zboz ı nemu z e by t opravdu dokonale. Proto se hleda zpu sob, jak nale zt takovy zkus ebnı postup, ktery by vyhovoval jak odběrateli tak dodavateli a pr edevs ıḿ nebyl příliš nákladný. Jiny mi slovy: je potr eba vytvor it takovou pr ejıḿacı kontrolu, ktera by pokud moz no pr i male m vy be rove m souboru poskytla za ruku, z e odbe ratel (pokud vy robce dodrz ı svu j vy robnı standard) dosta- ³³ Hypote za znamena doslovne pr edpoklad c i domne nku, z e ne co by mohlo být tak a tak c i vysvětleno tak a tak. Je to domne nka, ktera mu z e vzniknout z okamz ite ho na padu nebo mu z e by t vypreparova na po dlouhy ch u vaha ch z urc ite pokusne r ady: Bylo by přece docela dobře možné, že nebo: Předpokládejme, že je možná souvislost. ³⁴ Vy robnı kontrola se prova dı be z ne a ma umoz nit vc as poznat a odstranit vy robnı za vady napr ıḱlad ser ıźenıḿ urc ite ho stroje nebo vyr azenıḿ zvla s ť nepozorne ho pracovnıḱa z vy robnı ho procesu. Odbe ratelska kontrola se naproti tomu prova dı pouze u te ch vy robku, ktere jiz pros ly sı tem vy robnı kontroly a o ktery ch se vy robce domnı va, z e plne odpovı dajı jeho norma m kvality.

187 ne s nejve ts ı pravde podobnostı uspokojivou jakost a proda vajıćı se s vysokou pravde podobnostı doc ka pr ejıḿky bez za vad. Oba, odbe rateli dodavatel, musı podstoupit jedine riziko: Kupujícímu se mu z e sta t, z e na hodny vzorek je podstatne leps ı nez skutec na jakost cele doda vky; Proto mu z e odebrat a zaplatit (o takovy chto chyba ch viz da le) doda vku zboz ı, ktera obsahuje vıće zmetku, nez je ochoten pr ipustit. Výrobci se mu z e pr ihodit, z e sice vyra bı pr eva z ne dobre zboz ı, ale z e (te me r ) vs echny vadne exempla r e proklouznou do vy be rove ho souboru. Příklad Proto odbe ratel mu z e odmı tnout pr evzı t doda vku zboz ı, ktera spln uje jeho pr edpoklady. [14, str.173] Odbe ratel je ochoten akceptovat 2 % zmetku, zatıḿco vy robce vı, z e jeho vy roba jich ma asi 1 %. V doda vane m mnoz stvı (za kladnı soubor) (N) kusu je tedy asi 10 (M) kusu vadny ch. Vzorek o rozsahu 100 (n) kusu byl stanoven dohodou. Mu z e vy robce klidne oc eka vat pr ejıḿacı zkous ku? Ne tak docela! Hypergeometrické rozdělení. Protoz e jde o statisticky vy be r bez opakova nı (kaz dy vy robek kontrolujeme pouze jednou, tedy ve vzorku bude skutec ne 100 ru zny ch vy robku ) mu z eme (viz kapitola Rozdělení diskrétní náhodné veličiny) r ıći E(X) = n M N = = 1 z e jaky koliv vzorek 100 vy robku urc eny ch k pr ejıḿacı kontrole bude v pru me ru obsahovat pouze jeden vadny vy robek.

188 Je vs ak docela dobr e moz ne, z e ve vzorku (vy be ru) budou 3 (k) vadne kusy, pr ıṕadne jes te vıće. Tr i zmetky ve vy be ru se mohou vyskytnout s pravde podobnostı stanovenou podle vzorce P(X = k) = M k ( ) N = n 10! 3! (10 3)! 990! 97! (990 97)! 1 000! 100! ( )! = = 10! 3! 7! 990! 97! 893! 1 000! 100! 900! = 0, Tedy pr ibliz ne s est ze stovky uskutec ne ny ch vy be ru bude obsahovat tr i zmetky a pr inejmens ıḿ dva vy be ry dokonce budou obsahovat c tyr i nebo vıće zmetku. Poznámka. Pokud se vy s e uvedene faktoria ly pokusı te spoc ı tat pomocı sve kalkulac ky, mu z e se va m sta t, z e u vys s ıćh c ıśel obdrz ı te hla s enı Result too large nebo Out of range c i ne co podobne ho. Proto je le pe vyuz ı t sluz eb Excelu 2010: =KOMBINACE(M;k) nebo jednodus eji

189 =HYPGEOM.DIST(k;n;M;N;0) nebo postupovat na sledovne :

190 Binomické rozdělení. Protoz e doda vka ma velky rozsah N (1 000 vy robku ), n (rozsah kontrolnı ho vzorku je pevne stanoven na 100 kusu ) a M/N (procento vyrobeny ch zmetku je 10/1 000) se neme nı, mu z eme (podle pozna mky pod hypergeometricky m rozde lenıḿ) toto hypergeometricke rozde lenı nahradit binomicky m s na sledujıćıḿi parametry: n = 100, p = M/N = 0,01. Tr i (k) zmetky ve vy be ru se mohou vyskytnout s pravde podobnostı podle vzorce Excel 2010: P(X = k) = n k p (1 p) = = = (0,01) (0,99) 0, =BINOM.DIST(3;100;0,01;0)

191 Tedy ope t pr ibliz ne s est ze stovky uskutec ne ny ch vy be ru bude obsahovat tr i zmetky, kdy rozdıĺ oproti pr edchozıḿu vy poc tu c inı čtyři tisíciny. Tıḿ jsme proka zali, z e v tomto pr ıṕade se opravdu hypergeometricke rozde lenı blıź ı rozde lenı binomicke mu. A k tomu všemu ještě toto! Z a dny odbe ratel (pokud je pr ıć etny ) nebude souhlasit se stokusovy m vy be rovy m souborem obsahujıćıḿ dva vadne kusy, kdyz chce mı t jistotu, z e v celkove m doda vane m mnoz stvı tisıć kusu nenı vıće nez dve procenta zmetku. Tedy testova nı hypote zy je postup, ktery umoz n uje na za klade name r eny ch dat urc it, zda na hodna velic ina, jejıḿiz realizacemi data jsou, vykazuje urc itou vlastnost. Napr ıḱlad ma te pr ed sebou oba lku a jenom vı te, z e je v nı vyplne ny dotaznıḱ z vy zkumu na celosta tnıḿ vzorku dospe le ho obyvatelstva. Ma te uhodnout, jake je pohlavı respondenta, jehoz dotaznıḱ je v oba lce. Jaka je pravde podobnost, z e uhodnete spra vne? Zr ejme PADESAT na PADESAT. Zme n me teď trochu podmıńky. Pr edstavme si, z e oba lka ma pru hledne pole pro adresu a tıḿto oke nkem vidıḿe odpove ď na na sledujıćı ota zku: Uz ı va te ne kdy rte nku? ANO NE Bude-li odpove ď ANO, pravde podobne dotaznıḱ vypln ovala z ena. Mu z eme se sice sta le jes te my lit (i muz i mohou pouz ı vat rte nku), podobne jako kdyz pr i odpove di NE budeme ha dat muz e (ne kaz da z ena rte nku pouz ı va ), rozhodne je ale pravde podobnost spra vne ho odhadu mnohem vys s ı, nez byla pr ed zıśka nıḿ informace o pouz ı va nı rte nky. Informace o rte nce zvy s ila pravde podobnost spra vne ho odhadu respondentova pohlavı. Mu z eme tedy r ıći, z e mezi prome nny mi pohlaví a používání rtěnky existuje souvislost.

192 3.1. Postup při testování hypotéz 1. krok Pr i testova nı hypote z vz dy klademe proti sobe dve hypote zy (tvrzenı ), z nichz jedna ne co tvrdı (pr edpokla da ), druha to popıŕa. V klasické teorii testova nı se vycha zı z toho, z e platı pr edpokla dana vlastnost zkoumany ch na hodny ch velic in. Tento pr edpoklad se oznac uje nulová (testovana ) hypotéza ³⁵ a znac ı H (nebo jenom H). Jelikoz data jsou na hodna a na hoda mu z e pracovat proti nám, nelze obvykle za ve ry testova nı vyslovit s naprostou jistotou ³⁶. Proto se za roven pr edem stanovı hladina významnosti (1 α), coz urc uje mıŕu rizika (pravde podobnost) toho, z e hypote zu H zamítneme, ačkoliv ve skutečnosti platí (omyl oznac ovany jako chyba prvního druhu viz na sledujıćı tabulka). ROZHODNUTÍ SKUTEČNOST H přijmeme H zamítneme správné rozhodnutí chyba PRVNÍHO druhu H platí s pravde podobnostı 1 α s pravde podobnostı α spolehlivost hladina významnosti chyba DRUHÉHO druhu správné rozhodnutí H NEplatí s pravde podobnostı β s pravde podobnostı 1 β síla testu ³⁵ Proc nulova viz [14, str. 182] Testujeme hypote zu: Vs e zu stane pr i stare m, novy postup (le k, ) nenı ani leps ı, ani hors ı nez stary. (Zde je take etymologicky za klad nulové hypotézy, ktera r ıḱa, z e změna se rovná nule.) ³⁶ Protoz e pr i rozhodova nı o nulove hypote ze vycha zıḿe z vy be rove ho souboru, ktery nemusı dostatec ne pr esne odpovı dat vlastnostem za kladnı ho souboru, mu z eme se pr i rozhodova nı dopustit chyby.

193 Chyba prvního druhu α se tradičně v ekonomicke praxi (sociologii apod.) volí 0,05 a v technicky ch oblastech stanovuje 0,05 nebo 0,01. Pouze ve specia lnıćh pr ıṕadech (le kar ske u c ely, kosmonautika, ) poz adavek na pravde podobnost chyby I. druhu da le stupn ujeme (volıḿe jes te niz s ı α). Chybu II. druhu β snižujeme volbou vhodného testu (pokud ma me moz nost vy be ru z vıće testu, da va me pr ednost takove mu testu, ktery ma ve ts ı sıĺu testu (1 β) pr i stejne hladine vy znamnosti α) popřípadě zvětšením rozsahu výběrového souboru (coz je jediny zpu sob jak snıź it β, aniz bychom tıḿ zvy s ili α bohuz el vs ak je rozsah vy be ru te me r vz dy limitova n prakticky ni omezenıḿi / pr ıĺis ne inanc nı nebo c asove na klady, pr ıĺis na pracnost, pr ıṕadne fakt, z e vy be r je jiz proveden, nemohli jsme jej ovlivnit a nelze jej opakovat). Pravde podobnost chyby II. druhu za visı na pr esne hodnote alternativnı hypote zy. Doka z eme tedy urc it β pro pr ıṕad, z e alternativnı hypote za je pr esne speciikovana. 2. krok Da le se z dat vypoc ı ta takzvane testovací kritérium, jehoz rozde lenı podmıńe ne pr edpokla danou platnostı nulove hypote zy je zna mo. Vyjde-li hodnota testovacı ho krite ria typická pro toto zna me rozde lenı, nulovou hypote zu akceptujeme c i pr esne ji r ec eno nezamítáme na za klade zna my ch dat. Naopak vyjde-li hodnota extre mnı, tedy v oblasti hodnot, do nıź realizace pr edpokla dane ho rozde lenı padajı s pravde podobnostı mens ı nez α (tj. hodnota testovacı ho krite ria pr ekroc ı kritickou mez), usoudıḿe, z e testovacı krite rium nejspıś e nepocha zı z pr edpokla dane ho rozde lenı a nulovou hypote zu zamı tneme ve prospe ch opac ne tzv. alternativnı hypote zy, oznac ovane H (nebo H, nebo H ). Vz dyť co se de je pr i pr ejıḿce zboz ı? Odbe ratel vlastne testuje tuto svoji hypote zu: Chtějí mne doběhnout, zboží je špatné. A rozhodne se pro pr evzetı zboz ı pouze tehdy, je-li tato jeho hypote za vyvrácena. Idea lnı (v tomto pr ıṕade z hlediska dodavatele) je vy sledek, z e nulova hypote za se zamítá ve prospe ch alternativnı hypote zy. Statisticke ove r ova nı hypote z nenı ve sve podstate nic ıḿ jiny m nez pokusem zamı tnout nulovou hypote zu. Tedy tvrzení, které chceme dokázat, volíme za alternativní hypotézu.

194 Proč nepoužíváme pojem přijímáme nulovou hypotézu? Testova nı hypote z mu z eme prova de t ru zny mi zpu soby. Pr i kaz de m z nich mu z e by t testovana hypote za zamı tnuta. Nezamı tneme-li ji, znamena to, z e prova de ny m testem jsme ji nemohli zamı tnout. Nikoliv to, z e je spra vna. Je moz ne, z e ne jaky m jiny m testem se ji zamı tnout podar ı. Pokud pouz ı va me sta le pr esne js ı testy a sta le docha zıḿe ke stejne mu za ve ru o nezamı tnutı nulove hypote zy, mu z eme jednat tak, jako by nulova hypote za byla spra vna. Nikdy to vs ak nevıḿe jiste.»podobá se to dostihovému závodu s neomezeným trváním. Na každém skoku může kůň padnout, a tím by byl konec jeho závodění. Nepadne-li však, zbývá jen jedno pokračovat v závodě.«(prof. Dr. Ragnar Frisch, nositel Nobelovy ceny za ekonomii) Pr evzato z [3, str. 214] Vy sledkem testova nı platnosti ne jake ho pr edpokladu o vlastnosti zkoumane ho znaku tedy mohou by t na sledujıćı dve rozhodnutı : Neproka zali jsme z a dny pr esve dc ivy du vod pro zamı tnutı nulove hypote zy. Hodnoty sledovane ho znaku ve vy be rove m souboru odporujı pu vodnıḿu pr edpokladu natolik, z e jej zamı ta me ³⁷ a pr ijıḿa me alternativnı hypote zu. Test statisticke hypote zy je ove r ova nı uc ine ny ch pr edpokladu o nezna me vlastnosti rozloz enı na hodne prome nne cele ho za kladnı ho statisticke ho souboru pomocı u daju zıśkany ch z na hodne ho vy be ru. ³⁷ Zamı tneme-li nulovou hypote zu, tak to neznamena, z e tato hypoze za neplatı (viz chyby prvnı ho a druhe ho druhu). Jen da va me najevo, z e jı nedu ve r ujeme na za klade vy sledku objektivnı ho vys etr ova nı u daju, ktere ma me k dispozici.

195 Postup při klasickém testu (máme výběrový soubor): 1. Zformulujeme (testovanou) nulovou hypotézu H nebo H (pr edstavuje tvrzenı, z e sledovany efekt je nulovy ), ktera se ma ove r it. By va vyja dr ena rovnostı mezi testovany m parametrem a jeho oc eka vanou hodnotou. Proti nı postavıḿe alternativní hypotézu H nebo H pr ıṕadne H, ktera vyjadr uje tu moz nost, se kterou najisto poc ı ta me v pr ıṕade, z e testovana nulova hypote za neplatı. Nulova hypote za H by va stanovena jednoznac ne, napr ıḱlad μ = 55. Pro stanovenı alternativnı hypote zy by va vıće moz nostı, v nas em pr ıṕade tr i: μ < 55, μ > 55 a μ 55. Obsahuje-li zada nı proble mu vedoucı ho na testova nı hypote z vztah jednostranne nerovnosti, volı se jako alternativnı hypote za pr ıślus na jednostranna hypote za. V ostatnıćh pr ıṕadech volıḿe oboustrannou alternativnı hypote zu. Alternativnı hypote za by me la by t v souladu s vy be rovy m souborem. Pokud tomu tak nenı, pr izpu - sobujeme alternativnı hypote zu za ve ru m zıśkany m z vy be rove ho souboru. 2. Zvolıḿe hladinu významnosti (u roven, velikost) akceptovatelne chyby prvnı ho druhu α. Potom c ıślo 1 α urc uje koeicient spolehlivosti. Jiny mi slovy: Pravde podobnost, z e hodnota testove statistiky bude lez et v oblasti sve dc ıćı pro zamı tnutı nulove hypote zy, pr estoz e je nulova hypote za platna, ma by t rovna pr edem zvolene hodnote α. 3. Zvolıḿe testové kritérium (testovou statistiku), tj. statistiku B = f(x, X,, X ), ktera ma vztah k nulove hypote ze a jejıź pozorovanou hodnotu (zıśkanou ze vzorku) oznac ıḿe b. Jde o funkci vy be ru, ktera vyjadr uje sıĺu platnosti nulove hypote zy ve srovna nı s hypote zou alternativnı. Pro dals ı krok testu musıḿe zna t rovne z rozde lenı testove statistiky pr i platnosti nulove hypote zy H (nulové rozdělení).

196 4. Vypoc ı ta me pozorovanou hodnotu b testove statistiky B z vy be rove ho souboru. Pr i tomto vy poc tu pr edpokla da me platnost nulove hypote zy. 5. Urc ıḿe kritický obor (obor pr ijetı hypote zy) W hodnot statistiky B, do nıź hodnoty B za platnosti hypote zy H padnou s pravde podobnostı α, tj. P(B W H ) = α. Jde o rozde lenı prostoru vs ech moz ny ch hodnot testove statistiky S na dva podprostory: obor přijetí A obsahujıćı hodnoty testove statistiky sve dc ıćı pro nezamı tnutı nulove hypote zy a kritický obor C obsahujıćı hodnoty testove statistiky sve dc ıćı pro zamı tnutı nulove hypote zy. Je zr ejme, z e: A C = S; A C =. Hranice mezi kriticky m oborem a oborem pr ijetı se nazy va kritická hodnota testu. Zna me-li nulove rozde lenı testove statistiky B nenı obtıź ne pro dane α stanovit kriticky obor: Je-li alternativní hypotéza ve tvaru < (ve prospe ch alternativy sve dc ı extre mne nıźke hodnoty testove statistiky), pak je kriticky obor vymezen jako: C W > (ve prospe ch alternativy sve dc ı extre mne vysoke hodnoty testove statistiky), pak je kriticky obor vymezen jako: W C (ve prospe ch alternativy sve dc ı nıźke nebo vysoke hodnoty testove statistiky), pak je kriticky obor vymezen jako: C W W C 6. Formulujeme za ve r: a) Lez ı -li testova statistika b v kritickém oboru C (b C), pak zamítáme nulovou hypotézu ve prospěch alternativní hypotézy; b) Lez ı -li testova statistika b v oboru přijetí (nelez ı v kriticke m oboru b C), pak nulovou hypotézu NEzamítáme.

197 Jestliz e vy sledek testova nı umoz n uje za ve r, z e testova statistika je napr ıḱlad mimo 95% konidenc nı interval (koeicient spolehlivosti) testovane nulove hypote zy, mohu si by t na 95 % jist, z e hypote za nenı spra vna. Tıḿ se pe t dosta va me k nas emu dr ı ve js ıḿu zjis te nı, z e hypotéza nemůže být přímo dokázána, nýbrž může být jen zamítnuta jí odporující (nulova ) hypotéza. V praxi ove r ova nı hypote z jde tedy ve ts inou o pouz ı va nı takove sestavy testu (pr edevs ıḿ volby vy be rove ho souboru), aby zamy s lene u rovne odmı tnutı bylo pokud moz no pr esne dosaz eno. Jinak vznikajı zbytec ne na klady. Pr i testova nı statisticky ch hypote z se mu z eme dopustit ne kolika chyb: 1. Volba nevhodne dvojice hypote z (nulova hypote za versus alternativnı ). K te to chybe docha zı, pokud si du kladne nerozmyslıḿe, co vlastne chceme testovat. Du lez ity je pr edevs ıḿ vy be r vhodne alternativy (jednostranna, dvoustranna ). 2. Chybne urc ena testova statistika. 3. Chybne urc eny obor pr ijetı nebo kriticky obor. 4. Chyby pr i rozhodova nı (jiz dr ı ve diskutovane chyby prvnı ho a druhe ho druhu). Prvnı tr i uvedene chyby lze eliminovat dobrou pr ıṕravou testu. Jde tedy o chyby, ktere lze ovlivnit, pr ı padne jim zcela zabra nit. Jiny mi slovy: I při testování hypotéz platí pravidlo dvakrát měř a jednou řež. [3, str. 212] I sebele pe pr ipraveny test vs ak nemusı ve st ke spra vny m rozhodnutıḿ, neboť vyuz ı va pouze omezene informace na hodne ho vy be ru. Mu z e se sta t, z e na hodny vy be r nebude dostatec ne kopıŕovat vlastnosti za kladnı ho souboru a pr i rozhodova nı bude zvolena opac na hypote za, nez odpovı da skutec nosti. A jsme ope t u jiz zna my ch chyb prvního a druhého druhu.

198 Pamatujte si, z e ³⁸: Hladina významnos (chyba I. druhu, statisticka vy znamnost) je pravděpodobnost, s jakou bychom za předpokladu pravdivosti nulové hypotézy mohli obdržet data odporující nulové hypotéze stejně či ještě více než pozorovaná data. (str. 80) Síla testu je pravděpodobnost (hodnota pohybujıćı se mezi 0 a 1) správného přijetí alternativní hypotézy za předpokladu, že je tato v základním souboru platná. (str. 90) Castou statistickou u lohou je rozhodnout, zda nezna my parametr rozde lenı populace (nejc aste ji str ednı hodnota, rozptyl nebo relativnı c etnost) je roven ne jake konkre tnı c ıśelne hodnotě, pr ıṕadne zda je nezna my parametr rozde lenı populace ve ts ı c i mens ı nez ne jaka konkre tnı c ıśelna hodnota. Rozhodovacı proces, ktery je pro r es enı te chto u loh pouz ı va n, by va oznac ova n jako jednovy be rovy test. Jak lze z cele ho pr edchozı ho povı da nı usoudit, střední hodnota je za kladnı charakteristikou kaz de ho statisticke ho znaku. Nenı proto divu, z e ve ts ina vy be rovy ch s etr enı se zaby va pra ve zkouma nıḿ te to velic iny. Odhady a testy pru me rny ch pr ı jmu, pru me rny ch vy konu, pru me rne z ivotnosti vy robku, str ednı hmotnosti vy robku, atd. jsou nejbe z ne js ıḿi u lohami statistiky. Nejpoužívanější parametrické testy Parametricky mi testy prove r ujeme hypote zy o parametrech za kladnı ho souboru a ocen ujeme rozdıĺy mezi teoreticky mi (ktere ma za kladnı soubor) a empiricky mi (vypoc teny mi ze vzorku) charakteristikami. K jejich odvozenı je nutne pro dany vy be r speciikovat typ rozde lenı a v ne ktery ch pr ıṕadech i ne ktere parametry tohoto rozde lenı. ³⁸ SOUKUP, Petr. Nespra vna uz ı va nı statisticke vy znamnosti a jejich moz na r es enı. In: Data a výzkum SDA Info [online]. 2010, roc. 4, c ıś. 2 [cit ], str. 80 a str. 90. ISSN

199 Test o střední hodnotě normálního rozdělení Pr edpokla dejme, z e ma me normálně rozdělenou populaci (za kladnı soubor) s neznámou str ednı hodnotou μ a neznámým rozptylem σ. Na za klade vy be ru X, X,, X z dane populace chceme ove r it pr edpoklad, jestli se str ednı hodnota populace μ rovna hodnote μ. Nezna mou str ednı hodnotu μ odhadneme vy be rovy m aritmeticky m pru me rem x, ktery urc ıḿe z pozorovany ch vy be rovy ch hodnot x, x,, x. Je zr ejme, z e vypoc tena ( x ) a pr edpokla dana str ednı hodnota (μ ) se mohou od sebe lis it. Rozdıĺ mu z e by t pouze nevy znamny a lze ho pr ic ıśt u c inku na hodny ch vlivu, pu sobıćıćh pr i vy be ru. Tento rozdıĺ vs ak mu z e by t i nena hodny (r ıḱa me take statisticky vy znamny nebo signiikantnı ). Test o str ednı hodnote tak pr edstavuje ove r enı, zda se vy be rovy aritmeticky pru me r x a pr edpokla dana str ednı hodnota μ lis ı statisticky vy znamne nebo pouze na hodne. Nulovou hypote zu H volıḿe ve tvaru μ = μ. Zatıḿco volba nulove hypote zy je zr ejma, u alternativnı hypote zy H mu z eme volit ze tr ı moz nostı : μ < μ, μ > μ, μ μ. Tedy, kdyz to vc etne testove ho krite ria a oboru pr ijetı hypote zy shrneme: Parametrický test o střední hodnotě normálního rozdělení Pr edpoklad: {X, X,, X } je na hodny vy be r z N(μ; σ ) Hypote za H : μ = μ, kde μ je dane c ıślo Hypote za H : μ < μ μ > μ μ μ Testove krite rium: T = ( ) n S Obor pr ijetı hypote zy: I = t (n 1); ) I = ( ; t (n 1) I = t (n 1); t (n 1)

200 kde T ma Studentovo rozdělení s n 1 stupni volnosti a t je kvantil Studentova rozdělení, ktery najdeme ve statisticky ch tabulka ch, nebo pro oboustrannou (c ervenou) alternativu pomocı Excelu 2010 =T.INV.2T(α; n 1) Napr ıḱlad na vedlejs ıḿ obra zku je hodnota kvantilu t pro α = 5 % a (n 1) = 16. Pr edpoklad, z e vy be r pocha zı z norma lnı ho rozde lenı N(μ; σ ), nemusı by t za kaz dou cenu dodrz en. Test totiz pracuje s pru me rem vy be ru, a tento vy be r jiz pr i rozsahu v r a du desı tek ma pr ibliz ne norma lnı rozde lenı dıḱy centra lnı limitnı ve te. Proto pokud je rozsah vy be ru velky (v r a du stovek a vıć), lze mıśto kriticky ch hodnot Studentova rozde lenı pouz ı t kriticke hodnoty norma lnı ho rozde lenı. Příklad: Podle u daju na obalu ³⁹ c okola dy by jejı c ista hmotnost me la by t 125 g. Vy robce dostal ne kolik stıź nostı, z e hmotnost prodany ch c okola d byla niz s ı. Z tohoto du vodu odde lenı kontroly na hodne vybralo 50 c okola d urc eny ch k expedici a zjistilo, z e jejich pru me rna hmotnost je 122 g a sme rodatna odchylka c inı 8,6 g. Za pr edpokladu, z e hmotnost c okola d se r ı dı normálním rozložením, mu z eme na hladine vy znamnosti 0,01 povaz ovat stıź nosti spotr ebitelu za opra vne ne? Řešení: Pouz ijeme parametricky test o str ednı hodnote norma lnı ho rozde lenı, kdy testujeme nulovou hypotézu H μ = 125 proti levostranné alternative H μ < 125 s (černě stanoveny m) oborem přijetí hypotézy I = t, (50 1); ) = t, (49); ) 2,405 ; ) kde t, (49) urc ıḿe pro levostrannou alternativu pomocı Excelu 2010 takto: =T.INV(0,99;49) Testové kritérium: T = ( x μ ) n = S ,6 50 2,467 T I Závěr: Protoz e hodnota testove ho krite ria nespada do oboru pr ijetı hypote zy na hladine vy znamnosti 1 %, mu z eme usoudit, z e stıź nosti spotr ebitelu jsou opra vne ne (dosta vajı me ne c okola dy). ³⁹ Řezáč, M., Budíková, M. Statistika II. Brno : Masarykova univerzita 2013, str. 142

201 Test o rozptylu normálního rozdělení Pr edpokla dejme, z e ma me normálně rozdělenou populaci (za kladnı soubor) s neznámou str ednı hodnotou μ a neznámým rozptylem σ. Na za klade vy be ru X, X,, X z dane populace chceme ove r it pr edpoklad, jestli se rozptyl populace σ rovna hodnote σ. Nezna my rozptyl σ odhadneme vy be rovy m rozptylem S, ktery urc ıḿe z pozorovany ch vy be rovy ch hodnot x, x,, x. Je zr ejme, z e se vypoc teny vy be rovy rozptyl (S ) a pr edpokla dana hodnota rozptylu (σ ) mohou od sebe lis it. A to statisticky vy znamne nebo pouze na hodne. Parametrický test o rozptylu normálního rozdělení Pr edpoklad: {X, X,, X } je na hodny vy be r z N(μ; σ ) Hypote za H : σ = σ, kde σ je dane c ıślo Hypote za H : σ σ Testove krite rium: Obor pr ijetı hypote zy: T = S σ (n 1) (n 1) S (n 1) S I = χ ; (n 1) χ (n 1) kde T ma rozdělení CHÍ kvadrát s n 1 stupni volnosti a χ je kvantil rozde lenı chı kvadra t (ne kdy te z Pearsonovo rozdělení), ktery najdeme ve statisticky ch tabulka ch, nebo pomocı Excelu 2010: =CHISQ.INV.RT(α; n 1) Napr ıḱlad na vedlejs ıḿ obra zku je hodnota kvantilu χ pro α = 1 % a (n 1) = 5. Pro tvary dals ıćh testovy ch krite riı a zpu soby urc enı intervalu spolehlivosti odkazujeme za jemce na pr ıślus nou literaturu.

202 Nejpoužívanější testy shody (přiléhavos): Domne nka o tom, z e studovana data (vy be r) pocha zejı z urc ite ho teoreticke ho (oc eka vane ho) rozde lenı, by va podloz ena buď informacemi o sledovane m jevu, nebo odhadem teoreticke ho rozde lenı na za klade graicke ho zobrazenı vy be rove ho rozde lenı. Na s odhad vs ak nemusı by t spra vny. Proto jej v praxi ove r ujeme testy shody, zda se shoduje teoreticke (oc eka vane, pr edpokla dane ) a empiricke (pozorovane, vy be rove ) rozde lenı. Nulovou (H nebo H ) a alternativnı ( H nebo H, H ) hypote zu mu z eme v tomto pr ıṕade formulovat: H H teoreticke a empiricke rozde lenı se shoduje. teoreticke a empiricke rozde lenı se NEshoduje. χ 2 ( chí kvadrát Pearsonův) jednovýběrový test dobré shody absolutní četnos Nejzna me js ı z testu dobre shody ove r uje, zda se empiricke (pozorovane ) absolutnı c etnosti O (anglicky observed ) jednotlivy ch variant na hodne velic iny shodujı s oc eka vany mi absolutnıḿi c etnostmi E (angl. expected ). Tedy s c etnostmi, ktere bychom oc eka vali v pr ıṕade platnosti nulove hypote zy. Hypote za H : Hypote za H : Testove krite rium: χ = Obor pr ijetı hypote zy: testovany výběr pocha zı z teoretického rozdělení (znac ıḿe stříškou) na hodny vy be r n prvku pocha zı z jiného rozde lenı (n n ) = n I = 0 ; χ (k 1 L) n n n coz je souc et c tvercu rozdıĺu skutec ny ch a oc eka vany ch c etnostı va z eny ch oc eka vany mi (teoreticky mi) c etnostmi

203 kde k poc et tříd, na ktere byl rozde len interval pozorovany ch hodnot na hodne prome nne ; n pozorovaná (zjis te na na za klade pokusu) tr ı dnı c etnost intervalu a ; b, n teoretická (to co oc eka va me, platı -li H ) c etnost intervalu a ; b : n = n P(a X b ). Nenı -li splne na podmıńka na velikost vy be ru: n > 5 buď vy be r rozs ıŕ ıḿe tak, aby podmıńka byla splne na nebo tr ı dy s malou c etnostı sdruz ujeme (ty ka se to zpravidla krajnıćh tr ı d); L poc et stupňů volnosti, tj. nezna my ch parametru (modus, rozptyl, ) teoreticke ho rozde lenı, ktere je nutno (z hodnot vy be ru) poc ı tat. Pro N(μ, σ ) je L = 2, Kolmogorovův Smirnovův jednovýběrový test kumulavní četnos Pouz ı va me jej pr i hodnocenı rozdıĺu mezi kumulativními četnostmi. Toto je jedna z variant testu autoru Andreje Nikolajevic e Kolmogorova a Vladimira Ivanovic e Smirnova, ktera ove r uje, zda se rozde lenı na hodne velic iny v populaci lis ı od urc ite ho teoreticke ho rozde lenı. Nulova hypote za: Alternativnı hypote za: testovany výběr pocha zı z teoretického rozdělení (znac ıḿe stříškou) na hodny vy be r n prvku pocha zı z jiného rozde lenı Testove krite rium: D(X) = 1 n max N N kde N a N jsou kumulativnı c etnosti Obor pr ijetı hypote zy: I = 0; D (n) kde, D (n) je tabelova na a pro n > 40 pak platı : D % (n) 1,07 n D % (n) 1,22 n D % (n) 1,36 n D % (n) 1,52 n D % (n) 1,63 n

204 Vstupem te to varianty testu je k tr ı d testovane ho vy be ru a pr edpokla dane (napr ıḱlad norma lnı ) teoreticke rozde lenı, ktere se rozde lı do stejne ho poc tu tr ı d. Pro kaz dou tr ı du i (i = 1,, k) testovane ho vy be ru se spoc ı tajı četnosti n zjis te ne ve vy be ru a pro kaz dou tr ı du teoreticke ho rozde lenı se spoc ı tajı pr edpokla dane c etnosti n. Da le spoc ı ta me kumulativní četnosti pro vy be r N = n a pro testovane rozde lenı N = Pokud ma me k dispozici pouze vy be r male ho rozsahu, da va me pr i ove r ova nı dobre shody mezi empiricky m a teoreticky m rozde lenıḿ pr ednost tomuto testu pr ed pr edchozıḿ testem. Vy hody Kolmogorovova Smirnovova testu oproti Pearsonovu testu dobre shody [8, str. 348]: ve ts ı sıĺa testu (1 β) ; nema omezujıćı podmıńky; pokud navıć pouz ijeme jinou variantu testu (nez jsme si uvedli), ktera pracuje pr ıḿo s distribuc nıḿi funkcemi vy be ru a pr edpokla dane ho rozde lenı (namıśto jejich kumulativnıćh c etnostı ), tedy vycha zı z jednotlivy ch pozorova nı a nikoliv z u daju setr ı de ny ch do skupin, lze ji pouz ı t i na vy be ry skutec ne male ho rozsahu a nedocha zı ke ztra te informace obsaz ene ve vy be ru. n.

205 Příklad: χ 2 Test dobré shody Pr i opakovane m ha zenı kostkou (60 hodu ) padla jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13. Pta me se, zda je kostka regule rnı (fe rova ) c i zda je fales na (upravena, cinknuta ), a to na hladine vy znamnosti 0,01 (= 1 %). Řešení: Hracı kostka je v por a dku, kdyz je pravde podobnost padnutı kaz de ho c ıśla na kostce stejna. Nebo jinak: kaz de ze s esti c ıśel bude mı t shodne zastoupenı pr i ve ts ıḿ poc tu pokusu. Pr i 60 pokusech 60 6 = 10. Budeme tedy testovat, zda rozde lenı poc tu padly ch ok je takove, z e ma stejne pravde podobnosti pro vs echny moz ne varianty. Jestliz e lze za kladnı soubor (ze ktere ho pocha zı vy be r, ktery ma me k dispozici) roztr ı dit podle ne jake ho znaku do k disjunktnıćh skupin a my chceme na za klade na hodne ho vy be ru ove r it, zda jsou relativnı c etnosti jednotlivy ch variant rovny c ıślu m π,, π, mu z eme pouz ı t χ test dobre shody (Pearsonu v). Volba nulové a alternavní hypotézy H : Kostka je v pořádku, kdyz vy be r pocha zı ze za kladnı ho souboru, kde jsou pravde podobnosti jednotlivy ch variant rovny. H : Kostka nenı v por a dku (je falešná ), kdyz platı cokoliv jine ho. Testové kritérium Jako testove krite rium pouz ı va me na hodnou velic inu T(X) = χ = (n n ) = n (O E ) E, ktera ma za pr edpokladu, z e prova dıḿe dostatečně velký výběr (kaz da tr ı da ma aspon pět prvku ), pr ibliz ne χ rozde lenı s k 1 stupni volnosti. My oc eka va me v kaz de tr ı de deset prvku.

206 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

207 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

208 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

209 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

210 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

211 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu.

212 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. Prvnı sloupec oznac uje c ıślo r a dku index i. Do druhe ho sloupce tabulky zapıś eme c ıślo, ktere padlo, do tr etı ho n kolikra t padlo (pozorovana c etnost) a do c tvrte ho n teoretickou (oc eka vanou) c etnost. index r a dek i tr ı da n n n n (n n ) n , , , , ,9 6 T(X) = (n n ) = 6 n Protoz e z a dny parametr (modus, rozptyl, ) nepoc ı ta me, za L dosazujeme nulu. Je zr ejme, z e c ıḿ ve ts ı jsou odchylky pozorovany ch a oc eka vany ch c etnostı, tıḿ vys s ı pozorovanou hodnotu testove statistiky T(X) dosta va me a tıḿ silne js ı je vy pove ď vu c i nulove hypote ze. Krický obor pro přije nulové hypotézy je: I = 0 ; χ (k 1 L) χ,(6 1 0) = χ,(5) 15,086 I, = 0; 15,086 Pro stanovenı hodnoty χ,(5) vyuz ijeme Excel 2010: =CHISQ.INV.RT(α;n) Závěr: Protoz e v nas em pr ıṕade T(X) I,, nezamítáme nulovou hypote zu. Nelze tedy tvrdit, že kostka je falešná.

213 A teď si na stejne m pr ıḱladu zkusme otestovat pr edpoklad o NEfalešnosti kostky druhy m z testu. Příklad: Kolmogorovův Smirnovův jednovýběrový test shody Pr i opakovane m ha zenı kostkou (60 hodu ) padla jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13. Pta me se zda je kostka regule rnı (fe rova ) c i zda je fales na (upravena, cinknuta ), a to na hladine vy znamnosti 0,01 (= 1 %). Řešení: Odsud: / Hracı kostka je v por a dku, kdyz je pravde podobnost padnutı kaz de ho c ıśla na kostce stejna. Nebo jinak: kaz de ze s esti c ıśel bude mı t shodne zastoupenı pr i ve ts ıḿ poc tu pokusu. Pr i 60 pokusech 60 6 = 10. Budeme tedy testovat, zda rozde lenı poc tu padly ch ok je takove, z e ma stejne pravde podobnosti pro vs echny moz ne varianty. Jestliz e lze za kladnı soubor (ze ktere ho pocha zı vy be r, ktery ma me k dispozici) roztr ı dit podle ne jake ho znaku do k disjunktnıćh skupin, mu z eme pouz ı t Kolmogorovův Smirnovův test. / až sem (krome na zvu pouz ite ho testu) je to naprosto shodne s pr edchozıḿ testem, a to vc etne volby hypote z. Lis it se bude az testove krite rium. Volba nulové a alternavní hypotézy H : Kostka je v pořádku, kdyz vy be r pocha zı ze za kladnı ho souboru, kde jsou pravde podobnosti jednotlivy ch variant rovny. H : Kostka nenı v por a dku (je falešná ), kdyz platı cokoliv jine ho. Testové kritérium Jako testove krite rium pouz ı va me na hodnou velic inu D(X) = 1 n max N N Pozorovane i pr edpokla dane c etnosti (vc etne jejich kumulativnıćh c etnostı ) zase zapıś eme do tabulky.

214 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

215 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

216 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

217 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

218 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

219 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du.

220 60 hodu jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. i tr. i n n N = n N = N N n n =7 10 =10 0, 050 = = = , = = , = = , = = , = = = N N 60 hodu n = 60 D(X) = max = 0,133 n První sloupec je c ıślo r a dku, nebo-li index. Do druhého sloupce tabulky zapıś eme c ıślo, ktere padlo. Za roven to bude pr edstavovat tr ı du i. Do třetího sloupce oznac ene ho n kolikra t padlo (pozorovaná četnost) toto c ıślo. Do čtvrtého sloupce oznac ene ho n teoretickou (tu, kterou oc eka va me) c etnost. V pátém sloupci oznac ene m N jsou kumulativní pozorovane c etnosti. Tedy napr ıḱlad ve druhe m r a dku je c etnost vy sledku, z e padlo c ıślo mens ı nebo rovno 2. Jinak r ec eno, kolikra t padla jednička nebo dvojka. A v šestém sloupci jsou kumulativní pr edpokla dane c etnosti. Do sedmého sloupce zapıś eme hodnoty testove ho krite ria pro kaz dou tr ı du. Pokud nechceme zbytec ne s estkra t de lit, mu z eme tabulku vyplnit na sledovne :

221 60 hodu (n) jednic ka 7, dvojka 9, trojka 10, c tyr ka 6, pe tka 15 a s estka 13 ; α = 0,01. index tr ı da i n n N = n N = n N N =7 10 =10 3 = = = = = = = = = = = = = = = = n pozorovana c etnost n oc eka vana (teoreticka ) c etnost N kumulativnı pozorovana c etnost N kumulativnı teoreticka c etnost 60 hodu n = 60 Testové kritérium: D(X) = 1 n max N N = ,133 Krický obor pro přije nulové hypotézy je: I = 0; D (n) 0 ; 0,210, D, (60) 1,63 Závěr: Protoz e v nas em pr ıṕade D(X) I,, nezamítáme nulovou hypote zu. Na hladině významnosti 1 % nelze tvrdit, že kostka je falešná. Dokonce ani na hladine vy znamnosti 20 %, protoz e D % (60) 0,

222 Příklad K dispozici ma me na sledujıćı datovy vzorek, ktery jiz byl dr ı ve zpracova n ve forme vodorovne tabulky (data vzorku jsme zar adili do devı ti tr ı d). k x n Pro cely statisticky soubor, ze ktere ho byl vzorek vybra n, určete: 1. bodový odhad střední hodnoty μ. 2. intervalový odhad střední hodnoty μ, kde volte vy znamnost 5 %. 3. s 95% spolehlivostı, zda hypotézu H μ = 85 přijmout c i nikoliv. Řešení 1. volba testových kritérií ; 2. aplikace te chto krite riı Intervalove odhady (druhy bod zada nı ) jsme si uva de li pouze pro soubory majıćı normální rozdělení. Proto budeme nejprve zkoumat, zda na s vzorek pocha zı ze souboru s norma lnıḿ rozde lenıḿ. K tomu vyuz ijeme napr ed prvnı test shody ktery jsme si uvedli Pearsonu v test χ. Vidıḿe, z e asi nebude (pozna me to ale az urc enıḿ teoreticky ch c etnosti n ) splne na podmıńka minima lnı tr ı dnı c etnosti. Proto spojıḿe první a druhou tr ı du do jedne, ktera bude mı t za reprezentanta hodnotu = 26,5. Stejne tak i šestou se sedmou a osmou s devátou. Protoz e testujeme, zda se jedna o norma lnı rozde lenı, upravıḿe i krajnı meze hranic nıćh intervalu. Ostatnı hranice intervalu a vs echny reprezentanty nespojovany ch tr ı d ponecha me tak, jak byly. Vs e zase zapıś eme (svisle) do tabulky.

223 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

224 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

225 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

226 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

227 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

228 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

229 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

230 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

231 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

232 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

233 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

234 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0,424 65

235 r (a ; b ) x n n n x n x A = a μ σ F (A) 1 ( ; 43,5) 26,5 4 5, (43,5 ; 60,5) , ,14 0, (60,5 ; 77,5) , ,67 0, (77,5 ; 94,5) , ,19 0, (94,5 ; 128,5) 111,5 8 11, ,28 0, (128,5 ; ) 145,5 6 4, ,5 1,23 0, ,5 Pu vodnı tabulka kde n je teoreticka tr ı dnı c etnost pro norma lnı rozde lenı. n = n P(a X b ) = n [F(b ) F(a )] = n F b μ F σ a μ a F σ ( u) = 1 F (u). Chceme-li urc it napr. F(77,5) =?, potr ebujeme zna t μ a σ, abychom ve statisticky ch tabulka ch nebo pomocı Excelu (c i jinak) nas li hodnotu distribuc nı funkce F normovane ho norma lnı ho rozloz enı N(0; 1). Proto provedeme bodové odhady: μ = x = x = (n x )= ,4 σ = S = 1 n 1 (n 1 x ) n x = 42 1 ( , , 4 84,4 ) Pak: σ = σ = ,1 a F(77,5) = F (,,, ) F ( 0,19) = 1 F (0,19)= 0, Vidıḿe, z e nenı splne na nutna podmıńka v s este tr ı de, protoz e oc eka vana c etnost n 4,6 nenı ve ts ı nez 5. Proto necha me pu vodnı s estou tr ı du tak jak byla a spojıḿe sedmou a osmou s devátou (vs echny tr i tr ı dy dohromady) tr ı dou. A cely vy poc et provedeme znovu! Asi se zme nı μ a σ.

236 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

237 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

238 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

239 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

240 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

241 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

242 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) ( ) = 50,

243 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) Testove krite rium: χ = (n n ) n ( ) = 50,

244 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) Testove krite rium: χ = (n n ) n ( ) = 50,

245 (n r a ; b x n n x n x n ) n 1 ( ; 43,5 26,5 4 5, , ,5 ; 60, , , ,5 ; 77, , , ,5 ; 94, , , ,5 ; 111, , , ,5 ; ) , ,001 Pu vodnı tabulka 42 42, ,577 n P(a X b ) = = F(b ) F(a ) kde F(X) je distribuc nı funkce ove r ovane ho normálního rozde lenı a teoretickou tr ı dnı c etnost n pro norma lnı rozde lenı urc ıḿe na poc ı tac i. n = n P(a X b ) [=42*(NORM.DIST(b ; μ; σ; 1) NORM.DIST(a ; μ; σ; 1))] [Excel 2010] K tomu potr ebujeme zna t μ a σ. Proto provedeme bodové odhady: μ = x = x = (n x ) = 3527 = 83, ,0 (dr ı ve 84,4) σ = S = 1 n 1 (n x ) n x = Potom σ = σ = ,1 (dr ı ve 36,1) Testove krite rium: χ = (n n ) = 4,577 n Obor pr ijetı hypote zy: ( ) = 50, I % = 0; χ,(6 1 2) = 0; χ,(3) = 0; 7,815 χ I, Protoz e hodnota testove ho krite ria patr ı do oboru pr ijetı hypote zy, nelze v tomto pr ıṕade vylouc it, z e vzorek pocha zı za za kladnı ho souboru, ktery je rozloz en norma lne (ma norma lnı rozloz enı ).

246 Kolmogorovův Smirnovův test V pu vodnı tabulce jsme upravili spodnı mez prvnı tr ı dy a hornı mez poslednı tr ı dy (norma lnı rozde lenı je od do ); protoz e Excel (jako ve ts ina programu ) neumı pracovat se symbolem nekonec no, nahradıḿe jej hodnotami z ne kolika devı tek. Da le vyuz ijeme jiz dr ı ve spoc ı tany aritmetický průměr x 84,4 a směrodatnou odchylku S 37. Hodnoty N (kumulovane c etnosti norma lnı ho rozde lenı pro hornı hranici b dane tr ı dy) zıśka me pomocı Excelu 2010: =NORM.DIST(b;84,4;37;1)*42 Zde jsme tr ı dy oznac ili indexem k a ne r jako v pr edchozıḿ pr ıḱladu, ale to doufa m pr ıĺis nevadı. n = 42 D(X) = max N N 0,059 n I = 0 ; D (n) 0 ; 0,210 D, (42) 1,36 42 Protoz e hodnota testove ho krite ria patr ı do oboru pr ijetı hypote zy, nelze na hladine vy znamnosti 5 % vylouc it, z e vzorek pocha zı za za kladnı ho souboru, ktery je rozloz en norma lne (ma norma lnı rozloz enı ). Tedy nulovou hypote zu, z e: vzorek pochází z populace mající normální rozdělení, NEzamítáme.

247 Zopakujme si, co jsme zatıḿ (u vzorku, ktery ma 42 hodnot) vyr es ili: Vzorek byl asi vybra n ze souboru s normálním rozdělením a ma tyto charakteristiky: x = 84,4 S = 37 A coz e ma me vlastne pro cely za kladnı statisticky soubor vyr es it? Bodový odhad střední hodnoty za kladnı ho souboru (populace) μ = x = 84,4 jsme jiz vyr es ili. Intervalový odhad střední hodnoty na hladine vy znamnosti 5 % x S n t S (n 1) ; x + n t (n 1) = = 84, t 37, (42 1) ; 84, t, (42 1) = = 84,4 5,709 t, (41) ; 84,4 + 5,709 t, (41) = (84,4 11,538 ; 84,4+11,538) = (72,862 ; 95,938) Intervalovy odhad str ednı hodnoty populace na hladine vy znamnosti 5 % je: (72,862 ; 95,938). Hodnotu t, (41) 2,021 najdeme v tabulka ch, nebo vyuz ijeme Excel 2010: =T.INV.2T(0,05;41) S K urc enı hodnoty n t (n 1) 11,538 mu z eme take vyuz ı t Excel: =CONFIDENCE.T(α;σ;n), kde σ nahradıḿe S. Tıḿ se sice dopustıḿe chyby (ktera nenı az tak velka ), protoz e spra vne ma me zadat sme rodatnou odchylku za kladnı ho souboru σ, ale tu mi nezna me. Proto mıśto nı pouz ijeme jejı bodovy odhad vy be rovou sme rodatnou odchylku vzorku S.

248 Zopakujme si, co jsme zatıḿ (u vzorku, ktery ma 42 hodnot) vyr es ili: Vzorek byl asi vybra n ze souboru s normálním rozdělením a ma tyto charakteristiky: x = 84,4 S = 37 A coz e ma me vlastne pro cely za kladnı statisticky soubor vyr es it? Bodový odhad střední hodnoty za kladnı ho souboru (populace) μ = x = 84,4 jsme jiz vyr es ili. Intervalový odhad střední hodnoty na hladine vy znamnosti 5 % x S n t S (n 1) ; x + n t (n 1) = = 84, t 37, (42 1) ; 84, t, (42 1) = = 84,4 5,709 t, (41) ; 84,4 + 5,709 t, (41) = (84,4 11,538 ; 84,4+11,538) = (72,862 ; 95,938) Intervalovy odhad str ednı hodnoty populace na hladine vy znamnosti 5 % je: (72,862 ; 95,938). Hodnotu t, (41) 2,021 najdeme v tabulka ch, nebo vyuz ijeme Excel 2010: =T.INV.2T(0,05;41) Hypotézu o střední hodnotě Alternativnı hypote za: H μ 85 Testove krite rium: H μ = 85 s 95% spolehlivostı pr ijmout c i odmı tnout? T = ( x μ) n S = (84,4 85) ( 0,6) 6, = 3, ,105 Obor pr ijetı hypote zy: I = t (n 1) ; t (n 1) = t,(41); t, (41) = = 2,021 ; 2,021 T I,, hypote zu H, z e str ednı hodnota μ = 85 s 95% spolehlivostı nezamítáme (zamı ta me H μ 85).

249 Poznámka o strojovém zpracování. Zatıḿco pr i klasicke m testova nı v pr edchozıḿ pr ıḱladu bylo tr eba hledat kriticke meze pr ıślus ne ho testovacı ho krite ria, každý slušnější statisticky software vypisuje takzvanou hodnotu významnosti ⁴⁰ (te z zvanou signiikance nebo p hodnota, jejıź velikost vu bec neza visı na zvolene hladine spolehlivosti α). Tato hodnota uda va pravde podobnost, z e pr i platnosti nulove hypote zy vyjde testova statistika rovna name r ene nebo jes te extre mne js ı. Hodnota vy znamnosti p (p hodnota, p value, signiicance level) tedy pr edstavuje minima lnı hladinu vy znamnosti, na ktere je moz no zamı tnout nulovou hypote zu. Test se vyhodnocuje takto: Je-li hodnota vy znamnosti mens ı nez hladina spolehlivosti (p < α), pak zamı tneme nulovou hypote zu a pr ijmeme alternativnı hypote zu. Riskujeme chybu prvnı ho druhu (z e zamı tneme spra vnou hypote zu) s pravde podobnostı nanejvy s α. Je-li hodnota vy znamnosti ve ts ı nebo rovna nez hladina spolehlivosti (p α), pak nulovou hypote zu nezamı tneme, ale zamı tneme alternativnı hypote zu. Tento postup vyuz ı va poc etne (ve ts inou) na roc ne js ı ho Čistého testu významnosti. ⁴⁰ Je to hodnota hladiny vy znamnosti, kterou bychom museli volit, aby vypoc tena hodnota testovacı statistiky se rovnala pra ve kriticke hodnote. Tedy aby hodnota testovacı statistiky lez ela pra ve na hranici mezi oborem pr ijetı hypote zy a kriticky m oborem, ve ktere m hypote zu zamı ta me. Nebo jes te jinak r ec eno: Moderní statistické programy při výpočtech předkládají přímo pravděpodobnost chyby I. řádu.

250 U vod do Regresní a korelační analýzy

251 Obsah kapitoly: Regresní a korelační analýza 1. Souvislos mezi jevy Regresní analýza Regresnı pr ıḿka linea rnı regrese f(x) y = a + b x Regresnı parabola kvadraticka regrese f(x) y = a + b x + c x Volba regresnı funkce Linea rnı za vislost: Kvadraticka za vislost: Korelační analýza výběrový korelační koeficient Pr ıḱlady Odlehle pozorova nı a pu vodnı nekorelovany vzorek Vzorek te me r nekorelovany, jeho c a sti perfektne korelovane Vzorek pozitivne korelovany, jeho c a sti negativne korelovane Test vy znamnosti hodnoty korelac nı ho koeicientu r Příklad 271 Linea rnı regrese Excel Kovariance Soustavy norma lnıćh rovnic Vy be rovy korelac nı koeicient Kvadraticka regrese

252 1. Souvislos mezi jevy Zkouma nı souvislostı (zkouma nı tzv. korelace mezi jevy) vztah mezi pru me rnou rychlostı auta a pru me rnou spotr ebou pohonny ch hmot, vztah mezi spotr ebou hnojiva a vy nosem, vztah mezi rychlostı auta a de lkou dra hy, kterou auto urazı za stejny c as, a dals ı a dals ı je jednıḿ z nejdu lez ite js ıćh u kolu statistiky. Snaz ıḿe se o (matematicky ) popis systematicky ch okolnostı, ktere prova zı prvnı dve zmıńe ne volné ⁴¹ (tzv. stochastické) za vislosti. Tr etı uvedena za vislost je pevná (funkční), protoz e vzda lenost za visı pouze na c ase a rychlosti. Vy chodiskem k popisu statisticky ch za vislostı jsou statisticke u daje. Prvnı informace o pru be hu za vislosti dvou prome nny ch (znaku ) zıśka me jiz tak, z e u daje uspor a da me do tabulky. Napr ıḱlad takto: muž žena rte nku POUZ IVA NEpouz ı va rte nku A proc si vs ıḿa me za vislostı mezi prome nny mi? Protoz e z a dny jev v pr ıŕode ani ve spolec nosti nevznika ani neprobı ha libovolne, ale je ve vztahu k jiny m jevu m a nemu z e by t pochopen spra vne, je-li ⁴¹ Nenı zaruc eno, z e kdyz na jeden ar aplikujeme dane mnoz stvı hnojiva, tak ze sousednı ho aru pr i stejne m mnoz stvı hnojiva budeme mı t naprosto stejny vy nos. Tedy urc ite hodnote x (hnojivo) neodpovı da jedina hodnota y (vy nos), ale cele rozde lenı hodnot y, ktere kolıśajı s urc ity m rozptylem kolem urc ite str ednı hodnoty. Podobne jako v pr ıṕade vzdělání versus plat v prave m obra zku.

253 z te chto vztahu a souvislostı vytrz en. S nejjednodus s ıḿi formami pr ıć inny ch souvislostı (za vislostı velic in) se setka va me u ne ktery ch pr ıŕodnıćh jevu. Se sloz ity mi formami se setka va me u jevu spolec ensky ch (ekonomicky ch). Soubor postupu a metod, dovolujıćıćh r es enı za vislosti velic in, se nazy va regresní (termıń regrese»krok zpe t«naprosto nevystihuje podstatu proble mu; vznikl historicky a nada le se pouz ı va ) a korelační analýza. Tato analy za umoz n uje r es it dve za kladnı u lohy. A to: Regresní úlohu zjistit formu závislosti a vyja dr it ji matematickou (tzv. regresnı ) funkcí. Jedna velic ina je povaz ovana za za vislou (vysvětlovanou), obvykle ji znac ıḿe y. Dals ı prome nna nebo prome nne jsou povaz ova ny za neza visle (vysvětlující). Statistika neurc ı, ktera velic ina je pr ı c inou a ktera na sledkem, tedy ktera je neza visla a ktera je za visla. To rozhodne (pokud je to vu bec moz ne ) speciicka ve da, ktera se vztahem zaby va. Mu z e to by t napr ıḱlad da no tıḿ, jak je veden pokus pozorova nı (jednu velic inu vne js ıḿ za sahem me nıḿe, druha se dle toho me nı ). Statistika sleduje pouze, zda existuje mezi velic inami vztah, z e kdyz se me nı jedna velic ina, me nı se i druha, a to takovy m zpu sobem, z e to nelze vysve tlit pouze na hodny mi zme nami te to druhe velic iny. Proto se take pouz ı vajı rade ji pojmy vysve tlujıćı velic ina a vysve tlovane velic ina. Korelační úlohu urc it stupeň síly, nebo take průkaznost závislosti, s jakou se pr edpokla dana za vislost projevuje. Tedy zda zme na vysve tlovane (za visle ) prome nne vyvolana zme nou prome nne vysve tlujıćı (pr ıṕadne zme nami vıće vysve tlujıćıćh prome nny ch neza visly ch) se prosadı proti zme na m vysve tlovane prome nne vznikly m na hodne (jsou zpu sobeny jiny mi, nesledovany mi a na hodne se me nıćıḿi jevy), c i nikoliv. To pochopitelne za visı nejen na chova nı vlastnı za vislosti, ale i na poc tu name r eny ch vy sledku a pr ıṕadne rozmezı me r eny ch hodnot.

254 2. Regresní analýza My se budeme se zaby vat pouze jednoduchou regresí, kdy hleda me pr edpokla dany vztah pouze mezi dvěma veličinami, obecne obvykle znac eny mi x a y. Jinak bychom museli pouz ı t maticovy poc et. Provedeme pozorova nı obou velic in zme r ıḿe vy sledky pokusu. Pr i ne m volıḿe hodnoty jedne velic iny (neza visle prome nne ) oznac ovane obvykle x (ve statistice nazy vane c aste ji jako vysve tlujıćı velic ina). Casto nejde o volbu libovolny ch hodnot, ale o zme r enı hodnot, ktere se v praxi vyskytly. K te mto hodnota m prome r ujeme objevujıćı se hodnoty druhe (za visle prome nne ) velic iny y (statisticky je to velic ina vysve tlovana ). Tak zıśka me urc ity poc et (vy be r z dvourozme rne ho rozde lenı ) spa rovany ch hodnot [x ; y ], coz jsou body v rovine. Hodnoty velic iny neza visle (vysve tlujıćı ) zna me obvykle velmi pr esne, coz je jedna z podmıńek klasicke regrese. Hodnoty name r ene velic iny (vysve tlujıćı ) jsou nahodily mi vlivy vychy leny vıće c i me ne od za vislosti, kterou pr edpokla da me. Tyto nahodile vy chylky mohou by t vyvola ny tıḿ, z e hodnoty y mohou by t ovlivn ova ny dals ıḿi faktory (nejen velic inou x), ktere se be hem me r enı na hodne me nily (napr ıḱlad teplota vzduchu, slunec nı za r enı, sıĺa ve tru, apod.). Pokud jsme korelac nı analy zou proka zali, z e za vislost mezi velic inami je statisticky vy znamna, tedy z e zme ny velic iny y sva zane (sledovanou za vislostı ) se zme nou velic iny x jsou tak velke, z e se neztra cejı ve zme na ch vyvolany ch na hodny mi faktory, ma smysl metodami regresnı analy zy hledat matematicke vyja dr enı te to za vislosti. Zvoleny matematicky tvar (regresní funkce) sledovane za vislosti vs ak obsahuje nezna me parametry. U kolem regresnı analy zy je stanovenı hodnot parametru te to za vislosti. Regresnı metody se snaz ı odstranit vliv na hodny ch vy chylek name r eny ch hodnot y a zıśkany mi body proloz it regresnı funkci tak, aby dos lo k vyrovna nı te chto nahodily ch chyb me r enı. Statisticka indukce na s vede k pr edstave, z e existujı jedine skutec ne hodnoty konstant regresnı funkce, ktere platı pro za kladnı soubor (populaci), tedy pro vs echny moz ne name r ene pa ry hodnot. To jsou hledane parametry regresnı funkce regresnı koeicienty. My vs ak mu z eme urc it pouze výběrové re-

255 gresní koeicienty, ktery mi tyto parametry odhadujeme. Tyto vy be rove regresnı koeicienty budou pro opakovane vy be ry naby vat ru zny ch hodnot, ktere jsou na hodne rozloz eny kolem hledany ch parametru za kladnı ho souboru. Existuje tedy pravde podobnostnı rozde lenı moz ny ch hodnot vy be rove ho regresnı ho koeicientu s urc itou str ednı hodnotou a urc itou sme rodatnou odchylkou tohoto parametru, kterou nazy va me take standardní chyba. Odchylky name r eny ch hodnot od prokla dane regresnı funkce ale nemusejı by t zpu sobeny jen chybami me r enı velic iny y. Podıĺı se na nich i nas e pr ıṕadna chybna volba regresnı funkce (chyba modelu), ktera nemusı plne odpovı dat skutec ne mu (pr irozene mu) pru be hu za vislosti. Napr ıḱlad zkoumana za vislost je vyja dr ena hyperbolou namıśto na mi prokla dane pr ıḿky. Nejčastěji používané regrese (rovnice stochasticke ho vztahu mezi velic inami): linea rnı (pr ıḿkova ) regrese: f(x) y = a + b x kvadraticka (parabolicka ) regrese: f(x) y = a + b x + c x polynomia lnı stupne p: f(x) y = a + b x + b x + + b x hyperbolicka regrese: f(x) y = a + b x logaritmicka regrese: f(x) y = a + b log x exponencia lnı regrese: f(x) y = a b Uvedene parametry (a, b, c, b ), nebo-li vy be rove regresnı koeicienty jak jsme jiz uvedli vy s e, jsou str ednı hodnoty pravde podobnostnıćh rozde lenı vs ech moz ny ch hodnot urc eny ch z vy be ru. Jsou to tedy

256 konstanty, (str ednı hodnota je c ıślo) neme nna c ıśla, ktere ovs em nemu z eme nikdy urc it pr esne. Mu z eme pouze z hodnot vy be ru urc it jejich bodove odhady, pr ıṕadne urc it intervalove odhady tak, jak jsme si ukazovali v kapitole o statisticke indukci. Ze zıśkane ho na hodne ho vy be ru dvojic pak urc ıḿe (empirickou) výběrovou regresní funkci, ktera je jednıḿ z moz ny ch odhadu hledane regresnı funkce. Pro kaz dou hodnotu x tak budeme mı t dve hodnoty (konkre tnı c ıśla) za visle prome nne Y: jednak zıśkanou (empirickou) hodnotu y, jednak vyrovnanou hodnotu f(x ), coz je odhad (teoreticke ) str ednı hodnoty E(Y) /kterou ovs em nezna me/ cele ho za kladnı ho souboru. Jejich rozdıĺy [f(x ) y ] nazy va me odchylky (rezidua). Jsou to vlastne odhady chyb. Bodove odhady regresnıćh koeicientu nejc aste ji zıśka va me metodou nejmenších čtverců ⁴². Tato metoda nejmenších čtverců vycha zı z poz adavku, aby součet čtverců (druhy ch mocnin) odchylek pozorovany ch hodnot y, y,, y od odhadovane regresnı funkce f(x) byl minimální (ves kere chyby modelu pr eneseme do svisle ho sme ru osy y), tedy: S = [f(x ) y ] min. (23) Z kurzu matematicke analy zy (konkre tne z kapitoly o diferencia lnıḿ poc tu) vıḿe, z e extre m funkce (a minimum je extre m) mu z e nastat pouze tam, kde: prvnı derivace dane funkce neexistuje, nebo prvnı derivace dane funkce existuje a je rovna NULE. Budeme tedy vztah (23) derivovat: ⁴² Metodu zavedl francouzsky matematik Adrien Marie Legendre jiz poc a tkem 19. stoletı. Vyz aduje znalost diferencia lnı ho poc tu, ktery byl na plnı letnı ho semestru v prvnıḿ roc nıḱu.

257 S = [f(x ) y ] S = S = derivace souc tu se rovna souc tu derivacı {[f(x ) y ] } derivujeme sloz enou funkci; y je dana hodnota konstanta 2 [f(x ) y ] [f(x ) y ] = 2 [f(x ) y ] [f (x ) y ] = 2 [f(x ) y ] f (x ) Dals ı postup derivova nı za visı na tvaru regresnı funkce f(x). Vy slednou derivaci (v pr ıṕade parcia lnıćh derivacı je jich vıće a dosta va me syste m rovnic) pak poloz ıḿe rovnu nule a hleda me r es enı dane rovnice. Předpoklady metody nejmenších čtverců Chyby neza visle velic iny X majı by t relativne mens ı nez chyby za visle velic iny Y. V opac ne m pr ıṕade je pro spra vny odhad potr eba pouz ı t jinou metodu. Chyby hodnot velic iny Y majı mı t norma lnı rozde lenı s nulovou str ednı hodnotou a s konstantnıḿ rozptylem (a tedy i konstantnı sme rodatnou odchylkou). To znamena, z e se rozpty lenı hodnot nesmı me nit podle velikosti hodnot y (napr. u maly ch hodnot y nemajı by t chyby mens ı nez u hodnot velky ch). Da le tyto chyby nemajı by t vza jemne za visle. Na grafu majı by t tedy name r ene body rovnome rne rozpty leny kolem proloz ene regresnı kr ivky bez zjevny ch tendencı (napr ıḱlad v ru stu) a se zhruba stejny m poc tem bodu nad a pod kr ivkou. Pr ı tomnost jedine ho vychy lene ho bodu v datech mu z e zpu sobit pr ekvapive velke vychy lenı odhadu pr i pouz itı metody nejmens ıćh c tvercu. Takovy to bod strha va proloz enı regresnı kr ivky vy razne na svoji stranu (viz obra zek) a je tr eba jej pr ıṕadne vylouc it.

258 2.1. Regresní přímka lineární regrese f(x) y = a + b x Parametr b se take nazy va regresní koeicient a r ıḱa o kolik jednotek pru me rne vzroste pr ı jem (pravy obra zek), kdyz vzde la nı vzroste o jeden rok. Z pohledu geometrie je to sme rnice regresnı pr ıḿky. Hleda me minimum (23) funkce [a + b x y ] tak, z e parciální derivace podle prome nny ch a, b (ru zne pr ıḿky se odlis ujı pra ve jenom prome nny mi parametry a, b a my hleda me takove hodnoty te chto parametru /prome nny ch, aby souc et c tvercu chyb byl minima lnı ) položíme rovny nule (zadane

259 body [x ; y ] jsou v leve m obra zku oznac eny c erveny mi kolec ky; jejich sour adnice jsou tedy c ıśla a pro derivova nı jsou to konstanty) 2 [(a + b x y ) 1] = 0 a 2 [(a + b x y ) x ] = 0 coz vede na na sledujıćı soustavu normálních rovnic (kde: y = a+b x = a 1+b x = a x +b x = y x = 1 = n) a sumac nı meze kvu li pr ehlednosti jiz vynecha me: a x + b x = y a x + b x = (x y ) Tuto soustavu mu z eme r es it mnoha zpu soby (Cramerovo pravidlo), protoz e ma jedine r es enı. Po obecne m vyr es enı (a na roc ne js ıćh u prava ch) dosta va me tuto podobu rovnice regresní přímky: y y = cov(x, Y) (x ) ( x) (x x) nebo jinak f(x) y = x y x y (x ) ( x ) (x x ) + y (24) kde pruhem oznac ujeme aritmetický pru me r pr ıślus ny ch velic in a cov(x, Y) je vy be rova kovariance na hodny ch velic in X a Y. Pomocı /Excelu 2010/ mu z eme rovnici regresnı pr ıḿky sestavit na sledovne (pouz ijeme-li S kove varianty vestave ny ch funkcı, vzorec se da le zjednodus s ı ): f(x) y = /=COVARIANCE.S(X;Y)/ /=VAR.S(X)/ (x /=PRŮMĚR(X)/) + /=PRŮMĚR(Y)/ (25)

260 2.2. Regresní parabola kvadracká regrese f(x) y = a + b x + c x 2 ma na sledujıćı soustavu normálních rovnic: a x + b x + c x = y a x + b x + c x = (x y ) a x + b x + c x = (x y ) Poznámka Uvedena soustava norma lnıćh rovnic ma vz dy regula rnı matici soustavy, to znamena, z e vz dy existuje jedine r es enı dane soustavy. Proto mu z eme vyuz ı t libovolnou metodu pro hleda nı kor enu. Tr eba Crammerovo pravidlo, kdy si jednotlive determinanty necha me spoc ı tat napr ıḱlad Excelem 2010: =DETERMINANT(matice). Uvedenou soustavu norma lnıćh rovnic mu z eme formálně sestavit take tak, z e si vezmeme rovnici paraboly (z nadpisu) a jenom ji napıś eme v jine m por adı a s indexy (1 = x ) první rovnice. a x + b x + c x = y ( ) Kdyz tuto rovnici vyna sobıḿe vy razem x, dostaneme druhou rovnici. A kdyz ji vyna sobıḿe vy razem x, dostaneme třetí rovnici. Pak pr ida me vz dy k obe ma strana m rovnic sumac nı symboly. a x + b x + c x = y

261 Nynı jiz stac ı vyuz ı t vlastnostı sc ı ta nı (asociativnı a distributivnı za kon). Uka z eme si to na prvnıḿ c lenu prvnı rovnice. U ostatnıćh c lenu postupujeme analogicky Volba regresní funkce a x = a x = a 1 = a n Jak ale pouze ze zadany ch dat poznat, kterou regresnı funkci (ze dvou, ktere jsme si pr ed chvıĺı uvedli) ma me zvolit? Ne kdy stac ı nakreslit bodovy graf (korelační pole), v ne mz je kaz da dvojice u daju graicky zna zorne na jednıḿ bodem v rovine (napr ıḱlad tyto dva grafy a dals ı dva na sledujıćı grafy). A z polohy jednotlivy ch bodu se na m (ne kdy) povede urc it vhodny typ regresnı funkce. Jine dve moz nosti urc enı vyhovujıćı funkce si nynı uka z eme Lineární závislost: Z rovnice pr ıḿky y = k x + q plyne, z e pro stejne pr ıŕu stky (diference) neza visle prome nne (jednoho znaku) X (x x = konst.) bychom me li mı t (alespon pr ibliz ne ) stejné přírůstky (druhe ho znaku) za visle prome nne Y (Δ () = y y = konst.). Příklad. Ma me da no te chto deve t bodu : [1 ; 1], [2 ; 0,9], [3 ; 3], [4 ; 4,9], [5 ; 7], [6 ; 9,1], [7 ; 11], [8 ; 13], [9 ; 15,1]. Hodnoty si pr epıś eme do na sledujıćı tabulky, kterou doplnıḿe o pr ıślus ne vy poc ty, vc etne jiz spoc ı tane regresnı pr ıḿky.

262 i x y 1 0,9 3 4,9 7 9, ,1 Δ () = y y / 1,9 2,1 1,9 2,1 2,1 1,9 2 2,1 y = 2,015 x 3,075 1,06 0,955 2,97 4, ,015 11,03 13,045 15,06 Δ = y y 0,06 0,055 0,03 0, ,085 0,03 0,045 0,04 Vidıḿe, z e Δ 0,085; 0,085, tedy z e zadane body skutec ne te me r perfektne lez ı na regresnı pr ıḿce y = 2,015 x 3,075 a pr itom na mi zjis te ne pr ıŕu stky Δ () 1,9; 2,1. První problém. Uvedene tvrzenı vs ak skutec ne platı pouze za pr edpokladu, z e jednotlive hodnoty x jsou ekvidistantní (na sledujıćı hodnota je vz dy stejne vzda lena od pr edchozı hodnoty). Protoz e, kdyz z pr edchozıćh devı ti bodu, ktere lez ı te me r na pr ıḿce y = 2,015 x 3,075 vynecha me dva body (napr ıḱlad třetí a šestý), polohu ostatnıćh bodu tıḿ nezme nıḿe. Tedy zbyly ch sedm bodu musı ope t te me r lez et na stejne pr ıḿce. Na m ale, jak plyne z na sledujıćı tabulky, te me r konstantnı Δ () nevycha zı. i x y 1 0,9 4, ,1 Δ () = y y / 1,9 4 2, ,1 Zkusme rozdıĺ Δ () uvaz ovat s vahou rovnou velikosti rozdıĺu x x, tedy Δ () = y y x x.

263 Vy poc ty ope t zapıś eme do na sledujıćı tabulky: Vidıḿe, z e nynı je ope t Δ () x y 1 0,9 4, ,1 = / 1,9 2 2, ,1 Δ () 2. Druhý problém. A co se stane, kdyz bude da no te chto deve t bodu : [1 ; 1], [2 ; 0,9], [3 ; 3], [4 ; 4,9], [5 ; 7], [6 ; 9,1], [7,5 ; 13], [7,5 ; 11], [9 ; 15,1], kde sedmy a osmy bod majı stejnou hodnotu x? Jaky bude rozdıĺ Δ () od pr edchozı ho (s este ho) bodu? Bude to Δ () = 13 9,1 nebo Δ () = 11 9,1? A co kdyz budeme chtı t urc it vážený rozdıĺ Δ () my vıḿe, z e nulou de lit NELZE! = y y x x? Ve jmenovateli zlomku by byla NULA a V tomto pr ıṕade sedmy a osmy bod nahradıḿe jednıḿ bodem, jehoz hodnota y je někde mezi hodnotou sedme ho a osme ho bodu, tedy je to ne jaky z pru me ru hodnot. Vhodny m kandida tem je aritmeticky pru me r, takz e dosta va me na sledujıćı tabulku:

264 Δ () i x ,5 9 y 1 0,9 3 4,9 7 9, ,1 = y y x x / 1,9 2,1 1,9 2,1 2,1 1,933 2,067 Δ () 2 Pro na mi zjis te ne vážené přírůstky (a kdyz jsme pr ıślus ne body, ktere pro stejna x majı ru zna y vhodny m zpu sobem zpru me rovali ) platı, z e: Δ () 1,9; 2, Kvadracká závislost: Pro stejne pr ıŕu stky neza visle prome nne X (x x = konst.) bychom me li mı t stejne pr ıŕu stky pr ıŕu stku Δ () za visle prome nne Y (Δ () = Δ () Δ () = konst., kde Δ () = y y ) Příklad. x y 16,1 9 4,1 1 0,1 1,1 4 9,1 16 Δ () = y y / 7,1 4,9 3,1 0,9 1 2,9 5,1 6,9 Δ () = Δ () Δ () / / 2,2 1,8 2,2 1,9 1,9 2,1 1,8 y = 0,054 x + 0,446 x + 40,693 Poznámka. I pro urc enı, zda se jedna o kvadratickou za vislost platı analogicke podmıńky jako jsme uka zali u linea rnı za vislosti: ekvidistantní x, kde pro každé x je dáno jediné y. Pokud tyto podmıńky nejsou splne ny a my chceme pouz ı t pr edchozı postup musıḿe ne jak zajistit, aby tvrzenı platilo (jako jsme to naznac ili pr i r es enı pr edchozıćh dvou proble mu ).

265 3. Korelační analýza výběrový korelační koeficient Druhy m za kladnıḿ u kolem statisticke analy zy vztahu mezi na hodny mi velic inami je urc enı te snosti za vislosti korelace (souvztaz nosti). Zatıḿco regresnı analy za se zame r uje na formu vztahu mezi sledovany mi velic inami, korelac nı analy za ukazuje, jak je tento vztah silny. Vy chodiskem pro me r enı te snosti za vislosti je pr ıślus ny regresnı model. Znalost intenzity za vislosti mezi analyzovany mi velic inami je uz itec na zejme na z te chto du vodu : Je zr ejme, z e c ıḿ jsou urc ite velic iny te sne ji va za ny, s tıḿ ve ts ı pravde podobnostı lze oc eka vat, z e zme ny jedne velic iny budou mı t za na sledek zme ny velic iny s nı statisticky va zane. Stupen va zanosti na hodny ch velic in charakterizuje, jaka je vypovı dacı schopnost uz ite ho regresnı ho modelu. Cıḿ bude rozptyl empiricky ch hodnot za visle prome nne kolem pr ıślus ne regrese mens ı (a tedy za vislost te sne js ı ), tıḿ budou regresnı odhady, zaloz ene na dane regresnı funkci, pr esne js ı. Te snost za vislosti je moz no me r it pomocı r ady charakteristik [13]. My si uvedeme jedinou výběrový korelační koeicient pro pr ıṕad lineární závislosti mezi dve ma prome nny mi, kdy S(X) S(Y) 0 (pokud ano, pokla da me: r = 0). S korelac nıḿ koeicientem ρ jsme se setkali u na hodny ch vektoru. r = (x y ) 1 n x y x 1 n x y 1 n y = S(X; Y) S (X) S (Y) = S(X; Y) S(X) S(Y) Zatıḿco regresnı koeicient b (coz je vlastne sme rnice regresnı pr ıḿky) na m naznac uje, CO ma me ha dat, korelac nı koeicient r na m r ıḱa, JAK DOBR E budeme schopni ha dat. Pokud vyjdeme z (mens ı ho) prave ho obra zku, mu z eme r ıći, z e vy be rovy korelac nı koeicient (pro pr ıḿku) umocne ny na druhou (r nazy va me koeficientem determinace, ktery je roven souc inu sme rnic sdružených přímek, kdy jedna je metodou

266 nejmens ıćh c tvercu stanovena pro minima lnı odchylky ve vodorovne m sme ru osy x a druha pro minima lnı odchylky ve svisle m sme ru osy y) poskytuje informaci, jake procento rozdıĺu existujıćıćh v pr ı jmu se zda by t vysve tlitelne rozdıĺy, ktere existujı ve vzde la nı. Obra zek 5: Zdroj WE Ne kolik pr ıḱladu graicke ho zobrazenı name r eny ch dat a jejich koeicienty korelace r. I při nulovém korelačním koeicientu (r = 0) na sobě veličiny mohou záviset, pouze tento vztah nelze vyja dr it linea rnı funkcı, a to ani pr ibliz ne (spodnı r ada obra zku ). Stanovit stupnici ocen ujıćı za vislost (slabá, str ednı, silná) nenı u kol pro matematiku, ale pro profesnı ho odbornıḱa. Podobne stupnice by vajı souc a stı oborovy ch norem.

267 Příklad 1. r = 0 r = 0,912 V leve m grafu vidıḿe jednoduche seskupenı 12 pozorova nı ([2 ; 2], [2 ; 4], [2 ; 6], [3 ; 2],, [5 ; 6]). Je zr ejme, z e symbolizujı perfektnı neza vislost ( r = 0), protoz e bez ohledu na hodnotu prome nne X mu z e prome nna Y naby vat pouze hodnot 2, 4 nebo 6. A teď se podı vejme, co se stane, kdyz k nas im 12 pozorova nıḿ pr ida me jedno dals ı [20 ; 20], s vysoky mi hodnotami obou prome nny ch. V prave m grafu je toto pr idane pozorova nı oznac eno (pro pr ehlednost) tlustou s ipkou. Podı vejte se teď na novou hodnotu korelac nı ho koeicientu. Korelace je te me r perfektnı. Co vlastne zpu sobil tento jeden jediny u chylka r? Proste velice podstatne zve ts il rozptyl nas eho vzorku. Matematicky je tu vs echno v por a dku. Vıḿe, z e kvadra t korelac nı ho koeicientu odpovı da proporci rozptylu za visle prome nne, kterou je moz ne vysve tlit rozdıĺy hodnot druhe prome nne.

268 Ne tak docela v por a dku je interpretace dat. Te me r vs echen rozptyl byl vnesen do nas eho vzorku tıḿto jediny m, novy m pozorova nıḿ. Ta velka vysve tlujıćı sıĺa r se ty ka jenom tohoto u chylka r e ve vztahu ke zbytku pozorova nı. Vu bec na m nepomu z e k leps ıḿu porozume nı vztahu v ja dru nas eho vzorku, v pu - vodnıćh nas ich 12 pozorova nı. Příklad 2. A co te chto 18 pozorova nı, pro ktere r = 0,286? Jiste jste si vs imli, z e data majı zajıḿavou koniguraci, kterou mu z eme dobr e vyuz ı t. Rozde lıḿe proste na s pu vodnı vzorek podle hodnot neza visle prome nne X do tr ı c a stec ny ch vzorku. V prvnıḿ c a stec ne m vzorku budou vs echna pozorova nı, ktere majı hodnotu X z intervalu 2; 7 ; ve druhe m vzorku budou vs echna pozorova nı, ktere majı hodnoty X z intervalu 9; 14 ; a ve tr etıḿ budou vs echna pozorova nı, ktere majı hodnoty X z intervalu 16; 21.

269 Na prvnı pohled vidıḿe, z e v kaz de m c a stec ne m vzorku lez ı vs echna pozorova nı pr esne na pr ıḿce, tedy z e v kaz de m c a stec ne m vzorku existuje perfektnı souvislost mezi X a Y. Tıḿ jsme si uka zali jednu velice du lez itou ve c, Korelac nı koeicient je linea rnı a jeho hodnota uda va, jak moc je vhodne charakterizovat vs echny pozorovane hodnoty jedinou pr ıḿkou. V ne ktery ch pr ıṕadech (částečné vzorky v pr edchozıḿ grafu) je linea rnı reprezentace vy borna. Jindy (celý vzorek v pr edchozıḿ grafu) mu z e takovy linea rnı model ztratit du lez itou c a st informace. Příklad 3. A co te chto 16 pozorova nı, pro ktere r = 0,789? Konigurace dat ukazuje, z e v cele m souboru existuje celkem dosti silný pozitivní (kladny ) vztah mezi prome nny mi X a Y. Naproti tomu v kaz de m podsouboru mu z eme pozorovat perfektní negativní (za pornou) souvislost.

270 3.2. Test významnos hodnoty korelačního koeficientu r Jak jiz vıḿe, korelac nı koeicient za kladnı ho souboru ρ ma hodnotu nula, kdyz nenı mezi velic inami lineární za vislost. Jestliz e tedy statisticky proka z eme, z e se vypoc tena hodnota vy be rove ho korelac nı ho koeicientu r vy znamne lis ı od nuly, proka z eme tıḿ, z e mezi velic inami X a Y je linea rnı za vislost. Tedy podle postupu, ktery byl uveden v kapitole zaby vajıćı se testova nıḿ hypote z, testujeme nulovou hypote zu H ρ = 0 mezi zkoumanými veličinami neexistuje lineární závislost proti alternativnı hypote ze H ρ 0 lineární závislost existuje. Pro danou hladinu vy znamnosti zvolıḿe testove krite rium a pro name r ene dvojice [x ; y ] vypoc ı ta me pozorovanou hodnotu testove statistiky. Pote urc ıḿe kriticky obor (obor pr ijetı hypote zy) a rozhodneme, zda testova statistika lez ı v kriticke m oboru nebo v oboru pr ijetı. V literatur e jsou pro prokazova nı vy znamnosti r pr edepisova ny ru zne testovacı statistiky. Poznámky ke korelační analýze 1. S rostoucıḿ poc tem sledovany ch bodu sice ve ts inou klesa hodnota vy be rove ho korelac nı ho koeicientu r, ale sta le se (limitne ) pr ibliz uje hodnote korelac nı ho koeicientu populace ρ. Ma me-li pouze dve pozorova nı, najdeme vz dy pr ıḿku (pr ıḿka je urc ena dve ma body) ktera obe ma body procha zı a to bez nevysve tlitelny ch odchylek. Ve vzorku tedy dosta va me perfektnı linea rnı za vislost, i kdyz v cele populaci mezi zkoumany mi velic inami žádná (a tıḿ pa dem ani linea rnı ) za vislost nemusı vu bec existovat. Kdyz pr ida me dals ı (tr etı ) pozorova nı, pr ıḿka jiz nemusı vs emi tr emi body procha zet, takz e korelac nı koeicient se jiz nerovna nule, ale je sta le vysoky. Cıḿ ve ts ı bude poc et name r eny ch bodu, tıḿ ve ts ı bude moz nost nalezenı pr ıṕadne za vislosti, i tr eba v bodech s iroce rozpty leny ch kolem pr ıḿky, kdy za vislost je slaba, tedy i pro pr ıṕady nıźky ch (blıźky ch nule) korelac nıćh koeicientu.

271 2. Pr i korelac nı analy ze (hleda nı, zda existuje vy znamna pr ıḿkova za vislost) jediny bod vzda leny (odlehly ) od ostatnıćh mu z e zajistit nalezenı vy znamne korelace, ac zbyle body (bez tohoto odlehle ho) mohou vykazovat naprostou neza vislost mezi sledovany mi velic inami viz obra zek. Jediny vzda leny (moz na problematicky ) bod zajistı hodnotu korelac nı ho koeicientu pr ekrac ujıćı kritickou hodnotu. V takove m pr ıṕade nelze bra t vy sledek testu vy znamnosti hodnoty korelac nı ho koeicientu pr ıĺis va z ne, protoz e rozde lenı bodu zr ejme nevyhovuje pr edpokladu m nutny m pro platnost pouz ite ho testu. 4. Příklad K dispozici jsou tato data o prodeji (druhy r a dek), jak je ovlivn ovaly na klady na reklamu (prvnı r a dek): x y ,8 Urc ete rovnici linea rnı regrese, rovnici kvadraticke regrese a vy be rovy korelac nı koeicient (te snost vztahu pro linea rnı regresi) pro te chto s est dvojic hodnot [x ; y ], kde i = 1, 2,, 6. Lineární regrese 1. Pro linea rnı regresi vyjdeme ze vztahu (25) a nejprve necha me Excel 2010 spoc ı tat vs echny potr ebne hodnoty. Uvedenou tabulku pr epıś eme do Excelu a vyvola me pr ıślus ne vestave ne statisticke funkce.

272 Potom jiz stac ı dosadit zıśkane hodnoty do vztahu (25) a obdrz ıḿe hledanou rovnici regresnı pr ıḿky. y = cov(x, Y) S (x x ) + y = 2, 5 (x 2, 5) + 42, 3 y 0,714 x + 40,514 3, 5 Lineární regrese 2. A co v situaci, kdy nema me po ruce vhodny softwarovy na stroj? Nezby va na m, nez si pr ıślus ne charakteristiky spoc ı tat. Regresnı pr ıḿka potom bude mı t (podle 24) rovnici: y = x y x y (x ) ( x ) (x x ) + y Vidıḿe, z e potr ebujeme (x y) x y (x ) coz urc ıḿe tak, z e tabulku pr epıś eme svisle a doplnıḿe vhodny mi sloupci.

273 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514

274 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514

275 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514

276 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514

277 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514

278 y = x y x y (x ) ( x ) (x x ) + y i x y x y x : n= : , , x = 15 6 = 2,5 y = 253,8 6 = 42,3 (x y) = ,833 (x ) = ,167 Po dosazenı : y = 107,833 2,5 42,3 9,167 2,5 (x 2,5) + 42,3 y 0, 714 x + 40, 514 Lineární regrese 3. A co v pr ıṕade, z e si na vzorec (24) nevzpomeneme? Anebo (jako v tomto pr ıṕade ) kdy poz adujeme i kvadratickou regresi? Potom je vhodne js ı vyuz ı t soustavy norma lnıćh rovnic. Ope t pr epıś eme tabulku, tentokra t svisle a doplnıḿe ji vhodny mi sloupci tak, abychom mohli sestavit pr ıślus ne soustavy norma lnıćh rovnic.

279 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

280 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

281 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

282 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

283 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

284 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

285 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

286 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

287 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

288 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

289 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

290 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

291 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

292 i x y x x y y x x x y : n = : , , , , Lineární regrese Soustava norma lnıćh rovnic regresní funkce f(x) : y 0,714 x + 40,514 Výběrový korelační koeicient r = Tedy korelace (linea rnı za vislost) je proka za na. 6 a + 15 b = 253,8.(15) 15 a + 55 b = 647.(-6) ma r es enı : ,8 (55 15 ) (10750,04 253,8 ) a 40,514 b 0,714 0,790 Kvadratická regrese Soustava norma lnıćh rovnic 6 a + 15 b + 55 c = 253,8 15 a + 55 b c = a b c = ma r es enı : a 40,693 b 0,446 c 0,054 regresní funkce f(x) : y 0,054 x + 0,446 x + 40,693

293

294 U vod do Hospodářské statistiky

295 Obsah kapitoly: Hospodářská staska 1. Staska a ekonomie Za kladnı pojmy Individuální indexy Jednoduche individua lnı indexy Pr ıḱlad: trz by Pozna mka k velic ine s na zvem pru me rny koeicient vy voje Pr ıḱlad: pr eprava cestujıćıćh Sloz ene individua lnı indexy Pr ıḱlad Souhrnné (agregátní) indexy 322 Pr ıḱlad Závěr kapitoly Shrnu Pr ıḱlady pouz ı vany ch indexu v praxi

296 1. Staska a ekonomie Statistika byla zpoc a tku vyuz ı va na spıś e ve ve da ch pr ıŕodnıćh (fyzika, chemie), v poslednıćh letech vs ak zaznamena va u spe ch take v disciplıńa ch humanitnı ho charakteru, napr ıḱlad v psychologii, sociologii, ale take v ekonomii. K vy razne js ıḿu rozvoji statisticky ch metod v ekonomii dos lo na pr elomu 19. a 20. stoletı, a to zejme na dıḱy novy m objevu m ve statistice (zejme na na stupu metod matematicke statistiky). V současné době patří statistika stejně jako informatika nebo operační výzkum ke standardnímu vybavení moderního ekonoma. Proto je nutné, aby ekonomové znali základy statistiky a měli alespoň základní představu o možnostech a nástrojích této disciplíny. [3, str. 35] Aplikacı statisticky ch metod na ekonomicka a socia lne ekonomicka data vznikla samostatna statisticka disciplıńa, hospoda r ska (ekonomicka ) statistika. Pr edme tem ekonomicke statistiky je analy za stavu a vy voje jevu v hospoda r ske oblasti jako vy chodiska k hospoda r ske mu rozhodova nı c i stanovenı hospoda r ske politiky Základní pojmy Ukazatelé jsou velic iny, se ktery mi se denne setka va me. Ať jiz v dennıḿ tisku, v rozhlase, c i v televizi. Seznamujeme se s takovy mi pojmy jako hruby doma cı produkt (HDP), dovoz, vy voz, produktivita pra ce, pru me rna mzda, vy sledky voleb, apod. Tyto pojmy jsou vz dy doprova zeny c ıśly, ktera charakterizujı velikost odpovı dajıćı ho (ekonomicke ho, spolec enske ho, ) jevu, pr ıṕadne vy voj dane ho jevu. Dovı da me se, z e napr ıḱlad HDP vzrostl o xy %, saldo zahranic nı ho obchodu dosa hlo vy s e yz mld. Kc, roc nı mıŕa inlace byla xz %. Za roven se zpravidla seznamujeme s tıḿ, zda tyto vy sledky ma me hodnotit kladne c i za porne, v jaky ch souvislostech a za jaky ch podmıńek. Nejjednodus s ı a c asto pouz ı vanou metodou statisticke ho rozboru je porovna va nı takovy ch statisticky ch u daju. Jednou z moz nostı, jak vza jemne porovnat dve hodnoty, je zkouma nı, kolikra t je jedna hodnota ve ts ı jak druha. To provedeme matematickou operacı dělení, jejıḿz vy sledkem je podıĺ. Druhou

297 moz nostı je zkoumat, o kolik je jedna hodnota ve ts ı jak druha. To provedeme matematickou operacı odčítání, jejıḿz vy sledkem je rozdıĺ. Stascký ukazatel je c ıślo, ktere v dane m prostoru a c ase charakterizuje urc itou skutec nost (urc ity jev). Pr esne ji r ec eno je funkcí hodnot znaku statistických jednotek (funkcı charakteristik znaku). Je to kvantitativnı popis urc ite socia lne ekonomicke skutec nosti. Vezmeme-li napr ıḱlad ukazatel odpracovana doba, pak tento ukazatel je v metodicky ch pr edpisech vymezen jako u hrn pracovnı doby odpracovane de lnıḱy (pracovnıḱy) dane ho podniku (za vodu, provozovny) v me sıći (c tvrtletı, roce). Jde tedy o popis ukazatele, kde je obecne deinova n čas (me sıć) a prostor (podnik). Jestliz e pr esne deinujeme tento c as a prostor (napr ıḱlad u nor 1997, podnik E.ON), dostaneme konkre tnı hodnotu ukazatele nazy vanou údaj. Poměrný ukazatel vznikne jako podıĺ (pome r) dvou c ıśelny ch hodnot. Mohou by t podıĺem stejnorody ch u daju, ktere jsou stejne ho obsahu a rozme ru. Potom je pome rne c ıślo bezrozme rne a c asto ho vyjadr ujeme v procentech. Pr ıḱladem mu z e by t ukazatel podıĺu z en v celkove m poc tu pracovnıḱu irmy. Pokud je v c itateli pome rne ho ukazatele hodnota jine ho obsahu a rozme ru nez ve jmenovateli, jedna se o podıĺ nestejnorody ch ukazatelu a pome rny ukazatel je rozme rovy. Napr ıḱlad poc et obyvatel na jednoho zubar e, produktivita pra ce podniku apod. Pr i srovna va nı ukazatelu z c asove ho hlediska hovor ıḿe o základním období, ktere oznac ujeme indexem 0 a běžném období, ktere oznac ujeme indexem 1. Poměrné ukazatele struktury (nebo-li sloz enı ) vyjadr ujı podıĺ urc ite c a sti vzhledem k celku. Indexy jsou pome rne hodnoty, ktere umoz n ujı srovna nı shodne vymezeny ch ukazatelu (stejne ho druhu a obsahu).

298 Index je podıĺ hospoda r sky ch ukazatelu, indika tor pokroku c i neu spe chu. Je to bezrozme rne c ıślo (c asto se uva dı v procentech), ktere na m ukazuje pru be h ne jake ho vy voje tıḿ, z e zaznamena va zme ny oproti dr ı ve js ıḿu obdobı. Musı charakterizovat celkovou situaci, nejen situaci jednotlive ho vy robku. Indexu existuje velke mnoz stvı a za lez ı na vıće hlediscıćh, ktery druh indexu pouz ijeme. Je tr eba rozlis ovat, zda jde o velic iny extenzitní nebo intenzitní a jestli srovna va me jednu nebo vıće jednotek, ktere mohou by t buď stejnorodé nebo nestejnorodé. Z hlediska stejnorodosti ukazatelu (ze ktery ch vznikly) rozlis ujeme indexy individuální a indexy souhrnné. Uvedene nove pojmy si nynı objasnıḿe. Extenzitní ukazatel q uda va množství, objem, rozsah nebo počet sledovane ho jevu (napr ıḱlad vy roba, prodej, poc et pracovnıḱu, zboz ı v kusech apod.) v ne jake jednotce (Kc, kg, m, ) a vyjadr uje tak ne jakou (ekonomickou) skutec nost; je vyja dr en c ıślem. Obvykle jej oznac ujeme q. Extenzitní (stejnorodé) ukazatele shrnujeme (urc ujeme celkovou hodnotu ukazatele na za klade jeho dıĺc ıćh hodnot) součtem. Mu z eme napr ıḱlad sec ıśt mnoz stvı prodany ch akciı te z e irmy u ne kolika makle r u. Nebo souc et produkcı (v kusech) jednoho druhu zboz ı za jednotlive me sıće roku da va roc nı produkci tohoto druhu zboz ı. Nestejnorode extenzitnı velic iny sc ı tat nelze. Napr ıḱlad nema smysl sc ı tat prodane vkladove listy a mnoz stvı poskytnuty ch u ve ru, i kdyz byly realizova ny v jedne bance. Intenzitní ukazatel p da va do pome ru (podílu) dva extenzitnı ukazatele, ktere majı logickou souvislost a jsou vyja dr eny kaz dy v jiny ch jednotka ch (Kc /m, t/ha, ). Tedy vyjadr uje úroveň (napr ıḱlad cena je podıĺ trz eb a prodane ho mnoz stvı ). Obvykle jej oznac ujeme p. Intenzitní (stejnorodé) ukazatele shrnujeme (urc ujeme celkovou hodnotu ukazatele na za klade jeho dıĺc ıćh hodnot) váženým průměrem. Ru znorode intenzitnı velic iny vznikajı jako podıĺ nestejnorody ch extenzitnıćh velic in (napr ıḱlad ceny elektr iny a plynu). Takove velic iny nelze ani sc ı tat ani pru me rovat.

299 Intenzitnı a extenzitnı velic iny se c asto vyskytujı ve dvojici, kde urc ujı intenzitu (u roven ) a kvantitu (mnoz stvı ) dane ho jevu (napr ıḱlad: cenu prodane mnoz stvı, produktivitu pra ce odpracovany poc et hodin, ). Odpovı dajıćı hodnotu velic iny intenzitnı p a extenzitnı q lze na sobit, pr ic emz vznikne nova souhrnna extenzitnı velic ina, kterou obvykle oznac ujeme Q. Tuto velic inu lze ope t sc ı tat, a to i v pr ı pade nestejnorody ch velic in q. Tr eba sec tenıḿ trz eb za jednotlive vy robky dostaneme celkovou trz bu prodejny. Chceme-li ve de t, kolikrát (o kolik %) je jedna hodnota ukazatele mens ı /ve ts ı nez jina, budeme obe hodnoty srovna vat podílem. Budeme-li chtı t ve de t o kolik jednotek je jedna hodnota ukazatele mens ı /ve ts ı nez jina, budeme obe hodnoty srovna vat rozdílem. Podıĺem dvou hodnot te hoz ukazatele zıśka me (jak jsme uvedli na pr edcha zejıćı stra nce) index, rozdıĺem pak absolutnı pr ıŕu stek. Obe tyto mıŕy rozdıĺnosti jsou rovnocenne a nezastupitelne, ale vza jemne se dopln ujı. Poměrná čísla rozměrová jsou tvor ena jako podıĺ ukazatelu ru zne ho obsahu a rozme ru. Pokud oznac ı me pome rny ukazatel z = y, pak mu z eme pru me rnou hodnotu pome rne ho ukazatele vypoc ı tat x ru zny mi zpu soby. Tak jako mnohokra t v te to pr ıŕuc ce budeme psa t (kvu li u spor e mıśta) pouze prosty symbol sumy, u ktere vynecha me sc ı tacı index ⁴³. Pru me rnou hodnotu pome rne ho ukazatele vypoc ı ta me jako podíl souc tu vs ech hodnot c itatele a souc tu hodnot jmenovatele pome rne ho ukazatele: z = y x ⁴³ Spra vne by me lo by t napr ıḱlad x nebo (pokud i = 1, 2,, n) x

300 Pru me rnou hodnotu pome rne ho ukazatele vypoc ı ta me jako vážený aritmetický průměr hodnot pome rne ho ukazatele, kde vahami bude jmenovatel pome rne ho ukazatele: z = z x x Pru me rnou hodnotu pome rne ho ukazatele vypoc ı ta me jako vážený harmonický průměr hodnot pome rne ho ukazatele, kde vahami bude c itatel pome rne ho ukazatele: z = y V hospoda r ske praxi je c aste pouz itı va z ene ho harmonicke ho pru me ru napr ıḱlad pr i vy poc tu pru me rne produktivity pra ce ve irme sloz ene z ne kolika ilia lek. Indexová teorie pouz ı va pro obecne oznac enı ukazatelu, s nimiz pracuje, zauz ı vane symboly, ktere jasne rozlis ujı extenzitnı a intenzitnı ukazatel. Standardne se setka va me se tr emi druhy indexu, a to jednıḿ intenzitnıḿ (p) a dve ma extenzitnıḿi (q, Q), pro ne z platı vztah Q = p q. (26) Tato rovnice vycha zı historicky ze vztahu hodnoty Q, jednotkove ceny p a mnoz stvı q. Na cele m sve te nejzna me js ı a take nejvıće napadany je index spotřebitelských cen, ktere mu take ne kdy r ıḱa me index životních nákladů. Proti tomuto indexu se c asto namı ta, z e se v ne m skutec na zme na z ivotnıćh na kladu zrcadlı jen nedostatec ne, protoz e spotr ebnı zvyklosti se me nı a navıć je zkonstruova n na za klade spotr ebnı ho sche matu spotřebního koše ktere pr esne neodpovı da snad pro z a dne ho spotr ebitele.

301 Srovna nı dnes nı ho indexu z ivotnıćh na kladu s rokem 1989 je jiz skoro k nic emu a jestliz e se dals ıḿ zr ete zova nıḿ poc ı ta zpe t az do roku 1900, je to sice matematicky zcela moz ne, ale jinak zcela nesmyslne. Cituji: Tím se zabývají jen historikové podivíni, kteří nám ještě dnes pečlivě a přesně vypočítají, jakou hodnotu měl sestercius ve starém Římě. [14, str. 111] Obra zek 6: Pr evzat z [14] Mezi c etny mi cenovy mi indexy nabyly zvla s tnı ho vy znamu dva: Laspeyresu v index (porovna nı cen na za klade pu vodne spotr ebovane ho mnoz stvı stara mnoz stvı jako za kladna) a Paascheho index (porovna nı cen na za klade nove spotr eby) ⁴⁴. Laspeyresu v index te me r vz dy dosahuje vys s ıćh hodnot jako index Paascheho vzhledem k tomu, z e pr i neproporciona lnıḿ zdraz enı jednotlivy ch druhu zboz ı spotr ebitel ve ts inou pr echa zı na jine (lacine js ı ) druhy, takz e nova zboz ı zachytı c a st zdraz enı. ⁴⁴ Paasche a Laspeyres byli ne mec tı na rodohospoda r i z konce 19. stoletı.

302 Musıḿe si ovs em uve domit, z e stoupne-li ne jaky index (stanovovany napr ıḱlad pomocı kos e pak jde /jak již víme/ o bodovy odhad charakteristiky) z hodnoty 108,6 v jednom me sıći na 108,8 v na sledujıćıḿ me sıći, ner ıḱa to nic jine ho, nez toto: Pravděpodobnost, že hodnoty (které jsou základem výpočtu) stouply, je nepatrně větší než pravděpodobnost, že se nezměnily nebo klesly. Protoz e i kdyz budeme pr edpokla dat sme rodatnou odchylku pr esnosti σ jen ve vy s i 3 (a to je i pr i pec live pra ci nereálně ma lo), musıḿe r ıći: Údaj prvního měsíce s bodovým odhadem 108,6 leží s 95 % pravděpodobností mezi 108,0 a 109,2 (pravidlo dvou σ da va 95% pravde podobnost). U daj 108,8, ktery byl urc en za novy me sıć, lez ı (ma intervalovy odhad) mezi 108,2 a 109,4. Nenı tady vu bec vylouc eno, z e spra vny index za pr edchozı me sıć je 108,8 a za novy me sıć jen 108,5 nebo take z e oba jsou si pr esne rovny. Jestliz e vs ak naproti tomu dels ı r ada takovy ch indexu vykazuje sta le stejny vy voj, sta va se spra vnost pozorova nı sta le pravde podobne js ı. Na sledujı -li napr ıḱlad po hodnota ch 108,6 a 108,8 jako dals ı c ıśla v r ade 109,1 a 109,5, mu z eme pra vem nikoli vs ak s absolutnı jistotou pr edpokla dat, z e vy voj indexu za dane c tyr i me sıće vyjadr uje skutec ne existujıćı vzestupny vy voj. Žádný index není zcela přesný! To vs ak nenı argument proti indexu nebo proti jake mukoliv jine mu statisticke mu s etr enı. Nenı -li moz no zıśkat z a dnou dokonalou informaci, musıḿe se spokojit s pokud moz no nejpr esne js ıḿi odhady. A i ten nejpr esne js ı odhad je sta le jen odhad ale je nepome rne cenne js ı nez neve domost, pra zdna domne nka nebo ve s te nı z kr is ťa love koule. Kaz dy kos zboz ı je konec koncu jen vy be rovy soubor a jiz v same podstate vy be ru je, z e nemu z e zprostr edkovat absolutnı jistotu o cele m za kladnıḿ souboru. Potřebujeme vždy výpočty na zlomky procent? Nas e mys lenı je ve ts inou pr ıĺis ovla da no utkve lou pr edstavou, z e c ıślo vypoc ı tane az na poslednı platne mıśto je vrcholem pr esnosti a pravdivosti. Ve skutec nosti je tomu c asto naopak. Jen zr ı dkakdy je moz no na ota zku Kolik je hodin? odpove de t naprosto pr esne ve tvaru ( gong ozna mı ) 15 hodin, 32 minuty, 40 sekund. Stejne uz itec na a nepr ıĺis lz iva je odpove ď půl čtvrté.

303 2. Individuální indexy Individuální indexy jsou nejjednodus s ıḿi velic inami, ktere bezprostr edne srovna vajı dve hodnoty te hoz ukazatele (podíl stejnorodých veličin). Pokud porovna va me u daj o u rovni jedne velic iny, ktery jsme zıśkali bez shrnova nı souc tem nebo pru - me rem, hovor ıḿe o jednoduchých individuálních indexech. Pokud jsou u daje sumarizova ny nebo pru - me rova ny z vıće zdroju (napr ıḱlad z vıće prodejen) hovor ıḿe o složených individuálních indexech Jednoduché individuální indexy Tyto jednoduche individua lnı indexy nejsou nijak podrobne ji c lene ny ani shrnova ny. Budeme-li srovna vat hodnotu intenzitnı ho ukazatele p v situaci 1 (v c asove m srovna nı nazy vane běžným obdobím b. o.) a v situaci 0 (v c asove m srovna nı nazy vane základním obdobím z. o.), obdrz ıḿe I (ne kdy se te z oznac uje i ). Analogicky mu z eme konstruovat jednoduche indexy i pro extenzitnı ukazatele q a Q. Tedy I = p p I = q q I = Q Q (27) Ze vztahu (26) plyne, z e I = I I Individua lnı jednoduche indexy (zde vy luc ne c asove zjis ťujeme hodnotu jednoho ukazatele v dane m prostoru, ale v ru zne m c ase) se c asto vyskytujı sdruz ene do dels ıćh c asovy ch r ad. Tehdy mohou by t pr ıślus ne indexy poc ı ta ny

304 ke stejnému základu bázi napr ıḱlad (27) k nejstars ı hodnote (ba zı mu z e by t jake koliv obdobı, nikoliv nutne prvnı ) v c asove r ade pu vodnıćh pozorova nı tzv. bazické indexy S = x x k proměnlivému základu k bezprostr edne pr edcha zejıćıḿu pozorova nı v c asove r ade pu vodnıćh hodnot x tzv. řetězové indexy T = x r ete zovy index vyja dr eny v procentech se nazy va tempo růstu; geometricky pru me r r ete zovy ch indexu se nazy va průměrný koeicient vývoje. K posouzenı te z e zme ny u vs ech jednotek (prodej ve vs ech ilia lka ch dane ho obchodnı ho r ete zce apod.) musıḿe pouz ı t složené individuální indexy.

305 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786.

306 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786.

307 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786.

308 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786.

309 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786.

310 Jednoduché (individuální) indexy jeden ukazatel jednoho střediska Trz by: (za kladnı obdobı ma VZ DY index NULA) ,8 (tedy n = 5) Urc ete vhodne indexy, pru me rny koeicient vy voje a odhadne te trz by v na sledujıćıḿ me sıći. Graicky zna zorne te r adu trz eb (c ıśel) v c ase. i x S = T = 0 40 [1] / ,05 1, ,075 1, ,025 0, ,075 1, ,8 1,12 1,042 T T T T T = x x x x x x x x x x = S x = T T T T T = 1,05 1,024 0,953 1,049 1,042 = S = 1,12 = 1,022 V kaz de m obdobı tedy trz by rostly 1,022 kra t. Pr edpokla dane trz by pro s este obdobı odhadneme nejsnadne ji tak, z e hodnotu pa te ho obdobı vyna sobıḿe koeicientem 1,022. V šestém období budou trz by pravde podobne : 44,8 1,022 = 45,786. Pr esne js ı odhad pravde podobny ch trz eb v s este m obdobı zıśka me napr. pomocı regresní analýzy (regresnı pr ıḿku a regresnı parabolu jsme zkoumali v pr edchozı kapitole) nebo pomocı trendu (linea rnı a kvadraticky trend bude probıŕa n v kapitole Modelova nı c asovy ch r ad).

311 Poznámka k veličině s názvem průměrný koeficient vývoje Na pr edchozıḿ pr ıḱladu jsme si uka zali, z e pro k zadany ch hodnot nemusıḿe poc ı tat k 1 r ete zovy ch indexu a urc ovat jejich geometricky pru me r, ale stac ı vypoc ı tat k 1 odmocninu bazicke ho indexu S. Jiny mi slovy na s odhad vy voje pomocı pru me rne ho koeicientu vy voje je zaloz en pouze na první a poslední zadane hodnote. Ostatnı zadane u daje nemajı na na s odhad vy voje naprosto z a dny vliv. Pru me rny koeicient vy voje mu z eme jes te urc it take tak, z e ponecha me beze zme ny prvnı a poslednı zadanou hodnou a zbyle u daje upravıḿe tak, aby vs echny dohromady tvor ily geometrickou posloupnost. Pru me rny koeicient vy voje je potom roven kvocientu te to geometricke r ady. Vs e si uka z eme na na sledujıćıḿ pr ıḱladu, kde jsou c ıśelne u daje zaokrouhlene na stovky. Dlouhodoby m pozorova nıḿ bylo zjis te no, z e autobusova linka xyz pr epravı ve c tvrtek 4 tisíce cestujı cıćh (tedy ve c tvrtek je pr epraveno od do osob), v pa tek je to take 4 tisíce, zatıḿco v sobotu a v nede li pouze 1 tisíc. Nynı si pr edstavme, z e ma me k dispozici na sledujıćı r adu u daju : (Ct) ; (Pa ) ; (So) a ma me odhadnout, jake c ıślo bude na sledovat. Tedy urc it, kolik asi pasažérů je přepravováno v neděli. Sice se nejedna o typicky pr ıṕad, protoz e k dispozici ma me pr ıĺis maly vzorek, ale to snad v tomto pr ıṕade pr ıĺis nevadı. Alespon si proto pr ipomen me, z e každý závěr a tím spíše také rozhodnutí by mělo být dostatečně podloženo. Vyuz itı zdravého selského rozumu. Pokud vıḿe, co jednotlive zkratky znamenajı a na za klade te to znalosti usoudıḿe, z e na s zajıḿa poc et pasaz e ru o vıḱendove m dnu, mu z eme du vodne pr edpokla dat, z e to bude stejne jako jiny vy kendovy den. Tedy ope t jeden tisıć.

312 Odhad pomocı průměrného koeicientu vývoje. i den x S = T = 0 Ct [1] / 1 Pa So ,25 0,25 Ne? ,5 Pru me rny koeicient vy voje: coz je stej- T T = 1 0,25 = S = 0,25 = 0,5 ne jako kvocient q = geometricke r ady 4 ; 2 ; 1 ve ktere jsme vhodne upravili prostr ednı (pa tec nı ) hodnotu. Tedy na za klade pru me rne ho koeicientu vy voje bychom pro nede li odhadovali 500 pasaz e ru a to, jak vıḿe z prvnı odra z ky, nebude asi az tak moc pr esne, ale v za sade je to moz ne. A uz jsme zase u proble mu, ktery jsme diskutovali jiz dr ı ve. A to u rozde lova nı pu vodnı ho vzorku na c astec ne vzorky, zde na pracovnı dny a vıḱendove dny. V kapitole regrese jsme data vyrovna vali pr ıḿkou podle vzorce (25). Tento mu z eme aplikovat i na na s pr ıṕad, pouz ijeme-li k oznac enı dnu mıśto zkratek napr ıḱlad jejich por adove c ıślo. Pomocı sour adnic bodu lez ıćı ho na pr ıḿce pak odhadneme poz adovany u daj. x y = f(x) ? Potom f(x) = (x 2) f(4) = (4 2) = 0 Tedy na za klade linea rnı regrese bychom pro nede li odhadovali do 50 pasaz e ru a to je velmi nepravde podobne.

313 V pr edme tu Matematika jsme zadany mi body prokla dali polynom, a to Lagrangeu v interpolac nı mnohoc len. Pro na s pr ıṕad: f(x) = () () () () () () = () () () () () () 1500x x f(4) = = 5000 Tedy na za klade interpolac nı ho mnohoc lenu bychom pro nede li odhadovali MÍNUS pět tisíc pasaz e ru a to je nemoz ne. A co kdyz bude zada no: (Pa ) ; (So) ; (Ne) 1 000? A chte li bychom odhadnout, kolik asi pasažérů je přepravováno v pondělí. i den x S = T = 0 Pa [1] / 1 So ,25 0,25 2 Ne ,25 1 Pru me rny koeicient vy voje: T T = 0,25 1 = S = 0,25 = 0,5 Po? ,5 Tedy na za klade pru me rne ho koeicientu vy voje bychom pro ponde lı odhadovali 500 pasaz e ru, ovs em selský rozum říká, z e ponde lı je pracovnı den a tedy bychom me li oc eka vat spıś e čtyři tisíce pr epravovany ch osob. Jak tedy de lat smysluplne odhady za visle na c ase si uka z eme v na sledujıćı kapitole.

314 2.2. Složené individuální indexy Sloz ene individua lnı indexy jsou indexy stejnorode ho ⁴⁵ extenzitnı ho nebo intenzitnı ho ukazatele, ktere pouz ı va me za situace, kdy hodnoty dane ho ukazatele jsou c lene ny na dıĺc ı a v ra mci vy poc tu indexu prova dıḿe shrnova nı dıĺc ıćh hodnot. Tedy porovnáváme údaje (o mnoz stvı, cene, ), ktere vznikly součtem. Vzhledem k pozna mce 45 pak platı (sc ı tacı index i z pohodlnosti ope t uvedeme pouze u prvnı ho vy razu): I = I = Q ; Q ; I = I = q q (28) I = I = p = p = ( ) = ( ) (p q ) q (p q ) q (29) Index I nazy va me indexem proměnlivého složení, protoz e na jeho velikost majı vliv jak zme ny intenzitnı velic iny p (napr ıḱlad ceny zboz ı v jednotlivy ch prodejna ch), tak i zme ny extenzitnı velic iny q (napr ıḱlad mnoz stvı prodane ho zboz ı na jednotlivy ch prodejna ch). ⁴⁵ Obecne lze r ıći, z e: [11, str. 111] Ukazatel vyjadr ujıćı velikost urc ite ho jevu bez vztahu k jine mu jevu (c asove pru me ry, zisk, pr idana hodnota apod.) je stejnorody, ma -li ve cny smysl shrnovat jeho dıĺc ı hodnoty souc tem. Ukazatel vyjadr ujıćı velikost jednoho jevu na me rnou jednotku jine ho jevu je stejnorody tehdy, kdyz jsou stejnorode ukazatele obou jevu, z nichz se skla da. nebo kdyz mu z eme jeho dıĺc ı hodnoty shrnovat pru me rem. Pokud toto neplatı, nenı ukazatel stejnorody.

315 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

316 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

317 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

318 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

319 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

320 Individuální indexy složené jeden ukazatel ve více střediscích 6 prodejen nabıźı stejne zboz ı. K urc ite mu datu kaz da prodejna upravila cenu tohoto konkre tnı ho zboz ı, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] prodejna pr ed po pr ed po pr ed po p p q q Q = p q Q = p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q (pokud na s zajıḿa index stálého složení I nebo index struktury I ). Index hodnoty: I = Q Q = I = (p q ) (p q ) ,005 Index mnoz stvı : I = q q = = ,001 I = (p q ) q (p q ) q = , ,995

321 Index prome nlive ho sloz enı : I = (p q ) q (p q ) q = I I = ,996 Pro jednotlive prodejny ma me: napr. E I = p (E) p (E) = I = q (E) q (E) = I = Q (E) Q (E) 1,003 cena vzrostla o tr i desetiny procenta 0,991 prodej klesl o deve t desetin procenta = 0,994 trz by klesly o s est desetin procenta A celkově I 0,996 pru me rna cena jednoho vy robku klesla o c tyr i desetiny procenta I 1,005 prodej v cele irme vzrostl o 5 desetin procenta I 1,005 objem trz eb cele irmy vrostl o 5 desetin procenta, z toho: v du sledku zme n ceny dane ho vy robku na jednotlivy ch poboc ka ch sice poklesl (kdy pru me rna cena vy robku I klesla ve irme pr ibliz ne o c tyr i desetiny procenta), ale v du - sledku zme n v prodeji (poc tu prodany ch kusu ) na poboc ka ch celkove vzrostl (kdy prodej v cele irme I vzrostl pr ibliz ne o pe t desetin procenta).

322 3. Souhrnné (agregátní) indexy Souhrnné indexy mnoz stvı a u rovne jsou indexy nestejnorodých extenzitnıćh a intenzitnıćh velic in. Pro nestejnorode velic iny je charakteristicke, z e je nelze sc ı tat (ani kdyz jsou vyja dr ene ve stejny ch me rny ch jednotka ch), ale nelze je ani pru me rovat. Pouz ı vajı se za situace, kdy nelze sestrojit indexy extenzitnıćh ukazatelu (28), pr ıṕadne index prome nlive ho sloz enı (29) z du vodu nemoz nosti sestavit velic inu q nebo Q (napr ıḱlad nelze urc it pru me rnou cenu pro skupinu ru zny ch vy robku ). Za kladem koncepce souhrnny ch indexu je mys lenka pru me rova nı zme n (vyja dr eny ch jednoduchy mi indexy) dıĺc ıćh hodnot sledovane ho ukazatele. V pr ıṕade cenovy ch indexu se zr ejme jedna o pru me rova nı indexu cen jednotlivy ch vy robku s tıḿ, z e jako va hy vystupuje hodnota produkce ze za kladnı ho obdobı (situace 0), nebo z be z ne ho obdobı (situace 1). Jednou z moz nostı je pouz itı va z ene ho aritmeticke ho pru me ru individua lnıćh jednoduchy ch indexu cen, kde jako va hy pouz ijeme strukturu produkce ze za kladnı ho obdobı. Obdrz ıḿe pak pru me rovany tvar jiz dr ı ve zmin ovane ho Laspeyresova indexu I [11, 115], ktery po u prave take nazy va me Laspeyresův cenový index a oznac ujeme I. I = (I p q ) (p q ) () = ( p q ) (p q ) = (p q ) (p q ) = I Budeme-li analogicky postupovat pr i zme na ch objemu ru znorode produkce, dostaneme Laspeyresův objemový index I. Laspeyresu v objemovy index I = (p q ) (p q ) Souhrnny hodnotový index I = (p q ) (p q )

323 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

324 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

325 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

326 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

327 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

328 Souhrnné indexy více ukazatelů Prodejna nabıźı stejné (= srovnatelne ) zboz ı od 6 vy robcu. K urc ite mu datu prodejna upravila ceny, coz se projevilo na poc tu prodany ch kusu. Spoc ı tejte vhodne indexy. Na sledujıćı u daje ma me k dispozici za stejny c asovy u sek PR ED a PO u prave ceny. Cena p [Kc /kus] Prodej q [kusy] Trz by Q [Kc ] vy robce pr ed po pr ed po pr ed po p p q q p q p q p q p q A B C D E F Dopoc ı ta me trz by (Q = p q) a zapıś eme je do tabulky. Potom jes te vyplnıḿe pomocny sloupec p q a urc ıḿe poz adovane indexy. Cenovy i.: I = (p q ) (p q ) Hodnotovy index: I = (p q ) (p q ) = ,001 Objemovy i.: I = (p q ) (p q ) = ,005 = ,005

329 Pro jednotlive vy robce ma me: napr. F A celkove I = p (F) p (F) = I = q (F) q (F) = I = Q (F) Q (F) 1,001 cena vzrostla o jednu desetinu procenta 1,027 prodej vzrostl o dve cele sedm desetin procenta = 1,028 trz by vzrostly o dve cele osm desetin procenta I 1,001 vlivem zme n v u rovni jednotkovy ch cen celkove trz by vzrostly pr ibliz ne o jednu desetinu procenta I 1,005 vlivem zme n v prodane m mnoz stvı celkove trz by vzrostly pr ibliz ne o pe t desetin procenta I 1,005 vlivem obou pr ıć in celkove trz by vzrostly pr ibliz ne o pe t desetin procenta

330 Přehledné uspořádání pojmů Stascký ukazatel je c ıślo, ktere v dane m prostoru a c ase charakterizuje urc itou skutec nost (urc ity jev). Bazický index porovna va konkre tnı ukazatel (napr ıḱlad trz by v jednom obdobı ) vz dy se zvoleny m (nulty m) ukazatelem (ve ts inou za ba zi, tj. nulty ukazatel, volıḿe poc a tec nı ukazatel, ktery je k dispozici). Pro i = 1, 2,, n jej mu z eme vyja dr it ve tvaru: S = x x Řetězový index porovna va vz dy dva sousednı ukazatele. Pro i = 1, 2,, n jej mu z eme vyja dr it ve tvaru: T = x Průměrný koeficient vývoje je vy voj sledovane ho ukazatele v c ase vyja dr eny geometrickým průměrem řetězových indexů. Pro i = 1, 2,, n jej mu z eme vyja dr it ve tvaru: x x = T T T = x x x = x = S x x x x

331 Index hodnoty I Index množství I Index úrovně I (napr ıḱlad trz by). (jednoho konkre tnı ho ukazatele). (napr ıḱlad ceny jednoho konkre tnı ho zboz ı ). Pro sumy kvu li pr ehlednosti ope t pouz ijeme struc ny za pis s vynecha nıḿ symbolu, pr es ktere sc ı ta me. Tedy napr ıḱlad mıśto Q ; budeme psa t jen Q. index hodnoty index množství index úrovně Individ. jednoduche i. Individua lnı sloz ene indexy I = Q Q = p q p q I = Q Q I = q q I = p p I = (p q ) q (p q ) q I = q q I = (p q ) (p q ) I = (p q ) q (p q ) q (dle Laspeyrese) hodnotový index L. cenový index L. objemový index Souhrnny index I = (p q ) (p q ) I = (p q ) (p q ) I = (p q ) (p q ) I = I I index prome nlive ho sloz enı index sta le ho sloz enı index struktury I = I I

332 4.1. Příklady používaných indexů v praxi Cenove indexy patr ı k nejstars ıḿ oicia lne sledovany m indexu m. Potr eba zachytit cenovy vy voj v ru zny ch pr ıṕadech vedla nakonec k vytvor enı tak zvane cenove statistiky. V Ceske republice se v oblasti cenove statistiky pouz ı vajı souhrnne Laspeyeresovy cenove indexy s vahami, ktere jsou sta le po celou dobu mezi revizemi cen. Soubor reprezentantu a va hovy syste m tvor ı tak zvany spotřební koš. Index spotřebitelských cen je v souc asne dobe poc ı ta n na za klade souboru 775 reprezentantu. Poc et reprezentantu je kompromisem mezi pr esnostı a na klady na pru zkum. Novy revidovany spotr ebnı kos je zaloz en na souboru vybrany ch druhu zboz ı a sluz eb, ktere se vy znamne podıĺejı na vy dajıćh obyvatelstva a svy m rozsahem pokry vajı celou sfe ru spotr eby s vahami roku Zpravodajsky mi jednotkami jsou rozdıĺne typy prodejen a provozoven sluz eb z hlediska velikosti, druhu, vlastnictvı apod. zhruba 10 tisıć. Index spotr ebitelsky ch cen je konstruova n ve tvaru:, I = (p q ) (p q ) kde vy raz p q pr edstavuje sta le va hy vy daje doma cnostı za zboz ı (sluz bu) v za kladnıḿ obdobı. Index životních nákladů vyjadr uje, jak se index spotr ebitelsky ch cen promı ta do vy daju doma cnostı. Index z ivotnıćh na kladu je poc ı ta n pro na sledujıćı socia lnı skupiny: doma cnosti celkem; doma cnosti zame stnancu ;

333 doma cnosti du chodcu ; doma cnosti s de tmi v nıźke m pr ı jmove m pa smu; doma cnosti z ijıćı v hlavnıḿ me ste Praze. Měření inflace je zaloz eno na indexu spotr ebitelsky ch cen. Za kladnı mıŕou inlace je roc nı mıŕa inlace, ktera klouzave srovna va pru me r poslednıćh 12 me sıću s pru me rem pr edcha zejıćıćh me sıću. V Ceske republice jsou publikova ny tyto mıŕy inlace: Měsíční tempo inflace (coz je cenovy index) srovna va u roven cen v hodnocene m me sıći a v me sıći pr edcha zejıćıḿ: M = I I kde I je bazicky index spotr ebitelsky ch cen ve sledovane m me sıći a I je bazicky index spotr ebitelsky ch cen v me sıći pr edcha zejıćıḿ. Ba ze je cena v prosinci roku Meziroční tempo inflace srovna va u roven cen v hodnocene m me sıći a ve stejne m me sıći pr edcha zejıćı ho roku: M = I I Roční tempo inflace srovna va u roven cen v poslednıćh 12 me sıćıćh a ve 12 me sıćıćh pr edcha zejıćıćh: M = I I

334 Jádrová inflace vyjadr uje me sıć nı pr ıŕu stek indexu spotr ebitelsky ch cen poc ı tany na cele m spotr ebnıḿ kos i po vylouc enı vlivu zme n ovlivne ny ch regulovany mi cenami, dan ovy mi u pravami a jiny mi administrativnıḿi opatr enıḿi. Čistá inflace je poc ı ta na na neu plne m spotr ebnıḿ kos i, z ne hoz jsou vylouc eny poloz ky s regulovany mi cenami a cenami ovlivne ny mi administrativnıḿi opatr enıḿi, ale poloz ky, u nichz jsou zme ny cen zpu sobene dan ovy mi u pravami, zu sta vajı ve spotr ebnıḿ kos i. Pouze je eliminova n vliv dan ovy ch u prav. Indexy kurzů akcií pr edstavujı zvla s tnı typ cenovy ch indexu. Ne kaz dy index kurzu akciı, se ktery m se mu z ete setkat v praxi jednotlivy ch zemı, je indexem konstruovany m ve vy s e uvedene smyslu. V praxi pouz ı vane indexy kurzu akciı se lis ı svou konstrukcı, ale i trhem, pro ktery jsou sestavova ny. Z hlediska konstrukce se pouz ı vajı buď jako aritmeticky nebo harmonicky c i geometricky pru me r. Ať jiz jako prosty pru me r nebo jako va z eny pru me r indexu kurzu akciı. Jedna se buď o kurzově (cenove ) va z ene pru me ry sledujı stav a vy voj pru me rne ceny titulu akcie; nebo o tržně va z ene pru me ry sledujı pru me rnou cenu akcie z celkove ho objemu emitovany ch akciı.

335 U vod do Časových řad

336 Obsah kapitoly: Časové řady 1. Základní pojmy Za kladnı charakteristiky dynamiky vy voje c asovy ch r ad Vyrovnání časových řad Proble my pr i analy ze c asovy ch r ad Modelování časových řad trend Linea rnı trend Kvadraticky trend Trendy pr ıḱlady Závěr kapitoly Využi programového vybavení 371

337 1. Základní pojmy Časovou řadou (dynamickou r., vy vojovou r.) rozumıḿe posloupnost ve cne a prostorove srovnatelny ch dat, ktera jsou jednoznac ne uspor a da na z hlediska c asu ve sme ru minulost pr ı tomnost. Casove r ady upouta vajı vıće nez pome rna c ıśla nebo nehybna rozde lenı c etnostı, protoz e vna s ejı dimenzi c asu. Ukazujı ne kolika c arami nebo c ıśly vy voj, ktery jsme zpravidla jen nejasne tus ili. Pr esto nenı rozdıĺ mezi c asovou r adou a jednotlivy mi statisticky mi vy be ry nebo vyc erpa vajıćıḿ s etr enıḿ. Stejne jako se ilm skla da z jednotlivy ch nehybny ch obra zku, je i c asova r ada sloz ena z takovy ch jednotlivy ch snıḿku. Casove r ady v za sade vytva r ejı spojenı mezi stejnorodými ⁴⁶ u daji (zjis te nıḿi, vy pove ďmi) z ru zny ch dob, avs ak stejne ho ve cne ho obsahu. Mu z e jı t nejen o plynula porovna va nı (roc nı dovozy a vy vozy za poslednıćh x let) ale i o porovna nı jednotlivy ch vybrany ch u daju, jako je napr ıḱlad struktura povola nı ve Svy carsku v letech 1888, 1900, 1910, 1920, 1930, 1941, 1950 a 1960 (obra zek 7). Plynula pozorova nı nejsou vs ak c asto vu bec moz na. Casova r ada z vy sledku hromadny ch sc ı ta nı lidu nejenz e pr eskakuje velka (ve ts inou desetileta ) obdobı, ale krome toho poskytuje jen bodove u daje, ktere pr ıśne vzato platily jen v okamz iku odevzda nı sc ı tacı ho lıśtku. Proto je tr eba rozlis ovat mezi c asovy mi r adami okamžikovými, kdy se hodnoty ukazatele (statisticke ho znaku) vztahujı k urc ite mu okamz iku, a c asovy mi r adami intervalovými, kdy hodnoty ukazatele jsou sledova ny za urc ite obdobı (v urc ite m c asove m intervalu) a jsou proto de lkou tohoto obdobı ovlivne ny. Zatıḿco u daje okamz ikovy ch r ad lze zjis ťovat pouze k rozhodne mu dni (pr i poslednıḿ sc ı ta nı bylo tolik muz u a tolik z en, tolik rodin, tolik nezletily ch de tı apod.), u daje intervalovy ch r ad musejı by t naproti tomu zjis ťova ny a srovna va ny za urc ite obdobı. Pokud bychom sc ı tali sn atky minulou sobotu u derem ⁴⁶ Sledujeme-li napr ıḱlad poc ty kra dez ı ve dane oblasti (okres, kraj) za dels ı c asovy u sek, je moz ne, z e v urc ite m obdobı zaregistrujeme jejich na hlou zme nu. Ta ovs em mu z e zpu sobena jen tıḿ, z e za konem byla zme ne na hodnota minima l- nı zpu sobene s kody nutne k zahrnutı mezi kra dez e. Nebo mohlo dojı t v ra mci reformy sta tnı spra vy ke zme ne rozsahu (slouc enı c i rozde lenı ) sledovane oblasti.

338 Obra zek 7: Pr evzat z [14] dvana cte, dostali bychom te me r jiste nulu, ledaz e by ne kde pr ipadla odda vajıćı formule pr esne na poledne. Ovs em c asovy interval od 8 hodin ra no do 20 hodin vec er poskytuje celkem rozumnou srovna vacı hodnotu pro poc et sn atku za jeden den. Okamžikové r ady (stálé soubory) jsou takove, jejichz prvky (hodnoty ukazatele) se plynule me nı v c ase a majı urc itou dobu trva nı. Napr ıḱlad obyvatelstvo ne jake ho u zemı. Jednotlivci se rodı a umıŕajı celek obyvatelstva je tıḿ z dlouhodobe ho hlediska dotc en jen tehdy, kdyz trva zr ejma pr evaha narozenı c i u mrtı. Nebo poc et automobilu, ktere irma vlastnı k urc ite mu datu. Kaz dy prvek sta le ho souboru ma urc itou dobu setrva nı u lidı je to individua lnı de lka z ivota, u na hradnı ho dıĺu setrva nı ve skladu dıĺny a u hosta na dovolene doba pobytu v pra zdninove m hotelu (obra zek 8).

339 Obra zek 8: Pr evzat z [14] V pr ıṕade okamz ikovy ch c asovy ch r ad nema souc et hodnot znaku ve cny smysl (napr ıḱlad nema vy znam sc ı tat poc ty zame stnancu zjis te ne vz dy v prvnı str edu kalenda r nı ho me sıće). Ovs em ma smysl vyja dr it pru me rnou u roven hodnot. K tomu vyuz ı va me chronologicky pru me r. Tıḿto jediny m c ıślem pak charakterizujeme u roven ukazatele za cele obdobı. Je ale zr ejme, z e tıḿ docha zı ke znac ne mu zjednodus ova nı reality. Oblı bene js ı jsou proto ru zne druhy klouzavy ch ukazatelu, ktere jsou schopny c a stec ne eliminovat vliv na hodny ch vlivu na sledovany ukazatel a tıḿ c asovou r adu vyhladit. Pouz ı vajı se jak klouzavé mediány, tak klouzavé průměry. Vz dy se postupuje tak, z e u daj c asove r ady nahradıḿe zvoleny m ukazatelem z okolnıćh c asove pr edcha zejıćıćh a na sledujı cıćh u daju. Jaky to ma smysl? Napr ıḱlad pr i sledova nı prodeje je pravidelne u daj za dany me sıć v ne ktery ch obdobıćh zvla s ť velky (na poje c i mraz ene ho zboz ı v letnıćh me sıćıćh) a v jiny ch zase pravidelne

340 mens ı. Objevujı se sezo nnı vy kyvy. Vza jemny m srovna va nıḿ u daju pro ru zne me sıće nezıśka me pak pr ehled o tom, zda docha zı ke skutec ne zme ne nebo jenom zme ne vyvolane sezo nnıḿ vy kyvem. Jestliz e vs ak srovna va me pro dane me sıće souc ty vz dy za poslednıćh 12 me sıću, ma v sobe kaz dy tento klouzavy roc nı u hrn zahrnuty vs echny sezo nnı vy kyvy v roce a mu z eme pak na nich pozorovat skutec ne na ru sty c i poklesy prodeje. Intervalové r ady (pohyblivé soubory) jsou soubory uda lostı. Vznikajıćı uda losti se dajı me r it jen tıḿ zpu sobem, z e se sc ı tajı jevy vznikle be hem dane ho obdobı. Napr ıḱlad poc et kusu zboz ı vyrobene ho za dany me sıć. Take oba jevy, ktere vymezujı dobu setrva nı, lze pokla dat za pohyblive soubory: narozenı a smrt, pr ı jem na sklad a vy dej ze skladu, pr ı jezd a odjezd na vs te vnıḱu (viz obra zek 8), na kup auta do irmy a odprodej auta, atd. V pr ıṕade intervalovy ch r ad jiz ma smysl jejich sc ı ta nı (sec teme-li trz by od ponde lı do nede le, zıśka me ty dennı trz bu) a vy znam ma i pru me rna hodnota, ve ts inou vyja dr ena pomocı aritmeticke ho pru me ru. Pro intervalove r ady ovs em musıḿe zajistit jejich srovnatelnost a to jak c asovou (intervaly musejı by t stejne dlouhe ), tak prostorovou (u daje data musejı pocha zet ze stejne velky ch u zemı ). V pr ıṕade, z e tomu tak nenı a u daje v sobe nesou zkreslenı, prova dıḿe tzv. vyrovna nı c i oc iste nı c asove r ady. Casova r ada ukazuje ve ts inou vy voj vy vojovou linii. Ovs em pokud vezmeme obrat obchodnı ho domu za poslednıćh deset let, bude asi vykazovat stoupajıćı tendenci, coz ale nemusı mnoho znamenat. Je pr ece docela dobr e myslitelne, z e ru st bude zpu soben inlacı, zatıḿco rea lny obrat (pr i jeho propoc tu se pr ihlıź ı k poklesu kupnı sıĺy me ny) stagnuje nebo dokonce mıŕne klesa. Z te chto du vodu je nutno u daje o obratu oc istit od tohoto rus ive ho faktoru. Zatıḿco kr ivka celkovy ch roc nıćh obratu sme r uje plynule (alespon jak jsme se bez uvaz ova nı inlace domnı vali) nahoru, zme nı se tento obraz velmi rychle, kdyz rok rozde lıḿe na c tvrtletı nebo dokonce me sıće. Z pu vodne hladke kr ivky se stane divoce lomena c a ra (viz obra zek 9).

341 Obra zek 9: Pr evzat z [14] Zac nou se totiz projevovat vs echny vlivy, ktere jsou pro obchody zpravidla typicke : mdla kupnı na lada na poc a tku roku, sezo nnı vy prodeje, pr edva noc nı obchodnı ruch apod. Sva tky a vliv poc ası zava de jı vliv nepravidelnosti nejen do obratu obchodnıćh r ete zcu, ale mohou vyvolat velky zmatek pr edevs ıḿ v c ıślech statistik cestovnı ho ruchu, ktere mohou od br ezna jednoho roku k br eznu druhe ho roku stejne jako od dubna jednoho roku k dubnu druhe ho roku vykazovat podivuhodne skoky dıḱy velikonocu m a jarnıḿ pra zdnina m, coz obojı je pohybliva uda lost. Jestliz e jsou k dispozici pozorova nı za dostatec ne dlouha c asova obdobı, je moz ne v ne ktery ch pr ıṕadech postr ehnout cyklus. Jak dlouhe musı by t c asove obdobı, aby se dal urc ity cyklus postr ehnout, nelze obecne r ıći. To musı vyplynout ze zıśkany ch u daju. Podle periodicity (de lky cyklu) lze c asove r ady de lit na krátkodobé, kdy perioda je krats ı nez jeden rok (poc et smluv uzavr eny ch be hem ty dne, slapova dmutı mor e, ) a dlouhodobé kdy perioda je alespon jeden rok (roc nı zisk irmy). Zr etelny cyklus v pru be hu pr ibliz ne 24 hodin pr edstavuje mor sky pr ıĺiv a odliv, ktery je moz ne zjistit r adou hodinovy ch nebo dvouhodinovy ch intervalu. Kdybychom vs ak me r ili stav vody na pobr ez ı kaz dy c tvrtek pr esne v prave poledne, trvalo by asi velmi dlouho, nez bychom z te chto me r enı mohli uc init spra vny za ve r.

342 1.1. Základní charakterisky dynamiky vývoje časových řad Dynamikou vy voje c asove r ady rozumıḿe zme ny hodnot sledovane ho ukazatele v c ase. Nutnou podmıńkou pro spra vnou interpretaci charakteristik jsou ekvidistantní c asove intervaly (majı stejnou de lku). Absolutní přírůstek Δ (1) pr edcha zejıćıḿ: t (ne kdy te z 1. diference) je rozdıĺ mezi hodnotou znaku v c ase t a v c ase Δ () = y y kde t = 2, 3, 4, Hodnoty prvnıćh diferencı ne jake ho ukazatele jsou nositelem du lez ite informace. Pokud se totiz jednotlive c leny te to posloupnosti systematicky ani nezve ts ujı ani nezmens ujı (mu z eme r ıći, z e jejich hodnoty pouze na hodne a ne pr ıĺis kolıśajı ), lze u pu vodnı c asove r ady pr edpokla dat lineární trend. Hodnoty ukazatele Y c asove r ady budou lez et te me r na pr ıḿce, nebo-li jsou linea rne za visle v c ase. Viz povı da nı o linea rnı za vislosti v kapitole zaby vajıćı se regresnıḿi vztahy mezi dvourozme rny mi daty. Tehdy jsme pouze nepouz ı vali slovıć ko absolutní. Relavní přírůstek δ t je podıĺ, kdy absolutnı pr ıŕu stek de lıḿe hodnotou znaku v c ase pr edcha zejı cıḿ: δ = Δ() = y y kde t = 2, 3, 4, y y Z hodnot relativnıćh pr ıŕu stku mu z eme usuzovat (proc si uka z eme u dals ıćh charakteristiky I ) na tempo ru stu sledovane ho ukazatele Y v pu vodnı c asove r ade. Rostou-li hodnoty δ, vykazuje ukazatel rostoucı tempo ru stu (a naopak). Pokud je posloupnost relativnıćh pr ıŕu stku zhruba konstantnı, lze usuzovat i na konstantnı tempo ru stu sledovane ho ukazatele.

343 Druhá diference Δ (2) t je absolutnı diference prvnıćh diferencı : Δ () = Δ () Δ () kde t = 3, 4, 5, S tıḿto pojmem jsme se jiz take setkali pr i povı da nı o kvadraticke za vislosti v kapitole zaby vajıćı se regresnıḿi vztahy mezi dvourozme rny mi daty. Tehdy jsme jej nazy vali přírůstkem přírůstků. Takz e jiz vıḿe, z e pokud se jednotlive c leny posloupnosti druhy ch diferencı systematicky ani nezve ts ujı ani nezmens ujı (jejich hodnoty oscilujı pouze na hodne a ne pr ıĺis ), lze u pu vodnı c asove r ady pr edpokla dat kvadratický trend. Hodnoty ukazatele Y c asove r ady budou lez et te me r na parabole. A na sledujıćı charakteristiky take zna me, a to z kapitoly o hospoda r ske statistice. Koeficient růstu I t (řetězový index) nebo-li individua lnı jednoduchy index o prome nlive m za kladu (vztaz eny k bezprostr edne pr edcha zejıćıḿu pozorova nı v c asove r ade pu vodnıćh hodnot): I = y y = y y + y y = σ + 1 kde t = 2, 3, 4, Koeicient ru stu vyja dr eny v procentech se nazy va tempo růstu. Pokud hodnoty v posloupnosti koeicientu ru stu pr ıĺis neoscilujı, lze pr edpokla dat, z e pu vodnı c asova r ada ma exponenciální trend. Průměrný koeficient růstu T je geometricky m pru me rem koeicientu ru stu: T = I I I I = y y

344 Protoz e pru me rny koeicient ru stu za visı pouze na krajnıćh hodnota ch r ady, lze zıśkat zcela stejny pru - me rny koeicient ru stu pro r ady, ktere se shodujı pouze ve svy ch krajnıćh u rovnıćh, ale jinak majı zcela rozdıĺny pru be h. Proto je nutne pr ed vy poc tem pec live analyzovat pr ıślus nou c asovou r adu a je-li to nutne, rozde lit ji na ne kolik c a stı tak, aby v kaz de z te chto c a stı sledovany ukazatel vykazoval v podstate monoto nnı vy voj. A pro kaz dou z te chto c a stı pak stanovit pru me rne koeicienty ru stu (podobne jako jsme to de lali v pr ıṕade linea rnıćh regresnıćh funkcı ). 2. Vyrovnání časových řad Mimo jiz dr ı ve zmin ovany celkovy vy voj, vlivy roc nıćh obdobı a cykly mohou na c asovou r adu pu sobit jes te jednora zove mimor a dne jevy. Tyto jevy mohou by t rozeznatelne jiz pr edem, napr ıḱlad devalvace me ny (na obra zku 10 zachycujıćıḿu sezo nne vyrovnany export Velke Brita nie je zr etelny projev snıź enı hodnoty libry z podzimu roku 1967). Jestliz e jev, ktery vznikl jednora zove, pu sobı trvale, lze mluvit o jake msi zlomu struktury, ktery vede ke zme ne dals ı ho vy voje. Napr ıḱlad vyna lez synteticky ch vla ken postavil textilnı pru mysl pr ed zcela novou situaci. Jednora zovy jev a vy voj jsou tedy ne kdy v u zke m spojenı, a cykly proto mohou mı t pochybnou vypovı dacı hodnotu. Sezo nnı vlivy take nejsou vz dy tak jasne prokazatelne, jako je tomu napr ıḱlad pr i prodeji zmrzliny nebo ve stavebnictvı c i v cizinecke m ruchu. Proto je kaz dy pokus o vyrovnání (oc is te nı r ady) prvotnıćh u daju prova zen nebezpec ıḿ, z e mu z e dojı t k nove mu zkreslenı. Nejme ne s kodlive je, kdyz se urc ı srovnatelne obdobı. Tak napr ıḱlad lze u c elne srovnat u daje o cizinecke m ruchu v za r ı jednoho roku jen s u daji z me sıću za r ı v ostatnıćh letech. Ale i takove relativne jednoduche porovna nı se srovnatelny m me sıćem mu z e by t zava de jıćı, jestliz e v lon ske m roce bylo za r ı na dherne a teple a na sledovalo po des tive m a chladne m srpnu. V jiny ch letech to nebude platit.

345 Obra zek 10: Pr evzat z [14] Abychom se vs eobecne vyhnuli takovy m nahodilostem, pak v za jmu opravy od rušivých, ale nepodstatny ch vlivu, postupujeme ve ts inou na sledovne : intervalové c asove r ady (hodnoty za urc ity c asovy interval) transformujeme na stejne dlouhy c asovy u sek. Protoz e be z ny rok ma 365 dnı, tak za de lku be z ne ho me sıće bereme , 42. Potom napr ıḱlad lednovou hodnotu budeme na sobit c ıślem,, u norovou,, atd. Pokud vıće zaokrouhlıḿe, mu z eme za pru me rny me sıć povaz ovat ten, ktery ma 30 dnu. Podobne i pro jine c asove intervaly, nez je zde zmin ovany me sıć.

346 Me sıć Dny Mnoz stvı vyte z ene ho uhlı v prvnıḿ pololetı roku 2001 reálné h. reálné hodnoty / den vy poc et očištěné hodnoty leden : 31 = 38,065 38,065 30,42 = u nor : 28 = 36,071 36,071 30,42 = br ezen : 31 = 38,710 38,710 30,42 = duben : 30 = 36,333 36,333 30,42 = kve ten : 31 = 38,065 38,065 30,42 = c erven : 30 = 37,667 37,667 30,42 = součet : 181 = 37,514 37, ,42 = = okamžikové c asove r ady (hodnoty vz dy k dane mu datu) vyrovna va me nejc aste ji metodou klouzavých průměrů (viz obra zek 11). Napr ıḱlad: 10, 15, 12, 8, 20, 15, 5 Existuje jes te r ada jiny ch postupu vyrovna nı c asovy ch r ad. Z a dny z nich vs ak nenı docela bez proble mu, protoz e v same podstate vyrovna va nı je obsaz ena nutnost odchylky od dany ch u daju tıḿ, z e se posuzujı (s nutne subjektivnıḿ zabarvenıḿ) faktory, ktere se mohou koneckoncu jen odhadnout.

347 Obra zek 11: Sche ma klouzave ho pru me ru (pr evzato z [14]) Vz dy se pr ipojuje nejnove js ı me sıć nı nebo roc nı c i ty dennı vy sledek a nejstars ı se vypous tı. Vlevo je prvnı propoc et pru me ru, uprostr ed odpada starých 10 a nových 15 se pr ida va, vpravo rovne z odpada nejstars ı c ıślo a mıśto ne j pr ida va me nejnove js ı. Příklad: Ze za znamu (viz tabulka) docha zky ve irme s celoty dennıḿ provozem zjiste te pru me rnou dennı docha zku v dane m ty dnu. den Po U t St Ct Pa So Ne pr ı tomno Řešení: Protoz e vıḿe pouze to, kolik dany den pracovalo zame stnancu a jiz nevıḿe, zda byl pr ı tomen Vonásek, Opička c i Novák, jedna se o okamz ikovou c asovou r adu. Proto pro vy poc et pru me rne docha zky pouz ijeme chronologicky pru me r. Po seřazení datovy ch u daju a jejich dosazenı : x = 1 2 (n 1) (x +2x + +2x +x ) = 1 2 (7 1) ( ) = = ,83, coz je pru me rna (aritmeticky pru me r aritmeticky ch pru me ru sousednıćh dvojic) 12 dennı docha zka.

348 2.1. Problémy při analýze časových řad Pr i zpracova nı dat ve forme c asove r ady se poty ka me s mnoz stvıḿ proble mu (na ne ktere jsme upozornili v pr edchozıḿ textu), ktere jsou pra ve pro c asove r ady speciicke. Jedna se pr edevs ıḿ o proble my: s volbou c asovy ch bodu pozorova nı ; s kalenda r em ru zna de lka me sıću, ru zny poc et vıḱendu v me sıći, ru zny poc et pracovnıćh dnu v me sıći, pohyblive sva tky; s de lkou c asovy ch r ad; nesrovnatelnostı dat. 3. Modelování časových řad trend Casovou r adu zkouma me proto, abychom mohli odhalit mechanizmus pu sobenı c asu na utva r enı hodnot sledovane ho statisticke ho ukazatele Y. Nebo jinak, abychom pochopili pr ıć iny, ktere na tyto jevy pu sobily a ovlivn ovaly jejich chova nı v minulosti. A na sledne abychom zıśkane poznatky vyuz ili k progno ze do budoucna.

349 Pr edpokla da me, z e model (ktery popisujeme c asovou r adou) obsahuje na sledujıćı sloz ky: Trendovou T hlavnı (obecna ) tendence dlouhodobe ho vy voje vy voje zkoumane ho jevu za dlouhe obdobı. Je vy sledkem dlouhodoby ch a sta ly ch procesu. Trend mu z e by t rostoucı, klesajıćı nebo mu z e existovat r ada bez trendu. Sezónní S rok; pravidelne se opakujıćı vy kyvy (odchylky od trendove sloz ky) s periodou krats ı jak jeden Cyklickou dlouhodobe kolıśa nı kolem trendu ⁴⁷; v du sledku dlouhodobe ho cyklicke ho vy voje (pouz ı va se spıś e v makroekonomicky ch u vaha ch). Náhodnou ε souhrn drobny ch neza visly ch pr ıć in, ktre se nedajı popsat z a dnou funkcı c asu. Je to zbytek po vylouc enı trendu, sezo nnı a cyklicke sloz ky. Za (aditivnı ) model c asove r ady pak mu z eme povaz ovat vztah y = T + S + ε kde y je hodnota prome nne za visla na c ase t, coz je neza visla (c asova ) prome nna a mu z eme ji celkem libovolne vyja dr it v jaky chkoliv c asovy ch jednotka ch s libovolny m poc a tkem. Kdyz prome nnou t volıḿe tak, aby byla ekvidistantní (pravidelne rostla o stejny krok), malá (a rade ji pouze celoc ıśelna ; to kvu li zjednodus enı vy poc tu ) a jejı aritmeticky pru me r byl NULA, provedeme centrovanou c asovou transformaci. Tıḿ lze vy poc ty pro klasickou metodu nejmens ıćh c tvercu zjednodus it. ⁴⁷ Pr iklonıḿe se k c aste mu na zoru, z e cyklickou sloz ku lze povaz ovat za souc a st trendu.

350 Model trendu (vhodnou funkci, ktera nejle pe popisuje trend) si uka z eme pouze pro pr ıṕad rovnice pr ıḿky nebo paraboly. Pro jine typy kr ivek odkazujeme na pr ıślus nou literaturu (napr. [13]). Lineární trend L(t) y = a + b.t Platı -li t = 0, pak a = y n, b = (y t ) t Lineární bodová předpověď L = L(t ) rovnice linea rnı ho trendu. hodnoty c asove r ady v c ase t se zıśka dosazenıḿ t za t do Lineární intervalová předpověď hodnoty c asove r ady v c ase t s α% spolehlivostı je interval (L Δ; L + Δ), kde Δ = s h t (n 2) nazy va me pr ıṕustna chyba a s = y L (t) n 2 h = 1 1 n + t t Vy raz t (n 2) je kvantil Studentova rozde lenı, ktery najdeme ve statisticky ch tabulka ch (Excel). Po vhodne substituci indexu i ⁴⁸ na index t (s pru me rem NULA), jdou koeicienty a, b snadno urc it. Pozor! Koeicient a z linea rnı ho trendu ma jinou hodnotu jak stejne oznac eny koeicient a z kvadraticke ho trendu. ⁴⁸ Protoz e napr ıḱlad mıśto y bychom spra vne me li psa t y

351 Kvadracký trend K(t) y = a + b.t + c.t Platı -li t = 0, pak a = y t t (y t ) n t ( t ), b = (y t) t, c = n (y t ) y t n t ( t ) Bodová předpověď K = K(t ) hodnoty c asove r ady v c ase t se (stejne jako v pr ıṕadu linea rnı ho trendu) zıśka dosazenıḿ t za t do rovnice kvadraticke ho trendu. Intervalová předpověď hodnoty c asove r ady v c ase t je ope t interval (K Δ; K + Δ), kde pr ıṕustna chyba Δ = s g t (n 3) ovs em nenı identicka jako v pr ıṕade linea rnı ho trendu a vy raz t (n 3) je ope t kvantil Studentova rozde lenı, tentokra t s jiny m argumentem nez u linea rnı ho trendu, stejne tak jako prvnı koeicient s. Platı : s = y K (t) n 3 a g = 1 + [1 t t ] [X X] [1 t t ] kde symbolem [ ] oznac ujeme inverznı matici a symbolem X oznac ujeme transponovanou (ma zame ne ny r a dky za sloupce) matici k matici X, ktera je deinova na na sledovne : X = n n Podobne [1 t t ] je vlastne sloupcova matice (matice, ktera ma tr i r a dky a jeden sloupec).

352 Autokorelace časových řad Na za ve r se zmıńıḿe o typicke m jevu, ktery je spojen s c asovy mi r adami a komplikuje pr edpove ď hodnot r ady pomocı regrese. Hodnoty ukazatele v r ade za sebou by vajı c asto vza jemne za visle. Jev se nazy va autokorelace. Napr ıḱlad dnes nı teplota vzduchu je za visla na teplote vc erejs ı ; dnes nı cena akcie se odvı jı od ceny vc erejs ı ; nadbytec ny na kup za sob v dane m obdobı zpu sobuje snıź enı na kupu v obdobı pr ıś tıḿ a naopak. Podrobne js ı rozbor tohoto proble mu vc etne testova nı vy znamnosti autokorelace (napr ıḱlad Durbinu v Watsonu v test) lze nale zt v literatur e. Trendy příklady K dispozici jsou následující data 40; 42; 43; 41; 43; 44,8 (stejna jako ta, ze ktery ch jsme v kapitole o hospoda r ske statistice (indexech) poc ı tali pru - me rny koeicient vy voje a odhadovali trz by v na sledujıćıḿ obdobı a stejna jako ta, u ktery ch jsme v kapitole o regresnıćh za vislostech urc ovali regresnı funkce) o tržbách (nákladech, obratech, ) za s est po sobe jdoucıćh obdobı (dny, ty dny, me sıće, ), kdy jednotkou mohou by t tisıće (statisıće, milio ny, ) a me novou jednotkou Kč, $, Graicky zna zorne te c asovou r adu a odhadne te hodnotu trz eb v na sledujıćıḿ obdobı pomocı linea rnı ho a kvadraticke ho trendu, vc etne 95% intervalu spolehlivosti.

353 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

354 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

355 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

356 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

357 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

358 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

359 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

360 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

361 Vs e zapıś eme do tabulky. Aby platilo t = 0, volıḿe v nas em pr ıṕade za t tyto hodnoty: t = 5; t = 3; t = 1; t = 1; t = 3; t = 5 a urc ujeme hodnotu na sledujıćı ho obdobı : i = 7 t = 7 Chceme poc ı tat s 95% spolehlivostı, tedy chyba α = 5 % a potom 1 = 0,975. Tabulku doplnıḿe o dals ı sloupce: t, y t, t pro bodovy odhad a y, L(t ), L (t ) pro intervalovy. obdobı index i y t y t t y L(t ) L (t ) , , , , , , , , , , , ,04 44, , , , ,668 Linea rnı trend: L(t) = a + b t= 253, t 42,3 + 0,357 t 6 70 Bodovy odhad: L(t = 7) = 42,3 + 0,357 7 = 44,799 44,8 Intervalovy odhad: t, (6 2) = 2, , ,668 s = = 1, h = = 1,238 Δ = 1,159 1,238 2, = 3,983 4 (44,8 4 ; 44,8 + 4) = (40,84 ; 48,8) Urc ıḿe medián indexu i a pr ir adıḿe mu NULU. V nas em pr ıṕade bude media n mezi r a dkem 3 a 4. Nejbliz s ıḿu niz s ıḿu indexu nez media n (3. r a dek) pr ir adıḿe hodnotu 1 a nejbliz s ıḿu vys s ıḿu indexu (4. r a dek) 1. A protoz e c asova prome nna t musı by t ekvidistantní, mu z eme doplnit zbyle hodnoty te to prome nne.

362 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

363 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

364 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

365 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

366 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

367 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

368 V pr ıṕade kvadraticke ho trendu postupujeme analogicky. Chceme ope t poc ı tat s 95% spolehlivostı. Pr ıṕustna chyba α = 5 % a 1 = 0,975. Nejdr ı ve doplnıḿe nas i tabulku o sloupce y t, t, K, K. i t y t y t y L, L y t t K(t) K (t) , , , , , , , , , , , , , , , , ,563 K(t) = a + b t + c t = K(t) = 42, ,357 t + 0,013 t 253, ,8.70 t + t Bodova pr edpove ď: K(7) = 42, , ,013 7 = 45,28 45,3 kdy t = 7 Intervalova pr edpove ď: t, (6 3) = 3,182 g = 1 + 3,2= 2, , ,563 s = = 1,579 Δ = 1,579 2,049 3,182 = 10,295 10,3 6 3 (45,3 10,3 ; 45,3 + 10,3) = (35 ; 55,6)

369 kdy: [1 7 7 ] = = [1 7 49] = [1 7 49] 3,200 1,950 0,250 1,950 1,370 0,188 0,250 0,188 0, = = [1,8 1,55 0,25] = 3,2 Vy sledek cele ho pr ıṕadu zobrazıḿe graicky na na sledujıćı stra nce.

370

371 4. Využi programového vybavení V kapitole o regresnıćh za vislostech jsme pro zadana data (pr edstavujıćı trz by) urc ovali linea rnı regresnı funkci a kvadratickou regresnı funkci pomocı metody nejmens ıćh c tvercu. V te to kapitole jsme pro stejna data urc ovali linea rnı trend c asove r ady a kvadraticky trend. Za roven jsme si (na pr ıḱladu linea rnı ho trendu) uka zali, z e v obou pr ıṕadech vycha zejı stejne vy sledky. Uvedeny postup (ať jiz se v ne jake m oboru nazy va metoda nejmens ıćh c tvercu, v jine oblasti regrese c i spojnice trendu) je v praxi natolik pouz ı va n, z e jak ne ktere komerc nı programy (napr ıḱlad Excel, Mathematica, Matlab, MathCad, ) tak jejich freewarove alternativy (napr ıḱlad GNUplot) hledajı aproximac nı funkce (funkce, ktere procha zejı co nejblíže zadany m bodu m) samostatne, bez nas eho pr ic ine nı. Tedy krome toho, z e jim musıḿe v jimi poz adovane m forma tu sde lit, jake body majı vzı t v u vahu. Konkre tne v programu Excel 2010 postupujeme na sledovne : 1. Zadane hodnoty oznac ıḿe jako blok. 2. Potom na karte [Vložení] v oblasti Grafy vybereme <Bodový> (prvnı a druhy obra zek) a vedle zadany ch dat Excel vloz i jejich graicke zna zorne nı (tr etı obra zek). Mu z eme me nit velikost zobrazenı, upravovat popisy, barvy, atd. 3. Nakonec na karte [Nástroje grafu] v za loz ce Rozložení v oblasti <Analýza> (tr etı obra zek) a poloz ce Spojnice trendu (c tvrty obra zek) vybereme [Další možnosti spojnice trendu] (pa ty obra zek).

372

373 Po upr esne nı, z e chceme v grafu vypisovat vy slednou rovnici (v leve m obra zku druha volba od spodu) vc etne vy be rove ho korelac nı ho koeicientu r (nejspodne js ı volba ovs em Excel zobrazuje hodnotu spolehlivosti R, coz je druha mocnina na mi poz adovane ho koeicientu, tedy: r = R) se jiz vykreslı vy sledny graf (body i aproximac nı funkce) vc etne potr ebny ch u daju. Pro aproximac nı parabolu volıḿe na karte Typ trendu a regrese poloz ku Polynomický Por adı 2 (prostr enı obra zek v prave m sloupci).

374 Závěrečná poznámka Obra zek 12: Pr evzat z [14] Proc jsou tak oblı bene a c aste a bohuz el take c asto tak u spe s ne lz i pomocı statistik? Je tomu tak proto [14, str. 210], z e pru me rny c love k vyrostl v uctive plachosti pr ed c ıśly, ktera jsou obklopena posva tnou, ale nenapadnutelnou pr esnostı matematiky.

375 Vzhledem k tomu, z e statistika pracuje pr eva z ne s c ıśly, pr ena s ı du ve r ivy obc an svu j vztah k poc tu m take na c ıśla statistiky ac koli vedle toho mu z e docela dobr e obsta t ze zkus enosti zıśkane pr esve dc enı, z e statistiky lžou. Ve skutec nosti je obojı spra vne. Statistika pouz ı va matematicky ch metod a matematicke pr esnosti a statistika lz e. Prvnı pozitivnı pr edstava mimochodem pr evla da, jinak by take nebylo tolik pokusu lha t pomocı statistik. Pr edstava, z e čísla dokazují, nenı pr es ves kere s patne zkus enosti pr ekona na. Jestliz e je statistika (jako metodika nebo jako ve dnı obor) c asto posuzova na s pochybnostmi a odmı tave, mu z eme za to de kovat pr edevs ıḿ statistika m, ktere ve skutec nosti statistikami nejsou. Je to stejne [14, 205] jako kdyby nemocne ho c love ka le c il mastic ka r, zr ıźenec nebo kuchyn sky persona l kliniky a nemocny pak mrzute konstatoval: Medicıńa nenı vu bec z a dna ve da; vs ichni le kar i jsou s arlata ni. Obra zek 13 na zorne ukazuje, z e stejnou ve c je moz ne pozorovat z ru zny ch hledisek a podle toho statisticky ru zne vyja dr it. Jestliz e se tedy mluvı o lz i ve statistice, je nutno vz dy zjisti, o jaky druh lz i se jedna. Existuje pr edevs ıḿ zda nliva lez, ktera nenı v podstate nic jine ho nez nespra vne pojata pr esna statistika. Je ovs em docela dobr e moz ne, z e je lstive zame r ena na oklama nı naivnıćh lidı, ale sama o sobe (svy mi u daji a tvrzenıḿi) je nenapadnutelna. Da le existuje odvozena lez, charakterizovana tıḿ, z e se manipula tor zmocnı v podstate spra vny ch c ıśel a buduje kolem nich konstrukce lži (vyhleda va k nim vhodne příčiny c i následky), ktera je nesporny mi c ıśly znamenite udrz ova na a posilova na. Konec ne existuje forma lz i, pr i nıź lze postupovat statisticky korektne jak pr i zpracova nı, tak pr i vy kladu. Ovs em pracujeme se zfals ovany m prvotnıḿ materia lem. Pouz itıḿ nespra vny ch vy chozıćh u daju (nebo dokonce ve domy m fals ova nıḿ prvotnı ho za znamu, napr ıḱlad Ira k vyvı jı nebo dokonce jiz vlastnı jaderne zbrane operace Pous tnı bour e) je moz -

376 Obra zek 13: Pr evzat z [14] Vlevo je pr ıṕad, kdy jsme vzali z ijıćı obyvatelstvo a sledovali poc et sebevraz d pro ve kove kategorie. Uprostřed je pr ıṕad, kdy jsme vzali poc ty u mrtı v jednotlivy ch ve kovy ch skupina ch a sledovali, kolik z nich pr ipada na sebevraz dy. Vpravo jsme vzali u spe s ne sebevrahy a sledovali, kolik jich je v jednotlivy ch ve kovy ch skupina ch. V za vislosti na volbe za kladu vznika zcela rozdıĺny obraz. no doka zat vs echno. I nekriticke mu c tena r i nebo posluchac i bude obtıź ne namluvit, z e čtyři plus pět se rovná šest, ale jestliz e nejdr ı ve zfals ujeme pětku na dvojku, mohu potom plny m pra vem tvrdit, z e = 6.

377 Proto se doporuc uje vz dy nejdr ı ve zjistit, zda se (v nemocnici) setka va me s vra tny m, os etr ovatelkou nebo prima r em, zda s pseudostatistikou nebo se statistikou. Rozlis enı nenı na prvnı pohled vz dy snadne. I vra tny mu z e v bıĺe m pla s ti a v bry lıćh prohodit pa r latinsky ch slov a laikovi pr edstıŕat le kar e. Jes te snadne js ı je pro (ve ts inou mlads ı ) pracovnı sıĺu osobnı ho odde lenı vypoc ı tat na kalkulac ce procenta s pr esnostı na ne kolik desetinny ch mıśt a tak vyrobit zda nlive pravou statistiku. A jak to poznat, kdyz vu bec nemusı jı t o u mysl? Jak jednoduche je ze spra vny ch statisticky ch u daju vyvodit nesmyslne za ve ry, mu z eme dokumentovat na na sledujıćıḿ pr ıḱlade : Je statisticky dokázáno, že každé čtvrté dítě, které se narodí, je Číňan. Znamena to vs ak ne co pr i pla nova nı poc tu de tı pro pru me rnou c eskou rodinu? Ve ts ina c tena r u asi tus ı, z e nikoliv. Jsme vs ak schopni takovy rozpor vz dy odhalit? Vz dyť be z na praxe je, z e pu vodnı c ıśelny materia l byl ne ky m (spra vne ) interpretova n a v te to podobe pr eda n do tisku. Potom ne jaky novina r nikoli ve zle m u myslu, ny brz aby nerozzlobil c tena r e bojıćı ho se c ıśel, c a st u daju vynecha a z komentovane ho textu zvy raznı to, co pu sobı alespon trochu senzac ne. W. J. Reichmann [14, 206] komentuje napr ıḱlad zpra vu vytis te nou tuc ny m pıśmem v jedne ch anglicky ch novina ch: Každá druhá žena si stěžuje na bolesti v zádech, a uva dı pak, z e jiz pu vodnı statistika obsahovala ne kolik slabin. Pr edne nes lo o za kladnı soubor z eny (mimo jine by bylo zapotr ebı vyjasnit, zda napr ıḱlad patna cti c i s estna ctilete slec ny majı by t zahrnuty c i nikoliv atd.), ny brz o pacientky. Z eny, ktere navs tı vı le kar e, jsou bezpochyby v pru me ru me ne zdrave a trpı vıće bolestmi nez ty, ktere nejsou v c eka rna ch ordinacı. Tedy spra vne me lo by t jen: Každá druhá si stěžuje na bolesti v zádech. Da le se uka zalo, z e tento vy sledek nebyl zıśka n z reprezentativnı ho anketnı ho s etr enı mezi prakticky mi le kar i, ny brz byl vy sledkem soukrome statistiky jedine ho le kar e. Spra vne : Každá druhá pacientka X si stěžuje na bolesti v zádech.

378 Reichmann k tomu jiz zlomyslne poznamena va, z e dotyc ny le kar provozuje svoji praxi buď ve velmi vlhke krajine nebo ma v c eka rne dost nepohodlne z idle. Ale to zdaleka nenı vs echno (a pu vodnı cita t pokrac uje da le). Tak se scvrkává statisticky podložené tvrzení, podle něhož si každá druhá žena stěžuje na bolesti v zádech na mnohem méně působivou skutečnost, že někde v Anglii je nějaký lékař, polovina jehož pacientek na otázku, zda také mají bolesti v zádech, odpovídá ano. V tomto pr ıṕade bylo alespon moz ne vystopovat na za klade pu vodnı zpra vy vs echny zdroje chyb. Ale co ma de lat c tena r, ktere mu se pr edkla da pod uvedeny m titulkem husty text, nez se domnı vat, z e opravdu kaz da druha z ena v Anglii si ste z uje na bolesti v za dech? Nynı si na jine m pr ıḱladu uka z eme manipulaci, ktera nema demagogicky za me r a pr esto je znac ne matoucı. V roce 1966 sde lilo vı den ske letis te [14, str. 125]: «Mezi 37 za padoevropsky mi letis ti se Vı den r adı sice jes te mezi mens ı letis te, pokud vs ak jde o pr ıŕu stky dopravy, je Vı den jiz na c tvrte m mıśte. V roce 1964 bylo pr i startech odbaveno cestujıćıćh V nejsilne js ıćh dnech je registrova no az cestujıćıćh. Zde je v ne kolika ma lo slovech te me r vs e, na co je nutno bra t zr etel, chceme-li se nauc it zacha zet se statistikami. Ja dro vy pove di (řadí se mezi menší) je odsunuto stranou slu vkem sice a pak se vyna s ı trumf: jiz na c tvrte m mıśte v pr ıŕu stcıćh. Toto jiz je ale zcela nemıśtne, protoz e pr ıŕu stky jsou vysoke te me r vz dy, jestliz e je vy chozı za kladna mala. Pak na sledujı absolutnı c ıśla pro urc ena pro laika, ktery nema moz nost porovna nı : letu a cestujıćıćh to je pr ece ohromne! Absolutne ano, relativne nikoliv. Letis te Ry n Mohan odbavilo ve stejne m obdobı te me r 4 miliony cestujıćıćh, nemluve ani o Par ıź i, Londy ne c i americky ch letis tıćh. A nakonec jako zvla s tnı pozoruhodnost poukaz na nejsilne js ı dny a v nich dosahovane absolutnı nejvys s ı ( az ) hodnoty. Ve cne je jiste naprosto spra vne, z e v jednom takove m nejsilne js ıḿ dnu bylo jednou zaregistrova no az cestujıćıćh. Protoz e se vs ak souc asne neuva dı z a dny dennı pru me r, utkvı c tena r i

379 v mysli pr edstava: denne cestujıćıćh, i kdyz toto tvrzenı nenı ve zpra ve vy slovne r ec eno (zcela jiste ne!). Ctenı statistik se jes te nestalo vs eobecne ovla dany m ume nıḿ.» [konec cita tu] Pr ıḱladem statistiky vı den ske ho letis te jsme se podrobne ji nezaby vali proto, z e by byla obzvla s ť ra- inovana, za ludna c i demagogicka, ny brz proto, z e umoz n uje zr etelne uka zat, c eho se pr i c tenı ne jake statistiky vyvarovat. Nesnažit se vyčíst více,než je uvedeno. V nejsilne js ı dny az neznamená denne. Te me r vs echna c ıśla a proto i vs echny statistiky je moz no zneuz ı t. Kdo nechce padnout za obe ť takove mu zneuz itı, kdo se nechce nechat od demagogu nebo pr ehorlivy ch novina r u vehnat do u zky ch, bude se vz dy s pochybnostı pta t: Co se s čím srovnává? Má toto porovnání smysl a je oprávněné? A pr edevs ıḿ: Netvrdí se v průvodním textu více, než dovolují čísla sama poznat? A konec ne nikdy nemu z e s kodit, jestliz e se zepta me jako u soudu: Komu to slouží? Kdo se pomocí těchto čísel jeví ve zvlášť příznivém světle? A na které stasky se tedy můžeme spolehnout? Zpravidla na u r ednı statistiky, na statistiky velky ch institucı a organizacı. Pr edevs ıḿ vs ak na ty, ktere uva de jı absolutnı u daje, uda vajı rozsah vy be rove ho souboru a pokud moz no i ne ktere u daje o zpu sobu zjis ťova nı a pravde podobnou teoretickou spolehlivost vzorku. Dobra statistika poskytuje pr ehledne zpracovane u daje, pr ıṕadne matematicke souvislosti mezi te mito c ıśly, uva dı pru me rne hodnoty a sme rodatne odchylky, meze chyb, pr ıṕadne vysve tlujıćı pozna mky. Nedokazuje vs ak z a dne hypote zy ani ve decky c iste, ani demagogicky s pinave. Protoz e vs ak demagogove a skrytı manipula tor i statistiku tak ra di pouz ı vajı, je uz itec ne zeptat se v pr ı pade jaky chkoliv pochybnostı o serio znıḿ vyja dr enı jes te jednou nedu ve r ive cui bono? (Komu to prospı va?) Tato ota zka poma ha jiz po staletı odhalovat zloc iny a osve dc uje se c asto jako velmi uz itec na i pr i odhalova nı statisticky ch podvodu.

380 Použitá literatura [1] Český stascký úřad, www: [2] D, M. Jak se vyrábí sociologická znalost. Praha : Univerzita Karlova v Praze Karolinum, 4. nezme ne ne vyda nı, stran. ISBN [3] F, V. Statistika pro ekonomy. Ostrava : VSB TUO, [skripta] stran. [4] K, P. Aplikovaná statistika. Brno : VSKE, a. s. [skripta], stran. ISBN [5] K, J. Statistika A. / Na hodne jevy, Na hodne velic iny, Na hodne vektory, Indexnı analy za, Rozhodova nı za rizika. Brno : Vysoke uc enı technicke v Brne, Fakulta podnikatelska, druhe opravene vyda nı, stran. ISBN [6] K, J. Statistika B. / Jednorozme rne a dvourozme rne datove soubory, Regresnı analy za, Casove r ady. Brno : Vysoke uc enı technicke v Brne, Fakulta podnikatelska, stran. ISBN [7] K, J. Statistika C. / Statisticka regulace, Indexy zpu sobilosti, R ıźenı za sob, Statisticke pr ejıḿky. Brno : Vysoke uc enı technicke v Brne, Fakulta podnikatelska, stran. ISBN [8] L, M. Úvod do statistiky. [interaktivnı uc ebnı text] Vysoka s kola ba n ska Technicka univerzita Ostrava & Za padoc eska univerzita v Plzni, Dostupne z: pdf

381 [9] L, M. Vybrané kapitoly z pravděpodobnosti. [interaktivnı uc ebnı text] Vysoka s kola ba n ska Technicka univerzita Ostrava & Za padoc eska univerzita v Plzni, Dostupne z: pravdepodobnost.pdf [10] O, P., S, P. Pravděpodobnost a statistika. [11] P, F., K, J. Aplikovaná statistika. Zlıń : VUT FAME stran. ISBN [12] P J.. Aplikovaná statistika. Praha : Vysoka s kola chemicko technologicka v Praze. 2005, 1. vyda nı, 173 stran. ISBN [13] R, H., M, L., V, M. IASTAT Interaktivní učebnice statistiky. [14] S, H. Moderní statistika. Praha : Svoboda, stran

382 Vybrané stascké tabulky Na na sledujıćıćh strana ch jsou uvedeny ne ktere statisticke tabulky: Distribuční funkce F (u) normovaného normálního rozdělení N(0, 1) kdy vyuz ijeme postup, z e kaz de rozde lenı N(μ, σ ) lze transformacı U = pr eve st na normovane N(0, 1). Hodnoty lze take zıśkat pomocı Excelu 2010 prostr ednictvıḿ funkce: =NORM.DIST(x;μ;σ;1) Kvanly rozdělení χ (n) pouz ı vane napr ıḱlad pr i Pearsonove testu shody (zda mnoz ina dat vyhovuje dane distribuc nı funkci). Platı, z e rozde lenı χ (n) se s rostoucıḿ n blıź ı normálnímu rozdělení se str ednı hodnotou n a rozptylem 2n. Hodnoty lze take zıśkat pomocı Excelu 2010 prostr ednictvıḿ funkce: =CHISQ.INV.RT(α;n) Kvanly Studentova rozdělení Irsky chemik a statistik W. S. Gosset roku 1908 poprve publikoval toto rozde lenı pod pseudonymem Student, protoz e jeho zame stnavatel, pivovar Guiness v Dublinu, zaka zal svy m zame stnancu m publikovat pod svy m vlastnıḿ jme nem z obavy, z e konkurence by odhalila tajemstvı jejich excelentnı ho piva. Pro vysoky poc et stupn u volnosti (v praxi pro n > 30) se Studentovo rozde lenı blıź ı normovanému normálnímu rozdělení. Hodnoty lze take zıśkat pomocı Excelu 2010 prostr ednictvıḿ funkce: =T.INV.2T(α;n)

383 Distribučni funkce F (u) normovaného normálního rozdělení N(0, 1)

384 Kvanly rozdělení χ (n) Excel 2010: [=CHISQ.INV.RT(1 α ; n)]

385 Pokračování: Kvanly rozdělení χ (n) Excel 2010: [=CHISQ.INV.RT(1 α ; n)]

386 Kvanly T (k) Studentova rozdělení Excel 2010: [=T.INV.2T(2 (1 α) ; n)]

Operace s maticemi. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen.

Operace s maticemi. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. U stav matematiky a deskriptivnı geometrie Operace s maticemi Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Brno 2014 RNDr. Rudolf Schwarz,

Více

Operace s maticemi. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen.

Operace s maticemi. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Jdi na stranu Celá obr./okno Zavřít 1 Operace s maticemi Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Brno 2014 RNDr. Rudolf Schwarz, CSc.

Více

Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. RNDr. Rudolf Schwarz, CSc.

Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. RNDr. Rudolf Schwarz, CSc. First Prev Next Last Go Back Full Screen Close Quit Matematika 1 Lagrangeu v tvar interpolac nı ho mnohoc lenu Newtonu v tvar interpolac nı ho mnohoc lenu Studijnı materia ly Pro listova nı dokumentem

Více

Hodnost matice. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen.

Hodnost matice. Studijnı materia ly. Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. U stav matematiky a deskriptivnı geometrie Hodnost matice Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Brno 2014 RNDr. Rudolf Schwarz, CSc.

Více

Gaussovou eliminac nı metodou

Gaussovou eliminac nı metodou U stav matematiky a deskriptivnı geometrie R es enı soustav linea rnıćh algebraicky ch rovnic Gaussovou eliminac nı metodou Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo

Více

Raciona lnı lomena funkce, rozklad na parcia lnı zlomky

Raciona lnı lomena funkce, rozklad na parcia lnı zlomky U stav matematiky a deskriptivnı geometrie Raciona lnı lomena funkce, rozklad na parcia lnı zlomky Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full

Více

Co je to diferenciální rovnice Rovnice se separovanými proměnnými Aplikace. Diferenciální rovnice I

Co je to diferenciální rovnice Rovnice se separovanými proměnnými Aplikace. Diferenciální rovnice I Co je to diferenciální rovnice Rovnice se separovanými proměnnými Diferenciální rovnice I Modelování aneb předpovídání budoucnosti ? Diferencia lnı rovnice je rovnice, v ktere roli nezna me hraje funkce

Více

Transformace Aplikace Trojný integrál. Objem, hmotnost, moment

Transformace Aplikace Trojný integrál. Objem, hmotnost, moment Trojný integrál Dvojný a trojný integrál Objem, hmotnost, moment obecne ji I Nez zavedeme transformaci dvojne ho integra lu obecne, potr ebujeme ne kolik pojmu. Definice Necht je da no zobrazenı F : R2

Více

Vs eobecne podmi nky ve rnostni ho programu spolec nosti Victoria-Tip.

Vs eobecne podmi nky ve rnostni ho programu spolec nosti Victoria-Tip. Vs eobecne podmi nky ve rnostni ho programu spolec nosti Victoria-Tip. 1. U vodni ustanoveni 1.1. Ve rnostni program je produkt provozovany spolec nosti Victoria-Tip, a.s. a.s., se si dlem Letenske na

Více

uбdajuй rоaбdneб cоi mimorоaбdneб uбcоetnуб zaбveоrky a oddeоleneб evidence naбkladuй a vyбnosuй podle zvlaбsоtnубho praбvnубho prоedpisu.

uбdajuй rоaбdneб cоi mimorоaбdneб uбcоetnуб zaбveоrky a oddeоleneб evidence naбkladuй a vyбnosuй podle zvlaбsоtnубho praбvnубho prоedpisu. Cо aбstka 143 SbУбrka zaбkonuй cо. 377 /2001 Strana 7965 377 VYHLAб Sо KA Energetickeбho regulacоnубho uбrоadu ze dne 17. rоубjna 2001 o Energetickeбm regulacоnубm fondu, kterou se stanovуб zpuй sob vyбbeоru

Více

MAT 1 Posloupnosti a jejich aplikace v bankovnictvı

MAT 1 Posloupnosti a jejich aplikace v bankovnictvı MAT 1 Posloupnosti a jejich aplikace v bankovnictvı Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Brno 2013 RNDr. Rudolf Schwarz, CSc. Obsah

Více

z 0 3a 0 0dosti o vyda 0 0n rozhodnut o um ste 0 3n stavby

z 0 3a 0 0dosti o vyda 0 0n rozhodnut o um ste 0 3n stavby 1 3Strana 6962 Sb 0 1 0 0rka za 0 0konu 0 8 c 0 3. 503 / 2006 C 0 3 a 0 0stka 163 503 VYHLA 0 0 S 0 3 KA ze dne 10. listopadu 2006 o podrobne 0 3js 0 3 0 1 0 0 u 0 0 prave 0 3 u 0 0 zemn 0 1 0 0ho r 0

Více

Numerické řešení nelineární rovnice

Numerické řešení nelineární rovnice Matematika 1 Numerické řešení nelineární rovnice f(x) = e x 2 x 2 Metody: gra ická, bisekce, regula falsi, tečen (Newtonova), sečen Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko

Více

1. Věc: Výzva k podání nabídky na veřejnou zakázku malého rozsahu s názvem Dopravní automobil s požárním přívěsem nákladním

1. Věc: Výzva k podání nabídky na veřejnou zakázku malého rozsahu s názvem Dopravní automobil s požárním přívěsem nákladním 1. Věc: Výzva k podání nabídky na veřejnou zakázku malého rozsahu s názvem Dopravní automobil s požárním přívěsem nákladním 1. Identifikační údaje zadavatele Obec Kozlov se sí dlem 58401 Kozlov 31 zastoupena

Více

7. V Ї 4 odstavce 2 a 3 zneяjѕт:

7. V Ї 4 odstavce 2 a 3 zneяjѕт: 5 VYHLAТ SЯ KA ze dne 21. prosince 2006, kterou se meяnѕт vyhlaтsяka cя. 482/2005 Sb., o stanovenѕт druhuъ, zpuъ sobuъ vyuzя itѕт a parametruъ biomasy prяi podporяe vyтroby elektrяiny z biomasy Ministerstvo

Více

Darujme.cz. Podrobné statistiky 2015

Darujme.cz. Podrobné statistiky 2015 Darujme.cz Podrobné statistiky Zahrnutá data a jejich úprava Z hlediska fundraisingu je významnější, kdy dárce dar zadal, než kdy byla obdrž ena platba na u č et. Ve statistika čh proto prima rne pračujeme

Více

MANUÁL PRO PRÁCI S POČÍTAČOVÝM PROGRAMEM SLUNÍČKO

MANUÁL PRO PRÁCI S POČÍTAČOVÝM PROGRAMEM SLUNÍČKO UNIVERZITA PALACKÉHO V OLOMOUCI Pedagogická fakulta Katedra speciální pedagogiky RADKA BENEŠOVÁ III. roč ník prezenč ní studium obor: speciální pedagogika př edškolního vě ku MANUÁL PRO PRÁCI S POČÍTAČOVÝM

Více

insul tube & insul sheet

insul tube & insul sheet Vyŕobky z kauc uku firmy NMC insul tube & insul sheet Kompletní sortiment pro topení, sanitární, chladicí, klimatizac ní a solární zar ízení. Silny úc inek v horku a zime insul tube je synteticky kauc

Více

Příprava na 1. čtvrtletní písemku pro třídu 1EB

Příprava na 1. čtvrtletní písemku pro třídu 1EB Variace 1 Příprava na 1. čtvrtletní písemku pro třídu 1EB Autor: Mgr. Jaromír JUŘEK Kopírování a jakékoliv další využití výukového materiálu je povoleno pouze s uvedením odkazu na www.jarjurek.cz. 1. Číselné

Více

OBSAH 1 Podstata mezinárodní smlouvy... 13 2 Kategorie mezinárodních smluv podle jednotlivých kritérií... 21

OBSAH 1 Podstata mezinárodní smlouvy... 13 2 Kategorie mezinárodních smluv podle jednotlivých kritérií... 21 OBSAH 1 Podstata mezinárodní smlouvy... 13 1.1 Historicka pozna mka... 13 1.2 Pojem mezina rodnı smlouvy... 13 1.3 Funkce mezina rodnı smlouvy: smlouva kontraktua lnı a pravotvorna... 16 1.4 Pra vnı rez

Více

A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU

A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU Ing. Jiří Čarský, Ph.D. (Duben 2007) Komplexní přehled o podílu jednotlivých druhů

Více

Matematika 1 základy linea rnı algebry a funkcí

Matematika 1 základy linea rnı algebry a funkcí Matematika 1 základy linea rnı algebry a funkcí Studijnı materia ly Pro listova nı dokumentem NEpouz ı vejte kolec ko mys i nebo zvolte moz nost Full Screen. Brno 2013 RNDr. Rudolf Schwarz, CSc. Determinanty

Více

1.7. Mechanické kmitání

1.7. Mechanické kmitání 1.7. Mechanické kmitání. 1. Umět vysvětlit princip netlumeného kmitavého pohybu.. Umět srovnat periodický kmitavý pohyb s periodickým pohybem po kružnici. 3. Znát charakteristické veličiny periodického

Více

1)! 12 a) 14 a) K = { 1 }; b) K = { 6 }; c) K ={ 2 }; d) K ={ 3 }; e) K ={ 4 }; f) K = 0 ! ; N; 17 a) K =N; b) K ={ 2; 3;

1)! 12 a) 14 a) K = { 1 }; b) K = { 6 }; c) K ={ 2 }; d) K ={ 3 }; e) K ={ 4 }; f) K = 0 ! ; N; 17 a) K =N; b) K ={ 2; 3; Kombinatorika Peníze, nebo život? Kombinatorická pravidla) 7 a) NE b) ANO c) ANO d) NE e) ANO f) ANO [vínová zlatý potisk] [vínová stříbrný potisk] [vínová bílý potisk] [fialová zlatý potisk] [fialová

Více

TEORIE ZÁVISLOSTI, VZTAHY, PRÁCE S DATY ČTENÍ A INTERPRETACE DAT - TŘÍDĚNÍ A EVIDENCE

TEORIE ZÁVISLOSTI, VZTAHY, PRÁCE S DATY ČTENÍ A INTERPRETACE DAT - TŘÍDĚNÍ A EVIDENCE TEORIE ZÁVISLOSTI, VZTAHY, PRÁCE S DATY ČTENÍ A INTERPRETACE DAT - TŘÍDĚNÍ A EVIDENCE Musíš zvolit vhodnou formu evidence a údaje přenést do tabulky. V některých úlohách eviduješ pouze objekty, v jiných

Více

p (1) k 0 k 1 je pravd podobnost p echodu ze stavu k i v l ; 1 kroku do stavu k j

p (1) k 0 k 1 je pravd podobnost p echodu ze stavu k i v l ; 1 kroku do stavu k j Markovovsk n hodn procesy U Markovovsk ho n hodn ho proces nez vis dal v voj na zp sobu, jak se proces dostal do sou asn ho stavu. Plat 8 t

Více

Line rn oper tory v euklidovsk ch prostorech V t to sti pou ijeme obecn v sledky o line rn ch oper torech ve vektorov ch prostorech nad komplexn mi sl

Line rn oper tory v euklidovsk ch prostorech V t to sti pou ijeme obecn v sledky o line rn ch oper torech ve vektorov ch prostorech nad komplexn mi sl Line rn oper tory v euklidovsk ch prostorech V t to sti pou ijeme obecn v sledky o line rn ch oper torech ve vektorov ch prostorech nad komplexn mi sly z p edchoz ch kapitol k podrobn j mu zkoum n line

Více

Řešení: Dejme tomu, že pan Alois to vezme popořadě od jara do zimy. Pro výběr fotky z jara má Alois dvanáct možností. Tady není co počítat.

Řešení: Dejme tomu, že pan Alois to vezme popořadě od jara do zimy. Pro výběr fotky z jara má Alois dvanáct možností. Tady není co počítat. KOMBINATORIKA ŘEŠENÉ PŘÍKLADY Příklad 1 Pan Alois dostal od vedení NP Šumava za úkol vytvořit propagační poster se čtyřmi fotografiemi Šumavského národního parku, každou z jiného ročního období (viz obrázek).

Více

Ministryne 0 3: JUDr. Buzkova 0 0 v. r.

Ministryne 0 3: JUDr. Buzkova 0 0 v. r. 1 3Strana 490 Sb 0 1 0 0rka za 0 0konu 0 8 c 0 3. 71 a 72 / 2005 z du 0 8 vodu 0 8 hodny 0 0ch zvla 0 0s 0 3tn 0 1 0 0ho zr 0 3etele, zejme 0 0na zdravotn 0 1 0 0ch, lze pome 0 3rnou c 0 3a 0 0st u 0 0platy

Více

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN!

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN! MATEMATIKA DIDAKTICKÝ TEST Maximální bodové hodnocení: 50 bodů Hranice úspěšnosti: 33 % Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. Časový limit pro řešení didaktického testu

Více

Nové zdravotnické registry jako součást konceptu ehealth

Nové zdravotnické registry jako součást konceptu ehealth Nové zdravotnické registry jako součást konceptu ehealth Michal Opatřil ICZ a. s. Michal Opatřil ICZ a.s. 2012 www.i.cz 1 Zdravotní registry v C R bud me na ne hrdí FAKTA Souc a st NZIS (Na rodního zdravotnicke

Více

Pracovní úkoly dynamické geometrie

Pracovní úkoly dynamické geometrie Pracovní úkoly dynamické geometrie ÚKOL ČÍSLO 1: NAKRESLI ČTVEREC ÚKOL ČÍSLO 2: NAKRESLI ROVNOSTRANNÝ TROJÚHELNÍK ÚKOL ČÍSLO 3: NAKRESLI PRAVIDELNÝ ŠESTIÚHELNÍK ÚKOL ČÍSLO 4: NAKRESLI PRAVIDELNÝ OSMIÚHELNÍK

Více

PRŮZKUM MEZI OBCHODNÍMI A MARKETINGOVÝMI ŘEDITELI

PRŮZKUM MEZI OBCHODNÍMI A MARKETINGOVÝMI ŘEDITELI PRŮZKUM MEZI OBCHODNÍMI A MARKETINGOVÝMI ŘEDITELI Tyto výsledky jsou určeny pouze pro respondenty průzkumu a je zakázáno jejich šíření jakoukoliv formou bez souhlasu společnosti Innovative Business s.r.o.

Více

Smlouva o poskytnutí služby

Smlouva o poskytnutí služby Smlouva o poskytnutí služby - sociální rehabilitace - (dále jen smlouva ) uzavr ena mezi poskytovatelem sluz by: KŘ ESADLO HK Centrum pomoci lidem s PAS, z.u. IC : 038 47 926 se sídlem Mrs tíkova 934/20,

Více

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. Statistika II Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu) této závislosti pomocí vhodné funkce

Více

C 0 3 a 0 0stka 164. (biologicky 0 0ch) a toxinovy 0 0ch zbran 0 1 0 0 a o zme 0 3ne 0 3 z 0 3ivnostenske 0 0ho

C 0 3 a 0 0stka 164. (biologicky 0 0ch) a toxinovy 0 0ch zbran 0 1 0 0 a o zme 0 3ne 0 3 z 0 3ivnostenske 0 0ho 1 3Strana 9404 Sb 0 1 0 0rka za 0 0konu 0 8 c 0 3. 474 /2002 C 0 3 a 0 0stka 164 474 VYHLA 0 0 S 0 3 KA ze dne 1. listopadu 2002, kterou se prova 0 0d 0 1 0 0 za 0 0kon c 0 3. 281/2002 Sb., o ne 0 3ktery

Více

1 3Statistika I (KMI/PSTAT)

1 3Statistika I (KMI/PSTAT) 1 3Statistika I (KMI/PSTAT) Cvi 0 0en prvn aneb Suma 0 0n symbolika, vod do popisn statistiky Statistika I (KMI/PSTAT) 1 / 17 1 3Obsah hodiny Po dne 0 8n hodin byste m li b 0 5t schopni: spr vn pou 0 6

Více

10 je 0,1; nebo taky, že 256

10 je 0,1; nebo taky, že 256 LIMITY POSLOUPNOSTÍ N Á V O D Á V O D : - - Co to je Posloupnost je parta očíslovaných čísel. Trabl je v tom, že aby to byla posloupnost, musí těch čísel být nekonečně mnoho. Očíslovaná čísla, to zavání

Více

PRINCIPY ŠLECHTĚNÍ KONÍ

PRINCIPY ŠLECHTĚNÍ KONÍ PRINCIPY ŠLECHTĚNÍ KONÍ Úvod Chovatelská práce u koní měla v minulosti velmi vysokou úroveň. Koně sloužili jako vzor, obecná zootechnika a řada dalších chovatelských předmětů byla vyučována právě na koních

Více

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ Pozemkem se podle 2 písm. a) katastrálního zákona rozumí část zemského povrchu, a to část taková, která je od sousedních částí zemského povrchu (sousedních pozemků)

Více

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI SEMESTRÁ LNÍ PRÁ CE Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI Předmě t STATISTICKÁ ANALÝ ZA JEDNOROZMĚ RNÝ CH DAT (ADSTAT) Ú stav experimentá lní biofarmacie, Hradec

Více

DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 5. cvičení

DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 5. cvičení DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI 5. cvičení Rozdělení pravděpodobnosti NV Rozdělení náhodné veličiny X je předpis, kterým definujeme pravděpodobnost jevu, jež lze touto náhodnou veličinou popsat. U

Více

pracovní list studenta

pracovní list studenta Výstup RVP: Klíčová slova: pracovní list studenta Rovnice a jejich soustavy Petra Směšná žák měří dané veličiny, analyzuje a zpracovává naměřená data, rozumí pojmu řešení soustavy dvou lineárních rovnic,

Více

5. cvičení 4ST201_řešení

5. cvičení 4ST201_řešení cvičící. cvičení 4ST201_řešení Obsah: Informace o 1. průběžném testu Pravděpodobnostní rozdělení 1.část Vysoká škola ekonomická 1 1. Průběžný test Termín: pátek 26.3. v 11:00 hod. a v 12:4 v průběhu cvičení

Více

Měření hustoty kapaliny z periody kmitů zkumavky

Měření hustoty kapaliny z periody kmitů zkumavky Měření hustoty kapaliny z periody kmitů zkumavky Online: http://www.sclpx.eu/lab1r.php?exp=14 Po několika neúspěšných pokusech se zkumavkou, na jejíž dno jsme umístili do vaty nejprve kovovou kuličku a

Více

c sin Příklad 2 : v trojúhelníku ABC platí : a = 11,6 dm, c = 9 dm, α = 65 0 30. Vypočtěte stranu b a zbývající úhly.

c sin Příklad 2 : v trojúhelníku ABC platí : a = 11,6 dm, c = 9 dm, α = 65 0 30. Vypočtěte stranu b a zbývající úhly. 9. Úvod do středoškolského studia - rozšiřující učivo 9.. Další znalosti o trojúhelníku 9... Sinova věta a = sin b = sin c sin Příklad : V trojúhelníku BC platí : c = 0 cm, α = 45 0, β = 05 0. Vypočtěte

Více

Státní maturita 2011 Maturitní testy a zadání jaro 2011 Matematika: didaktický test - základní úrove obtíºnosti MAMZD11C0T02 e²ené p íklady

Státní maturita 2011 Maturitní testy a zadání jaro 2011 Matematika: didaktický test - základní úrove obtíºnosti MAMZD11C0T02 e²ené p íklady Státní maturita 0 Maturitní testy a zadání jaro 0 Matematika: didaktický test - základní úrove obtíºnosti MAMZDC0T0 e²ené p íklady Autor e²ení: Jitka Vachtová 0. srpna 0 http://www.vachtova.cz/ Obsah Úloha

Více

P íklad 1 (Náhodná veli ina)

P íklad 1 (Náhodná veli ina) P íklad 1 (Náhodná veli ina) Uvaºujeme experiment: házení mincí. Výsledkem pokusu je rub nebo líc, ºe padne hrana neuvaºujeme. Pokud hovo íme o náhodné veli in, musíme p epsat výsledky pokusu do mnoºiny

Více

Řízení kalibrací provozních měřicích přístrojů

Řízení kalibrací provozních měřicích přístrojů Řízení kalibrací provozních měřicích přístrojů Přesnost provozních přístrojů je velmi důležitá pro spolehlivý provoz výrobního závodu a udržení kvality výroby. Přesnost měřicích přístrojů narušuje posun

Více

Přechod na nový způsob měření psů pro účely určení výšky překážek

Přechod na nový způsob měření psů pro účely určení výšky překážek Přechod na nový způsob měření psů pro účely určení výšky překážek Specifikace postupu přeměřování psů, kteří mají českou flyballovou licenci Pro výbor FC ČR zpracovala: Milena Vrbová, koordinátorka rozhodčích

Více

Vyvažování tuhého rotoru v jedné rovině přístrojem Adash 4900 - Vibrio

Vyvažování tuhého rotoru v jedné rovině přístrojem Adash 4900 - Vibrio Aplikační list Vyvažování tuhého rotoru v jedné rovině přístrojem Adash 4900 - Vibrio Ref: 15032007 KM Obsah Vyvažování v jedné rovině bez měření fáze signálu...3 Nevýhody vyvažování jednoduchými přístroji...3

Více

2.2.10 Slovní úlohy vedoucí na lineární rovnice I

2.2.10 Slovní úlohy vedoucí na lineární rovnice I Slovní úlohy vedoucí na lineární rovnice I Předpoklady: 0, 06 Pedagogická poznámka: Řešení slovních úloh představuje pro značnou část studentů nejobtížnější část matematiky Důvod je jednoduchý Po celou

Více

Plánování a organizace práce podle Denig-Holmsové

Plánování a organizace práce podle Denig-Holmsové Vyšší odborná škola pedagogická a sociální, Evropská 33, Praha 6 Předmět: Pedagogická psychologie Plánování a organizace práce podle Denig-Holmsové 4. 1. 2007 Michaela Molková 3A SOP OBECNĚ Je všeobecně

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií Základy paprskové a vlnové optiky, optická vlákna, Učební text Ing. Bc. Jiří Primas Liberec 2011 Materiál vznikl

Více

Matematický model kamery v afinním prostoru

Matematický model kamery v afinním prostoru CENTER FOR MACHINE PERCEPTION CZECH TECHNICAL UNIVERSITY Matematický model kamery v afinním prostoru (Verze 1.0.1) Jan Šochman, Tomáš Pajdla sochmj1@cmp.felk.cvut.cz, pajdla@cmp.felk.cvut.cz CTU CMP 2002

Více

Nabídka na firemní akce

Nabídka na firemní akce Nabídka na firemní akce S K Y D I V E A R E N A P R A H A Konference Teambuildingové aktivity Firemní večírky Ostatní firemní akce Dárek pro obchodní partnery a klienty Rozšíření benefitního programu pro

Více

Úlohy domácího kola kategorie C

Úlohy domácího kola kategorie C 50. ročník Matematické olympiády Úlohy domácího kola kategorie 1. Najděte všechna trojmístná čísla n taková, že poslední trojčíslí čísla n 2 je shodné s číslem n. Student může při řešení úlohy postupovat

Více

5.2.1 Matematika povinný předmět

5.2.1 Matematika povinný předmět 5.2.1 Matematika povinný předmět Učební plán předmětu 1. ročník 2. ročník 3. ročník 6. ročník 7. ročník 8. ročník 9. ročník 4 4+1 4+1 4+1 4+1 4 4 3+1 4+1 Vzdělávací oblast Matematika a její aplikace v

Více

MATEMATIKA A BYZNYS. Finanční řízení firmy. Příjmení: Rajská Jméno: Ivana

MATEMATIKA A BYZNYS. Finanční řízení firmy. Příjmení: Rajská Jméno: Ivana MATEMATIKA A BYZNYS Finanční řízení firmy Příjmení: Rajská Jméno: Ivana Os. číslo: A06483 Datum: 5.2.2009 FINANČNÍ ŘÍZENÍ FIRMY Finanční analýza, plánování a controlling Důležité pro rozhodování o řízení

Více

Statistika pro geografy. Rozd lení etností DEPARTMENT OF GEOGRAPHY

Statistika pro geografy. Rozd lení etností DEPARTMENT OF GEOGRAPHY Statistika pro geografy Rozd lení etností DEPARTMENT OF GEOGRAPHY Faculty of Science Palacký University Olomouc t. 17. listopadu 1192/12, 771 46 Olomouc Pojmy etnost = po et prvk se stejnou hodnotou statistického

Více

U PLNA PRAVIDLA SOUTE Z E S OBCHODNI CENTRUM LETN ANY Vyhrajte knihy Tento dokument obsahuje u plna pravidla marketingove soute z e Vyhrajte knihy

U PLNA PRAVIDLA SOUTE Z E S OBCHODNI CENTRUM LETN ANY Vyhrajte knihy Tento dokument obsahuje u plna pravidla marketingove soute z e Vyhrajte knihy U PLNA PRAVIDLA SOUTE Z E S OBCHODNI CENTRUM LETN ANY Vyhrajte knihy Tento dokument obsahuje u plna pravidla marketingove soute z e Vyhrajte knihy (da le jen soute z ). 1. Por adatel soute z e: Boomerang

Více

Přechodové děje při startování Plazmatronu

Přechodové děje při startování Plazmatronu Přechodové děje při startování Plazmatronu Ing. Milan Dedek, Ing. Rostislav Malý, Ing. Miloš Maier milan.dedek@orgrez.cz rostislav.maly@orgrez.cz milos.maier@orgrez.cz Orgrez a.s., Počáteční 19, 710 00,

Více

OVĚŘENÍ ELEKTRICKÉHO ZAŘÍZENÍ STROJŮ NOVĚ UVÁDĚNÝCH DO PROVOZU PODLE ČSN/STN EN 60204-1 Ed. 2

OVĚŘENÍ ELEKTRICKÉHO ZAŘÍZENÍ STROJŮ NOVĚ UVÁDĚNÝCH DO PROVOZU PODLE ČSN/STN EN 60204-1 Ed. 2 OVĚŘENÍ ELEKTRICKÉHO ZAŘÍZENÍ STROJŮ NOVĚ UVÁDĚNÝCH DO PROVOZU PODLE ČSN/STN EN 60204-1 Ed. 2 Ing. Leoš KOUPÝ, ILLKO, s. r. o. Masarykova 2226, 678 01 Blansko ČR, www.illko.cz, l.koupy@illko.cz ÚVOD Stroj

Více

Pokusné ověřování Hodina pohybu navíc. Často kladené otázky

Pokusné ověřování Hodina pohybu navíc. Často kladené otázky MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY ČESKÉ REPUBLIKY Karmelitská 7, 118 12 Praha 1 - Malá Strana Pokusné ověřování Hodina pohybu navíc Často kladené otázky Dotazy k celému PO: Dotaz: Co to přesně

Více

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka. Testování Menu: QCExpert Testování Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka. Síla a rozsah výběru Menu: QCExpert Testování Síla a rozsah výběru

Více

1.2.7 Druhá odmocnina

1.2.7 Druhá odmocnina ..7 Druhá odmocnina Předpoklady: umocňování čísel na druhou Pedagogická poznámka: Probrat obsah této hodiny není možné ve 4 minutách. Já osobně druhou část (usměrňování) probírám v další hodině, jejíž

Více

Tématické celky { kontrolní otázky.

Tématické celky { kontrolní otázky. Tématické celky kontrolní otázky. Základy teorie pravdìpodobnosti..pravdìpodobnostní míra základní pojmy... Vysvìtlete pojem náhody, náhodného pokusu, náhodného jevu a jeho mno- ¾inovou interpretaci. Popi¹te

Více

4 DVOJMATICOVÉ HRY. Strategie Stiskni páku Sed u koryta. Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0)

4 DVOJMATICOVÉ HRY. Strategie Stiskni páku Sed u koryta. Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0) 4 DVOJMATICOVÉ HRY Strategie Stiskni páku Sed u koryta Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0) 125 DVOJMATICOVÁ HRA Je-li speciálně množina hráčů Q = {1, 2} a prostory strategií S 1, S 2

Více

Vektor náhodných veli in - práce s více prom nnými

Vektor náhodných veli in - práce s více prom nnými Vektor náhodných veli in - práce s více prom nnými 12. kv tna 2015 N kdy k popisu n jaké situace pot ebujeme více neº jednu náhodnou veli inu. Nap. v k, hmotnost, vý²ku. Mezi t mito veli inami mohou být

Více

Diamantová suma - řešení příkladů 1.kola

Diamantová suma - řešení příkladů 1.kola Diamantová suma - řešení příladů.ola. Doažte, že pro aždé přirozené číslo n platí.n + 2.n + + n.n < 2. Postupujeme matematicou inducí. Levou stranu nerovnosti označme s n. Nejmenší n, pro než má smysl

Více

Izolac ní materiály z polyetylenu firmy NMC. Kompletní sortiment pro vytápe ní a sanitární zar ízení

Izolac ní materiály z polyetylenu firmy NMC. Kompletní sortiment pro vytápe ní a sanitární zar ízení Izolac ní materiály z polyetylenu firmy NMC Kompletní sortiment pro vytápe ní a sanitární zar ízení Více nez jedna z alternativ Polyetylenové izolace si jiz pr ed celou r adou let vydobyly pevné místo

Více

Preference v u ívání prost edk elektronické komunikace áky a studenty

Preference v u ívání prost edk elektronické komunikace áky a studenty Preference v u ívání prost edk elektronické komunikace áky a studenty (dotazníkový pr zkum) Zuzana Pustinová Dne ní doba nabízí mnohé mo nosti, jak komunikovat, ani by se ú astníci hovoru nacházeli na

Více

Pravidla Indiánské stezky

Pravidla Indiánské stezky sout ěž za měřená na ochran u přírod y a pa máte k, na tábor n ic ké a turistic ké d o vednosti pra v i d la soutěže soutěžní řád Pravidla Indiánské stezky Stezka je určena dětem, mládeži i dospělým ve

Více

Novinky verzí SKLADNÍK 4.24 a 4.25

Novinky verzí SKLADNÍK 4.24 a 4.25 Novinky verzí SKLADNÍK 4.24 a 4.25 Zakázky standardní přehled 1. Možnosti výběru 2. Zobrazení, funkce Zakázky přehled prací 1. Možnosti výběru 2. Mistři podle skupin 3. Tisk sumářů a skupin Zakázky ostatní

Více

SBI 0 0RKA ZA 0 0 KONU 0 8 C 0 3 ESKE 0 0 REPUBLIKY

SBI 0 0RKA ZA 0 0 KONU 0 8 C 0 3 ESKE 0 0 REPUBLIKY 1 3Roc 0 3n 0 1 0 0k 1994 SBI 0 0RKA ZA 0 0 KONU 0 8 C 0 3 ESKE 0 0 REPUBLIKY C 0 3 a 0 0stka 7 Rozesla 0 0na dne 7. u 0 0 nora 1994 Cena Kc 0 3 6, ю OBSAH: 20. Opatr 0 3en 0 1 0 0 C 0 3 eske 0 0 na 0

Více

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI SEMESTRÁ LNÍ PRÁ CE Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI Předmě t ANOVA A ZÁ KON PROPAGACE CHYB U JEDNOROZMĚ RNÝ CH DAT Ú stav experimentá lní biofarmacie, Hradec

Více

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu 1 Tutoriál č. 3 Exponenciála matice a její užití řešení Cauchyovy úlohy pro lineární systémy užitím fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu 0.1 Exponenciála matice a její užití

Více

Pokud se vám tyto otázky zdají jednoduché a nemáte problém je správně zodpovědět, budete mít velkou šanci v této hře zvítězit.

Pokud se vám tyto otázky zdají jednoduché a nemáte problém je správně zodpovědět, budete mít velkou šanci v této hře zvítězit. Pro 2 až 6 hráčů od 10 let Určitě víte, kde leží Sněžka, Snad také víte, kde pramení Vltava, kde leží Pravčická brána, Černé jezero nebo Prachovské skály. Ale co třeba Nesyt, jeskyně Šipka, Pokličky nebo

Více

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/07.0018. 3. Reálná čísla

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/07.0018. 3. Reálná čísla Moderní technologie ve studiu aplikované fyziky CZ..07/..00/07.008 3. Reálná čísla RACIONÁLNÍ A IRACIONÁLNÍ ČÍSLA Význačnými množinami jsou číselné množiny. K nejvýznamnějším patří množina reálných čísel,

Více

Zastupitelstvo města Přerova

Zastupitelstvo města Přerova Pořadové číslo: 4/4 Zastupitelstvo města Přerova Přerov 26.2.2015 Předloha pro 4. jednání Zastupitelstva města Přerova, které se uskuteční dne 9. 3. 2015 Předkladatel: Mgr. VLADIMÍR PUCHALSKÝ, primátor

Více

SBI 0 0RKA ZA 0 0 KONU 0 8

SBI 0 0RKA ZA 0 0 KONU 0 8 1 3Roc 0 3n 0 1 0 0k 2000 SBI 0 0RKA ZA 0 0 KONU 0 8 C 0 3 ESKA 0 0 REPUBLIKA C 0 3 a 0 0stka 73 Rozesla 0 0na dne 9. srpna 2000 Cena Kc 0 3 91,70 OBSAH: 237. Za 0 0 kon, ktery 0 0m se me 0 3n 0 1 0 0

Více

1.2.5 Reálná čísla I. Předpoklady: 010204

1.2.5 Reálná čísla I. Předpoklady: 010204 .2.5 Reálná čísla I Předpoklady: 00204 Značíme R. Reálná čísla jsou čísla, kterými se vyjadřují délky úseček, čísla jim opačná a 0. Každé reálné číslo je na číselné ose znázorněno právě jedním bodem. Každý

Více

STANOVISKO č. STAN/1/2006 ze dne 8. 2. 2006

STANOVISKO č. STAN/1/2006 ze dne 8. 2. 2006 STANOVISKO č. STAN/1/2006 ze dne 8. 2. 2006 Churning Churning je neetická praktika spočívající v nadměrném obchodování na účtu zákazníka obchodníka s cennými papíry. Negativní následek pro zákazníka spočívá

Více

Seznamka. Adéla Hrubá Zš Bří Jandusů 8.A Prosinec 2015

Seznamka. Adéla Hrubá Zš Bří Jandusů 8.A Prosinec 2015 Seznamka Zš Bří Jandusů 8.A Prosinec 2015 Obsah 1 Obsah 1. Úvod 2. Co je to vlastně seznamka 3. Rizika 4. Jak to funguje 5. Typ seznamky 6. Seznámení krok za krokem 7. 10 nejlepších seznamek 2 Úvod 2 Úvod

Více

Těhotenský test pro zrakově postižené Tereza Hyková

Těhotenský test pro zrakově postižené Tereza Hyková Těhotenský test pro zrakově postižené Tereza Hyková hykovter@fel.cvut.cz Zadání Cílem projektu je nalézt řešení, které by umožnilo nevidomým dívkám a ženám interpretovat výsledek těhotenského testu v soukromí

Více

Seriál: Management projektů 7. rámcového programu

Seriál: Management projektů 7. rámcového programu Seriál: Management projektů 7. rámcového programu Část 4 Podpis Konsorciální smlouvy V předchozím čísle seriálu o Managementu projektů 7. rámcového programu pro výzkum, vývoj a demonstrace (7.RP) byl popsán

Více

ZATÍŽENÍ SNĚHEM A VĚTREM

ZATÍŽENÍ SNĚHEM A VĚTREM II. ročník celostátní konference SPOLEHLIVOST KONSTRUKCÍ Téma: Cesta k pravděpodobnostnímu posudku bezpečnosti, provozuschopnosti a trvanlivosti konstrukcí 21.3.2001 Dům techniky Ostrava ISBN 80-02-01410-3

Více

1.11 Vliv intenzity záření na výkon fotovoltaických článků

1.11 Vliv intenzity záření na výkon fotovoltaických článků 1.11 Vliv intenzity záření na výkon fotovoltaických článků Cíle kapitoly: Cílem laboratorní úlohy je změřit výkonové a V-A charakteristiky fotovoltaického článku při změně intenzity světelného záření.

Více

TALISMAN. (dále také jen TAL 5.0 )

TALISMAN. (dále také jen TAL 5.0 ) ZVLÁŠTNÍ POJISTNÉ PODMÍNKY PRO INVESTIČNÍ ŽIVOTNÍ POJIŠTĚNÍ AVIVA ŽIVOTNÍ POJIŠŤOVNY, A.S. TALISMAN (dále také jen TAL 5.0 ) Článek 1 Úvodní ustanovení 1. Tyto Zvláštní pojistné podmínky (dále také jen

Více

Press kit Můžeme se zdravou stravou vyvarovat střevních zánětů?

Press kit Můžeme se zdravou stravou vyvarovat střevních zánětů? Press kit Můžeme se zdravou stravou vyvarovat střevních zánětů? 1 Chronické střevní problémy trápí stále více pacientů V posledních letech roste počet těch, kteří se potýkají s chronickými střevními záněty.

Více

SBIЖRKA ZAЖ KONUв. RocиnфЖk 2000. Cи ESKAЖ REPUBLIKA. Cи aжstka 49 RozeslaЖna dne 21. cиervna 2000 Cena Kcи 63,40 OBSAH:

SBIЖRKA ZAЖ KONUв. RocиnфЖk 2000. Cи ESKAЖ REPUBLIKA. Cи aжstka 49 RozeslaЖna dne 21. cиervna 2000 Cena Kcи 63,40 OBSAH: RocиnфЖk 2000 SBIЖRKA ZAЖ KONUв Cи ESKAЖ REPUBLIKA Cи aжstka 49 RozeslaЖna dne 21. cиervna 2000 Cena Kcи 63,40 OBSAH: 153. ZaЖ kon o naklaжdaжnфж sgeneticky modifikovanyжmi organismy a produkty a o zmeиneи

Více

Náležitosti nutné k zahájení znaleckých úkonů

Náležitosti nutné k zahájení znaleckých úkonů 1 Náležitosti nutné k zahájení znaleckých úkonů 1. V písemné podobě dodat žádost o vypracování znaleckého posudku Žádost musí obsahovat: a) Jméno (název firmy), adresu zadavatele posudku b) Spojení na

Více

Programy SFRB využijte co nejvýhodněji státní úvěr na opravu vašeho bytového domu.

Programy SFRB využijte co nejvýhodněji státní úvěr na opravu vašeho bytového domu. Říjen 2013 Programy SFRB využijte co nejvýhodněji státní úvěr na opravu vašeho bytového domu. Z pohledu státního rozpočtu jsou programy SFRB charakteristické výrazným multiplikačním efektem a pro stavebnictví

Více

Národní informační středisko pro podporu kvality. 15.3.2012 Tůmová

Národní informační středisko pro podporu kvality. 15.3.2012 Tůmová Národní informační středisko pro podporu kvality 1 SeminářČSJ Odborná skupina statistické metody 15.3.2012 Praha 2 Nejistoty měření v teorii a praxi Doc. Ing. Olga Tůmová, CSc. 3 O měření 1 Ve 20. století

Více

Metodika pro učitele Optika SŠ

Metodika pro učitele Optika SŠ Metodika pro učitele Optika SŠ Základní charakteristika výukového programu: Popis: V šesti kapitolách se žáci seznámí se základními principy geometrické optiky, s optickými klamy a světelným spektrem.

Více

Metodika k hodnocení biologické účinnosti insekticidních přípravků mořidel proti křísku polnímu v obilninách

Metodika k hodnocení biologické účinnosti insekticidních přípravků mořidel proti křísku polnímu v obilninách Metodika k hodnocení biologické účinnosti insekticidních přípravků mořidel proti křísku polnímu v obilninách Poznámka: Tato metodika je doplněním metodiky EPPO 1/70 (3) Aphid vectors of BYDV. Je zaměřena

Více

1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním

1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním 1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním Ad hoc modul 2007 vymezuje Nařízení Komise (ES) č. 431/2006 z 24. února 2006. Účelem ad hoc modulu 2007

Více

Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace. Komenské 1720, Staré Město, www.zsstmesto.cz. Metodika

Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace. Komenské 1720, Staré Město, www.zsstmesto.cz. Metodika Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace Komenské 1720, Staré Město, www.zsstmesto.cz Metodika k použití počítačové prezentace A Z kvíz Mgr. Martin MOTYČKA 2013 1 Metodika

Více

SYLABUS PŘEDNÁŠKY 6b Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčování) 4. ročník bakalářského studia studijní program G studijní obor G

SYLABUS PŘEDNÁŠKY 6b Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčování) 4. ročník bakalářského studia studijní program G studijní obor G SYLABUS PŘEDNÁŠKY 6b Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčování) 4. ročník bakalářského studia studijní program G studijní obor G říjen 2014 1 1O POLOHOVÉ VYTYČOVÁNÍ Pod pojem polohového vytyčování se

Více