APLIKOVANÁ STATISTIKA



Podobné dokumenty
Metody zkoumání závislosti numerických proměnných

4.2 Elementární statistické zpracování Rozdělení četností

a další charakteristikou je četnost výběrového souboru n.

Mendelova univerzita v Brně Statistika projekt

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

9. Měření závislostí ve statistice Pevná a volná závislost

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Úvod do korelační a regresní analýzy

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

S1P Popisná statistika. Popisná statistika. Libor Žák

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Univerzita Karlova v Praze Pedagogická fakulta

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Statistika - vícerozměrné metody

Generování dvojrozměrných rozdělení pomocí copulí

11. Časové řady Pojem a klasifikace časových řad

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Doc. Ing. Dagmar Blatná, CSc.

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

BIVŠ. Pravděpodobnost a statistika

12. Neparametrické hypotézy

Odhady parametrů 1. Odhady parametrů

, jsou naměřené a vypočtené hodnoty závisle

12. N á h o d n ý v ý b ě r

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Testování statistických hypotéz

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Deskriptivní statistika 1

Spolehlivost a diagnostika

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

PRAVDĚPODOBNOST A STATISTIKA

Náhodné jevy, jevové pole, pravděpodobnost

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Optimalizace portfolia

Testy statistických hypotéz

Chyby přímých měření. Úvod

1. Základy měření neelektrických veličin

Náhodný výběr 1. Náhodný výběr

[ jednotky ] Chyby měření

Přednáška č. 2 náhodné veličiny

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

P1: Úvod do experimentálních metod

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

8. Analýza rozptylu.

Úvod do teorie měření

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

1.1 Definice a základní pojmy

8. Zákony velkých čísel

VY_52_INOVACE_J 05 01

Téma 6: Indexy a diference

Pravděpodobnost a aplikovaná statistika

11. Popisná statistika

2. Vícekriteriální a cílové programování

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

Intervalové odhady parametrů některých rozdělení.

Elementární zpracování statistického souboru

Jednoduchá lineární regrese

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

MATICOVÉ HRY MATICOVÝCH HER

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

8 NELINEÁRNÍ REGRESNÍ MODELY

Závislost slovních znaků

TECHNICKÁ UNIVERZITA V LIBERCI

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY Přírodovědecká fakulta ANALÝZA DAT. Josef Tvrdík

ZÁKLADY STAVEBNÍ MECHANIKY

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

9.3.5 Korelace. Předpoklady: 9304

Statistická analýza dat

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

PRAVDĚPODOBNOST A STATISTIKA

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

P2: Statistické zpracování dat

13 Popisná statistika

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

6. Posloupnosti a jejich limity, řady

NEPARAMETRICKÉ METODY

Transkript:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA MANAGEMENTU A EKONOMIKY VE ZLÍNĚ APLIKOVANÁ STATISTIKA FRANTIŠEK PAVELKA PETR KLÍMEK ZLÍN 000

Recezoval: Haa Lošťáková Fratšek Pavelka, Petr Klímek, 000 ISBN 80 4 545

OBSAH ÚVOD 5. EXKURS DO POPISNÉ STATISTIKY 6. Statstcký soubor a statstcké zaky 6. Typy proměých 6.3 Základí statstcké charakterstky 8.3. Míry polohy (úrově) 8.3. Míry varablty 0. ANALÝZA ZÁVISLOSTÍ 4. Růzé druhy závslostí 4. Základí způsoby popsu závslostí 5.. Dvourozměrá tabulka 5.. Bodový dagram 8..3 Podmíěé průměry a rozptyly 8.3 Aalýza rozptylu (pláováí expermetu).3. Expermety s jedím faktorem 3.3. Expermety se dvěma faktory 9.3.3 Aalýza rozptylu kvaltatvích zaků 35.4 Neparametrcké metody 40.4. Zamékový test 4.4. Jedovýběrový Wlcoxoův test 4.4.3 Dvouvýběrový Wlcoxoův test 4.4.4 Kruskal-Wallsův test 44.4.5 Fredmaův test 45.5 Regresí aalýza 49-3 -

.6 Korelačí aalýza 70 straa číslo.6. Parametrcké míry těsost závslost 70.6. Neparametrcké míry těsost závslost 79.6.3 Pozámka o multkoleartě 86 3. KAPITOLY Z ANALÝZY ČASOVÝCH ŘAD 89 3. Elemetárí charakterstky časových řad 90 3. Dekompozce časových řad 9 3.. Pops tredu - aalytcké vyrováváí 93 3.. Mechacké vyrováváí časových řad 98 4. KAPITOLY Z HOSPODÁŘSKÉ STATISTIKY 0 4. Ukazatel jako statstcká velča 0 4.. Typy a vlastost ukazatelů 03 4.. Zdroje ekoomckých dat v ČR 08 4. Idexy a absolutí rozdíly jako ástroj srováváí 09 4.. Jedoduché (dvduálí) dexy 0 4.. Složeé (dvduálí) dexy 4..3 Souhré dexy 5 4.3 Ceové dexy v České republce 7 LITERATURA 3-4 -

ÚVOD Skrpta Aplkovaá statstka jsou určea pro kurs Aplkovaá statstka. ročíku presečího a kombovaého studa Fakulty maagemetu a ekoomky ve Zlíě. Navazují a skrpta Metody statstcké aalýzy stejojmeého kursu, který studet absolvoval jž v. ročíku. V souladu s hlavím předáškovým bloky jsou rozdělea do čtyř stěžejích kaptol:. Exkurs do popsé statstky,. Aalýza závslostí, 3. Kaptoly z aalýzy časových řad a 4. Kaptoly z hospodářské statstky. Skrpta jsou kocpováa tak, aby vedla studety k volbě vhodých statstckých metod př řešeí kokrétích problémů, k přměřeému zvládutí techky výpočtů a zejméa ke správé terpretac získaých výsledků. Probíraá problematka je téměř vždy vysvětlea a řešeých příkladech. Získaé dovedost s studet dále prohloubí v předmětech Ekoomcká statstka a Ekoometre, se kterým se setkají ve vyšších ročících. Statstcké tabulky základích statstckých rozděleí (ormovaého ormálího rozděleí, t-rozděleí, F-rozděleí a χ -rozděleí) jsou uvedey ve skrptech Metody statstcké aalýzy, popř. v běžé statstcké lteratuře. Specálí tabulky používaé v kaptole.4 studet aleze v lteratuře [] a [3]. Pro hlubší zvládutí předášeé látky je potřeba eje ávštěva předášek a aktví účast a cvčeích, ale studum další lteratury, která je uvedea a závěr skrpt. Přejeme studetům moho úspěchů př studu. Fratšek Pavelka Petr Klímek - 5 -

. EXKURS DO POPISNÉ STATISTIKY V této kaptole zopakujeme stručě základí pojmy z popsé statstky. Popsá statstka je součástí předmětu Metody statstcké aalýzy, který se vyučuje v I. ročíku. K výkladu základích pojmů jž ebudeme uvádět příklady.. Statstcký soubor a statstcké zaky Defce. Statstcké jedotky, statstcké zaky Statstcké jedotky jsou elemetárí prvky, a kterých zkoumáme vlastost, které se vyskytují u velkého počtu jedců. Každá statstcká jedotka má řadu vlastostí, které j charakterzují. Tyto vlastost se azývají statstcké zaky. Defce. Statstcký soubor, rozsah souboru Statstcký soubor je souhr všech statstckých jedotek, které jsou předmětem zkoumáí. Počet jedotek statstckého souboru se azývá rozsah souboru. Pozámka: Statstcký zak je tedy odraz určté vlastost každé jedotky jstého statstckého souboru. Nabývá tolka hodot (slovích ebo číselých), kolk jedotek patří do daého souboru. Počet hodot je rove rozsahu souboru. Defce.3 Hodota zaku Ozačeí stupě daé vlastost (vyjádřeé statstckým zakem) pozorovaého u každé jedotky souboru je hodota zaku; ěkdy se azývá pozorováí. Defce.4 Kostata, proměá Statstcký zak, který abývá v daém souboru pouze jedé obměy, se azývá kostata (ěkdy též detfkačí statstcký zak). Statstcké zaky, které abývají v daém souboru více ež jedé obměy, jsou promělvé (varablí) - ebol proměé. Defce.5 Základí a výběrový soubor Základí soubor (populace) je soubor, v ěmž pozáí jeho ěkterých promělvých vlastostí je vlastím cílem statstckého zkoumáí. Výběrový soubor tvoří jstý počet jedotek, které byly určtým způsobem vybráy ze základího souboru. Výběrový soubor by měl být co ejlepším představtelem (represetatem) populace, poěvadž a základě pozáí vlastostí výběrového souboru se usuzuje a vlastost populace (základího souboru).. Typy proměých Podle toho, jsou-l obměy určté proměé vyjádřey slovy ebo určtým čísly, dělíme proměé a: a) sloví (alfabetcké, kategorálí), - 6 -

b) číselé (umercké). Kategorálí se azývají proto, že vytříděím jedotek souboru podle takové proměé vzkají skupy ebol kategore. Někdy se kategorálím proměým říká kvaltatví a umerckým proměým pak kvattatví. Podle toho, zda proměé abývají v daém statstckém souboru dvou ebo více ež dvou obmě, dělíme proměé a: a) alteratví (abývají pouze dvou varat), b) možé (abývají více ež dvou varat). Podle toho, zda varaty umercké proměé mohou abýt v tervalu, v ěmž se reálě pohybují, všech reálých čísel ebo je zolovaých číselých hodot, se číselé proměé dělí a: a) spojté (kotuálí), b) espojté (dskrétí). Podle hledska typu vztahů mez varatam a tím hodotam proměých čleíme tyto a omálí, ordálí a metrcké. Defce.6 Nomálí proměá Nomálí (jmeé, ázvové) proměé jsou ty kategorálí proměé, u jejchž varat elze objektvě jedozačě staovt jedo určté pořadí tak, že by varata s vyšším pořadím vyjadřovala vyšší stupeň vlastost ež já varata s žším pořadím. O dvou hodotách omálí proměé lze pouze kostatovat, že jsou buď stejé, ebo že jsou růzé. Defce.7 Ordálí proměá Ordálí (pořadové) proměé jsou ty, o jejchž varatách lze kostatovat eje, že jsou růzé, ale lze je jedozačě seřadt od ejmeší po ejvětší. Rozdíl dvou obmě ebo hodot ordálí proměé začí rozdíl v pořadí těchto varat ebo hodot. Toto srováí obmě a hodot ordálí proměé má smysl a je plě dostačující. Naprot tomu emá smysl ebo je klamé srováí obmě a hodot ordálí proměé podílem. Srováí podílem v případě, že ordálí proměá obsahuje záporé ezáporé obměy, je emožé. V případě, že ordálí proměá obsahuje pouze kladé varaty č hodoty, je srováí podílem rozumě těžko vysvětltelé. Příkladem ordálí proměé je třeba zámka z matematky u vysokoškolských studetů. Tato proměá abývá ve sloví formě varat výborě, velm dobře, dobře, evyhověl a v číselé formě,,3,4. Lze apř. říc, že studet se zámkou 4 má o 3 stupě (= 4-) horší zámku ež studet se zámkou. Nelze však rozumě tvrdt, že by prví studet byl právě čtyřkrát (= 4:) horší ež oe jedčkář. Defce.8 Metrcká proměá Metrcké (měřtelé) proměé jsou ty, o jejchž dvou obměách lze říc eje, že jsou růzé (jako u omálích proměých) a že jeda z ch je větší ež druhá (jako u ordálích proměých), ale lze přesě změřt, o kolk je jeda obměa větší ež druhá. - 7 -

Metrcké proměé jsou vždy číselé. Vyjadřují přtom eje seřazeí, ale velkost měřeých vlastostí statstckých jedotek daého statstckého souboru. Pro metrcké proměé se často používá ázev kardálí. Toto ztotožěí metrckých a kardálích proměých však eí účelé a užtečé. Metrcké proměé lze totž podle oboru varat (a tím hodot), kterých může v daém souboru daá měřtelá proměá abýt, rozdělt v zásadě a dvě skupy. Do prví skupy patří taková metrcká proměá, která v daém souboru abývá pouze kladých číselých hodot. A právě pro tuto metrckou proměou je vhodé vyhradt ázev kardálí. Defce.9 Kardálí proměá Kardálí proměá je taková metrcká proměá, která abývá v určtém statstckém souboru pouze kladých číselých varat, u jejchž dvojc lze přesě změřt ejeom, o kolk je jeda obměa větší ež druhá, ale lze též přesě staovt, kolkrát je jeda varata větší ež druhá. Příkladem kardálí proměých jsou v souboru vysokoškolských studetů apř. tělesá výška v cm a hmotost v kg, eboť abývají pouze kladých číselých hodot. Například u posledí proměé má smysl říc, že apř. 00 kg vážící studet prot studetům vážícím 50 kg je eje o 50 kg (00-50) těžší, ale je dvakrát (00:50) těžší apod. Do druhé skupy metrckých proměých patří takové, které abývají v daém souboru kladých ekladých číselých hodot. U obmě takové metrcké proměé lze tedy pouze přesě změřt, o kolk je jeda varata větší ež druhá, ale elze staovt, kolkrát je jeda kladá obměa větší ež ějaká ekladá obměa. Tyto proměé jsou ekardálí..3 Základí statstcké charakterstky.3. Míry polohy (úrově) Defce.0 Středí hodota Středí hodota umercké proměé x, která abývá hodot x, =,,...,, z chž ěkterá je mmálí (x m ) a ěkterá maxmálí (x max ), je každá hodota x str, pro ž platí: x m x str x max. (.) Mez hodoty x str, které vyhovují (.) lze uvést: x m, x max (extrémí hodoty),!x (modus), ~ x (medá), dolí kvartl ~ x 5, horí kvartl ~ x 75 apod. Za velm dobré míry polohy se z ch považují právem modus!x (relatvě ejčetější hodota), medá ~ x (prostředí hodota). Všechy výše uvedeé druhy středích hodot jsou kokrétí hodoty, které ejsou přímo ovlvěy velkostí všech hodot proměé. To má výhodu zejméa tehdy, kdy se vyskytují áhodě jeda ebo ěkolk málo mmořádě extrémích hodot (vzhledem k ostatím hodotám přílš velkých resp. přílš malých). V těchto případech ejsou modus a medá ovlvěy těmto odlehlým hodotam a poskytují tak dobrou představu o objektví poloze prostředí a ejčastější hodoty a tím o úrov (poloze) hodot sledovaé proměé. - 8 -

Někdy se však ectlvost těchto měr považuje za jstou evýhodu. Tuto evýhodu překoává velká skupa středích hodot, která se azývá průměry, což jsou středí hodoty defovaé tak, že jsou fukcí všech hodot daé proměé. Exstuje moho druhů průměrů. My se zde zaměříme a artmetcký, geometrcký, harmocký a kvadratcký průměr. Defce. Artmetcký průměr (jedoduchý, prostý) Artmetcký průměr řady hodot x, x,..., x se ozačuje zpravdla jako xa je defová jako: x = x. (.) = Udává, jaká stejá část ze součtu hodot umercké proměé přpadá a jedu jedotku. Má smysl všude, kde má ějaký formačí smysl součet hodot proměé. Defce. Artmetcký průměr vážeý Artmetcký průměr vážeý se spočítá z rozděleí četost podle vzorce: x k = = k = x, (.3) kde x je třídí zak -tého tervalu (střed tervalu) rozděleí četost, - absolutí četost v -tém tervalu, k - počet tervalů. Nahradí-l se v (.3) absolutí četost, =,,...,k relatvím četostm p, =,,...,k, pak platí: x = k = x p. (.4) Defce.3 Geometrcký průměr Geometrcký průměr kladých hodot x, x,..., x se spočítá podle vztahu: x = x. x... x = x. (.5) G Geometrcký průměr má smysl všude, kde má ějaký formačí smysl souč hodot proměé. = Defce.4 Harmocký průměr Harmocký průměr kladých hodot je defová jako: x H =. (.6) x = - 9 -

Má smysl všude, kde má ějaký formačí smysl součet převráceých hodot proměých. Ze vzorce (.6) je zřejmé, že převráceá hodota harmockého průměru: x = = (.7) x H je artmetckým průměrem převráceých hodot proměých. Defce.5 Kvadratcký průměr Kvadratcký průměr hodot x, x,..., x je defová jako: x = x K =. (.8) Má smysl všude, kde má ějaký formačí smysl součet čtverců hodot proměé. Ze vztahu (.8) plye, že čtverec kvadratckého průměru: x x K = = (.9) je artmetckým průměrem čtverců hodot proměé. Pozámka: Pro kladé hodoty x, x,..., x platí mez výše uvedeým průměry těchto hodot erovost: xh xg x xk. (.0).3. Míry varablty Defce.6 Varačí rozpětí Varačí rozpětí kladých hodot proměé, seřazeých v tzv. varačí řadu x x... x - x se spočítá podle vztahu: R = x - x. (.) Hodotu x ěkdy ozačujeme jako x m a hodotu x jako x max. Pak je R = x max - x m. Varačí rozpětí je velm přblžou charakterstkou varablty hodot umercké proměé, eboť je přílš ovlvěo velkostí extrémích hodot. Defce.7 Rozptyl Rozptyl řady hodot x, x,..., x je defová jako: - 0 -

s = ( x x) =. (.) Z rozděleí četostí se rozptyl určí jako: s = k ( ) = x x. (.3) Nahradí-l se ve (.3) absolutí četost, =,,...,k četostm relatvím p, =,,..., k, potom máme: k ( ) s = x x p. (.4) = Častěj jako (.) a (.3) je rozptyl s z řady hodot x, x,..., x defová: s = ( x x) = (.5) a z rozděleí četostí: s = k ( ) = x x. (.6) Defce.8 Směrodatá odchylka Směrodatá odchylka je defováa jako kladá druhá odmoca z rozptylu, tj.: s=+ s. (.7) Jedím z důvodů zavedeí směrodaté odchylky jako míry varablty je skutečost, že rozptyl je uvádě ve čtvercích měrých jedotek hodot umerckých proměých. Odmocěím se tyto čtverce měrých jedotek převedou zpět do leárího tvaru. Směrodatá odchylka je vlastě kvadratckým průměrem z odchylek jedotlvých hodot od jejch artmetckého průměru, tedy: s = ( x x) =. (.8) Směrodatá odchylka tedy udává, jak se v průměru v daém souboru odchylují hodoty od artmetckého průměru. - -

Defce.9 Varačí koefcet Varačí koefcet je defová jako podíl směrodaté odchylky a artmetckého průměru, tedy: s V x =. (.9) x Je mírou tzv. relatví varablty. Po vyásobeí stem udává, z kolka procet se podílí směrodatá odchylka a artmetckém průměru. Doporučuje se k aplkac př srováváí varablty hodot dvou růzorodých proměých, které jsou vyjádřey zpravdla v růzých měrých jedotkách. Pozámka k varačímu koefcetu: a) Přčte-l se ke všem hodotám (odečte-l se od všech hodot) proměé lbovolá kladá kostata, potom se varačí koefcet zmeší (zvětší). b) Násobí-l se (dělí-l se) všechy hodoty proměé eulovou kostatou, pak se varačí koefcet ezměí. Defce.0 Průměrá odchylka Průměrá odchylka z řady hodot x, x,..., x je defováa jako: d = = x x. (.0) Defce. Míra varablty hodot kardálí proměé Tato míra je defováa jako: x ( x x j)l = j= x va = ( ) j = x x x ( )l, = x > 0. (.) Míra v a byla zavedea proto, že ěkdy je třeba př měřeí varablty hodot umercké proměé přhlédout k růzé povaze ordálích a kardálích proměých. Zatímco je pro měřeí varablty hodot ordálí proměé vhodé použít kterékol míry absolutí varablty, založeé je a průměrech odchylek hodot od průměru, je třeba př měřeí varablty kardálí proměé přhlédout k podílům hodot od průměru, což splňuje právě míra v a. Zatímco směrodatá odchylka, průměrá odchylka apod. měří absolutí varabltu a varačí koefcet relatví varabltu, je míra v a mírou komplexí varablty kardálí proměé. Defce. Varablta hodot kategorálí proměé Varablta hodot kategorálí proměé (mutablta) je defováa jako: - -

k ( ) = M =., (.) kde k je počet obmě, je absolutí četost jedotek v -té obměě, je rozsah souboru. Obor míry mutablty: M <0,>. Jestlže tedy jsou všechy hodoty ějaké sloví proměé stejé, tj. abývá-l tato proměá pouze jedé obměy, jde o ulovou mutabltu. Nabývá-l tato proměá aspoň dvou obmě, potom jde o určtý stupeň mutablty. Tato promělvost je tím vyššího stupě, čím více abývá daá kategorálí proměá obmě. Je-l rozsah souboru () rove počtu obmě (k), je mutablta rova jedé. Výraz za podílem / ( - ) v (.) se azývá omálí varace: omvar = k = ( ). (.3) Míru mutablty lze také psát ve tvaru: k = M = ( ). (.4) - 3 -

. ANALÝZA ZÁVISLOSTÍ Př výkladu této kaptoly předpokládáme zalost z předmětu Metody statstcké aalýzy. Kvůl kotutě výkladu zopakujeme (tak jako v. kaptole) ěkteré základí pojmy z regresí a korelačí aalýzy.. Růzé druhy závslostí Vysvětlíme (zopakujeme) ejprve pojmy: příčá, pevá a volá závslost. Defce. Příčá závslost O příčé závslost mluvíme tehdy, jestlže vzk, exstece č změy jeděch jevů (příč) podmňuje vzk, exstece č změy jých jevů (účků), ebo když se jevy vzájemě podmňují. Zkoumáí souvslostí (zkoumáí tzv. korelace mez jevy) je jedím z ejdůležtějších úkolů statstky. S ejjedodušším formam příčých souvslostí se setkáváme u ěkterých přírodích jevů. Se složtým formam se setkáváme u jevů společeských (ekoomckých). Příčá souvslost se zpravdla projevuje v růzých formách. Jedou z ch je fukčí závslost, se kterou se setkáváme v matematce, fyzce apod. Defce. Fukčí (pevá) závslost Fukčí (pevá) závslost je taková závslost, kdy každé hodotě jedé proměé, která se azývá argumet a ozačuje se zpravdla jako x (ezávsle proměá), se přřazuje jedozačě jedá hodota druhé proměé velčy, která se azývá fukcí a ozačuje se písmeem y (závsle proměá). O fukčí závslost mluvíme ěkdy jako o pevé závslost, poěvadž vzk exstece jedoho jevu je př fukčí závslost erozlučě spjata se vzkem ebo exstecí jevu druhého. Defce.3 Volá závslost Volá závslost je taková závslost, kdy stejé hodotě jedé proměé může odpovídat více hodot druhé proměé. Budeme se setkávat s velčam, mez mž fukčí závslost eexstují, a přesto půjde o velčy závslé. Můžeme říc, že př zkoumáí závslostí umerckých (číselých) zaků charakterzujících ekoomcké velčy, budeme mít výhradě co čt s volým závslostm. Defce.4 Podmíěé rozděleí četostí Podmíěé rozděleí četostí je rozděleí četostí jedé velčy (jedoho kvattatvího zaku) odpovídající určté hodotě druhé velčy (druhého kvattatvího zaku). - 4 -

Defce.5 Statstcká závslost, ezávslost Dochází-l př změách jedoho zaku ke změám podmíěého rozděleí zaku druhého, považují se oba zaky za statstcky závslé. Odpovídá-l aopak růzým změám jedoho zaku stejé podmíěé rozděleí četostí zaku druhého, považují se oba zaky za statstcky ezávslé. Defce.6 Stochastcká závslost Statstcká závslost je emprckou formou stochastcké závslost, tj. závslost áhodých velč. Ty jsou závslé, jestlže změy hodot jedé áhodé velčy jsou doprovázey změam podmíěého pravděpodobostího rozděleí velčy druhé. Stochastcká a tedy statstcká závslost jsou volé závslost.. Základí způsoby popsu závslostí Tato podkaptola je také vlastě stručým zopakováím pozatků z kurzu Metody statstcké aalýzy. Tady se jž eobejdeme bez jedoduchého příkladu... Dvourozměrá tabulka Prví formace o průběhu závslost dvou proměých (zaků) získáme jž tak, že zjštěé údaje uspořádáme do dvourozměré tabulky. Je to tabulka, v jejíž legedě jsou uvedey varaty jedoho zaku, v hlavčce varaty druhého zaku a v jedotlvých políčkách tabulky četost kombací obou proměých (zaků). Tyto četost azveme sdružeé četost a začí se zpravdla j. V posledím sloupc tabulky se uvádějí řádkové součty a v posledím řádku tabulky sloupcové součty sdružeých četostí. Tyto řádkové č sloupcové součty se azývají okrajové (margálí) četost a ozačují se obvykle jako. a.j. Defce.7 Kotgečí a korelačí tabulka Dvourozměrá tabulka kvaltatvích zaků se azývá kotgečí tabulka. Dvourozměrá tabulka kvattatvích zaků se azývá korelačí tabulka. V korelačí tabulce jako varaty obou zaků fgurují buď hodoty zaků, jde-l o espojté zaky, které mohou abývat je malého počtu hodot, ebo tervaly hodot zaků (v jých případech). V posledím případě jsou př zpracováí údajů korelačí tabulky jedotlvé tervaly represetováy jejch středy (tzv. třídím zaky). Příklad. Př socologckém průzkumu prováděém u = 400 respodetů byly jedotlvým respodetům položey mmo jé tyto otázky: - 5 -

. Jak hodotíte pocty př ošeí letí obuv zakoupeé u fy Baťa? Odpověd mohou být: dobré, a dobré a špaté, špaté.. Hodláte tedy př příštím ákupu obuv změt frmu? Odpověd mohou být: ao, ejsem rozhodut, e. Průzkum měl mmo jé dát odpověď a otázku, zda exstuje souvslost mez tím, jak respodet posuzují své pocty př ošeí obuv a mez jejch postojem ke změě frmy. Jedotlvé odpověd získaé od respodetů byly seřazey do dvourozměré tabulky (tab..). Tabulka. Pocty př ošeí obuv postoj ke změě frmy součty (řádkové). hodlám změt ejsem rozhodut ehodlám změt dobré 6 40 44 00 a dobré 0 68 80 a špaté špaté 88 8 4 0 součty (sloupcové).j 04 60 36 400 Povšměme s, že z tabulky je patrá souvslost obou zaků. Se změou ázorů a pocty př ošeí se měí podmíěá rozděleí četostí postoje ke změě frmy. Z tabulky je vdět, že z respodetů považujících pocty př ošeí za dobré jch větša ehodlá změt frmu, zatímco z respodetů považujících pocty př ošeí za špaté, jch větša hodlá změt frmu. Dobrou představu o změách podmíěých rozděleí četostí zaku změa frmy obdržíme tak, že tato rozděleí popíšeme podmíěým relatvím četostm (tab..), které získáme tak, že četost v každém řádku podělíme jejch součtem. Ozačíme-l počet řádků tabulky (kromě součtového) symbolem k a počet sloupců (opět kromě součtového) symbolem m, můžeme psát j p j \ = ( =,,..., k; j =,,..., m). (.). Tabulka. Pocty př ošeí postoj ke změě frmy součty obuv hodlám změt ejsem rozhodut ehodlám změt dobré 0,08 0,0 0,7,00 a dobré 0,00 0,5 0,85,00 a špaté špaté 0,73 0,07 0,0,00 součty 0,6 0,5 0,59,00 V posledím řádku tabulky jsou uvedey okrajové relatví četost p.j, popsující rozděleí četost zaku postoj ke změě frmy u všech = 400 respodetů bez ohledu a pocty př ošeí. Tyto relatví četost jsou poměrem okrajových četostí.j k počtu všech pracovíků, tj. - 6 -

. j p. j =, j =,,..., m. (.) Vypočítal jsme je tak, že jsme všechy hodoty v součtovém řádku tab.. děll 400. Z tab.. lze vyčíst zejméa to, že z respodetů, považujících pocty př ošeí obuv za dobré, jch pouze 8 % hodlá a plých 7 % ehodlá změt frmu, zatím co z respodetů, považujících pocty př ošeí obuv za špaté, jch 73 % hodlá a pouze 0 % ehodlá změt frmu. Z tab.. lze také vyčíst, že z celkového počtu respodetů ( = 400) hodlá změt frmu 6 % respodetů, erozhoduto je 5 % a ehodlá změt frmu 59 %. Kdyby byl postoj ke změě frmy ezávslý a poctech př ošeí, byly by podmíěé relatví četost p j\ v každém řádku tabulky stejé a byly by stejé jako tř okrajové relatví četost p.j. V uvedeém příkladu byly růzé postoje respodetů ke změě frmy vysvětlováy jejch růzým pocty př ošeí obuv. Prví z těchto zaků byl tedy zakem vysvětlovaým a druhý prvkem vysvětlujícím. V takových případech se relatvím četostm popsují vždy rozděleí zaku vysvětlovaého, zatímco zak vysvětlující fguruje jako zak třídící. Je-l závslost obou zaků vzájemá, tj. může-l každý z ch vystupovat v rol vysvětlovaého zaku, popsují se podmíěým relatvím četostm podmíěá rozděleí každého z obou zaků. Prví s podmíěým relatvím četostm (vztah.) a okrajovým relatvím četostm (vztah.) a druhá tabulka s podmíěým relatvím četostm j p\ j=, =,,..., k; j =,,..., m (.3). j a s okrajovým relatvím četostm. p. =, =,,..., k. (.4) V těchto případech se sestavuje tabulka sdružeých relatvích četostí. j pj =, =,,..., k; j =,,..., m, (.5) které jsou poměrem sdružeých četostí k počtu pozorováí. Ke sdružeým relatvím četostem se pak v posledím sloupc přpojují okrajové relatví četost p. a v posledím řádku okrajové relatví četost p.j. Pozámka: Z tabulky. bychom přešl a tabulku sdružeých relatvích četostí tak, že bychom všechy hodoty v tabulce. děll 400. Sdružeá relatví četost 6/400 = 0,04 by ás formovala o tom, že z celkového počtu 400 respodetů jch 4 % považovalo pocty př ošeí obuv za dobré, a přesto hodlal změt frmu, sdružeá relatví četost 88/400 = 0, ás formuje o tom, že % respodetů považovalo pocty př ošeí obuv za špaté a hodlalo změt frmu apod. - 7 -

.. Bodový dagram Sledujeme-l u statstckých jedotek dva kvattatví zaky x, y, obdržíme celkem dvojc hodot x, y, =,,...,. Prví představu o závslost obou zaků lze získat tak, že zjštěá data zázoríme bodovým dagramem. Defce.8 Bodový dagram Bodový dagram je dagram, v ěmž každá dvojce x, y je zázorěa jako bod v pravoúhlé souřadé soustavě, kde a vodorové ose je umístěa stupce hodot zaku x a svslé stupce hodot zaku y. Vyeseé body tvoří jakýs roj, z ěhož můžeme vystopovat charakterstcké rysy závslost obou zaků. Bodový dagram ám tedy poskytuje formace o průběhu závslost a také o její těsost...3 Podmíěé průměry a rozptyly Nejdůležtějším charakterstkam rozděleí četostí jsou artmetcký průměr a rozptyl. Pokud se tyto charakterstky týkají podmíěého rozděleí četost, mluvíme o podmíěém průměru a o podmíěém rozptylu. Měí-l se podmíěé rozděleí četostí, odráží se to zpravdla a změě alespoň jedé z těchto charakterstk. Popíšeme jedoduchý způsob, který lze použít př zkoumáí závslost kvattatvího zaku y a zaku x, který může být kvattatví kvaltatví. Jedotky, a chž byly zjštěy údaje o zacích y a x (počet těchto jedotek budeme začt ) se podle zaku x roztřídí do k skup. Dále se v každé skupě vypočte průměr a rozptyl příslušých hodot zaku y. Tím se získá k podmíěých průměrů y, y,..., y k a k podmíěých rozptylů sy., sy.,..., sy. kzaku y. Posuzuje se pak, jak se př změách úrově zaku x měí podmíěé průměry a podmíěé rozptyly zaku y. Je-l x espojtý kvattatví zak abývající je malého počtu hodot, mohou být skupy vymezey přímo těmto hodotam, jak je tomu apř. v tab..3. Zde je zakem x počet dětí a jsou vymezey skupy hodotam 0,,, 3, 4 tohoto zaku. Nabývá-l zak x moha hodot, je k skup vymezeo dsjuktím tervaly hodot zaku x. Např. je-l měsíčí mzda v Kč, mohou být tervaly 7000-7499, 7500-7999, 8000-8499 apod. Koečě je-l x kvaltatvím zakem, jsou skupy vymezey varatam tohoto zaku. Např. je-l x dokočeé školí vzděláí, mohou být voley varaty: základí, středoškolské, vysokoškolské. Úrově zaku x ozačíme jako x, x,..., x k. Půjde-l o kvaltatví zak, budou jm jedotlvé varaty. Bude-l x kvattatví zak, budou x < x <...< x k buď jedotlvým hodotam zaku ebo (př tervalovém tříděí) středy tervalů (třídí zaky). - 8 -

Příklad. U 50 úplých rod (maželka, mažel, dět) byly sledováy ročí výdaje a průmyslové zboží v ts. Kč (y) a počet dětí v rodě (x). Údaje, roztříděé podle počtu dětí jsou uvedey v tab..3, kde jsou uvedey podmíěé průměry a podmíěé rozptyly výdajů rod a průmyslové zboží. Tabulka.3 počet dětí roč.výdaje a prům. zboží v ts. Kč y j počet rod pr. roč. výdaje y rozptyl roč. výdajů 0 36, 36,6 34, 7 37,9 34,0 38,4 36,3 6,5600 35,0 37, 33,9 38,9 3,5 4,4 37,9 37,4 38,8 37, 35, 40,0 0 37,7 5,960 34,8 40,9 33,9 40,7 36, 44, 39,5 38,8 40,0 38, 4,0 4 39, 6,674 37,7 40,7 37, 43, 35,6 43,3 35, 3 40,6 4,4 39, 4, 38,8 43,9 9 40,4 7,889 36,8 44,3 36,4 4 38,6 43,7 39, 44, 44,4 5 4,0 6,690 celý pozorovaý soubor 50 = 38,7 = y 9,734 = s y s y. Z tabulky je zřejmé, že s růstem počtu dětí se zvyšují průměré výdaje rody a průmyslové zboží, zatímco rozptyly těchto výdajů kolísají kolem určté kostaty. Jsou-l y x kvattatví prvky, zázorňují se dvojce x, y, =,,..., k (resp. dvojce x,s y., =,,..., k) jako body v pravoúhlé souřadé soustavě. Spojí-l se tyto body úsečkam, získá se v prvém případě čára podmíěých průměrů a ve druhém případě čára podmíěých rozptylů. Z tab..3 je patré, že s rostoucím počtem dětí rostou výdaje rod a průmyslové zboží přblžě leárě. V tab..3 jsou kromě uvedeých podmíěých průměrů a rozptylů zaku y uvedey průměr a rozptyl tohoto zaku za celý pozorovaý soubor, tj. celkový průměr a celkový rozptyl y = k = k = j= y j= j ( yj y) (.6) sy =. (.7) Přpomeňme, že celkový průměr je průměrem podmíěých průměrů, tj. k y y = =. (.8) Celkový rozptyl je pak součtem rozptylu podmíěých průměrů - 9 -

s ym. a průměru podmíěých rozptylů = k k ( y y) ( y y) = = j= k = k ( yj y ) (.9) s y.. = = j= s y. v = =, (.0) takže sy = sy. m + sy. v. (.) Rozptyl podmíěých průměrů jsme ozačl symbolem s ym., abychom azačl, že odráží mezskupovou varabltu zaku y, průměr podmíěých rozptylů symbolem s yv., abychom azačl, odráží vtroskupovou varabltu zaku y. Vztah (.) je důsledkem vztahu = S S, (.) S y y. m + y. v k kde je Sy = ( yj y) = j=, Příklad.3 k k ( ) ( ) Sym. = y y = y y, } (.3) = j= = k ( ) S. = y y yv j = j=. V tab..3 s všměme pouze skupy domácostí se 4 dětm a ukážeme, že tu platí vztah Výpočty jsou uvedey v tab..4. ( yj y) = ( y y) + ( yj y ) j= j= j=. (.4) Tabulka.4 y j y j y y y y j y ( yj y) ( y y) ( y y ) j 38,6-0, 3,3-3,4 0,0 0,89,56 43,7 5,0 3,3,7 5,00 0,89,89 39, 0,4 3,3 -,9 0,6 0,89 8,4 44, 5,5 3,3, 30,5 0,89 4,84 44,4 5,7 3,3,4 3,49 0,89 5,76 Součet čtverců odchylek 87,9 54,45 33,46-0 -

Prví součet čtverců je součtem dalších dvou. Tak by tomu bylo ve všech ostatích skupách domácostí a v součtech za všechy skupy. V součtech za všechy skupy tedy platí vztah (.). Zkoumá-l se závslost zaku y a zaku x, lze za jstých podmíek považovat kolísáí (varabltu) podmíěých průměrů y za důsledek závslost zaku y a zaku x, zatímco kolísáí hodot y uvtř jedotlvých skup za důsledek závslost zaku y a dalších čtelích. Závslost zaku y a zaku x se pak považuje za tím slější, čím je větší mezskupová varablta a čím meší je vtroskupová varablta zaku y. Za míru (tezty) závslost zaku y a zaku x se pak volí poměr s S ym. ym. P = =, (.5) sy Sy který se azývá poměr determace, a jeho odmoca P se azývá korelačí poměr. Poměr determace abývá hodot z tervalu <0,>. Závslost zaku y a zaku x se pak považuje za tím těsější (slější), čím více se poměr determace blíží k jedé, a za tím slabší (volější), čím více se blíží k ule. Příklad.4 Vraťme se opět k příkladu.. V ěm jsme uvedl celkový rozptyl výdajů rod a průmyslové zboží s y = 9,734. Protože rozptyl podmíěých průměrů ( ) + ( ) + + ( ) 36, 3 38, 7 * 37, 7 38, 7 * 0... 4, 0 387, * 5 s ym. = =, 6308 50 a průměr podmíěých rozptylů 6, 5600* + 5, 960* 0+... + 6, 690 * 5 s yv. = = 8, 06, 50 je poměr determace rove 6308 P =, 9 734 = 0,, 68. Jeho hodota sgalzuje slabší závslost y a x, tj. slabší závslost výdajů rod a průmyslové zboží a počtu dětí v rodě..3 Aalýza rozptylu (pláováí expermetu) V základím kurzu Metody statstcké aalýzy jsme př výkladu o testu hypotézy shody dvou průměrů (t-test, Welchův test) uvedl, že teto test patří mez ejdůležtější a ejčastěj používaé. Často však potřebujeme ověřt výzamost rozdílu mez výběrovým průměry většího počtu áhodých výběrů (počet testovaých průměrů je alespoň 3). Toto ověřováí výzamost se provádí pomocí aalýzy rozptylu. Aalýza rozptylu (zkratka ANOVA - aalyss of varace) v průmyslových aplkacích umožňuje posoudt vlv růzých faktorů a výrobí proces, hodott vlv použtí růzých druhů surov a jakost produkce apod. Aalýzy rozptylu v ekoomckých aplkacích umožňují posoudt vlv růzých faktorů a hospodářský proces, hodott účky růzých přjatých opatřeí apod. - -

ANOVA byla původě odvozea R. A. Fsherem (935) jako velm výhodý postup statstcké aalýzy v bologckém (především zemědělském) výzkumu. Podstata aalýzy rozptylu spočívá v tom, že celkový rozptyl rozložíme a dílčí rozptyly áležející příslušým jedotlvým vlvům, podle chž jsou emprcké údaje roztříděy. Kromě těchto dílčích rozptylů je jedou složkou celkového rozptylu tzv. rezduálí rozptyl, který je způsobe dalším vlvy, jež ve svém rozboru eposthujeme. Porováím složek rozptylu zkoumaého kvattatvího zaku určíme pak vlvy, které výzamě ovlvňují úroveň tohoto zaku. Úspěšost využtí aalýzy rozptylu předpokládá správou přípravu expermetu. Sažíme se, abychom př ejžším možém počtu pokusů získal relevatí formace o zkoumaé závslost. Objekt zkoumáí (OZ), který může představovat ovou techolog, ové vlastost výrobku apod. je pro ás tzv. čerou skříňkou s defovaým počtem vstupů a výstupů (obr. ). z z... z p x y x y y OBJEKT : : ZKOUMÁNÍ x k y m Obr. w w... w q. Vstupy zázorěé špkam směřující k objektu zkoumáí charakterzují všechy způsoby možého vlvu a objekt zkoumáí (vstupí parametry). Výstupy, jež jsou zázorěy špkam směřujícím od objektu zkoumáí, charakterzují vlastost objektu zkoumáí (výstupí parametry). Budeme rozlšovat: a) vstupí kotrolovaé proměé, které může výzkumík mět podle svého uvážeí podle předem přpraveého pláu: vektor x = [x, x,..., x k ], b) vstupí proměé kotrolovaé, ale eřízeé: vektor z = [ z, z,..., z p ], c) eřízeé a ekotrolovaé proměé: vektor w = [w, w,..., w q ], d) výstupí proměé, charakterstka zkoumaých vlastostí, závsle proměé: vektor y = [y, y,..., y m ]. Proměé x a z se azývají faktory (ezávsle proměé). Faktory se mohou jedak mět v čase (proměé x) a jedak áhodě (proměé z). - -

Defce.9 Faktorový prostor Faktorový prostor je prostor kotrolovaých promìých. Defce.0 Úroveň faktorů Hodoty, kterých mohou faktory abývat, se azývají úrovì (hlady) faktorù. Proměé představovaé vektorem w jsou ěkteré rušvé proměé, přčemž charakter jejch vlvu a y může být dvojí. Představíme-l s, že proměé x a z (faktory) jsou v čase kostatí, pak pod vlvem proměých w se mohou závsle proměé y mět buď dostatečě systematcky, ebo praktcky epředvídaě, áhodě. Tehdy mluvíme o exstec šumového pole. Defce. Odezva, fukce odezvy, povrch odezvy Výstupí proměou y azýváme odezvou. Závslost odezvy a uvažovaých faktorech azýváme fukcí odezvy a geometrcké zázorěí fukce odezvy povrchem odezvy (výsledkovou plochou). Defce. Matematcký model objektu zkoumáí Matematcký model objektu zkoumáí je přesá věta v matematckém jazyce jedozačě odrážející ty ebo oy vlastost zkoumaého objektu. Defce.3 Expermet Expermet je systém operací pozorováí směřujících k získáí formací o objektu zkoumáí př výzkumých zkoumáích. Defce.4 Pokus Pokus je reprodukováí zkoumaého jevu v daých podmíkách expermetu s možostí regstrace jeho výsledků. Je to jedotlvá, elemetárí část expermetu. Defce.5 Plá expermetu Plá expermetu je moža (soubor) údajů, určující počet, podmíky a pořadí realzace pokusů. Defce.6 Pláováí expermetu Pláováí expermetu je výběr pláu expermetu, jež odpovídá zadaým podmíkám. Je to vlastě soustava čostí směřující k rozpracováí stratege expermetováí od počátečí ke koečé etapě zkoumáí objektu. - 3 -

.3. Expermety s jedím faktorem Uvažujme expermet, v ěmž je vyšetřová vlv jedoho faktoru A (kvůl zjedodušeí zápsu úroví faktoru jsme použl symbolu A, když jsme v předchozí kaptole ozačl faktory jako vektor x). Faktor A může být buď kvattatví ebo kvaltatví a je v expermetu uvažová a I úrovích A, A,..., A I. Pro úroveň (hladu) A provedeme r pokusů, pro úroveň A r pokusů, až pro úroveň A I provedeme r I pokusů. Ozačme = I r = jako celkový počet pokusů v celém expermetu. Nechť r, =,,..., I a > I (tj. aspoň jedo r je větší ež ). Obecě echť y ν začí výsledek ν -tého pokusu a úrov A. Model s pevým efekty: (.6) Předpokládáme, že y ν = η + e ν, =,,..., I ;ν =,,..., r, (.7) kde η je teoretcký výsledek a úrov A, e ν - áhodé chyby. Parametry η můžeme ahradt součty µ + α, kde µ, α, α,..., α I jsou ezámé parametry (kostaty), přčemž I µ = η (.8) I = začí průměrý teoretcký výsledek a uvažovaých I úrovích faktoru A. Jelkož α = η - µ, =,,..., I, je I I I ( ) α = η µ = η I µ = 0 (Iµ dle (.8) je η = = = Lze tedy místo (.7) psát y ν = µ + α + e ν, =,,...,I; ν =,,..., r, (.9) přčemž Defce.7 I α = = I = 0. (.0) Model expermetu s jedím faktorem, efekty Vztahy (.9) a (.0) azveme modelem expermetu s jedím faktorem. Náhodé velčy y ν jsou tedy fukcí + parametrů β = µ, β = α, β 3 = α,..., β + = α I, přtom parametry α, α,..., α I splňují vztah (.0). Parametr µ je obecou kostatou, parametr α efektem (účkem) úrově A (α zvyšuje resp. sžuje µ o úček úrově A ). Jelkož parametry µ, α, α,..., α I jsou kostatí, jsou vztahy (.9) a (.0) modelem s pevým efekty. ). - 4 -

Rozklad součtu čtverců: Zaveďme ejprve ozačeí (podle Cochraa) Velča y. echť začí průměr velč y ν ; ν =,,...,r. Symbolem Y. budeme ozačovat součet těchto velč, takže r y y r r Y. = ν =., =,,..., I. (.) ν = Podobě y.. a Y.. začí průměr a součet velč y ν, tj. I r I y y Y.. = ν =.. = ry.. (.) = ν = = Ozačme I r I r.. ν.. = ν = = ν = ( ν ) S = y y = y y. (.3) Teto výraz azveme celkový součet čtverců, eboť charakterzuje celkovou mělvost výsledků pokusů kolem celkového průměru. Celkový součet čtverců lze rozložt a dvě složky S A a S e, kde Je tedy ( ) I A... = I r S = r y y ( ν.) S = y y e = ν = S=S A + S e. a (.4). (.5) Součet čtverců S A charakterzuje mělvost mez průměry y. pro jedotlvé úrově A, A,..., A I faktoru A, součet čtverců S e azýváme rezduálí a charakterzuje varabltu ve výsledcích opakovaých pokusů a jedotlvých úrovích. S A je ovlvě tím, zda efekty α jedotlvých úroví jsou stejé č kolv, kdežto S e a této skutečost ezávsí. Pro sazší výpočty lze S, S A a S e přepsat do tvarů: I r Y.. S = y ν, S S A e = ν = I Y Y... = r = I r = y = ν = ν Velčě Y.. říkáme korekčí faktor. Test výzamost faktoru: I = Y r., (.6). - 5 -

Testujeme hypotézu H A, že efekty všech úroví faktoru A jsou stejé. Poěvadž efekty úroví splňují podmíku (.0), jsou efekty stejé, právě když α = α =...= α I = 0. Hypotéza rovost všech efektů tedy tvrdí: H A : α = 0, =,,..., I. (.7) Alteratví hypotéza H A I 0. = : α Jako testového krtera pro test hypotézy H A se použje velča S ( ) A / I F =. (.8) S ( I) e / Podíl S e /(-I) je estraým odhadem σ bez ohledu a velkost efektů α, α,..., α I, tedy I r S e s = ( y y ) I = ν.. (.9) I = ν = Dosadíme-l s do (.8) máme SA F =. (.30) ( I ) s Za platost hypotézy H A má velča F rozděleí F s I - a - I stup volost. Př testu H A vypočteme z expermetálích dat hodotu F podle (.30) a porováme je s krtckou hodotou F - α (I -, - I), která se pro daou hladu výzamost α a stupeň volost k = I -, k = - I aleze v tabulkách F-rozděleí. Vyjde-l F > F - α (I -, - I), hypotéza H A se zamítá. Začí to, že vlv faktoru A je statstcky výzamý. Rozklad celkového součtu čtverců S a dvě složky S A a S e a testové krterum se zapsují do tabulky aalýzy rozptylu (ANOVA table), vz tab..5. Tabulka.5: ANOVA Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum SA SA faktor A S A I - F = ( I ) ( I ) s opakováí pokusů S - (rezduálí) S e =S - S A - I s e = I celkem S - - - Příklad.5 Je třeba porovat hodový výko tří určtých strojů. Protože tyto stroje obsluhují ldé, a také vlvem dalších eodstratelých příč hodový výko těchto strojů začě kolísá. Bylo vybráo áhodě 5 růzých hod a zjštěý výko - 6 -

zazameá do tab..6. Otázka zí: Jsou stroje opravdu rozdílé? a ebo kolísáí výkou je je áhodé (statstcky evýzamé)? Tabulka.6 stroj stroj stroj 3 47 55 54 53 54 50 49 58 5 50 6 5 46 5 49 součty Y. =45 Y. =80 Y 3. =55 průměry y. =49 y. =56 y 3. =5 Řešeí: Stroje, a 3 s můžeme představt jako I = 3 úrově kvaltatvího faktoru A- stroje. Přtom r = r = r 3 = 5, takže = 5. 3 5 y ν = ν= Z výsledků měřeí y ν se spočítají jejch čtverce y ν a sečtou, tj. = 40784, Y.. = 780. Korekčí faktor: Y.. / = 780 / 5 = 40560. Celkový součet čtverců je tedy: S= 40784-40560 = 4,0. Pro výpočet S A ejprve staovíme: 3 Y. 45 80 55 03450 5 = + + = = 40690. = 5 5 Pak S A = 40690-40560 = 30, S e = S - S A = 4,0-30 = 94. Výsledky uspořádáme do tabulky ANOVA (tab..7). Tabulka.7 Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum faktor A(stroje) S A = 30 65 65 F = = 8, 98 783, rezduálí S e = 94 s = 7,83 - celkem S = 4 4 - - V tabulkách F-rozděleí alezeme hodotu F 0,95 (, ), pro hladu výzamost α=0,05, pro stupě volost k =, k = tedy máme F 0,95 (, ) = 3,885. - 7 -

Poěvadž vyšlo, že F = 8,98 > F 0,95 (, ) = 3,885, je vlv faktoru A statstcky výzamý. Začí to, že a výko strojů působí ějaký systematcký vlv (kolísáí výkou strojů eí áhodé). V příkladu.5 jsme uvedl tzv. vyvážeý expermet, tj. počet měřeí pro každou úroveň faktoru byl stejý. V dalším příkladu uvedeme výsledky evyvážeého expermetu. Bude z oblast zemědělství: zde poprvé R. A. FISHER aplkoval prcpy ANOVA. Příklad.6 Z deset pokusých pozemků, které jsou k dspozc, bylo a třech pozemcích použto hojva P a dosažeo výosů 8, 9, 3; a čtyřech pozemcích bylo použto hojva N a dosažeo výosů 0,, 4, 6 a koečě tř pozemky byly echáy bez hojeí a bylo dosažeo výosů 4, 6, 8. Je třeba ověřt, zda způsoby hojeí (ošetřeí půdy) ovlvňují výosy. Výsledky pokusů jsou uvedey v tab..8. Tabulka.8 způsob hojeí P N bez hojeí 8 0 4 výosy 9 6 3 4 8 6 součty Y. = 60 Y. = 9 Y 3. = 48 průměry y. = 0 y. = 3 y 3. = 6 Řešeí: Způsob hojeí je pro ás faktor A, má I = 3 úrově A... hojvo P; A... hojvo N; A 3... bez ošetřeí. Počet měřeí r = 3, r = 4, r 3 = 3, = 0. Hypotéza H A má sloví vyjádřeí: Způsob ošetřeí půdy emá vlv a výosy. Celkový součet všech měřeí Y.. = 60 + 9 + 48 = 00. Celkový součet čtverců všech měřeí 3 r y ν = ν= = 46. Korekčí faktor Y.. / 0 = 40000 / 0 = 4000. Je tedy S = 46-4000 = 6, S A = (60 / 3 + 9 / 4 + 48 / 3) - 4000 = 84, S e = 6-84 = 4. Z vypočteých hodot sestavíme tabulku ANOVA (tab..9) - 8 -

Tabulka.9 Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum faktor A S A = 84 4 4 F = = 7 6 (způsob ošetřeí) rezduálí S e = 6-84 = 4 7 s = 6 - celkem S = 6 9 - - V tabulkách F-rozděleí alezeme pro α = 0,05 a stupě volost k =, k = 7 krtckou hodotu F 0,95 (, 7) = 4,74. Poěvadž vyšlo, že F = 7 > F 0,95 (, 7) = 4,74, zamítáme hypotézu H A a tvrdíme, že způsob ošetřeí půdy výzamě ovlvňuje výosy. Mohoásobé porováváí: Zatímco přjetím hypotézy o rovost efektů hlad faktoru A test kočí, př jejím zamítutí (příklady.5,.6) s obvykle klademe další otázku, totž mez kterým efekty (středím hodotam) lze prokázat rozdíly, a jaká je tedy struktura ehomogety středích hodot. Chceme ověřt rovost středích hodot µ =µ j pro všechy dvojce, j =,,...,I ; j. Teto problém řeší metody mohoásobých pozorováí.. Velm často používaá je Schefféova metoda. Příklad.7 Tato metoda zamítá hypotézu µ = µ j u těch dvojc (,j), pro které x xj ( I ) s F α ( I, I)( + ). (.3) V příkladu.5 byla prokázáa rozdílost hodových výkoů tří strojů. Máme zjstt, které rozdíly mez hodovým výkoy strojů se statstcky výzamě lší. Z tab..6 zjstíme, že výběrové průměry hodových výkoů strojů jsou x = 49 x = 56 x 3 = 5. Staovíme absolutí hodoty rozdílů průměrů x x a příslušé krtcké hodoty ( I ) s F α ( I, I)( + ) = * 7, 83* F 095(, )( ), * 7, 83* 3, 885( + ) = 60, 865( ) j j +. j j j + = Hodotu s jsme získal z tabulky ANOVA (tab..7). V tab..0 jsou uvedey rozdíly středích hodot a krtcké hodoty. j - 9 -

Tabulka.0 Porovávaé dvojce Rozdíly mez průměry x x j Krtcká hodota, 7 4,934 *,3 4,934,3 5 4,934 * Poěvadž počet měřeí pro každou úroveň faktoru A je rove 5, výpočet krtcké hodoty se zjedoduší: 60 865, ( + ) = 60, 865* 0, 4 = 4, 346 =4,934. 5 5 Z testu vyplyulo, že krtcká hodota je překročea u dvojc (,) a (,3), a druhé straě u dvojce (,3) je pozorovaý rozdíl pod krtckou hodotou a evybočuje z mezí áhodost. Učíme tedy závěr, že z hledska hodového výkou se výzamě lší stroj od strojů a 3. V případě volby preferujeme stroj..3. Expermety se dvěma faktory Uvažujeme expermet, v ěmž je zkoumá vlv dvou faktorů A B, přčemž faktor A je vyšetřová a I úrovích, faktor B a J úrovích (takovému expermetu říkáme faktorálí expermet typu I x J). Uvažujme pro každou kombac úroví A B j r pokusů. Ozačme y jν výsledek ν-tého pokusu a úrov faktorů A a B j, =,,..., I; j =,,..., J; ν =,,..., r. Uvažujme tedy případ, kdy počet měřeí pro každou kombac úroví faktorů je stejý (jde o vyvážeý expermet). Tyto výsledky představují hodoty, jchž abyly áhodé velčy, které lze vyjádřt ve tvaru y jν = η j + e jν = µ + α + β + (αβ) j + e jν, (.3) kde η j jsou teoretcké výsledky pro kombace A B j, e jν - áhodé chyby. Platí vztahy: I α J = j= J = βj = 0, ( αβ) j = 0, pro =,,..., I. j= Předpokládáme, že e jν jsou ezávslé áhodé velčy, každá s rozděleí N(0, σ ). Celkový počet pokusů = Ijr. Kromě hypotézy H A : α = 0, =,,..., I, H B : β j = 0,j =,,..., J, chceme provést test exstece terakce faktorů A a B: H AB : (αβ) j = 0, =,,..., I, j =,,..., J. Iterakc dvou faktorů A, B azveme dvojou terakcí a začíme j AB. Iterakce, řečeo zjedodušeě, začí současé působeí obou faktorů A a B a sledovaý zak. - 30 -

Uvažujeme-l vyvážeý expermet, je celkový součet čtverců rove.). I J ( jν...) S = y y = j= r ν =. (.33) Te se dá rozložt a čtyř složky, tak, jak to ukazuje tabulka ANOVA (tab. Pro test hypotézy H A, H B, H AB se použje opět krtérí F, která jsou v posledím sloupc tab... Pro test hlavího efektu A použjeme jako testovacího krtera velčy F A = S A / [(I - )s ], která má v případě platost H A rozděleí F - α (I -, IJ(r - )). Pro test hlavího efektu faktoru B použjeme velčy F B =S B / [(J-)s ],které má v případě platost H B rozděleí F - α (J -, IJ(r - )). SAB Pro test exstece terakce AB využjeme velčy F =, která má ( I )( J ) s v případě platost H AB rozděleí F - α = ((I - ).(J - ), IJ(r - )). Tabulka. Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum faktor A S A I - SA SA FA = ( I ) ( I ) s faktor B S B J - S B SB FB = ( J ) ( J ) s terakce AB S AB (I - )(J - ) SAB SAB FAB = ( I )( J ) ( I )( J ) s rezduálí S - e S e IJ(r - ) s = IJ( r ) celkem S IJr - - - V tabulce. máme S S A I J = y = j= r ν = I Y... = Y.. Jr IJr = jν, Y... IJr, Velča Y... IJr S S } J Y... = Y.. j, (.34) Ir IJr B = I J r I J e = y jν Y j., = j= ν = r = j= S AB = S - ( S A + S B + S e ). je tzv. korekčí faktor. - 3 -

Se Náhodá velča s = je estraým odhadem rozptylu σ bez ohledu a to, IJ( r ) zda hlaví efekty A, B a terakce AB exstují, č kolv. Vyjdou-l hodoty F-krterí větší, ež příslušé tabulkové hodoty F- rozděleí, příslušé hypotézy (H A, H B, H AB ) se zamítají. Příklad.8 Byl prošetřová vlv osvětleí (faktor A) a hlučost (faktor B) a rychlost zázamu vstupích dat a dskety ve výpočetím středsku. Faktor A měl tř úrově: A... přímé deí světlo, A... osvětleí stolí lampou, A 3... stropí osvětleí. Faktor B měl tř úrově: B... absolutí tcho, B... hluk z ulce, B 3... hlastá reprodukce hudby (řev chulgáů). Bylo áhodě vybráo 8 pracovc výpočetího středska a každá z ch ezávsle a ostatích prováděla zázam 500 hodot a dsketu (sezam vstupích dat byl stejý pro všechy vybraé pracovce výpočetího cetra). Pracovce byly áhodě rozděley mez kombace úroví sledovaých faktorů tak, že každá kombace byla přdělea vždy dvěma z ch. Čas v mutách y jν, =,, 3; j =,, 3; ν =, spotřebovaý k zázamu 500 hodot a dsketu je uvede v ásledující tabulce (tab..). Tabulka. A B B B B 3 Součty A 3 4 5 3 4 6 Y.. =5 Y. =7 Y. =8 Y 3. =0 A 3 3 5 5 5 Y.. = Y. =4 Y. =8 Y 3. =0 Řešeí: 3 = A 3 4 6 5 5 4 Y 3.. =6 Y 3. =6 Y 3. = Y 33. =9 Součty Y.. =7 Y.. =7 Y.3. =9 Y... =73 3 y j ν j= ν = = 37, = 8. Korekčí faktor Y... 8 = 73 / 8 = 96,0555. S = 37-96,0555 = 30,9445, S A = /6 ( 5 + + 6 ) - 96,0555 =,445, S B = /6 ( 7 + 7 + 9 ) - 96,0555 = 3,7778, S e = 37 - / ( 7 + 8 + 0 +... + + 9 ) = 37-30,5 =,5, - 3 -

S AB = 30,9445 -,4445-3,7778 -,5 = 4,. Z vypočteých údajů sestavíme tabulky aalýzy rozptylu (tab..3). Tabulka.3 - ANOVA table- Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum faktor A S A =,4445 0,7 F A = 0,565 faktor B S B = 3,7778 6,8889 F B = 5,39 * terakce AB S AB = 4, 4,0556 F AB = 0,86 rezduálí S e =,5 9 s =,778 - celkem S = 30,9445 7 - - Tabulkové hodoty F- rozděleí: Pro F A... F 0,95 (, 9) = 4,6, F B... F 0,95 (, 9) = 4,6, F AB... F 0,95 (4, 9) = 3,63. Celkem: Rychlost zázamu dat a dskety závsí výzamě a hlučost (faktor B), zatímco rozdíly mez úrověm osvětleí (faktor A), jakož terakce jsou statstcky evýzamé. Případ s jedím opakováím pozorováí: Uvažujeme případ, kdy r =. V této stuac elze hodott terakc AB, případá terakce se započítává do rezduálí složky S e. Výpočty jedotlvých složek S A, S B, S e a S se zjedoduší, máme I J Y S = y.. j, IJ = j= S S A B } I Y.. = Y., (.35) J IJ = J Y.. = Y. j, I IJ j= Velča Y.. IJ S e = S - S A - S B. je tzv. korekčí faktor. Bez ohledu a efekty faktorů A a B, je rezduálí rozptyl S e /[(I - )(J - )] = s estraým odhadem teoretckého rozptylu σ. Testováí hypotéz o vlvu faktoru A (resp. B) je obdobé jako pro předešlý případ (pro r ). Pouze eprovádíme test výzamost terakce. Testovací krtera pro jedotlvé faktory mají tvar: - 33 -

F S A A =, ( I ) s F S B B =. ( J ) s Krtcké hodoty - pro faktor A... F - α (I -, (I - )(J - )), - pro faktor B... F - α (J -,(I- )(J - )). Vyjdou-l testová krtera vyšší ež příslušé krtcké hodoty, považujeme vlvy faktorů za statstcky výzamé (a příslušé hladě výzamost α). Tabulka aalýzy rozptylu pro teto případ má tvar (tab..4): Tabulka.4 Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum faktor A S A I- SA SA FA = ( I ) ( I ) s faktor B S B J- S B SB FB = J ( J ) s rezduálí S e (I - )( J- ) S e s = ( I )( J ) - celkem S IJ - - - Příklad.9 Př odvozu materálu a skládku lze jet třem růzým trasam A, A, A 3 (faktor A) a použít dva typy vozdel B, B (faktor B). Chceme učt závěr o vlvu trasy a typu vozdel a spotřebu pohoých hmot. Bylo vybráo po třech vozdlech obou typů a těm přděley áhodě trasy. Změřeá spotřeba pohoých hmot a ěkteré výpočty jsou uvedey v ásledující tabulce. (tab..5). Tabulka.5 Trasa Typ vozdla (faktor B) Součty (faktor A) B B A 3 4 Y. = 7 A 3 Y. = 4 A 3 8 Y 3. = 39 Součty Y. = 4 Y. = 48 Y.. = 90 3 = 6, y j = 40. Korekčí faktor Y.. / 6 = 90 / 6 = 350. = j= S = 40-350 = 70, S A = / ( 7 + 4 + 39 ) - 350 = 63, S B = /3 (4 + 48 ) - 350 = 6, S e = 70-63 - 6 =. Testovací krtera: F A = 3,5 / 0,5 = 63,0, F B = 6,0 / 0,5 =,0. Z těchto údajů sestrojíme tabulku aalýzy rozptylu (tab..6). - 34 -

Tabulka.6 Zdroj mělvost Součet čtverců Stupě volost Středí čtverec F-krterum 63 3,5 63,0 * faktor A 6 6,0,0 faktor B s = 0,5 - rezduálí celkem 70 5 - - Krtcké hodoty: a) faktor A... F 0,95 (, ) = 9,0 b) faktor B... F 0,95 (, ) = 8,5 Výsledek: F A = 63 > F 0,95 (, ) =9,0, F B = < F 0,95 (, ) = 8,5. Spotřeba pohoých hmot výzamě závsí a volbě trasy (faktor A). Vlv typu vozdla a spotřebu pohoých hmot (faktor B) ebyl prokázá..3.3 Aalýza rozptylu kvaltatvích zaků V socologckých průzkumech často převažují kvaltatví zaky, ať jž omálí č ordálí. I pro takové případy byla vypracováa metodka aalýzy rozptylu, jejíž prcpy jsou v podstatě shodé s tím, co bylo řečeo o aalýze zaků kvattatvích (měřtelých). Uvedeme tedy je základí vztahy, z chž teto typ aalýzy vychází, a osvětlíme jejch použtí a příkladech. ANOVA pro jede faktor: Rozptyl kvaltatvího zaku je dá výrazem σ =.p.q, (.36) kde je počet pozorováí, p je podíl jedotek, jež mají sledovaý zak A, q =- p je podíl jedotek z celkového počtu pozorováí, které teto zak emají. Relatví četost p = m /, kde m je počet jedotek, jež mají zak A a je celkový počet pozorováí. Zřejmě platí pro ty jedotky, které zak A emají ( - m), a pak tedy q = ( - m) / = - p. Lze tedy psát σ = m m ( ) = m m. (.37) Podobě jako u zaků kvattatvích je možo zde celkový rozptyl σ rozdělt do dvou složek, totž σ A, tj. rozptyl vzkající působeím růzých úroví sledovaého faktoru, a σ e -rozptyl rezduálí vyvolaý ostatím, esledovaým vlvy: σ = σ A + σ e. (.38) - 35 -

Celkový součet čtverců odchylek S rozdělujeme aalogcky do dvou kvadratckých složek S A, přřadtelou jedotlvým úrovím faktoru A, a S e, rezduálí. Z ch se pak spočítají příslušé rozptyly. Sledujeme působeí růzých úroví jedého faktoru A rozděleého do k stupňů (hlad, úroví), kde počty pozorováí budou ( =,,...,k) a počty pozorováí obsahujících zak A a příslušé úrov - m. Celkový součet čtverců odchylek je S k ( m) = = m k = k = Kvadratcká složka přřadtelá působeí faktoru je S A k ( m ) m = = k = k =. (.39), (.40) kvadratcká složka rezduálí bude k k m Se = m. (.4) = = Výsledky pozorováí a potřebé výpočty obvykle sestavujeme do tabulky (tab..7a). Tabulka.7a Faktor A úrově ( ) 3... k počet pozorováí 3... k N = celkový počet prvků se m m m 3... m k M = m zakem A m m m m 3... m k - m / m / m / m 3 / 3... m k / k m / p = m / p = m / p = m / p 3 = m 3 / 3... p k = m k / k - Tabulka aalýzy rozptylu: Tabulka.7b Zdroj Součet čtverců Vlv [%] (π) Stupě volost Středí čtverec mělvost Faktor A S A π A = S A / S k - σ A = S A / (k - ) rezduálí S e π e = S e / S N - k σ e = S e / (N - k) celkem S π =,000 N - - Posouzeí výzamost vlvu faktoru A se provede F-testem. Testovací charakterstka F = σ A / σ e. - 36 -