Aktivita 1 Seminář základů statistiky a workshop (Prof. Ing. Milan Palát, CSc., Ing. Kristina Somerlíková, Ph.D.)



Podobné dokumenty
- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Metody zkoumání závislosti numerických proměnných

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

Odhady a testy hypotéz o regresních přímkách

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Testy statistických hypotéz

1. Základy měření neelektrických veličin

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

} kvantitativní znaky

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

C V I Č E N Í 4 1. Představení firmy Splintex Czech 2. Vlastnosti skla a skloviny 3. Aditivita 4. Příklady výpočtů

Fakulta elektrotechniky a informatiky Statistika STATISTIKA

ZÁKLADY STAVEBNÍ MECHANIKY

Spojité (kontinuální) - nap. podle vykázaného zisku, tržeb, náklad Nespojité (diskrétní) - nap. podle potu len v rodin

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

APLIKACE REGRESNÍ ANALÝZY NA VÝPOČET BODU ZVRATU

Statistické charakteristiky (míry)

17. Statistické hypotézy parametrické testy

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

PRAVDĚPODOBNOST A STATISTIKA

2 EXPLORATORNÍ ANALÝZA

Doc. Ing. Dagmar Blatná, CSc.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Interval spolehlivosti pro podíl

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Statistické metody ve veřejné správě ŘEŠENÉ PŘÍKLADY

Momenty a momentové charakteristiky

Mendelova univerzita v Brně Statistika projekt

Statistika - vícerozměrné metody

, jsou naměřené a vypočtené hodnoty závisle

Cvičení z termomechaniky Cvičení 5.

VÁŽENÝ ARITMETICKÝ PRŮMĚR S REÁLNÝMI VAHAMI

3. cvičení 4ST201 - řešení

HYPOTEČNÍ ÚVĚR. , kde v = je diskontní faktor, Dl počáteční výše úvěru, a anuita, i roční úroková sazba v procentech vyjádřená desetinným číslem.

Charakteristiky úrovně

Úvod do zpracování měření

Testování statistických hypotéz

3. cvičení 4ST201. Míry variability

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

PŘÍKLAD NA VÁŽENÝ ARITMETICKÝ PRŮMĚR Z INTERVALOVÉHO ROZDĚLENÍ ČETNOSTI

SP2 Korelační analýza. Korelační analýza. Libor Žák

FLUORIMETRIE. Jan Fähnrich. Obecné základy

Univerzita Pardubice. Fakulta ekonomicko-správní

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Univerzita Karlova v Praze Pedagogická fakulta

[ jednotky ] Chyby měření

cenný papír, jehož koupí si investor zajistí předem definované peněžní toky, které obdrží v budoucnosti

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Soustava kapalina + tuhá látka Izobarický fázový diagram pro soustavu obsahující vodu a chlorid sodný

9. Měření závislostí ve statistice Pevná a volná závislost

Lineární regrese ( ) 2

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Univerzita Pardubice Fakulta ekonomicko-správní

Téma 4: Výběrová šetření

Stavíme reproduktorové

Jednoduchá lineární závislost

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

elektrické filtry Jiří Petržela základní pojmy

1 3VYSOK KOLA EKONOMICK 0 9 V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravd їpodobnosti STATISTIKA VZORCE PRO 4ST201

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

OPTIMÁLNÍ FILTRACE METALURGICKÝCH SIGNÁLŮ POMOCÍ INFORMAČNÍCH KRITÉRIÍ

Nejistoty v mìøení III: nejistoty nepøímých mìøení

sin n sin n 1 n 2 Obr. 1: K zákonu lomu

IV. NEJISTOTY MENÍ A ZPRACOVÁNÍ VÝSLEDK

Měřící technika - MT úvod

u, v, w nazýváme číslo u.( v w). Chyba! Chybné propojení.,

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Chyby přímých měření. Úvod

Testování statistických hypotéz

Statistické zpracování dat

11. Časové řady Pojem a klasifikace časových řad

Univerzita Karlova v Praze Pedagogická fakulta

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Test hypotézy o parametru π alternativního rozdělení příklad

P1: Úvod do experimentálních metod

FINANČNÍ MATEMATIKA SBÍRKA ÚLOH

Spolehlivost a diagnostika

z možností, jak tuto veličinu charakterizovat, je určit součet

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

a) Hypotézy o parametru jedné populace (o stední hodnot, mediánu, rozptylu, relativní

Pravděpodobnost a aplikovaná statistika

1. Základy počtu pravděpodobnosti:

12. N á h o d n ý v ý b ě r

Závislost slovních znaků

Úvod do lineárního programování

MATEMATIKA PŘÍKLADY K PŘÍJÍMACÍM ZKOUŠKÁM BAKALÁŘSKÉ STUDIUM MGR. RADMILA STOKLASOVÁ, PH.D.

,6 32, ,6 29,7 29,2 35,9 32,6 34,7 35,3

Transkript:

Aktvta Semář základů tattky a workhop (Prof. Ig. Mla Palát, CSc., Ig. Krta Somerlíková, Ph.D.) Stattcké tříděí Základí metoda tattckého zpracováí. Sekupováí hodot proměé, které jou z hledka klafkačího zaku tejé ebo podobé. Zároveň e uvádí četot. Zaky rozlšujeme - tříděé (uvaretí ebo multvaretí) - třídící (kvaltatví ebo kvattatví) Tříděí: Proté podle jedoho třídícího zaku Víceáobé podle ěkolka zaků Třídící zaky: - Čaové (podle doby relevatí událot) - Protorové (podle míta) - Věcé (podle popého tavu ebo typu epermetálího ošetřeí) - Dvojé (podle pohlaví, vakcace, březot, zdravotího tavu) - Možé (podle varety, druhu, plemee) Spojté (kotuálí) - apř. podle vykázaého zku, tržeb, ákladů Nepojté (dkrétí) - apř. podle počtu čleů v rodě Varačí řady - rozděleí četotí (u epojtých proměých) - tervalové rozděleí četotí (u pojtých proměých) Výzam tříděí - lepší orgazace dat, pozáí truktury - výpočet artmet. průměru, populačích parametrů - metody GOF (goode of ft) Varačí rozpětí (R) - rozdíl mez mamálí a mmálí hodotou. Varačí třídy - djuktí tervaly a číelé oe, uvtř tervalů erozlšujeme hodoty, ztrácíme čát formací, ale zíkáme a přehledot. Většou pracujeme 6-5 třídam. Třídy muí být tejě šroké. Pravdlo pro počet tervalů: < 00 k 5-9 tervalů 00 < < 500 k 0-5 tervalů > 500 k +3,3 * log Hrace a tředy tříd by měla být vhodá číla. Každou třídu reprezetuje její fyzcký třed (e průměr hodot!), Úhr třídy je pak rove a ahrazuje přeou hodotu oučtu všech hodot třídy.

Příprava tabulky četotí Četot - počet pozorováí v ouboru, třídě Abolutí četot ( ) - fyzcký počet pozorováí výběrového ouboru zařazeých do třídy Kumulatví (oučtová) četot (k ) - oučet všech abolutích četotí předcházejících daé abolutích četotí. Relatví četot ( p ) - podíl abolutí četot k celkovému počtu hodot ouboru Relatví četot vyjadřujeme v pravděpodobotech ebo v procetech. Kumulatví relatví četot - oučtová relatví četot (kp ) Kumulatví četot jou vyjádřtelé acedetím ebo decedetím způobem. Základí varačí charaktertky tattckého ouboru.. Lokačí míry (obecé polohy) -> tředí hodoty. Míry promělvot (varablty) -> varačí míry 3. Míry škmot (ymetre) -> míry ouměrot 4. Míry kocetrace (špčatot) ->míry špčatot. Měřeí obecé úrově. Středí hodoty a.) Průměry Artmetcký Geometrcký Harmocký Kvadratcký Chroologcký G H Q CH b.) Otatí tředí hodoty Medá ~ Modu ^ Průměry jou charaktertky obecé polohy a jou fukcem všech hodot v ouboru. Artmetcký průměr ( ) Protá výpočtová forma: Vážeá forma: k *,

Kde k redukuje a. Jou-l abolutí četot ahrazey relatvím četotm, vážeá forma e k k * p p Vážeá forma e aplkuje a tříděá data (rozděleí četotí ebo tervalové rozděleí četotí), u dat, kde jou zámy parcálí průměry. Protá forma e používá u meších etříděých ouborů. Vlatot artmetckého průměru:. Součet abolutích odchylek jedotlvých hodot ouboru je rove ule. ( -) 0. Součet čtverců odchylek je mmálí. ( -) M, tj. ( -) < ( -c)," c ¹ 3. Artmetcký průměr kotaty je rove kotatě 4. Průměr oučtů (rozdílů) dvou proměých je rove oučtu (rozdílu) jejch artmet. průměrů. 5. U vážeé formy, jou-l všechy četot áobey (děley) tejou kotatou, průměr e eměí. 6. Je-l ke každé hodotě přčtea (odečtea) určtá kotata, o tuto kotatu e zvýší (íží) artmetcký průměr. 7. Je-l každá hodota ouboru áobea (dělea) určtou kotatou c, bude artmetcký průměr c-krát větší (meší). Harmocký průměr ( ) Převráceá hodota oučtu převráceých hodot zkoumaého zaku. Používá e př průměrováí eprímo vyjádřeých velč jako rychlot, výoy, výkoy atd. Protá forma: H Geometrcký průměr ( G ) -tá odmoca ze ouču hodot. Vážeá forma: H k k Protá forma výpočtu: G * *... * Õ 3

V logartmckém tvaru: log log G Vážeá forma výpočtu: V logartmckém tvaru: log G G * *...* *log k k k Õ Používá e př aalýze bezrozměrých deů zřetězeých v čae. Medá ( ~ ) Protředí hodota etříděé řady hodot ouboru. Jedá e o 50, tedy 50% kvatl. Předtavuje hodotu, která rozdělí etříděý oubor a dvě tejé čát, co do počtu hodot. 50% hodot je meších ež medá a 50% je větších ež medá. Př lchém počtu hodot je protředí hodota medá. Př udém počtu hodot je medáem průměr dvou protředích hodot etříděého ouboru. Modu ( ^ ) Je hodota ouboru ejvyšší četotí. U ymetrckého ormálího rozděleí je U levotraě eouměrého rozděleí je U pravotraě eouměrého rozděleí je Míry promělvot ~ < ~ < < ~ < A. Varačí rozpětí R Y ma - Y m B. Kvatlové (kvartlové) odchylky Mez-kvartlové rozpětí(iqr): IQR 75-5 Kvartlová odchylka : Q IQR / C. Průměré odchylky abolutí a relatví Vypočítávají e průměré odchylky buďto od průměru ebo od medáu. Průměrá abolutí odchylka: Protý tvar: d / d/ / -/ 4

5 Vážeý tvar: - k k k k d d /* / /* / Relatví průměrá odchylka: Vyjádřtelá v % z artmetckého průměru. *00 d d D. Rozptyl a měrodatá odchylka Protá forma (evychýleá): ) ( - -, - -, / ) ( - - Vážeá forma: * ) ( - - k Vlatot rozptylu: Je ezáporý. Je ejmeší průměrou čtvercovou odchylkou. Změou hodot o kotatu e rozptyl eměí. Náobeím (děleím) všech hodot kotatou k e rozptyl zvětší (zmeší) k-krát. Rozptyl oučtu (rozdílu) dvou proměých je rove oučtu (rozdílu) jejch rozptylů plu (mu) dvojáobek jejch kovarace. y y y * ) ( ± + ± Celkový rozptyl z dílčích ouborů je rove průměru dílčích rozptylů a rozptylu dílčích průměrů. + Směrodatá odchylka: Je uvedea ve tejých jedotkách jako aměřeé hodoty.

E. Varačí koefcet v *00[%] Používá e př porováváí varablty jedoho zaku v růzých ouborech ebo růzých zaků v jedom ouboru. Míry eouměrot (škmot). Pearoova míra škmot: t - ^, popř. 3( - ~ ) t, záporé hodoty dkují pravotraou eouměrot.. Koefcet eouměrot - aymetre(a 3 ): a ( - 3 3 ) 3 Míry špčatot (kocetrace, kartéze):. Koefcet špčatot (a 4 ): 4 a 4 ( - ) -3 4 Kladá hodota dkuje špčatější rozděleí oprot ormálímu rozděleí. Záporá hodota zameá podormálí špčatot (plochot) rozděleí. 3 Jedoduchá leárí regree a korelace Cílem je zkoumáí příčé závlot mez dvěma, č více proměým. Regreí úloha: počívá v alezeí rovce regreí fukce, která vhodě popuje typ a průběh závlot y f(). Podle typu fukce regreí závlot dělíme a leárí ebo eleárí. Podle počtu proměých a regre jedoduchou ebo víceáobou. 6

Modelová rovce jedoduché regreí úlohy je: Y a + b* + e, Kde Y je závle proměá (odezva) a je protý čle (tercept) b je regreí koefcet b y X je ezávle proměá (regreor) E je reduálí odchylka Př oboutraé závlot jou možé dvě regreí přímky: Y a y + b y * X a y + b y *y a y, b y, a y, b y jou ezámé koefcety, jejchž hodotu zíkáme řešeím outavy tzv. ormálích rovc.,y jou emprcké(kutečé hodoty závle proměé.,y jou teoretcké hodoty závle proměé vypočteé z regreí rovce. Hodoty potřebé pro výpočet regreích hodot: Součty čtverců odchylek od průměru: S yy ( y -y)( y -y) ( y -y) S ( -)( -) ( -) S y ( y -y)*( -) Základí forma regreího koefcetu je pak: b y S S y b y S S y yy Forma I. b y ( -)*( y ( -) -y) b y ( -)*( y ( y -y) -y) 7

Forma II. b y y -y - b y y y -y -y Forma III. b y -/ * y -/ *( * ) y b y y -/ * y -/ *( * y) y Abolutí čle je pak: a y-b a -b y y y* INTERPRETACE: y y* Regreí koefcet b y udává jedotkovou změu závle proměé (y), když e ezávle proměá () změí o jedotku. Abolutí čle (tercept) a y udává hodotu teoretcké proměé y, je-l hodota regreoru rova ule. Vlatot metody LS (ejmeší čtverce): ( y - ( y / y / -y ) 0, uma odchylek emprckých a teoretckých hodot rovy ule ) 0, uma odchylek teoretckých hodot a průměru rovy ule ( y -y) 0, uma odchylek emprckých hodot a průměru rovy ule ( y - / y ) m, uma čtverců odchylek emprckých a teoretckých hodot je mmálí Koefcet korelace (r). Je bezrozměrá velča v tervalu < r > +. Zamékem e muí hodovat oběma regreím koefcety. Kladá hodota zameá kladou, poztví závlot. Záporá hodota zameá záporou, egatví závlot. r 0 zameá leárí ezávlot. /r/ zameá pevou fukčí závlot. 8

Abolutí hodota r Těot závlot Typ závlot 0 Nulová Nezávlot 0,0-0,3 Nízká 0,3-0,5 Mírá 0,5-0,7 Výzačá Volá závlot 0,7-0,9 Velká 0,9-0,99 Velm vyoká,0 Pevá fukčí Pevá závlot Výpočet: r ± b y * b y geometrcký průměr obou regreích koefcetů, kde zaméko odpovídá zaméku regreího koefcetu úpravou vztahu lze zíkat výrazy pro výpočet koefcetů regree: y r b y r, by, b y r, b b y y y r b kde hodoty měrodatých odchylek e počítají vychýleým způobem. Obecě korelačí koefcet dotaeme: covy r var *var y y výpočtové tvary: r æ ç è í y - -y öæ ç øè y -y ö ø y -y y S S y * S yy ebo r - y -y * ( -)( y y -y) ebo / var( y ) r, kde var(y ) je varace teoretckých hodot a var(y) je varace emprckých var( y) hodot závle proměé. 9

4 Náhodá velča, rozděleí pravděpodobot Náhodá velča lbovolá kvattatví charaktertka áhodého pokuu proměá abývající hodot v závlot a áhodě hodota je tedy jedozačě určea výledkem áhodého pokuu, kterou je číelá hodota - realzace áhodé velčy X) pro áhodou velču e užívá ozačeí X, X, X 3, Y, Z, pro hodoty realzace pak,, 3, y, z apod. Základí druhy áhodé velčy: epojtá (dkrétí) alteratví rozděleí, Bomcké rozděleí, Pooovo rozděleí, Hypergeometrcké pojtá ormálí (Gauovo) rozděleí, rozděleí c, t, F (Fher- Sedecorovo) Záko rozděleí pravděpodobot pravdlo, podle kterého jou jedotlvým možým hodotám áhodé velčy X přřazey jejch pravděpodobot. způoby vyjádřeí zákoa rozděleí pravděpodobotí - vzorcem, tabulkou, grafcky Základím protředkem vyjádřeí zákoa rozděleí áhodé velčy X je dtrbučí fukce F()P(X ) Vlatot dtrbučí fukce: 0 F() P( < X < ) F( ) - F( ) Dtrbučí fukce je ekleající, tj. pro všecha < platí, že F( ) F( ) Dtrbučí fukce je pojtá zprava F(- ) 0, F( ) 0,8 Dtrbučí fukce F() 0,6 0,4 0, 0 3 0

Kvatly 00 a% kvatl a pojté áhodé velčy X azýváme hodotu, pro kterou platí F( a ) a je-l a0,05 5 % kvatl a0,95 95 % kvatl Kvatly umožňují kotruovat takové tervaly, do chž padá hodota áhodé velčy e zvoleou pravděpodobotí. apř. 0,05,8 0,95 5,94 pak P(,8 < X < 5.94) 0,90 POZN. Pro praktckou prác jou kvatly důležtých pravděpodobotích rozděleí tabelováy Stattky Základí používaé tattky artmetcký průměr X, jehož realzace je rozptyl rep. měrodatá odchylka - tvary (výběrový a základího ouboru) S ( X - X ) S X - X - ( ) - 5 Teore odhadu Bodový odhad je odhad a základě jedoho číla odhadem charaktertky č parametru základího ouboru Q je výběrová charaktertka č parametr T (obvykle je vole tzv. výběrový protějšek) výběrová charaktertka pak m r r b y b y charaktertka zákl. ouboru odhad R¾ ¾¾ Q

Bodový odhad má plňovat: etraot - tj. odhad tředí hodoty charaktertky výběrového ouboru je rove odhadovaé charaktertce základího ouboru E(T) Q koztece - vzrůtající rozah výběru žuje výběrovou chybu lm P( T- Q < e) vydatot - takový odhad, který má z charaktertk přcházejících v úvahu ejmeší rozptyl D(T)<D(T + ) kde T - výběrová charaktertka plňující vydatot odhadu T + - jakákol já výběrová charaktertka Vydatot lze měřt mírou vydatot e(t + ): + D( T) e( T ) 0<e(T + )< + D( T ) Lze uvét: + lm e( T ) Itervalový odhad odhadem charaktertky č parametru základího ouboru e rozumí taoveí tervalu, v ěmž e odhadovaá charaktertka č parametr achází Pro 00(-a) procetí terval polehlvot charaktertky Q platí: P( T / Q T // ) -a kde T / - dolí hrace tervalu T // - horí hrace tervalu hodoty a jou rzka odhadu

za a e obvykle volí a0,05 ebo a0,0 (95% rep. 99% terval polehlvot) tervaly polehlvot e ozačují též termíem kofdečí tervaly př taoveí tervalů polehlvot e čato využívá ormálí apromace. Vychází e z ormovaé velčy ormálího rozděleí výběrové charaktertky U T - E ( T ) T-Q U X -m D( T) D( T) Dtrbučí fukce ormovaého ormálího rozděleí je tabelováa pro růzé hodoty u Itervaly polehlvot mohou být jedotraé ebo oboutraé Oboutraý terval polehlvot Q: P( - u U u) P( - u T-Q D( T) u) [- ( ) - Q ( )] [ - ( ) Q + ( )] P u DT T u DT PT u DT T u DT takže platí: é ù PêT- u D( T) Q T+ u D( T) ú - - - ë û a a a 3

Jedotraé tervaly polehlvot charaktertky Q pak: levotraý terval [ -a ( ) Q ] P T- u D T -a pravotraý terval [ -a ( )] PQ T+ u D T -a 4

D - příputá chyba áobek ormovaé velčy ormálího č Studetova rozděleí a tředí chyby D u D T a ( ) D - u a - Staoveí mmálího rozahu výběru: ³ ³ t a - D př rozahu výběru >30 lze ezámý parametr bez problémů ahradt jeho bodovým odhadem - měrodatou odchylkou S - (ahrazeí ormálím rozděleím) u a - D př rozahu výběru <30 je př ezámém parametru uto použít vztah - - P( X - t a m X + t a ) -a - - kde t -a/ je kvatl Studetova rozděleí pro - tupňů volot Grafcké taoveí mmálího rozahu výběru - je polehlvější Iterval polehlvot artmetckého průměru Oboutraý terval P( - u m + u ) -a kde a a - -, popř. - 5

Levotraý P( - u -a m) -a Pravotraý P( m + u - ) -a a Iterval polehlvot rozptylu využtím c rozděleí é P ê( - ) ( - ) ê ê c a c a - ë ù ú ú ú û -a Iterval polehlvot relatvích a abolutích četotí relatví četot P( p - t P p + t ) - p p a - a - a kde: p ( - p ) p abolutí četot [ ( p ) ( p )] P N p - t N N p + t - a - a - a Itervalový odhad charaktertk korelace a regree Závlot podle tupě závlot - pevá, volá podle druhu zaků - korelačí, aocačí, kotgečí Druhy korelačí závlot podle počtu kvattatvích zaků - jedoduchá, víceáobá podle typu regreí fukce - leárí, eleárí podle změ - poztví, egatví 6

korelačí koefcet výběrový koefcet korelace r eodpovídá krtérím bodového odhadu, proto: r Fherova _ traformace ¾ ¾¾¾¾¾¾ z r + l - r r (tabelováo) P( z - u z + u ) -a r a zr r a zr - - kde zr - 3 ale pro r < 0,5 a > 00 platí: P( r- u r r+ u ) -a a r a r - - kde -r r -k- regreí koefcet b, popř. b y Přímka může být zapáa buď ve tvaru: y a y + b y ebo y b 0 + b. Potom pro tervaly polehlvot platí: Pb ( - t b b + t ) -a a b a b - - kde b e ( -) popř. b y -r -k- 7

Abolutí čle b o, popř. a y Pb ( - t b b + t ) -a kde 0 a b 0 0 a b - - b0 e + ( - ) 0 0 e je rezduálí měrodatá odchylka ( y-y ' ) - regreí přímka y a y + b y popř. y b 0 + b. / / / P( y - t y y + t ) - / y j / a - a - a y kde y' e + ( -) ( -) popř. + / y y y a y ( -) Nejpřeější je odhad v blízkot artmetckého průměru, terval polehlvot je v tomto mítě ejužší. Pozámka: Pro >30 lze t rozděleí apromovat ormálím pá polehlvot kolem regreí fukce Hodoty závle proměé kokrétího tattckého zaku jou rozptýley kolem regreí fukce. Teto pá, ve kterém e tyto kutečé hodoty acházejí, lze taovt e zvoleou pravděpodobotí. 8

Pá polehlvot kolem regreí přímky / P ( y ± t ) -a y a y ( H, D) - kde y je měrodatá (tadardí) chyba y / / ( y -y) ( y) - y y -k- -k- k - počet parametrů regreí fukce mmo abolutí čle, popř. počet ezávle proměých (vyvětlujících proměých) Vzorce pro, r - ( - )( y - y) r y b b y y Iterval polehlvot regreí fukce Y 500 450 400 350 300 50 00 50 00 50 0 8 0 4 6 X 9

E. Pá polehlvot t. Kč 00 Pá polehlvot kolem regreí přímky 00 000 900 800 Obrat 700 600 500 400 9 0 3 4 5 6 7 8 9 Otev. doba -6,68+6,093* -6,68+6,093*-35,3470-6,68+6,093*+35,3470 hod. 6 Tetováí tattckých hypotéz pjato e tattckým odhady Prcpem je vyloveí předpokladu o charaktertce základího ouboru - ulová hypotéza H o a její tetováí mc, - tředí hodota je rova kotatě r0 - korelačí koefcet je rove 0 b0 - regreí koefcet je rove 0 m m - tř. hodoty výběrů e rovají apod. Prot ulové hypotéze - alteratví hypotéza H u dvoutraého tetu - m ¹ c u jedotraého tetu - m > c Chyba. druhu - H 0 je pravdvá a zamítá e, pravděpodobot chyby je a Chyba. Druhu - H 0 je epravdvá a ezamítáme j - pravděpodobot chyby je b Hlada výzamot - pravděpodobot chyby. druhu - a Potup př tetováí hypotéz:. formulace hypotézy. volba tetového krtéra 0

3. etrojeí krtckého oboru 4. výpočet hodoty tetového krtéra 5. formulace výledků tetu Platí-l, že hodota tetového krtéra je větší ež tabulková hodota př: a 0,05 - tet je tattcky průkazý a 0,0 - tet je tattcky vyoce průkazý Tety o tředí hodotě př velkém výběru (>30) ze základího ouboru, popř. př zámém rozptylu (d ) Tetové krtérum: U _ - X C Př. Otetujte, zda-l průměrý plat pracovíků školtví je vyšší ež 8389 Kč. Nulovou hypotézu lze formulovat jako: H 0 : m 8389 Kč Alteratví jako: hypotézu H : m > 8389 Za tímto účelem byl provede áhodý výběr 00 oob pracujících ve oboru. Byla zjštěa průměrá odměa 840 Kč a měrodatá odchylka 90 Kč. Tet provedeme a hladě výzamot a 0,05 Pro hodotu tetového krtéra platí: 840-8389 U,33 90 00 Tabulková hodota 95% kvatlu u 0,95 je,64 I př hladě výzamot a 0,0 je tet tattcky výzamý (u 0,95,36).

Podobě, pokud by byla průměrá odměa zjštěa jako 8368 Kč a tetové krtérum U-,33 a alteratví hypotéza H byla m < 8389, platlo by, že u a -u -a Závěrem, lze říc, že zamítáme ulovou hypotézu, že průměrá odměa je 8389 Kč. Z toho tedy plye, že průměrá odměa je vyšší. Tety o tředí hodotě př malém výběru (<30) ze základího ouboru, popř. ezámém rozptylu zákl. ouboru Jedá e o podobý potup jako př tetováí výběrů větších jak 30 tím rozdílem, že tetovým krtérem je hodota t. Tetové krtérum má tvar t t má tudetovo rozděleí o - tupích volot. Př. U áhodého výběru potřebtelů o rozahu 5 byl zjště průměrý měíčí výdaj a oobu za potravy 850, měrodatá odchylka 80. Zjtěte, zda-l lze zamítou hypotézu, že průměrý výdaj za potravy a oobu a měíc je v ČR 88 Kč. Nulovou hypotézu lze formulovat jako: H 0 : m 88 Kč Alteratví hypotézu jako: H : m ¹ 88 Tet provedeme a hadě výzamot a 0,05 Tetové krtérum t má tvar: t 850-88,06 80 5 Tabulková hodota t- rozděleí pro oboutraou hypotézu pro 4 tupňů volot je t 0,975,45. Nezamítáme ulovou hypotézu, že tředí hodota e rová 88 Kč. Prcp a potup př tetováí hypotéz pro regre, regreí koefcety a de korelace je podobý.

Tet hypotézy o hodě průměrů: za předpokladu zámých rozptylů v obou základích ouborech pro rováváí alteratv, poouzeí výzamot změ apod. U - + Příklad: Na 5% hladě výzamot tetu ověřte, zda výko pracovíků v jedom závodě je výzamě vyšší ež v jém, zaměřeém a tejý typ výroby. Je zám rozptyl výkoů 5 a 3. K ověřeí tetovaé hypotézy byl provede áhodý výběr v prvím závodě 50 pracovíků a 40 pracovíků, průměré výkoy byly 35 a 30. H 0 : m m H : m > m U 35-30 5 50 + 3 40, 95 u 0,95,645,95 >,645 Nulová hypotéza e zamítá, a zvoleé 5% hladě výzamot je výko pracovíků v prvím závodě vyšší ež ve druhém. Tetováí průkazot regreího modelu - aalýza rozptylu (varace) Defovaý model tetujeme pomocí aalýzy rozptylu, kdy zjšťujeme varabltu vyvětleou regreí a ovlvěou áhodým vlvy. Tetovým krtérem je F-tet Tabulka aalýzy rozptylu Zdroj varablty Součet čtverců Stupě volot Rozptyl F-hodota Regree S R R k RS R / R R/ e Rezduum S e e -k- es e / e Celkem S T T - ' S R ( y -y) - S e - ( y y ' ) ( y y) S T - 3

Pro umy čtverců a tupě volot platí: S T S R + S e, tj. celková způobeá regreí + rezduálí T R + e k... počet parametrů regreího modelu kromě abolutího čleu, popř. počet ezávle proměých Př tetováí vycházíme z ulové hypotézy H 0 : model je tattcky eprůkazý Tetovým krtérem je F-hodota zíkaá jako podíl rozptylu teoretckých hodot (rozptyl vyvětleý regreí) k rozptylu kolem regree (rezduálí). F (k, -k-) R e F má Fher-Sedecorovo rozděleí k a -k- tup volot. Př. Ve regoech byly ledováy proměé: cea za určtý výrobek a možtví, které potřebtelé za tuto ceu požadoval (poptávka). Zjtěte, jaký je vztah mez ceou a možtvím. Proveďte tetováí regreího modelu. Cea Možtví Vyrovaé hodoty 7 00 8,4 7.5 80 76,6 8 70 7,8 8.5 6 67,0 9 53 6, 9.5 48 57,40 0 45 5,60 0.5 43 47,79 4 4,99.5 40 38,9 40 33,38.5 39 8,58 Řešeí: Metodou ejmeších čtverců bylo vypočítáa rovce přímky: y 48,68-9,6. Hodota korelačího koefcetu byla 0,896 Regreí model lze tetovat aalýzou rozptylu. Bylo vypočteo: ' S R ( y -y) (8,4-55) +...+(8,58-55) 3300,5 - S T - S e - ( y y) (00-55) +...+(39-55) 40 ( y y ' ) S T - S R 809,5 4

RS R / R 3300,5/3300,5 es e / e 809,5/080,95 Pro tetové krtérum F potom platí: F (,0) 33005, 40,77 8095, F tab 4,965 F vyp > F tab, platí proto, že zamítáme ulovou hypotézu H 0, že regreí model je eprůkazý. Výledá data pro aalýzu rozptylu jou uvedea v tabulce. Aalýza rozptylu Vlv Suma čtverců S St.v. Rozptyl F-hod. St.výz. Regree R 3300.483 3300.483 40.77 0.000 Chyba (e) 809.57 0 80.95 Celkem (T) 40.000 373.636 Tetováí parametrů regreí fukce Nulová hypotéza H 0 je ve tvaru: b j 0, tj. že parametry regreí fukce jou evýzamé, rovy 0, eovlvňují závle proměou. Alteratví hypotéza H je b j ¹0. Pro tetové krtérum t platí: t (-k-) b j bj, b j je parametr fukce, bj je měrodatá chyba odhadu kde pro j0 (abolutí čle) platí b0 e + ( - ) pro j (regreí koefcet) platí ( -), popř. y b b e -r -k- e je rezduálí měrodatá odchylka ( y-y ' ) - a y jou měrodaté odchylky proměých a y. 5

Hodota t má Studetovo rozděleí t -k- tup volot. Pro >30 e kvatly ahrazují kvatly ormálího rozděleí. Byly zjštěy tyto hodoty regreí přímky: Koefcet Kotata 48.6888 Směrce -9.608399 Otetujte parametry regreí fukce a hladě výzamot a 0,05. b0 9 9506, + 3575 b 9 3575 t tab,8, rep. -,8, 4,9 pro t-hodotu platí: t 487, 6,69 49,,50 pro t-hodotu platí: t, -96, -6,4 5, Jelkož hodota vypočteá je větší ež tabulková, můžeme a hladě výzamot a0,05 zamítout hypotézu o ulové hodotě koefcetů regreí fukce. Tetováí tattcké výzamot korelačího koefcetu Tetovým krtérem je opět hodota F, která má Fher-Sedecorovo rozděleí k a -k- tup volot. F r ( -k-) y ( -r ). k y Poz.: Jedá-l e o jedoduchou regre, lze použít tetové krtérum t - tup volot. Potom platí t r. - y -r y Z příkladu v kaptole.5.3 byl zjště korelačí koefcet r 0,896. Na hladě výzamot a 0,05 tetujte hodotu korelačího koefcetu. F (,0) 08030,. ( 0803, ). - 40,77 6

7

8

9

30

3

3

33

34

8 Ukázka tetováí regreího modelu a jeho parametrů ve tattckém ytému UNISTAT Závlot mez ceou a požadovaým možtvím Závle proměá: možtví Koefcet Směr. chyba t-hodota Výzamot Kotata 48.688888 4.8997998937 6.6907906 0.0000 Směrce -9.6083960839.5047876347-6.38563563 0.000 Rezduálí uma čtverců 809.5748575 Směrodatá chyba 8.99738947984 Průměr Y 55 Směrodatá odch. y 9.33 Ide determace 0.803037 F(,0) 40.77098504677 výzamot F 0.000 Počet řádků Aalýza rozptylu regree Vlv Suma čtverců St.v. Rozptyl F-hod. výz. Regree 3300.483 3300.483 40.77 0.000 Chyba 809.57 0 80.95 Celkem 40.000 373.636 Rozklad umy čtverců Vlv Suma čtverců St.v. Rozptyl F-hod. Výz. cea 3300.483 3300.483 40.77 0.000 Celkem 3300.483 3300.483 40.77 0.000 95% terval polehlvot pro koefcety regreí fukce Koefcet Hodota Směrodatá ch. dolí mez Horí mez kotata 48.688888 4.8997998937 5.4830 8.8806 měrce -9.6083960839.5047876347 -.963-6.555 95% terval polehlvot pro přímku a pá polehlvot dolí m.pá dolí mez př. Teoret. Y horí mez př. Horí m.pá 58.608 70.5370 8.43 9.309 04.354 54.43 67.09 76.689 86.69 98.8066 3 50.395 63.5734 7.847 80.0560 93.4898 4 45.779 59.865 67.005 74.559 88.93 5 4.894 55.8964 6.063 68.56 83.3 6 36.594 5.5546 57.40 63.496 78.848 7 3.75 46.7504 5.5979 58.4454 73.4806 8 6.7769 4.4838 47.7937 54.036 68.806 9.7069 35.844 4.9895 50.349 64.7 0 6.50 9.9440 38.853 46.466 59.8605.934 3.873 33.38 4.889 55.5689 05.7646 7.6908 8.5769 39.4630 5.389 Příklad: Zjtěte tattckou průkazot závlot mez počtem zamětaců a tržbam. Tetováí proveďte a hladě výzamot a 0,05%. Úkol proveďte pro přímku, pomocí výpočetí techky pro parabolu. Výledek kometujte. 35

počet tržby v ml. Kč. zamět. 0 5 6 0 9 5 30 35.5 40.9 45 3 50 55 8 Po proložeí přímkou byla zjštěy tyto výledky: Koefcet Ab.čle 5.0606060606 měrce 0.48 Rezduálí uma čtverců 7.596969697 Směrodatá chyba 3.0038577794 Průměr Y 9.84 Směr. Odch. Y 3.6770879899 Ide determace 0.38543006 Výledky: Coeffcet Stadard Error t-stattc Sgfcace Cotat 5.0606060606.3496379995.3907934686 0.0649 poczam 0.48 0.066796.3998059 0.0554 Redual Sum of Square 7.596969697 Stadard Error 3.0038577794 Mea of Y 9.84 Stad Dev of y 3.6770879899 R-quared 0.38543006 Adjuted R-quared 0.38543006 F(,8) 5.073747933 gfcace of F 0.0554 Number of Row 0 ANOVA of Regreo Due To Sum of Square DoF Mea Square F-Stat Sgf Regreo 45.5 45.5 5.07 0.0554 Error 7.53 8 9.09 Total 7.404 9 3.045 95% Cofdece Iterval for Regreo Coeffcet Cotat Coeffcet Stadard Error Lower Boud Upper Boud ab.čle 5.0606060606.3496379995-0.39 0.4443 měrce 0.48 0.066796-0.0044 0.3006 36

95% Cofdece Iterval for Mea ad Actual Y Value lb Actual Y lb Mea of Y Ftted Y ub Mea of Y ub Actual Y -.557.4369 6.5073 0.5777 4.5403-0.490 3.7957 7.479 0.7000 4.9860 3 0.479 5.085 7.9885 0.898 5.4978 4.376 6.584 8.79.997 6.080 5.963 7.468 9.4697.696 6.743 6.9369 7.9874 0.03.433 7.4837 7 3.5980 8.4803 0.9509 3.46 8.3038 8 4.8 8.788.695 4.5949 9.008 9 4.6940 8.9800.43 5.8843 0.70 0 5.397 9.03 3.77 7.43.057 Závěr: Po proložeí přímkou lze zjtt, že model eí tattcky výzamý. Je proto třeba zvolt jé, vhodější proložeí. V tomto případě odpovídá zjštěým datům parabola, kdy všechy tety vycházeí průkazé. Příklad: Otetujte model, koefcety regreí fukce, korelačí koefcet u závlot mez prodejem automoblů a potřebou pohoých hmot. Prodej PHM 43 345 50 340 65 350 90 400 70 380 78 390 0 40 48 344 30 30 50 450 Vypočítaé hodoty: koefcet kotata 84.0499978 měrce.088068639 Ide determace 0.9569887 Výledky: Směr. Chyba t-hodota Sgfcace 5.3633696677.0669609043 0.0000 0.08667598.5549864334 0.0000 Aalýza rozptylu regree Due To Sum of Square DoF Mea Square F-Stat Sgf Regreo 370.547 370.547 57.68 0.0000 Error 696.353 8 87.044 Total 446.900 9 60.878 Ide determace 0.9569887 F(,8) 57.67589746 gfcace of F 0.0000 37

Lteratura STÁVKOVÁ, J., DUFEK, J. Bometrka.. vyd. Bro: Medelova zemědělká a lecká uverzta v Brě, 000. 78. ISBN 80-757-486-4. ANDĚL, J. Stattcké metody.. vyd. Praha: MATFYZPRESS, 993. 46. MELOUN, M., MILITKÝ, J. Kompedum tattckého zpracováí dat : metody a řešeé úlohy včetě CD.. vyd. Praha: Academa, 00. 764. ISBN 80-00-008-4. MENDENHALL, W., SINCICH, T. Stattc for the Egeerg ad Computer Scece.. vyd. Sa Fracco: Delle Publhg Compay, 988. 6. ISBN 0-0-380460-. NAVIDI, W. Stattc for egeer ad cett. Boto: McGraw-Hll, 006. 869. ISBN 0-07-49-5. ROD, J., VONDRÁČEK, J. Polí pokuctví : Pokucká techka e základy bometrky. Bro: VŠZ, 975. 30. SEGER, J., HINDLS, R. Stattcké metody v tržím hopodářtví.. vyd. Praha: Vctora Publhg, 995. 435. ISBN 80-787-058-7. PALÁT, M. Aplkace bometrckých metod a modelováí v lecké ekolog. I FLAK, P. Bometrcké metódy a modely v pódohopodárkej vede, výkume a výučbe. XVI. letá škola bometrky, Račkova dola,. - 5. júa 004. Ntra: VES SPU v Ntre, 004,. 65-77. ISBN 80-8960-6-. 38

Semář základů tattky a workhop Ig. Krta Somerlíková V teoretcké čát emáře jou vyvětley základí pojmy a charaktertky a objaěy používaé tattcké metody. V áledující praktcké čát, budou uvedeé charaktertky a metody praktcky ukázáy a ouvlém příkladě. Soukromý zemědělec vlatí tádo mléčého kotu tří růzých pleme růzého táří. Jeho hlavím produktem je mléko, vede deí zázamy o produkc jedotlvých krav.. Navrhěte tabulku rozděleí četotí z uvedeých dat. Dopočítejte relatví četot a kumulatví četot. Grafcké zobrazeí četotí.. Nalezěte výzamé hodoty varačí řady. Aalýza truktury. Setrojeí Lorezovy kocetračí křvky. 3. Vypočítejte z uvedeých dat charaktertky obecé úrově a charaktertky varablty. Pracujte daty tříděým etříděým. 4. Výpočet regreí úlohy. Výpočet deu korelace. Grafcké zázorěí regreí fukce. 5. Výpočet družeých regreích přímek a korelačího koefcetu. Grafcké zázorěí přímek. 6. Měřeí závlot lovích zaků. Výpočet koefcetů kotgece a aocace. 7. Středí a příputá chyba výběru, taoveí rozahu výběrového ouboru. 8. Výpočet kofdečích tervalů pro tředí hodotu, rozptyl a měrodatou odchylku, jejch grafcké zobrazeí. 9. Tetováí homogety rozptylu, t tety: tetováí výzamot rozdílu dvou třeích hodot u ezávlých závlých ouborů. 0. Jedofaktorová a vícefaktorová aalýza rozptylu.. Metody áledého tetováí. 39