STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9"

Transkript

1 STATISTICKÁ VAZBA Obsah 1 Korelační analýza Statistická vazba Motivační příklady Sdružená distribuční funkce a nezávislost náhodných veličin Charakteristiky statistické vazby dvou náhodných veličin Varianční a korelační matice Ověřování nezávislosti Příklad využití korelační analýzy Výběrová varianční matice Literatura 9 Příklady k procvičení 10 1 Korelační analýza 1.1 Statistická vazba V praktických situacích je velmi častá úloha rozhodnout, jaký je vzájemný vztah dvou (nebo i více náhodných veličin), mluvíme o tom, jaká je statistická vazba mezi těmito náhodnými veličinami. Pro popis intenzity statistické vazby mezi náhodnými veličinami a pro její číslené vyjádření se ve statistice používají metody korelační analýzy, pro analytický popis této vazby se používají metody regresní analýzy. 1.2 Motivační příklady Základní úlohu regresní a korelační analýzy lze jednoduše demonstrovat na následujících dvou příkladech. 1. Na obrázku 1 a) je graficky znázorněn růst cen ve městě Taiwan v období Nezávislá proměnná X je příslušný rok sledování, závislá proměnná (regresor) Y je index popisující nárůst ceny. Je vidět, že uvedené body sledují přibližně lineární trend (s jedním odlehlým bodem v roce 1943), který je v obrázku znázorněný přímkou a dále, že variabilita jednotlivých bodů kolem této přímky je značná. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační číslo projektu: CZ.1.07/2.2.00/ PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY.

2 2. Na obrázku 1 b) je znázorněna závislost brzdné dráhy automobilu Y (měřená v metrech) na jeho rychlosti X (měřené v km/hod). Data byla získána při testování kvality nově vyrobených pneumatik. Z tohoto obrázku je vidět, že brzdná dráha sleduje nelineární trend a variabilita naměřených hodnot kolem proložené křivky je malá. Zjednodušeně řečeno, z obou obrázků jsou dobře patrné cíle korelační analýzy, tedy popis velikosti statistické vazby mezi X a Y, a cíle regresní analýzy, tedy popis průběhu této stochastické vazby matematickou funkcí. Obrázek 1: a) Index růstu ceny ve městě Taiwan v období , b) Závislost brzdné dráhy automobilu na jeho rychlosti 1.3 Sdružená distribuční funkce a nezávislost náhodných veličin Při popisu statistické vazby mezi náhodnými veličinami X a Y mohou nastat dvě krajní situace. V prvním případě může být vazba mezi proměnnými X a Y deterministická, tedy pevně daná nějakým formálním předpisem. Tak je tomu třeba při studiu fyzikálních zákonitostí, kdy např. ujetou dráhu Y lze přesně vyjádřit jako lineární funkci času X (za daných přesně specifikovaných podmínek). Při experimentálním ověřování této skutečnosti, již mohou být měřené veličiny ovlivněny náhodnou chybou měření a graficky znázorněné naměřené hodnoty času X a ujeté dráhy Y již potom kolísají v úzkých mezích kolem přímky. Narůstající kolísání hodnot proměnné Y v závislosti na hodnotách proměnné X bylo znázorněno na obrázku 1 b), kdy šlo o popis závislosti brzdné dráhy na rychlosti vozidla. Ještě větší kolísání, tedy ještě menší statistickou vazbu mezi veličinami X a Y lze pozorovat na obrázku 1 a), kdy index růstu cen Y poměrně volně lineárně závisí na čase X. V druhém krajním případě mohou být obě sledovaně veličiny X a Y nezávislé. Tak by tomu mohlo třeba být při sledování rychlosti vozidla Y a hmotností jeho řidiče X. Ověřování nezávislosti náhodných veličin je velmi častou praktickou úlohou, proto pojem nezávislosti nejdříve formálně zavedeme. Budeme uvažovat dvě náhodné veličiny X a Y a pomocí nich zavedeme dva náhodné jevy X x a Y y. Když bude pravděpodobnost společného nastoupení obou těchto jevů rovna součinu jejich pravděpodobností pro libovolné reálné hodnoty x a y, budeme říkat, že náhodné veličiny X a Y jsou nezávislé. Jednodušeji lze nezávislost náhodných veličin zavést pomocí tzv. sdružené distribuční funkce F (x, y), která je rovna pravděpodobnosti společného nastoupení jevů X x a Y y. Tedy F (x, y) = Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační číslo projektu: CZ.1.07/2.2.00/

3 Obrázek 2: Hustota dvourozměrného normálního rozdělení N 2 (µ X, µ Y, σx 2, σ2 Y, ρ) pro různé hodnoty parametrů µ X, µ Y, σx 2, σ2 Y a ρ P (X x Y y). Obecně lze říci, že sdružená distribuční funkce F (x, y) vyčerpávajícím způsobem popisuje pravděpodobnostní chování obou náhodných veličin X a Y. Některé dvojice náhodných veličin mají sdruženou distribuční funkce popsanou přesnou matematickou funkcí podobně, jako tomu bylo u distribučních funkcí jednotlivých náhodných veličin. Příkladem takové distribuční funkce je distribuční funkce dvourozměrného normálního rozdělení. Toto rozdělení závisí na středních hodnotách EX = µ X, EY = µ Y, rozptylech DX = σ 2 X, DY = σ2 Y a na parametru ρ, jeho význam bude vysvětlen v následujícím odstavci. Toto rozdělení je zobecněním dříve zavedeného jednorozměrného normálního rozdělení, budeme jej značit N 2 (µ X, µ Y, σ 2 X, σ2 Y, ρ). Grafem jeho hustoty je známá zvonovitá funkce a je znázorněna na obrázku 2 pro různé hodnoty parametrů µ X, µ Y, σ 2 X, σ2 Y a ρ. Po zavedení sdružené distribuční funkce lze snadno charakterizovat nezávislost náhodných veličin X a Y. Náhodné veličiny X a Y jsou nezávislé, právě když mezi distribuční funkcí sdruženou a distribučními funkcemi F X (x) náhodné veličiny X a F Y (y) náhodné veličiny Y (tzv. marginálními distribučními funkcemi) platí multiplikativní vztah F (x, y) = F X (x) F Y (y) pro libovolné hodnoty proměnných x a y. Podobně lze nezávislost charakterizovat pomocí sdružené hustoty ve spojitém případě nebo pomocí sdružené pravděpodobnostní funkce v diskrétním případě. V diskrétním případě, kdy obor hodnot náhodné veličiny X je nejvýše spočetná množina M 1 a obor hodnot náhodné veličiny Y je nejvýše spočetná množina M 2 zavádíme sdruženou pravděpodobnostní funkci dvojice X a Y vztahem p(x, y) = P (X = x Y = y) pro (x, y) M 1 M 2. Jsou-li potom 3

4 p 1 (x) = P (X = x) a p 2 (y) = P (Y = y) pravděpodobnostní funkce veličin X a Y, lze jednoduše nezávislost diskrétních náhodných veličin X a Y charakterizovat vztahem p(x, y) = p 1 (x)p 2 (y) pro (x, y) M 1 M 2. Analogicky ve spojitém případě, lze pravděpodobnostní chování náhodné veličiny popsat hustotou. Sdružené distribuční funkci F (x, y) pak ve spojitém případě odpovídá hustota f(x, y), kterou lze stanovit podle vzorce f(x, y) = 2 F (x,y) pro všechna reálná x a y, kde uvedená derivace existuje. x y Je-li f 1 (x) hustota náhodné veličiny X a f 2 (y) hustota náhodné veličiny Y, lze jednoduše nezávislost spojitých náhodných veličin X a Y charakterizovat vztahem f(x, y) = f 1 (x)f 2 (y) pro libovolné reálné hodnoty x a y. Při popisu skupinové nezávislosti komplexu k náhodných veličin X 1, X 2,..., X k se postupuje podobně, zavede se sdružená distribuční funkce F (x 1, x 2,..., x k ) = P (X 1 x 1 X 2 x 2 X k x k ) náhodných veličin X 1, X 2,..., X k. Pak se náhodné veličiny X 1, X 2,..., X k považují za nezávislé, když platí, že F (x 1, x 2,..., x k ) = F 1 (x 1 ) F 2 (x 2 ) F k (x k ), kde distribuční funkce na pravé straně jsou marginální distribuční funkce náhodných veličin X 1, X 2,..., X k. V této souvislosti se k-tice náhodných veličin (X 1, X 2,..., X k ) nazývá náhodným vektorem a značí se X. Náhodné vektory budeme dále v tomto textu zapisovat do sloupce, tedy budeme psát X 1 X 2 X = (X 1, X 2,..., X k ) =., přičemž (X 1, X 2,..., X k ) značí transpozici vektoru (X 1, X 2,..., X k ). Analogicky lze nezávislost diskrétních (nebo spojitých) náhodných veličin (X 1, X 2,..., X k ) charakterizovat pomocí sdružené pravděpodobnostní funkce (nebo sdružené hustoty). 1.4 Charakteristiky statistické vazby dvou náhodných veličin Nejdříve se budeme věnovat statistické vazbě mezi dvěma náhodnými veličinami X a Y. Popíšeme ji pomocí kovariance a korelačního koeficientu. Kovarianci náhodných veličin X a Y označíme cov(x, Y ) a zavedeme ji pomocí střední hodnoty součinu odchylek obou náhodných veličin od jejich střední hodnoty. Tedy vztahem cov(x, Y ) = E(X EX)(Y EY ) = E(X µ X )(Y µ Y ). Kovariance cov(x, Y ) náhodných veličin nabývá hodnot mezi σ X σ Y a σ X σ Y. Pro náhodnou veličinu X platí, že cov(x, X) = DX. Když jsou náhodné veličiny X a Y nezávislé, je jejich kovariance rovna nule. V případě, že víme, že sdružené rozdělení náhodných veličin X a Y je normální, je cov(x, Y ) rovna nule, právě když jsou náhodné veličiny X a Y nezávislé. Pomocí kovariance potom zavedeme korelační koeficient náhodných veličin X a Y, někdy se nazývá Pearsonův korelační koeficient a značí se ρ nebo detailněji ρ(x, Y ). Je definován vztahem X k ρ(x, Y ) = cov(x, Y ) σ X σ Y. 4

5 Korelační koeficient je snad nejčastěji užívanou mírou statistické vazby mezi náhodnými veličinami X a Y. Jeho výhodou oproti kovarianci je, že nabývá hodnot mezi 1 a 1. Když nabývá hodnoty 1, je mezi X a Y přímý lineární vztah, když nabývá hodnoty 1, je mezi X a Y nepřímý lineární vztah. V obou těchto případech lze průběh statistické vazby mezi Y a X popsat přímkou a pozorované hodnoty dvojice X a Y leží na této přímce. Tedy v této situaci je mezi Y a X deterministický lineární vztah. V případě, že hodnota korelačního koeficientu je rovna nule, říkáme, že náhodné veličiny X a Y jsou nekorelované. Pro náhodnou veličinu X platí, že korelační koeficient ρ(x, X) = 1. V případě, že sdružené rozdělení náhodných veličin X a Y je normální N 2 (µ X, µ Y, σx 2, σ2 Y, ρ), je parametr ρ roven korelačnímu koeficientu ρ(x, Y ). Dále v tomto případě platí, že korelační koeficient ρ(x, Y ) = 0, právě když jsou obě veličiny X a Y nezávislé. Velikost korelačního koeficientu určuje, jak silná je statistická vazba mezi veličinami X a Y. Čím je absolutní hodnota korelačního koeficientu blíže 1, tím je sledovaná vazba mezi X a Y větší. Druhá mocnina korelačního koeficientu se nazývá koeficientem determinace. Jeho hodnota vyjádřená v procentech, budeme ji značit d, udává v procentech variabilitu proměnné Y, kterou lze vysvětlit variabilitou proměnné X. Tedy d = 100ρ 2. Celkově je možné říci, že kovariance a korelační koeficient jsou kvalitní míry statistické vazby mezi náhodnými veličinami X a Y v situaci, kdy lze tuto vazbu charakterizovat jako lineární. 1.5 Varianční a korelační matice Popis statistické vazby mezi k náhodnými veličinami X 1, X 2,..., X k se často jednoduše provádí pomocí popisu statistické vazby mezi dvojicemi proměnných, tedy zavedou se kovariance a korelační koeficienty mezi veličinami X i a X j pro všechny možné dvojice indexů i a j a ty se pak uspořádají do matice. Matici kovariancí a rozptylů DX 1 cov(x 1, X 2 )... cov(x 1, X k ) cov(x 2, X 1 ) DX 2... cov(x 2, X k ) V ar(x) = cov(x k, X 1 ) cov(x k, X 2 )... DX k pak nazýváme varianční maticí náhodného vektoru X = (X 1, X 2,..., X k ). Matici korelačních koeficientů 1 ρ(x 1, X 2 )... ρ(x 1, X k ) ρ(x 2, X 1 ) 1... ρ(x 2, X k ) Cor(X) = ρ(x k, X 1 ) ρ(x k, X 2 )... 1 pak nazýváme korelační maticí náhodného vektoru X = (X 1, X 2,..., X k ). Varianční matice popisuje pravděpodobnostní chování náhodného vektoru podobně, jako rozptyl popisuje pravděpodobnostní chování náhodné veličiny. Korelační matice (a podobně varianční matice) pak popisuje strukturu statistických vazeb mezi studovanými náhodnými veličinami. Pro popis statistické vazby náhodné veličiny Y na náhodném vektoru X lze zavést koeficient mnohonásobné korelace ρ(y, X). Je to vlastně korelační koeficient mezi náhodnou veličinou Y a 5

6 její nejlepší lineární predikcí získanou pomocí náhodného vektoru X. Konečně pro popis statistické vazby mezi náhodnými veličinami Y a Z při současné eliminaci vlivu, který může být způsobem dalšími veličinami X 1, X 2,..., X k se zavádějí tzv. parciální korelační koeficienty ρ(y, Z X). Kromě toho existuje řada dalších měr statistické vazby (např. Spearmanův korelační koeficient, Kendallův korelační koeficient apod.), které se užívají v závislosti na tom, s jakým typem náhodných veličin se pracuje. Bude o nich pojednáno později. 1.6 Ověřování nezávislosti Budeme předpokládat, že sledujeme dvě náhodné veličiny X a Y a cílem je ověřit jejich nezávislost. K tomu pořídíme datový soubor, kdy budeme na n nezávislých statistických jednotkách pozorovat hodnoty obou znaků. V matematické terminologii to znamená, že provedeme náhodný výběr rozsahu n ze sdruženého rozdělení náhodných veličin X a Y. Označíme x i a y i pozorování dvojice X a Y zjištěné na i-té statistické jednotce, i = 1, 2,..., n. Z těchto hodnot potom vypočteme výběrový průměr x znaku X a výběrový průměr ȳ znaku Y podle vzorců x = 1 n n x i a ȳ = 1 n i=1 n y i. i=1 Lze ukázat, že platí E x = µ x, E ȳ = µ y. To znamená, že hodnoty průměrů kolísají kolem neznámých odhadovaných středních hodnot µ x, µ y a takové odhady se nazývají nestranné nebo nevychýlené. Dále stanovíme výběrové rozptyly s x a s y podle vzorců s x = 1 n 1 n i=1 (x i x) 2 a s y = 1 n 1 n (y i ȳ) 2. Podobně jako pro výběrové průměry platí i pro výběrové rozptyly s x a s y, že jsou nevychýlenými odhady rozptylů σ 2 X a σ2 Y. Konečně vypočteme výběrovou kovarianci s xy podle vzorce s xy = 1 n 1 i=1 n (x i x)(y i ȳ). i=1 Uvedený odhad je opět nevychýlený. Konečně stanovíme výběrový korelační koeficient r xy podle vzorce r xy = s xy s x s y. (1) Tento odhad již není nevychýlený, ale pro velké hodnoty rozsahu výběru n je přibližně nevychýlený, to znamená, že jeho hodnoty kolísají kolem neznámé hodnoty korelačního koeficientu ρ(x, Y ). Ověřit nezávislost znaků X a Y lze provést za předpokladu, že sdružené rozdělení náhodných veličin X a Y je normální N 2 (µ X, µ Y, σx 2, σ2 Y, ρ). Pak je nezávislost ekvivalentní nekorelovanosti a lze ji ověřit statistickým testem, který vychází z testovací statistiky t = r xy 1 r 2 xy n 2. 6

7 Když platí, že t > t 1 α (n 2), zamítáme na hladině významnosti α hypotézu nezávislosti náhodných 2 veličin X a Y a závislost X a Y považujeme za statisticky prokázanou na hladině významnosti α. Symbolem t 1 α (n 2) rozumíme (1 α )-kvantil Studentova t-rozdělení o n 2 stupních volnosti (pro 2 2 stanovení kvantilů lze použít prakticky každý dostupný statistický software např. Excel, Statistica, MATLAB apod.). 1.7 Příklad využití korelační analýzy Při sledování provozu firmy po zavedení nové výrobní linky byl po dobu 7 měsíců sledován počet hodin provozu této linky proměnná X a zároveň měsíční náklady na její údržbu v tisících Kč proměnná Y. Výsledky jsou zaznamenány v tabulce 1. Cílem je zjistit, jak počet hodin provozu linky koreluje s náklady na její provoz a otestovat, zda statistická vazba mezi těmito proměnnými je významná. x i y i Tabulka 1: Počet hodin provozu výrobní linky (proměnná X) v závislosti na měsíčních nákladech na její údržbu (proměnná Y ) Řešení: Užitím výše uvedených vzorců snadno zjistíme, že x = 325, ȳ = 168,571, s x = 54,006, s y = 21,493, r xy = 0,973 a d = 94,6. Za předpokladu normality lze provést test nezávislosti obou veličin. Zvolíme hladinu významnosti α = 0,05, vypočteme t = 9,387 a ve statistických tabulkách najdeme kvantil t 1 α (n 2) = t 0,975(5) = 2,571 Studentova t-rozdělení o n 2 = 5 stupních volnosti. 2 Protože t > t 1 α (n 2), zamítáme na hladině významnosti α = 0,05 hypotézu o nezávislosti obou 2 veličin X a Y. Zároveň lze říci, že náklady na údržbu linky lze z d = 94,6 procent vysvětlit dobou provozu linky. Zbylé procento odpovídá jiným nekontrolovaným vlivům. 1.8 Výběrová varianční matice Na závěr tohoto odstavce ještě zmíníme výpočet výběrové varianční a korelační matice náhodného vektoru X = (X 1, X 2,..., X k ). Podobně jako v případě dvou náhodných veličin, budeme předpokládat, že je na n statistických jednotkách pozorován vektor X. Výsledkem těchto pozorováni je potom datová matice x x 1k D =..... x n1... x nk V jejím i-tém řádku je pozorování vektoru X, na i-té statistické jednotce a v j-tém sloupci jsou pozorování proměnné X j na všech statistických jednotkách. Výběrová varianční matice je matice V ar(x), kde kovariance cov(x i, X j ) jsou nahrazeny výběrovými protějšky s ij. Výběrovou varianční. 7

8 matici budeme značit S a lze ji stanovit ze vzorce S = 1 n 1 D ( I 1 ) n E D, kde I je jednotková matice typu n n a E je matice samých jedniček typu n n. Podobně výběrovou korelační matici označíme R a lze ji stanovit podle vzorce R = Diag 1 (s 1, s 2,..., s k ) S Diag 1 (s 1, s 2,..., s k ), kde Diag 1 (s 1, s 2,..., s k ) značí inverzní matici k diagonální matici Diag(s 1, s 2,..., s k ) s prvky s i = s ii, i = 1, 2..., n, na hlavní diagonále. 8

9 Literatura Základní MANN, P.S. Introductory Statistics. 6th edition. Hoboken: Wiley, ISBN MOUČKA, J., RÁDL, P. Matematika pro studenty ekonomie. 1. vyd. Grada ISBN NEUBAUER, J., SEDLAČÍK, M., KŘÍŽ, O. Základy statistiky Aplikace v technických a ekonomických oborech. Grada 2012.ISBN: ŘEZANKOVÁ, H. Analýza dat z dotazníkových šetření. 2. vydání, Professional Publishing, ISBN: Doporučená AGRESTI, A. Categorical Data Analysis. Second Edition. Wiley ISBN: ANDĚL, J. Statisticke metody. 3. vydání. Praha: Matfyzpress, ISBN ANDĚL, J. Základy matematické statistiky. 2. vyd. Praha: Matfyzpress, 2007, 358 s. ISBN VÁGNER, M. Integrální počet funkcí jedné proměnné. 1. vydání. Brno: UO, 2005,126 s. ISBN VÁGNER, M., KAŠTÁNKOVÁ, V. Posloupnosti a řady. 1. vydání. Brno: UO, ISBN X. 9

10 Příklady k procvičení Příklad 1.1 Náhodné veličiny X a Y mají sdruženou hustotu f(x, y) = x + y pro 0 < x < 1, 0 < y < 1, jinak je tato hustota rovna 0. Stanovte korelační koeficient ϱ(x, Y ). Příklad 1.2 Zjišt ovalo se kolik mg kyseliny mléčné je ve 100 ml krve u matek prvorodiček (hodnoty X i ) a u jejich novorozenců (hodnoty Y i ). Byly získány výsledky uvedené v následující tabulce: X i Y i Vypočtěte výběrový korelační koeficient a rozhodněte, zda je mezi množstvím kyseliny mléčné v krvi matek a v krvi jejich novorozenců statisticky významný rozdíl. Příklad 1.3 Zjišt ovalo se jak závisí ve vybraných evropských zemích spotřeba alkoholu (proměnná X)a úmrtnost na cirózu jater (počet zemřelých na tuto diagnózu na obyvatel - proměnná Y ). Údaje jsou převzaty z monografie Anděl: Statistické metody. Byly získány výsledky uvedené v následující tabulce: Země FIN NOR IRL NLD SWE GBR BEL AUT DEU ITA FRA X 3,9 4,2 5,6 5,7 6,6 7,2 10,8 10,9 12,3 15,7 24,7 Y ) 3,6 4,3 3,4 3,7 7,2 3,0 12,3 7,0 23,7 23,6 46,1 Údaje jsou převzaty z monografie Anděl: Statistické metody. Vypočtěte výběrový korelační koeficient a rozhodněte, zda je mezi množstvím spotřeby alkoholu a úmrtností na cirózu jater statisticky významný rozdíl. Příklad 1.4 V tabulce níže jsou uvedena data podle monografie Anděl: Statistické metody o počtu úmrtí v Londýně (hodnoty proměnné Y ) od 1. do , kdy Londýn postihla mimořádně silná mlha. Dále jsou uvedeny hodnoty proměnné X, která představuje průměrné znečištění vzduchu v County Hall uváděné v mg/m 3 a hodnoty proměnné Z, která představuje průměrný obsah oxidu siřičitého (počet částic na jeden milion). Den Y i x i z i Den Y i x i z i ,30 0, ,22 0, ,49 0, ,22 0, ,61 0, ,32 0, ,49 0, ,29 0, ,64 0, ,50 0, ,45 0, ,32 0, ,46 1, ,32 0, ,46 1,34 10

11 Stanovte korelační koeficienty r(x, Y ), r(x, Z) a r(y, Z) a otestujte hypotézy, že mezi dvojicemi proměnných je statisticky významná závislost. 11

1.1 Úvod... 1 1.2 Data... 1. 3 Statistická analýza dotazníkových dat 8. Literatura 10

1.1 Úvod... 1 1.2 Data... 1. 3 Statistická analýza dotazníkových dat 8. Literatura 10 MÍRY STATISTICKÉ VAZBY, VÝBĚROVÁ ŠETŘENÍ, STATISTICKÁ ANALÝZA DOTAZNÍKOVÝCH DAT Obsah 1 Statistická data 1 1.1 Úvod.......................................... 1 1. Data...........................................

Více

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

10. N á h o d n ý v e k t o r

10. N á h o d n ý v e k t o r 10. N á h o d n ý v e k t o r 10.1. Definice: Náhodný vektor. Uspořádanou n tici (X 1, X 2,..., X n ) náhodných veličin X i, 1 i n, nazýváme náhodným vektorem. Poznámka: Pro jednoduchost budeme zavádět

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 202 Založeno na materiálech doc. Michala Kulicha Náhodný vektor často potřebujeme

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y) 5. NÁHODNÝ VEKTOR 5.1. Rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,..., X n ) T n-rozměrný vektor, složky X i, i = 1,..., n náhodné veličiny. Vícerozměrná (n-rozměrná) náhodná veličina n =

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

NÁHODNÝ VEKTOR. 4. cvičení

NÁHODNÝ VEKTOR. 4. cvičení NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

Markovské metody pro modelování pravděpodobnosti

Markovské metody pro modelování pravděpodobnosti Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

1 Rozptyl a kovariance

1 Rozptyl a kovariance Rozptyl a kovariance Nechť X je náhodná veličina s konečnou střední hodnotou EX Potom rozptyl náhodné veličiny X definujeme jako: DX E(X EX, pokud střední hodnota na pravé straně existuje Podobně jako

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet? Náhodné veličiny Náhodné veličiny Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Příklad Vytáhneme tři karty z balíčku zajímá nás, kolik je mezi nimi es.

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Náhodné vektory Vilém Vychodil KMI/PRAS, Přednáška 8 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 8) Náhodné vektory Pravděpodobnost a statistika

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Matematika pro chemické inženýry

Matematika pro chemické inženýry Matematika pro chemické inženýry Drahoslava Janovská Lineární a nelineární regrese Přednášky ZS 2016-2017 Sponzorováno grantem VŠCHT Praha, PIGA 413-17-6642, 2016 Povinná látka. Bude v písemkách a bude

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Náhodné vektory a matice

Náhodné vektory a matice Náhodné vektory a matice Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Symbolika A B Jev jistý S (nastane

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

8 Střední hodnota a rozptyl

8 Střední hodnota a rozptyl Břetislav Fajmon, UMAT FEKT, VUT Brno Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Diskrétní náhodná veličina. November 12, 2008

Diskrétní náhodná veličina. November 12, 2008 Diskrétní náhodná veličina November 12, 2008 (Náhodná veličina (náhodná proměnná)) Náhodná veličina (nebo též náhodná proměnná) je veličina X, jejíž hodnota je jednoznačně určena výsledkem náhodného pokusu.

Více

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Kanonická korelační analýza

Kanonická korelační analýza Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] Použitá literatura: [1]: J.Reif, Z.Kobeda: Úvod do pravděpodobnosti a spolehlivosti, ZČU Plzeň, 2004 (2. vyd.) [2]: J.Reif: Metody matematické

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Univerzita Pardubice. Fakulta ekonomicko-správní

Univerzita Pardubice. Fakulta ekonomicko-správní Univerzita Pardubice Fakulta ekonomicko-správní Aplikace regrese a korelace v ekonomii Zbyněk Černovský Bakalářská práce 2013 PROHLÁŠENÍ Prohlašuji, že jsem tuto práci vypracoval samostatně. Veškeré

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více