Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017
Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí áhodých jevů) 2. Podmíěá pravděpodobost 3. Náhodá veličia 4. Statistické charakteristiky (3. a 4. týde) 5. Slabý záko velkých čísel 6. Cetrálí limití věta (teorém) 7. Bodový a itervalový odhad 8. Testováí hypotéz 9. Korelace a regrese
4.1 Středí hodota (očekávaá hodota, očekávaá středí hodota) pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Začeí: EX, E(X) Diskrétí áhodá veličia: Spojitá áhodá veličia: E X = E X = x i P(X = x i ) = Výběrová středí hodota = (aritmetický) průměr: e X = Výsledek úkolu: vekoví teplota: 9,53 C x i P(X = x i ) = xf x dx x i p i = x i p i x i 1 = 1 x i = X
4.2 Obecý momet k-tého řádu (spec. k = 0, k = 1) pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: μ k k-tý obecý momet Diskrétí áhodá veličia: μ k = x i k p i, kde p i je pravděpodobost, že X abývá hodoty x i Spojitá áhodá veličia: μ k = x i k f x dx, kde f(x) je hustota pravděpodobosti daé veličiy.
4.2 Obecý momet k = 0: μ 0 = x i k p i = x i 0 p i = 1 p i = p i = 1 k = 1: μ 1 = x i k p i = x i 1 p i = x i p i = E(X) Prví obecý momet se azývá středí hodota E(X) Výběrový obecý momet: m k = x i k p i = x i k 1 = 1 x i k Výsledek úkolu: průměrá vekoví vlhkost: k = 0 1 k = 1 83,87 %
4.3 Cetrálí momet k-tého řádu (spec. k = 0, k = 2) pro diskrétí a pro spojitou áhodou veličiu (průměrý barometrický tlak) Začeí: μ k k-tý cetrálí momet Diskrétí áhodá veličia: μ k = x i E(X) k p i, kde p i je pravděpodobost, že X abývá hodoty x i Spojitá áhodá veličia: μ k = x i E(X) k f x dx, kde f(x) je hustota pravděpodobosti daé veličiy.
4.3 Cetrálí momet k = 0: μ 0 = x i E(X) k p i = x i E(X) 0 p i = 1 p i = p i = 1 k = 1: μ 1 = x i E(X) k p i = x i E(X) 1 p i = x i E(X) p i = x i p i E(X) p i = x i p i E X p i = E X E X p i = 0 Prví cetrálí momet je vždy 0.
4.3 Cetrálí momet k = 2: μ 2 = x i E(X) k p i = x i E(X) 2 p i = x 2 i 2x i E X + E X 2 p i = x 2 i p i 2E X x i p i + E X 2 p i = x 2 i p i 2E X E X + E X 2 1 = x i 2 p i 2E X 2 + E X 2 = x i 2 p i E X 2 = μ 2 E X 2 = var(x) Druhý cetrálí momet je rozptyl var X. Třetí cetrálí momet se používá pro výpočet šikmosti. Čtvrtý cetrálí momet se používá pro výpočet špičatosti.
4.3 Cetrálí momet Výběrový cetrálí momet: m k = 1 x i X k Výsledek úkolu: průměrý barometrický tlak: k = 0 1 k = 1 0 k = 2 40,78 k = 3 83,69 k = 4 5 319,19
4.4 Rozptyl (rozptýleost, variabilita, kolísavost) pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří teplota) Začeí: var X, σ 2 X, S 2 X, D(X) Míra rozptýleí Jedá se o druhý cetrálí momet. Diskrétí áhodá veličia: var X = σ 2 X = x i E(X) 2 p i Spojitá áhodá veličia: var X = σ 2 X = x E X 2 f x dx
4.4 rozptyl Diskrétí áhodá veličia (při stejých pravděpodobostech): var X = σ 2 X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: var X = σ 2 X = 1 x i X 2 Pokud upravujeme počet stupňů volosti, mluvíme zpravidla výběrovém rozptylu (viz 4.6). Výsledek úkolu: průměrá vitří teplota: σ 2 X = 32,30 C
4.5 směrodatá odchylka pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří vlhkost) Začeí: var X, σ X, S X, D(X) Míra rozptýleí Diskrétí áhodá veličia: σ X = var X = x i E(X) 2 p i Spojitá áhodá veličia: σ X = var X = x E X 2 f x dx
4.5 směrodatá odchylka Diskrétí áhodá veličia (při stejých pravděpodobostech): σ X = var X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: s X = var X = 1 1 x i X 2 Zpravidla pak mluvíme o výběrové směrodaté odchylce. Výsledek úkolu: průměrá vitří vlhkost: σ X = 6,62 % s X = 6,63 %
4.6 Výběrový rozptyl pro diskrétí a pro spojitou áhodou veličiu (průměrý árazový vítr) Začeí: var X, σ 2 X, S 2 X, D(X) Míra rozptýleí Jedá se o druhý cetrálí momet. Diskrétí áhodá veličia (rozptyl): var X = σ 2 X = x i E(X) 2 p i Spojitá áhodá veličia (rozptyl): var X = σ 2 X = x E X 2 f x dx
4.6 Výběrový rozptyl Diskrétí áhodá veličia (při stejých pravděpodobostech): var X = σ 2 X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: s 2 X = 1 1 x i X 2 Pokud upravujeme počet stupňů volosti, mluvíme zpravidla výběrovém rozptylu. Vztah mezi rozptylem a výběrovým rozptylem má tvar: s 2 X = 1 σ2 X Výsledek úkolu: průměrý árazový vítr: s 2 X = 1,06 m/s
4.7 výběrová směrodatá odchylka pro diskrétí a pro spojitou áhodou veličiu (průměrá rychlost větru) Začeí: var X, σ X, S X, D(X) Diskrétí áhodá veličia: var X = 1 1 (x i X) 2 Spojitá áhodá veličia: var X = x E X 2 f x dx Výsledek úkolu: průměrá rychlost větru: 1,40 m/s
4.8 šikmost pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Začeí: γ 1 Diskrétí áhodá veličia: Výběrový koeficiet šikmosti g 1 = m 3 γ 1 = (m 2 ) 3 2 E X E(X) 3 = var(x) 3/2 x i X 3 3 x i X 2 2 Kde X je výběrový průměr, m 2 je výběrový rozptyl a m 3 je třetí výběrový cetrálí momet. Výsledek úkolu: průměrá vekoví teplota: 0,380
4.9 Špičatost pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: α 4, γ 2 Míra špičatosti Diskrétí i spojitá áhodá veličia: Výběrový koeficiet špičatosti: kde X je výběrový průměr, α 4 = γ 2 = a 4 = g 2 = m 4 m 2 2 3 = E X E(X) 4 var(x) 2 3 x i X 4 x i X 2 2 3 m 2 je výběrový rozptyl (druhý výběrový cetrálí momet) a m 4 je čtvrtý výběrový cetrálí momet. Výsledek úkolu: průměrá vekoví vlhkost: 0,1030
4.10 Horí kvatil (spec. horí kvartil) pro diskrétí a pro spojitou áhodou veličiu (průměrý barometrický tlak) Začeí: x p, Q p Míra polohy Kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je tedy taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Postup: Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak se kvatil určí jako aritmetický průměr hodot a pozicích p a p + 1 25 % 25 % 25 % 25 %
4.10 Horí kvatil Speciálí ozačeí kvatilů mediá statistický soubor je rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejě početých skupi dolí kvartil Q 0,25 25% kvatil hodota, pod íž leží čtvrtia dat horí kvartil Q 0,75 75% kvatil hodota, ad íž leží čtvrtia dat decil horích a dolích 10 % dat percetil obecě 25 % 25 % 25 % 25 % 50 % 50 % 25 % 25 % 25 % 25 % Výsledek úkolu: průměrý barometrický tlak: 968,75 mb
4.11 dolí kvatil (spec. dolí kvartil) pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří teplota) kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak kvatil se určí jako aritmetický průměr Speciálí ozačeí kvatilů mediá statistický soubor rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejých skupi dolí kvartil 25. percetil dat horí kvartil 75. percetil dat decil horích a dolích 10 % percetil obecě Výsledek úkolu: průměrá vitří teplota: 19,9 C 25 % 25 % 25 % 25 %
4.12 mediá pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří vlhkost) kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak kvatil se určí jako aritmetický průměr Speciálí ozačeí kvatilů mediá statistický soubor rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejých skupi dolí kvartil 25. percetil dat horí kvartil 75. percetil dat decil horích a dolích 10 % percetil obecě 50 % 50 % Výsledek úkolu: průměrá vitří vlhkost: 37,0 %
4.13 modus pro diskrétí a pro spojitou áhodou veličiu (průměrý árazový vítr) Začeí: mod X, x Modus je hodota, která se ve statistickém souboru vyskytuje ejčastěji (má ejvětší relativí četost). Diskrétí áhodé veličiy P X = x P X = x i Spojisté áhodé veličy f( x) f(x) dé veličiy X. elze použít průměr. Výsledek úkolu: průměrý árazový vítr: 0,00 m/s
4.14 miimum a maximum pro diskrétí a pro spojitou áhodou veličiu (průměrá rychlost větru) Maximum je statistická fukce, kde její fukčí hodota představuje ejvyšší hodotu ze statistického souboru. max = x () Miimum je statistická fukce, kde její fukčí hodota představuje ejižší hodotu ze statistického souboru. mi = x (1) Výsledek úkolu: průměrá rychlost větru: miimum: 0,00 m/s, maximum: 8,1 m/s
4.15 Rozpětí pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Rozpětí (variačí rozpětí) vyjadřuje míru variability statistického souboru. Rozdíl mezi ejvětší a ejmeší hodotou statistického souboru. R = max mi = x x (1) 25 % 25 % 25 % 25 % Výsledek úkolu: průměrá vekoví teplota: 37,59 C
4.16 Kvartilové rozpětí pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: QR, R Q Míra rozptýleí 1. kvartil (25% kvatil) ozačuje takovou hodotu, aby čtvrtia pozorováí byla meší (ebo rova) této hodotě. 3. kvartil (75% kvatil) ozačuje takovou hodotu, aby čtvrtia pozorováí byla větší (ebo rova) této hodotě. Kvartilové rozpětí je rozdíl mezi tímto 3. a 1. kvartilem. 25 % 25 % 25 % 25 % Výsledek úkolu: průměrá vekoví vlhkost: 11,95 %
4.17 středí hodota áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) áhodý vektor X = (X 1, X 2,, X ) T Středí hodota áhodého vektoru je vektor středích hodot E X = E X 1, E X 2,, E X T Výsledek úkolu: průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak: [9,39 C, 82,54 %, 966,13 mb]
4.18 Kovariačí matice áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) KOVARIANCE pro dvě áhodé veličiy X a Y Kovariace vyjadřuje souvislosti (závislosti) mezi jedotlivými veličiami σ X,Y = cov X, Y = E X E X Y E Y σ X,Y = cov X, Y = E XY E X E Y Poz.: σ X,X = cov X, X = E X E X X E X = E X E X 2 = var(x) Kovariace může abývat jakýchkoliv reálých hodot, ale pro dvě kokrétí veličiy musí platit cov 2 X, Y var(x) var(y)
4.18 Kovariačí matice KOVARIANČNÍ MATICE Zobrazuje kovariace mezi veličiami X 1,, X = σ 11 σ 12 σ 1 σ 21 σ 22 σ 2, σ ij jsou kovariace, σ ij = cov X i, X j = E X i E(X i ) X j E(X j ) σ 1 σ 2 σ Pokud jsou X i a X j ezávislé, pak cov X i, X j = 0 Platí ásledující: 1) σ ii = cov X i, X i = var(x i ) a diagoálí prvky matice představují rozptyly veliči 2) σ ij = σ ji (z defiice) a kovariačí matice je tedy symetrická
4.18 Kovariačí matice VÝBĚROVÁ KOVARIANČNÍ MATICE Ve všech uvedeých vztazích jsou středí hodoty ahrazey průměry = σ 11 σ 12 σ 1 σ 21 σ 22 σ 2, σ ij = cov X i, X j = E X i X i X j X j σ 1 σ 2 σ Pro vlastí výpočet lze použít vztah: σ ij = cov X, Y = E XY E X E Y a tedy: σ ij = cov X i, X j = E X i X j E X i E X j Pro daý výběr jsou v uvedeém vztahu opět středí hodoty ahrazey průměry a lze upravit počty stupňů volosti.
4.18 Kovariačí matice Výsledek úkolu: teplota ( C) vlhkost (%) tlak (mb) teplota ( C) 32,30-25,99-1,87 vlhkost (%) -25,99 71,69-2,96 tlak (mb) -1,87-2,96 40,78
4.19 korelačí matice áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) Korelačí matice (matice korelačích koeficietů) ormováím kovariací směrodatými odchylkami σ i = var(x i ) a σ j = var(x j ) ς = corr X i, X j = cov X i,x j var(x i ) var(x j ) a rozdíl od kovariace ezávisí korelace a jedotkách a měřítku jeho hodota se ezměí lieárí trasformací tj. když místo X 1 použijeme Y 1 = a + b X 1 a místo X 2 použijeme Y 2 = c + d X 2 => corr X 1, X 2 = corr Y 1, Y 2 corr X i, X j 1,1 teplota ( C) vlhkost (%) tlak (mb) teplota ( C) 1,00-0,59-0,15 Výsledek úkolu: vlhkost (%) -0,59 1,00 0,01 tlak (mb) -0,15 0,01 1,00