Pravděpodobnost a aplikovaná statistika

Podobné dokumenty
12. N á h o d n ý v ý b ě r

Deskriptivní statistika 1

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Náhodný výběr 1. Náhodný výběr

P2: Statistické zpracování dat

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Odhady parametrů 1. Odhady parametrů

Pravděpodobnost a aplikovaná statistika

3. Charakteristiky a parametry náhodných veličin

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

V. Normální rozdělení

z možností, jak tuto veličinu charakterizovat, je určit součet

Popisná statistika. Zdeněk Janák 9. prosince 2007

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

13 Popisná statistika

PRAVDĚPODOBNOST A STATISTIKA

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

8. Analýza rozptylu.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

2. Náhodná veličina. je konečná nebo spočetná množina;

4. B o d o v é o d h a d y p a r a m e t r ů

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Intervalové odhady parametrů některých rozdělení.

6. P o p i s n á s t a t i s t i k a

Statistika pro metrologii

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Číselné charakteristiky náhodných veličin

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Dynamická pevnost a životnost Statistika

Pravděpodobnost a aplikovaná statistika

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Přednášky část 7 Statistické metody vyhodnocování dat

7. P o p i s n á s t a t i s t i k a

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

8. Odhady parametrů rozdělení pravděpodobnosti

Pravděpodobnostní model doby setrvání ministra školství ve funkci

14. B o d o v é o d h a d y p a r a m e t r ů

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

11. P o p i s n á s t a t i s t i k a

Intervalové odhady parametrů

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

n-rozměrné normální rozdělení pravděpodobnosti

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a statistika - absolutní minumum

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Pravděpodobnostní modely

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Závislost slovních znaků

PoznÁmky k přednášce

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Mendelova univerzita v Brně Statistika projekt

Úloha III.S... limitní

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

2 EXPLORATORNÍ ANALÝZA

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

NMSA331 Matematická statistika 1

Elementární zpracování statistického souboru

PRAVDĚPODOBNOST ... m n

Přijímací řízení akademický rok 2013/2014 NavMg. studium Kompletní znění testových otázek matematika a statistika

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Zápočtová práce STATISTIKA I

Pravděpodobnost a statistika Výpisky z cvičení Ondřeje Chocholy

MATICOVÉ HRY MATICOVÝCH HER

Národní informační středisko pro podporu jakosti

17. Statistické hypotézy parametrické testy

Matematika přehled vzorců pro maturanty (zpracoval T. Jánský) Úpravy výrazů. Binomická věta

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

MATEMATICKÁ STATISTIKA - XP01MST

1. Základy počtu pravděpodobnosti:

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Charakterizace rozdělení

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Náhodný výběr, statistiky a bodový odhad

BAKALÁŘSKÁ STA I. + II.

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

Transkript:

Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017

Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí áhodých jevů) 2. Podmíěá pravděpodobost 3. Náhodá veličia 4. Statistické charakteristiky (3. a 4. týde) 5. Slabý záko velkých čísel 6. Cetrálí limití věta (teorém) 7. Bodový a itervalový odhad 8. Testováí hypotéz 9. Korelace a regrese

4.1 Středí hodota (očekávaá hodota, očekávaá středí hodota) pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Začeí: EX, E(X) Diskrétí áhodá veličia: Spojitá áhodá veličia: E X = E X = x i P(X = x i ) = Výběrová středí hodota = (aritmetický) průměr: e X = Výsledek úkolu: vekoví teplota: 9,53 C x i P(X = x i ) = xf x dx x i p i = x i p i x i 1 = 1 x i = X

4.2 Obecý momet k-tého řádu (spec. k = 0, k = 1) pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: μ k k-tý obecý momet Diskrétí áhodá veličia: μ k = x i k p i, kde p i je pravděpodobost, že X abývá hodoty x i Spojitá áhodá veličia: μ k = x i k f x dx, kde f(x) je hustota pravděpodobosti daé veličiy.

4.2 Obecý momet k = 0: μ 0 = x i k p i = x i 0 p i = 1 p i = p i = 1 k = 1: μ 1 = x i k p i = x i 1 p i = x i p i = E(X) Prví obecý momet se azývá středí hodota E(X) Výběrový obecý momet: m k = x i k p i = x i k 1 = 1 x i k Výsledek úkolu: průměrá vekoví vlhkost: k = 0 1 k = 1 83,87 %

4.3 Cetrálí momet k-tého řádu (spec. k = 0, k = 2) pro diskrétí a pro spojitou áhodou veličiu (průměrý barometrický tlak) Začeí: μ k k-tý cetrálí momet Diskrétí áhodá veličia: μ k = x i E(X) k p i, kde p i je pravděpodobost, že X abývá hodoty x i Spojitá áhodá veličia: μ k = x i E(X) k f x dx, kde f(x) je hustota pravděpodobosti daé veličiy.

4.3 Cetrálí momet k = 0: μ 0 = x i E(X) k p i = x i E(X) 0 p i = 1 p i = p i = 1 k = 1: μ 1 = x i E(X) k p i = x i E(X) 1 p i = x i E(X) p i = x i p i E(X) p i = x i p i E X p i = E X E X p i = 0 Prví cetrálí momet je vždy 0.

4.3 Cetrálí momet k = 2: μ 2 = x i E(X) k p i = x i E(X) 2 p i = x 2 i 2x i E X + E X 2 p i = x 2 i p i 2E X x i p i + E X 2 p i = x 2 i p i 2E X E X + E X 2 1 = x i 2 p i 2E X 2 + E X 2 = x i 2 p i E X 2 = μ 2 E X 2 = var(x) Druhý cetrálí momet je rozptyl var X. Třetí cetrálí momet se používá pro výpočet šikmosti. Čtvrtý cetrálí momet se používá pro výpočet špičatosti.

4.3 Cetrálí momet Výběrový cetrálí momet: m k = 1 x i X k Výsledek úkolu: průměrý barometrický tlak: k = 0 1 k = 1 0 k = 2 40,78 k = 3 83,69 k = 4 5 319,19

4.4 Rozptyl (rozptýleost, variabilita, kolísavost) pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří teplota) Začeí: var X, σ 2 X, S 2 X, D(X) Míra rozptýleí Jedá se o druhý cetrálí momet. Diskrétí áhodá veličia: var X = σ 2 X = x i E(X) 2 p i Spojitá áhodá veličia: var X = σ 2 X = x E X 2 f x dx

4.4 rozptyl Diskrétí áhodá veličia (při stejých pravděpodobostech): var X = σ 2 X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: var X = σ 2 X = 1 x i X 2 Pokud upravujeme počet stupňů volosti, mluvíme zpravidla výběrovém rozptylu (viz 4.6). Výsledek úkolu: průměrá vitří teplota: σ 2 X = 32,30 C

4.5 směrodatá odchylka pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří vlhkost) Začeí: var X, σ X, S X, D(X) Míra rozptýleí Diskrétí áhodá veličia: σ X = var X = x i E(X) 2 p i Spojitá áhodá veličia: σ X = var X = x E X 2 f x dx

4.5 směrodatá odchylka Diskrétí áhodá veličia (při stejých pravděpodobostech): σ X = var X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: s X = var X = 1 1 x i X 2 Zpravidla pak mluvíme o výběrové směrodaté odchylce. Výsledek úkolu: průměrá vitří vlhkost: σ X = 6,62 % s X = 6,63 %

4.6 Výběrový rozptyl pro diskrétí a pro spojitou áhodou veličiu (průměrý árazový vítr) Začeí: var X, σ 2 X, S 2 X, D(X) Míra rozptýleí Jedá se o druhý cetrálí momet. Diskrétí áhodá veličia (rozptyl): var X = σ 2 X = x i E(X) 2 p i Spojitá áhodá veličia (rozptyl): var X = σ 2 X = x E X 2 f x dx

4.6 Výběrový rozptyl Diskrétí áhodá veličia (při stejých pravděpodobostech): var X = σ 2 X = 1 x i E(X) 2 Pro výběr ahrazujeme středí hodotu průměrem a upravujeme počet stupňů volosti: s 2 X = 1 1 x i X 2 Pokud upravujeme počet stupňů volosti, mluvíme zpravidla výběrovém rozptylu. Vztah mezi rozptylem a výběrovým rozptylem má tvar: s 2 X = 1 σ2 X Výsledek úkolu: průměrý árazový vítr: s 2 X = 1,06 m/s

4.7 výběrová směrodatá odchylka pro diskrétí a pro spojitou áhodou veličiu (průměrá rychlost větru) Začeí: var X, σ X, S X, D(X) Diskrétí áhodá veličia: var X = 1 1 (x i X) 2 Spojitá áhodá veličia: var X = x E X 2 f x dx Výsledek úkolu: průměrá rychlost větru: 1,40 m/s

4.8 šikmost pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Začeí: γ 1 Diskrétí áhodá veličia: Výběrový koeficiet šikmosti g 1 = m 3 γ 1 = (m 2 ) 3 2 E X E(X) 3 = var(x) 3/2 x i X 3 3 x i X 2 2 Kde X je výběrový průměr, m 2 je výběrový rozptyl a m 3 je třetí výběrový cetrálí momet. Výsledek úkolu: průměrá vekoví teplota: 0,380

4.9 Špičatost pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: α 4, γ 2 Míra špičatosti Diskrétí i spojitá áhodá veličia: Výběrový koeficiet špičatosti: kde X je výběrový průměr, α 4 = γ 2 = a 4 = g 2 = m 4 m 2 2 3 = E X E(X) 4 var(x) 2 3 x i X 4 x i X 2 2 3 m 2 je výběrový rozptyl (druhý výběrový cetrálí momet) a m 4 je čtvrtý výběrový cetrálí momet. Výsledek úkolu: průměrá vekoví vlhkost: 0,1030

4.10 Horí kvatil (spec. horí kvartil) pro diskrétí a pro spojitou áhodou veličiu (průměrý barometrický tlak) Začeí: x p, Q p Míra polohy Kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je tedy taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Postup: Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak se kvatil určí jako aritmetický průměr hodot a pozicích p a p + 1 25 % 25 % 25 % 25 %

4.10 Horí kvatil Speciálí ozačeí kvatilů mediá statistický soubor je rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejě početých skupi dolí kvartil Q 0,25 25% kvatil hodota, pod íž leží čtvrtia dat horí kvartil Q 0,75 75% kvatil hodota, ad íž leží čtvrtia dat decil horích a dolích 10 % dat percetil obecě 25 % 25 % 25 % 25 % 50 % 50 % 25 % 25 % 25 % 25 % Výsledek úkolu: průměrý barometrický tlak: 968,75 mb

4.11 dolí kvatil (spec. dolí kvartil) pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří teplota) kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak kvatil se určí jako aritmetický průměr Speciálí ozačeí kvatilů mediá statistický soubor rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejých skupi dolí kvartil 25. percetil dat horí kvartil 75. percetil dat decil horích a dolích 10 % percetil obecě Výsledek úkolu: průměrá vitří teplota: 19,9 C 25 % 25 % 25 % 25 %

4.12 mediá pro diskrétí a pro spojitou áhodou veličiu (průměrá vitří vlhkost) kvatily tvoří iverzí fukci k distribučí fukci Kvatil x p je taková hodota statistického zaku, před íž leží právě p procet shromážděých dat (seřazeých podle velikosti). Pro uspořádaý soubor dat (vzestupě, tj. od ejmešího k ejvětšímu) je třeba určit pořadový idex i p kvatilu x p a musí platit p < i p < p + 1 Kvatil x p je rove hodotě zaku a pozici i p. Pokud jsou hodoty celočíselé, pak kvatil se určí jako aritmetický průměr Speciálí ozačeí kvatilů mediá statistický soubor rozděle a dvě stejě početé možiy Q 0,5 kvartil tři body, které rozdělují seřazeá data do čtyř stejých skupi dolí kvartil 25. percetil dat horí kvartil 75. percetil dat decil horích a dolích 10 % percetil obecě 50 % 50 % Výsledek úkolu: průměrá vitří vlhkost: 37,0 %

4.13 modus pro diskrétí a pro spojitou áhodou veličiu (průměrý árazový vítr) Začeí: mod X, x Modus je hodota, která se ve statistickém souboru vyskytuje ejčastěji (má ejvětší relativí četost). Diskrétí áhodé veličiy P X = x P X = x i Spojisté áhodé veličy f( x) f(x) dé veličiy X. elze použít průměr. Výsledek úkolu: průměrý árazový vítr: 0,00 m/s

4.14 miimum a maximum pro diskrétí a pro spojitou áhodou veličiu (průměrá rychlost větru) Maximum je statistická fukce, kde její fukčí hodota představuje ejvyšší hodotu ze statistického souboru. max = x () Miimum je statistická fukce, kde její fukčí hodota představuje ejižší hodotu ze statistického souboru. mi = x (1) Výsledek úkolu: průměrá rychlost větru: miimum: 0,00 m/s, maximum: 8,1 m/s

4.15 Rozpětí pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví teplota) Rozpětí (variačí rozpětí) vyjadřuje míru variability statistického souboru. Rozdíl mezi ejvětší a ejmeší hodotou statistického souboru. R = max mi = x x (1) 25 % 25 % 25 % 25 % Výsledek úkolu: průměrá vekoví teplota: 37,59 C

4.16 Kvartilové rozpětí pro diskrétí a pro spojitou áhodou veličiu (průměrá vekoví vlhkost) Začeí: QR, R Q Míra rozptýleí 1. kvartil (25% kvatil) ozačuje takovou hodotu, aby čtvrtia pozorováí byla meší (ebo rova) této hodotě. 3. kvartil (75% kvatil) ozačuje takovou hodotu, aby čtvrtia pozorováí byla větší (ebo rova) této hodotě. Kvartilové rozpětí je rozdíl mezi tímto 3. a 1. kvartilem. 25 % 25 % 25 % 25 % Výsledek úkolu: průměrá vekoví vlhkost: 11,95 %

4.17 středí hodota áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) áhodý vektor X = (X 1, X 2,, X ) T Středí hodota áhodého vektoru je vektor středích hodot E X = E X 1, E X 2,, E X T Výsledek úkolu: průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak: [9,39 C, 82,54 %, 966,13 mb]

4.18 Kovariačí matice áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) KOVARIANCE pro dvě áhodé veličiy X a Y Kovariace vyjadřuje souvislosti (závislosti) mezi jedotlivými veličiami σ X,Y = cov X, Y = E X E X Y E Y σ X,Y = cov X, Y = E XY E X E Y Poz.: σ X,X = cov X, X = E X E X X E X = E X E X 2 = var(x) Kovariace může abývat jakýchkoliv reálých hodot, ale pro dvě kokrétí veličiy musí platit cov 2 X, Y var(x) var(y)

4.18 Kovariačí matice KOVARIANČNÍ MATICE Zobrazuje kovariace mezi veličiami X 1,, X = σ 11 σ 12 σ 1 σ 21 σ 22 σ 2, σ ij jsou kovariace, σ ij = cov X i, X j = E X i E(X i ) X j E(X j ) σ 1 σ 2 σ Pokud jsou X i a X j ezávislé, pak cov X i, X j = 0 Platí ásledující: 1) σ ii = cov X i, X i = var(x i ) a diagoálí prvky matice představují rozptyly veliči 2) σ ij = σ ji (z defiice) a kovariačí matice je tedy symetrická

4.18 Kovariačí matice VÝBĚROVÁ KOVARIANČNÍ MATICE Ve všech uvedeých vztazích jsou středí hodoty ahrazey průměry = σ 11 σ 12 σ 1 σ 21 σ 22 σ 2, σ ij = cov X i, X j = E X i X i X j X j σ 1 σ 2 σ Pro vlastí výpočet lze použít vztah: σ ij = cov X, Y = E XY E X E Y a tedy: σ ij = cov X i, X j = E X i X j E X i E X j Pro daý výběr jsou v uvedeém vztahu opět středí hodoty ahrazey průměry a lze upravit počty stupňů volosti.

4.18 Kovariačí matice Výsledek úkolu: teplota ( C) vlhkost (%) tlak (mb) teplota ( C) 32,30-25,99-1,87 vlhkost (%) -25,99 71,69-2,96 tlak (mb) -1,87-2,96 40,78

4.19 korelačí matice áhodého vektoru pro diskrétí a pro spojité rozděleí (průměrá vekoví teplota, průměrá vekoví vlhkost, průměrý barometrický tlak) Korelačí matice (matice korelačích koeficietů) ormováím kovariací směrodatými odchylkami σ i = var(x i ) a σ j = var(x j ) ς = corr X i, X j = cov X i,x j var(x i ) var(x j ) a rozdíl od kovariace ezávisí korelace a jedotkách a měřítku jeho hodota se ezměí lieárí trasformací tj. když místo X 1 použijeme Y 1 = a + b X 1 a místo X 2 použijeme Y 2 = c + d X 2 => corr X 1, X 2 = corr Y 1, Y 2 corr X i, X j 1,1 teplota ( C) vlhkost (%) tlak (mb) teplota ( C) 1,00-0,59-0,15 Výsledek úkolu: vlhkost (%) -0,59 1,00 0,01 tlak (mb) -0,15 0,01 1,00