3. ZákladnZ kladní statistické charakteristiky rozdělení 1
charakteristiky Dva hlavní druhy základnz kladních charakteristik statistického souboru: charakteristiky úrovně,, polohy (středn ední hodnoty) charakteristiky variability Další : charakteristiky asymetrie charakteristiky špičatosti rozdělení 2
Středn ední hodnoty = čísla (charakteristiky), která zastupují hodnoty zkoumaného statistického znaku udávaj vají polohu rozdělen lení četností,, velikost zkoumaného jevu v daném m souboru atd. rozdělení 3
Středn ední hodnoty Aritmetický průměr r (+ vážený) v Geometrický průměr Harmonický průměr Modus Aritmetický střed Medián n (kvartily( kvartily, decily, percentily) rozdělení 4
Charakteristiky variability = čísla, která charakterizují stupeň proměnlivosti statistického znaku v daném m statistickém souboru = důled ležitý doplněk k informací,, které poskytují středn ední hodnoty rozdělení 5
Kvartilová odchylka Q = ( x% %) (% % 75 x + x25 x) 2 rozdělení 6
Decilová, percentilová odchylka D = ( x% %) (% % 90 x + x10 x) 8 P = ( x% %) (% % 99 x + x1 x) 98 rozdělení 7
Průměrn rná odchylka d x n xi x = i= 1 i= 1 d x = n k xi xni k i= 1 ni rozdělení 8
Relativní průměrn rná odchylka D = d x Při vynásobení stem v % rozdělení 9
Středn ední diference = aritmetický průměr r absolutních hodnot všech možných vzájemných rozdílů n jednotlivých hodnot sledovaného znaku x = n n i= 1 j= 1 x i n( n 1) x j rozdělení 10
Středn ední diference Vhodná míra variability pro soubory s malým rozsahem. Jinak velmi pracné. rozdělení 11
Rozptyl, směrodatn rodatná odchylka = nejdůle ležitější charakteristiky variace hodnot znaků ve statistickém m souboru rozptyl: s 2 směrodatn rodatná odchylka: s rozdělení 12
Rozptyl = průměr r ze čtverců odchylek jednotlivých hodnot znaku od jejich aritmetického průměru ru s2 = n i= 1 ( x i x) n rozdělení 13
Rozptyl s2 = n i= 1 ( x i x) n V praxi se používá: 2 2 s = x2 x 2 2 x s = i n rozdělení 14
Rozptyl V případp padě skupinového rozdělen lení četností: s2 = k i= 1 ( x x) 2 s ni k i= 1 n i rozdělení 15
Rozptyl V praxi se opět t používá: 2 2 2 s = x x Kde: x2 = k i= 1 k x 2 i ni i= 1 n i x = k i= 1 k i= 1 x n i i n i rozdělení 16
Směrodatn rodatná odchylka Používá se častěji, jde o druhou odmocninu rozptylu. Je mírou m rozptylu hodnot x i náhodnn hodné veličiny iny kolem průměru. ru. rozdělení 17
Variační koeficient = nejpoužívan vanější relativní míra variability = poměr r směrodatn rodatné odchylky k průměru ru v = s x rozdělení 18
Variační koeficient = je mírou m bezrozměrnou rnou rozdělení 19
Charakteristiky asymetrie = míry m šikmosti (asymetrie, nesouměrnosti), jsou čísla, která charakterizují nesouměrnost rozdělen lení četností. míra šikmosti založen ená na variačním m rozpětí míra šikmosti založen ená na rozpětí kvantilů koeficient asymetrie rozdělení 20
Koeficient asymetrie = aritmetický průměr r z třett etích mocnin odchylek jednotlivých hodnot znaku od aritmetického průměru ru vyjádřených v jednotkách směrodatn rodatné odchylky rozdělení 21
Koeficient asymetrie Ze skupinového rozdělen lení četností se vypočítá: k α i= 1 = n ( xi x) i 3 ns3 rozdělení 22
Koeficient asymetrie α α α = f p 0 0 0 rozdělení četností je souměrné rozdělení četností je sešikmeno doleva (kladná šikmost) rozdělení četností je sešikmeno doprava (záporná šikmost) rozdělení 23
Charakteristiky špičatosti = čísla, která charakterizují koncentraci prvků souboru v blízkosti určit ité hodnoty znaku = poskytují představu o tvaru rozdělen lení četností co do špičatosti nebo plochosti míra koncentrace kolem mediánu koeficient špičatosti rozdělení 24
Koeficient špičatosti = průměrn rná hodnota součtu čtvrtých mocnin odchylek hodnot x i od aritmetického průměru ru měřených v jednotkách směrodatn rodatné odchylky s rozdělení 25
Koeficient špičatosti Ze skupinového rozdělen lení četností se vypočítá: k 4 n ( xi x) i = ns4 ε i= 1 3 rozdělení 26
Koeficient špičatosti ε ε ε = f p 0 0 0 rozdělení četností je normálně zašpičatělé rozdělení četností je kladně zašpičatělé (špičaté) rozdělení četností je záporně zašpičatělé (ploché) rozdělení 27
Příklad rozdělení 28
rozdělení 29 9,6 34 9,7 17 9,6 50 9,4 33 10,9 16 9,4 49 10,7 32 11,1 15 9,2 48 9,9 31 10 14 9 47 8,5 30 7,7 13 8,5 46 9,3 29 8,2 12 8,8 45 9,8 28 8,5 11 9,9 44 9,4 27 10,1 10 9,6 43 10,8 26 9,9 9 9,5 42 10,5 25 10,3 8 9,3 41 10,2 24 9,4 7 9,1 40 8,6 23 8,3 6 8,7 39 8,4 22 7,9 5 8,9 38 7,9 21 9,1 4 8,8 37 9,3 20 8,1 3 9,4 36 8,9 19 9,6 2 9,1 35 8,8 18 7,4 1 Průměrná teplota ( C) Rok Průměrná teplota Rok Průměrná teplota( C) Rok
intervaly 6,5-7 7,1-7,5 7,6-8 8,1-8,5 8,6-9 9,1-9,5 9,6-10 10,1-10,5 10,6-11 11,1-11,5 11,6-12 střed intervalu 6,8 7,3 7,8 8,3 8,8 9,3 9,8 10,3 10,8 11,3 11,8 absolutní četnost 0 1 3 7 8 13 10 4 3 1 0 50 rozdělení 30
Spočítáno z minula: Aritmetický průměr. r. Modus. Medián, horní a dolní kvartil. Průměrnou rnou odchylku. rozdělení 31
Relativní odchylku Rozptyl Směrodatnou odchylku Koeficient špičatosti Koeficient šikmosti Vypočítej: rozdělení 32
intervaly xs ni x s n i x s -x n i (x s -x) 2 6,5-7 6,8 0 7,1-7,5 7,3 1 7,6-8 7,8 3 8,1-8,5 8,3 7 8,6-9 8,8 8 9,1-9,5 9,3 13 9,6-10 9,8 10 10,1-10,5 10,3 4 10,6-11 10,8 3 11,1-11,5 11,3 1 11,6-12 11,8 0 50 rozdělení 33
4. Teoretická rozdělen lení rozdělení 34
Teoretická rozdělen lení pojmy Náhodná veličina ina proměnn nná,, pro kterou nelze na základz kladě určit ité zákonitosti předem p stanovit její konkrétn tní hodnotu Spojitá náhodná veličina ina může-li nabývat jakékoliv koliv hodnoty v určit itém m intervalu Nespojitá (diskrétn tní) ) náhodnn hodná veličina ina opak rozdělení 35
Teoretická rozdělen lení princip Ve statistice pracujeme často s výběrovými soubory o rozsahu n, jejich grafickým znázorn zorněním m je histogram. Budeme-li zvětšovat rozsah souboru (při i předpokladu, p že e náhodnn hodná veličina ina je spojitá) ) a hodnoty třídit t do stále menší ších intervalů,, dostaneme histogramy, které se budou stále více v blížit hladké křivce. rozdělení 36
Teoretická rozdělen lení princip Této hladké křivky dosáhneme v teoretickém limitním m případp padě,, kdy soubor o nekonečně velkém m rozsahu třídíme t do nekonečně mnoha nekonečně úzkých intervalů. Dostaneme: frekven pravděpodobnosti) podobnosti) frekvenční funkci funkci (hustotu rozdělení 37
Teoretická rozdělen lení princip Analogicky přejdeme p od součtov tové čáry ke spojité křivce F(x) distribuční funkce rozdělení 38
Teoretická rozdělen lení princip Frekvenční funkce tak představuje p teoretické rozdělen lení četností základního souboru o parametrech µ σ aritmetický průměr směrodatná odchylka rozdělení 39
Normáln lní (Gaussovo)) rozdělen lení Patří mezi nejčast astěji používan vaná rozdělen lení spojité náhodné veličiny. iny. Bylo pozorováno při p i opakovaném m měřm ěření téže veličiny iny za stálých podmínek, kdy jednotlivé hodnoty se více v či i méněm odlišovaly ovaly od skutečné hodnoty rozdělení 40
Normáln lní (Gaussovo)) rozdělen lení Frekvenční funkce : ( ) =. σ 2π f x ( x µ ) 2 1 2 2 e σ rozdělení 41
Normáln lní (Gaussovo)) rozdělen lení Distribuční funkce : ( x ) 2 x 1 2 2 F x = e σ dx ( ). 2 σ π µ rozdělení 42
Normované normáln lní rozdělen lení Normujeme pomocí: z = x µ σ rozdělení 43
Normované normáln lní rozdělen lení Frekvenční funkce: f ( x) = 1. e 2π z2 2 rozdělení 44
Normované normáln lní rozdělen lení Distribuční funkce: z2 z 1 F( x) =. e 2 dx 2 π rozdělení 45
Normované normáln lní rozdělen lení Zvonovitý tvar, asymptoticky se přiblip ibližuje ose x Souměrn rná podle osy, která prochází vrcholem, x-ová souřadnice vrcholu je aritmetickým průměrem rem normáln lního rozdělen lení Aritmetický průměr r se rovná modusu a mediánu rozdělení 46
Normované normáln lní rozdělen lení Normované rozdělen lení již nezávis visí na parametrech µ σ rozdělení 47
Vlastnosti, pravděpodobnosti podobnosti Normáln lní křivka omezuje plochu 100 % (nebo 1). Lze tak určit pravděpodobnosti, podobnosti, s nimiž leží hodnoty v určit itém m intervalu. rozdělení 48
Vlastnosti, pravděpodobnosti podobnosti V intervalu: µ ± σ µ ± 2σ µ ± 3σ leží 68,28 % všech hodnot leží 95,45 % všech hodnot leží 99,73 % všech hodnot rozdělení 49
Vlastnosti, pravděpodobnosti podobnosti Naopak: 95 % hodnot odpovídá intervalu µ ± 1,65σ 99 % hodnot odpovídá intervalu µ ± 2,58σ rozdělení 50
Pravděpodobn podobná chyba Stanovení mezí extremity se opírá o zmíněné pravděpodobnosti. podobnosti. Kromě násobků směrodatn rodatné odchylky lze použít t i tzv. pravděpodobnou podobnou chybu c: (pro normáln lní rozdělen lení) c = 0,6745. s rozdělení 51
Extremita jevů a její meze slovní označení extremity symbol meze pravděpod obnost výskytu jevu (%) meze pravděpod obnost výskytu jevu (%) extrémně podnormální EP < x - 3s 0,135 < x - 3c 2,150 silně podnormální SP x - 3s až x - 2s 2,190 x - 3c až x - 2c 8,870 podnormální P x -2s až x - s 13,590 x -2c až x - c 13,980 normální O x - s až x + 2s 68,270 x - c až x + 2c 50,000 nadnormální N x + s až x + 2s 13,590 x + c až x + 2c 13,980 silně nadnormální SN x + 2s až x + 3s 2,190 x + 2c až x + 3c 8,870 extrémně nadnormální EN > x + 3s 0,135 > x + 3c 2,150 rozdělení 52
Konstrukce a výpočet normáln lního rozdělen lení Nutná je znalost základnz kladních charakteristik výběrov rového souboru ( x a s ), které nahrazují neznámé parametry základnz kladního souboru a µ σ rozdělení 53
Konstrukce a výpočet normáln lního rozdělen lení Hledaná frekvenční funkce pak bude mít m t tvar: nh f ( x) =. e s 2π ( x x) 2 2s2 rozdělení 54
Konstrukce a výpočet normáln lního rozdělen lení Pořadnice vrcholu křivky k y max procházej zející aritmetickým průměrem rem x dostaneme ze vztahu: y max = 0,39894 nh s rozdělení 55
Konstrukce a výpočet normáln lního rozdělen lení Další pořadnice křivky k y i dostaneme ze vztahu: y i = k i. y max Kde k i jsou tabelované hodnoty pro různr zné násobky směrodatn rodatné odchylky. Body y y 1s a -1s jsou inflexními body normáln lní křivky. rozdělení 56
Pearsonova křivka III. typu Používá se v případp padě,, kdy nelze na geografické jevy aplikovat normáln lní rozdělen lení (např. studovaná veličina ina nemá možnost nabývat nekonečných ných hodnot, nebo je omezena konečnými nými hodnotami ). V tom případp padě lze na soubor použít t některou n křivku k ze systému 12 křivek Pearsonova systému. rozdělení 57
Pearsonova křivka III. typu Nejčast astěji se používá (zejména v hydrologii) Pearsonova křivka III. typu. Rovnice: y x x = y. e b (1 + ) 0 a a b rozdělení 58
Pearsonova křivka III. typu Distribuční funkce Pearsonovy křivky III. typu se používá ke konstrukci čáry překrop ekročení (součtov tová čára četností). rozdělení 59
Konstrukce čáry překrop ekročení Nutné je znát t základnz kladní parametry Pearsonovy křivky III. typu : aritmetický průměr variační koeficient koeficient asymetrie rozdělení 60
Konstrukce čáry překrop ekročení rozdělení 61
Binomické rozdělen lení = rozdělen lení diskrétn tní náhodné veličiny iny Udává rozdělen lení výsledků při i opakování jednoho a téhot hož pokusu za stejných podmínek. Výsledkem pokusu mohou být pouze 2 alternativy: A nebo B. rozdělení 62
Binomické rozdělen lení Pravděpodobnost, že e nastane alternativa A označme jako p Pravděpodobnost, že e nastane alternativa A označme jako q Potom platí p + q = 1 rozdělení 63
Binomické rozdělen lení Za předpokladu, p že e provedeme uvažovaný pokus n krát,, hledáme pravděpodobnost, podobnost, že alternativa A (s pravděpodobnost podobností p) nastane právě x krát. rozdělení 64
Binomické rozdělen lení Výpočet pravděpodobnosti: podobnosti: n! f ( x) =. px. qn x x! n x! ( ) rozdělení 65
Binomické rozdělen lení Předchozí rovnice vyjadřuje rozdělen lení pravděpodobnost podobností binomického rozdělen lení rozdělení 66
Binomické rozdělen lení Příklad: Jak vypadá rozložen ení pravděpodobnost podobností pro: n = 8 p = a) 0,1 b) 0,25 c) 0,5 d) 0,75 e) 0,9 rozdělení 67
Binomické rozdělen lení Základní momenty binomického rozdělen lení : µ = σ = α = n. p n. p. q 1 2 p n. p. q 1 6. p. q ε = n. p. q rozdělení 68
Speciáln lní rozdělen lení rozdělení 69
Speciáln lní rozdělen lení Při i testování statistických hypotéz z využíváme poznatku, že e testovací kritéria ria mají některé z následujících ch rozdělen lení. rozdělení 70
Rozdělen lení 2 χ [chí kvadrát] Předpoklad: Ze základnz kladního souboru, který mám normované normáln lní rozdělen lení provedeme náhodný n výběr r n prvků,, které označíme x 1, x 2 x n. rozdělení 71
Rozdělen lení 2 χ [chí kvadrát] Součet druhých mocnin x 1, x 2 x n se označuje jako χ 2. 2 χ Hodnota můžm ůže e nabývat výběr r od výběru různých hodnot v intervalu od 0 do +. +. Je tedy náhodnou veličinou, inou, která má své vlastní rozdělen lení χ 2. rozdělení 72
Rozdělen lení 2 χ [chí kvadrát] Frekvenční a distribuční funkce: f F ν ν χ 2 ( ) χ 2 ( ) rozdělení 73
Rozdělen lení 2 χ [chí kvadrát] ν 2 jediný parametr χ rozdělení, nazývá se počet stupňů volnosti 2 a je v případě χ rozdělení roven počtu sčítanců, čili rozsahu náhodného výběru n. rozdělení 74
Rozdělen lení 2 χ [chí kvadrát] Každé hodnotě ν = n příslup sluší tedy jiná křivka. S rostoucí hodnotou ν 2 se χ rozdělen lení blíží rozdělen lení normáln lnímu. rozdělení 75
Rozdělen lení 2 χ [chí kvadrát] = používá se pro ověř ěření nezávislosti náhodných n veličin in rozdělení 76
Studentovo t - rozdělen lení Předpoklad: Aritmetický průměr r výběrov rového souboru se můžm ůže více či i méněm lišit it od průměru ru základnz kladního souboru. rozdělení 77
Studentovo t - rozdělen lení Pro hodnocení odchylek x µ byla x µ t =. n 1 s definována na náhodnn hodná veličina ina, které přísluší tzv. t rozdělen lení (Studentovo rozdělen lení). rozdělení 78
Studentovo t - rozdělen lení Spojitá náhodná veličina ina t můžm ůže e nabývat hodnot od - do +. +. Frekvenční funkci t rozdělen lení budeme označovat ovat q ( t) ν je souměrn rná podle osy jdoucí jejím m vrcholem a mám jediný parametr = n - 1 ν rozdělení 79
Studentovo t - rozdělen lení S rostoucím počtem stupňů volnosti se t rozdělení blíží normálnímu. Shoda nastane až při ν =. V praxi však můžeme t rozdělení považovat za normální při > 30. ν rozdělení 80
F - rozdělen lení (Fischerovo Snedecorovo) Předpoklad: Máme dvě nezávisl vislé náhodné veličiny, iny, které mají χ 2 rozdělen lení s ν ν 2 stupni volnosti. Potom veličina ina F, určen ená jako jejich poměr má tzv. F rozdělen lení. 1 rozdělení 81
5. Odhady parametrů rozdělení 82
5. Odhady parametrů Základní soubor Výběr, výběrový soubor Náhodný výběr rozdělení 83
5. Odhady parametrů Neznáme charakteristiky základnz kladního souboru odhadujeme pomocí příslušných výběrových charakteristik s určitou přesnostp esností a spolehlivostí. Přesnost odhadu dané charakteristiky je určena násobkem středn ední výběrov rové chyby, kterou je směrodatn rodatná odchylka příslup slušné charakteristiky ze všech teoreticky možných. Spolehlivost odhadu je dána d pravděpodobnost podobností,, se kterou je možné určitý odhad považovat ovat za správný. rozdělení 84
5. Odhady parametrů Určen ení přesnosti a spolehlivosti odhadu předpokládá znalost rozdělen lení výběrových charakteristik. Rozlišujeme výběry s malým a velkým rozsahem (hranice n = 30). U velkých výběrů se výběrov rové rozdělen lení aproximuje většinou v normáln lním rozdělen lením. rozdělení 85
5. Odhady parametrů Reprezentativnost výběru dosahujeme nejčast astěji náhodným výběrem. Náhodný výběr r s opakováním x bez opakování rozdělení 86