tatistické rozdelenia

FYZ-230/00 Algoritmy vedeckotechnických výpo tov tatistické rozdelenia 1

Obsah Úvod, vlastnosti rozdelení pravdepodobnosti Rovnomerné rozdelenie Trojuholníkové rozdelenie Binomické rozdelenie Poissonovo rozdelenie Normálne rozdelenie Rozdelenie χ 2 Centrálna limitná veta Odhad veli iny 2

írenie chýb 3

Úvod Vlastnosti rozdelení pravdepodobnosti: P (x a, b ) = b a 1 = f(x) dx 1 = n i=1 P (x i) f(x) dx Distribu ná funkcia F (a) vyjadruje pravdepodobnos, ºe x a: F (a) = a f(x) dx n-tý moment rozdelenia α n je: α n = x n f(x) dx 4

Prvý moment nazývame stredná hodnota µ: µ = x = E(x) = xf(x) dx n-tý centrálny moment rozdelenia σ n je denovaný vzh adom na strednú hodnotu µ: σ n = (x µ) n f(x) dx Druhý centrálny moment nazývame disperzia D: D = σ 2 = (x µ) 2 f(x) dx Druhú odmocninu z disperzie D nazývame stredná kvadratická odchýlka Stredná hodnota a disperzia pre diskrétne hodnoty pravdepodobnosti: µ = N x j P (x j ), σ 2 = i=1 N (x j µ) 2 P (x j ) i=1 5

Marginálna hustota pravdepodobnosti f 1 (x) pre hustotu pravdepodobnosti dvoch náhodných premenných f(x, y): f 1 (x) = Stredná hodnota x v prípade f(x, y): f(x, y) dy µ x = xf 1 (x) dy =,, xf(x, y) dy dx Centrálny moment druhého rádu v prípade f(x, y): σ 2 x = σ 2 y =,,,, (x µ x ) 2 f(x, y) dy dx (y µ y ) 2 f(x, y) dy dx Kovariancia je zmie²aný centrálny moment druhého rádu, v prípade f(x, y): Cov(x, y) = Cov(y, x) =,, (x µ x )(y µ y )f(x, y) dy dx 6

Miera korelácií veli ín x, y: ρ xy = Cov(x, y) σ x σ y Ak dve náhodné veli iny x, y sú nezávislé, tak platí: ρ xy = 0 Kovariancia v prípade viacerých premenných: Cov(x i, x j ) =... (x i µ xi )(x j µ xj )f(x 1, x 2,..., x N ) dx n... dx 1 Variancia: Var(x i ) = Cov(x i, x i ) 7

Parametre rozdelení Pravdepodobnos alebo hustota pravdepodobnosti Stredná hodnota Stredná kvadratická odchýlka alebo disperzia 8

Rovnomerné rozdelenie Opisuje jav, ktorý má kon²tantnú hustotu pravdepodobnosti na kone nom intervale 0, x < a 1 f(x; a, b) = b a, x a, b 0, x > b Stredná hodnota: x = a+b 2 Disperzia: σ 2 = (b a)2 12 Získanie rozdelenia f(x; a, b), ak máme k dispozícii náhodnú veli inu rozdelením hustoty pravdepodobnosti na intervale 0, 1 : y s rovnomerným x = y(b a) + a Sú tom 2 náhodných veli ín s rovnomerným rozdelením hustoty pravdepodobnosti získane náhodnú veli inu s trojuholníkovým rozdelením hustoty pravdepodobnosti. 9

Rovnomerné rozdelenie f(x) 1 / (b - a) f(x) 0 a x b 10

Trojuholníkové rozdelenie f(x; a, b, c) = 0, x < a 2(x a), x a, c (b a)(c a) 2(b x) (b a)(b c), x c, b 0, x > b Stredná hodnota: x = a+b+c 3 11

Trojuholníkové rozdelenie f(x) 2 / (b - a) f(x) 0 a c b x 12

Binomické rozdelenie Ak veli ina môºe nadobudnú len 2 hodnoty (padne 6 pri hode kockou, hodnota javu je v intervale) a pravdepodobnos, ºe nadobudne hodnotu 1, je p, potom pravdepodobnos, ºe pri n pokusoch sa hodnota 1 realizuje p krát, je daná binomickým rozdelením. f(r; n, p) = n! r! (n r)! pr (1 p) n r r = 0, 1, 2,..., n p 0, 1 Stredná hodnota: r = np Disperzia: σ 2 = np(1 p) 13

0.5 0.4 Binomické rozdelenie, n = 10 p = 1 / 2 p = 1 / 6 p = 0.9 0.3 f(r) 0.2 0.1 0 0 2 4 6 8 10 r 14

Poissonovo rozdelenie Aproximácia binomického rozdelenia pre ve ký po et pokusov s kone nou strednou hodnotou µ = np Pre ve ké µ sa podobná na Gaussovo rozdelenie Popisuje javy, ktoré reprezentujú po et udalostí za jednotku asu po et rádioaktívnych rozpadov po et zákazníkov v obchode po et áut prechádzajúcich kriºovatkou f(k; µ) = µk e µ k! k = 0, 1, 2,... µ > 0 Stredná hodnota: µ Disperzia: σ 2 = µ 15

0.5 0.4 Poissonovo rozdelenie µ = 5 µ = 10 / 6 µ = 9 0.3 f(k) 0.2 0.1 0 0 2 4 6 8 10 k 16

Poissonovo rozdelenie v reálnej situácii Ladislaus Josephovich Bortkiewicz, 1898 Po as 20 rokov bolo v pruskej armáde v jednotke s 10 jazdcami 122 jazdcov ukopaných ko mi na smr. Treba zisti, i ide o náhodný jav. K dispozícii máme údaje o po te usmrtení na jednotlivých pozíciách pre v²etky roky. Máme 200 vojakorokov. V jednom vojakoroku môºe dôjs k viacerým usmrteniam (usmrtený vojak je nahradený novým). Stredný po et usmrtení na jeden vojakorok µ = 122/200 = 0,61. Pravdepodobnos k-usmrtení na jeden vojakorok, ak ide o náhodný jav: f(k; µ) = µk e µ k! k = 0, 1, 2,... µ = 0,61 17

# usmrtení / vojakorok pravdepodobnos # realizácií odhadnutý # realizácií 0 0.54335 108.6702 109 1 0.33144 66.2888 65 2 0.10109 20.2181 22 3 0.02056 4.1110 3 4 0.00313 0.6269 1 5 0.00038 0.0765 0 Vypo ítané hodnoty sa zhodujú s nameranými. I²lo o náhodný jav (nie sabotáº). 18

Normálne rozdelenie (Gauss) Normálne rozdelenie je tieº nazývané Gaussovým rozdelením. Z poh adu spracovania experimentálnych dát je najdôleºitej²ím rozdelením. Jeho dôleºitos je daná aj centrálnou limitnou vetou. Hustota pravdepodobnosti: f(x; µ, σ) = 1 σ (x µ) 2 2π e 2σ 2 Stredná hodnota µ a disperzia σ 2 sú priamo parametre funkcie hustoty pravdepodobnosti. Získanie rozdelenia f(x; µ, σ), ak máme k dispozícii náhodnú veli inu y s Gaussovým rozdelením hustoty pravdepodobnosti so strednou hodnotou 0 a disperziou 1: x = yσ + µ 19

0.4 0.35 0.3 0.25 Normálne rozdelenie µ = 0, σ = 1 µ = 1, σ = 1 µ = 0, σ = 2 f(x) 0.2 0.15 0.1 0.05 0-4 -2 0 2 4 x 20

Rozdelenie χ 2 Nech x 1, x 2,..., x n sú nezávislé náhodné veli iny s Gassovským rozdelením hustoty pravdepodobnosti. Potom suma z = n (x i µ i ) 2 má rozdelenie χ 2 (chí kvadrát) s n stup ami vo nosti χ 2 (n). i=1 σ 2 i Hustota pravdepodobnosti: f(z, n) = z n 2 1 e z 2 2 n 2 Γ ( ) n 2 Stredná hodnota: z = n Disperzia: σ 2 = 2 n Pretoºe stredná hodnota pre n stup ov vo nosti je n, veli ina χ 2 /n nazývaná redukovaný χ 2 alebo χ 2 na stupe vo nosti je uºito ná pri ohodnotení konzistentnosti modelu interpretujúceho dáta a dát. 21

0.5 0.4 Rozdelenie χ 2 n = 2 n = 5 n = 10 0.3 f(z) 0.2 0.1 0 0 5 10 15 20 z 22

Centrálna limitná veta Ak máme postupnos náhodných premenných x i, ktoré sú rozdelené pod a rôznych rozdelení hustoty pravdepodobnosti s kone nými strednými hodnotami a disperziami, potom centrálna limitná veta tvrdí, ºe pre dostato ne ve ké n suma n i=1 x i má pribliºne Gaussovo rozdelenie hustoty pravdepodobnosti. 23

Odhad veli iny Ak máme súbor N nezávislých meraní x i veli iny s konkrétnou ale neznámou strednou veli inou µ a disperziou σ 2, potom pre odhad strednej hodnoty a disperzie platí: N ˆσ 2 = 1 N 1 N i=1 ˆµ = x = 1 N i=1 x i (x i x) 2 = 1 N 1 ( N ) x 2 i N x 2 i=1 Disperzia ˆµ: ˆσ 2 µ = ˆσ2 N 24

írenie chýb Majme nieko ko veli ín x 1, x 2,..., x N ktoré sú získané meraním a sú za aºených chybami σ 1, σ 2,..., σ N. Tieto veli iny pouºijeme na výpo et al²ej veli iny Y = f(x 1, x 2,..., x N ). Na²ou úlohou je nájs chybu veli iny Y. Budeme predpoklada, ºe chyby sú rozdelené Gaussovsky Obmedzíme sa na lineárne leny z Taylorovho rozvoja Úvaha pre jednu premennú x = µ x ± σ x Rozloºenie veli iny Y = f(x) do radu okolo bodu µ x : Y = f(µ x ) + f(x) x (x µ x ) x=µx Dostaneme: µ Y = f(µ x ) 25

σ 2 Y = E ( (Y µ Y ) 2) = E ( =µy {}}{ f(µ x ) + f(x) x (x µ x ) µ Y x=µx ) 2 = = f(x) x 2 E ( (x µ x ) 2) = f(x) x=µ x x 2 x=µ x σ 2 x Pre viacrozmerný prípad Y = f(x 1, x 2,..., x N ) Taylorov rozvoj Y = f(µ 1, µ 2,..., µ N ) + N i=1 f(x 1, x 2,..., x N ) x i (x i µ i ) x1=µ1,x2=µ2,...,xn =µ N Stredná hodnota Y : µ Y = f(µ 1, µ 2,..., µ N ) Disperzia: σ 2 Y = E ( (Y µ Y ) 2) = i,j ( ) ( ) f f Cov(x i, x j ) x i x j 26

Ak veli iny x 1, x 2,..., x N sú nezávislé, tak Cov(x i, x j ) = 0 pre i j, disperzia Y je: σ 2 Y = N i=1 σ 2 i f(x 1, x 2,..., x N ) x i 2 x1=µ1,x2=µ2,...,x N =µ N 27

írenie chýb príklad y = x 2 σ 2 y = σ 2 x ( ) x 2 2 x = σ 2 x (2x) 2 = σx4x 2 2 y = xx, budeme po íta s kaºdým x zvlá² : y = x L x R ( ) 2 ( ) 2 σy 2 = σx 2 xl x R x + σ 2 xl x R ( ) ( L x x = σ 2 R x x 2 R + x 2 L = σ 2 x x 2 + x 2) = σx2x 2 2 Chybný výsledok, veli iny x L a x R nie sú nezávislé! 28