Příklady k třetímu testu - Matlab 18. dubna 2013 Instrukce: Projděte si všechny příklady. Každý příklad se snažte pochopit. Pak vymyslete a naprogramujte příklad podobný. Tím se ujistíte, že příkladu rozumíte. Další příklady najdete na stránkách Ivana Nagye nebo Pavly Pecherkové. Učivo: Práce se statistickým balíčkem. Příkazy typu normal_cdf, poisson_rnd a podobně. Generování náhodných čísel s daným rozdělením Vygenerujte deset tisíc čísel s exponenciálním rozdělením s parametrem λ = 2. Čísla nechť jsou v řádkovém vektoru. Vykreslete histogram těchto čísel s 30 sloupci. Zadám do Command Window příkaz hlp a pak volbu 3. Najdeme si nápovědu k exponencálnímu rozdělení - exponential a ke generování náhodných čísel - _rnd. Zejména si všimněte parametrů a v jakém pořadí se píší. lambda - parametr rozdělení r - počet řádků c - počet sloupečků Mohu do Command Window zadat i příkaz pro nápovědu k funkci: help exponential_rnd. Otevřu si editor! X = exponential_ rnd ( 2, 1,10000); % lambda, 1 radek, 10000 sloupcu hist (X,30); %30 sloupcu 1
Vygenerujte deset tisíc čísel s normálním rozdělením se střední hodnotou 5 a rozptylem 3. Čísla nechť jsou v řádkovém vektoru. Vykreslete histogram těchto čísel s 50 sloupci. Zadám do Comand Window příkaz hlp a pak volbu 3. Najdeme si nápovědu k normálnímu rozdělení - normal a ke generování náhodných čísel - _rnd. Zejména si všimněte parametrů a v jakém pořadí se píší. m - µ - střední hodnota v - ν - rozptyl r - počet řádků c - počet sloupečků Mohu do Command Window zadat i příkaz pro nápovědu k funkci: help normal_rnd. Otevřu si editor! X= normal_rnd (5,3,1,10000); % N(5,3), 1 radek, 10000 sloupcu hist (X,50); %50 sloupcu 2
Vykreslení grafů hustoty pravděpodobnosti a distribuční funkce Vykreslete hustotu pravděpodobnosti pro exponenciální rozdělení s parametrem λ = 2. Rozsah osy x volte 0 až 18, krok 0,01. Zadám do Comand Window příkaz hlp a pak volbu 3. Najdeme si nápovědu k exponenciálnímu rozdělení - exponential a k výpočtu pravděpodobnostní funkce - _pdf. Zejména si všimněte parametrů a v jakém pořadí se píší. x - vektor hodnot x lambda - parametr rozdělení Mohu do Command Window zadat i příkaz pro nápovědu k funkci: help exponential_pdf. Otevřu si editor! X =0:0.01:18; Y= exponential_pdf (X,2); plot (X,Y); Porovnejte tvar křivky a histogram z prvního příkladu. Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí pro normální rozdělení: N(0, 1)- normální normované rozdělení - modře N(0, 9)- střední hodnota 0, rozptyl 9, směrodatná odchylka 3 - zeleně N(0, 1 4 )- střední hodnota 0, rozptyl 1 4, směrodatná odchylka 1 2 - fialově N(4, 1)- střední hodnota 2, rozptyl 1, směrodatná odchylka 1 - červeně Rozsah osy x volte -8 až 8, krok 0,01. 3
X = -8:0.01:8; Y1= normal_pdf (X,0,1); Y2= normal_pdf (X,0,9); Y3= normal_pdf (X,0,0.25); Y4= normal_pdf (X,4,1); hold on; plot (X,Y1, b ); plot (X,Y2, g ); plot (X,Y3, m ); plot (X,Y4, r ); Na grafu vidíme, jak parametry µ a ν ovlivňují tvar pravděpodobnostní funkce. Vykreslete do jednoho obrázku grafy pravděpodobnostní funkce pro: normální rozdělení N(10, 5) - modře binomické rozdělení se stejnou střední hodnotou a rozptylem Bi(20; 1 2 ) - červenými hvězdičkami. První parametr n v binomickém rozdělení znamená např. počet hodů mincí, druhý parametr p pravděpodobnost hodu jedničky. µ = n.p, σ 2 = ν = n.p. (1 p) Rozsah osy x volte 0 až 20, krok 0,01. X =0:0.01:20; Y1= normal_pdf (X,10,5); Y2= binomial_pdf (X,20,0.5); 4
hold on; plot (X,Y1, b ); plot (X,Y2, r* ); Vidíte rozdíl mezi podobnými rozděleními, kde ale jedno patří spojité a druhé diskrétní náhodné veličině. Červené hvězdičky v celých číslech leží téměř na modré křivce. Rozmyslete si, že jde o důsledek centrální limitní věty. Vidíme, že i pro dvacet hodů mincí je centrální limitní věta dobře splněna. Silná čarvená čára dole je nulová pravděpodobnost pro neceločíselné body. - Při házení mincí nemůžeme hodit tři a půl. Vykreslete do jednoho obrázku grafy distribuční funkce pro: normální rozdělení N(10, 5) - modře binomické rozdělení se stejnou střední hodnotou a rozptylem Bi(20; 1 2 ) - červeně První parametr n v binomickém rozdělení znamená např. počet hodů mincí, druhý parametr p pravděpodobnost hodu jedničky. µ = n.p, σ 2 = ν = n.p. (1 p) Rozsah osy x volte 0 až 20, krok 0,01. X =0:0.01:20; Y1= normal_cdf (X,10,5); Y2= binomial_cdf (X,20,0.5); hold on; plot (X,Y1, b ); plot (X,Y2, r ); 5
Vidíte rozdíl mezi podobnými rozděleními, kde ale jedno patří spojité a druhé diskrétní náhodné veličině. Výška každého schodu odpovídá hodnotě pravděpodobnostní funkce v tomto bodě. Vykreslete do jednoho obrázku grafy pravděpodobnostní a distribuční funkce pro Poissonovo rozdělení s parametrem λ = 10. Tedy průměrný počet úspěchů (např. projetých aut) za jednotku času je 10. Rozsah osy x volte 0 až 20, krok 0,01. Pravděpodobnostní funkci vykreslete jen pro celočíselné hodnoty. X =0:0.01:20; XX =0:20; Y1= poisson_pdf (XX,10); Y2= poisson_cdf (X,10); hold on; plot (XX,Y1, b* ); plot (X,Y2, r ); Zde vidíme k sobě patřící pravděpodobnostní a distribuční funkci. Výška každého schodu odpovídá hodnotě pravděpodobnostní funkce v tomto bodě. 6
Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí: - pro binomické rozdělení Bi(6, 1 2 ) - (Šest hodů mincí, pravděpodobnost jedničky je 0,5. Střední hodnota je µ = n.p = 3.) - fialové o - pro Poissonovo rozdělení P o(3)- (Střední hodnota je také µ = λ = 3.) - černé + Rozsah osy x volte 0 až 20. Pravděpodobnostní funkce vykreslete jen pro celočíselné hodnoty. X =0:6; XX =0:20; Y1 = binomial_ pdf ( X, 6, 0. 5); % Protoze pri 6 pokusech muzeme v souctu hodit % nejvice 6, musíme mít definiční obor jen do 6!!! % Pozor na to!!! Y2 = poisson_ pdf ( XX, 3); % Zde může jít df obor libovolně daleko. hold on; plot (X,Y1, mo ); plot (XX,Y2, k+ ); Vidíme, že binomické a Poissonovo rozdělení mají odlišný průběh. Poissonovo rozdělení je sice limitou binomického (pro n a p 0, přičemž ovšem zachováváme střední hodnotu stejnou: µ = n.p = λ), avšak použitý parametr p = 0, 5 je příliš velký. Obě rozdělení používáme tehdy, když je výsledek celočíselný. Binomické rozdělení používáme tehdy, když je maximální možná hodnota omezezená. Např. při šesti hodech mincí mohu hodit maximálně šest. 7
Poissonovo rozdělení používáme tehdy, když maximální možná hodnota není omezezená.např. na silnici projedou v průměru tři auta za hodinu (µ = λ = 3), ale maximální možný počet projíždějících aut není určen. Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí: - pro binomické rozdělení Bi(500, 1 20 ) - (500 hodů nepoctivou mincí, pravděpodobnost jedničky je 0,05. Střední hodnota je µ = n.p = 25. Rozptyl σ 2 = ν = n.p. (1 p) = 23, 75) - fialové o - pro Poissonovo rozdělení P o(25)- (Střední hodnota je také µ = λ = 25.) - černé + - pro normální (= Gaussovo) rozdělení se stejnou střední hodnotou a rozptylem: N(25; 23, 75) - modrá čára Rozsah osy x volte 0 až 60. První dvě pravděpodobnostní funkce vykreslete jen pro celočíselné hodnoty. Třetí s krokem 0,01. X =0: 60; % Pro kazdou funkci si pripravime vlastni x XX =0:60; XXX =0:0.01:60; Y1= binomial_pdf (X,500,0.05); Y2= poisson_pdf (XX,25); Y3= normal_pdf (XXX,25,23.75); hold on; plot (X,Y1, mo ); plot (XX,Y2, k+ ); plot (XXX,Y3, b - ); 8
Vidíme, že všechna tři rozdělení se krásně překrývají. Poissonovo je podobné binomickému, protože mají stejné střední hodnoty (25) a n je velké (500) a p malé (0,05). Binomické je podobné normálnímu, protože mají stejné střední hodnoty (25) a rozptyl (23,75) a n je velké (500). Je to důsledek Centrální limitní věty. Binomické totiž vzniká součtem alternativních veličin, což je přesně situace z CLV. Kvantily Inteligenční qvocient je definován tak, aby měl normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15: N(100, 225). Od jakého IQ začíná nejinteligentnějších deset procent lidí? Hledáme tedy 90% kvantil. Najdeme si nápovědu k rozdělení normal a ke koncovce _inv. X =0.9; Y= normal_inv (X,100,225) % Chybi strednik ĨQ 0,90 = 119, 2 Inteligenční qvocient je definován tak, aby měl normální rozdělení N(100, 225). V jakém rozmezí má IQ 90% obyčejných lidí? Hledáme tedy 5% a 95% kvantil. Mezi nimi je oněch 90% obyčejných lidí. Najdeme si nápovědu k rozdělení normal a ke koncovce _inv. 9
X =[0.05,0.95]; Y= normal_inv (X,100,225) % Chybi strednik ĨQ 00,05 = 75, 3 ĨQ 0,95 = 124, 7 Typové příklady k testu Veličina X má exponenciální rozdělení s parametrem λ = 3. Vykreslete do jednoho obrázku příslušnou pravděpodobnostní funkci (modře) a distribuční funkci (červeně). Osu x volte od 0 do 20. Dále spočtěte medián tohoto rozdělení. Medián je vlastně 50% kvantil! X =0:0.01:20; Y= exponential_pdf (X,3); Z= exponential_cdf (X,3); hold on; plot (X,Y, b ); plot (X,Z, r ); Median = exponential_ inv (0.5,3) % Chybi strednik X 0,5 = 2, 0794 10
Vygenerujte 10 000 hodnot veličiny X 1, která má spojité rovnoměrné rozdělení od 2 do 5. Totéž proveďte pro veličiny X 2 až X 20. Získejte 10 000 hodnot Z = 20 i=1 X i. Vykreslete histogram veličiny Z s 50 sloupci. Máme na výběr funkci rand nebo uniform_rnd z balíčku. X = uniform_ rnd (2,5,20,10000); % Nahodne cislo od 2 do 5 %20 radku, 10000 hodnot % pro kazdou velicinu jeden Z= zeros (1,10000); for i =1:20 Z=Z+X(i,:); end ; hist (Z); Opět hezká ilustrace Centrální limitní věty. Inteligenční qvocient je definován tak, aby měl normální rozdělení N(100, 225). Vykreslete pravděpodobnostní funkci od 50 do 150 a spočtěte pravděpodobnost, že náhodně vybraný člověk bude mít IQ větší než 140. Distribuční funkce nám dá pravděpodobnost, že IQ bude menší než 140. Zbytek do 1 je hledaná hodnota. 11
X =50:0.01:150; Y= normal_pdf (X,100,225); plot (X,Y); XX =140; YY= normal_cdf (XX,100,225); Pravdepodobnost =1 - YY % Bez stredniku Pravděpodobnost, že náhodně vybraný člověk bude mít IQ větší než 140, je 0,0038. Hmotnost dospělých žen kmene Navaho má normální rozdělení N(58, 127). Jaká je pravděpodobnost, že náhodně vybraná žena bude mít 1. hmotnost do 60 kg. 2. hmotnost mezi 50 a 70 kg. 3. hmotnost nad 80 kg. 4. Do jaké hodnoty bude hmotnost 10% nejlehčích navažských žen? Spočteme distribuční funkci pro dotazované hmotnosti a příslušný kvantil. Pravdepodobnost1 = normal_ cdf (60,58,127) Pravdepodobnost2 = normal_cdf (70,58,127) - normal_cdf (50,58,127) Pravdepodobnost3 =1 - normal_ cdf (80,58,127) Hmotnost4 = normal_inv (0.1,58,127) 1. 57 % 12
2. 61,8 % 3. 2,6 % 4. 43,6 kg 13