STATISTIKA A ANALÝZA DAT. Jan Picek. Katedra aplikované matematiky. doktorandské studium na EF TUL 2013/2014

Rozměr: px
Začít zobrazení ze stránky:

Download "STATISTIKA A ANALÝZA DAT. Jan Picek. Katedra aplikované matematiky. doktorandské studium na EF TUL 2013/2014"

Transkript

1 STATISTIKA A ANALÝZA DAT Katedra aplikované matematiky doktorandské studium na EF TUL 2013/2014

2 KONTAKT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická budova H (4.patro), Voroněžská 13 tel , konzultační hodiny:út 9:00-10:30 jan.picek@tul.cz

3 POŽADAVKY Požadavky: Zpracování semestrální práce zaměřené na využití statistických metod ve vazbě na téma disertační práce. Ústní komisionální zkouška.

4 LITERATURA ANDĚL, J.. 4. vyd. Praha: Matfyzpress, ISBN HEBÁK, P. a kol. Vícerozměrné statistické metody, díl vyd. Praha: Informatorium, ISBN HENDL, J. Přehled statistických metod zpracování dat. Portál: Praha, 2012 (4.vyd.). ISBN MELOUN, M. a J. MILITKÝ. Kompendium statistického zpracování dat. 2. vyd. Praha: Academia, ISBN PECÁKOVÁ, I. Statistika v terénních průzkumech. 2. vyd. Praha: Professional Publishing, ISBN ŘEZANKOVÁ, H., D. HÚSEK a V. SNÁŠEJ. Shluková analýza dat. 2. vyd. Praha: Professional Publishing, ISBN

5 LITERATURA JUREČKOVÁ, J. a J. PICEK. Robust statistical methods with R. 1st ed. Boca Raton: Chapman & Hall, ISBN WARNER, R. M. Applied Statistics: From Bivariate Through Multivariate Techniques. 2nd ed. Thousand Oaks: SAGE Publications, ISBN

6 LITERATURA Jaroslav Ramík: v marketingu friesl/hpsb/tit.html

7 ÚVOD Motto: "Vystačím si s průměrem...", "Co po mne chcete, to je přece výsledek z počítače..."

8 ÚVOD Motto: "Vystačím si s průměrem...", "Co po mne chcete, to je přece výsledek z počítače..." I tak jednoduchý ukazatel, jako je aritmetický průměr, může mít vlastnosti, které překvapí.

9 ÚVOD Motto: "Vystačím si s průměrem...", "Co po mne chcete, to je přece výsledek z počítače..." I tak jednoduchý ukazatel, jako je aritmetický průměr, může mít vlastnosti, které překvapí. Příklad č. 1: Naprostá většina lidí má nadprůměrný počet nohou

10 ÚVOD Motto: "Vystačím si s průměrem...", "Co po mne chcete, to je přece výsledek z počítače..." I tak jednoduchý ukazatel, jako je aritmetický průměr, může mít vlastnosti, které překvapí. Příklad č. 1: Naprostá většina lidí má nadprůměrný počet nohou Příklad č. 2: Dvě firmy na trhu zabývající se stejnou činností uvádí průměrnou mzdu. První ji má Kč a druhá Kč.

11 ÚVOD 1. firma: 10 dělníků adm. pracovníci zástupce ředitele ředitel

12 ÚVOD 1. firma: 10 dělníků adm. pracovníci zástupce ředitele ředitel průměr

13 ÚVOD 1. firma: 10 dělníků adm. pracovníci zástupce ředitele ředitel průměr firma: 100 dělníků adm. pracovníků zástupci ředitele ředitel

14 ÚVOD 1. firma: 10 dělníků adm. pracovníci zástupce ředitele ředitel průměr firma: 100 dělníků adm. pracovníků zástupci ředitele ředitel průměr

15 ÚVOD Opustíme-li průměry, situace může být ještě zamotanější okres A okres B kategorie ženy muži celkem ženy muži celkem mladší starší celkem V mladší věk. kategorii je podíl žen v okrese A větší než v okrese B: 5 11 = 45,5% > 3 7 = 42,9% Ve starší věkové kategorie je to stejné: 6 9 = 66,7% > 9 14 = 64,3%

16 ÚVOD Opustíme-li průměry, situace může být ještě zamotanější okres A okres B kategorie ženy muži celkem ženy muži celkem mladší starší celkem V mladší věk. kategorii je podíl žen v okrese A větší než v okrese B: 5 11 = 45,5% > 3 7 = 42,9% Ve starší věkové kategorie je to stejné: 6 9 = 66,7% > 9 14 = 64,3% Je podíl žen v okrese A větší než v okrese B?

17 ÚVOD Opustíme-li průměry, situace může být ještě zamotanější okres A okres B kategorie ženy muži celkem ženy muži celkem mladší starší celkem V mladší věk. kategorii je podíl žen v okrese A větší než v okrese B: 5 11 = 45,5% > 3 7 = 42,9% Ve starší věkové kategorie je to stejné: 6 9 = 66,7% > 9 14 = 64,3% Je podíl žen v okrese A větší než v okrese B? NE = 55,0% > = 57,1%

18 ÚVOD Okres Podíl žáků na gymnáziích Jablonec 38.6% Semily 29.0% Liberec 18.6%

19 ÚVOD Okres Podíl žáků na gymnáziích Jablonec 38.6% Semily 29.0% Liberec 18.6% Okres počet Studenti Podíl Jablonec % Semily % Liberec %

20 ÚVOD Okres Podíl žáků na gymnáziích Jablonec 38.6% Semily 29.0% Liberec 18.6% Okres počet Studenti Podíl Bydlí Podíl Jablonec % % Semily % % Liberec % %

21 MĚŘENÉ ZNAKY A MĚŘÍCÍ ŠKÁLY Vlastnosti, které jsou podrobovány měření, označujeme jako znaky. Znak je měřen na vhodné zvolené škále, stupnici.

22 MĚŘENÉ ZNAKY A MĚŘÍCÍ ŠKÁLY Vlastnosti, které jsou podrobovány měření, označujeme jako znaky. Znak je měřen na vhodné zvolené škále, stupnici. Měření rozdělujeme podle typu: 1. Metrické (kardinální) 2. Ordinální 3. Nominální (jmenné)

23 DATA: TŘÍDĚNÍ Předmětem zájmu obvykle není jediný, izolovaný objekt, ale soubor objektů. Pozorování či měření se podrobují všichny prvky tohoto souboru. Pro každou ze sledovaných vlastností, definujících znak, tak dostáváme soubor údajů odečítaných na příslušných škálách - tj. data x 1,...,x n.

24 DATA: TŘÍDĚNÍ Předmětem zájmu obvykle není jediný, izolovaný objekt, ale soubor objektů. Pozorování či měření se podrobují všichny prvky tohoto souboru. Pro každou ze sledovaných vlastností, definujících znak, tak dostáváme soubor údajů odečítaných na příslušných škálách - tj. data x 1,...,x n. 174, 178, 183, 168, 163, 175, 178, 177, 169, 182, 188, 176, 177, 178, 184, 185, 170, 168, 157, 158, 174, 174, 173, 171, 168, 170, 172, 174, 176, 179, 179, 188, 186, 181, 180, 169, 172, 174, 165, 164, 156, 174, 184, 182, 181, 172, 176, 177, 185, 181, 178, 175, 170, 168, 180, 183, 183, 181, 180, 173, 175, 177, 179, 164, 161, 172, 174, 178, 184, 176, 179, 162, 182, 177.

25 DATA: TŘÍDĚNÍ Třídní rozdělení četností: Interval absol. relativ. kumul.abs. kumul.rel. 156, 161) , 166) , 171) , 176) , 181) , 186) , 191)

26 DATA: TŘÍDĚNÍ Počet a volba tříd: mnoho málo Doporučení: M = 1+3.3log(n) Stugarsovo pravidlo M = n odmocninové pravidlo

27 DATA: TŘÍDĚNÍ Histogram

28 DATA: TŘÍDĚNÍ Pohlaví Kuřák Nekuřák Muž Žena Známka počet žáků

29 DATA: POPIS Základní úlohou, které řeší popis dat, je úloha kondenzace, zhuštění informace v datech obsažené, tak že se původní primární data zredukují do mnohem menšího počtu údajů, tzv. charakteristik souboru: polohy variability (proměnlivosti) vzájemného vztahu, souvislosti mezi měřenými daty...

30 CHARAKTERISTIKY POLOHY 1 aritmetický průměr citlivý na hrubé chyby, pouze pro metrický znak x = 1 n x i. n i=1

31 CHARAKTERISTIKY POLOHY 1 aritmetický průměr citlivý na hrubé chyby, pouze pro metrický znak x = 1 n x i. n 2 výběrový medián "robustní" - není ovlivněn i velkými změnami několika hodnot. n liché: ˆx = x ( n+1 2 ) i=1

32 CHARAKTERISTIKY POLOHY 1 aritmetický průměr citlivý na hrubé chyby, pouze pro metrický znak x = 1 n x i. n 2 výběrový medián "robustní" - není ovlivněn i velkými změnami několika hodnot. n liché: ˆx = x ( n+1 ( 2 ) ) n sudé: ˆx = 1 x 2 ( n 2 ) +x ( n 2 +1). 3 modální hodnota (modus) x je definován jako nejčetnější hodnota. Obecně není určena jednoznačně. i=1

33 CHARAKTERISTIKY POLOHY setříděná data: x (1) x (2)... x (n)

34 CHARAKTERISTIKY POLOHY α-kvantil x α ( α (0,1)) x α = x ( αn ), kde a označuje a, pokud je to celé číslo, jinak nejbliží vyšší celé číslo. Kromě mediánu, což je kvantil pro α = 0.5, se často užívají i kvartily, x 0.25 a x 0.75.

35 CHARAKTERISTIKY POLOHY

36 CHARAKTERISTIKY VARIABILITY

37 CHARAKTERISTIKY VARIABILITY Rozptyl (variance, disperze) - průměrná kvadratická odchylka od průměru ( s 2 = 1 n n ) (x i x) 2 = 1 x 2 i n x 2 n n i=1 směrodatná odchylka s = s 2 střední chyba s n i=1 variační koeficient v = s x - definován pouze pro x 1,...,x n > 0.

38 CHARAKTERISTIKY VARIABILITY průměrná absolutní odchylka d = 1 n n x i ˆx i=1 rozpětí R = x (n) x (1) mezikvartilové rozpětí R M = x 0.75 x 0.25 entropie (pro nominální znak) h = r i=1 n ( i n log ni ) n

39 DALŠÍ CHARAKTERISTIKY 1 Obecný moment k tého řádu m k = 1 n x k n i, k = 0,1,... i=1 2 Centrální moment k tého řádu m k = 1 n (x i x) k, k = 0,1,... n i=1 3 šikmost míra (ne)symetrie 4 špičatost a 3 = m 3 s 3 a 4 = m 4 s 4

40 Průměr je x = 1 n výběrový rozptyl s 2 = 1 n směrodatná odchylka n x i = , i=1 n (x i x n ) 2 = 51.72, i=1 s = s 2 = 7.19, variační koeficient v = = 0.041, s x šikmost špičatost a 3 = 1 n n i=1 (x i x) 3 s 3 1 n n i=1 (x i x) 4 = 0.629,

41 CHARAKTERISTIKY - BOX PLOT č. výška výška otce výška matky váha tuk

42 CHARAKTERISTIKY - BOX PLOT č. výška výška otce výška matky váha tuk

43 CHARAKTERISTIKY - BOX PLOT

44 CHARAKTERISTIKY VZTAHU

45 CHARAKTERISTIKY VZTAHU Statistiky ukazují, že 10% dopravních nehod způsobují opilí řidiči. Z toho plyne, že zbývajících 90% dopravních nehod je způsobeno střízlivými řidiči. Nemělo by se tedy střízlivým řidičům zakázat řízení vozidel?

46 CHARAKTERISTIKY VZTAHU (x 1,y 1 ),...,(x n,y n ) korelační koeficient: r x,y = C x,y s x s y. kovariance: C x,y = 1 n ( n n (x i x)(y i ȳ) = 1 x i y i ) xȳ, n i=1 i=1

47 CHARAKTERISTIKY VZTAHU Korelační matice (výška, výška otce, výška matky, váha, tuk):

48 CHARAKTERISTIKY VZTAHU Spearmanův korelační koeficient R i a Q i je pořadí r S = 1 6 n(n 2 1) n (R i Q i ) 2 i=1

49 CHARAKTERISTIKY VZTAHU Žák (i) x i y i R i Q i , , , ,5 6

50 CHARAKTERISTIKY VZTAHU Žák (i) x i y i R i Q i , , , ,5 6 r S = 0.266

51 CHARAKTERISTIKY VZTAHU Pohlaví Kuřák Nekuřák Muž Žena

52 CHARAKTERISTIKY VZTAHU Pohlaví Kuřák Nekuřák Muž Žena Míry asociace založeny na χ 2 = r i=1 ( s nij n i.n j. j=1 n i. n j. n n ) 2 např. χ C = 2 χ 2 +n

53 CHARAKTERISTIKY VZTAHU Pohlaví Kuřák Nekuřák Muž Žena C = Míry asociace založeny na χ 2 = r i=1 ( s nij n i.n j. j=1 n i. n j. n n ) 2 např. χ C = 2 χ 2 +n

54 INDUKTIVNÍ STATISTIKA - ÚVOD Příklad: placení školného, dotáži se několika vybranných jedinců: 1. 7 osob, 1x ANO, 7x NE pro je 1 7 = = 14.3(%)

55 INDUKTIVNÍ STATISTIKA - ÚVOD Příklad: placení školného, dotáži se několika vybranných jedinců: 1. 7 osob, 1x ANO, 7x NE pro je 1 7 = = 14.3(%) Kolik osob do šetření vybrat?

56 INDUKTIVNÍ STATISTIKA - ÚVOD Příklad: placení školného, dotáži se několika vybranných jedinců: 1. 7 osob, 1x ANO, 7x NE pro je 1 7 = = 14.3(%) Kolik osob do šetření vybrat? osob, 430x ANO, 2570x NE pro je = = 14.3(%)

57 INDUKTIVNÍ STATISTIKA - ÚVOD Příklad: placení školného, dotáži se několika vybranných jedinců: 1. 7 osob, 1x ANO, 7x NE pro je 1 7 = = 14.3(%) Kolik osob do šetření vybrat? osob, 430x ANO, 2570x NE pro je = = 14.3(%) Přesnost - tzv. intervalové odhady, kvalita - reprezentativnost

58 INDUKTIVNÍ STATISTIKA - ÚVOD Intervalový odhad: 1) (0.4%,57.9%) 2) (13.1%,15.6%)

59 INDUKTIVNÍ STATISTIKA - ÚVOD Intervalový odhad: 1) (0.4%,57.9%) 2) (13.1%,15.6%) Základní soubor - úplné šetření Vzorek - výběrové šetření

60 INDUKTIVNÍ STATISTIKA - ÚVOD Matematická statistika řeší dvě základní úlohy: odhady (v základním souboru) rozhodovací problémy (testování hypotéz) Obvykle předpokládáme, že pro danou situaci známe vhodný model (distribuční funkci, hustotu aj.) až na hodnotu parametrů. Úlohy jsou pak převedeny na úvahy o těchto parametrech.

61 ODHADY bodový (odhad číslem) intervalový - interval, který s předepsanou pravděpodobností (1 α) pokrývá hodnotu neznámého parametru

62 PRAVDĚPODOBNOST Předmětem teorie pravděpodobnosti je studium náhodných dějů, tj. takových dějů, jejichž výsledek není předem jednoznačně určen a očekává se pouze, že výsledek bude jedním z dané množiny možných výsledků Ω neprázdná abstraktní množina. Počet jejích prvků může být konečný, spočetný, ale i nespočetný. Náhodnému ději budeme říkat náhodný pokus. Výsledkem pokusu mohou být čísla, číselné vektory, číselné posloupnosti, časový průběh nějaké funkce na daném intervalu, ale i libovolný kvalitativní ukazatel. Všechny možné výsledky pokusu ω Ω nazýváme elementárními jevy. Podmnožiny množiny Ω nazýváme jevy

63 PRAVDĚPODOBNOST Klasická definice pravděpodobnosti. Tato definice je použitelná v případech, kdy situace je popsána konečným počtem n různých výsledků (elementárních jevů ω), z nichž každý je "stejně možný". Potom P(A) = m(a) n, kde m(a) je počet elementárních jevů, které tvoří náhodný jev A.

64 PRAVDĚPODOBNOST Náhodná veličina Cíl: matematický popis náhodných jevů ("kvantifikovace" popisu - vyjádření pomocí reálných čísel.) odpovědi v anketě "ano", "ne" "1", "0", "kvalita výrobku" označení 1,2,3,... pro třídy kvality, Často je už náš základní prostor jevů částí R (výsledky měření, doba bezporuchového provozu, počet výrobků za směnu atd.).

65 PRAVDĚPODOBNOST Náhodnou veličinou budeme nazývat zobrazení X : Ω R. Náhodná veličina se vyznačuje rozdělením pravděpodobnosti na R, což není nic jiného než původní pravděpodobnost na Ω převedená na R. Existují dva typy náhodných veličin, náhodná veličina s diskrétním rozdělením pravděpodobnosti a náhodná veličina se spojitým rozdělením pravděpodobnosti.

66 PRAVDĚPODOBNOST Diskrétní rozdělení Řekneme, že náhodná veličina X je náhodná veličina s diskrétním rozdělením pravděpodobnosti, jestliže existuje nejvýše spočetně mnoho bodůx j a nejvýše spočetně mnoho kladných čísel p j = P(X = x j ) > 0, splňujících j P(X = x j) = 1. Funkci P X (x j ) = P(X = x j ) nazýváme pravděpodobnostní funkcí.

67 PRAVDĚPODOBNOST Řekneme, že náhodná veličina X je náhodná veličina s (absolutně) spojitým rozdělením, jestliže existuje nezáporná reálná funkce f X reálné proměnné taková, že P(a X < b) = pro libovolná reálná a,b; a b. b a f X (x)dx Funkce f X se nazývá hustotou rozdělení pravděpodobnosti.

68 PRAVDĚPODOBNOST Distribuční funkcí náhodné veličiny X budeme nazývat reálnou funkci reálné proměnné, pro kterou platí F X (x) = P(X < x).

69 PRAVDĚPODOBNOST Vlastnosti distribuční funkce 1. 0 F X (x) 1 pro všechna reálná x. 2. F X je neklesající funkce, tj. F X (x 1 ) F X (x 2 ) pro každé x 1,x 2 R,x 1 < x Pro libovolná reálná čísla a,b R;a < b platí P(a X < b) = F X (b) F X (a). 4. lim F X(x) = 0, lim F X (x) = 1. x x 5. F X je zleva spojitá v libovolném bodě x R. 6. Pro libovolné reálné číslo x R platí P(X = x) = lim t x+ F X (t) F X (x). 7. Distribuční funkce má nejvýše spočetně mnoho bodů nespojitosti.

70 PRAVDĚPODOBNOST Číselné charakteristiky Rozdělení pravděpodobnosti dává úplnou informaci o náhodném chování náhodné veličiny. Při vyhodnocování pokusů a sledování náhodných jevů však často vystačíme se znalostí jen některých zvláštních charakteristik, které odráží nějakou důležitou stránku tohoto pokusu resp. náhodného jevu.

71 PRAVDĚPODOBNOST Nejdůležitější z takovýchto charakteristik je hodnota, kolem které se kumulují hodnoty náhodné veličiny. Tuto hodnotu nazýváme střední hodnotou, někdy též hovoříme o očekávané hodnotě. EX = i I x i P(X = x i ). resp. EX = + xf X (x)dx.

72 PRAVDĚPODOBNOST Rozptyl Kromě střední hodnoty, nejužívanějším momentem je druhý centrální, tzv. rozptyl (variance) náhodné veličiny resp. varx = E(X EX) 2 = i I (x i EX) 2 P(X = x i ). varx = E(X EX) 2 = + (x EX) 2 f X (x)dx Druhou odmocninu z rozptylu nazýváme směrodatnou odchylkou (σ).

73 PRAVDĚPODOBNOST Vlastnosti rozptylu a střední hodnoty. 1. varx varx = EX 2 (EX) Necht a,b R a X je náhodná veličina, potom platí var(a+bx) = b 2 varx a E(a+bX) = a+bex. 4. Nemusí existovat.

74 PRAVDĚPODOBNOST Je-li g funkce, pak Eg(X) = i I g(x i )P(X = x i ). resp. Eg(X) = + g(x)f X (x)dx.

75 PRAVDĚPODOBNOST Obecné a centrální momenty Obecný moment r-tého řádu µ r = EX r = i I x r i P(X = x i ), r = 1,2,..., resp. µ r = EX r = + x r f X (x)dx.

76 PRAVDĚPODOBNOST Centrální moment r-tého řádu µ r = E(X EX) r = i I (x i EX) r P(X = x i ) resp. µ r = E(X EX) r = + (x EX) r f X (x)dx Šikmost a špičatost: α 3 = α 3 (X) = µ 3 σ 3, α 4 = α 4 (X) = µ 4 σ 4 ( 3)

77 PRAVDĚPODOBNOST Kvantilové číselné charakteristiky Necht X náhodná veličina s distribuční funkci F X. Potom funkce F 1 X daná vztahem F 1 X (α) = inf{x; F X(x) α} 0 < α < 1, se nazývá kvantilová funkce. Hodnotám funkce F 1 X (α) říká α-kvantil (nebo 100α%-ní kvantil).

78 PRAVDĚPODOBNOST Mediánem x rozumíme 50%-ní kvantil. Dolním kvartilem x 0.25 rozumíme 25%-ní kv. Horním kvartilem x 0.75 rozumíme 75%-ní kv. k-tým decilem rozumíme F 1 X (k/10) pro k = 1,2,...,9. k-tým percentilem rozumíme F 1 X (k/100) pro k = 1,2,...,99. mezikvartilové rozpětí x 0.75 x 0.25

79 PRAVDĚPODOBNOST Používaná diskrétní rozdělení

80 PRAVDĚPODOBNOST Alternativní rozdělení X Alt(p) Necht náhodná veličina X nabývá pouze dvou hodnot 0 a 1, a to s pravděpodobnostmi P(X = 1) = p, P(X = 0) = (1 p), kde 0 < p < 1. Rozdělení se někdy označuje jako 0 1. EX = p, varx = p(1 p)

81 PRAVDĚPODOBNOST Binomické rozdělení X Bi(n, p) Necht náhodná veličina X nabývá hodnot 0,1,...,n s pravděpodobnostmi ( ) n P(X = i) = p i (1 p) n i, i = 0,1,...,n, i kde 0 < p < 1. EX = np, varx = np(1 p)

82 PRAVDĚPODOBNOST Binomické rozdělení X Bi(n, p) Binomickým rozdělením se řídí četnost nějakého jevu A v n nezávislých pokusech, když v každém pokusu je pravděpodobnost jevu A stále stejná a je rovna p.

83 PRAVDĚPODOBNOST Poissonovo rozdělení X P o(λ) Necht X je náhodná veličina nabývající hodnot i = 0,1,2,... s pravděpodobnostmi kde λ > 0 je dané číslo. P(X = i) = λi i! e λ, EX = var(x)

84 PRAVDĚPODOBNOST Poissonovo rozdělení X P o(λ) Nejčastěji se používá pro popis pravděpodobnosti počtu událostí v nějakém časovém intervalu. (počet telefonních hovorů, dopravních nehod, příchodů zákazníků do obchodu apod.) Poissonovo rozdělení je možno také použít místo binomické náhodné veličiny X Bi(n,p), přičemž n je velmi velké číslo, p je velmi malé číslo a součin λ = np je stálý.

85 PRAVDĚPODOBNOST Geometrické rozdělení X Ge(p) Uvažujme náhodnou veličinu X, která nabývá hodnot i = 0,1,2,..., a to s pravděpodobnostmi kde p (0,1) je parametr. P(X = i) = p(1 p) i, EX = 1 p, varx = (1 p)p2 p

86 PRAVDĚPODOBNOST Geometrické rozdělení X Ge(p) Sledujme výskyt jevu A v nezávislých opakováních náhodného pokusu, přičemž pravděpodobnost jevu A je v každém pokusu rovna p. Náhodná veličina s geometrickým rozdělením udává počet nezávislých opakování onoho náhodného pokusu před prvním výskytem jevu A.

87 PRAVDĚPODOBNOST Hypergeometrické rozdělení X Hg(N, n, M) Necht N,M a n jsou přirozená čísla taková, že M < N, n < N. Necht X nabývá pouze celočíselných hodnot i s pravděpodobnostmi ) P(X = i) = ( M )( N M i n i ( N n), pro max(0,m +n N) i min(m,n). EX = na ( na(n A), var(x) = 1 n 1 ). N N 2 N 1

88 PRAVDĚPODOBNOST Hypergeometrické rozdělení X Hg(N, n, A) Toto rozdělení je možné popsat následující situací. Uvažujme množinu, která obsahuje N objektů, z nichž M má jistou vlastnost. Vybereme náhodně z této množiny n objektů. Potom X označuje počet vybraných objektů mající uvažovanou vlastnost.

89 PRAVDĚPODOBNOST Spojitá rozdělení

90 PRAVDĚPODOBNOST F X (x) = x f X (y)dy pro každé x R. Ve všech bodech, kde existuje derivace distribuční funkce F X, platí vztah df X (x) = f X (x). dx f X (x)dx = 1

91 PRAVDĚPODOBNOST Pro libovolná reálná čísla a,ba b platí P (a X b) = P (a < X b) = P (a X < b) = P (a < X < b) = b a f X (t)dt.

92 PRAVDĚPODOBNOST Rovnoměrné rozdělení { X R(a, b) 1 pro a < x < b f(x) = b a 0 pro x a nebo x b. 0 x a x a F(x) = a < x < b b a 1 x b. Dále je EX = (a+b) 2, var(x) = (b a)2. 12

93 PRAVDĚPODOBNOST Normální (Gaussovo) rozdělení X N(µ,σ) f(x) = 1 ( exp 1 ) (x µ) 2, prox R, 2πσ 2 σ 2 parametry: µ = EX a σ 2 = var(x). Distribuční funkce - nexistuje žádná explicitní formule. Hodnoty distribuční funkce s parametry 0, 1 velice přesně tabelovány.

94 PRAVDĚPODOBNOST 0.8 µ=0, σ= µ=0, σ=1 µ=2, σ=1 0.2 µ=0, σ= Graf hustoty normalního rozdělení pro různé hodnoty parametrů µ a σ.

95 PRAVDĚPODOBNOST Exponenciální rozdělení X Exp(c) { ce cx x 0 f(x) = 0 jinak, x { 1 e cx x 0 F X (x) = f(t)dt = 0 x < 0. EX = 1/c, var(x) = 1/c 2

96 PRAVDĚPODOBNOST Weibullovo rozdělení X Wb(c,d) Zobecněním exponenciálního rozdělení { 1 e cx d x 0 F(x) = 0 x < 0. s parametry c,d > 0. { cdx f(x) = d 1 exp( cx d ) x 0 0 x < 0.

97 PRAVDĚPODOBNOST c=2, d=1 c=1, d=1 c=1, d=2 0.2 c=1, d= Graf hustoty Weibullova rozdělení pro různé hodnoty parametrů c a d.

98 PRAVDĚPODOBNOST Cauchyovo rozdělení parametry θ a λ. f(x) = 1 π λ λ 2 +(x θ) 2, F(x) = π arctan ( x θ λ ). Toto rozdělení nemá střední hodnotu a rozptyl.

99 ODHADY Matematická statistika řeší dvě základní úlohy: odhady (v základním souboru) rozhodovací problémy (testování hypotéz) Obvykle předpokládáme, že pro danou situaci známe vhodný model (distribuční funkci, hustotu aj.) až na hodnotu parametrů. Úlohy jsou pak převedeny na úvahy o těchto parametrech.

100 ODHADY Informaci pro statistickou analýzu obdržíme ve formě dat, která považujeme za realizace zkoumaných náhodných veličin. Náhodným výběrem rozumíme vektor složený z nezávislých a stejně rozdělených náhodných veličin. Číslo n je rozsah výběru. Náhodný výběr je model pro situace, kdy pozorujeme n nezávislých, stejných" objektů, nebo opakujeme nezávisle n krát tentýž pokus. Náhodná veličina je modelem pro onu veličinu, kterou na daných objektech zkoumáme.

101 ODHADY "výběr" za rozumnou dobu a s rozumnými náklady schopni zjistit údaje jen o n vybraných objektech. Na základě výběru děláme závěry o charakteristikách celého souboru. Příklady: namátková či výběrová kontrola výrobků, výzkumy veřejného mínění, testování léčebných postupů. Důležitou otázka - reprezentativnost

102 ODHADY Mezi nejpoužívanější odhady : výběrový průměr a výběrový rozptyl S 2 = 1 n 1 X n = 1 n n i=1 X i n (X i X n ) 2 = 1 n n 1 ( Xi 2 n X n,) 2 i=1 i=1

103 ODHADY Necht X 1,...,X n je náhodný výběr z rozdělení, které má střední hodnotu µ a konečný rozptyl σ 2. Pak platí E X = µ, var X = σ2 n Necht X 1,...,X n je náhodný výběr N(µ,σ 2 ). Pak platí X N(µ,σ 2 /n).

104 ODHADY Necht X 1,...,X n je náhodný výběr z rozdělení, které má střední hodnotu µ a konečný rozptyl σ 2. Pak platí ES 2 = σ 2 vars 2 = σ 4 2n (n 1) 2 Necht X 1,...,X n je náhodný výběr N(µ,σ 2 ). Pak platí (n 1)S 2 /σ 2 χ 2 n 1 a X a S 2 jsou nezávislé.

105 ODHADY Náhodná veličina Z = m 1 Z2 j má χ 2 -rozdělení, když Z 1,Z 2,...,Z m jsou nezávislé stejně rozdělené veličiny z rozdělení N(0,1). Pak hustota Z je g m (z) = 1 2 m 2 Γ ( m 2 )e z 2 z m 2 1, pro z 0, Γ(p) je gamma-funkce, 0 x p 1 e x dx, pro p celé > 0 je Γ(p) = (p 1)!. E(Z) = n, var(z) = 2n

106 ODHADY Necht X 1,...,X n je náhodný výběr z rozdělení, které má střední hodnotu µ a konečný rozptyl σ 2. Pak platí ES 2 = σ 2 vars 2 = σ 4 2n (n 1) 2 Necht X 1,...,X n je náhodný výběr N(µ,σ 2 ). Pak platí (n 1)S 2 /σ 2 χ 2 n 1 a X a S 2 jsou nezávislé.

107 ODHADY Necht U, Z jsou nezávislé náhodné veličiny, kde U je normální N(0,1) a Z 2 má χ 2 -rozdělení o n stupních volnosti. Pak veličina T = U Z n má Studentovo t-rozdělení o n stupních volnosti dané hustotou h n (t) = ( ) n+1 1 ( nb n, ), t2 2 n < t <.

108 ODHADY Necht U, V jsou dvě nezávislé náhodné veličiny o χ 2 -rozděleních o n a m stupních volnosti. Rozdělení jejich podílu W = U/n V/m se pak nazývá F -rozdělení s n a m stupni volnosti a má hustotu g n,m (z) = g n,m = 0 n n 2 m m 2 z n 2 1 B( n 2,m 2)(m+nz) n+m 2 pro z > 0 jinak.

109 ODHADY Teorie bodového odhadu Náhodný výběr (reprezentuje data): nezávislé stejně rozdělené náhodné veličiny mají rozdělení z určité třídy rozdělení {F(x,θ)}, kde θ Θ R k je neznámý parametr. Uvažujeme tedy náhodný vektor X, jejíž rozdělení závisí na parametru θ. F X (x,θ) = n F(x i,θ) i=1

110 ODHADY Úkolem je odhad parametru θ. Parametr θ "charakterizuje vlastnost, kterou z dat chceme odhadnout." Odhad je obecně funkcí pozorovaných náhodných veličin, tj. T(X) z R n to R k (statistika). Odhad je opět náhodná veličina (vektor), konkrétní "odhad" aktuální hodnoty parametru θ je hodnota T(X), když x je realizace X. Cíl vybrat funkci statistiku T n (X), která by "co nejlépe" odhadovala neznámý parametr θ.

111 ODHADY Požadované vlastnosti odhadů: 1 Nestrannost (nevychýlenost): pro každé θ platí E θ T n (X) = θ. 2 Konzistence: lim n T n (X) = θ 3 Eficience (vydatnost): odhad T n (x) je eficientní, když pro každý jiný odhad T n(x) mající konečný druhý moment platí E θ {(T n (X) θ) 2 } E θ {(T n(x) θ) 2 } tj. pro nestranné odhady var θ (T n (X) var θ (T n(x))

112 ODHADY Metody odhadu Metoda maximální věrohodnosti Maximálně věrohodným odhadem parametru θ při naměřených hodnotách x 1,x 2,...,x n je hodnota θ 0 Θ, pro kterou je věrohodnostní funkce L θ (x) maximální. L θ (x) = n i=1 f(x i,θ) pro spojité, resp. P(X i = x i,θ) pro diskrétní rozložení pravděpodobnosti.

113 ODHADY Protože logl má maximum v témže bodě jako L, prakticky se často odhad hledá jako řešení věrohodnostní rovnice logl θ (x)/ θ = 0. Maximálně věrohodný odhad je konzistentní.

114 ODHADY Momentová metoda Porovnání teoretických a výběrových momentů

115 ODHADY Odhady: bodový (odhad číslem) intervalový - interval, který s předepsanou pravděpodobností (1 α) pokrývá hodnotu neznámého parametru

116 ODHADY Intervalový odhad: model normálního rozdělení 100(1 α)% interval pro µ a neznámé σ 2 : (X t n 1 (1 α/2) S n,x +t n 1 (1 α/2) S n ) pro µ a známé σ 2 : (X Φ 1 (1 α/2) σ n,x +Φ 1 (1 α/2) σ n ) t n 1 (1 α/2), Φ 1 (1 α/2) - kvantily (tabulkové hodnoty), α - zvolená (předepsaná) hodnota, obvykle 0.05, 0.01

117 ODHADY Intervalový odhad: model normálního rozdělení 100(1 α)% interval pro σ 2 : ( ) (n 1)S 2 χ 2 n 1(1 α/2), (n 1)S2 χ 2 n 1(α/2) χ 2 n 1(α/2) - kvantily (tabulkové hodnoty), α - zvolená (předepsaná) hodnota, obvykle 0.05, 0.01

118 ODHADY Intervalový odhad: model binomického rozdělení 100(1 α)% interval pro p: ( m n Φ 1 (1 α/2) m(1 m n n ), m n + Φ 1 (1 α/2) m(1 m n n Φ 1 (1 α/2) - kvantil normálního rozdělení (tabulky), m/n relativní četnost "výskytu sledovaného jevu" ve výběrovém souboru

119 TESTY Testování hypotéz: Na základě náhodného výběru x = (X 1,...,X n ), jehož rozdělení závisí na parametru θ, který patří do parametrického prostoru Θ, chceme rozhodnout, zda platí určité tvrzení o náhodné veličině, například, že θ patří do určité vlastní podmnožiny θ prostoru Θ. Toto tvrzení nazýváme (nulová) hypotéza.

120 TESTY Toto tvrzení nazýváme (nulová) hypotéza. H 0 : θ θ. Protikladné tvrzení v rámci uvažovaného modelu se nazývá alternativa, např. A : θ / θ. Je-li θ jednobodová, pak mluvíme o jednoduché hypotéze.

121 TESTY Vlastní test: Na základě náhodného výběru zkonstruujeme testovou statistiku T a určíme množinu W, která se nazve kritický obor. Nastane-li jev {T W}, pak zamítneme hypotézu H 0. Při tomto rozhodování nastane některý z následujících případů: 1. H 0 platí a test ji nezamítá. Rozhodnutí je správné. 2. H 0 neplatí a test ji zamítá. Rozhodnutí je správné. 3. H 0 platí a test ji zamítá. Říká se, že nastala chyba 1. druh 4. H 0 neplatí a test ji nezamítá. Říká se, že nastala chyba 2.

122 TESTY Kriticky obor přitom konstruujeme tak, aby pravděpodobnost chyby 1. druhu nepřekročila předem dané číslo α hladina testu. Nejlepší volba kritického oboru a testové statistiky je taková, kdy při dodržení podmínky na chybu na chybu 1. druhu je pravděpodobnost chyby 2. druhu minimální.

123 TESTY T-test: Model normální rozdělení: nulová hypotéza: H 0 : µ = µ 0 (předepsané číslo) alternativa: A : µ µ 0

124 TESTY Rozhodovací kritérium: T = X µ 0 S n Je-li T t n 1 (1 α/2) zamítám nulovou hypotézu ("tvrdím, že správná je alternativa"), v případě opačné nerovnosti nezamítám nulovou hypotézu ("je správná").

125 TESTY Párový t-test: se používá v situacích, kdy máme na každém z n objektů měřeny dvě veličiny (X 1,Y 1 ),...,(X n,y n ). Jednotlivé objekty lze zpravidla pokládat za nezávislé, ale měření na témž objektu nikoli. Položme Z 1 = X 1 Y 1,...,Z n = X n Y n. Předpokládejme, že Z i N(µ,σ 2 ), i = 1,...,n, kde µ = µ 1 µ 2. Jsou-li tyto předpoklady splněny, pak jde o test H : µ = 0 proti alternativě A : µ 0. (Úloha převedena na jednovýběrový t-test.)

126 TESTY Testová statistika: T = Z S n, kde S 2 = 1 n 1 n (Z i Z) 2 i=1 Je-li T t n 1 (1 α/2) zamítám nulovou hypotézu, v případě opačné nerovnosti nezamítám nulovou hypotézu.

127 TESTY Dvouvýběrový t-test: jako párový test porovnává dvě skupiny dat (měření), můžeme ho použít pouze v situacích, kdy máme skutečně zajištěnu nezávislost všech veličin X 1,...,X n,y 1,...,Y m. Užijeme-li dvouvýběrový t test v situaci, pro kterou je nezbytný test párový, pak to zpravidla vede k nesmyslným výsledkům. Naproti tomu není hrubou chybou použít párový test v případě n = m i v situaci, pro kterou je vhodnější dvouvýběrový t-test.

128 TESTY Položme kde S 2 = 1 ( ) (n 1)S 2 n+m 2 X +(m 1)SY 2, S 2 X = 1 n 1 S 2 Y = 1 m 1 n (X i X) 2, i=1 m (Y i Y) 2 i=1

129 TESTY Testová statistika: T = X Y S nm n+m. Je-li T t n+m 2 (1 α/2) zamítám nulovou hypotézu (tj. střední hodnoty jsou různé), v případě opačné nerovnosti nezamítám nulovou hypotézu (rovnost středních hodnot).

130 TESTY Znaménkový test: Alternativa k t-testu, nepožaduje se normalita. Testuje se hypotéza H : x = x 0, tj. medián je roven danému číslu.

131 TESTY POSTUP: 1. Vyloučíme z dalšího zpracování pozorování, pro něž X i = x 0 a příslušně snížíme rozsah výběru n. 2. Určíme v kolika případech nastal jev X i > x 0. Počet těchto případů označíme Z. 3. Z je náhodná veličina s binomickým rozdělením Bi(n,p), kde p = P(X i > x 0 ).

132 TESTY TESTOVÁ STATISTIKA. U = Z n/2 n/4 = 2Z n. n Je-li U Φ 1 (1 α/2) zamítám nulovou hypotézu (medián není roven číslu x 0 ), v případě opačné nerovnosti nezamítám nulovou hypotézu.

133 TESTY Jednovýběrový Wilcoxonův test: Test o hodnotě mediánu (jako znaménkový test), založen na pořadí hodnot. 1. Vyloučíme z dalšího zpracování pozorování, pro něž X i = x 0 a příslušně snížíme rozsah n. 2. Určíme pořadí R + i náhodných veličin X i x Test je založen na součtu pořadí R + i těch veličin X i x 0, pro které je X i x 0 > 0.

134 TESTY TESTOVÁ STATISTIKA. V = i:x i >x 0 R + i U = V n(n+1) 4 n(n+1)(2n+1) 24 Je-li U Φ 1 (1 α/2) zamítám nulovou hypotézu (medián není roven číslu x 0 ), v případě opačné nerovnosti nezamítám nulovou hypotézu.

135 TESTY Dvouvýběrový Wilcoxonův test: Test o shodě hodnot mediánů (obdoba dvouvýběrového t-testu), založen na pořadí hodnot. 1. Určíme pořadí R i náhodných veličin ve sloučeném výběru. 2. Test je založen na součtu pořadí R i těch veličin, které jsou v prvním výběru.

136 TESTY TESTOVÁ STATISTIKA. V x = x i R x i U = V x nx(nx+ny+1) 2 n xn y(n x+n y+1) 12 Je-li U Φ 1 (1 α/2) zamítám nulovou hypotézu (mediány si nejsou rovny), v případě opačné nerovnosti nezamítám nulovou hypotézu.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost Pravděpodobnost Náhodné veličiny a jejich číselné charakteristiky Petr Liška Masarykova univerzita 19.9.2014 Představme si, že provádíme pokus, jehož výsledek dokážeme ohodnotit číslem. Před provedením

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 4. října 2018 Podmíněná pravděpodobnost Při počítání pravděpodobnosti můžeme k náhodnému pokusu přidat i nějakou dodatečnou podmínku. Podmíněná pravděpodobnost

Více

NMAI059 Pravděpodobnost a statistika

NMAI059 Pravděpodobnost a statistika NMAI059 Pravděpodobnost a statistika podle přednášky Daniela Hlubinky (hlubinka@karlin.mff.cuni.cz) zapsal Pavel Obdržálek (pobdr@matfyz.cz) 205/20 poslední změna: 4. prosince 205 . přednáška. 0. 205 )

Více

Deskriptivní statistické metody II. Míry polohy Míry variability

Deskriptivní statistické metody II. Míry polohy Míry variability Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Pravděpodobnost a statistika I KMA/K413

Pravděpodobnost a statistika I KMA/K413 Pravděpodobnost a statistika I KMA/K413 Konzultace 3 Přírodovědecká fakulta Katedra matematiky jiri.cihlar@ujep.cz Kovariance, momenty Definice kovariance: Kovariance náhodných veličin Dále můžeme dokázat:,

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

NÁHODNÁ VELIČINA. 3. cvičení

NÁHODNÁ VELIČINA. 3. cvičení NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák Základy statistického hodnocení výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý)

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

Jevy a náhodná veličina

Jevy a náhodná veličina Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

JAK MODELOVAT VÝSLEDKY

JAK MODELOVAT VÝSLEDKY JAK MODELOVAT VÝSLEDKY NÁHODNÝCH POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Náhodné veličiny III Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Základy zpracování dat chemometrie, statistika Doporučenáliteratura

Více

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9. Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4 Pravděpodobnost a statistika (BI-PST) Cvičení č. 4 J. Hrabáková, I. Petr, F. Štampach, D. Vašata Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení technické v Praze ZS 2014/2015

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet? Náhodné veličiny Náhodné veličiny Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Příklad Vytáhneme tři karty z balíčku zajímá nás, kolik je mezi nimi es.

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC Přednáška 03 Přírodovědecká fakulta Katedra matematiky KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC jiri.cihlar@ujep.cz Diskrétní rozdělení Důležitá diskrétní rozdělení pravděpodobnosti

Více

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman Kotecký, 2011 Pravděpodobnost

Více

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek Náhodná veličina Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 10. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 71 Obsah 1 Náhodná veličina 2 Diskrétní náhodná veličina 3

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Poznámky k předmětu Aplikovaná statistika, 5.téma

Poznámky k předmětu Aplikovaná statistika, 5.téma Poznámky k předmětu Aplikovaná statistika, 5.téma 5. Některá významná rozdělení A. Diskrétní rozdělení (i) Diskrétní rovnoměrné rozdělení na množině {,..., n} Náhodná veličina X, která má diskrétní rovnoměrné

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více