Deskriptivní statistické metody II. Míry polohy Míry variability

Rozměr: px
Začít zobrazení ze stránky:

Download "Deskriptivní statistické metody II. Míry polohy Míry variability"

Transkript

1 Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha

2 Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které se řídí stejným zákonem rozdělení, tj. výběr je homogenní hodnoty x i, zahrnuté do výběru jsou vybrány nezávisle na sobě výběr je charakterizován střední hodnotou rozptýlením kolem střední hodnoty tvarem výběrového rozdělení

3 Výběrové charakteristiky pro charakterizaci výběru se tradičně používá momentů Obecné momenty m 1, m 2, m k : m j 1 n j xi n i = 1 = j = 1, 2,, k Centrální momenty C j, jsou analogií obecných momentů pro odchylky od prvního obecného momentu (x m 1 ), tedy: 1 n ( ) j i 1 n i = 1 Cj = x m j = 2, 3,, k

4 Míry polohy Míry polohy (střední hodnoty) (Střední hodnoty určují, kde na číselné ose je výběrová distribuce umístěna). Aritmetický průměr Geometrický průměr Modus Medián Kvantily

5 Aritmetický průměr Aritmetický průměr první obecný moment sečteme všechny hodnoty, kterých sledovaná veličina nabyla, a vydělíme jejich počtem x = n i= 1 n x i

6 Vážený aritmetický průměr Vážený aritmetický průměr máme-li několik nezávislých náhodných výběrů o různých počtech pozorování a známe-li již aritmetické průměry v těchto výběrech, je společný průměr souboru roven x = k i= 1 nx n i i kde k je počet nezávislých výběrů a n k = n výsledek je stejný, jako kdybychom průměr počítali ze společného souboru všech pozorovaných hodnot i= 1 i

7 Modus Modus je hodnota nejčastěji se vyskytující M 0 nebo z histogramu je hodnota patrna na první pohled i v četnostních tabulkách nalezneme max n i a příslušná hodnota x i je modus v intervalových tabulkách najdeme interval s max n i a přesnou hodnotu určíme ze vzorce ˆ d 1 x= b+ h d 1+ d 2 ˆx b je počátek intervalu obsahujícího ˆx h šířka tohoto intervalu d 1 je rozdíl četností intervalu s ˆx a intervalu předcházejícího d 2 je rozdíl četností intervalu s ˆx a následujícího ˆx

8 Medián Medián uspořádáme- li pozorované statistické jednotky podle velikosti sledovaného znaku, dělí medián M e nebo x výběr na dvě stejně četné části je-li počet n sledovaných prvků lichý, je medián hodnota toho prvku, který má pořadové číslo (n+1)/2 sudý počet prvků pokud dva prostřední prvky s pořadími n/2 a n/2+1 mají stejnou hodnotu je medián roven této hodnotě, pokud jsou jejich hodnoty různé, je medián jejich aritmetický průměr u intervalových četnostních tabulek najdeme snadno interval kde x leží. Jeho hodnotu určíme ze vztahu: x = a+ h n 2 n 2 n 1 a je počátek intervalu obsahujícího x h šířka tohoto intervalu n 2 je počet prvků v tomto intervalu n 1 je počet všech prvků ležících před intervalem s x n počet všech prvků

9 Geometrický průměr Používáme tehdy, když má význam součin znaků Při analýze posloupností odvozených znaků, které vznikají jako podíl dvou veličin časové řady n n n G = n = i i= 1 x x x x x

10 Geometrický průměr Potlačuje vliv extrémních hodnot (velmi malých i velmi velkých) Používá se: v oblastech ochrany životního prostředí dodržování hygienických norem při sledování kvality ovzduší, vody apod. např. při analýze koncentrace bakterií, kdy se hodnoty mohou pohybovat od 10 do Naopak je geometrický průměr nevhodný při analýze již zlogaritmovaných dat

11 Geometrický průměr Z definice vyplývá, že jej nelze spočítat v případě, kdy se jedna nebo vícero hodnot rovná 0, nebo je záporná Dosadíme substituci např. 1 nebo pro všechny hodnoty menší jako 2, tj. hodnoty kolem 0 a záporné dosadíme hodnotu 1,9, tak aby nedošlo ke ztrátě informace

12 Kvantily medián je hodnota, pod kterou leží 50% souboru; někdy říkáme že medián je 50%-ní kvantil (percentil) obecně p procentní kvantil je hodnota, pod kterou leží p % souboru vypočteme číslo a = n.p / 100. Za p procentní kvantil bereme pak a-tou hodnotu seřazeného souboru dat užívají se pro odhad referenčních rozmezí biochemických testů, obvykle se hledá 2,5% a 97,5% kvantil kvantil se specifikovaným p = k.10, k = 1, 2,, 9 se nazývá k-tý decil kvartil odděluje z každého kraje uspořádané řady prvků 25%, mezi nimi leží 50% prvků

13 Kvantilová polosuma pro rozdělení s plochými vrcholy se doporučuje jako charakteristika polohy kvantilová polosuma: ~ ~ P F = x 0,75 x 0,25 v případě ohraničených rozdělení ~ x P = (x max x min ) / 2 kde x max je maximální a x min je minimální prvek výběru Polosuma x p je efektivnější než x pro g 2 > 2,2

14 Míry variability Míry variability (Rozložení se stejným průměrem může být velice mnoho, liší se těsností uspořádání jednotlivých prvků kolem průměru, VARIABILITOU) Rozptyl Směrodatná odchylka Rozpětí Šikmost a špičatost

15 Rozptyl Výběrový rozptyl výběrový druhý centrální moment značíme s 2 a vypočteme jej pomocí vzorce s n ( ) 2 2 x x x = = i i 2 i= 1 i= 1 2 n n n x kde n je počet prvků pro četnostní tabulky s k ( ) 2 2 n x x n x i i i i 2 i= 1 i= 1 2 = = x k i= 1 n i k n kde k je počet řádků četnostní tabulky a k i= 1 n i = n

16 Směrodatná odchylka Směrodatná odchylka značíme jí s a spočteme dle vzorce s =+ s 2

17 Rozpětí Rozpětí nejjednodušší míra variability rozdíl mezi maximální a minimální pozorovanou hodnotou R= x x max min pomocí R můžeme dosti dobře odhadnout s platí totiž, že v intervalu μ ±3σ leží 99,7% souboru, neboli skoro všechno lze aproximovat R 6 s

18 Cheppardova korekce při výpočtu rozptylu z dat uspořádaných do třídních intervalů se dopouštíme chyby tím, že všechny hodnoty x i patřící do jedné třídy nahrazujeme jedinou hodnotou středem intervalu. Čím je šířka intervalu větší, tím je i tato chyba větší. Je-li sledovaná hodnota spojitá, lze opravit hodnotu rozptylu Cheppardovou korekcí: s 2 d = s kde d = šíře intervalu kor

19 Variační koeficient vyjadřuje poměr s a x v procentech δ = V = s 100 x Použití: V laboratoři mají králíky, morčata a myši a potřebují porovnat variabilitu váhy u jednotlivých souborů pokusných zvířat. Vzhledem k tomu, že s jsou vyjádřeny ve stejných jednotkách jako x i, počítaly by se u králíků v kg a u myší v g, což by vedlo k názoru, že variabilita u králíků je větší. Proto převádíme s na V variační koeficient je číslo bezrozměrné (nezávislé na jednotkách)

20 Střední chyba průměru náhodné kolísání způsobuje, že x, byť správně spočítané, má svou náhodnou chybu, kterou lze spočítat pomocí rozptylu s 2 jednotlivých hodnot kolem průměru čím je větší rozptyl jednotlivých hodnot, tím je větší i rozptyl průměru čím je n větší, tím je rozptyl menší s 2 x 2 s = sx n = s n

21 Tvarové parametry Šikmost (skewness) g třetí centrální moment ( ) i i= 1 1 = n 32 2 i= 1 n n x x x ( ) i x 3

22 Tvarové parametry Špičatost (kurtosis) g čtvrtý centrální moment ( ) i 2 i= 1 = n 2 2 i= 1 n n x x x ( ) i x 4

23 Náhodná veličina a její rozložení distribuční funkce frekvenční funkce

24 Teorie pravděpodobnosti teorie pravděpodobnosti studuje matematické modely náhodných pokusů, tj. takových pokusů, jejichž výsledek není zcela jednoznačně určen podmínkami pokusu avšak nezabývá se libovolnými náhodnými pokusy ale pouze těmi, které mají vlastnost statistické stability neboli stability četností označme písmenem A jeden z možných výsledků náhodného pokusu. Opakujme tento pokus n-krát a označme znakem μ A počet, kolikrát se v těchto n pokusech vyskytl výsledek A. Poměr μ A /n se pak nazývá poměrná četnost jevu A a vlastnost stability četností záleží v tom, že při velkém n kolísá poměrná četnost jevu A nepatrně (při změně n) kolem jistého čísla všechny pokusy lze rozdělit do tří skupin dobré pokusy úplná stabilita výsledku zde je všechno jasné bez teorie pravděpodobnosti horší pokusy nejsou úplně stabilní, jsou však statisticky stabilní špatné pokusy nejsou ani statisticky stabilní teorie pravděpodobnosti je nepoužitelná

25 Náhodná veličina Náhodná veličina předpis, který přiřazuje každému výsledku náhodného pokusu určité číslo... výsledkem pokusu nemusí být vždy nějaké číslo; vždy mu však nějaké číslo můžeme přiřadit v praxi nás však daleko více zajímají pravděpodobnosti, s kterými náhodná veličina nabývá určité hodnoty nebo je obsažena v určitých intervalech hodnot PRAVDĚPODOBNOST ROZLOŽENÍ náhodné veličiny

26 Distribuční funkce Distribuční funkce je pravděpodobnost, že náhodná veličina X nabude určité hodnoty x nebo hodnoty menší, tedy: F(X) = P(X x) distribuční funkce je definována pro všechna reálná čísla x, má tedy smysl pro < x < + Vlastnosti: 1. 0 F(x) 1 2. když x, pak F(x) = 0 3. když x +, pak F(x) = 1 4. F(x) je funkce neklesající, tedy: když x i < x j, pak F(x i ) F(x j ) 5. F(x) nemusí být spojitá

27 Frekvenční funkce má-li F(x) pro všechna x derivaci derivaci nazýváme d f x = F x dx ( ) ( ), pak tuto Vlastnosti: HUSTOTA PRAVDĚPODOBNOSTI neboli frekvenční funkce f + P ( x) 0, pro každé x f ( x) dx = 1 2 ( x X x ) = f ( x) 1 2 x x 1 dx ale: pro spojité náhodné veličiny je P(X = x) = 0

28 Střední hodnota a rozptyl Diskrétní veličiny Spojité veličiny střední hodnota míra polohy E x = xp i x ( ) ( ) i E x = x f x dx ( ) ( ) i střední kvadratická odchylka od μ míra variability + (( ) 2 ) D x E x E x = ( ) ( ) ( ) ( ) D x = E x 2 μ 2

29 Teoretická rozdělení Pomocí distribuční funkce, frekvenční funkce nebo pravděpodobnostní funkce jsou definována různá rozložení distribuce náhodných veličin. Nejčastěji se setkáváme s normálním rozdělením. Existuje však řada úloh, kde předpoklad normality není zcela oprávněný. Nejdůležitější typy rozložení: Poissonovo rozdělení Laplaceovo rozdělení Exponenciální rozdělení Rovnoměrné rozdělení Binomické rozdělení Bernouliho rozdělení Logaritmicko normální rozdělení Weibullovo rozdělení

30 Poissonovo rozdělení Poissonovo rozdělení pravděpodobnosti má náhodná veličina, která vyjadřuje počet výskytu málo pravděpodobných jevů v určitém časovém, popř. objemovém intervalu např. počet výskytu jevu A v časovém intervalu t musí splňovat následující podmínky pravděpodobnost výskytu A je úměrná délce t, přičemž pravděpodobnost výskytu více než jednoho jevu v tomto úseku je zanedbatelná pravděpodobnost výskytu A v daném časovém intervalu t je závislá na výskytu jevu A v předcházejícím intervalu t pravděpodobnost výskytu A v časovém intervalu t nezávisí na počátku intervalu S Poissonovým rozdělením se setkáváme při strukturálních analýzách, u různých čítačů částic a výskytu poruch v plošných nebo objemových elementech

31 Poissonovo rozdělení Pravděpodobnostní funkce je definována vztahem: p x, λ ( ) = x λ e x! λ kde x je diskrétní náhodná veličina, nabývající pouze hodnot 0, 1,, n a λ je parametr. E(x) = λ, D(x) = λ

32 Laplaceovo rozdělení oboustranně exponenciální vyskytuje se v případě, kdy jsou náhodné veličiny měřeny za podmínek kolísání rozptylu kolem určité střední hodnoty 1 f ( x) = e 2b = 1 2b { x μ b μ x e if x< μ b x μ e if x μ b E(x) = μ, D(x) = 2b 2 μ=5, b = 2 kde x je spojitá náhodná veličina, nabývající hodnot (-, + ), μ je parametr polohy a b je měřítko.

33 Exponenciální rozdělení je jednostranně ohraničené zdola využívá se k popisu reálných dějů uplynulý čas, resp. obsazený prostor před tím než daný jev nastal životnost součástí strojů vzdálenost, kterou urazí molekuly plynu při nízkém tlaku až do vzájemné srážky doba mezi dopadem částic do čítače x ( ) λ f x = e λ pro x 0 f ( x ) = 0 pro x < 0 E(x) = λ -1, D(x) = λ -2

34 Rovnoměrné rozdělení rektangulární rozložení nejjednodušší rozdělení pro oboustranně omezenou náhodnou veličinu, která musí ležet v zadaném intervalu a h< x < a + h týká se náhodných veličin, které se v daném intervalu vyskytují se stejnou pravděpodobností f ( x) = 1 b a pro a < x < b f ( x ) = 0 pro x < a, nebo x > b E(x) = (a+b)/2, D(x) = (b a) 2 /12

35 Binomické rozdělení je rozložení četnosti výskytu jevu, který může nabýt pouze dvou hodnot (jev alternativní) označíme-li P(A) = p a P(A) = q, pak zřejmě p + q = 1 jednotlivá vybírání jsou na sobě nezávislá, proto lze spočítat pravděpodobnost jevu, že z n pokusů nastane jev A právě k-krát (a tedy jev A (n k)-krát), pomocí rovnice (p + q) n = 1 n f x = p 1 p k ( ) k ( ) n n! = k k! ( n k)! n k

36 Binomické rozdělení Střední hodnota a rozptyl binomického rozložení: E(x) = np, D(x) = np(1 p)

37 Bernouliho rozdělení speciální případ binomického rozložení nula-jedničkové rozložení náhodné veličiny jev může nabývat pouze hodnot 1 a 0 E(x) = p, D(x) = p(1 p) opakujeme-li tento alternativní pokus nezávisle na sobě vícekrát (n krát), veličina X (jejímiž hodnotami je počet pokusů, z oněch n provedených, které skončily s výsledkem 1 (celkový počet úspěchů)) má binomické rozdělení

38 Log-normální rozdělení nejrozšířenější alternativa normálního rozdělení pro jednostranně ohraničená data fyzikální veličiny (teplota, tlak, objem, hmotnost, ) jsou buď kladné, nebo mají přirozeně definovaný počátek pro náhodné veličiny tohoto druhu je normální rozdělení vždy aproximací když jsou naměřené veličiny dostatečně vzdálené od spodní meze, resp. přirozeného počátku, tato aproximace vyhovuje dobře v blízkosti počátku je tato aproximace nevhodná měření nízké koncentrace, malé hmotnosti, malé délky distribuce prachových částic v atmosféře je-li měřená veličina náhodným podílem již náhodně vybraného celku

39 Log-normální rozložení Pravděpodobnostní funkce je definována vztahem: 1 f x e xσ 2π ( ) ( ) 2 2 ln x μ /2σ μσ, = kde x > 0, a μ a σ jsou střední hodnota a směrodatná odchylka logaritmu proměnné E(x) = e μ+σ2 /2, D(x) = (e σ2 1) e 2μ+σ2

40 Weibullovo rozdělení je spojité rozložení pravděpodobnosti s frekvenční funkcí () f t β t γ = η η β 1 t γ η e β kvantitativní hodnocení bezporuchovosti (spolehlivosti) komponent technických systémů matematický popis doby do poruchy analýza přežití u karcinomů

41 Weibullovo rozdělení E(x) = γ + ηγ(1+1/β), D(x) = η 2 [Γ(1+2/β) Γ 2 (1+1/β)]

42 Normální rozdělení

43 Gaussovo rozdělení představuje pro statistiku nejdůležitější rozložení v praxi se vyskytuje nejčastěji řada dalších rozložení se mu za jistých podmínek přibližuje a můžeme je tedy normálním rozložením aproximovat je charakterizován průměrem μ a směrodatnou odchylkou σ, která určuje rozptýlení hodnot kolem μ hustota pravděpodobnosti náhodné veličiny x v intervalu (-, + ) má tvar 1 f ( x) = e 2 2πσ ( x μ ) 2 2 2σ

44 Gaussovo rozdělení E(x) = μ, D(x) = σ 2

45 Gaussovo rozdělení hustota pravděpodobnosti při různém σ a stejném μ hustota pravděpodobnosti při různém μ a stejném σ

46 Význam normálního rozdělení patří mezi nejdůležitější pravděpodobnostní modely matematické statistiky distribuční funkci poprvé stanovil Moivre na základě experimentu házení mincí; sloupky histogramu proložil plynulou spojitou křivkou, jejíž matematické vyjádření vypočítal již v roce 1733 tato křivka byla znovu objevena jako Gaussova křivka chyb měření (v astronomii) na začátku 19. století její význam pak zdůraznil Quételet, který provedl řadu četných měření somatických veličin a zjistil, že se tato měření řídí stejnými zákony jako křivka chyb měření očekáváme, že normálně rozložených veličin je většina; bohužel tomu tak není, ale je dokázáno že součty (a teda i průměry) i zcela nenormálních veličin se k normálnímu rozložení blíží, a to již při poměrně malých počtech sčítanců n

47 Transformace normálního rozdělení protože řada statistických metod normalitu náhodných veličin vyžaduje převádíme nenormální náhodné veličiny na normální x = x + c i log ( ) x = x+ c kx x = e i ( k ) x = x 1/ k (x i +c) > 0 (x i +c) > 0 k 0 Je potřeba vždy ověřit, která transformace pro daný soubor dat nejlépe vyhovuje

48 Teorie odhadu Bodové odhady Intervalový odhad

49 Bodový odhad odhad parametrů náhodné veličiny (náhodného vektoru ) výběrovou charakteristikou (známým vypočteným vektorem ˆΘ ) nazýváme bodový odhad kritéria pro kvalitu odhadu pro jeden parametr platí: konzistence odhadu: odhad je konzistentní, když pro daný rozsah n výběru je pravděpodobnost toho, že jeho vzdálenost od skutečné hodnoty je libovolně malá, rovna jedné nestrannost odhadu: odhad je nestranný, když pro daný rozsah výběru n je jeho střední hodnota rovna parametru souboru vydatnost odhadu: odhad je vydatný, když je jeho rozptyl kolem skutečné hodnoty Θ minimální vzhledem ke všem možným odhadům tohoto parametru nejčastěji odhadujeme: průměr μ... x směrodatnou odchylku σ s ˆΘ Θ Θ Θ Θ

50 Bodový odhad při podezření, že výběr obsahuje vychýlené hodnoty (hodnoty, které evidentně nepatří do zkoumaného rozložení), používáme pro odhad μ robustní odhady poměrně robustným odhadem průměrné hodnoty je medián takovým odhadem je také průměr vypočítaný z těch hodnot výběru, které leží mezi specifikovanými symetrickými kvantily (např. mezi 10% a 90% kvantilem) Ze statistického hlediska mají bodové odhady malý význam, protože neříkají nic o tom, kde leží skutečné hodnoty parametrů

51 Intervalový odhad poskytuje více informací, protože určuje interval, v němž se bude se zadanou pravděpodobností 1 α nacházet skutečná hodnota daného parametru Θ neznámý parametr odhadujeme dvěma číselnými hodnotami L D a L H, které tvoří meze intervalu spolehlivosti čili konfidenčního intervalu CI ten pokryje neznámý odhadovaný parametr s předem zvolenou, dostatečně velkou pravděpodobností P( L D < Θ < L H ) = 1 α, kterou nazveme koeficient spolehlivosti (statistická jistota) ten se volí obyčejně roven 95% nebo 99% parametr α se nazývá hladina významnosti pro intervaly CI platí že: čím je rozsah výběru n větší, tím je interval spolehlivosti užší čím je odhad přesnější a má menší rozptyl, tím je interval spolehlivosti užší čím je vyšší statistické jistota (1 α), tím je interval spolehlivosti širší

52 Odhad průměru intervalový odhad přibližně 95% konfidenční interval x σ 2 μ x + 2 n σ n v praxi obyčejně neznáme směrodatnou odchylku základního souboru σ a musíme ji odhadnout pomocí s. Uvažujme proto náhodný výběr rozsahu n z normálního rozložení N(μ,σ 2 ) s neznámými parametry μ a σ 2 a jejich výběrovými odhady x a s 2. Jelikož má veličina bodový odhad: μ = x x μ s Studentovo t-rozdělení, můžeme po úpravách napsat: s x t ( ) ( ) 1 α/2 ν μ x + t1 α/2 ν n n s n kde t 1-a/2 (ν) je 100(1-α/2)% kvantil Studentova rozdělení s ν = n 1 stupni volnosti

53 Odhad rozptylu nejlepší bodový odhad populačního rozptylu σ 2 pomocí výběrového rozptylu s 2 je ˆ s 2 2 σ = n n 1 význam rozlišení mezi výběrovým rozptylem a odhadem populačního rozptylu má smysl pouze pro malá n, pro velká n ztrácí smysl, protože n 1 n 1 intervalový odhad je poněkud komplikovanější n 1 s n 1 s ( ) ( ) χ σ 2 2 α χ α kde χ α, je kritická hodnota rozložení χ, které je tabelováno. Počet stupňů volnosti je n 1

54 Odhad relativní četnosti Uvažujme náhodný jev. Zajímá nás jeho pravděpodobnost π. Lze ji vyjádřit buď v pravděpodobnostech (celek = 1), nebo v % (celek = 100%). Výběrovou relativní četnost značíme p, p = n 1 /n, kde n 1 je počet kolikrát nastal jev z n pozorování. Náhodná veličina p má přibližně normální rozložení s průměrem π a směrodatnou odchylkou ( ) σ = π 1 π /n π Protože π neznáme, nahradíme je výběrovou hodnotou p a dostaneme intervaly spolehlivosti ( ) π ( ) 95% p 1, 96 p 1 p / n p+ 1, 96 p 1 p / n ( ) π ( ) 99% p 2,58 p 1 p / n p+ 2,58 p 1 p / n

55 Odhad relativní četnosti pro malé n a při nesplnění podmínky p 0,05 a (1-p) 0,05 nelze použít normální aproximace interval spolehlivosti pro π spočteme přesně pomocí kritických hodnot F-rozložení ( ) ( n + 1) Fcd ( ) n1 1,, α π n + n+ 1+ n F n n + n + 1 F 1 1 ab,, α 1 1 cd,, α kde F..α je kritická hodnota F-rozložení při stupních volnosti a = 2(n + 1 n 1 ) b = 2n 1 c = 2(n 1 + 1) d = 2(n n 1 ) avšak při volbě α = 5% dostáváme 90% interval spolehlivosti a α = 1% dostáváme 98% interval spolehlivosti, neboť rozložení F je tabelováno pro jednostranné hypotézy

56 Odhad mediánu bodový odhad: μ = x intervalový odhad x μ x h+ 1 n h kde indexy značí pořadové číslo v uspořádané řadě hodnot x i, hodnotu h spočteme z výrazu: ( ) 95% h= n 1 1,96 n /2 99% ( ) h= n 1 2,58 n /2 za h bereme hodnotu celočíselnou zaokrouhlenou. Lze použít pro n > 8

57 T rozložení jako jedno z výběrových rozložení Tvar t rozložení je funkcí rozsahu výběru Při narůstajícím rozsahu výběru se t rozložení blíží normálnímu rozložení T rozložení = normální rozložení, když rozsah výběru = velikosti populace V praktickém využití t rozložení = normální rozložení pro N > 30 T rozložení je funkcí stupňů volnosti, které jsou přímo dané rozsahem výběru Když se d.f. t rozložení se blíží normálnímu rozložení Pro každé N existuje jiná křivka Pro každé N existují jiné kritické hodnoty pro 5% riziko, že učiníme chybu I. druhu

58 T rozložení jako jedno z výběrových rozložení pokračování

59 Kritické hodnoty t rozložení Jsou definované námi zvoleným rizikem, které jsme schopni podstoupit, že učiníme chybu I. druhu a tím, zda jde o jednostranný nebo dvoustranný test Předpokládejme, že N = 20 Při 5%-ní spolehlivosti t krit = ± 2,093 Při 1%-ní spolehlivosti t krit = ± 2,861 Při 10%-ní spolehlivosti t krit = ± 1,729 N = 20 Dvoustranný test 5%-ní spolehlivost t krit = ± 2,093 Jednostranný test 5%-ní spolehlivost t krit = + 1,729 nebo 1,729 d.f. 0,95 0,99 2 4,303 9, ,182 5, ,776 4, ,571 4, ,306 3, ,228 3, ,093 2, ,009 2, ,984 2,626

60 F rozložení Snedecorovo, nebo Fisherovo Snedecorovo rozložení χ 2 test, F test jsou velmi citlivé na non normalitu sledovaných veličin Je definováno jako poměr dvou χ 2 rozložení F = U 1 d U 2 d 1 kde U 1, U 2 jsou dvě χ 2 rozložení s d 1 a d 2 stupni volnosti 2

61 F rozložení pokračování

62 F rozložení pokračování

63 χ 2 rozložení Když X 1, X 2,, X k jsou nezávislé normálně rozložené náhodné veličiny se střední hodnotou rovnou 0 a směrodatnou odchylkou rovnou 1, potom náhodná veličina Q n = i= 1 X 2 i má χ 2 rozložení

64 χ 2 rozložení pokračování

65 χ 2 rozložení pokračování

66 děkuji za pozornost

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Jevy a náhodná veličina

Jevy a náhodná veličina Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

pravděpodobnosti, popisné statistiky

pravděpodobnosti, popisné statistiky 8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost Pravděpodobnost Náhodné veličiny a jejich číselné charakteristiky Petr Liška Masarykova univerzita 19.9.2014 Představme si, že provádíme pokus, jehož výsledek dokážeme ohodnotit číslem. Před provedením

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI 7. cvičení Intenzita poruch Funkce modelující dobu do výskytu události životnost, dobu do poruchy, dobu do relapsu (návratu onemocnění), apod. používáme spolu s distribuční

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Rovnoměrné rozdělení

Rovnoměrné rozdělení Rovnoměrné rozdělení Nejjednodušší pravděpodobnostní rozdělení pro diskrétní náhodnou veličinu. V literatuře se také nazývá jako klasické rozdělení pravděpodobnosti. Náhodná veličina může nabývat n hodnot

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Popisná statistika. Jaroslav MAREK. Univerzita Palackého Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí

Více

Pravděpodobnost a statistika I KMA/K413

Pravděpodobnost a statistika I KMA/K413 Pravděpodobnost a statistika I KMA/K413 Konzultace 3 Přírodovědecká fakulta Katedra matematiky jiri.cihlar@ujep.cz Kovariance, momenty Definice kovariance: Kovariance náhodných veličin Dále můžeme dokázat:,

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

5. B o d o v é o d h a d y p a r a m e t r ů

5. B o d o v é o d h a d y p a r a m e t r ů 5. B o d o v é o d h a d y p a r a m e t r ů Na základě hodnot náhodného výběru z rozdělení určitého typu odhadujeme parametry tohoto rozdělení, tak aby co nejlépe odpovídaly hodnotám výběru. Formulujme

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat 2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Statistika I (KMI/PSTAT)

Statistika I (KMI/PSTAT) Statistika I (KMI/PSTAT) Cvičení druhé aneb Kvantily, distribuční funkce Statistika I (KMI/PSTAT) 1 / 1 Co se dnes naučíme Po absolvování této hodiny byste měli být schopni: rozumět pojmu modus (modální

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 4. října 2018 Podmíněná pravděpodobnost Při počítání pravděpodobnosti můžeme k náhodnému pokusu přidat i nějakou dodatečnou podmínku. Podmíněná pravděpodobnost

Více

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9. Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

NÁHODNÁ VELIČINA. 3. cvičení

NÁHODNÁ VELIČINA. 3. cvičení NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Úvod do problematiky měření

Úvod do problematiky měření 1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek

Více

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1 3. ZákladnZ kladní statistické charakteristiky rozdělení 1 charakteristiky Dva hlavní druhy základnz kladních charakteristik statistického souboru: charakteristiky úrovně,, polohy (středn ední hodnoty)

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.025 0.02 0.015 0.01 0.005 Nominální napětí v pásnici Std Mean 140 160 180 200 220 240 260 Std Téma 2: Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Pravděpodobnostní posuzování

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více