ZÁKLADNÍ POJMY a analýza výběru
|
|
- Anna Bláhová
- před 7 lety
- Počet zobrazení:
Transkript
1
2 ZÁKLADNÍ POJMY a analýza výběru PARAMETR je statistická charakteristika základního souboru (značíse řeckými písmeny, např. střední hodnota μ ). STATISTIKA je statistická charakteristika výběrového souboru (značíse latinkou, např. výběrový průměr ). x ODHAD PARAMETRU ZÁKLADNÍHO SOUBORU je určitá hodnota (hodnoty) vhodné statistiky získaná postupem zvaným bodový nebo intervalový odhad. VÝBĚROVÉ ROZDĚLENÍ je rozdělení pravděpodobnosti všech možných hodnot statistiky, které mohou být zjištěny z náhodných výběrů stejné velikosti vybraných z určitého základního souboru.
3 VÝBĚROVÝ PRŮMĚR a jeho rozdělení x1 x x3 x4
4
5 ZÁKLADNÍ VLASTNOSTI BODOVÝCH ODHADŮ Nespornost (konzistence): se vzrůstající velikostí výběru vzrůstá i pravděpodobnost, že odhad bude blízký skutečnému parametru. Nevychýlenost (nestrannost): střední hodnota výběrové statistiky se rovná odhadovanému parametru základního souboru E(T) = P Vydatnost: znamená, že daný nevychýlený odhad má se srovnání se všemi ostatními nevychýlenými odhady nejmenší variabilitu (rozptyl)
6
7 Konstrukce bodových odhadů Metoda maximální věrohodnosti (MLE): Konstruují se odhady maximalizující věrohodnostní funkci L (resp její logaritmus lnl). Věrohodnostní funkce je sdružená hustota pravděpodobnosti všech prvků výběru. Pro nezávislá měření (nezávislé chyby ε i ) platí ln L ( μ, σ, a ) = ln f ( x i μ, σ, a ) Podmínky maxima představují soustavu rovnic lnl( μ, σ μ, a) = 0 lnl( μ, σ σ, a) = 0 lnl( μ, σ a, a) = 0
8
9 MLE pro normální rozdělení Věrohodnostní funkce pro náhodný nezávislý výběr z normálního rozdělení Derivace Výběrový průměr a rozptyl jsou tedy MLE odhady. ) ( )] ln( ) )*[ln( / ( ) ln( σ μ σ π + = i x i N L μ μ * * ) ln( N x L i i = ] [ ) ( ) ln( σ σ μ σ N x L i i =
10
11
12 VÝBĚROVÝ PRŮMĚR a jeho rozdělení Pro rozdělení výběrového průměru platí: σ E(X) = μ σ =SE = X X n Jestliže výběr pochází z normálního rozdělení se střední hodnotou μ a směrodatnou odchylkou σ, potom výběrový průměr x má výběrové normální rozdělení N(μ,σ /n) Z toho vyplývá: výběrový průměr je dobrým odhadem střední hodnoty μ se vzrůstající velikostí výběru n se snižuje standardní chyba průměru SE a určení střední hodnoty je tím spolehlivější
13 ZÁKLADNÍ VLASTNOSTI BODOVÝCH ODHADŮ Grafické znázornění nevychýleného odhadu Odhadovaný parametr Výběrový průměr
14 ZÁKLADNÍ VLASTNOSTI BODOVÝCH ODHADŮ Systematické vychýlení odhadu Vychýlený odhad y
15 ZÁKLADNÍ VLASTNOSTI BODOVÝCH ODHADŮ Nevychýlený a vydatný odhad Nevychýlený odhad s velkou variabilitou (nevydatný)
16
17 BODOVÉ ODHADY ZÁKLADNÍCH PARAMETRŮ Hustota pravděpodobnosti základního souboru X μ Hodnoty výběrového souboru Tato vzdálenost je pro jeden konkrétní výběr neznámá, není možné určit spolehlivost konkrétního odhadu
18
19
20
21
22
23
24
25
26 Ukázky příkladů určení centrální tendence Průměr= 5 Průměr= Medián = 5 Medián = Módus = 9 Není módus
27 Ukázky příkladů rozličné variability (rozptýlení) Rozpětí = 1-7 = 5 Rozpětí = 1-7 = Data A Průměr = 15.5 s = Data B Průměr = 15.5 s =.958
28 Přehled sumarizace dat Sumární míry Centrální tendence Kvartily Variabilita Průměr Medián Módus Rozpětí Rozptyl Variační koeficient Směrodatná odchylka
29 Přehled měr variability (rozptýlení) Variabilita Rozptyl Směrodatná odchylka Variační Rozpětí Populační r. Populační s.o. koeficient Výběrový r. Výběrová s.o. Interkvartilové rozpětí
30 Popisné statistiky polohy, rozptýlení a tvaru Parametry polohy: Centrální tendence Průměr aritmetický: (Σx/n) Medián: Centrální bod (dělicí bod) Parametry rozptýlení: Variace směrodatná odchylka Parametry tvaru: šikmost náklon rozdělení špičatost délka konců Zešikmené vpravo Mode < Median < Mean Symetrické Mean = Median =Mode Zešikmené vlevo Mean < Median < Mode
31 Pokud x i nemají normální rozdělení σ (g 1) D(s) 4N Parametry rozptýlení - směrodatná odchylka Směrodatná odchylka s je vychýleným odhadem veličiny σ. Platí, že E(s) < σ. Pro nevychýlený odhad lze odvodit σ = K u * s s (N 1) N 1.45 kde K u N 1 = Γ( ) N 1 N Γ( ) N 1 N 1 3 4N 37 3 N D( σ ) = σ (N) D(s) σ (N 1)
32 Parametry rozptýlení - variační koeficient Výběrový odhad V a odpovídající rozptyl D(V) lze vyjádřit ve tvaru V x = s D(V) N + (N 1) δ δ δ (1 + N( n 1) N δ )
33 Parametry tvaru - šikmost a špičatost Odhady jsou pouze asymptotické (platí pro velké N ). Pro odhad šikmosti g 1 se používá výběrová šikmost s rozptylem D( ), kde ĝ 1 N 3 N (x i x) i = 1 ĝ1 = D( ĝ 3 / 1 N (x i x) i = 1 Pro odhad špičatosti g platí ) (N ĝ 1 6N(N - )(N + - 1) 1)(N + 3) ĝ = N N i = 1 N i = 1 (x (x i i x) x) 4 D( ĝ ) (N - 4N(N - 1) 3)(N - )(N + 5)(N + 3)
34 Kdy použít mediánu? x Aritmetický průměr je efektivní (má minimální rozptyl) pouze pro normální rozdělení. Pro případ Laplaceova rozdělení je efektivní výběrový medián pro jehož rozptyl platí ~ D( x 0.5 ) = 4Nf (M) ~ x 0.5 kde f (M) je hodnota hustoty pravděpodobnosti v místě teoretického mediánu M. 1 Pro případ Laplaceova rozdělení je f (M) = 1/( σ ) a tedy ~ D( x0.5) = σ /(N)
35 Pro Laplaceovo rozdělení je poměr E D(x) M = ~ = D( x ) 0.5 tj. medián je x efektivnější než aritmetický průměr. Pro třídu exponenciálních rozdělení s parametrem α lze obecně určit E M ze vztahu E M = α Γ(3/ α ) Γ 3 (1/ α ) Z této rovnice plyne, že pro rozdělení α > (dlouhé konce) je medián efektivnější než aritmetický průměr
36 Kdy použít polosumy? Polosuma je efektivnější než x pro g >.. Pro rozdělení s plochými vrcholy se doporučuje použití kvartilové polosumy ~ x 0.75 ~ ( x ~ x PF = ~ x 0.5 kde resp. je horní, resp. dolní kvartil ) / V případě ohraničených rozdělení (arkussínové a lichoběžníkové třídy) je efektivní tzv. polosuma xˆ P = (x max x min ) / kde x max je maximální a x min je minimální prvek výběru
37 Rozptyl odhadu polosumy je pro normální rozdělení roven D(xˆ Pro rovnoměrné rozdělení je P ( π ) = σ ) (4 ln( N)) D(xˆ P ) = (6σ ) [(N 1)(N )] Arkussínové rozdělení je definováno v intervalu (-A, A) a pro jeho hustotu pravděpodobnosti platí 1 Pro arkussínové rozdělení D(xˆ f (x ) = π P ) = A x (5π 4 σ ) N 4
38 Uřezaný průměr α-uřezaný průměr x( α) x( α) 1 = n M je definován vztahem N M = x (i) i M + 1 kde M = int(αn/100) je celá část výrazu α N/100 a x (i) jsou pořádkové statistiky (vzestupně setříděné prvky výběru).
39 Kombinovaný odhad centrální hodnoty Pro symetrická rozdělení s vybočujícími hodnotami je doporučen za odhad středu symetrie čili centrální hodnoty použít medián dle vzorce ~ x C ~ x x 0. 5 xˆ x(0.5) = med{,,, PF, } P kde med{.} označuje medián z prvků v závorce. Pro odhad rozptylu odhadu x~ C je možno použít interkvantilové délky ( ~ ~ x x )/ k 0.9 = D( ~ xc ) = k 9 0. (.7N)
40 SUMARIZACE DAT Sumární míry Centrální tendence Průměr Módus Medián Geometrický průměr Kvartily Rozpětí Rozptyl Variace Směrodatná odchylka Variační koeficient
41 Fisher, Sir Ronald Aylmer, Sir Ronald Fisher F.R.S. ( ) was one of the leading scientists of the 0th century; making major contributions to Statistics, Evolutionary Biology and Genetics. This website has information about him and his work. perhaps the most original mathematical scientist of the [twentieth] century Bradley Efron Annals of Statistics (1976) Fisher was a genius who almost single-handedly created the foundations for modern statistical science. Anders Hald A History of Mathematical Statistics (1998) Sir Ronald Fisher could be regarded as Darwin s greatest twentieth-century successor. Richard Dawkins River out of Eden (1995)
42 Standardizace metodou Z-skóre (u, t, Z jsou transformované proměnné)
43 Gosset, William Sealy ("Student"), The probable error of a mean [Paper on the t-test], Biometrika 6 (1908), pp. 1-5
44 Odhady parametrů Rozdělení měření pro oba modely obsahuje střední hodnotu μ a rozptyl a odhady získáme: 1) Momentová metoda: pro normální rozdělení: odhadem je aritmetický průměr x A a výběrový rozptyl s. σ ) Metoda maximální věrohodnosti získává odhad maximalizující logaritmus ( xi μ ) i věrohodnostní funkce L, tj. ln( L) = ( N / )[ln( π) + ln( σ )] σ Pro první derivace logaritmu věrohodnostní funkce pak platí ln( L ) = xi N μ μ, ( x i μ ) ln( L ) i N = σ [ σ ] σ maximálně věrohodné odhady střední hodnoty a rozptylu jsou totožné s průměrem a výběrovým rozptylem. i.
45 1) Stanovení typu rozdělení: pro výpočet F 1 t (P i ) je třeba znát obecně parametry teoretickéh rozdělení. V řadě případů je však možná standardizace s = ( x Q) / R, kde R je parame rozptýlení. Standardizované kvantilové funkce Q s (P i ) = Fs t 1 (P i ) obsahují jen tvarové faktory. V případě shody obou rozdělení pak resultuje přímková závislost x() i = Q + R. QS( Pi) = a + b. QS( Pi). ) Odhady parametrů polohy a rozptýlení: odhad střední hodnoty odpovídá absolutnímu členu a odhad směrodatné odchylky směrnicí b regresní přímky. Pro odhad parametrů z Q-Q grafů je možno použít bud MNČ. Transformací z Y σ 1/ = ln[(1 + σ * ) ] má veličina z normované normální rozdělení N(0,1). Pořádková statistika x (i) pak souvisí s pořádkovou statistikou normovaného normálního exp( σ z ( i )) 1 x( i) = μ + τ μ τ g i( σ ) rozdělení z (i) dle + σ
46 V řadě případů je však možná standardizace = ( x Q) R, kde R je parametr rozptýlení. s / V případě shody obou rozdělení pak resultuje přímková závislost x( i) = Q + R. QS( Pi) = a + b. QS( Pi). Odhad střední hodnoty odpovídá absolutnímu členu a odhad směrodatné odchylky směrnicí b regresní přímky. Pro odhad parametrů z Q-Q grafů je možno použít bud MNČ.
47 Cenzorované výběry Pro odhady parametrů v cenzorovaných výběrech lze použít jak metodu maximální věrohodnosti, tak i metody založené a pořádkových statistikách. Cenzorování typu I: známe limitu detekce x L (mez pod kterou se zaznamenává pouze, Přítomnost měření) a předpokládejme, známe rozdělení dat charakterizované hustotou pravděpodobnosti f(x), resp. distribuční funkcí F(x). Pro cenzorovaná měření lze při znalosti distribuční funkce měření určit pouze pravděpodobnost s jakou leží pod mezí detekce, která je rovna F(x L ). Všechny možné kombinace n 1 prvků, které ve výběru velikosti N leží pod limitou detekce jsou dány binomickým koeficientem N!/(n 1! (N - n 1 )!). Věrohodností funkce má pro tento případ tvar N! ln( L) = n!*( N n N n F( X L ) 1 1)! i= n * f ( x( i) ).
48
49 Pro případ normálního rozdělení dat nalezl Cohen vztahy pro odhad střední hodnoty x C a rozptylu s odpovídající maximalizaci věrohodnostní funkce s využitím odhadů z necenzorované části dat Platí, že x N = 1 N x() i N n = +, 1 1 i n 1 s x x. N N = ( () i N) N n 1 1 i= n + 1 x = x λ *( x x ) C N N L, = + *( ) C N N L s s λ x x Parametr λ závisí: 1) na odhadnutém podílu cenzorovaných dat h = n1 / N a ) na parametru g = sn /( xn xl). Hodnoty λ jsou tabelovány a existují také empirické vztahy. 1 1
50 Postačuje jednokrokový odhad založený na předpokladu, že počet hodnot pod limitou detekce má binomické rozdělení a pro odhad střední hodnoty x CJ a rozptylu s CJ pak platí x = x q* s CJ N N N x() i i= n CJ = N N Φ N n1 ( ) *( * ( ) ) 1 s x s q h q Korekční faktor q má tvar q = ( N N n 1 ) 1 exp( 0.5*[ Φ ( h)] ) π. Odhady xcj a s CJ lze tedy určit relativně snadno bez nutnosti použití speciálních tabulek. Pro dvou-parametrové logaritmicko-normální rozdělení stačí místo hodnot x (i) použít jejich logaritmů ln (x (i) ) a logaritmovat i limitu detekce.
51
52 Praktické doplňky Při zpracování experimentálních dat záleží na množství informací, které jsou: I. Víme vše: známe pravděpodobnostní model a stačí pouze ověření předpokladů před konfirmativní statistickou analýzou II. Nevíme nic: postavíme datově závislý pravděpodobnostní model a provede se komplex analýza dat (1. EDA průzkumová,. Ověření předpokladů, 3. Transformace, 4. Porovnání výběrovéh rozdělení s teoretickými). III. Něco víme: postavíme empirický model se známými tak i datově závislými informacem pak se provede 1.,., 3. a 4. analýza dat) Doporučené další postupy: 1) Robustní metody, ) Využití zešikmených rozdělení, 3) Počítačově intenzivní metody, 4) Generalizovaná lineární regrese.
INTERVALOVÉ ODHADY PARAMETRŮ ZÁKLADNÍHO SOUBORU
INTERVALOVÉ ODHADY PARAMETRŮ ZÁKLADNÍHO SOUBORU Interval spolehlivosti pro parametr τ při hladině významnosti α (0,1) je určen statistikami T 1 a T 2 :. P T τ T =1-α ( ) 1 2 X toto je bodový odhad neznámé
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VícePRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
VíceÚloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )
Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v
VíceKvantily a písmenové hodnoty E E E E-02
Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem České
VíceVYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Více6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.
6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceMATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
VícePrůzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceStatistická analýza. jednorozměrných dat
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v
VíceUrčujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VícePraktická statistika. Petr Ponížil Eva Kutálková
Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
VíceZáklady teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
VíceIDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
VíceP13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VícePředpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2
Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik
VíceMATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
VíceÚloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII
VíceVýběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
VíceÚvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
VíceJiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
VíceTéma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
VíceUNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE
UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT V OSTRAVĚ 20.3.2006 MAREK MOČKOŘ PŘÍKLAD Č.1 : ANALÝZA VELKÝCH VÝBĚRŮ Zadání: Pro kontrolu
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
Více8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované
VíceDeskriptivní statistické metody II. Míry polohy Míry variability
Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceI. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
VíceMATEMATICKÁ STATISTIKA
MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceČíselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
Vícep(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ
VíceNáhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1
Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud
VíceZÁKLADNÍ ANALÝZA DAT S OHLEDEM NA LIMITU DETEKCE
ZÁKLDÍ LÝZ DT S OHLEDEM LIMITU DETEKCE JIŘÍ MILITKÝ, Katedra tetilních materiálů, Technická universita v Liberci, 46 7 Liberec MIL MELOU, Katedra analytické chemie, Universita Pardubice, Pardubice Motto:
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Vícepravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
VíceStatistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
VíceSTATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
VíceStatistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni
Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou
VícePorovnání dvou reaktorů
Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.
VíceStatistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné
VíceJAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová
JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž
Více31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
VícePSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
VíceVybraná rozdělení náhodné veličiny
3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.
VíceS E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
VícePřednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP
IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceUniverzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel
Vícey = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
VíceS E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza
Víceveličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
VíceDefinice spojité náhodné veličiny zjednodušená verze
Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f
VíceNormální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
VíceSTATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VíceJAK MODELOVAT VÝSLEDKY
JAK MODELOVAT VÝSLEDKY NÁHODNÝCH POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za
VíceJiří Militký KTM, Technická universita v Liberci, LIBEREC, Česká Republika
RUTIÍ AALÝZA DAT V AALYTICKÉ LABORATOŘI Jiří Militký KTM, Technická universita v Liberci, 46 7 LIBEREC, Česká Republika Milan Meloun, KACH, Universita Pardubice,530 099 PARDUBICE Česká Republika Souhrn
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus
VíceX = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
VíceStatistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
Více8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
Vícemarek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
Více5. B o d o v é o d h a d y p a r a m e t r ů
5. B o d o v é o d h a d y p a r a m e t r ů Na základě hodnot náhodného výběru z rozdělení určitého typu odhadujeme parametry tohoto rozdělení, tak aby co nejlépe odpovídaly hodnotám výběru. Formulujme
VíceNáhodná veličina a rozdělení pravděpodobnosti
3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro
VícePopisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
VíceObsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku
Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v
VíceStatistická analýza jednorozměrných dat
Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných
VíceZáklady popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceZpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceOtázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?
Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.
VíceSimulace. Simulace dat. Parametry
Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,
VíceMetodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
Více