Matematická Statistika. Ivan Nagy, Pavla Pecherková, Jitka Homolová

Rozměr: px
Začít zobrazení ze stránky:

Download "Matematická Statistika. Ivan Nagy, Pavla Pecherková, Jitka Homolová"

Transkript

1 Texty ke cvičením Matematická Statistika Ivan Nagy, Pavla Pecherková, Jitka Homolová

2 Obsah Popisná statistika 4. Seznámení s programem MATLAB Popisné charakteristiky v MATLABu Příklady Náhodný výběr 4 3 Příklady 5 4 Bodové odhady a jejich vlastnosti 5 4. Exponenciální třída rozdělení Některá rozdělení ve tvaru exponenciální třídy Metoda maximální věrohodnosti Metoda momentů Příklad (exponenciální rozdělení) Příklad (alternativní rozdělení) Vlastnosti bodových odhadů Příklad (nestrannost a konzistence pro Alt(π)) Příklad (vydatnost) Příklady 8 6 Intervaly spolehlivosti 9 6. Funkce MATLAB Příklady Testy parametrických hypotéz 9 7. Funkce MATLAB Příklady Příklady 9 9 Chi testy hypotéz 0 9. Funkce MATLAB Příklady Další neparametrické testy 0 0. Funkce MATLAB Příklady

3 Regresní analýza 0. Funkce MATLAB Příklady Korelační analýza. Funkce MATLAB Příklady Analýza rozptylu (ANOVA) 3. Funkce MATLAB Příklady Analýza hlavních komponent 4. Příklady Funkce MATLAB Příklady řešené pomocí MATLAB 5. Popisná statistika Intervaly spolehlivosti Testy hypotéz Chi testy hypotéz Další neparametrické testy hypotéz Regresní analýza Korelační analýza ANOVA Analýza hlavních komponent

4 Cvičení Popisná statistika. Seznámení s programem MATLAB. Popisné charakteristiky v MATLABu bas stat bas stat bas stat sort mean std var cov cor mode median iqr moment meansq sumsq sorted unsorted table popisná statistika pro netříděná data popisná statistika - - dva soubory popisná statistika pro tříděná data průměr směrodatná odchylka výběrový rozptyl výběrová kovariance korelační koeficient modus median mezikvartilové rozpětí výběrové momenty průměr čtverců součet čtverců tříděná data netříděná data kontingenční tabulka.3 Příklady Udělat průměr a porovnat s mean. A další. Sestavit něco jako bas stat, ale podle svého. Generovat kostku a ověřit /6 pro jedno číslo. A další (sudé,...). Kostka: fix(6rand+). Více hodů: k=fix(6rand(,000)+), udělat min, max, hist. Součet na dvou kostkách: k=fix(6rand(,000)+)+fix(6rand(,000)+). MATLAB: p0, p0 Náhodný výběr Popsat výběr na příkladech. Zdůraznit náhodnost charakteristik výběru. Výběrový průměr a jeho charakteristiky. Rozdělení výběrových charakteristik. Normování a odnormování výběrového průměru. Udělat funkci. 4

5 3 Příklady cv0 a cv0. Cvičení 4 Bodové odhady a jejich vlastnosti Vlastnosti bodových odhadů na grafu hp statistiky. Metoda momentů. Metoda maximální věrohodnosti. Příklady: pro exponenciální rozdělení, pro alternativní rozdělení, MATLAB: průměr z průměrů se blíží mí. 4. Exponenciální třída rozdělení Hp f(x, θ) je exponenciální třídy jestliže f(x, θ) = exp{q(θ)u(x) + R(θ) + V (x)} množina {x f(x, θ) 0} nezávisí na θ. 4. Některá rozdělení ve tvaru exponenciální třídy Alternativní Poissonovo { ( ) } π f(x, π) = π x ( π) x = exp ln x + ln( π) π λ λx f(x, λ) = e x! = exp {ln(λ)x λ ln(x!)} Normální (µ i σ neznámé) = exp f(x, [µ, σ ]) = { exp πσ { [ σ, µ σ ] [ x x ] ( µ ( ) } x µ = σ σ + ln(σ ) ) ln(π) } Exponenciální f(x, δ) = { δ exp x } = exp { } δ δ x ln(δ) 5

6 4.3 Metoda maximální věrohodnosti Exponenciální třída Podmínka extrému Ověření maxima f(x, θ) = exp{q(θ)u(x) + R(θ) + V (x)} Q S + nr = 0 kde S = Q S + nr < 0 n U(x i ) i= 4.4 Metoda momentů Porovnáme obecné momenty souboru E[X k ] = x k f(x, θ)dx θ a výběru M k = n x k, n i= pro k =,,... podle toho, kolik parametrů odhadujeme. Většinou odhadujeme jeden parametr, potom použijeme prvé momenty, tj. E[X] = x. 4.5 Příklad (exponenciální rozdělení) Zkonstruujte odhadovou statistiku pro odhad parametru δ exponenciálního rozdělení. Ř e š e n í: Maximální věrohodnost Exponenciální třída f(x, δ) = exp { } δ x ln(δ) Odtud je U = x S = n i= x i Q = δ Q = Q δ = δ 3 R = ln(δ) R = δ R = δ Podmínka n δ x i n δ = 0 ˆδ = x. Ověření Momenty i= δ 3 E[X] = δ, Poznámka: Udělat spíše pro a = /δ. n i= x i + n δ < 0 <. n n x i = x, ˆδ = x i= 6

7 4.6 Příklad (alternativní rozdělení) Proved te konstrukci odhadu parametru π náhodné veličiny s alternativním rozdělením. Ř e š e n í: Maximální věrohodnost: Exponenciální třída Odtud je U = x ( ) Q = ln π π R = ln( π) Podmínka { ( ) } π f(x, θ) = exp ln x + ln( π) π S = n i= x i Q = π( π) Q = π π ( π) R = π R = ( π) π( π) Ověření (dosadíme x i = nπ) Momenty Odtud porovnáním ˆπ = p. n i= n π = 0 ˆπ = x = p π π ( π) nπ n ( π) < 0 π <. E[X] = xπ x ( π) x = 0π 0 ( π) + π ( π) 0 = π, i=0 n x i = x = p n i= 4.7 Vlastnosti bodových odhadů Obecně označíme: T je odhadová statistika, θ je odhadovaný parametr. Nestrannost Konzistence Kriterium: E[T ] = θ lim P ( T n θ > ɛ) = 0 n - asymptotická nestrannost E[T n ] = θ, pro n, - limita rozptylu jde k nule D(T n ) = 0, pro n. Vydatnost Vyjadřuje přesnost bodového odhadu. Pro nestranné odhady se vydatnost měří rozptylem D[T ]. Pro odhady, které nejsou nestranné je měřítkem vydatnosti M SE MSE = E[(T θ) ] = D[T ] + B(θ). 7

8 4.8 Příklad (nestrannost a konzistence pro Alt(π)) Je dán výběr o rozsahu n z náhodné veličiny X s pravděpodobnostní funkcí f(x) = π x ( π) x, x = 0,. Ukažte, že statistika T = p = n ni= X i je nestranným a konzistentním odhadem parametru π. Ř e š e n í: E[X] = π, D[X] = π( π). Nestrannost E[T ] = E [ n ] n X i = n X i = π. n i= i= Konzistence D[X] π( π) lim P ( p π > ɛ) lim n n nɛ = lim n nɛ = 0 Cvičení: totéž, ale pro T = n + = X i. (Je nestraný, není konzistentní). 4.9 Příklad (vydatnost) Z náhodné veličiny byl učiněn výběr o rozsahu 3000 a vypočteny průměry x i z první poloviny dat, x ze dvou třetin druhé poloviny a x 3 ze zbytku. Pro odhad střední hodnoty byly použity dvě statistiky T = X + X a) Ověřte nestrannost obou statistik. b) Zjistěte, která ze statistik ve vydatnější. Ř e š e n í: a) Jsou nestranné b) T je vydatnější. E[T ] = µ + µ a T = X + X 3. = µ, E[T ] = µ + µ 3 [ ] D[T ] = D X + X = 4 (D[X ] + D[X ]) = ( σ 4 = µ. ) σ 000 ) [ ] D[T ] = D X + X 3 = 4 (D[X ] + D[X 3 ]) = ( σ σ 500 Poznámka: Rozptyl součtu je zde součet rozptylů. Proč? = σ 400. = σ Příklady cv03 a cv04 8

9 Cvičení 3 6 Intervaly spolehlivosti 6. Funkce MATLAB z int t int t int s t int n t int p prop int prop int var int interval pro střední hodnotu (známý rozptyl) interval pro střední hodnotu (neznámý rozptyl) interval pro dvě střední hodnoty (sdružený) interval pro dvě střední hodnoty (nesdružený) interval pro dvě střední hodnoty (párové výběry) interval pro podíl interval pro dva podíly interval pro rozptyl 6. Příklady p04, p04, p043 7 Testy parametrických hypotéz 7. Funkce MATLAB z test z test t test t test s t test n t test p prop test prop test var test var test test střední hodnoty (známé sig) test dvou středních hodnot (známé sig) test střední hodnoty (neznámé sig) test dvou středních hodnot (sdružený) test dvou středních hodnot (nesdružený) test dvou středních hodnot (párový) test podílu test dvou podílů test rozptylu test dvou rozptylů 7. Příklady p05, p05, p053, p054, p055, p056, p057 8 Příklady cv05, cv06 a cv07 9

10 Cvičení 4 9 Chi testy hypotéz 9. Funkce MATLAB chisquare test chisquare test homogeneity chisquare test independence vzdálenost O a E dobrá shoda nezávislost 9. Příklady p06, p06, p063 0 Další neparametrické testy 0. Funkce MATLAB sign test wztest cor test kolmogorov smirnov test test dvou mediánů test nezávislosti prvků výběru test nezávislosti výběrů test typu rozdělení 0. Příklady p07, p07, p073, p074 Cvičení 5 Regresní analýza. Funkce MATLAB reg desc reg info lin reg exp reg pol reg popisná lin. regrese lin. regrese (soubor charakteristik) lineární regrese exponenciální regrese polynomická regrese 0

11 . Příklady Korelační analýza. Funkce MATLAB reg infe t test reg f test reg inferenční lin. regrese t-test lin. regrese f-test lin. regrese. Příklady 3 Analýza rozptylu (ANOVA) 3. Funkce MATLAB Cvičení 6 anova anova analýza rozptylu - jednoduchá analýza rozptylu - dvojná 3. Příklady Cvičení 7 4 Analýza hlavních komponent 4. Příklady p0, p0 4. Funkce MATLAB pca eig pca svd rozklad kovarianční matice rozklad datové matice

12 5 Příklady řešené pomocí MATLAB 5. Popisná statistika ****************** p0 ****************** % P0 - Popisná statistika % % - char. polohy a variability pro prosta data % - char. polohy a variability pro tříděná data % Měřením jsme získali dva náhodné výběry "x" a "y" a % uložili je do datového souboru "data0". % % Určete: % a) střední hodnotu, rozptyl, směrodatnou odchylku, modus, % medián, variační rozpětí, a mezikvartilové rozpětí pro "x" % b) kovarianci a korelační koeficient pro "x" a "y". % % Soubor "x" roztřidte do pěti intervalů a % c) určete vážený průměr a rozptyl, % d) určete modus a medián tříděných dat. load data0; disp( Priklad P0 ); disp( a) prosta data ); mx = mean(x); vx = var(x); sd = std(x); mo = mode(x,00); me = median(x); rr = max(x)-min(x); kr = iqr(x); fprintf( stredni hodnota: %g\n,mx) fprintf( rozptyl: %g\n,vx) fprintf( smerodatna odchylka: %g\n,sd) fprintf( modus: %g\n,mo) fprintf( median: %g\n,me) fprintf( variacni rozpeti: %g\n,rr) fprintf( mezikvartilove rozpeti: %g\n,kr) disp( b) ); cxy = cov(x,y); rxy = cor(x,y); fprintf( kovariance: %g\n,cxy) fprintf( korelacni koeficient: %g\n,rxy)

13 disp( c) tridena data ); [ff xx]=hist(x,5); xn.d=xx ; xn.n=ff ; mxs = mean(xn); vxs = var(xn); fprintf( stredni hodnota: %g\n,mxs) fprintf( rozptyl: %g\n,vxs) disp( d) ); [a k]=max(xn.n); mos = xn.d(k); mes = median(unsorted(xn)); fprintf( modus: %g\n,mos) fprintf( median: %g\n,mes) ****************** p0 ****************** % P0 - Popisná statistika % % - trídeni dat % - char. tridenych a netridenych dat % Měřením jsme získali dva náhodné výběry "x" a "y" a % uložili je do datového souboru "data0". % Soubor "x" roztřidte intervalů s hranicemi h = [ ]; % a % a) určete vážený průměr a rozptyl takto tříděných dat, % b) porovnejte s průměrem a rozptylem stejných dat, % tříděných rovnoměrně do pěti skupin. load data0; disp( Priklad P0 ); disp( a) trideni do predapsanych intervalu ); intervaly=h f = zeros(5,); g = f; for j=:4 f(j)=sum(x>h(j) & x<=h(j+)); g(j)=(h(j+)+h(j))/; end%for f()=f()+; xn.d=g; xn.n=f; 3

14 mx = mean(xn) vx = var(xn) disp( b) trideni do 5 ekvidistantnich intervalu ); [f g]=hist(x,5); intervaly=g xn.d=g; xn.n=f; mx = mean(xn) vx = var(xn) 5. Intervaly spolehlivosti ****************** p04 ****************** % P04 - Intervaly spolehlivosti (pravděpodobnost že..) % % Předpokládáme, že velký ročník va VŠ má % výskedky testu rozděleny normálně, se střední % hodnotou 7 bodů a směrodatnou odchylkou % 9 bodů. % a) Určete pravěpodobnost, že náhodně vybraný student % bude mít výsledek nad 80 bodů. % b) Provedeme výběr o rozsahu n=4 a n=9. Jaká je % pravděpodobnost, že výběrový průměr z těhto výběrů % bude větší než 80? % zadané hodnoty m = 7; % střední hodnota s = 9; % směrodatná odchylka h = 80; % hranice bodů n = 4; % velikost výběru % a) z=(h-m)/s; pv=-normal_cdf(z); % b) z=(h-m)/s*sqrt(n); pv=-normal_cdf(z); % normování pro veličinu % pravděpodobnost % normování pro výběr % pravděpodobnost fprintf( Test velkeho rocniku na VS ()\n\n ); fprintf( Pr. nad %g pro studenta je: %g\n,h,pv); fprintf( Pr. nad %g pro vyber n=%g je: %g\n,h,n,pv); 4

15 % Řešeni b) je pro n=4. Pro n=9 se hodnota n přepíše. % Tak je možno měnit i dakší hodnoty, případně upravit % celý m-file. % Funkce normal_cdf(x) je totéž jako % normal_cdf(x,0,) což je stdnormal_cdf(x) % => std na začátku funkce je tedy možno vynechat! ****************** p04 ****************** % P04 - Intervaly spolehlivosti (výpočet hranice intervalu) % % Velký ročník na VŠ psal test. Ze zkušenosti víme, že % výsledky testu jsou rozděleny normálně, se směrodatnou % odchylkou 9 bodů. Střední hodnotu, danou konkrétní % obtížností testu, neznáme. Provedli jsme výběr x = [64, 66, 89, 77]; % a) Určete interval, ve kterém leží střední hodnota mí % s pravděpodobností 0.95 (nebo, ve kterém leží % 95% všech odhadů střední hodnoty - což je totéž). % b) Totéž, ale pro neznámý rozptyl. % c) Totéž, ale pro rozptyl. % zadané hodnoty sig = 9; % směrodatná odchylka al =.05; % pravděpodobnost % a) n=length(x); mx=mean(x); z_kr=-normal_inv(al/); del=sig/sqrt(n)*z_kr; is=[mx-del, mx+del]; % b) s=std(x); t_kr=-t_inv(al/,n-); del=s/sqrt(n)*t_kr; is=[mx-del, mx+del]; % rozsah výběru % průměr x % krit. hodnota % poloměr IS % IS % směrodatná odchylka % krit. hodnota % poloměr IS % IS % c) ch_krl=chisquare_inv(-al/,n-); % kr. hod. levá ch_krr=chisquare_inv(al/,n-); % kr. hod. pravá s=var(x); % rozptyl 5

16 is3()=(n-)*s/ch_krl; is3()=(n-)*s/ch_krr; % IS levá hranice % IS pravá hranice fprintf( Test velkeho rocniku na VS ()\n\n ); fprintf( IS pro mi (sig zname) je: (%g, %g)\n,is); fprintf( IS pro mi (sig nezname) je: (%g, %g)\n,is); fprintf( IS pro sig je: (%g, %g)\n,is3); % lze použít funkce pro IS % z_int(x,sig**,.95); % t_int(x,.95); % var_int(x,.95); ****************** p043 ****************** % P043 - Intervaly spolehlivosti (pro mí, rozsah IS) % % Náhodná veličina X má normální rozdělení se střední % hodnotou mí a rozptylem sig. Provedli jsme náhodný % výběr x = [5, 7, -5, -4, 0,,,, 5, ]; % Určete % a) 95% IS pro střední hodnotu, % b) maximální chybu oboustranného intervalu, % c) rozsah výběru pro pro maximální chybu 0.. % zadané hodnoty al =.05; del0 =.; % a) is=t_int(x, al, <> ); is=t_int(x, al, > ); is3=t_int(x, al, < ); % b) n=length(x); s=std(x); t_kr=-t_inv(al/,n-); del=s/sqrt(n)*t_kr; % IS obou.. % IS pravo.. % IS levo.. % rozsah výběru % směrodatná odchylka % kritická hodnota % poloměr intervalu % c) nn=s/del0*t_kr; % rozsah výběru (zlomek) n0=fix(nn)+; % - - (zaokrouhleno) 6

17 disp( a) ); fprintf( IS pro mi a rozsah vyberu\n\n ); fprintf( IS obou.. je: (%g, %g)\n,is); fprintf( IS pravo.. je: (%g, %g)\n,is); fprintf( IS levo.. je: (%g, %g)\n,is3); disp( b) ); fprintf( maximalni chyba: %g\n,del); disp( c) ); fprintf( rozsah vyberu: %g\n,n0); ****************** p044 ****************** % PO44 - Interval spolehlivosti pro rozdíl dvou mí % % Sledovali jsme účinek dvou protikorozních látek. % První jsme použili ve 0 případech, druhou ve 5 % případech. Po stanovené době jsme zjistili stupeň % poškození s výsledky mx=8.4; sx=; mx=80; sx=0; % Určete 95% IS pro shodu středních hodnot obou testů % za předpokladu normality obou rozdělení. Rozptyly % považujte a) za stejné, b) za různé. Výsledky % porovnejte. % zadané hodnoty al =.05; n = 0; n = 5; alt = <> ; % konstrukce dat (jsou zadány již vypočtené momenty) x.n=n; x.m=mx; x.v=sx; x.n=n; x.m=mx; x.v=sx; % a) sdružený test is_s = t_int_s(x,x,al,alt); 7

18 % b) nesdružený test is_n = t_int_n(x,x,al,alt); fprintf( Dve stredni hodnoty\n\n ); fprintf( interval spolehlivosti: fprintf( interval spolehlivosti: (%g, %g)\n, is_s); (%g, %g)\n, is_n); % Protože výběrové rozptyly jsou blízké, jsou blízké i % IS pro sdružený a nesdružený výběr % Protože 0 neleží v intervalech, lze učinit závěr (s % pravděpodobností 0.95), že metody nejsou shodné. ****************** p045 ****************** % P045 - Interval pro podíl % % Na dálničním úseku s rychlostí omezenou na 80 km/h % byla náhodným výběrem u 0 automobilů změřena % rychlost s výsledky x=[ ]; % Určete levo, pravo i oboustranný 0.95-IS pro podíl % automobilů, překračujících povolenou rychlost. % Návod: počet překračujících je sum(x>80) % zadané hodnoty al =.05; n = 0; alt_l = > ; alt_p = < ; alt_o = <> ; n=sum(x>80); p=n/n; is_l= prop_int(p,n,al,alt_l); is_p= prop_int(p,n,al,alt_p); is_o= prop_int(p,n,al,alt_o); fprintf( Dva podily\n\n ); fprintf( levostranný IS: fprintf( pravostranný IS: (%6.4g, %g)\n, is_l); (%g, %6.4g)\n, is_p); 8

19 fprintf( oboustranný IS: (%6.4g, %6.4g)\n, is_o); % V testu lze zadat bud podíl p nebo počet n. Výsledek % je stejný. 5.3 Testy hypotéz ****************** p05 ****************** % P05 - Test hypotézy pro střední hodnotu % % Byl proveden výběr o rozsahu 6 z normálního rozdělení a % byl vypočten výběrový průměr 458 a výběrová směrodatná % odchylka 5. Testujte hypotézu H0: mi0=4500 proti % alternativě HA: mi>mi0 na hladině významnosti % zadané hodnoty n = 6; % rozsah výběru mi0 = 4500; % H0 mx = 458; % průměr sx = 5; % směrodatná odchylka al =.05; % pravděpodobnost t_kr=-t_inv(al,n-); t_r=(mx-mi0)/sx*sqrt(n); W=[t_kr, inf]; pval=-t_cdf(t_r,n-); % kritická hodnota % realizovaná statistika % kritický obor % p-hodnota fprintf( Test stredni hodnoty\n\n ); fprintf( statistika: %g\n,t_r); fprintf( krit. obor: (%g, %g)\n,w); fprintf( p-hodnota: %g\n,pval); if t_r>t_kr disp( => H0 zamítáme ); else disp( => H0 nezamítáme ); end%if % m-file je připraven pro změnu zadání. Proto je závěr % formulován obecně (i pro zamítnutí H0) % Ověření pomocí funkce: disp( ); 9

20 disp( Overeni ); % konstrukce výběru (momenty) x.n = n; x.m = mx; x.v = sx^; [pval, t, df]=t_test(x, mi0, > ) ****************** p05 ****************** % P05 - Test pro střední hodnotu % % Provedli jsme náhodný výběr o rozsahu 0 z normálního % rozdělení se směrodatnou odchylkou 3 a vypočetli % průměr 5.5. Na hladině 0.05 testujte nulovou hypotézu % H0: mi0=4 proti alternativě % HA: a) mi!= mi0; b) mi > mi0; c) mi < mi0. % zadané hodnoty n = 0; sx = 3; mx = 5.5; mi0 = 4; al =.05; % konstrukce výběru (momenty) x.n = n; x.m = mx; x.v = sx^; % a) disp( Oboustranny test ); pval=t_test(x, mi0) disp( ); % b) disp( Levostranny test ); pval=t_test(x, mi0, < ) disp( ); % c) disp( Pravostranny test ); pval=t_test(x, mi0, > ) 0

21 % Lze také využít vnitřních tisků (zadání bez výstupu). ****************** p053 ****************** % P053 - Test pro střední hodnotu % % Výrobce tvrdí, že jím vyráběné kuličky do ložisek mají % střední hodnotu průměru 0 mm a ne větší. Ne hladině % významnosti 0.05 testujte uvedenou hypotézu, jestliže ve % výběru 6 kuliček byl průměr 0.3 a a) sig=, b) s=.. % zadané hodnoty alt = > ; mi0 = 0; mx = 0.3; n = 6; sig = ; s =.; % konstrukce výběru (momenty) x.n = n; x.m = mx; x.v = s; % a) pvala=z_test(x, mi0, sig, alt); % b) pvalb=t_test(x, mi0, alt); fprintf( Test stredni hodnoty\n\n ); fprintf( pval pro sig: %g\n, pvala); fprintf( pval pro s: %g\n, pvalb); ****************** p054 ****************** % P054 - Test pro rozptyl % % Nová metoda měření délky součástek byla ověřována na % etalonu. Disperze určená z 0 měření byla 00. Je tento % výsledek ve shodě s tvrzením, že disperze výsledků nové

22 % metody není větší než 50? Testujte na hladině % zadané hodnoty n = 0; s = 00; s0 = 50; alt = > ; % konstrukce výběru (momenty) x.n = n; x.v = s; var_test(x, s0, alt); ****************** p055 ****************** % P055 - Test pro dvě střední hodnoty % % Zjištoval se vliv dvou katalizátorů na konverzi plynu. % Výsledky (v procentech) jsou x = [ ]; y = [ ]; % Ověřte hypotézu, že vysledky obou katalyzátorů jsou na % hladině významnosti 0.05 stejné. Testujte pro % a) stejné rozptyly, b) různé rozptyly. % zadané hodnoty al =.05; alt = <> ; % a) stejné rozptyly (sdružený test) [pvala, ta, dfa] = t_test_s (x, y, alt); % b) různé rozptyly (nesdružený test) [pvalb, tb, dfb] = t_test_n (x, y, alt); disp( Sdruzeny t-test ) fprintf( pval: %g\n, pvala); if pvala<al disp( H0 zamitame ); else

23 disp( H0 nezamitame ); end%if disp( ); disp( Nesdruzeny t-test ) fprintf( pval: %g\n, pvalb); if pvalb<al disp( H0 zamitame ); else disp( H0 nezamitame ); end%if ****************** p056 ****************** % P056 - Test dvou středních hodnot - párové výběry % % Dvěma laboratoními metodami se zjištoval obsah chemické % látky v roztoku (v %). Předpokládáme. že výsledky mají % normální rozdělení. Bylo provedeno měření 5 vzorků (každý % vzorek byl měřen oběma metodami) s výsledky x = [ ]; y = [ ]; % Ověřte, zda existuje na hladině významnosti 0.05 podstatný % rozdíl mezi metodami. % zadané hodnoty al =.05; n=length(x); if length(y)~=n, disp( Delky x a y musi byt stejne ); return end%if [pval, t, df] = t_test_p (x, y); fprintf( Parovy t-test\n\n ); fprintf( p-hodnota: %g\n, pval); fprintf( statistika: %g\n, t); fprintf( stupne vol.: %g\n, df); ****************** p057 ****************** 3

24 % P057 - IS a TH pro dva podíly % % Na dvou pracovištích sledujeme pracovní prostoje. % Pracoviště A bylo sledováno v 800 časových okamžicích a % bylo zaznamenáno 6 prostojů. Kontrola pracovište B % probíhala v 00 okamžicích a bylo zjištěno 78 prostojů. % a) Stanovte 95% IS pro rozdíl středních podílů. % b) Na hladině významnosti 0.05 testujte hypotézu o % rovnosti středních podílů. % zadané hodnoty x = 6; n = 800; x = 78; n = 00; al =.05; % a) is=prop_int_(x,n,x,n,al); % b) [pval, z] = prop_test_ (x, n, x, n); fprintf( Dva podily\n\n ); fprintf( interval spolehlivosti: fprintf( p-hodnota testu: (%g, %g)\n, is); %g\n, pval); % Souvislost mezi IS a TH: nula není v IS => H0 se zamítá. 5.4 Chi testy hypotéz ****************** p06 ****************** % P06 - Test dobré shody pro rovnoměrné rozdělení % % Testujte tvrzení, že ve Svédsku se děti rodí rovnoměrně po % celý rok. K dispozici jsou údaje z náhodného výběru 88 % porodů, sdružené do čtyř (různě dlohuhých) obdobi. % Délky období ve dnech jsou: d = [ ]; % Počty porodů za jednotlivá období: 4

25 x = [ ]; n = length(x); % Pozorované četnosti jsou zadány o = x; % Teoretické četnosti určíme tak, aby % ) byl stejný počet porodů (tj. 88), % ) porody byly rozděleny rovnoměrně, tj. úměrně délce % období. Tedy e = d/sum(d)*sum(x); % Statistika: ch = sum((o-e).^./e); % p-hodnota pval = -chisquare_cdf(ch,n-); % Ověření pomocí funkce chisquare_test [pv ch]=chisquare_test(o,e); fprintf( Test dobre shody rovnomerneho rozdeleni\n\n ); fprintf( p-hodnota: %g\n, pval); fprintf( p-hodnota (funkce): %g\n, pv); ****************** p06 ****************** % P06 - Test dobré shody pro normální rozdělení % % V souboru data je uložen datový vzorek x. % a) Určete bodový odhad jeho střední hodnoty a rozptylu. % b) Testujte, zda pochází z normálního rozdělení s % odhadnutými charakteristikami. load data0; n = length(x); m = 30; % data % rozsah výběru % počet intervalů pro četnosti % a) odhady mx = mean(x); vx = var(x); 5

26 % b) test dobré shody % Pozorované četnosti (na m intervalech) [o xx]=hist(x, m); s=xx+(xx()-xx())/; % Teoretické četnosti f=normal_cdf(s, mx, vx); ff=[0 f]; ee=ff(:end)-ff(:end-); e=sum(o)*ee; % Test [pval ch] = chisquare_test(o, e); fig plot(xx,o, bo,xx,e, rx ); title( Dobra shoda pro norm. rozd. (blue=o, red=e) ) fprintf( Test dobre shody pro normalni rozdeleni\n\n ); fprintf( p-hodnota testu: %g\n, pval); fprintf( (pozri tiez graf)\n ); ****************** p063 ****************** % P063 - Test nezávislosti % % Bylo dotázáno 400 osob na bydliště a platovou skupinu. Z % odpovědí byla sestavena kontingenční tabulka T = [ ; ]; % kde řádky odpovídají bydlišti a sloupce platovým třídám. % Testujte hypotézu H0: bydliště a platy jsou nezávislé. % a) podle vzorců [nr nc]=size(t); % rozměry tabulky ss=sum(sum(t)); % celkový součet t=t/ss; % normování sc=sum(t); % norm. součet přes řádky (svisle) sr=sum(t ); % norm. součet přes sloupce (vodorovně) tt=sr *sc; % nezávislá normovaná tabulka TT=tt*ss; % nazávislá tabulka absolutní 6

27 o=t(:); e=tt(:); n=(nr-)*(nc-); % pozorované četnosti % teoretické četnosti % stupně volnosti [pval ch]=chisquare_test(o,e,n); % b) ověření funkcí [pv ch df] = chisquare_test_i (T); fprintf( Test nezávislosti\n\n ); fprintf( stat. (vzorce): %g\n, ch); fprintf( pval (vzorce): %g\n\n, pval); fprintf( stat. (funkce): %g\n, ch); fprintf( pval (funkce): %g\n, pval); % Kontingenční tabulka obsahuje absolutní četnosti dvou % znaků: bydlište,; plat,,3,4. Potom např. 30 lidí % odpovědělo, že bydlí v a mají plat Další neparametrické testy hypotéz ****************** p07 ****************** % P07 - Znaménkový test mediánů % % Generujte dva vzorky dat délky n. Oba s rozdělením chi, % první s 5 a druhý s 8 stupni volnosti. Pomocí % zanaménlového tesu ověřte shodu mediánů těchto vzorků. n = 00; % generování vzorků x=chisquare_rnd(5,, n); y=chisquare_rnd(8,, n); % chi s 5 stupni volnosti % chi s 8 stupni volnosti % výpočet mediánů med_x=median(x); med_y=median(y); % znaménkový test pval=sign_test(x, y, <> ); fprintf( Znamenkovy test medianu\n ); 7

28 fprintf( (H0: jsou stejné)\n\n ); fprintf( p-hodnota testu: %g\n, pval); % vykreslení průběhů datových vzorků fig plot(:n,x,:n,y); title( Testovana data ) ****************** p07 ****************** % P07 - Test nezávislosti prvků výběru (reziduí) % % V následujícím příkladě generujeme data pomocí diferenční % rovnice. řádu. Data modelujeme pomocí diferenční rovnice %. řádu jejíž koeficienty odhadujeme metodou nejmenších % čtverců. Odečtením změřených dat a dat generovaných z % odhadnuté diferenční rovnice získáme rezidua. Pokud je % odhad dobrý, musí být rezidua nezávislá. Testujte! k = ; % řad odhadu ( nebo ) n = 00; % počet dat ni = 3; % začátek generování dat if k==, nv = 5; % počet odhadovaných parametrů + else nv = 6; end%if y=zeros(,n); e=randn(,n); u=randn(,n); v=eye(nv)*e-5; % statistika pro odhad for t=ni:n % simulace regr. modelu druhého řádu y(t)=.9*y(t-)-.5*y(t-)+.3*u(t)+.*u(t-)+.*e(t); % identifikace regr. modelu prvního řádu if k==, d=[y(t) y(t-) u(t) u(t-) ]; else d=[y(t) y(t-) y(t-) u(t) u(t-) ]; end%if v=v+d *d; end vy=v(,); vfy=v(:nv,); vf=v(:nv,:nv); p=inv(vf)*vfy; % výpočet odhadu ze statistiky for t=ni:n % predikce identifikovaným modelem prvního řádu if k==, yp(t)=p()*y(t-)+p()*u(t)+p(3)*u(t-)+p(4); else yp(t)=p()*y(t-)+p()*y(t-)+p(3)*u(t)+p(4)*u(t-)+p(5); end%if end 8

29 % chyby predikce ep=y(ni:n)-yp(ni:n); % test na bělost (nezávislost) chyb predikce pval=wztest(ep); fprintf( Test nezavislosti rezidui\n ); fprintf( (H0: jsou nezavisla)\n\n ); fprintf( p-hodnota testu: %g\n, pval); ****************** p073 ****************** % P073 - Test nezávislosti výběrů (Pearson, Spearman, Kendal) % % Měřením jsme získali dva výběry x a y x=[ ]; y=[ ]; % Testujte, zda pocházejí z nezávislých rozdělení. Pro test % použijte % a) Pearsonův test, % b) Spearmanův test, % c) Kendalův test. % Výsledky srovnejte! disp( a) Pearsonuv test ) sp=cor_test(x,y, <>, p ) disp( a) Spearmanuv test ) ss=cor_test(x,y, <>, s ) disp( a) Kendalv test ) sk=cor_test(x,y, <>, k ) disp( *** H0: jsou nezavisle *** ); ****************** p074 ****************** % P074 - Kolmogorov-Smirnovův test typu rozdělení % % Generujte data z a) normálního, b) rovnoměrného rozdělení 9

30 % a testujte, zda generátor skutečně představuje tato % rozdělení n = 000; % počet dat % a) test rovnoměrného rozdělení na intervalu (,4) x=uniform_rnd(, 4,, n); pv=kolmogorov_smirnov_test(x, uniform,, 4); % test normálního rozdělení se stř. h. 5 a rozpt. 9 y=normal_rnd(5, 9,, n); pv=kolmogorov_smirnov_test(y, normal, 5, 9); fprintf( Kolmogorov-Smirnov test\n\n ); fprintf( p-hodnota pro rovnomerna data: fprintf( p-hodnota pro normalni data: %g\n, pv); %g\n, pv); % Další typy rozdělení. % Zadání je stejné % generátor: Rozdělení_rnd(Parametry, řádky, sloupce) % test: kolmogorov_smirnov_test(data, Rozdělení, Parametry) % Rozdělení Parametry % % binomial n,p % poisson lambda % geometric p % hypergeometric m,t,n % uniform a,b % exponential lambda % lognormal a,v % stdnormal % normal m,v % t df % chisquare df % f df_num,df_den % Příklady dalších rozdělení % x=exponential_rnd(,,n); % pv_e=kolmogorov_smirnov_test(x, exponential,) % x=binomial_rnd(0,.6,,n); % pv_b=kolmogorov_smirnov_test(x, binomial,0,.6) 30

31 % x3=poisson_rnd(4,,n); % pv_p=kolmogorov_smirnov_test(x3, poisson,4) % x4=lognormal_rnd(0,9); % pv_l=kolmogorov_smirnov_test(x4, lognormal,0,9) 5.6 Regresní analýza ****************** p08 ****************** % P08 - Regresní přímka % % Generujte datové dvojice [x,y], pro x=,,...,0 tak, aby % splnovali rovnici y = ax + b + e, kde e je normální náhodná % veličina s nulovou střední hodnotou a směrodatnou odchylkou s. % Volte: a = ; b = ; s = ; x = :0; % a) Určete koeficienty regresní přímky. % b) Určete korelační koeficient. % c) Vypočtěte predikce ve všech bodech x. % d) Body [x,y] i regresní přímku zobrazte. % e) Určete předpovídanou hodnotu ya pro xa=.5. % f) Odhadněte, pro které xb bude platit yb=6. % g) Doporučené experimenty: %. Měnte a na -, -.,.,.5,, 5, 5 %. Měnte s na 0,., 0, 00 % 3. Provedte předpověd yc pro xc=5, 5 n=length(x); % počet dat e=s*randn(,n); % šum y=a*x+b+e; % hodnoty y mx=mean(x); % průměr x my=mean(y); % průměr y sx=var(x)*(n-); % součet čtverců pro x sxy=cov(x,y)*(n-); % součet čtverců pro x,y sy=var(y)*(n-); % součet čtverců pro y % a) disp( Koeficienty regresni primky ) b=sxy/sx % směrnice b0=my-b*mx % absolutní člen 3

32 % b) disp( Korelacni koeficient ) r=sxy/sqrt(sx*sy) % korelační koeficient % c) yp=b*x+b0; % predikce % d) if, axis([0,,0,30]); % osy else axis([min(x)-,max(x)+,min(y)-,max(y)+]); end fig plot(x,y, o,x,yp, +-g ); % graf title( Regesni analyza pro testovana data ) % e) disp( Predikce y pro dane x ) xa=.5; ya=b0+b*xa % y pro dané x % f) disp( Predukce x pro dane y ) yb=6; xb=(yb-b0)/b % x pro dané y ****************** p08 ****************** % P08 - Odlehlá a vlivná pozorování % % Provedte regresní analýzu pro data x = [ 3]; y = [.3.8]; % Přidejte další měření [x4,y4] a výsledek porovnejte % s původním výsledkem. % REŠENÍ ii=3; % ii= - odlehlá pozorování if ii==, x(4)=4; y(4)=5; end % přidané měření % ii=3 - vlivná pozorování if ii==3, x(4)=9; y(4)=0; end disp( Koeficienty regrese ) [b b0 r]=reg_desc(x,y) yp=b0+b*x; fig plot(x,y, o,x,yp); axis([min(x)-.,max(x)+.,min(y)-.,max(y)+.]) % klíč, která data se přidají % ii= (nic), ii= (odlehlé), ii=3 (vlivné) % přidaný outlier (správně y=8.33) 3

33 ****************** p083 ****************** % P083 - Míra vhodnosti dat pro regresi % % Generujte data na elipse a provedte jejich regresní analýzu. % Při experimentech měnte velikosti poloos a otočení elipsy. % Sledujte hodnotu korelačního koeficientu r. s=0; % amplituda šumu přidaného k elipse a=0; b=; % poloosy elipsy % stejné - nevhodná, různé - vhodná d=[]; for f=0:.:*pi % polární souřadnice xf=a*cos(f)+s*randn; yf=b*sin(f)+s*randn; d=[d; [xf yf]]; end d=d*[cos(.) sin(.); -sin(.) cos(.)]; % otočení souřadnic x=d(:,); y=d(:,); [b b0 r]=reg_desc(x,y); % regrese yp=b0+b*x; % predikce fig plot(x,y, o,x,yp) title( Data vhodna / nevhodna pro regresi ) axis([min(x)-,max(x)+,min(y)-,max(y)+]); fprintf( Korelacni koeficient je: %5.3g\n,r); 5.7 Korelační analýza ****************** p09 ****************** % P09 - Korelační analýza (linearni a exponencialni regrese) % % Sledujeme vývoj počtu automobilů na jednoho obyvatele % v nasi republice ve vybraných rocích. Zjištěné údaje % jsou (x - rok, y - počet/hlavu) x = [ ]; y = [ ]; 33

34 % a) Provedte lineární regresní ananýzu těchto dat a testujte % vhodnost lineární regrese. % b) Provedte exponenciální regresní analýzu a její výsledky % porovnejte s s výsledky lineární regrese. Pro porovnání % použijte koeficient determinace. % a) xp = 99; al =.05; [b,b0,r]=reg_desc(x,y); [ie,ip,pa,pr]=reg_infe(x,y,xp,al); pv=f_test_reg(x,y); disp( ) disp( a) Linearni regrese ); disp( **************** ); fprintf( Koeficienty regresni primky: %g a %g\n,b,b0); fprintf( Korelacni koeficient: %g\n,r); fprintf( Interval str. h. pro xp=%d je: (%g, %g)\n,xp,ie); fprintf( Interval predikce pro xp=%d je: (%g, %g)\n,xp,ip); fprintf( p-hodnota pro t-test b: %g\n,pa); fprintf( p-hodnota pro t-test r: %g\n,pr); fprintf( p-hodnota pro F-test: %g\n,pv); % b) p=exp_reg(x,y); yp=exp_pred(x,p); p_exp=f_test_pred(y,yp); disp( ) disp( b) Exponencialni regrese ); disp( ********************* ); fprintf( Koeficienty exp. regrese: %g a %g\n,p); fprintf( p-hodnota pro F-test: %g\n,p_exp); % graf linearni a exponencialni regrese yy=lin_pred(x,[b b0]); fig plot(x,y, kx,x,yy, r,x,yp, b ); title( Linearni a exponencialni regrese ) % Pro toto zadání je exponenciální regrese lepší % (má menší p-hodnotu - ideální je ph=0) ****************** p09 ****************** 34

35 % P09 - Základní inference v lineární regresi % % Generujte datové dvojice [x,y], pro x=,,...,0 tak, aby % splnovali rovnici y = ax + b + e, kde e je normální náhodná % veličina s nulovou střední hodnotou a směrodatnou odchylkou s. % Volte: a = ; b = ; s = 3; x = :0; % a) Provedte lineární regresní analýzu. % b) Body [x,y] i regresní přímku zobrazte. % c) Stanovte 0.05-interval pro směrnici reg. přímky. % d) Stanovte 0.05-interval pro regresní přímku v xp=6. % e) Testem korelačního koeficientu ověřte vhodnost regrese. % f) Provedte F-test regrese a porovnejte t-testem. n=length(x); e=s*randn(,n); y=a*x+b+e; % počet dat % šum % hodnoty y [b b0 r]=reg_desc(x,y); yp=lin_pred(x,[b b0]); if, axis([0,,0,30]); % osy else axis([min(x)-,max(x)+,min(y)-,max(y)+]); end fig plot(x,y, o,x,yp, +-g ); % graf hold on xp=6; alpha=.05; alt= <> ; disp( is_e interval spolehlivosti pro stredni hodnotu ) disp( is_r interval spolehlivosti pro predikci ) disp( pval_a p-hodnota pro test "smernice reg. pr."=0 ) disp( pval_p p-hodnota pro test "korelacni koef."=0 ) disp( ) [is_a,is_e,pval_a,pval_r]=reg_infe(x,y,xp,alpha,alt) plot(xp,is_e(), xb,xp,is_e(), xb ); title( Linearni regrese ) hold off 35

36 ****************** p093 ****************** % P093 - Pás spolehlivosti % % Generujte datové dvojice [x,y], pro x=,,...,0 tak, aby % splnovali rovnici y = ax + b + e, kde e je normální náhodná % veličina s nulovou střední hodnotou a směrodatnou odchylkou s. % Volte: a = ; b = ; s = 0; x = :0; % Určete pás spolehlivosti pro regresné přímku. % ŘESENÍ n=length(x); % počet dat e=s*randn(,n); % šum y=a*x+b+e; % hodnoty y mx=mean(x); % průměr x my=mean(y); % průměr y sx=var(x)*(n-); % součet čtverců pro x sxy=cov(x,y)*(n-); % součet čtverců pro x,y sy=var(y)*(n-); % součet čtverců pro y disp( Koeficienty regrese ) b=sxy/sx % směrnice b0=my-b*mx % absolutní člen r=sxy/sqrt(sx*sy) % korelační koeficient se=sqrt(sy-b*sxy)/(n-); % standard error t_kr=t_inv(.95,n-); % kritická t-hodnota yp=[]; y=[]; y=[]; for xi=x ypi=b0+b*xi; % predikce yp=[yp ypi]; del=t_kr*se*sqrt(/n+(xi-mx)^/sx); y=[y ypi-del]; % intervaly y=[y ypi+del]; % spolehlivosti end if, axis([0,,0,30]); % osy else axis([min(x)-,max(x)+,min(y)-,max(y)+]); end fig plot(x,y, o,x,yp, +-g ); % graf hold on plot(x,y,x,y); title( Pas spolehlivosti ) hold off 36

37 ****************** p0 ***************** % P0 - Regresní analýza % % V letech 999, 000, 00, 00 a 003 byl zaznamenáván % počet obyvatel, využívající pražké metro. Změřené údaje % byly přepočítány na realtivní hodnoty (počet obyvatel % přepravených za vteřinu) a jsou y = [ ]; % Vypočtěte % a) lineární regresi, % b) polynomickou regresi stupně a 3 a % c) exponenciální regresi, % d) pro všechny regrese určete predikci osob přepravených % za jeden den pro rok 00. x = [- 0 3]; % a) disp( Koeficienty linearni regrese ) p_lin=lin_reg(x,y) % b) disp( Koeficienty polynomialni regrese radu ) p_pol_=pol_reg(x,y,) disp( Koeficienty polynomialni regrese radu 3 ) p_pol_3=pol_reg(x,y,3) % c) disp( Koeficienty exponencialni regrese ) p_exp=exp_reg(x,y) % d) xp = 0; k = 60*60*4; disp( Predikce s linearni regresi ) y_lin= k*lin_pred(xp,p_lin) disp( Predikce s polynomialni regresi radu ) y_pol_=k*pol_pred(xp,p_pol_) disp( Predikce s polynomialni regresi radu 3 ) y_pol_3=k*pol_pred(xp,p_pol_3) disp( Predikce s exponencialni ) y_exp= k*exp_pred(xp,p_exp) ****************** p0 ***************** % P0 - Vícenásobná regrerse pro reálná data 37

38 % % V strahovském tunelu nyly měřeny hustoty a intenzity % dopravního proudu na 0 vybraných místech. Měření % se provádělo každých 5 min. Změřená data jsou v souboru % data5. % a) Provedte regresi první měřené veličiny v závislosti % na třech dalších veličinách. % b) Testujte vhodnost této regrese. load data5 % 000=současnost a my ii=000:-:600; % bereme 400 vzorků id=0; % zpoždění mezi y a x y=x(,ii) ; % nezávisle proměnná x=x(:4,ii-id) ; % závisle proměnné p=lin_reg_n(x,y); % odhad parametrů yp=lin_pred_n(x,p); % predikce np=length(p); % počet odhadnutých parametrů f_test_pred(y,yp,np); wztest(y-yp); % F-test regrese % test na nezávislost reziduí fig plot(:length(y),y, ro,:length(yp),yp, cx ); title( Vicenasobna regrese pro realna data ) ylabel( data (r), predikce (b) ) xlabel( cas vzorkovani ) ****************** p03 ***************** % P03 - Vícenásobná regrerse pro simulovaná data % % Generujte 4 nezávislé, normálně rozložené náhodné % veličiny x a na nich lineárně závislou náhodnou % veličinu y s koeficienty ps=[ ] ; % kde ps(5)=8 je absolutní člen. Tj. generující rovnice % je y=p()*x+..+p(4)*x4+p(5)+e. % a) Provedte lineární regresi y v závislosti x. % b) Testujte vhodnost této regrese. 38

39 n=000; a=0; np=length(ps); x=randn(n,np-); d=[x ones(n,)]; y=d*ps+a*randn(n,); p=lin_reg_n(x,y); yp=lin_pred_n(x,p); f_test_pred(y,yp,np); wztest(y-yp); % velikost výběru % směr. odch. poruchy % počet parametrů simulace % nezávisle proměnné % data % závisle proměnná % odhad parametrů % predikce % F-test regrese % test nezávislosti reziduí fig plot(:length(y),y, ro,:length(yp),yp, cx ); title( Vicenasobna regrese pro simulovana data ) ylabel( data (r), predikce (b) ) xlabel( cas vzorkovani ) ****************** p04 ***************** % P04 - Vícenásobná regrerse pro simulovaná data % % Generujte nezávislé veličiny x a na nich lineárně % závislou náhodnou veličinu y s koeficienty ps=[. 3 5] ; % kde ps(3) je absolutní člen. Tj. generující rovnice % je y=p()*x+p()*x+p(3)+e. % a) Provedte lineární regresi y v závislosti x. % b) Testujte vhodnost této regrese. %!!! nebezpecí kolinearity x!!! n=00; a=.; b=.0000; np=length(ps); x=(:n) +b*rand(n,); x=(n:-:) *.; x=[x x]; d=[x ones(n,)]; y=d*ps+a*randn(n,); p=lin_reg_n(x,y); yp=lin_pred_n(x,p); % počet dat % směr. odch. šumu % nezávislost x a x % (daná šumem s amplitudou b) % počet parametrů % první nezávisle proměnná % druhá nezávisle proměnná % nezávisle proměnné % data (do regrese) % závisle proměnná % odhad parametrů % predikce 39

40 f_test_pred(y,yp,np); wztest(y-yp); % F-test regrese % test nezávislosti reziduí fig plot(:length(y),y, ro,:length(yp),yp, cx ); title( Vicenasobna regrese s linearni vabou v regresnim vektoru ) ylabel( data (r), predikce (b) ) xlabel( cas vzorkovani ) 5.8 ANOVA ****************** p ***************** % P - Analýza rozptylu ANOVA (jednoduché třídění) % % Pro automobily určitého typu byla zjištována minimální % spotřeba pohonných hmot. Na třech vybraných automobilech bylo % provedeno pět měření s výsledky x=[ ]; % první soubor x=[ ]; % druhý soubor x3=[ ]; % třetí soubor % Testujte tvrzení všechny automobily jsou na tom se spotřebou % stejně. x=[x x x3 ]; [n,a]=size(x); m=mean(x); s=var(x); sx=var(m); sp=sum(s)/a; F=n*sx/sp; pv=-f_cdf(f,a-,a*(n-)); % datová matice % počet měření / automobilů % stření hodnoty souborů x,x,x3 % rozptyly souborů % rozptyl střeních hodnot % normování % statistika % p-hodnota fprintf( Testovani spotreby automobilu\n ); fprintf( H0: spotreby jsou stejne\n\n ) fprintf( p-hodnota testu: %g\n,pv); % Hotové funkce jsou: 40

41 %% ekvivalentní zadání % pv=anova(x) %% zadání vhodné pro různě dlouhé soubory % y=[x x x3]; % g=[ones(n,); *ones(n,); 3*ones(n,)]; % [PVAL, F, DF_B, DF_W] = anova (y,g) ****************** p ***************** % P - Analýza rozptylu ANOVA (dvojné třídění) % % Na třech strojích pracuje pět operátorů. Byl zjištován hodninový % výkon strojů při obsluze jednotlivými operátory. Naměřené % hodnoty jsou uvedeny v tabulce (sloupce - stroje, řádky - % operátoři) V=[ ; ; ; ; ]; % Zjistěte, zda na hladině 0,05 existují rozdíly mezi % stroji a mezi operátory. anova_(v); % Pro zobrazení výsledků jsme využili vnitřní tisk. % Stroje (sloupce): je-li první p-hodnota (pro sloupce) % menší než 0.05, jsou podtatné rozdíly % mezy stroji % Operátoři (řádky): je-li druhá p-hodnota (pro řádky) % menší než 0.05, jsou podtatné rozdíly % mezy operátory ****************** p3 ***************** % P3 - Predikce simulovaných dat z lineární regrese %

42 % Ověřte kvalitu predikce pomocí lineární regrse. Data % simulujte pomocí statického regresniho modelu s deseti % nezávisle proměnnými, generovanými jako standardní bílý % šum. Koeficienty regrese jsou p = [ ]; % a směrodatná odchylka šumu s = 0.; % Vytiskněte výsledky F-testu a predikci zobrazte v grafu. nt=000; % počet dat Y=[]; F=[]; for t=:nt % simulace e=s*randn; % šum x=randn(,0); % nezáv. proměnná y=p*x +e; % záv. proměnná % datová matice Y=[Y; y]; % výstup F=[F; x]; % datová matice end Fi=F(:,[ 5 6]); % data pro odhad disp( Odhad parametru ) ps=inv(fi *Fi)*Fi *Y % odhad parametrů Yp=Fi*ps; % predikce ep=y-yp; % chyba predikce disp( Hodnata kriteria nejmensich ctvercu ) J=ep *ep/nt % kriterium f_test_pred(y,yp,length(ps)); % f-test fig plot(:nt,y, r.,:nt,yp, c. ) title( Predikce (b) realnych dat (r) ) ****************** p4 ***************** % P4 - Predikce reálných dat z lineární regrese % % Ověřte kvalitu predikce pomocí lineární regrse. Pro regresi % použijte reálná data ze souboru "data5" - obsazenosti a intenzity % ze strahovského tunelu. Jako závisle proměnnos volte data z prvého % řádku a za nezávisle proměnné vezměte data z až 5 řádku. Zobrazte % výsledky F-testu a predikci ukažte v grafu. nt=000; load data5 % počet dat % data z disku 4

43 Y=x(,:nt) ; Fi=x(:5,:nt) ; % datová matice disp( Odhad parametru ) ps=inv(fi *Fi)*Fi *Y % parametry Yp=Fi*ps; % predikce ep=y-yp; % chyba predikce disp( Hodnata kriteria nejmensich ctvercu ) J=ep *ep/nt % kriterium f_test_pred(y,yp,length(ps)); % f-test regrese fig plot(:nt,y, r.,:nt,yp, c. ) % grag title( Predikce (b) realnych dat (r) ) 5.9 Analýza hlavních komponent ****************** p ***************** % P - Redukce datovych velicin pomoci rozkladu % kovariancni matice (vlastni cisla a vektory) % % V souboru data5 jsou v matici x uložena % data (hustoty a intenzity dopravního proudu - po řádcích) % ze strahovského tunelu. Provedte redukci pomocí rozkladu % kovarianční maice pro prvních pět veličin souboru. load data5 al=.95; n=5; nd=000; D=x(:n,:nd); pca_eig(d,al); % podil zachovaneho rozptylu % pocet velicin % pocet dat % datova matice % redukce ****************** p ***************** % P - Redukce datovych velicin pomoci rozkladu % datove matice (svd rozklad) % % V souboru data5 jsou v matici x uložena % data (hustoty a intenzity dopravního proudu - po řádcích) % ze strahovského tunelu. Provedte redukci pomocí SVD 43

44 % rozkladu datové matice pro prvních pět veličin souboru. load data5 al=.9; n=00; y=x(,:n); d=x(:6,:n); D=[y d ]; pca_svd(d,al); % podil zachovaneho rozptylu % pocet dat % nezavisle promenna % zavisle promenne % rozsirena datova matice % redukce ****************** p3 ***************** % P3 - Redukce řádu regresního modelu % a ověření pomocí predikce % % a) Generujte data regresním modelem % y(t)=b()*u(t)+a()*y(t-)+b()*u(t-)+a()*y(t-)+ % +b(3)*u(t-)+a(3)*y(t-3)+b(4)*u(t-3)+k+e(t) % kde a=[ ]; b=[ ]; k=.3; % b) Provedte redukci dat pomocí rozkladu datové matice % a utčete transformační matici pro tuto redukci. % c) Dalších 000 vzorků generovaných ze stejného % regresního modelu redukujte pomocí nalezené % transformační matice a odhadujte redukované regresní % koeficienty. % d) Kvalitu odhadu z redukovaných dat ověřte porovnáním % predikce redukovným modelem a simulovaných dat z % regresního modelu. na=length(a); nb=length(b)-; ns=max(na,nb); n=(:na+nb+)+; ps=[a b k]; al=.9; ni=00; 44

45 y=zeros(,ni); u=y; e=randn(,ni); % datová matice z prvních 00 vzorků a jejich redukce D=[]; for t=ns+:ni u(t)=rand; f=[y(t-:-:t-na) u(t:-:t-nb) ]; y(t)=ps*f +.*e(t); D=[D; [y(t) f]]; end%for [i,dd,sn,dd,p]=pca_svd(d,al); n=000; y=zeros(,n); u=y; e=randn(,n); % odhad parametrů z redukovaných dat (q) Dr=[]; for t=ns+:n u(t)=rand; f=[y(t-:-:t-na) u(t:-:t-nb) ]; y(t)=ps*f +.*e(t); Dr=[Dr; [y(t) f*dd]]; end%for w=dd *DD+Dr *Dr; n=:length(w); q=inv(w(n,n))*w(n,); % predikce z redukovaného modelu Dry=Dr(:,); Drf=Dr(:,n); yp=zeros(,n-ns); for t=:n-ns yp(t)=q *Drf(t,:) ; end%for % porovnání predikce s daty disp( Normovany soucet ctvercu chyb predikce ) ep=dr(:,) -yp; pe=ep*ep /n fig plot(:length(dry),dry,:length(yp),yp) title( Data a jejich predikce ) 45

46 cv0.doc Čebyševova nerovnost Nechť X je náhodná veličina se střední hodnotou E [X ] = µ a rozptylem D[ X ] P ( X E[ X] ε). ε Pro výběrový průměr X : σ P ( X µ ε). nε D [ X ] = σ. Pak platí. Příklad Jak velký musí být rozsah náhodného výběru, z náhodné veličiny se střední hodnotou µ a směrodatnou odchylkou σ, aby se výběrový průměr x nelišil od střední hodnoty µ o více než σ / s pravděpodobností 0,9. Řešení: P X σ σ µ σ n = 0,9 = 0,9 n = 40 n Poznámka: Z Čebyševovy nerovnosti nás zajímá jen pravá strana.. Příklad Počet aut přijíždějících na křižovatku v určitém časovém okamžiku má Poissonovo rozdělení se střední hodnotou 0. Určete dolní hranici pravděpodobnosti, že skutečný počet aut, která do křižovatky v tomto intervalu přijedou, bude větší než 00 a menší než 40. Řešení: X počet aut, µ = σ = 0. P ( X µ 0 0) 0, 7 0 =. 3. Příklad Průměrná spotřeba masa v jedné domácnosti za rok je 60 kg. Jaká je pravděpodobnost, že spotřeba přesáhne 30 kg, jestliže směrodatná odchylka spotřeby je 40 kg? Řešení: X spotřeba masa. Pro symetrické rozdělení je P ( X 60) = 6

47 cv0a.doc Pravděpodobnosti kvantily a kritické hodnoty Definice kvantilu ζ α : P ( X < ζ α ) = α, kritické hodnoty α Zobrazení pomocí hustoty pravděpodobnosti z : P( X z ) = α > α α α ζ α zα z α ζ α Z obrázku je patrné, že platí (jen pro symetrické rozdělení) α = ζ α, zα = z = z, z = ζ ζ α ζ α α α α Pomocí těchto vzorečků lze v tabulkách kvantilů (kde jsou jen kladné hodnoty) hledat i záporné kvantily, nebo kritické hodnoty. Pravděpodobnost normované náhodné veličiny Z. P( Z <,8) =? [0,96]. P( Z >,8) =? [ = P( Z <,8 ) = 0,96 = 0,04] 3. P( Z <,8) =? [ = P( Z <,8 ) = 0,04] 4. P( Z >,8) =? [ = P( Z <,8 ) = 0,96] Pravděpodobnost nenormované náhodné veličiny X, E[ X ] = µ, D[ X ] = σ Normování µ Z = X σ 47 Je dána náhodná veličina X se střední hodnotou µ = 5 a rozptylem σ = 9. Určete následující pravděpodobnosti

48 cv0a.doc Pravděpodobnosti a kritické hodnoty. Příklad Nechť Z je normálně rozdělená náhodná veličina se střední hodnotou 0 a rozptylem. Určete. ( Z >,96) =? P [0,05]. ( Z >,96) =? P [.0,05 = 0,05] 3. P ( Z,96) =? [ ( Z >,96 ) = 0, ( Z >?) = 0, 05 P [,645] 5. ( Z >?) = 0, 05 P [,96] 6. ( Z?) = 0, 05 P [-,645] Řešení: Excel Výpočet pravděpodobnosti a.96 P(Z>a)=? =-NORMSDIST(B) =-NORMDIST(B;0;;) Určení kritické hodnoty p 0.05 P(Z>?)=p =-NORMSINV(B5) =-NORMINV(0.05;0;) P ]. Příklad Nechť X je normálně rozdělená náhodná veličina se střední hodnotou µ = 5 a směrodatnou odchylkou σ = 3. Určete ( X >0.88) =? P [0,05] Řešení: X µ Z = =,96 σ p = 0,05 Excel m 5 Z.96 =(B3-B)/B s 3 p =-NORMSDIST(E) a =-NORMDIST(B3;B;B;) 3. Příklad Uvažujme výběr X o velikosti 50 z náhodné veličiny X N ( µ = 5, σ = 84) S je výběrový součet. Určete 48. ( X >0 ) =? ( ) [0,] P [0,000]. X je výběrový průměr a

49 cv0b.doc Pravděpodobnost, že. Příklad Z lékařských šetření je známo, že výška chlapců ve věku 9-0 let má normální rozdělení N ( µ,σ ) kde µ =39, a σ = 40,. Změřili jsme výšku u 5 chlapců a vypočetli její průměr. S jakou pravděpodobností bude tento průměr větší než 40? Řešení: X výška vybraného chlapce X výběrový průměr z výšek 40 µ ( X > 40 ) = P Z > n P( Z > 0,55) = 0, 9 P σ = Excel: a 40 n 5 mi 39. sig 40. E[mX] 39. =B3 D[mX].68 =B4/B P(mX>a)=? 0.94 =-NORMDIST(B;B5;ODMOCNINA(B6);). Příklad Hmotnost výrobků v gramech má normální rozdělení N ( µ = 000, σ = 6). Jaká je pravděpodobnost, že průměrná hmotnost n náhodně vybraných výrobků bude větší, než 00g, je-li počet vybraných výrobků: a) 8, b), c) 6? Řešení: X hmotnost výrobku X hmotnost výběrového průměru P a) n = 8, P( Z > ) = 0, 079 b) n =, P( Z > 3 ) = 0, 04 c) n = 6, P( Z > ) = 0, 03 Excel (ad ) a 00 n 8 mi 000 sig 6 00 µ n ( X > 00) = P Z > n = P Z > σ E[mX] 000 =B3 D[mX] =B4/B 49 P(mX>a)=? =-NORMDIST(B;B6;ODMOCNINA(B7);)

Obsah. 3 Testy 31 3.1 z test... 32 3.2 z test 2... 33 3.3 t test... 34 3.4 t test 2s... 35

Obsah. 3 Testy 31 3.1 z test... 32 3.2 z test 2... 33 3.3 t test... 34 3.4 t test 2s... 35 Obsah 1 Popisná statistika 4 1.1 bas stat........................................ 5 1.2 mean.......................................... 6 1.3 meansq........................................ 7 1.4 sumsq.........................................

Více

Matematická Statistika

Matematická Statistika Texty ke cvičením Matematická Statistika Ivan Nagy, Jitka Kratochvílová Obsah 1 Popisná statistika 4 1.1 Seznámení s OCTAVE................................... 4 1.2 Popisné charakteristiky v OCTAVE............................

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Příklady ze Statistiky

Příklady ze Statistiky Příklady ze Statistiky Regrese Příklad 1 V továrně byla sledována závislost celkových nákladů "n" (v tis. Kč.) na produkci "p". Byly zaznamenány následující údaje p = [532 297 378 121 519 613 592 497];

Více

Příklad 81b. Předpokládejme, že výška chlapců ve věku 9,5 až 10 roků má normální rozdělení N(mi;sig2)

Příklad 81b. Předpokládejme, že výška chlapců ve věku 9,5 až 10 roků má normální rozdělení N(mi;sig2) Příklad 1. Za předpokladu, že výška dětí ve věku 10 let má normální rozdělení s rozptylem 38, určete pravostranný 99% interval spolehlivosti, ve kterém bude ležet neznámá střední hodnota výšky dětí, jestliže

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Příklady ze Statistiky

Příklady ze Statistiky Příklady ze Statistiky Regrese Příklad 1 V továrně byla sledována závislost celkových nákladů "n" (v tis. Kč.) na produkci "p". Byly zaznamenány následující údaje p = [532 297 378 121 519 613 592 497];

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Matematická Statistika. Ivan Nagy, Jitka Kratochvílová

Matematická Statistika. Ivan Nagy, Jitka Kratochvílová Texty k přednáškám Matematická Statistika Ivan Nagy, Jitka Kratochvílová Obsah 1 Náhodný výběr 4 1.1 Pojem náhodného výběru (Sripta str. 68).................... 4 1.2 Charakteristiky výběru (Sripta str.

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Kovariance, 76. Kritická hodnota. souboru, 65 Kritický obor, 121 Kvantil. souboru, 64 Kvartil. souboru, 68. Median

Kovariance, 76. Kritická hodnota. souboru, 65 Kritický obor, 121 Kvantil. souboru, 64 Kvartil. souboru, 68. Median Index χ 2 -test, 133 dobré shody, 134 nezávislosti, 135 Úplná pravděpodobnost, 50 Alternativní hypotéza, 118 ANOVA, 157 nevysvětlený rozptyl, 159 příklad, 160 vysvětlený rozptyl, 158 ANOVA 2, 161 příklad,

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Kalibrace a limity její přesnosti Vedoucí licenčního studia Prof. RNDr. Milan Meloun,

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Poznámky k předmětu Aplikovaná statistika, 9.téma

Poznámky k předmětu Aplikovaná statistika, 9.téma Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního

Více

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Semestrální práce. 2. semestr

Semestrální práce. 2. semestr Licenční studium č. 89002 Semestrální práce 2. semestr PŘEDMĚT 2.2 KALIBRACE A LIMITY JEJÍ PŘESNOSTI Příklad 1 Lineární kalibrace Příklad 2 Nelineární kalibrace Příklad 3 Rozlišení mezi lineární a nelineární

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu 1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

T E O R I E C H Y B A V Y R O V N Á V A C Í P O

T E O R I E C H Y B A V Y R O V N Á V A C Í P O ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA VYŠŠÍ GEODÉZIE název předmětu T E O R I E C H Y B A V Y R O V N Á V A C Í P O Č E T 2 č. úlohy 6 název úlohy T

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více