Milan Bernauer, Bohumil Bernauer, Petr Št astný. dat. Ústav Anorganické Technologie. Obsah

Rozměr: px
Začít zobrazení ze stránky:

Download "Milan Bernauer, Bohumil Bernauer, Petr Št astný. dat. Ústav Anorganické Technologie. Obsah"

Transkript

1 Milan Bernauer, Bohumil Bernauer, Petr Št astný Statistické zpracování naměřených dat Ústav Anorganické Technologie Obsah 1 Základní pojmy Výběrové charakteristiky Aplikace výběrových charakteristik - I Aplikace výběrových charakteristik - II Zákon šíření chyb 5 3 Regresní analýza Lineární regrese Vážená lineární regrese Určení počtu parametrů modelové rovnice χ 2 test konsistence s d a s(y i )

2 1 Základní pojmy Chyby vyskytující se při experimentální práci můžeme rozdělit do dvou kategorií: ˆ Náhodné chyby ˆ Systematické chyby. Opakovaným měřením za identických podmínek na stejném zařízení neobdržíme vždy identické výsledky, což je důsledkem fluktuací veličin během experimentu (změny teploty, tlaku...), resp. vlivem náhodných chyb. Náhodné chyby můžeme popsat vcelku snadno a rigorózně vztahy uvedenými v následující sekci 1.1. Systematické chyby jsou mírou odlehlosti zjištěné veličiny od nějaké známé či standardní hodnoty. Systematické chyby můžeme roztřídit do následujících skupin podle jejich původu ˆ Instrumentální chyby (nejistoty v kalibraci měřících přístrojů, nečistoty ve vzorcích) ˆ Chyby experimentální metody (nedokonalost použitých modelů popisujících danou metodu) ˆ Chyby experimentátora Zjistit vliv systematických chyb na výsledky měření je obtížné pokud neznáme výslednou (správnou) hodnotu, at již standardu, nebo například hodnotu z literatury. Pokud je tato hodnota nedostupná, je tu možnost provést měření identické veličiny na jiné aparatuře, nejlépe založené na jiném principu než ta původní. Například měřit teplotu rtut ovým a alternativně odporovým teploměrem. Dále se setkáváme s pojmy vyjadřujícími kvalitu experimentálně získaných dat; přesnost a správnost. Uvedené pojmy by měly sloužit k objektivnímu popisu dat, jak z pohledu jejich vzájemné vnitřní konzistence a reprodukovatelnosti (přesnost) tak jejich vztahu k nějaké známé, správné hodnotě (správnost). Přesnost (precision) a správnost (accuracy) jsou definovány na základě normy ČSN ISO a jejich význam je patrný z obrázku 1. Přesnost měření je ovlivněna náhodnými chybami a můžeme ji vyhodnotit statistickými postupy, které budou uvedeny v následujícím oddíle 1.1. Správnost dat můžeme vyhodnotit pouze známe-li správnou (referenční) hodnotu. Hodnota experimentálně stanovené veličiny, uvedená bez odhadu její nejistoty, je ochuzena o podstatnou část své vědecké informace. Výsledek uvedený ve formě 25.0 ± 0.2 je diametrálně odlišný od výsledku 25.0 ± 15.5, ač jsou absolutní hodnoty identické 2. Nejistota (uncertainty) se většinou udává jako odhad standardní směrodatné odchylky dané veličiny 3. 1 ČSN ISO 5725:Přesnost (správnost a shodnost) metod a výsledků měření 2 Malanowski, E.R. A Computer Program for Calculating Standard Deviations from Standard Deviations J. Chem. Educ. 1995, 72,

3 Obrázek 1: Význam pojmů přesnost a správnost. Oba obrázky obsahují stejná data, pouze je změněn způsob jejich vynesení do grafu. = x i µ, kde x i je změřená (zjištěná) hodnota a µ je správná (referenční) přesná a správná data; p- nepřesná a správná data; E- přesná a nesprávná data (dle teorie poznání plynoucí z filozofie externismu Járy Cimrmana: Nevíme nic, ale zato to víme přesně ); u- nepřesná a nesprávná data. 1.1 Výběrové charakteristiky Mějme náhodnou veličinu Y, kterou získáváme opakovaným měřením, například některé fyzikální veličiny. Obvykle se z těchto opakovaných měření vyhodnocují tyto veličiny: průměrná hodnota a odhad rozptylu, resp. směrodatná odchylka, které poskytnou odhad o střední hodnotě a přesnosti, resp. nejistotě veličiny Y. Slovo odhad je zde použito z důvodu konečného počtu měření veličiny Y. Aby bylo možno stanovit střední hodnotu µ a rozptyl σ 2 veličiny Y (mající Gaussovo rozdělení, též nazýváno normální rozdělení) muselo by se provést nekonečně mnoho experimentů. Z evidentních důvodů tento počet měření nemůžeme uskutečnit a proto se vyhodnocují odhady z vybraného (konečného) počtu měření na základě tzv. výběrových funkcí 4. Tyto funkce jsou: ˆ Výběrový průměr ˆ Výběrový rozptyl ˆ Výběrová směrodatná odchylka Y = 1 n s 2 (Y ) = 1 n 1 Y i (1) (Y i Y ) 2 (2) s(y ) = s 2 (Y ) (3) 4 Výběrové funkce jsou definované na výběrovém prostoru a jejich rozdělení pravděpodobnosti je určeno pravděpodobnostním rozdělením základního souboru. 2

4 ˆ Směrodatná odchylka výběrového průměru s(y ) = s(y ) n (4) K výběrové směrodatné odchylce ze vztahu 3 a směrodatné odchylce výběrového průměru ze vztahu 4 existují relativní veličiny, které jsou definovány jako poměr výběrové směrodatné odchylky a absolutní hodnoty veličiny Y s r (Y ) = s(y ) Y, (5) respektive jako poměr směrodatné odchylky výběrového průměru a průměrné hodnoty Y s r (Y ) = s(y ) Y. (6) V případě, kdy známe rozptyl jednotlivého pozorování s 2 (Y i ), například když tato veličina Y je měřena s konstantní relativní směrodatnou odchylkou (nejistotou) s r (Y ), můžeme vyjádřit vážený průměr Y w = Y i s 2 (Y i ), (7) 1 s 2 (Y i ) a rozptyl tohoto váženého průměru vypočteme z s 2 (Y w ) = n 1 s 2 (Y i ) (Y i Y w ) 2. (8) s 2 (Y i ) V předchozím oddíle byly zavedeny pojmy přesnost, správnost a nejistota. Vztah mezi směrodatnou odchylkou a přesností je ten, že směrodatná odchylka je mírou přesnosti výsledku měření. Taktéž nejistota je podle definice z předchozího oddílu rovna hodnotě směrodatné odchylky výběrového průměru. Nejlépe bude význam výběrových funkcí patrný z následujících příkladů, ve kterých pro zjednodušení a zkrácení je vypuštěno slovo výběrový. 1.2 Aplikace výběrových charakteristik - I Měříme plynovou chromatografií koncentrace N-methyl-pyrrolidonu(NMP) ve vodě. Jedná se o velmi zředěný roztok (x i < 0.001) a provádíme 12 analýz (nástřiků) tak, abychom mohli provést statistické vyhodnocení naměřených dat. Detekce NMP probíhá pomocí plamenově ionizačního detektoru a v následující tabulce 1 jsou vyneseny hodnoty ploch píků 3

5 n A n A Tabulka 1: Hodnoty ploch píků A úměrných koncentraci NMP ve vodě. A úměrných koncentraci NMP ve vodě. Z těchto hodnot budeme chtít zjistit průměrnou hodnotu A, rozptyl chromatografické analýzy (resp. směrodatnou odchylku) a směrodatnou odchylku průměrné hodnoty A. Průměrnou hodnotu A vypočteme ze vztahu 1, A = Směrodatnou odchylku chromatografického měření, respektive směrodatnou odchylku jednoho měření vypočteme ze vztahů 2 a 3, s(a) = 433. A směrodatnou odchylku vypočteného průměru A získáme ze vztahu 4, s(a) = 125. Závěry, které můžeme učinit na základě předchozí statistiky jsou, že relativní nejistota jedné chromatografické analýzy (vztah 5)je přibližně s r (A) = s(a) A = 433/27026 = (9) a získaná průměrná hodnota plochy píku A (úměrná koncentraci NMP ve vodě) byla stanovena s relativní nejistotou (vztah 6) s r (A) = s(a) A = 125/27026 = (10) 1.3 Aplikace výběrových charakteristik - II Metodou diferenciální destilace byl opakovaně stanovován limitní aktivitní koeficient γ1 N-methylformamidu (NMF) ve vodě 5. Všechna měření byla provedena za konstantní teploty 70 o C, tlaku a průtoku stripovacího plynu, s cílem stanovit nejistotu (směrodatnou odchylku) stanovení γ1 touto metodou. Jelikož každá hodnota γ1 měla jinou váhu (rozptyl), plynoucích z rozdílných nejistot při chromatografické analýze získaných vzorků, byl k výpočtu průměru použit vztah 7. Hodnoty γ1 a jejich nejistoty s(γ1 ) jsou uvedeny v následující tabulce 2. Nevážený průměr byl vypočítán z rovnice 1, γ1 = 1.52, vážený průměr z rovnice 7, γ1 w = 1.42 a směrodatná odchylka váženého průměru (nejistota) ze vztahu 8, respektive z jeho druhé odmocniny s(γ1 w ) = Výsledky jsou vyneseny na obrázku 2. 5 Bernauer, M. and Dohnal, V. Temperature Dependence of Air-Water Partitioning of N-Methylated (C1 and C2) Fatty Acid Amides. J. Chem. Eng. Data. 2008, 53,

6 n γ s(γ1 ) n γ s(γ1 ) n γ s(γ1 ) Tabulka 2: Naměřené hodnoty γ 1 NMF ve vodě společně s hodnotami nejistot s(γ 1 ), stanovenými na základě zákona šíření chyb. Obrázek 2: Vážený průměr opakovaných měření limitního aktivitního koeficientu γ1 NMF ve vodě při 70 o experimentální data γ1 ; nevážený průměr γ1 (rovnice 1); vážený průměr γ1 w (rovnice 7); odlehlé hodnoty γ 1 > γ1 ± 3s(γ1 ). 2 Zákon šíření chyb Měříme-li (pozorujeme) náhodnou veličinu Y v závislosti na jiných, taktéž náhodných veličinách A 1, A 2 až A n Y = f(a i ), i = 1,..., n, (11) 5

7 můžeme odvodit vztah, který vystihuje, jak se nejistota plynoucí z náhodného charakteru veličin A i promítá do vypočtené hodnoty Y 6 s 2 (Y ) = ( ) ( f f j=1 A i A j kde cov(a i, A j ) je prvek kovarianční matice C, která je definována cov(a 1, A 1 )... cov(a } {{ } 1, A n ) s 2 (A 1 ) C = cov(a n, A 1 )... cov(a n, A n ) } {{ } s 2 (A n) Kovariance mezi dvěma vektory A i a A j vyjadřuje vztah ) cov(a i, A j ), (12) cov(a i, A j ) = E{[A i E(A i )][A j E(A j )]} = E(A i A j ) E(A i )E(A j ), (13) kde E() značí střední hodnotu. Z tohoto vztahu plyne pro kovarianci cov(a i, A i ) = s 2 (X i ). Pokud jsou A i a A j nezávislé, platí cov(a i, A j ) = 0. (14) Opět si vše vysvětlíme na konkrétním případu. Chceme stanovit objemový průtok dusíku membránovým modulem pomocí bublinkového průtokoměru. Zároveň chceme zjistit jeho směrodatnou odchylku. Průtok je nastavován nenakalibrovaným hmotnostním průtokoměrem. Cela je přesně temperována na 25 o C, ale měření průtoku je prováděno na určitém místě v laboratoři, kde teploměr, měřící s přesností na 0.5 o C udává teplotu 20 o C. Bylo provedeno 12 měření při konstantním průtoku dusíku. Objem bublinkového průtokoměru je 10 ml. Tlak v laboratoři je kpa. Naměřené hodnoty jsou uvedeny v tabulce 3. Užitím n t/s n t/s Tabulka 3: Naměřené hodnoty času v sekundách při měření průtoku bublinkovým průtokoměrem 6 Tento vztah lze odvodit z Taylorova rozvoje v okolí středních hodnot A i. Detaily tohoto odvození jsou k nalezení například v: Meloun, M., Militký, J., Chemometrie-Zpracování Experimentálních Dat na IBM-PC, SNTL Praha

8 vztahů z předchozího oddílu zjistíme průměrnou hodnotu času a směrodatnou odchylku průměrného času (vztah 4). t = t ± s(t) = ± 0.28 s. Průtok vypočteme z následujícího vztahu (zanedbáme korekci na objem vodní páry uvolněné z náplně bublinkového průtokoměru 7 a předpokládáme ideální chování plynné fáze) V (T 2 ) = V B t T 2 T 1, (15) kde V (T 2 ) je objemový průtok za teploty T 2 = 298 K, V B je objem průtokoměru, T 1 je absolutní teplota, za které bylo provedeno měření průtoku a t je změřený čas. Veličiny T 1 a t nejsou známy s absolutní přesností, ale známe jejich nejistoty s(t 1 ) a s(t). Také víme, že tyto dvě náhodné veličiny jsou mezi sebou nekorelované (neexistuje vztah mezi nimi, viz. vztah 14) a proto můžeme vztah 12 zjednodušit na a pro náš konkrétní případ s 2 ( V 2 ) = n p ( ) 2 f s 2 (Y ) = s 2 (A i ), (16) A i ( V ) 2 ( 1T 2 1 s 2 (t) + V 1T 2 T 1 t 2 t 1 T 2 1 ) 2 s 2 (T 1 ). (17) Dosazením číselných hodnot do předchozího vztahu a použitím vztahu 3 vypočteme směrodatnou odchylku průtoku celou s( V 2 ) = 1.4 ml min 1. Výsledek zapíšeme V 2 = 54.9 ± 1.4 ml min 1. 3 Regresní analýza Tentokráte se budeme zabývat závislostí náhodné veličiny Y na proměnné x, která není náhodnou veličinou. Obecně x může být n-rozměrné. Závislostí Y = f(x) myslíme matematický model, kterým se snažíme popsat nějaký pozorovaný jev a z pozorovaných hodnot 7 Korekce průtoku na objem vypařené vodní páry je V s = V p (p + p s T 2 ), kde V s je průtok suchého dusíku, V je celkový průtok plynu změřený bublinkovým průtokoměrem, p je celkový tlak a p s T 2 je tlak nasycené vodní páry při teplotě T 2. Tlak nasycené vodní páry při 25 o C je 3.16 kpa což je přibližně 3% z celkového tlaku a navíc z důvodu konstrukčního uspořádání průtokoměru lze stěží předpokládat rovnovážné nasycení proudícího plynu vodní parou. Proto tuto korekci můžeme zanedbat. 7

9 odhadnout parametry tohoto matematického modelu. Například hodnotu tlaku nasycených par nad kapalinou (pozorovaná veličina) v závislosti na teplotě dobře vystihuje v rozmezí od trojného bodu po normální bod varu známá Antoinova rovnice ln p s = A B C + T, (18) kde A, B a C jsou nastavitelné parametry, které získáme (v tomto případě nelineární) regresí změřených dvojic dat p s a T. Čistě teoreticky by stačily k určení těchto tří parametrů pouze tři dvojice hodnot p s a T. Není těžké si představit jak mizerná by byla správnost takto stanovené teplotní závislosti p s. Proto se provádí měření více a je obecně známým pravidlem, že měření (n) má být přinejmenším o dvě více než je parametrů (n p ) v modelové rovnici n n p + 2. Regresní analýza potom spočívá v nalezení takových hodnot parametrů A, B, C, tak aby po dosazení do Antoinovy rovnice co nejlépe popsaly změřenou závislost. Slovo nejlépe je velmi důležité a vede nás k určení nějakého kritéria, pomocí kterého objektivně a nestranně určíme ty nejlepší hodnoty parametrů. Bohužel nestačí naměřená data p s (T ) vynést do grafu a proložit je křivkou odpovídající Antoinově rovnici s náhodně zvolenými parametry, a spokojit se vizuálním oko-metrickým vyhodnocením a s konstatováním, že křivka pěkně sedí na naměřených datech. Tímto objektivním kritériem je v případě veličin s normálním rozdělením 8 suma čtverců rozdílů mezi změřenou a vypočtenou hodnotou Y respektive S(A, B, C) = (p s i,změřená p s i,vypočtená) 2. (19) Tato funkce se nazývá objektivní funkce, někdy též cílová nebo kriteriální funkce. Hodnoty parametrů A, B, C při kterých nabývá S(A, B, C) minima jsou potom jejich nejlepším nestranným odhadem pro daný soubor experimentálních dat. Výše zmíněnými slovy jsou těmi nejlepšími :-). Úkoly regresní analýzy se dají shrnout do následujícího seznamu: 1. Stanovení hodnot parametrů matematického modelu 2. Odhad nejistoty vypočtených parametrů 3. Statistické vyhodnocení kvality korelace goodnes-of-fit 3.1 Lineární regrese Nyní se budeme zabývat případem, kdy modelová rovnice je lineární vůči parametrům, jako například v následujícím polynomu y(x) = a 1 + a 2 x + a 3 x 2 +,..., +a np x np 1, 8 Odvození je například uvedeno v: Bard, Y., Nonlinear Parameter Estimation, Academic Press, New York

10 y y k y(x k ) x 1 x k x n x Obrázek 3: Konstrukce objektivní funkce a princip metody nejmenších čtverců. u jsou experimentální (změřené) body, kterým odpovídá hodnota y k při x k, n je celkový počet pozorování, y(x k ) je vypočtená hodnota z modelové rovnice pro x k. Plochy jednotlivých čtverců jsou rovny (y k y(x k )) 2. Plná křivka reprezentuje proložení bodů zvolenou modelovou rovnicí. nebo v kompaktnější formě n p y(x) = a i x i 1, (20) kde n p je počet parametrů. Pro tuto rovnici sestavíme kriteriální funkci minima součtu čtverců odchylek S( a) = (y k y(x k )) 2, (21) nebo S w ( a) = k=1 (y k y(x k )) 2, (22) s 2 (y k ) k=1 kde s 2 (y k ) je rozptyl k-tého experimentálního bodu, y k je hodnota náhodné veličiny a n je počet bodů. Pro pochopení jednotlivých veličin je na obrázku 3 znázorněna grafická konstrukce objektivní funkce a její význam v metodě nejmenších čtverců. Kvalita výsledné korelace je vystižena veličinou nazývanou reziduální rozptyl s 2 d = S( a), nebo s 2 d = S w( a), (23) n n p n n p kde a je vektor parametrů. Její odmocnina se nazývá směrodatná odchylka korelace s d = s 2 d. (24) 9

11 Minimalizací rovnice 21 nebo 22 se vyhodnotí parametry a i rovnice 20. Minimalizace spočívá v řešení tzv. soustavy normálních rovnic, které vzniknou derivací S( a) podle parametrů a i S( a) = 0, i = 1,..., n p. (25) a i Pokud zapíšeme vektor pozorovaných hodnot jako y = (y 1,..., y n ) T a vektor parametrů a = (a 1,..., a np ) T, můžeme zmíněnou soustavu normálních rovnic zapsat maticově FF T a = F y, (26) kde F je matice prvních derivací modelové funkce podle parametrů f 1 f n... a 1 a 1 F =..... f 1 f n,... a np a np kde n p f k = a i x i 1 k, k = 1,..., n. (27) Například pro rovnici 20 bude f k a 1 = 1, pro všechna k = 1,..., n. Neznámé parametry a i se dají vypočítat z 9 a = (FF T ) 1 F y. (28) Součin matice F a transponované matice F T (respektive FF T ) je v případě lineární funkce 20 roven následující matici 1 2 S( a) 1 2 S( a)... 2 a 1 a 1 2 a 1 a np... FF T = 1 2 S( a).. 2 a i a j S( a) 1 2 S( a)... 2 a np a 1 2 a np a np což je regulární matice typu (n p, n p ). Součin reziduálního rozptylu a inverzní matice C a = s 2 d(ff T ) 1 (29) 9 Většinou se při výpočtu parametrů a i dává přednost řešení rovnice 26, před řešením rovnice 28 spojené s inverzí matice FF T, což je výpočetně náročnější úkon. 10

12 se nazývá kovarianční matice parametrů a. Vezmeme-li v úvahu pouze lineární rovnici (n p = 2), to znamená že máme pouze dva nastavitelné parametry a 1 a a 2, soustava normálních rovnic bude mít rozměry 2 2 n x i FF T =, přičemž matice F bude mít rozměr 2 n, kde n je počet měření (experimentálních bodů) [ ] F =. x 1... x n x i x 2 i V tomto případě bude rovnice 26 vypadat následovně n x i [ ] [ a = a 2 x 1... x n x i x 2 i ] y 1. y n. Prvky v kovarianční matici C a C a = [ cov(a1, a 1 ) cov(a 1, a 2 ) cov(a 2, a 1 ) cov(a 2, a 2 ) poskytují odhad rozptylu s 2 (a i ) = cov(a i, a i ) vypočtených parametrů a 1, a 2 a kovarianci mezi parametry cov(a 1, a 2 ) = cov(a 2, a 1 ). Samozřejmě v době, kdy je k dispozici nepřeberné množství softwarového vybavení (Matlab, Excel, Gnuplot, Origin... atd.) nemusí se ručně provádět výpočty související s řešením soustavy normálních rovnic. Ale málokterý z výše uvedených nástrojů poskytuje výpočet kovarianční matice, pomocí které se může vyhodnotit nejistota ve vypočtených parametrech, a proto často řešení tohoto problému padá na bedra nebohého uživatele. 3.2 Vážená lineární regrese V předchozím oddíle se tiše předpokládalo, že pozorované veličiny y mají shodné rozptyly σ 2 (y 1 ) = σ 2 (y 2 ) =,..., = σ 2 (y n ). Jinými slovy, že všechny hodnoty y mají stejnou váhu. Pokud bude třeba penalizovat určité hodnoty pozorovaných hodnot, třeba z důvodu zhoršených experimentálních podmínek (přiblížení se k hranici citlivosti aparatury), je třeba použít metodu vážené regrese, která je pouhým zobecněním postupu popsaného v předchozím oddíle. Tam byla pro odhad parametrů lineárního modelu odvozena rovnice 28 ], a = (FF T ) 1 F y. (28) 11

13 Pro zobecnění v případě nestejných rozptylů σ 2 (y i ) je zavedena kovarianční matice C y = σ 2 (y)w, (30) kde W je matice vah jednotlivých pozorovaných hodnot. Sérií úprav 10 lze odvodit vztah pro řešení soustavy normálních rovnic vedoucí k výpočtu parametrů lineárního modelu Kovarianční matice C y parametrů a je potom a = (FW 1 F T ) 1 FW 1 y. (31) kde s 2 d je reziduální rozptyl vypočtený podle rovnice 23. C y = s 2 d(fw 1 F T ) 1, (32) 3.3 Určení počtu parametrů modelové rovnice Problém určení počtu parametrů rovnice 20 potřebných k popisu experimentálních dat může být vyřešen použitím statistického F-testu (Fisherův F-test) o rovnosti rozptylů dvou základních souborů, kdy se testují reziduální rozptyly dvojice fitů s různým počtem použitých parametrů. Problém je možno formulovat tak, že se snažíme rozhodnout zda reziduální rozptyl fitu s n p,1 parametry je větší než reziduální rozptyl fitu s n p,2 parametry na zadané hladině významnosti α. V řeči matematické statistiky vyslovíme nulovou hypotézu (H0), že nedošlo ke snížení s 2 d a tuto budeme testovat proti alternativní hypotéze (H1), že došlo k snížení s 2 d H0 : s 2 d,1 s 2 d,2 ; H1 : s 2 d,1 > s 2 d,2. (33) Reziduální rozptyly s 2 d,1 a s2 d,2 odpovídající regresi pomocí rovnice 20 s n p,1 respektive n p,2 parametry a n 1 respektive n 2 počtem experimentálních bodů se vypočítají n1 s 2 d,1 = (Y i,1 Y i,1 ) 2, (34) n 1 n p,1 n2 s 2 d,2 = (Y i,2 Y i,2 ) 2. (35) n 2 n p,2 Testovací statistika je popsána funkcí R = s2 d,1. (36) s 2 d,2 Rozhodnutí zda zvýšením počtu parametrů rovnice 20 z n p,1 na n p,2 získáme menší reziduální rozptyl probíhá na základě nerovnosti R > F α (n 1 n p,1, n 2 n p,2 ) zamítáme H0, tudíž s 2 d,1 > s 2 d,2, R < F α (n 1 n p,1, n 2 n p,2 ) nemůžeme zamítnout H0, tudíž platí H1 s 2 d,1 s 2 d,2, kde F α (n 1 n p,1, n 2 n p,2 ) je tabelovaná hodnota Fisherova rozdělení pro daný počet stupňů volnosti a dané hladině významnosti. 10 Viz například skripta: Jaroš, F. a spol., Pravděpodobnost a Statistika, VŠCHT Praha

14 3.4 χ 2 test konsistence s d a s(y i ) Pokud jsou hodnoty směrodatných odchylek experimentálních veličin s(y i ) statisticky konzistentní s výslednou hodnotou součtu čtverců vážených odchylek S w ( a), musí se hodnota vážené směrodatné odchylky korelace s d pohybovat v okolí jedničky S w ( a) s d = 1, (37) n n p kde n je počet experimentálních bodů a n p je počet parametrů. Toto kritérium je možno považovat za splněné, pokud hodnota S w ( a) leží v intervalu vymezeném kvantily rozdělení χ 2 pro daný počet stupňů volnosti (n n p ) na zvolené hladině významnosti α χ 2 α/2(n n p ) < S w ( a) < χ 2 1 α/2(n n p ), (38) kdy hladina významnosti je obvykle volena α = Pokud je hodnota S w ( a) nižší než dolní kvantil χ 2 α/2 (n n p) jsou nejistoty příslušící experimentálním bodům nadhodnocené oproti výsledné hodnotě s d. Slovy terminologie zavedené v úvodu tohoto dokumentu se pravděpodobně jedná o správná ale nepřesná data. Pokud S w ( a) > χ 2 1 α/2 (n n p) jsou nejistoty příslušící experimentálním bodům podhodnocené a data jsou pravděpodobně přesná ale nesprávná. Lineární regrese - nevážená Rozšíříme příklad z předchozího oddílu (měření průtoku bublinkovým průtokoměrem) o kalibraci hmotnostního regulátoru průtoku. Budeme měřit průtok plynu ( V B ) pro různé hodnoty nastavené na regulátoru (V D ) a z těchto uspořádaných dvojic se budeme snažit vyhodnotit parametry modelové rovnice. Použijeme rozvoj rovnice 20 do prvního stupně, resp. lineární závislost y(x) = a 1 + a 2 x, (39) kde x = V D a y = V B. Postup měření průtoku je stejný jako v předchozím případě. V tabulce 4 jsou uvedeny naměřené hodnoty a přepočtené hodnoty za normálních podmínek (p = kpa a T 2 = K) Přepočet na normální podmínky byl proveden podle rovnice 15 se započtením vlivu změny tlaku (z atmosférického p 1 na standardní p 2 ) V (T 2 ) = V 1(T 2 ) T 2 p 1. (40) t T 1 p 2 Směrodatná odchylka s( V ) byla vypočtena ze vztahu 16 zahrnující příspěvky s(t) s(t ) a s(p 1 ) 11. Lineární regresi je možno provést například v tabulkovém procesu (MS Excel, OpenOffice Calc, Gnumeric), který podporuje maticové operace (maticový součin a operaci 11 Atmosférický tlak byl měřen s přesností 0.1kPa 13

15 V D / (ml min 1 ) V B / ml T 1 / o C n Čas t / s Statistika t/s s(t)/s Průtok V B /(ml.min 1 ) při K a kpa V B s( V B ) Tabulka 4: Tabulka experimentálních hodnot měření průtoku bublinkovým průtokoměrem. V D je hodnota udávaná na hmotnostním průtokoměru, V B je objem bublinkového průtokoměru, T 1 je teplota při které bylo provedeno měření průtoku ( V B ) inverze matice). Tento postup je jednoduchý ale zároveň neefektivní. Pokud bude změněn počet parametrů nebo pozorování bude třeba provést přeprogramování celého výpočtu, protože tyto tabulkové procesory neumožňují dynamickou alokaci polí. Jinou možností je použít některého z programovacích jazyků, at již kompilovaného - FORTRAN, C, nebo interpretovaného Matlab, Maple. Výsledky byly v tomto případě získány pomocí programu WLINREG 12 napsaném v programovacím jazyce FORTRAN. Výstup z výpočtu je uveden v dodatku. Výsledné hodnoty (odhady!) parametrů rovnice 39 jsou a 1 = a 2 = Součet čtverců odchylek a směrodatná odchylka korelace (rovnice 24) jsou S( a) = s d = Zdrojový kód programu je k dispozici na adrese... 14

16 Směrodatné odchylky stanovených parametrů a 1, a 2 se určí z kovarianční matice (rovnice 29) [ ] C a =, kde prvky na hlavní diagonále jsou rozptyly parametrů, které po odmocnění dávají směrodatné odchylky s(a 1 ) = s(a 2 ) = Pokud bude třeba stanovit nejistotu v průtoku při nastavené hodnotě V D = 30, použijeme rovnici 12 v podobě n p n p ( ) ( ) s 2 Vb Vb (V b ) = cov(a i, a j ) a i a j j=1 = 1 cov(a 1, a 1 ) + x 2 cov(a 2, a 2 ) + 2x cov(a 1, a 2 ), kde za cov(a i, a j ) dosadíme hodnoty z vypočtené kovarianční matice. Po dosazení obdržíme Pro V D = 30 je průtok V b = ± 0.98 ml min 1 Na obrázku 4 jsou znázorněny změřené hodnoty a výsledky lineární regrese. Lineární regrese - vážená Zdánlivá molární tepelná kapacita C φ p,1 N-methyl-pyrrolidonu (NMP) ve vodě byla měřena na kalorimetru Pickerova typu v závislosti na molalitě roztoku při atmosférickém tlaku a teplotě 298 K 13. Cílem tohoto experimentu bylo stanovení zdánlivé molární tepelné kapacity NMP ve vodě v nekonečném zředění C φ. p,1, která je rovna parciální molární tepelné kapacitě v nekonečném zředění C p,1. Proto bylo potřeba koncentrační závislost C φ p,1 modelovat lineární funkcí Cp,1(b) φ = a 1 + a 2 b a z výsledku určit hodnotu C φ p,1 v b = 0 (respektive určit parametr a 1 ). Výsledky experimentu jsou uvedeny v tabulce 5 Nejistota ve stanovené hodnotě C φ p,1 vzrůstala směrem k nižším hodnotám molality roztoku, z důvodu nižší odezvy měřící aparatury a tím pádem větším vlivu šumu na výslednou hodnotu. Proto byla zvolena metoda vážené lineární regrese, která zohlední nejistoty v jednotlivých měřeních. K proložení dat byl použit již zmíněný lineární model C φ p,1(b) = a 1 + a 2 b, a nástrojem, kterým byla povedena samotná regrese byl opět program WLINREG. Matice vah W obsahovala na své hlavní diagonále rozptyly experimentálních hodnot a zbytek prvků byl roven nule. Výsledky jsou znázorněny na obrázku Bernauer, M. and Dohnal, V. Temperature dependences of limiting activity coefficients and Henry s law constants for N-methylpyrrolidone, pyridine, and piperidine in water. Fluid Phase Equilib. 2009, 282,

17 Obrázek 4: Kalibrace průtokoměru, V D údaj na průtokoměru, V x reálná hodnota průtoku. p, experimentální body;, křivka lineární regrese;, 95% konfidenční pásy. n b/mol kg 1 Cp,1(exptl) φ s(cp,1(exptl)) φ Cp,1(calc) φ wdev J mol 1 K Tabulka 5: Tabulka experimentálních hodnot a výsledků vážené lineární regrese. C φ p,1(exptl), C φ p,1(calc) jsou experimentální, resp. vypočtené hodnoty a wdev = (C φ p,1(calc) C φ p,1(exptl))/s(c φ p,1(exptl)) je vážená odchylka. 16

18 Obrázek 5: Vážená lineární regrese dat zdánlivé tepelné molární kapacity C φ p,1 NMP ve vodě v závislosti na molalitě b. p, experimentální body;, křivka lineární regrese;, 95% konfidenční pásy. 17

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Posouzení přesnosti měření

Posouzení přesnosti měření Přesnost měření Posouzení přesnosti měření Hodnotu kvantitativně popsaného parametru jakéhokoliv objektu zjistíme jedině měřením. Reálné měření má vždy omezenou přesnost V minulosti sloužila k posouzení

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Matematicko-statistická metoda používaná zejména při zpracování nepřesných dat (typicky experimentálních empirických

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Úvod do problematiky měření

Úvod do problematiky měření 1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Charakterizují kvantitativně vlastnosti předmětů a jevů. Měřicí aparatura 1 / 34 Fyzikální veličiny Charakterizují kvantitativně vlastnosti předmětů a jevů. Můžeme je dělit: Podle rozměrů: Bezrozměrné (index lomu, poměry) S rozměrem fyzikální veličiny velikost

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Kalibrace a limity její přesnosti Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod Měření Pb v polyethylenu 36 různými laboratořemi 0,47 0 ± 0,02 1 µmol.g -1 tj. 97,4 ± 4,3 µg.g -1 Měření

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Technický experiment, příprava, provedení, hodnocení výsledků

Technický experiment, příprava, provedení, hodnocení výsledků Technický experiment, příprava, provedení, hodnocení výsledků 1 Katedra stavebních hmot a hornického stavitelství VŠB - Technická univerzita Ostrava 8. 3. 2012 Experiment Experiment se snaží získat potřebné

Více

Interpolace, aproximace

Interpolace, aproximace 11 Interpolace, aproximace Metoda nejmenších čtverců 11.1 Interpolace Mějme body [x i,y i ], i =0, 1,...,n 1. Cílem interpolace je najít funkci f(x), jejíž graf prochází všemi těmito body, tj. f(x i )=y

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Kalibrace a limity její přesnosti Vedoucí licenčního studia Prof. RNDr. Milan Meloun,

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Úvod do teorie měření. Eva Hejnová

Úvod do teorie měření. Eva Hejnová Úvod do teorie měření Eva Hejnová Literatura: Novák, R. Úvod do teorie měření. Ústí nad Labem: UJEP, 2003 Sprušil, B., Zieleniecová, P.: Úvod do teorie fyzikálních měření. Praha: SPN, 1985 Brož, J. a kol.

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek UNIVERZITA PARDUBICE Licenční Studium Archimedes Statistické zpracování dat a informatika 4.4 Aproximace křivek a vyhlazování křivek Mgr. Jana Kubátová Endokrinologický ústav V Praze, leden 2012 Obsah

Více

Úvod do teorie měření. Eva Hejnová

Úvod do teorie měření. Eva Hejnová Úvod do teorie měření Eva Hejnová Program semináře 1. Základní pojmy - metody měření, druhy chyb, počítání s neúplnými čísly, zaokrouhlování 2. Chyby přímých měření - aritmetický průměr a směrodatná odchylka,

Více

d p o r o v t e p l o m ě r, t e r m o č l á n k

d p o r o v t e p l o m ě r, t e r m o č l á n k d p o r o v t e p l o m ě r, t e r m o č l á n k Ú k o l : a) Proveďte kalibraci odporového teploměru, termočlánku a termistoru b) Určete teplotní koeficienty odporového teploměru, konstanty charakterizující

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE

Více

Chyby nepřímých měření

Chyby nepřímých měření nepřímé měření: Chyby nepřímých měření chceme určit veličinu z hodnot jiných veličin na základě funkční vztahu máme změřené veličiny pomocí přímých měření (viz. dříve) včetně chyb: x±σ x, y±σ y,... známe

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

0.1 Úvod do lineární algebry

0.1 Úvod do lineární algebry Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde

Více

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté polynomy pro případ dvou uzlových bodů ξ 1 = 1 a ξ 2 = 4. Experimentální body jsou x = [0.2 0.4 0.6 1.5 2.0 3.0

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Autor: Přednášející: Prof. RNDr. Milan Meloun, DrS 1. VÝPOČET OBSAHU

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Matematika pro chemické inženýry

Matematika pro chemické inženýry Matematika pro chemické inženýry Drahoslava Janovská Lineární a nelineární regrese Přednášky ZS 2016-2017 Sponzorováno grantem VŠCHT Praha, PIGA 413-17-6642, 2016 Povinná látka. Bude v písemkách a bude

Více

1. Změřte teplotní závislost povrchového napětí destilované vody σ v rozsahu teplot od 295 do 345 K metodou bublin.

1. Změřte teplotní závislost povrchového napětí destilované vody σ v rozsahu teplot od 295 do 345 K metodou bublin. 1 Pracovní úkoly 1. Změřte teplotní závislost povrchového napětí destilované vody σ v rozsahu teplot od 295 do 35 K metodou bublin. 2. Měřenou závislost znázorněte graficky. Závislost aproximujte kvadratickou

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

VYSOKONAPĚŤOVÉ ZKUŠEBNICTVÍ. #2 Nejistoty měření

VYSOKONAPĚŤOVÉ ZKUŠEBNICTVÍ. #2 Nejistoty měření VYSOKONAPĚŤOVÉ ZKUŠEBNICTVÍ # Nejistoty měření Přesnost měření Klasický způsob vyjádření přesnosti měření chyba měření: Absolutní chyba X = X M X(S) Relativní chyba δ X = X(M) X(S) - X(M) je naměřená hodnota

Více

Kalibrace odporového teploměru a termočlánku

Kalibrace odporového teploměru a termočlánku Kalibrace odporového teploměru a termočlánku Jakub Michálek 10. dubna 2009 Teorie Pro označení veličin viz text [1] s výjimkou, že teplotní rozdíl značím T, protože značku t už mám vyhrazenu pro čas. Ze

Více

MODEL TVÁŘECÍHO PROCESU

MODEL TVÁŘECÍHO PROCESU MODEL TVÁŘECÍHO PROCESU Zkouška tlakem na válcových vzorcích 2 Vyhodnocení tlakové zkoušky Síla F způsobí změnu výšky H a průměru D válce. V každém okamžiku při stlačování je přetvárný odpor definován

Více

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT

3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT PROKAZOVÁNÍ SHODY VÝROBKŮ část 3, díl 8, kapitola 4, str. 1 3/8.4 PRAKTICKÉ APLIKACE PŘI POUŽÍVÁNÍ NEJISTOT Vyjadřování standardní kombinované nejistoty výsledku zkoušky Výsledek zkoušky se vyjadřuje v

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality RNDr. Alena Mikušková FN Brno Pracoviště dětské medicíny, OKB amikuskova@fnbrno.cz Analytické znaky laboratorní metody

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Úvod do teorie měření. Eva Hejnová

Úvod do teorie měření. Eva Hejnová Úvod do teorie měření Eva Hejnová Podmínky získání zápočtu: Podmínkou pro získání zápočtu je účast na cvičeních (maximálně tři absence) a úspěšné splnění jednoho písemného testu alespoň na 50 % max. počtu

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Použitý rezistor (jmenovitá hodnota): R1 = 270 kω je přesný metalizovaný rezistor s přesností ± 0,1%.

Použitý rezistor (jmenovitá hodnota): R1 = 270 kω je přesný metalizovaný rezistor s přesností ± 0,1%. Laboratorní úloha Snímač teploty R je zapojený podle schema na Obr. 1. Snímač je termistor typ B57164K [] se jmenovitým odporem pro teplotu 5 C R 5 00 Ω ± 10 %. Závislost odporu termistoru na teplotě je

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří

Více

Vyjadřování přesnosti v metrologii

Vyjadřování přesnosti v metrologii Vyjadřování přesnosti v metrologii Měření soubor činností, jejichž cílem je stanovit hodnotu veličiny. Výsledek měření hodnota získaná měřením přisouzená měřené veličině. Chyba měření výsledek měření mínus

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

0.1 Úvod do lineární algebry

0.1 Úvod do lineární algebry Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání

Více

1. Určete závislost povrchového napětí σ na objemové koncentraci c roztoku etylalkoholu ve vodě odtrhávací metodou.

1. Určete závislost povrchového napětí σ na objemové koncentraci c roztoku etylalkoholu ve vodě odtrhávací metodou. 1 Pracovní úkoly 1. Určete závislost povrchového napětí σ na objemové koncentraci c roztoku etylalkoholu ve vodě odtrhávací metodou. 2. Sestrojte graf této závislosti. 2 Teoretický úvod 2.1 Povrchové napětí

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více