2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Podobné dokumenty
Náhodné chyby přímých měření

Úvod do problematiky měření

8. Normální rozdělení

Normální (Gaussovo) rozdělení

Odhad parametrů N(µ, σ 2 )

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Aplikovaná numerická matematika

Náhodné (statistické) chyby přímých měření

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Odhad parametrů N(µ, σ 2 )

Chyby měření 210DPSM

Pravděpodobnost a matematická statistika

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Kapitola 4: Extrémy funkcí dvou proměnných 1/5

Simulace. Simulace dat. Parametry

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Normální (Gaussovo) rozdělení

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Posouzení přesnosti měření

7. Rozdělení pravděpodobnosti ve statistice

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Charakteristika datového souboru

Úvod do teorie měření. Eva Hejnová

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

Teorie náhodných matic aneb tak trochu jiná statistika

Regresní a korelační analýza

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza 1. Regresní analýza

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Regresní a korelační analýza

f(x) = ax + b mocnin (čili čtverců, odtud název metody) odchylek proložených hodnot od naměřených hodnot byl co (ax i + b y i ) 2 2(ax i + b y i ).

Regresní a korelační analýza

10. N á h o d n ý v e k t o r

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz o parametrech regresního modelu

Charakterizace rozdělení

Výběrové charakteristiky a jejich rozdělení

Regresní a korelační analýza

Matematická analýza III.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Lineární regrese. Komentované řešení pomocí MS Excel

Regresní a korelační analýza

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Téma 22. Ondřej Nývlt

KATEDRA MATERIÁLOVÉHO INŽENÝRSTVÍ A CHEMIE. Stanovení základních materiálových parametrů

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Testování statistických hypotéz

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

KGG/STG Statistika pro geografy

Regresní a korelační analýza

ANALYTICKÁ GEOMETRIE V ROVINĚ

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Matematika 1 Jiˇr ı Fiˇser 19. z aˇr ı 2016 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 19. z aˇr ı / 19

Porovnání dvou výběrů

I. D i s k r é t n í r o z d ě l e n í

Testování hypotéz o parametrech regresního modelu

Úvod do teorie měření. Eva Hejnová

FUNKCE POJEM, VLASTNOSTI, GRAF

Kvantily a písmenové hodnoty E E E E-02

AVDAT Nelineární regresní model

p(x) = P (X = x), x R,

Interpolace, aproximace

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

Numerické metody zpracování výsledků

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Pravděpodobnost a statistika I KMA/K413

Statistická analýza jednorozměrných dat

Návrh a vyhodnocení experimentu

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

4. Aplikace matematiky v ekonomii

Základy teorie odhadu parametrů bodový odhad

3. ÚVOD DO ANALYTICKÉ GEOMETRIE 3.1. ANALYTICKÁ GEOMETRIE PŘÍMKY

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Základy teorie pravděpodobnosti

5. Lokální, vázané a globální extrémy

MATEMATICKÁ STATISTIKA

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

11 Analýza hlavních komponet

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.

Transkript:

2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků a redukci počtu experimentálních údajů metodou nejmenších čtverců (pouze lineární závislost). 2.1 Gaussův zákon chyb Každé měření je zatíženo chybami. Chyby dělíme do dvou základních kategorií: a) Systematické chyby, jejichž nejčastější příčinou je chyba měřicí metody nebo použití nevhodného přístroje, případně vada přístroje, zkreslují výsledky obvykle v jednom směru. V principu je možné je zjistit, zabránit jim nebo je korigovat. b) Nahodilé chyby, které jsou výslednicí mnoha faktorů, jako např. nepostihnutelné výkyvy měřicího přístroje, osobní vliv, atmosférické vlivy atd., které způsobují fluktuace měřené veličiny. Na rozdíl od systematických chyb jim není možno zabránit. V této kapitole nebudeme uvažovat existenci systematické chyby a pod pojmem chyba budeme rozumět nahodilou chybu. Z hlubších poznatků matematické statistiky lze odvodit Gaussův zákon chyb: Chyba při měření je náhodná veličina mající normální rozdělení s nulovou střední hodnotou. V následujícím odstavci vysvětlíme použité pojmy. 2.2 Náhodná veličina a její rozdělení Náhodná veličina je reálná proměnná, jejíž hodnota je jednoznačně určena výsledkem náhodného pokusu (v našem případě výsledku měření). Náhodnou veličinu budeme značit velkým písmenem a její konkrétní hodnoty malými písmeny. Každá náhodná veličina se řídí určitým předpisem, kterému ve statistice říkáme rozdělení. V teorii zpracování naměřených údajů hraje (jak bylo zdůvodněno v předchozím odstavci) rozhodující roli tzv. normální rozdělení charakterizované dvěma parametry a, > 0, jehož hustota pravděpodobnosti má tvar ( ) Parametr µ představuje tzv. střední (očekávanou) hodnotu a parametr σ směrodatnou odchylku náhodné veličiny řídící se normálním rozdělením. Funkce f (x) má maximum v bodě a je symetrická podél osy. Graf hustoty pravděpodobnosti normálního rozdělení se nazývá Gaussova křivka. Změna hodnoty µ (při pevném σ) pouze "posouvá" Gaussovu křivku doleva či doprava. Na obr. 2.1 jsou jako příklad uvedeny grafy dvou Gaussových křivek se stejnou očekávanou hodnotou, ale s různými směrodatnými odchylkami. Parametr σ ovlivňuje špičatost (plochost) Gaussovy křivky. Jak bude ukázáno dále, obsah plochy vymezené Gaussovou křivkou a osou x je roven jedné. Mezi hustotou pravděpodobnosti f (x) a pravděpodobností p, že náhodná veličina X leží v intervalu (x 1,x 2 ), platí vztah 18

Obr. 2.1 Obr. 2.2 Z předchozí rovnice plyne normalizační podmínka pro hustotu pravděpodobnosti ve tvaru Na obr. 2.2 je obsah vyšrafované plochy roven pravděpodobnosti, že náhodná veličina X leží v intervalu (x 1,x 2 ). Jestliže se náhodná veličina řídí normálním rozdělením, pak z rovnice (2.2) plynou důležité vztahy mezi pravděpodobností výskytu náhodné veličiny X v daném intervalu a hodnotami µ a σ, které jsou uvedeny v tab. 2.1. V technické praxi obvykle požadujeme, aby statistická tvrzení měla pravděpodobnost (hladinu významnosti) 95 %. Intervalem spolehlivosti náhodné veličiny X na této hladině významnosti je tedy interval I a výsledek obvykle zapisujeme ve tvaru 19

Tab. 2.1 Základní vlastnosti rozdělení α p (μ ασ < X < μ + ασ ) 0,674 0,5 1 0,683 1,645 0,9 1,96* 0,95 2,576 0,99 3,291 0,999 * při praktických aplikacích je tato hodnota 2 Úkolem je nyní odhadnout hodnoty parametrů µ a σ z dané sady experimentálních dat. Na tomto místě je důležité si uvědomit podstatný rozdíl mezi slovy "určit" a "odhadnout". Nejsme nikdy schopni přesně určit hodnoty µ a σ, neboť vždy provedeme pouze konečný počet experimentálních měření a nepřekvapuje nás, že ze dvou různých sad experimentálních měření obdržíme obecně různé odhady parametrů µ a σ (lze však např. ukázat, že pravděpodobnost prázdného průniku intervalů spolehlivosti odhadnutých hodnot µ l a µ 2 je menší než 1 %). 2.3 Odhad hodnot parametrů µ a σ Uveďme nejprve důležité tvrzení o střední hodnotě a směrodatné odchylce normálního rozdělení, které je tvořeno lineární kombinací jiných normálních rozdělení: Nechť náhodná veličina X i má rozdělení N(µ i,σ i ) pro všechna i = 1,2,...,n. Definujme novou náhodnou veličinu vztahem kde a i pro všechna i = 1,2,...,n jsou libovolná reálná čísla. Pak též náhodná veličina X má normální rozdělení N(µ,σ 2 ) a pro její střední hodnotu µ platí Jsou-li náhodné veličiny X i pro všechna i = 1,2,...,n navíc vzájemně nezávislé, pak pro směrodatnou odchylku náhodné veličiny X platí Požadavek vzájemné nezávislosti v praxi znamená, že výsledek daného měření není ovlivněn výsledky předchozích měření. Uvažujme, že daná experimentální veličina je n-krát opakovaně měřena a nechť každé měření je náhodná veličina X i s rozdělením N(µ,σ), tj. X i = X, µ i = µ a σ i = σ pro všechna i = 1,2,...,n. Uvažujme dále novou náhodnou veličinu jako průměr předchozích Pak ze vztahů (2.7) a (2.8) plyne ( ) ( ) 20

Střední hodnota průměru je rovna střední hodnotě náhodné veličiny jednotlivého měření, ale směrodatná odchylka průměru klesá s počtem opakovaných měření. Pokud bychom chtěli opakovaným měřením zlepšit přesnost výsledku o řád, museli bychom provést zhruba 100 měření, pokud o 2 řády pak zhruba 10000 měření. Z matematické statistiky lze odvodit, že pro "nejlepší" odhad parametrů µ a σ a v našem případě platí ( ) ( ) kde symbol ^ značí, že se jedná o odhad. Vztahy (2.5), (2.10) a (2.11) nás navádí na výsledný vztah který interpretujeme tak, že s 95 % pravděpodobností leží správná (nikoliv však přesně zjistitelná) hodnota v intervalu uvedeném na pravé straně vztahu. Ve skutečnosti vztah (2.12) platí pouze pro vysoké hodnoty n (n > 20). Při praktických aplikacích je však vztah (2.12) užíván i pro nižší hodnoty (n > 4). Standardní odchylku součtu či rozdílu dvou nezávislých náhodných veličin lze určit ze vztahů (2.6) a (2.8). Uveďme dále bez důkazu navíc standardní odchylku součinu a podílu dvou nezávislých náhodných veličin A a B 2.4 Metoda nejmenších čtverců V tomto odstavci se budeme výše uvedenou metodou zabývat pouze z numerického a nikoliv statistického hlediska. Uvažujme sadu experimentálních dvojic bodů (x i,y i ) pro všechna i = 1,2,...,n a model představující funkční vztah mezi experimentálními veličinami X a Y. Metodami matematické statistiky lze např. testovat "správnost" volby modelu (2.14), stanovit vlastnosti rozdělení, kterými se řídí nastavitelné (adjustabilní) parametry, vazbu (kovarianci) mezi parametry atd. Zde pouze uveďme, že za jistých předpokladů "nejlepší" odhad parametrů minimalizuje kriteriální funkci S (a,b), která je rovna součtu čtverců odchylek (odtud název metoda nejmenších čtverců), a má tvar 21

Bod minima funkce S (a,b) určíme tak, že obě první parciální derivace funkce S položíme rovny nule. Tím získáme tzv. soustavu normálních rovnic kde platí Řešením soustavy normálních rovnic (2.16) obdržíme přičemž pro determinant soustavy (2.16) platí. 22