2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků a redukci počtu experimentálních údajů metodou nejmenších čtverců (pouze lineární závislost). 2.1 Gaussův zákon chyb Každé měření je zatíženo chybami. Chyby dělíme do dvou základních kategorií: a) Systematické chyby, jejichž nejčastější příčinou je chyba měřicí metody nebo použití nevhodného přístroje, případně vada přístroje, zkreslují výsledky obvykle v jednom směru. V principu je možné je zjistit, zabránit jim nebo je korigovat. b) Nahodilé chyby, které jsou výslednicí mnoha faktorů, jako např. nepostihnutelné výkyvy měřicího přístroje, osobní vliv, atmosférické vlivy atd., které způsobují fluktuace měřené veličiny. Na rozdíl od systematických chyb jim není možno zabránit. V této kapitole nebudeme uvažovat existenci systematické chyby a pod pojmem chyba budeme rozumět nahodilou chybu. Z hlubších poznatků matematické statistiky lze odvodit Gaussův zákon chyb: Chyba při měření je náhodná veličina mající normální rozdělení s nulovou střední hodnotou. V následujícím odstavci vysvětlíme použité pojmy. 2.2 Náhodná veličina a její rozdělení Náhodná veličina je reálná proměnná, jejíž hodnota je jednoznačně určena výsledkem náhodného pokusu (v našem případě výsledku měření). Náhodnou veličinu budeme značit velkým písmenem a její konkrétní hodnoty malými písmeny. Každá náhodná veličina se řídí určitým předpisem, kterému ve statistice říkáme rozdělení. V teorii zpracování naměřených údajů hraje (jak bylo zdůvodněno v předchozím odstavci) rozhodující roli tzv. normální rozdělení charakterizované dvěma parametry a, > 0, jehož hustota pravděpodobnosti má tvar ( ) Parametr µ představuje tzv. střední (očekávanou) hodnotu a parametr σ směrodatnou odchylku náhodné veličiny řídící se normálním rozdělením. Funkce f (x) má maximum v bodě a je symetrická podél osy. Graf hustoty pravděpodobnosti normálního rozdělení se nazývá Gaussova křivka. Změna hodnoty µ (při pevném σ) pouze "posouvá" Gaussovu křivku doleva či doprava. Na obr. 2.1 jsou jako příklad uvedeny grafy dvou Gaussových křivek se stejnou očekávanou hodnotou, ale s různými směrodatnými odchylkami. Parametr σ ovlivňuje špičatost (plochost) Gaussovy křivky. Jak bude ukázáno dále, obsah plochy vymezené Gaussovou křivkou a osou x je roven jedné. Mezi hustotou pravděpodobnosti f (x) a pravděpodobností p, že náhodná veličina X leží v intervalu (x 1,x 2 ), platí vztah 18
Obr. 2.1 Obr. 2.2 Z předchozí rovnice plyne normalizační podmínka pro hustotu pravděpodobnosti ve tvaru Na obr. 2.2 je obsah vyšrafované plochy roven pravděpodobnosti, že náhodná veličina X leží v intervalu (x 1,x 2 ). Jestliže se náhodná veličina řídí normálním rozdělením, pak z rovnice (2.2) plynou důležité vztahy mezi pravděpodobností výskytu náhodné veličiny X v daném intervalu a hodnotami µ a σ, které jsou uvedeny v tab. 2.1. V technické praxi obvykle požadujeme, aby statistická tvrzení měla pravděpodobnost (hladinu významnosti) 95 %. Intervalem spolehlivosti náhodné veličiny X na této hladině významnosti je tedy interval I a výsledek obvykle zapisujeme ve tvaru 19
Tab. 2.1 Základní vlastnosti rozdělení α p (μ ασ < X < μ + ασ ) 0,674 0,5 1 0,683 1,645 0,9 1,96* 0,95 2,576 0,99 3,291 0,999 * při praktických aplikacích je tato hodnota 2 Úkolem je nyní odhadnout hodnoty parametrů µ a σ z dané sady experimentálních dat. Na tomto místě je důležité si uvědomit podstatný rozdíl mezi slovy "určit" a "odhadnout". Nejsme nikdy schopni přesně určit hodnoty µ a σ, neboť vždy provedeme pouze konečný počet experimentálních měření a nepřekvapuje nás, že ze dvou různých sad experimentálních měření obdržíme obecně různé odhady parametrů µ a σ (lze však např. ukázat, že pravděpodobnost prázdného průniku intervalů spolehlivosti odhadnutých hodnot µ l a µ 2 je menší než 1 %). 2.3 Odhad hodnot parametrů µ a σ Uveďme nejprve důležité tvrzení o střední hodnotě a směrodatné odchylce normálního rozdělení, které je tvořeno lineární kombinací jiných normálních rozdělení: Nechť náhodná veličina X i má rozdělení N(µ i,σ i ) pro všechna i = 1,2,...,n. Definujme novou náhodnou veličinu vztahem kde a i pro všechna i = 1,2,...,n jsou libovolná reálná čísla. Pak též náhodná veličina X má normální rozdělení N(µ,σ 2 ) a pro její střední hodnotu µ platí Jsou-li náhodné veličiny X i pro všechna i = 1,2,...,n navíc vzájemně nezávislé, pak pro směrodatnou odchylku náhodné veličiny X platí Požadavek vzájemné nezávislosti v praxi znamená, že výsledek daného měření není ovlivněn výsledky předchozích měření. Uvažujme, že daná experimentální veličina je n-krát opakovaně měřena a nechť každé měření je náhodná veličina X i s rozdělením N(µ,σ), tj. X i = X, µ i = µ a σ i = σ pro všechna i = 1,2,...,n. Uvažujme dále novou náhodnou veličinu jako průměr předchozích Pak ze vztahů (2.7) a (2.8) plyne ( ) ( ) 20
Střední hodnota průměru je rovna střední hodnotě náhodné veličiny jednotlivého měření, ale směrodatná odchylka průměru klesá s počtem opakovaných měření. Pokud bychom chtěli opakovaným měřením zlepšit přesnost výsledku o řád, museli bychom provést zhruba 100 měření, pokud o 2 řády pak zhruba 10000 měření. Z matematické statistiky lze odvodit, že pro "nejlepší" odhad parametrů µ a σ a v našem případě platí ( ) ( ) kde symbol ^ značí, že se jedná o odhad. Vztahy (2.5), (2.10) a (2.11) nás navádí na výsledný vztah který interpretujeme tak, že s 95 % pravděpodobností leží správná (nikoliv však přesně zjistitelná) hodnota v intervalu uvedeném na pravé straně vztahu. Ve skutečnosti vztah (2.12) platí pouze pro vysoké hodnoty n (n > 20). Při praktických aplikacích je však vztah (2.12) užíván i pro nižší hodnoty (n > 4). Standardní odchylku součtu či rozdílu dvou nezávislých náhodných veličin lze určit ze vztahů (2.6) a (2.8). Uveďme dále bez důkazu navíc standardní odchylku součinu a podílu dvou nezávislých náhodných veličin A a B 2.4 Metoda nejmenších čtverců V tomto odstavci se budeme výše uvedenou metodou zabývat pouze z numerického a nikoliv statistického hlediska. Uvažujme sadu experimentálních dvojic bodů (x i,y i ) pro všechna i = 1,2,...,n a model představující funkční vztah mezi experimentálními veličinami X a Y. Metodami matematické statistiky lze např. testovat "správnost" volby modelu (2.14), stanovit vlastnosti rozdělení, kterými se řídí nastavitelné (adjustabilní) parametry, vazbu (kovarianci) mezi parametry atd. Zde pouze uveďme, že za jistých předpokladů "nejlepší" odhad parametrů minimalizuje kriteriální funkci S (a,b), která je rovna součtu čtverců odchylek (odtud název metoda nejmenších čtverců), a má tvar 21
Bod minima funkce S (a,b) určíme tak, že obě první parciální derivace funkce S položíme rovny nule. Tím získáme tzv. soustavu normálních rovnic kde platí Řešením soustavy normálních rovnic (2.16) obdržíme přičemž pro determinant soustavy (2.16) platí. 22