Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná. Dva základní problémy: 1) Jakým způsobem ze souboru naměřených hodnot zjistit výsledek měření, který se nejvíce blíží správné (tj. skutečné) hodnotě měřené veličiny? 2) Jakým způsobem charakterizovat odchylku výsledku měření od správné hodnoty, tj. jak určit velikost náhodné chyby?

Náhodná veličina (n. v.) Na soubory naměřených hodnot pohlížíme jako na soubory náhodných veličin, které se řídí statistickými zákony a výsledcích lze vyslovit pouze pravděpodobnostní výroky. Náhodnou veličinu lze charakterizovat pravděpodobností, s jakou nabývá svých hodnot. N. v. může být buď spojitá nebo nespojitá. Příklad hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota Měření délky: 13,3 cm; 13,2 cm; 13,1 cm; 13,2 cm; 13,0 cm. Jednotlivé naměřené délky považuje za náhodné (spojité) veličiny (délka může nabývat libovolné hodnoty).

Opakování počtu pravděpodobnosti

Klasická definice pravděpodobnosti: Pravděpodobnost Počet případů příznivých Počet případů možných Jakých hodnot může pravděpodobnost daného jevu nabývat? Příklad Jaká je pravděpodobnost, že při hodu hrací kostkou padne číslo 6?

Statistická definice pravděpodobnosti n krát opakujeme daný experiment m krát zaznamenáme úspěch (příznivý případ). Pravděpodobnost lim n m n Příklad Hodíme desetkrát hrací kostkou. Padnou tato čísla: 5, 4, 1, 6, 5, 4, 2, 6, 3, 4 Odhadněte pravděpodobnost toho, že padne číslo 6.

Nespojitá náhodná veličina Může nabývat jen konečně mnoha nebo spočetně mnoha hodnot. Jedná se často o hodnoty celočíselné (např. počet impulzů, počet částic, ) získaných čítáním. Předem zadané hodnoty x nabývá s pravděpodobností P(x).

Měříme opakovaně n krát za shodných podmínek stejnou veličinu. Danou hodnotu x naměříme m krát. Číslu m říkáme četnost měřené hodnoty x. Tento graf nazýváme histogram

Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty: číslo měření intenzita (imp/10s) 1 3 Nakreslete histogram: graf četnosti intenzity jako funkce měřené hodnoty 2 4 3 2 4 3 5 4 6 2 7 4 8 2 9 3 četnost 5 4 3 2 1 takto kreslíme četnost hodnoty 2 10 2 0 1 2 3 4 5 intenzita (imp/10s)

Za jakých podmínek bude relativní četnost rovna pravděpodobnosti naměření dané hodnoty? Relativní četnost je definována jako m n Pravděpodobnost je definována jako lim n m n

Graf závislosti pravděpodobnosti na naměřené hodnotě nazýváme rozdělení diskrétní náhodné proměnné. pravděpodobnost hodnota Pravděpodobnost naměření hodnoty x i budeme značit P xi

Jaká je hodnota výrazu: všechna i P x i

Doposud jsme se věnovali diskrétní náhodné proměnné. To je taková proměnná, která nabývá jen určitých hodnot. (Př.: výsledek hodu kostkou, posloupnost čísel při tahu sportky apod.) Fyzikální veličiny však obvykle mohou nabývat libovolné hodnoty. Náhodná proměnná spojená s takovou fyzikální veličinou bude tzv. spojitá (spojitá n. v.). Spojitá náhodná veličina může nabývat hodnot, které se od sebe libovolně málo liší, ale žádné dvě nejsou stejné. Toto je však pouze teorie. Ve skutečnosti je každá měřená hodnota diskrétní diskretizaci provádí měřící přístroj. Tento digitální voltmetr naměří hodnoty 1,295, 1,296 nebo 1,297 ale nic mezi tím.

Přestože se ve skutečnosti se spojitými náhodnými proměnnými (veličinami) při měření v praxi nesetkáme, používají se spojitá rozdělení častěji lépe se s nimi počítá s využitím aparátu matematické analýzy. Formalismus popisu náhodných proměnných je ale odlišný. pravděpodobnost hodnota hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota Jaká je pravděpodobnost, že naměříme hodnotu frekvence elektromagnetického záření 2,128574443445098853567899653GHz? Přesně!

Pravděpodobnost naměření určité konkrétní hodnoty spojité náhodné proměnné nemá smysl, je vždy rovna nule. Smysl má pouze pravděpodobnost naměření hodnoty v určitém intervalu. Definujeme tzv. hustotu pravděpodobnosti px ( ) dp dx

Analogie hustota (hmotnosti) a hustota pravděpodobnosti hustota (hmotnosti) m V průměrná hustota nehomogenního kusu látky o hmotnosti m a objemu V Pokud se hustota tělesa mění místo od místa (těleso není homogenní), má smysl definovat lokální hustotu: dm dv Hustota v bodě = hmotnost nekonečně malého kousku děleno objemem tohoto kousku.

Známe-li střední hustotu, můžeme hmotnost tělesa spočítat takto: m V Známe-li lokální hustotu, hmotnost tělesa se spočítá takto: m V dv Pravděpodobnosti naměření hodnoty x z intervalu (x 1, x 2 ) se spočítá jako: P( x, x ) p( x) dx 1 2 x x 2 1 hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota

Čemu je roven výraz: p( x) dx? hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota

Úkol: Seřaďte podle velikosti od nejmenšího po největší 1) pravděpodobnost naměření hodnoty v intervalu (50,100) 2) pravděpodobnost naměření hodnoty v intervalu (100,150) 3) pravděpodobnost naměření hodnoty v intervalu (250,300) p(x) P( x1, x2) p( x) dx x x 2 1 0 50 100 150 200 250 300 350 400 x

Základními parametry rozdělení jsou: diskrétní rozdělení spojité rozdělení střední hodnota n Px x ( ) i i i 1 D x p x dx n počet všech možností D definiční obor rozptyl (disperze) n D Px ( xi ) i 1 i 2 2 D ( x ) p( x) dx D

Úkol: Které rozdělení má větší střední hodnotu (černé nebo červené)? hustota pravděpodobnosti 0,006 0,005 0,004 0,003 0,002 0,001 D x p( x) dx 0,000 0 200 400 600 800 1000 hodnota

Úkol: Které rozdělení má větší disperzi (černé nebo červené)? 0,006 2 D ( x ) p( x) dx D hustota pravděpodobnosti 0,005 0,004 0,003 0,002 0,001 0,000 0 200 400 600 800 1000 hodnota Proč je červené rozdělení nižší než černé?

Střední hodnota určuje polohu rozdělení na ose x a disperze jeho šířku. Disperze však nemůže být přímo jakkoliv definovanou šířkou nemá vhodnou jednotku. n 2 2 x ( ) i i i 1 D D P x D ( x ) p( x) dx Proto definujeme tzv. směrodatnou odchylku σ vztahem: D 0,006 hustota pravděpodobnosti 0,005 0,004 0,003 0,002 0,001 0,000 0 200 400 600 800 1000 hodnota

Intervaly spolehlivosti Hledáme velikost intervalu pro zvolenou hodnotu pravděpodobnosti, přičemž předpokládáme, že máme naměřeno nekonečně mnoho hodnot. Interval, jemuž přísluší pravděpodobnost P, nazýváme P-procentní interval spolehlivosti (také konfidenční interval). (μ kσ, μ kσ), kde k 0.

Normální (Gaussovo) rozdělení P( x1, x2) p( x) dx p( x) x x 2 1 1 e 2 ( x ) 2 2 2 střední hodnota: µ disperze: D=σ 2 σ je směrodatná odchylka Je nejčastější používaný model rozdělení náhodné veličiny. 0,000 0 100 200 300 400 500 600 700 800 900 1000 Používá se pro náhodné jevy, které vznikly složením vlivů, které jsou nezávislé, je jich velký počet a každý z těchto vlivů ovlivňuje skutečnou hodnotu n. v. jen malým příspěvkem. Přímo měřené fyzikální veličiny zpravidla těmto předpokladům vyhovují (u přesných měření je třeba nejdříve vyšetřit, jakým rozdělením pravděpodobnosti lze n. v. popsat). hustota pravděpodobnosti 0,004 0,003 0,002 0,001 hodnota

Jak souvisí σ s tvarem křivky? µ = 500 σ = 100 µ = 300 σ = 100 hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota 0,0025 µ = 500 σ = 200 hustota pravděpodobnosti 0,0020 0,0015 0,0010 0,0005 0,0000 0 100 200 300 400 500 600 700 800 900 1000 hodnota

Inflexní bod je bod na křivce, ve kterém křivost mění znaménko z kladného na záporné nebo ze záporného na kladné. Křivka se mění z konkávní (kladná křivost) na konvexní (záporná křivost) nebo obráceně. µ = 500 σ = 100 hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota µ µ - σ µ + σ inflexní bod

µ = 500 σ = 100 hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota µ µ - σ µ + σ inflexní bod ( x ) 1 p x dx e dx 2 2 2 ( ) 0,68 2 Měříme-li veličinu, která se řídí normálním rozdělením se střední hodnotou µ a směrodatnou odchylkou σ, je pravděpodobnost toho, že při dalším měření naměříme hodnotu z intervalu (µ - σ, µ + σ) rovna 68%.

Úkol: Odhadněte, jaká je pravděpodobnost naměření hodnoty z intervalu (µ - 3σ, µ + 3σ). hustota pravděpodobnosti 0,004 0,003 0,002 0,001 0,000 0 100 200 300 400 500 600 700 800 900 1000 hodnota µ µ - σ µ + σ inflexní bod

Definujeme tzv. krajní (mezní) chybu vztahem: k = 3.σ Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ) (tzv. 3σ interval) je rovna 99,7 %. krajní (mezní) chyba = jistota

Definujeme tzv. pravděpodobnou chybu pro P = 0,5 (= 50 %): k = 2/3 Pravděpodobnost naměření hodnoty v intervalu (µ - 2/3σ, µ + 2/3σ) je rovna 50 % (tento interval vymezuje právě polovinu obsahu plochy pod normální křivkou). Při běžných měřeních často stačí pracovat s tímto intervalem.

Hodnoty čísla k pro pravděpodobnost P při různém počtu měření N

Vlastnosti spojité n. v., která se řídí normálním rozdělením

Odhady střední hodnoty a směrodatné odchylky pro konečný počet měření Měříme náhodnou veličinu x a chceme určit odhad její střední hodnoty a chyby, tedy výraz: x (hodnota chyba) jednotky x ( x s x ) Opakujeme n krát měření za stejných podmínek, odhad střední hodnoty získáme jako: 1 n x x aritmetický průměr i n i 1 a odhad směrodatné odchylky (chyby) n jednoho měření 2 ( xi x) i 1 sx n 1

Příklad Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty: číslo měření Intenzita Vypočtěte odhad střední hodnoty a směrodatné odchylky. 1 3,0 2 4,0 3 3,0 4 3,0 5 4,0 s x n i 1 ( x x) i n 1 2

Příklad Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty: číslo měření intenzita (imp/10s) 1 3 2 4 Vypočtěte odhad střední hodnoty a směrodatné odchylky. Řešení 3 3 4 3 5 4 Vlastnosti aritmetického průměru

Směrodatná odchylka při malém počtu měření Při malém počtu měření se spojitá n. v. neřídí normálním rozdělením, ale tzv. Studentovým neboli t-rozdělením Křivka je plošší (tím více, čím nižší je N) pro dosažení stejné psti P výskytu naměřené hodnoty v nějakém intervalu symetrickém kolem μ je třeba u t-rozdělení zvolit interval (μ kσ, μ + kσ) širší.

Kritéria pro vyloučení hrubých chyb měření Připomeňme si: Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ) je rovna (tzv. 3σ interval) je 99,7 % (= jistota) krajní (mezní) chyba

Směrodatná odchylka jednoho měření však není pro celý soubor N měření dostačující. Pokud bychom znovu provedli N měření, dospěli bychom k jiné hodnotě arit. průměru (i když je střední hodnota μ stejná). x 1 n xi n i 1 s x n i 1 ( x x) i nn ( 1) 2 x ( x s ) x

Shrnutí postup při zpracování hodnot získaných přímým měřením

Cvičení 1. Určení střední hodnoty a chyby při malém počtu měření Posuvným měřidlem byly naměřeny tyto hodnoty délky: 3,12 cm; 3,00 cm; 3,06 cm. Předpokládejte, že měřené hodnoty jsou zatíženy jen náhodnými chybami. Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a aritmetického průměru. Určete interval spolehlivosti pro P= 0,995 a P = 0,5. Vypočtěte relativní chyby.

Cvičení 2. Určení střední hodnoty a chyby při malém počtu měření V tabulce jsou zaznamenány naměřené hodnoty hmotnosti. Předpokládejte, že měřené hodnoty jsou zatíženy jen náhodnými chybami. Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a aritmetického průměru. Určete interval spolehlivosti pro P = 0,999, P = 0,995 a P = 0,5. Vypočtěte relativní chyby.

Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření - použití přísnějšího kritéria pro vyloučení hrubých chyb

Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření - použití přísnějšího kritéria pro vyloučení hrubých chyb V tabulce jsou zaznamenány naměřené hodnoty hmotnosti. Předpokládejte, že měřené hodnoty jsou zatíženy jen náhodnými chybami. Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a aritmetického průměru. Pro vyloučení hrubých chyb užijte t-kritérium.

Cvičení 4. Určení střední hodnoty a chyby při dostatečném počtu měření V tabulce jsou zaznamenány naměřené hodnoty průměru drátu (průměr drátu byl měřen na deseti různých místech, vždy ve dvou navzájem kolmých směrech). Předpokládejte, že měřené hodnoty jsou zatíženy jen náhodnými chybami), měření bylo provedeno mikrometrem. Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a aritmetického průměru. Určete interval spolehlivosti pro P = 0,997 a P = 0,5. Vypočtěte relativní chyby.