Stochastické signály (opáčko) Stochastický signál nemůžeme popsat rovnicí, ale pomocí sady parametrů. Hodit se bude statistika a pravděpodobnost (umíte). Tohle je jen miniminiminiopáčko, později probereme pořádně (snad) Proč se tím vůbec budeme trápit? Když něco měříme, použijeme snímač. Snímač je většinou analogový. A šumí. Šum má charakter náhodného signálu. Zpracování signálu odstranění šumu Když chci něco zničit, musím o tom něco vědět Náhodný signál může být se spojitým časem nebo diskrétním časem (to je stejné jako u deterministických signálů) Příklad: záznam šumu pozadí u mě v kanceláři (zrovna tam nikdo nekřičí ani venku nesekají trávník): -.55 -.6 -.65 -.7 -.75 -.8 -.85 4 6 8
Střední hodnota aritmetický průměr Základní parametry (momenty) Značí se všelijak, např. μ,e( x), x E ( X) N = x N i= i Poznámka: E je z expected value proč je v argumentu E velké X? X je náhodná veličina, x je konkrétní číslo Existuje i kupa dalších středních hodnot (medián, modus) Cvičení: pro náhodný signál z předchozího obrázku spočítejte aritmetický průměr a medián. Zkuste i pro kousky signálu. Liší se to? Hodně?
Rozptyl, směrodatná odchylka Parametrizujeme, jak moc hodnota signálu lítá kolem střední hodnoty. N i Nejjednodušší verze: průměrná odchylka: x E( X) N i= Proč je tam absolutní hodnota? Proč se to nepoužívá? Většinou není důležitá odchylka, ale výkon (když v elektrickém obvodu máte různé zdroje šumu, je výsledný šum rovný kombinaci výkonu jednotlivých signálů). Proto se používá rozptyl, respektive směrodatná odchylka (ve vzorečku je N-, vysvětlíme za chvilku ): N D X x E X N ( i ) ( ) = σ = ( ) Směrodatná odchylka je odmocnina z rozptylu σ = σ Směrodatná odchylka je míra toho, jak moc signál lítá kolem střední hodnoty Rozptyl je míra výkonu tohoto lítání. Výše uvedený vzoreček má jednu nevýhodu, následující je lepší. Proč? N N D( X) = σ = xi xi N i= N i= Existují ještě další druhy odchylek, například ta s pěknou anglickou zkratkou MAD (Median Absolute ( i ) Deviation) MAD = median x median( X ) Cvičení: naprogramujte v Matlabu funkci pro výpočet rozptylu (já vím že tam je, však ono vám to neuškodí) i=
Další užitečné parametry Poměr signál/šum (SNR Signal to Noise Ratio) SNR = μ σ Variační koeficient (CV - Coefficient of Variation) převrácená hodnota CV = Proč jsou tam úplně jiná písmenka? Abyste si zvykli že to každý značí jinak ( ) ( ) D X E X Poměr signál/šum jinak Psignál Asignál SNR = P, SNR = šum Ašum, kde A je efektivní hodnota (RMS Root Mean Square odmocnina průměru čtverců) Protože většina signálů má velký dynamický rozsah, používá se logaritmická stupnice: SNR db Psignál Asignál Asignál = log = log = log Pšum Ašum Ašum A tenhle vzoreček už jste určitě někde viděli
Signál a proces (co se vážně děje) Zatím jsme se bavili o signálech, tedy o tom co naměříme. Ke zpracování naměřených dat slouží statistika. Ale měříme vždy nějaký děj, vznešenými slovy realizaci náhodného děje. A náhodný děj, proces bublající pod tím co naměříme, popisuje pravděpodobnost. Když mluvíme o střední hodnotě nebo směrodatné odchylce, je potřeba vědět jestli se bavíme o datech, nebo o procesu. Jak to poznáme? Těžko! Čím víc měření, tím líp zákon velkých čísel Chyba mezi střední hodnotou měření a střední hodnotou reálného děje pro náhodný signál: Když je N velké, chyba je malá σ N Využití: např. výpočet směrodatné odchylky (N- z předminulého slidu, když je N malé, získám lepší odhad směrodatné odchylky procesu (z dat která jsem naměřil), když je N velké, tak je to jedno) Platí pouze pro stacionární procesy (v nestacionárním se např. mění střední hodnota s časem co s tím?)
Popis pomocí funkcí (histogram, hustota pravděpodobnosti) Zatím jsme počítali jednoduché parametry naměřených hodnot momenty. Není to málo? Z takové kupy čísel máme jedno, dvě čísla! Histogram Pro data šumu z kanceláře 9 8 7 6 5 4 3 -.9 -.85 -.8 -.75 -.7 -.65 -.6 8 6 4 8 6 4 -.9 -.85 -.8 -.75 -.7 -.65 -.6 -.55 45 4 35 3 5 5 5 -.95 -.9 -.85 -.8 -.75 -.7 -.65 -.6 -.55 -.5 5 hodnot, skupin (tříd) hodnot hodnot Z histogramu se dá snadno spočítat střední hodnota i směrodatná odchylka. Ale hlavně je v něm kupa dalších informací! Cvičení: vyzkoušet si histogram, s různým počtem tříd
Hustota pravděpodobnosti Histogram je z konečného počtu hodnot měření! (ne proces) Proces: hustota pravděpodobnosti probability density function, PDF (jak by vypadal histogram z nekonečně mnoha měření, když bychom ho nanormovali tak, aby plocha pod křivkou byla jednička, navíc je to funkce spojitá (na rozdíl od měření)) K čemu to je? Jednoduše spočítám pravděpodobnost toho, že hodnota bude z určitého intervalu (jako plochu pod křivkou v daných mezích, bacha, hodnota hustoty pravděpodobnosti NENÍ pravděpodobnost) Cvičení: napsat program, který vypočítá a nakreslí odhad hustoty pravděpodobnosti z daného měření (není to tak lehké, jak to na první pohled vypadá) Jak bude vypadat pdf pro sinusovku?
Normální rozdělení Signály z náhodných procesů většinou mají Gaussovo (normální) rozdělení, hustota pravděpodobnosti: f ( x) = πσ e ( x μ ) σ, pro daný rozptyl a střední hodnotu.7.6 std = std =.5 std = 4.5.4.3.. -8-6 -4-4 6 8 Cvičení: naklovejte funkci, která bude generovat pěkné gaussovy kopečky
Protože většina šumů má právě toto rozdělení. Jak je to možné??? Proč je normální rozdělení tak důležité? Centrální limitní věta: Když budeme sečítat náhodná čísla, tak se budou blížit normálnímu rozdělení. Neříká se nic o tom, z jakého rozdělení ta čísla jsou Neříká se nic o tom, že musí být ze stejného rozdělení Šum (aditivní) je kupa všelijakých šumů: bude mít (asi) normální rozdělení Jednoduchý pokus: sečteme náhodná čísla z rovnoměrného rozložení.8.6.4. 3 4 5 6 7 8 9 8 6 4...3.4.5.6.7.8.9.5.5 3 4 5 6 7 8 9 8 6 4..4.6.8..4.6.8 8 6 4 5 3 4 5 6 7 8 9 5 3 4 5 6 7 8 9 RAND RAND+RAND RAND+RAND+ (x) Cvičení: vyrobte generátor náhodného šumu podle předchozího obrázku
Přesnost a přesnost Ultrazvukovým snímačem měříme vzdálenost robotu od zdi. Robot stojí. Zeď stojí. Naměříme každou chvilku něco jiného. Co to vlastně naměříme? Z jednotlivých měření vyrobíme histogram. Z něj snadno spočítáme střední hodnotu. Je to opravdu skutečná vzdálenost od zdi? Čeština je krásný jazyk a tak používá slovo přesnost ve zcela odlišných významech. Odchylka střední hodnoty od skutečné hodnoty, SPRÁVNOST Rozptyl naměřených hodnot, PŘESNOST
Měříme vzdálenost ultrazvukem Střílíme do terče Tyto dvě přesnosti mají různou podstatu Odchylka od skutečné hodnoty (správnost) je záležitost kalibrace. Špatná správnost je výsledkem systematických chyb. Rozptyl naměřených hodnot (přesnost) je záležitost náhodného šumu (vysoký rozptyl měření odpovídá špatné opakovatelnosti měření)