Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012

Podobné dokumenty
Matematicko-fyzikální model vozidla

Bayesovská klasifikace digitálních obrazů

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Matematická statistika

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Pomůcka pro cvičení: 3. semestr Bc studia

Národní informační středisko pro podporu kvality

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Regresní a korelační analýza

6. T e s t o v á n í h y p o t é z

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky

Zpracování a vyhodnocování analytických dat

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Pojem a úkoly statistiky

Dopad operace levostranné dislokace slezu metodou omentopexe na užitkovost a reprodukci dojnic holfštýnského typu

Základy matematiky kombinované studium /06

Použití technik UI v algoritmickém obchodování III

Bootstrap - konfidenční intervaly a testy

Tomáš Karel LS 2012/2013

Obraz matematický objekt. Spojitý obraz f c : (Ω c R 2 ) R

Stochastické signály (opáčko)

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015

Základy matematické statistiky

Rozhodovací stromy a lesy

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

ANALÝZA A KLASIFIKACE DAT

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Číslicové zpracování signálů a Fourierova analýza.

Využití časových řad v diagnostice výkonových olejových transformátorů - 1. část

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Pro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:

ODBĚR, PŘÍPRAVA, PŘEPRAVA A UCHOVÁVÁNÍ VZORKŮ

Hodnocení klasifikátoru Test nezávislosti. 14. prosinec Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

Přednáška 5. Výběrová šetření, Exploratorní analýza

Použití splinů pro popis tvarové křivky kmene

Získávání znalostí z dat

Národní informační středisko pro podporu kvality

1.3. Cíle vzdělávání v oblasti citů, postojů, hodnot a preferencí

Fixed management model s mûfienou heterogenitou

Pravděpodobnost a matematická statistika

Rozhodování. s více účastníky. Miroslav. school@utia

ČESKÁ TECHNICKÁ NORMA

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

1. Pravděpodobnost a statistika (MP leden 2010)

7.2.1 Vektory. Předpoklady: 7104


V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Osvětlování a stínování

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

Vytěžování znalostí z dat

Simulované žíhání jako nástroj k hledání optimálního řešení

Klasifikace a rozpoznávání. Lineární klasifikátory

Tvorba povrchů pomocí interpolací

NEPARAMETRICKÉ TESTY

Odhady Parametrů Lineární Regrese

Program pro zobrazení černobílých snímků v nepravých barvách

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Intervalové Odhady Parametrů

Tématické celky { kontrolní otázky.

A NUMERICKÉ METODY. Matice derivací: ( ) ( ) Volím x 0 = 0, y 0 = -2.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

ČSN EN ed. 2 OPRAVA 1

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

a n (z z 0 ) n, z C, (1) n=0

UČENÍ BEZ UČITELE. Václav Hlaváč

KLASIFIKAČNÍ A REGRESNÍ LESY

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Odhad parametrů N(µ, σ 2 )

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

NÁVRH LQG ŘÍZENÍ PRO FYZIKÁLNÍ MODEL KULIČKY NA TYČI

Pracovní text a úkoly ke cvičením MF002

Třídění statistických dat

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Robust ledna 5. února 2010, Králíky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Výsledky vstupních testů z matematiky a úspěšnost studia

Výběrové charakteristiky a jejich rozdělení

OPTIMÁLNÍ SEGMENTACE DAT

LINEÁRNÍ REGRESE. Lineární regresní model

Klasifikační metody pro genetická data: regularizace a robustnost

2. Bodové a intervalové rozložení četností

Tomáš Karel LS 2012/2013

Statistika. Jindřich Soukup. University of South Bohemia in České Budějovice Faculty of Fisheries and Protection of Waters, School of complex systems

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Neparametrické odhady hustoty pravděpodobnosti

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Seminář RIB. Úvod do požární odolnosti

KGG/STG Statistika pro geografy

Transkript:

Statistické metody v digitálním zpracování obrazu Jindřich Soukup 3. února 2012

Osnova Úvod (Neparametrické) odhady hustoty pravděpodobnosti Bootstrap Použití logistické regresi při klasifikaci

Odhady hustoty pravděpodobnosti motivace Zhodnotit pravidelnost daných struktur Rozdělení vzdáleností d-tých nejbližších sousedů Radiální distribuční funkce Naměřené hodnoty realizace náhodného jevu - odhad hustoty pravděpodobnosti

Odhady hustoty pravděpodobnosti motivace Naměřené hodnoty beru jako realizace náhodného jevu Histogramy jsou pouze odhady hustoty pravděpodobnosti tohoto jevu

Odhady hustoty pravděpodobnosti rozdělení xi - naměřené hodnoty, ρ - hustota pravděpodobnosti Histogram, frekvenční polynom, jádrové odhady

Odhady hustoty pravděpodobnosti rozdělení xi - naměřené hodnoty, ρ - hustota pravděpodobnosti Histogram, frekvenční polynom, jádrové odhady θ - vektor parametrů Bayes, MLE

Histogram - po částech konstantní odhad hustoty pravděpodobnosti k - počet binů, h - šířka binu k = ceiling( (max(x)-min(x)) / h ) k, resp. h jsou klíčové

Histogram - šířka binu Sturgesovo pravidlo (1926) to odpovídá! nepoužívat pro větší soubory dat!

Histogram - šířka binu Sturgesovo pravidlo (1926) to odpovídá! nepoužívat pro větší soubory dat! Scott (1979) - optimální ve smyslu minimalizace MSE

Histogram - šířka binu Sturgesovo pravidlo (1926) to odpovídá! nepoužívat pro větší soubory dat! Scott (1979) - optimální ve smyslu minimalizace MSE Odhady R(ρ') (Scott 1979, Friedman a Diaconis 1981)

Řád konvergence, citlivost Odhady založené na Scottově vzorci mají řád konvergence N-2/3 (pro porovnání MLE má N-1).

Řád konvergence, citlivost Odhady založené na Scottově vzorci mají řád konvergence N-2/3 (pro porovnání MLE má N-1). Citlivost

Řád konvergence, citlivost Odhady založené na Scottově vzorci mají řád konvergence N-2/3 (pro porovnání MLE má N-1). Citlivost

Porovnání pravidel

Literatura

Kernel density estimation Jádrové odhady, Parzenovo okénko... Klouzavý vážený průměr

Tvar jádra, šířka jádra, citlivost Optimální šířka jádra (Scott - kniha) Optimální je tzv. Epanechnikovo jádro Vyšší citlivost na nesprávně zvolenou šířku

Shrnutí Histogram je vhodný pro prvotní náhled Pokud je to možné použijeme parametrické metody (vyšší řád konvergence) Pro velké soubory dat (řádově >104) použít raději jádrové odhady Šířky binů/jádra ovlivní přesnost - záleží na nich Problémy ve více dimenzích

Software Matlab Histogram (fce hist) - není implementováno žádné pravidlo pro počet binů Jádrové odhady (ksdensity) - pravidla pro šířku jádra - pouze to nejjednodušší R - všechny zmiňovaná pravidla: hist(x,breaks="volba_pravidla"), resp. plot(density(x,kernel="tvar_jádra", breaks="volby_pravidla"))

Další využití Klasifikace Statistické zpracování výsledků Segmentace...

Časosběrné snímky Pro každý pixel směrodatná odchylka okolí pixelu, průměrováno přes čas (či obráceně) Rozdělení hodnot - superpozice dvou gausovek

Časosběrné snímky Pro každý pixel směrodatná odchylka okolí pixelu, průměrováno přes čas (či obráceně) Rozdělení hodnot - superpozice dvou gausovek

Výsledky Matlab - statistický toolbox "Gaussian mixture" Viditelné jpg artefakty Úspěšnost srovnatelná s nejlepší volbou prahu

Intermezzo Strategie vědeckého poznání, filozofie vědy Jak psát články, pracovat se zdroji, komunikovat s recenzenty

Bootstrap Simulační statistická metoda Efron (1979) - první článek Jak recyklovat data tak, abych je mohl považovat za data nová (nezávislá na původních) Vhodné, pokud je získání dalších dat příliš drahé, náročné či nemožné

Princip Na základě dat {xi} chci získat rozdělení statistiky s

Princip Na základě dat {xi} chci získat rozdělení statistiky s Provedu náhodný výběr s vracením z {xi} a spočtu statistiku na těchto datech

Princip Na základě dat {xi} chci získat rozdělení statistiky s Provedu náhodný výběr s vracením z {xi} a spočtu statistiku na těchto datech Opakuji dostatečně-krát

Příklad Statistický výzkum mezi lidmi (známky ve škole)

Příklad Statistický výzkum mezi lidmi (známky ve škole) Zpracování pomocí metody hlavních komponent

Příklad Statistický výzkum mezi lidmi (známky ve škole) Zpracování pomocí metody hlavních komponent Získám výsledky - jaká je ale jejich přesnost?

Příklad Statistický výzkum mezi lidmi (známky ve škole) Zpracování pomocí metody hlavních komponent Získám výsledky - jaká je ale jejich přesnost? Vytvořím si z původního souboru dat několik bootstrapový výběrů a na nich znova provedu analýzu hlavních komponent

Příklad Statistický výzkum mezi lidmi (známky ve škole) Zpracování pomocí metody hlavních komponent Získám výsledky - jaká je ale jejich přesnost? Vytvořím si z původního souboru dat několik bootstrapový výběrů a na nich znova provedu analýzu hlavních komponent Z rozdělení bootstrapových odhadů spočítám směrodatnou odchylku pro vlastní čísla a vektory (a cokoli dalšího, co mě zajímá)

Kolikrát opakovat? Podle toho, co chci získat

Kolikrát opakovat? Podle toho, co chci získat Pokud chci odhadovat momenty rozdělení (směrodatná odchylka, šikmost,...), stačí 200600 opakování (podle některých zdrojů jen 50200)

Kolikrát opakovat? Podle toho, co chci získat Pokud chci odhadovat momenty rozdělení (směrodatná odchylka, šikmost,...), stačí 200600 opakování (podle některých zdrojů jen 50200) Pokud chci získat distribuční funkci dané statistiky (např. abych pak z ní získal konfidenční interval), potřebuju řádově 1000 a více opakování

Kolikrát opakovat? Podle toho, co chci získat Pokud chci odhadovat momenty rozdělení (směrodatná odchylka, šikmost,...), stačí 200600 opakování (podle některých zdrojů jen 50200) Pokud chci získat distribuční funkci dané statistiky (např. abych pak z ní získal konfidenční interval), potřebuju řádově 1000 a více opakování Existují metody, jak snížit počet opakování

Kde nepoužívat? Když vím, že odhadovaná statistika je divoká Není vhodné pro odhady extrémů Pokud jsou data v původním souboru navzájem závislá, musíme modifikovat Můžeme používat i pokud máme odlehlé hodnoty, výsledky na to nejsou příliš citlivé

Literatura Efron, Tibshirani - An introduction to bootstrap Prášková (ROBUST 2004) - Metoda bootstrap Davison, Hinkley - Bootstrap Methods and Their Application

Intermezzo Kurz: Úvod do programování v Matlabu Doktorandští studenti numeriky www.papez.org/matlab 13. - 17. února od 9 do 13h přihlásit se do 5. února

Regrese vs. klasifikace - shrnutí Je možné provádět klasifikaci pomocí logistické regrese - model pro učení Získáme pravděpodobnosti

Logistická regrese Není to matematicky ekvivalentní se SVM minimalizujeme různé veličiny Výsledky můžou být srovnatelně dobré

Transformace souřadnic U regrese jsou užitečné triky, které se dají použít v klasifikaci - transformace souřadnic

Data z tunelovacího mikroskopu Poissonovský proces velikost šumu závisí na intezitě signálu Škálujeme pomocí log

Děkuji za pozornost Diskuze