Bayesovská klasifikace digitálních obrazů

Podobné dokumenty
TECHNOLOGIE FUZZY-BAYESOVSKÉ KLASIFIKACE RASTROVÝCH OBRAZŮ

Bayesovská klasifikace rastrových obrazů pomocí webové aplikace

Euklidovský prostor Stručnější verze

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

9. Úvod do teorie PDR

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Osvětlování a stínování

Pro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:

2. RBF neuronové sítě

Regresní a korelační analýza

Ten objekt (veličina), který se může svobodně měnit se nazývá nezávislý.

Svobodná chebská škola, základní škola a gymnázium s.r.o. procvičení a zapamatování počítání a měření úhlů

6. T e s t o v á n í h y p o t é z

LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Několik poznámek na téma lineární algebry pro studenty fyzikální chemie

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 12

kde je dostupný ve formě vhodné pro tisk i ve formě vhodné pro prohlížení na obrazovce a z adresy

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Optimalizace trasy při revizích elektrospotřebičů

Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012

AVDAT Mnohorozměrné metody, metody klasifikace

(n, m) (n, p) (p, m) (n, m)

11. Geometrická optika

2 Spojité modely rozhodování

JčU - Cvičení z matematiky pro zemědělské obory (doc. RNDr. Nýdl, CSc & spol.) Minitest MT1

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

Počítačové vidění vs. digitální zpracování obrazu Digitální obraz a jeho vlastnosti

Získávání znalostí z dat

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Statistické vyhodnocování experimentálních dat. Mgr. Martin Čada, Ph.D.

Informační systémy pro podporu rozhodování

Jak pracovat s absolutními hodnotami

Studentská tvůrčí činnost. O letu volejbalového míče při podání

ELEKTRICKÉ SVĚTLO 1 Řešené příklady

Přednáška 5. Výběrová šetření, Exploratorní analýza

Matematická statistika

1 Funkce dvou a tří proměnných

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu

Algoritmy a struktury neuropočítačů ASN P3

1. Úvod do studia statistiky Významy pojmu statistika

Tématické celky { kontrolní otázky.

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

Světlo v multimódových optických vláknech

y n+1 = g(x n, y n ),

Usuzování za neurčitosti

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

Petr Chvosta. vlevo, bude pravděpodobnost toho, že se tyč na počátku intervalu τ B nachází nad vpravo

Západočeská univerzita v Plzni. Fakulta aplikovaných věd Katedra matematiky. Geometrie pro FST 1. Pomocný učební text

Odhad ve fyzice a v životě

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

Jazyk matematiky Matematická logika Množinové operace Zobrazení Rozšířená číslená osa

1 Úvod do kompilátorů

3. Matice a determinanty

Zpracování a vyhodnocování analytických dat

Katedra kybernetiky, FEL, ČVUT v Praze.

Vyplňování souvislé oblasti

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

CVIČENÍ č. 3 STATIKA TEKUTIN

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

1.3. Cíle vzdělávání v oblasti citů, postojů, hodnot a preferencí

PŘEDNÁŠKA KURZU MPOV

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky

Tlumené kmitání tělesa zavěšeného na pružině

FAKULTA STAVEBNÍ MATEMATIKA II MODUL 2 STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

Vzorové úlohy pro výuku hromadného zpracování dat v tabulkovém procesoru

1. Je dána funkce f(x, y) a g(x, y, z). Vypište symbolicky všechny 1., 2. a 3. parciální derivace funkce f a funkce g.

9.1 Definice a rovnice kuželoseček

ELEKTRICKÉ SVĚTLO 1 Řešené příklady

Biostatistika a matematické metody epidemiologie- stručné studijní texty

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

Stavový model a Kalmanův filtr

Funkce zadané implicitně

Zlatý řez nejen v matematice

Testování a spolehlivost. 6. Laboratoř Ostatní spolehlivostní modely

Katedra informatiky, Univerzita Palackého v Olomouci. 27. listopadu 2013

MINISTERSTVO VNITRA ČR

Regulární matice. Věnujeme dále pozornost zejména čtvercovým maticím.

MATEMATIKA IV - PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE - ZÁPISKY Z. Obsah. 1. Parciální diferenciální rovnice obecně. 2. Kvaazilineární rovnice prvního řádu

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ. Matematika 3. RNDr. Břetislav Fajmon, PhD. Autoři textu:

Měření kinematické a dynamické viskozity kapalin

Geometrické transformace

Vybraná témata z mobilní robotiky

Geometrie pro FST 2. Plzeň, 28. srpna 2013, verze 6.0

Základy matematiky kombinované studium /06

Návrh nelineárního systému odhadu v úlohách filtrace, predikce a vyhlazování

Program pro zobrazení černobílých snímků v nepravých barvách

Laboratorní práce č. 1: Určení výtokové rychlosti kapaliny

Úvodem Dříve les než stromy 3 Operace s maticemi

ZPRACOVÁNÍ DAT DÁLKOVÉHO PRŮZKUMU

Metamorfóza obrázků Josef Pelikán CGG MFF UK Praha

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly

Určování výměr Srážka mapového listu Výpočet objemů Dělení pozemků

7. Rozdělení pravděpodobnosti ve statistice

Neparametrické odhady hustoty pravděpodobnosti

PRINCIPY PRO PŘÍPRAVU NÁRODNÍCH PRIORIT VÝZKUMU, EXPERIMENTÁLNÍHO VÝVOJE A INOVACÍ

Kreslení elipsy Andrej Podzimek 22. prosince 2005

Transkript:

Výzkumný ústav geodetický, topografický a kartografický Bayesovská klasifikace digitálních obrazů Výzkumná zpráva č. 1168/2010 Lubomír Soukup prosinec 2010

1 Úvod V průběhu nedlouhého historického vývoje počítačového zpracování digitálních obrazů bylo navrženo ohromné množství nejrůzněnjších metod řešení problému klasifikace. V zásadě je možno rozdělit je do dvou hlavních skupin na deterministické a statistické. Dalším hlediskem dělení klasifikačních metod jsou praktické předpoklady řešení problému klasifikace. Pokud jsou k dispozici údaje o charakteristikách jednotlivých tříd, jde o tzv. řízenou klasifikaci (nebo též klasifikaci s učitelem), pokud předběžné údaje o třídách nejsou předem známy, jde o neřízenou klasifikaci (nebo též klasifikaci bez učitele). Neřízená klasifikace bývá někdy označována jako shluková analýza. V současné době mají velký význam především statistické metody řízené klasifikace (viz [2], [1]). Při řízené klasifikaci je nutné předem znát charakteristiky jednotlivých tříd. Nejobvyklejším způsobem obstarání předběžných údajů o charakteristikách tříd je vymezení tzv. trénovacích množin. Trénovací množina je oblast v obraze, která obsahuje reprezentativní vzorek obrazových dat, který výstižně charakterizuje určitou třídu. Cílem klasifikace je pak nalezení dalších oblastí v obraze s podobným rozložením barev jako v trénovací množině. Jde vlastně o obdobu interpolace. Interpolační funkcí je zde po částech konstantní funkce s hodnotami odpovídajícími jednotlivým třídám. Roli interpolačních bodů hrají trénovací množiny. Statistické metody řízené klasifikace jsou založeny na geometrické představě tzv. příznakového prostoru. Příznakový prostor je Euklidovský prostor, který slouží k rozlišení jednotlivých tříd. Souřadnice bodů příznakového prostoru představují veličiny (tzv. příznaky), přiřazené každému pixelu v digitálním obraze. Typickým příkladem příznaků jsou barevné složky R, G, B. Každý pixel digitálního obrazu se v příznakovém prostoru zobrazí jako bod o souřadnicích odpovídajících hodnotám jeho příznaků. Takovéto body vytvoří v příznakovém prostoru shluky odpovídající jednotlivým třídám. Některé body těchto shluků odpovídají příznakům pixelů trénovacích množin. Tyto body je možné označit návěštím příslušné třídy, neboť u pixelů trénovacích množin je vždy známo, do které třídy náleží. Pomocí takto označených bodů trénovacích množin je třeba označit i ostatní body v příznakovém prostoru. Úlohu klasifikace je tedy možno formulovat jako stanovení určitého pravidla, pomocí něhož se toto označování má provádět. Toto pravidlo, tzv. klasifikátor, lze hledat mnoha různými způsoby. Mezi nejpoužívanější klasifikátory patří např. lineární klasifikátor nebo bayesovský klasifikátor. Lineární klasifikátor odděluje výrazné shluky rovinami tak, aby tyto roviny rozložily příznakový prostor na buňky obsahující body vždy jen jedné třídy. Oddělující roviny jsou přitom umístěny tak, aby středy buňek byly co nejblíže ke středům shluků, kde je rozložení bodů nejhustší. Bayesovský klasifikátor je založen výhradně na pravděpodobnostním přístupu. Ve své nejjednodušší verzi nepotřebuje žádnou geometrickou pomůcku jako např. lineární klasifikátor. Účelem tohoto pojednání je připravit teoretické východisko pro další rozvíjení bayesovské klasifikace digitálních obrazů, zejména s ohledem na neurčitost přiřazení tříd jednotlivým pixelům. 2

2 Formulace problému V digitálním obraze je třeba vymezit oblasti, které jsou něčím charakteristické. Charakteristické vlastnosti určité oblasti (stručněji charakteristika oblasti) jsou dány nějakým dobře rozpoznatelným atributem, např. barvou. Charakteristika oblasti v obraze bývá obvykle spolehlivě rozpoznatelná pohledem. Všechny takovéto oblasti je tak možno rozčlenit (klasifikovat) do několika tříd tak, že všechny oblasti jedné a téže třídy mají stejnou charakteristiku. Cílem klasifikace je ke každému pixelu v daném digitálním obraze jednoznačně přiřadit určitou třídu s odpovídající charakteristikou. 2.1 Požadovaný výsledek Výsledkem klasifikace daného digitálního obrazu je nový digitální obraz, v němž jsou barevně vyznačeny homogenní oblasti příslušné stanoveným třídám. Přiřazení barev jednotlivým třídám je znázorněno legendou. 2.2 Vstupní údaje a předpoklady Je dán digitální obraz, na němž jsou vymezeny některé oblasti s určitými charakteristickými vlastnostmi, tzv. trénovací množiny. Podle rozdílných charakteristických vlastností je zvolen určitý počet tříd. Soubor všech zvolených tříd označíme C. U každé trénovací množiny je známo, do které třídy náleží. Ke každé třídě musí být vymezena alespoň jedna trénovací množina. Dále je nutno znát tzv. apriorní pravděpodobnosti P (C), které vyjadřují předběžnou obecnou znalost frekvence výskytu třídy C C v daném obraze. 3 Řešení problému Problém klasifikace je v tomto pojednání řešen výhradně bayesovským klasifikátorem. Bayesovský klasifikátor se opírá o tzv. Bayesův vzorec (viz [2]). Tento vzorec umožňuje vypočítat pravděpodobnost, že určitý pixel s příznakem F náleží do třídy C. Označíme ji P (C F). Pomocí trénovacích množin lze odhadnout opačné pravděpodobnosti P ( F C) pro každý příznak F a každou třídu C C. Výraz P ( F C) udává pravděpodobnost, že pixel třídy C bude mít příznak F. Za těchto předpokladů a při známých apriorních pravděpodobnostech P (C) má Bayesův vzorec tvar: P (C F) = P ( F C) P (C) P ( F T ) P (T ) T C Posledním krokem klasifikace je přiřazení třídy C pixelu s příznakem F tak, aby bylo splněno vhodné extremální kritérium pro jednoznačný výběr třídy. Nejjednodušším takovým kritériem je maximalizace aposteriorní pravděpodobnosti P (C F). 3 (1)

3.1 Příznakový prostor Před vlastním použitím Bayesova vzorce (1) je třeba stanovit charakteristické vlastnosti zvolených tříd tak, aby bylo možno jednotlivé třídy od sebe dobře odlišit. K rozlišení tříd slouží příznaky, které jsou přiřazeny jednotlivým pixelům obrazu. Nejjednodušším příkladem příznaků barevného obrazu jsou barevné složky R, G, B. Může to však být i jiná reprezentace barev (např. Hue, Saturation, Brightness) nebo odrazivost pixelu v různých spektrálních pásmech, např. infračerveném, ultrafialovém, radarovém apod. Daný soubor příznaků lze interpretovat jako souřadnice bodu v příznakovém prostoru. To znamená, že za příznaky lze volit i jakoukoliv transformaci souřadnic původního příznakového prostoru. V tomto pojednání se nebudeme zabývat volbou příznaků. Budeme předpokládat, že je dán soubor příznaků jako vektor F = [F 1, F 2,..., F n ], kde n je dimenze příznakového prostoru. Po vhodné volbě příznakového prostoru lze ke každému pixelu daného obrazu přiřadit určitou hodnotu vektoru příznaků F. Označíme ji f(x, y), přičemž x, y jsou celočíselné indexy udávající polohu pixelu v daném obraze. Tím je na daném obraze definována vektorová funkce f : H F : [x, y] f(x, y). Množina H N 2 definuje souřadnicový systém daného digitálního obrazu. Složkami vektorové funkce f(x, y) jsou jednotlivé příznaky f i (x, y) pixelu [x, y]. Tedy f i : H F, i {1, 2,..., n}, f = [f 1, f 2,..., f n ]. K pixelu o souřadnicích [x, y] též přiřadíme třídu, ke které náleží, pomocí funkce γ : H C. (2) Hodnoty této funkce jsou známy pouze pro pixely trénovacích množin. Pixely v trénovací množiné příslušné třídě C tvoří oblast K C {[x, y] H γ(x, y) = C}. Body příznakového prostoru obvykle vytváří v příznakovém prostoru shluky odpovídající jednotlivým třídám. Příslušnost nějakého pixelu k určité třídě lze pak stanovit podle polohy onoho pixelu vůči shluku pixelů té určité třídy. Pravděpodobnost náležení nějakého pixelu k určité třídě závisí na hustotě té části shluku, ve které se onen pixel vyskytuje. Charakteristika třídy C C je tedy dána rozdělením pravděpodobnosti příznaků jejích pixelů v příznakovém prostoru. 4

3.2 Odhad rozdělení pravděpodobnosti shluků Rozdělení pravděpodobnosti shluku příslušného k určité třídě lze odhadnout pomocí příznaků některých vybraných pixelů té třídy. Tyto pixely byly vybrány prostřednictvím trénovacích množin. Odhadovat rozdělení pravděpodobnosti shluků je možno v zásadě dvěma způsoby: podle relativních četností pixelů v trénovací množině, podle vzdáleností pixelů od shluku v příznakovém prostoru. 3.2.1 Metoda relativních četností Pravděpodobnost, že se v třídě C vyskytne pixel s příznaky F, odhadneme pomocí relativní četnosti {[x, y] K C } f(x, y) = F} K C Pro libovolný pixel [ x, ȳ] z trénovací množiny K C proto platí: P ( F C) = P (f( x, ȳ) = F γ( x, ȳ) C) = {[x, y] K C} f(x, y) = F} K C (3) 3.2.2 Metoda vzdáleností Tato metoda je založena na předpokladu, že shluky mají n-rozměrná normální rozdělení pravděpodobnosti. Za tohoto předpokladu je možné zvětšit trénovací množiny jednotlivých tříd přidáním pixelů, u nichž není příslušnost k některé třídě naprosto jistá. Hustotu pravděpodobnosti n-rozměrného normálního rozdělení lze vyjádřit ve tvaru: ϕ uc,m C ( u ) := 1 ( 1 2 π) n M C e 2 (u u C) T M 1 C (u uc). (4) Vektor středních hodnot u C a kovarianční matici M C příslušnou k třídě C odhadneme podle vztahů: u C = [x,y] K C f(x, y) K C, (5) M C = T (f(x, y) u C )(f(x, y) u C ). (6) [x,y] K C K C 1 Vektory u, u C, f(x, y) jsou sloupcové. Pixely [ x, ȳ], jejichž příznaky f( x, ȳ) jsou dostatečně blízko středu u C shluku příslušného trénovací množině K C, lze s jistým rizikem r považovat za pixely třídy C. Skutečnost, že příznakový vektor f( x, ȳ) je blízko středu shluku u C, budeme prozatím zapisovat 5

f( x, ȳ) u C (7) Pixely [ x, ȳ] s vlastností (7) tedy mohou doplnit původní trénovací množinu K C na novou, rozšířenou trénovací množinu K C,r. K C,r := K C {[x, y] H P (γ(x, y) C f(x, y) u C ) > 1 r)} (8) Tato rozšířená trénovací množina poskytuje reprezentativnější výběr pixelů, ovšem za cenu rizika r, že některé její pixely nepatří do třídy C. Pokud je toto riziko pod únosnou hranicí (např. menší než 0.05), je možné rozšířenou trénovací množinu K C,r dosadit do vzorce (3) za K C a získat tak lepší odhad pravděpodobnosti P (f( x, ȳ) = F γ( x, ȳ) C). Kritérium blízkosti pixelu od středu shluku Blízkost dvou bodů příznakového prostoru předběžně vyjádřená relací (7) je nyní třeba přesněji definovat. Vzdálenost v příznakovém prostoru nebudeme měřit Euklidovskou metrikou, ale pomocí jiné, tzv. Mahalanobisovy vzdálenosti ρ MC. ρ MC (u, u C ) = (u u C ) T M 1 C (u u C ). Geometrický význam metriky ρ MC je následující: Všechny body u příznakového prostoru, pro které je vzdálenost ρ MC (u, u C ) konstantní, vytvoří elipsoidickou plochu. Konstanta ρ MC (u, u C ) představuje násobnou konstantu, kterou je třeba vynásobit poloosy středního elipsoidu příslušného kovarianční matici M C (tj. elipsoidu, jehož poloosy jsou rovny odmocninám vlastních čísel matice M C ), aby vznikla zmíněná elipsoidická plocha procházející bodem u. u u C ρ MC (u, u C ) < t. (9) Parametr t udává míru blízkosti bodů u, u C. t R, t > 0 Menší hodnota parametru t znamená větší blízkost. Oblast blízkosti od středu shluku je tedy vymezena elipsoidem, který je t-krát větší než střední elipsoid daný kovarianční matici M C. Definice (9) umožní naharadit výraz f(x, y) u C v (8). Pravděpodobnost, že pixel [ x, ȳ] náhodně zvolený v blízkosti středu shluku u C náleží k třídě C, budeme tedy označovat P (γ(x, y) C ρ MC (u, u C ) < t). Tuto pravděpodobnost lze určit pomocí Bayesova vzorce P (γ(x, y) C ρ MC (u, u C ) < t) = = P ( ρ M C (u, u C ) < t γ(x, y) C ) P ( γ(x, y) C ) P ( ρ MC (u, u C ) < t). (10) 6

Pro vhodně zvolenou hodnotu parametru t se pravděpodobnost P ( ρ MC (u, u C ) < t) odhadne pomocí relativní četnosti. P ( ρ MC (u, u C ) < t ) = {[x, y] H ρ M C (u, u C ) < t} H Pravděpodobnost blízkosti barvy u od středu shluku u C se pro třírozměrný příznakový prostor určí ze vztahu:. kde P ( ρ MC (u, u C ) < t γ(x, y) C ) = erf ( ) t 2 t 2 2 π e 2 t, t... násobek středního elipsoidu, erf... funkce chyb (error function), erf(x) = 2 e x2 2 i x 2i+1 π (2i + 1)!!. Pro zvolené riziko r lze určit vzdálenost t řešením rovnice 1 r = P (γ(x, y) C ρ MC (u, u C ) < t). (11) i=0 4 Závěr Bayesovská klasifikace je zde představena jako univerzální nástroj pro klasifikaci digitálních obrazů. Kromě základní metody relativních četností byla navržena metoda vzdáleností, která tradičně nebývá používána v kontextu bayesovské klasifikace. Její bayesovská modifikace umožňuje korektně kvantifikovat kvalitu výsledné klasifikace i bez znalosti skutečného stavu (tzv. ground truth). Toho lze využít ke zobecnění problému klasifikace, při němž není cílem pouze jednoznačné přiřazení tříd pixelům v obraze, ale vymezení oblastí, v nichž je příslušnost k třídě neurčitá ve smyslu teorie fuzzy množin. Použitá literatura [1] D. G. T. Denison, C. C. Holmes, B. K. Mallick, and A. F. M. Smith. Bayesian Methods for Nonlinear Classification and Regression. Willey series in probability and statistics. John Willey & Sons, 2002. [2] Andrew Webb. Statistical Pattern Recognition. John Willey & Sons, 2003. 7