LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015



Podobné dokumenty
Roman Juránek. Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 30

2. RBF neuronové sítě

Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 39

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

FSI analýza brzdového kotouče tramvaje

Zpracování digitalizovaného obrazu (ZDO) - Segmentace

Histogram a jeho zpracování

Histogram a jeho zpracování

Elektrická impedanční tomografie

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II

ČSN EN ed. 2 OPRAVA 1

Programovací stanice itnc 530

Bayesovská klasifikace digitálních obrazů

Circular Harmonics. Tomáš Zámečník

6 NÁVRH A EXPERIMENTÁLNÍ OVĚŘENÍ ELEKTROMAGNETICKÉHO AKTUÁTORU. František MACH

Pro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:

Vodoznačení video obsahu

SYLABUS PŘEDNÁŠKY 6a Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčovací sítě) 4. ročník bakalářského studia studijní program G studijní obor G

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Detekce obličeje v obraze s využitím prostředí MATLAB

INFORMACE NRL č. 12/2002 Magnetická pole v okolí vodičů protékaných elektrickým proudem s frekvencí 50 Hz. I. Úvod

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Makroskopická obrazová analýza pomocí digitální kamery

Neuropočítače. podnět. vnímání (senzory)

Euklidovský prostor Stručnější verze

Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 53

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 12

PARAMETRICKÉ PROGRAMOVÁNÍ SOUČÁSTI V ŘÍDICÍM SYSTÉMU HEIDENHAIN SVOČ FST 2015

Cyklické změny v dynamice sluneční konvektivní zóny

Kapka kapaliny na hladině kapaliny

Technická mechanika - Statika

2 MECHANICKÉ VLASTNOSTI SKLA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Analýza a zpracování digitálního obrazu

ÚVOD DO PROBLEMATIKY PIV

MODELOVÁNÍ MAGNETICKÝCH LOŽISEK

Druhy masek 1 tvary ohraničené vyhlazené bez stínování

Základy zpracování obrazů

D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

SBÍRKA ZÁKONŮ. Ročník 2008 ČESKÁ REPUBLIKA. Částka 51 Rozeslána dne 15. května 2008 Cena Kč 80, O B S A H :

Příloha P.1 Mapa větrných oblastí

Mikroskopická obrazová analýza

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Text úlohy. Kolik je automaticky generovaných barev ve standardní paletě 3-3-2?

Únosnosti stanovené níže jsou uvedeny na samostatné stránce pro každý profil.

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

Matematické symboly a značky

DUM 14 téma: Barevné korekce fotografie

FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ PRO AKADEMICKÝ ROK

Program pro zobrazení černobílých snímků v nepravých barvách

ŠROUBOVÝ A PROSTOROVÝ POHYB ROTAČNĚ SYMETRICKÉHO TĚLESA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

3. Restrukturalizace nebo manipulace s údaji - práce s rastrovými daty

Úvod do mobilní robotiky AIL028

Obr.94. Tečná reakce T r musí být menší nebo rovna třecí síle F t

Osvětlování a stínování

9 Impedanční přizpůsobení

Studentská tvůrčí a odborná činnost STOČ 2015

Elektrické vlastnosti pevných látek

Výpočtová studie 2D modelu stroje - Frotor

Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012

Obsah. Kapitola 1 Stažení a instalace Kapitola 2 Orientace v programu a základní nastavení Úvod... 9

f(x) = 9x3 5 x 2. f(x) = xe x2 f(x) = ln(x2 ) f(x) =

9. Číslicové osciloskopy. 10. Metodika práce s osciloskopem

Rotační skořepiny, tlakové nádoby, trubky. i Výpočet bez chyb. ii Informace o o projektu?

Laserový skenovací systém LORS vývoj a testování přesnosti

K 9 MANIPULAČNÍ ZAŘÍZENÍ PRO HUTNÍ PRŮMYSL

10.1 Úvod Návrhové hodnoty vlastností materiálu. 10 Dřevo a jeho chování při požáru. Petr Kuklík

R-5602 DYNBAL_V1 - SOFTWARE PRO VYHODNOCENÍ DYNAMICKÉ NEVÝVAHY V JEDNÉ ROVINĚ ING. JAN CAGÁŇ ING. JINDŘICH ROSA

3 Elektromagnetické vlny ve vakuu

APLIKACE NÁSTROJŮ KVALITY VE SPOLEČNOSTI METEOSERVIS V.O.S. SVOČ FST 2011

Západočeská univerzita v Plzni Fakulta aplikovaných věd KKY/LS2. Plzeň, 2008 Pavel Jedlička

Úloha č. 8 Vlastnosti optických vláken a optické senzory

Minkowského operace a jejich aplikace

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

Výběrová kritéria pro hodnocení IPRM

MRAR-L. Družicové navigační systémy. Č. úlohy 4 ZADÁNÍ ROZBOR

4.1 Shrnutí základních poznatků

Operace s obrazem I. Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.

VE 2D A 3D. Radek Výrut. Abstrakt Tento článek obsahuje postupy pro výpočet Minkowského sumy dvou množin v rovině a pro výpočet Minkowského sumy

PRAKTIKUM... Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Odevzdal dne: Seznam použité literatury 0 1. Celkem max.

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Systémy digitálního vodotisku. Digital Watermarking Systems

ELEKTŘINA A MAGNETIZMUS

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ STUDIJNÍ PROGRAM GEODÉZIE A KARTOGRAFIE STUDIJNÍ OBOR GEODÉZIE, KARTOGRAFIE A GEOINFORMATIKA

DUM 15 téma: Filtry v prostředí Gimp

Popis objektů. Karel Horák. Rozvrh přednášky:

Základy podmíněné matematické optimalizace

3D SIMULACE PĚCHOVÁNÍ A PRODLUŽOVÁNÍ KOVÁŘSKÉHO INGOTU I 45

Mechatronické systémy s krokovými motory

Fyzikální praktikum 1

3. D/A a A/D převodníky

ELEKTRICKÉ SVĚTLO 1 Řešené příklady

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

3D CFD simulace proudění v turbinovém stupni

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky

Měření povrchového napětí kapaliny metodou maximální kapky

I. STEJNOSMĚ RNÉ OBVODY

Transkript:

LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015

1 LBP 1 LBP Tato metoda, publikovaná roku 1996, byla vyvinuta za účelem sestrojení jednoduchého a výpočetně rychlého nástroje pro klasifikaci textur v obraze. Textury představují oblast obrazu se specifickým vnitřním uspořádáním (např. rozložení jasů), které umožňuje opakovanou detekci dané oblasti. Podobně jako v předchozích případech, je pro texturní oblasti nutné zvolit takový popis, který je odolný vůči jasovým transformacím (změna úrovně jasu a kontrastu) a rotaci obrazu. V případě metody LBP (z ang. Local Binary Patterns) je textura charakterizována binárním řetězcem. POPIS TEXTURY Popis textury se provádí v blízkém okolí jednotlivých pixelů vstupního obrazu. Na základě experimentů byla pro okolí zvolena kruhová reprezentace a tak se výsledný popis vztahuje vždy k bodu ležícímu ve středu okolí. Textura T v lokálním okolí bodu je definována jako: T = t (g c, g 0,..., g P 1 ), (1) kde g c je hodnota pixelu ve středu lokálního okolí a g p (p = 0,..., P 1) jsou hodnoty P (P > 1) pixelů symetricky rozmístěných na kružnici o poloměru R(R > 0) se středem ve zkoumaném bodě. Souřadnice středu g c je (0, 0) a souřadnice okolních bodů g p jsou dány předpisem (( R sin (2πp/P ), R cos (2πp/P ))). Na Obr. 1 jsou zobrazena lokální okolí, která jsou metodou LBP nejčastěji využívána k získání popisu textury. Hodnota bodů neležících v přesném středu okolních pixelů je stanovena pomocí interpolace. Obrázek 1: Lokální okolí využívaná metodou LBP, g c - modrá barva, g p - červená barva. Poslední úpravy: 29. října 2015 1

1 LBP INVARIANCE VŮČI JASOVÝM TRANSFORMACÍM Znakem dobrého deskriptoru je jeho odolnost vůči jasovým změnám obrazu. Metoda LBP této nezávislosti dosahuje v několika krocích. Nejprve je hodnota g c odečtena od všech hodnot g p ve svém okolí, čímž nedochází ke ztrátě informace a textura je pak definována následovně: T = t (g c, g 0 g c,..., g P 1 g c ). (2) Za předpokladu, že rozdíl g p g c je nezávislý na hodnotě g c, lze předpis faktorizovat na tvar: T t (g c ) (g 0 g c,..., g P 1 g c ). (3) Nezávislost ovšem nemůže být vždy zaručena, z tohoto důvodu je tvar předpisu po faktorizaci pouhou aproximací spojité distribuce jasů v okolí zkoumaného bodu. Přesto je použití této aproximace vhodné, jelikož změna úrovně jasu či kontrastu má vliv na obraz jako celek. Projev těchto transformací v lokálním okolí bodu je zanedbatelný. LBP proto distribuci jasů 2 v okolí bodu nahrazuje distribucí rozdílů: T t (g 0 g c,..., g P 1 g c ). (4) Tento předpis popisuje textury v okolí jednotlivých bodů vstupního obrazu. Každému bodu je přiřazen P -dimenzionální vektor, jehož prvky odpovídají hodnotě g p g c. Pro konstantní oblasti zůstává rozdíl nulový, zatím co pro hrany dochází k nárůstu hodnot ve směru jejich gradientu a v případě osamocených bodů narůstá hodnota rozdílu ve všech směrech. Jelikož znaménko rozdílu g p g c není ovlivněno jasovými změnami obrazu, odpadá nutnost uchovávání této hodnoty pro popis textury. Proto se tzv. vzor textury metody LBP skládá pouze z binárních hodnot reprezentujících znaménko jednotlivých rozdílů g p g c : T t (s (g 0 g c ),..., s (g P 1 g c )), (5) kde s (x) { 1 pro x 0, s (x) = 0 pro x < 0. Jinými slovy, binární vzor textury je tvořen hodnotami 0 a 1, které jsou získány jako výsledek prahování jasových hodnot pixelů v lokálním okolí s prahem odpovídajícím jasové hodnotě středového pixelu (viz Obr. 2). Každé znaménko vzoru je váženo koeficientem 2 p a jednotlivé prvky vzoru jsou následně sečteny. Tím vznikne tzv. LBP P,R operátor charakterizující prostorové uspořádání textury. (6) LBP P,R = P 1 p=0 s (g p g c ) 2 p, (7) kde R značí poloměr kružnice se středem ve zkoumaném bodě, na které je rovnoměrně rozmístěno P okolních pixelů. Poslední úpravy: 29. října 2015 2

1 LBP Obrázek 2: Textura v lokálním okolí zkoumaného bodu a její binární vzor. INVARIANCE VŮČI ROTACI Jak bylo popsáno výše, binární vzor textury je tvořen P hodnotami, přičemž P závisí na zvolené velikosti lokálního okolí. Během rotace obrazu se jasové hodnoty g p pohybují ve směru otáčení po kružnici definující lokální okolí, zatímco jasová hodnota středového bodu g c zůstává neměnná. Metoda LBP své nezávislosti na rotaci dosahuje jednoduše tak, že ze všech možných natočení binárního vzoru textury vybírá takový, jenž je tvořen nejmenším binárním číslem: LBP ri P,R = min{rot (LBP P,R, i) i = 0, 1,..., P 1}, (8) kde ROT (x, i) značí i-tou iteraci bitového posunu binárního čísla x doprava. Aplikací této operace na lokální okolí zkoumaného bodu v obraze dochází k postupnému otáčení bodů okolí po kružnici ve směru hodinových ručiček (viz Obr. 3). Obrázek 3: Princip konstrukce binárního vzoru invariantního vůči rotaci; body lokálního okolí nesoucí binární hodnotu 1 jsou vyznačeny bíle, body s hodnotou 0 naopak černě. Z takto zkonstruovaného binárního vzoru je následně podle vzorce 7 vypočten operátor LBP ri P,R definující texturu v okolí bodu, který je nyní nezávislý na rotaci. UNIFORMNÍ BINÁRNÍ VZORY Z důvodu zvýšení robustnosti LBP metody se výsledný deskriptor neskládá ze všech nalezených binárních vzorů v obraze. Množina vzorů je před dalším zpracováním zredukována pouze na vzory uniformní, které během testování prokázaly největší stabilitu. Uniformní vzory jsou zobrazeny na Obr. 4 a ve své podstatě představují šablonu pro detekci světlých bodů (0), hran (1 7) a tmavých bodů či konstantních ploch (8) v obraze. Poslední úpravy: 29. října 2015 3

1 LBP Obrázek 4: Uniformní vzory mající míru uniformnosti U 2. Uniformita binárního vzoru je určena tzv. mírou uniformnosti U, jejíž hodnota koresponduje s počtem přechodů 0/1 a 1/0 uvnitř binárního řetězce. Například, vzory 00000000 2 a 11111111 2 mají míru U = 0, zatímco ostatní vzory na Obr. 4 mají míru U = 2, jelikož obsahují právě dva přechody 0/1, resp. 1/0. Vzory s mírou uniformnosti o hodnotě maximálně dva jsou považovány za uniformní a LBPP,R ri operátor popisující texturu v okolí zkoumaného bodu je nahrazen LBP riu2 operátorem: LBPP,R riu2 = kde U (LBP P,R ) je definováno jako: P,R { LBP ri P,R pro U (LBP P,R ) 2, P + 1 jinak, U (LBP P,R ) = s (g P 1 g c ) s (g 0 g c ) + s (g p g c ) s (g p 1 g c ). (10) KONSTRUKCE DESKRIPTORU Finální deskriptor obrazu je v případě metody LBP sestaven tak, že se vstupní obraz rovnoměrně rozčlení na několik čtvercových podoblastí. Velikost podoblasti záleží jak na velikosti obrazu, tak i na zvolených parametrech lokálního okolí P a R. Následně jsou pro každou podoblast získány binární vzory textur v okolí všech jejích pixelů, T P,R, a je stanoven rotačně nezávislý tvar těchto vzorů, TP,R. ri Z množiny získaných vzorů jsou vybrány jen ty, které splňují podmínku uniformnosti, T riu2 P,R. Poté jsou spočteny jednotlivé operátory LBPP,R riu2. Pro každou podoblast je tak získán určitý počet operátorů LBPP,R riu2, P 1 p=1 které jsou zaneseny do histogramů podoblastí, jenž představují jednotlivé prvky výsledného LBP deskriptoru (jeden histogram LBP operátorů pro každou podoblast vstupního obrazu). (9) Poslední úpravy: 29. října 2015 4

2 HOG 2 HOG Metoda HOG (z ang. Histograms of Oriented Gradients) byla vyvinuta roku 2005 za účelem detekce lidských postav v obraze a patří do skupiny parametrických metod popisu. Vychází z myšlenky popisu objektu pomocí distribuce gradientů. V tomto směru je HOG inspirovaný metodou SIFT, jelikož i zde jsou jednotlivé gradienty reprezentovány svou velikostí a směrem. Vstupem metody HOG mohou být jak šedotónové, tak barevné obrazy, které jsou často za účelem zvýšení robustnosti nejprve normalizovány gamma korekcí. VÝPOČET GRADIENTU Výsledný deskriptor je vysoce ovlivněn procesem výpočtu gradientu. Proto byla otestována celá řada variant stanovení gradientu v obraze a překvapivě nejlepších výsledků dosahovala ta nejjednodušší z nich. Vstupní obraz byl v prvním kroku filtrován Gaussovým jádrem o různém parametru σ (včetně σ = 0) a následně na něj byly aplikovány masky pro výpočet diskrétního gradientu. 1-D masky: [ 1, 1], [ 1, 0, 1], [1, 8, 0, 8, 1]. [ ] [ ] 1 2 1 0 1 1 0 2-D masky:,, 1 0 0 1 0 0 0. 1 2 1 Výsledky testů byly vyhodnoceny a nejlepší kombinace parametru σ a filtrační masky byla zvolena pro stanovení gradientu metodou HOG. Ta tak získává gradienty pomocí konvoluce Gaussovsky filtrovaného obrazu I při σ = 0 s maskou [ 1, 0, 1], resp. [ 1, 0, 1] : kde značí konvoluci. I x = I [ 1, 0, 1], (11) I y = I [ 1, 0, 1], (12) HISTOGRAM ORIENTACÍ GRADIENTŮ Poté co jsou získány obrazy I x a I y, je pro každý pixel vypočtena velikost gradientu m (x, y) a směr gradientu Θ (x, y): m (x, y) = Ix 2 + Iy, 2 (13) ( ) Θ (x, y) = tan 1 Iy. (14) I x Následně je zkonstruován histogram orientací, jehož počet binů je určený intervalem i a počtem sektorů s. Interval i udává rozsah, ve kterém se zjišťuje směr gradientu Θ (x, y) a nejčastěji používané rozsahy jsou i = 0, π, i = 0, 2π. Číslo s definuje počet stejně velkých výsečí, na které je daný interval i rozčleněn (viz Obr. 5). Přínos vypočtených gradientů do jednotlivých binů histogramu je vážen jejich velikostmi m (x, y), a navíc bilineárně rozdělen i mezi biny sousední, což zvyšuje robustnost výsledného deskriptoru. Poslední úpravy: 29. října 2015 5

2 HOG Obrázek 5: Histogramy orientací gradientů pro různé hodnoty i a s. NORMALIZACE HISTOGRAMU Z důvodu dosažení invariance deskriptoru vůči jasovým transformacím obrazu (tj. změna jasu a změna kontrastu) jsou získané histogramy orientací normalizovány. Mezi nejčastěji využívaná normalizační schémata metody HOG patří L 1 norm, L 1 sqrt a L 2 norm, jejichž předpisy jsou: L 1 norm = L 1 sqrt = L 2 norm = v ( v 1 + e), (15) v ( v 1 + e), (16) v ( v 2 2 + e 2 ), (17) kde v je nenormalizovaný vektor, v k představuje jeho k-tou normu a e je malá konstanta. Speciálním případem je L 2 Hys, při které je vektor v nejprve normalizován pomocí L 2 norm a následně dojte k tzv. clipnutí, kdy je rozložení hodnot upraveno tak, aby poměr mezi minimem a maximem vektoru odpovídal předem zvolené hodnotě (viz Obr. 6). Obrázek 6: Ukázka clipnutí 2-D histogramu. KONSTRUKCE DESKRIPTORU Deskriptor metody HOG je získán tak, že dojde k rovnoměrnému rozdělení vstupního obrazu do čtvercových bloků o hraně k pixelů. Tyto bloky jsou následně dále rozčleněny na tzv. buňky o hraně l pixelů (l < k), pro které jsou vypočteny normované histogramy orientací gradientů. Výsledné histogramy buněk jsou zprůměrovány v jeden, který pak Poslední úpravy: 29. října 2015 6

2 HOG tvoří HOG popis bloku, po jehož získání se blok posune o zvolený počet pixelů a celý proces se opakuje. Finální HOG deskriptor je zřetězením všech popisů jednotlivých bloků uvnitř vstupního obrazu (viz Obr. 7). Obrázek 7: Princip konstrukce HOG deskriptoru (posun bloku o dvě buňky). Pokud jsou použity čtvercové bloky, je výsledný popis označován jako R-HOG deskriptor. V odborné literatuře je možné setkat se i s C-HOG deskriptory využívající členění vstupního obrazu do kruhových bloků, jejichž dvě nejčastější formy jsou zobrazeny na Obr. 8. Obrázek 8: Příklad kruhových bloků metody HOG. Poslední úpravy: 29. října 2015 7

3 ZKOUŠKA 3 Zkouška 3.1 LBP 3.1.1 Co to je? Local Binary Patterns - metoda popisu textury 3.1.2 Na co to je? Metoda kóduje lokální texturu do binárního čísla. Celá textura je pak reprezentována jako histogram, kterého analýzou můžeme porovnávat různe textury. 3.2 HoG 3.2.1 Co to je? Histogram of Oriented Gradients - metoda popisu textury 3.2.2 Na co to je? Metoda popisuje texturu z hlediska hran, které se v ní vyskytují. K popisu se používá histogram orietovaných hran. Pomocí metod porovnávání histogramů můžeme porovnávat různé textury. Když histogram reprezentujeme jako příznak, můžeme použít metody strojového učení pro jeho klasifikaci. Poslední úpravy: 29. října 2015 8

REFERENCE Reference Poslední úpravy: 29. října 2015 9