SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

Podobné dokumenty
Cvičení 11: RANSAC Tomáš Sixta 23. listopadu 2012

BRNO UNIVERSITY OF TECHNOLOGY FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA BACHELOR S THESIS AUTHOR

Roman Juránek. Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 30

REKONSTRUKCE 3D OBJEKTU Z OBRAZOVÝCH DAT

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

2 Rekonstrukce ze dvou kalibrovaných pohledů

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý

Analýza a zpracování digitálního obrazu

SLEDOVÁNÍ OBJEKTU VE VIDEOSEKVENCI

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

REKONSTRUKCE 3D SCÉNY Z OBRAZOVÝCH DAT

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Jasové transformace. Karel Horák. Rozvrh přednášky:

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

LOKALIZACE MOBILNÍHO ROBOTA V PROSTŘEDÍ LOCALISATION OF MOBILE ROBOT IN THE ENVIRONMENT

aneb jiný úhel pohledu na prvák

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Úloha - rozpoznávání číslic

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 39

transformace je posunutí plus lineární transformace má svou matici vzhledem k homogenním souřadnicím [1]

ROZ1 CVIČENÍ VI. Geometrická registrace (matching) obrazů

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

Projekt do předmětu ZPO

5. Lokální, vázané a globální extrémy

Operace s obrazem II

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Aplikace obrazové fúze pro hledání vad

Diskrétní 2D konvoluce

Minkowského operace. Použití. Světlana Tomiczková. Rozmisťování Robot Motion Planning Offset Optics. Pojmy:

Zpracování digitalizovaného obrazu (ZDO) - Analýza pohybu

Hierarchický model Josef Pelikán CGG MFF UK Praha. 1 / 16

PŘI AGILITY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ PETR PALATA BRNO UNIVERSITY OF TECHNOLOGY

Nelineární rovnice. Numerické metody 6. května FJFI ČVUT v Praze

11 Zobrazování objektů 3D grafiky

Automatické rozpoznávání dopravních značek

Problematika disertační práce a současný stav řešení. Ing. Aneta Zatočilová

Fotoaparát s historickou pamětí

Afinní transformace Stručnější verze

Diplomová práce Prostředí pro programování pohybu manipulátorů

DUM 14 téma: Barevné korekce fotografie

2010 Josef Pelikán, CGG MFF UK Praha

ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ

Geometrie pro počítačovou grafiku - PGR020

Kybernetika a umělá inteligence, cvičení 10/11

Úvod do mobilní robotiky AIL028

PROGRAM PRO VÝPOČET PROSTOROVÝCH SOUŘADNIC A TVORBU HLOUBKOVÉ MAPY

kamerou. Dle optických parametrů objektivu mohou v získaném obraze nastat geometrická

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

Matematika I (KX001) Užití derivace v geometrii, ve fyzice 3. října f (x 0 ) (x x 0) Je-li f (x 0 ) = 0, tečna: x = 3, normála: y = 0

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

SCI-FI HUDEBNÍ KNIHOVNA

Algoritmus sledování objektů pro funkční vzor sledovacího systému

7. Geometrické algoritmy (sepsal Pavel Klavík)

WhyCon: Přesný, rychlý a levný lokalizační systém

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Kalibrační proces ve 3D

Zpráva o zahraničním pobytu

Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 53

Státnice odborné č. 20

Detekce beztexturových 3D objektů Detection of Textureless 3-D Objects

Hledání hran. Václav Hlaváč. České vysoké učení technické v Praze

Vytěžování znalostí z dat

Jak funguje asymetrické šifrování?

PARCIÁLN LNÍ ROVNICE

Odhad parametrů N(µ, σ 2 )

Panoramatická fotografie

Operace s obrazem I. Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.

Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU

Výpočet sedání kruhového základu sila

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Popis objektů. Karel Horák. Rozvrh přednášky:

1 Extrémy funkcí - slovní úlohy

Hledání hran. Václav Hlaváč. České vysoké učení technické v Praze

Digitální kartografie 3

Zpracování digitalizovaného obrazu (ZDO) - Segmentace


PHOTO-ON Profesionální on-line správa fotografií

Spojitý šum v praxi. Jan Gehr

MATEMATIKA V MEDICÍNĚ

3D REKONSTRUKCE ARCHITEKTURY DAVID SEDLÁČEK

DUM 15 téma: Filtry v prostředí Gimp

Value at Risk. Karolína Maňáková

Vlastní čísla a vlastní vektory

Pearsonův korelační koeficient

Anotace závěrečné práce:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

PROJEKT 3 2D TRAJEKTORIE KAMERY SEMESTRÁLNÍ PRÁCE DO PŘEDMĚTU MAPV

1 Linearní prostory nad komplexními čísly

D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E

M E T O D Y R O Z P O Z NÁNÍ OB J E K T Ů V O B R A Z U

Vstupní signál protne zvolenou úroveň. Na základě získaných údajů se dá spočítat perioda signálu a kmitočet. Obrázek č.2

Matematika II, úroveň A ukázkový test č. 1 (2018) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

Transkript:

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků lukas.mach@gmail.com Přílohy (videa, zdrojáky, ) ke stažení na: http://mach.matfyz.cz/sift

Korespondence mezi obrázky

Korespondence mezi obrázky

K čemu je to dobré? Motivace na začátek

Panorama stitching (a)

Panorama stitching (b)

Automatická rekonstrukce 3D scény Ukázka

Jak najít korespondence? Nejprve na obrázku nalezneme významná místa features (body zájmu)

Deskriptory Každou feature popíšeme deskriptorem: vektorem 128 integerů Deskriptory jsou invariantní vůči následujícím operacím s obrazem: zvětšení/zmenšení, posun, 2d rotace, šum, změna kontrastu, jasu, osvětlení částečně invariantní vůči prostorové změně úhlu pohledu Stejné body na dalších obrázcích tedy budou mít stejné (nebo velmi podobné) deskriptory

Schéma algoritmu 1. Vybereme velké množství bodů kandidátů 2. Z této množiny odfiltrujeme nestabilní features (nekontrastní, na hranách, ) 3. Vypočítáme deskriptory 4. Vše provedeme v různých měřítcích (scale space) původního obrázku a všechny features hodíme na jednu hromadu

Pozorování: vezmeme obrázek

Gaussovské rozostření poprvé

Gaussovské rozostření podruhé

Odečteme je od sebe

Odečteme je od sebe

Co se stalo? Zajímat nás budou lokální extrémy v rozdílovém obrázku (na předchozím obrázku je zobrazený v absolutní hodnotě) Černé (= nulový rozdíl) jsou hrany a velké homogenní oblasti ty nás nezajímají Bílé (= velký rozdíl) jsou oblasti vedle hran a středy malých kruhů

Proč se to stalo? Ukážeme si to na příkladu jednorozměrné funkce ( 1D obrázek ):

Pokračujeme s funkcí Funkci rozostříme podobně jako jsme to provedli s obrázkem:

Rozostření podruhé Zopakujeme konvoluci:

odečteme funkce od sebe výsledek

původní funkce 2. derivace této funkce rozdíl z minulého slidu

Závěr pozorování Rozdíl dvou gaussovsky rozostřených obrázků je aproximací druhé derivace obrázku (přesněji Laplaciánu) Algoritmus na začátku vybere lokální extrémy v takovýchto rozdílových obrázcích

Sestavíme scale space

Sestavíme scale space

Sestavíme scale space

Sestavíme scale space

Sestavíme scale space

Sestavíme scale space

Odečteme sousední obrázky

Vybereme lokální extrémy V rozdílových obrázcích vybereme lokální extrémy pixely s hodnotou větší (menší) než všichni sousedé Porovnáváme ovšem i s pixely na 3x3 okolí na stejném místě v sousedních obrázcích ve scale space

Ukázka: lokální extrémy ve scale space

Proložení kvadratickou funkcí (a) Pro každý lokální extrém vezmeme jeho 3 3 okolí a představíme si ho jako funkci R 2 R

Proložení kvadratickou funkcí (b) Těmito hodnotami proložíme trojrozměrnou kvadratickou funkci:

Subpixelová přesnost Najdeme minimum/maximum této funkce a tak zjistíme polohu feature se subpixelovou přesností

Filtrování features Podle tvaru kvadratické funkce odstraníme nestabilní features: s nedostatečným kontrastem nebo ležící podél hran

Znovu: lokální extrémy ve scale space

Odstranění nekontrastních features

Odstranění features na hranách

Odstranění features na hranách

Odstranění features na hranách

Orientace a velikost Bodům zájmu přiřadíme orientaci a velikost V rozostřeném obrázku vypočítáme 1. derivaci v místě feature (ve směrech os x a y: d x, d y ) Velikost: L = sqrt(d x2 + d y2 ) Orientace: α = arctan(d y /d x )

Orientace a velikost Velikost feature: L = sqrt(d x2 + d y2 ) Orientace feature: α = arctan(d y /d x )

Deskriptor Chceme vhodně popsat okolí feature (o velikosti L) Výpočet deskriptoru budeme provádět relativně vzhledem k orientaci feature (α) Tím dosáhneme invariance vzhledem k rotaci obrázku

Deskriptor Deskriptor je typicky 128-rozměrný vektor vypočítaný na základě gradientů v okolí feature To vychází z biologického modelu rozpoznávání objektů Image licensed under GNU FDL

Deskriptor V okolí feature vypočítáme gradienty Deskriptor je histogramem těchto gradientů D. Lowe

Feature matching Každý bod zájmu máme popsaný vektorem Na druhém obrázku najdeme bod zájmu, který má tento vektor co nejpodobnější Podobnost vektorů: použijeme běžnou eukleidovskou metriku Feature space outlier rejection Zrychlení: PDS, kd-strom

Další aplikace Zdrojáky využívají knihovnu OpenCV a opensource implementaci SIFTů (viz odkazy na literaturu).

Rozpoznávání objektů Hledání korespondencí oproti celé množině fotografií (databáze) Unknown

matching.c, pano.c

Kalibrace kamer Kalibrace snímků videa či fotografií U videa ale fungují i primitivnější metody Přidávání renderovaných objektů do videa, modelování podle fotografií Nicméně: SIFT není zcela afině invariantní, hledání korespondencí mezi fotografiemi s velmi odlišnými úhly pohledu je stále problém

Literatura Hlavní článek: David G. Lowe: Distinctive image features from scale-invariant keypoints, International Journal of Computer Vision, 60, 2 (2004), pp. 91-110 http://www.cs.ubc.ca/~lowe/keypoints/

Další informace Filtrování chybných korespondencí (RANSAC, guided matching) a mnoho dalšího: R. I. Hartley, A. Zisserman, Multiple View Geometry in Computer Vision, 2nd Edition, Cambridge University Pr., 2004. Automatická rekonstrukce 3D scén pomocí SIFTů: Brown, Lowe, Unsupervised 3D Object Recognition and Reconstruction in Unordered Datasets http://research.microsoft.com/~brown/papers/3dim05.pdf Jiný algoritmus (stabilnější při změně polohy pozorovatele): J. Matas, O. Chum, M. Urban, T. Pajdla, Robust Wide Baseline Stereo from Maximally Stable Extremal Regions, British Machine Vision Conference, 2002.

Odkazy Open source implementace: Seznam na: http://people.csail.mit.edu/albert/ladypack/wiki/index. php/known_implementations_of_sift Zejména: http://web.engr.oregonstate.edu/~hess/index.html Komerční software (kalibrace kamer): http://www.realviz.com/ http://www.2d3.com/

Děkuji za pozornost Licensed under Creative Commons BY 3.0