Projekt do předmětu ZPO



Podobné dokumenty
Jasové transformace. Karel Horák. Rozvrh přednášky:

12 Metody snižování barevného prostoru

13 Barvy a úpravy rastrového

Zpracování obrazů. Honza Černocký, ÚPGM

Vyšší odborná škola a Střední škola,varnsdorf, příspěvková organizace. Šablona 15 VY 32 INOVACE

Operace s obrazem II

Omezení barevného prostoru

Grafika na počítači. Bc. Veronika Tomsová

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

Zpracování digitalizovaného obrazu (ZDO) - Segmentace

Defektoskopie. 1 Teoretický úvod. Cíl cvičení: Detekce měřicího stavu a lokalizace objektu

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

Řídící karta PCI v. 2.2 LED Panely , revize 1.0

LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015

Osvědčené postupy pro zpracování tiskových dat s vynikající kvalitou tisku

Barvy a barevné modely. Počítačová grafika

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

scale n_width width center scale left center range right center range value weight_sum left right weight value weight value weight_sum weight pixel

Úpravy rastrového obrazu

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

Zpracování obrazu v FPGA. Leoš Maršálek ATEsystem s.r.o.

Měření průtoku kapaliny s využitím digitální kamery

Téma: Vektorová grafika. Určete pravdivost následujícího tvrzení: "Grafická data jsou u 2D vektorové grafiky uložena ve voxelech."

D E T E K C E P O H Y B U V E V I D E U A J E J I C H I D E N T I F I K A C E

Text úlohy. Která barva nepatří do základních barev prostoru RGB? Vyberte jednu z nabízených možností: a. Černá b. Červená c. Modrá d.

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

2D grafika. Jak pracuje grafik s 2D daty Fotografie Statické záběry Záběry s pohybem kamery PC animace. Počítačová grafika, 2D grafika 2

Obrazové snímače a televizní kamery

Obrazové snímače a televizní kamery

HDR obraz (High Dynamic Range)

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

ÚROVNĚ, KŘIVKY, ČERNOBÍLÁ FOTOGRAFIE

Základní nastavení. Petr Novák

Meo S-H: software pro kompletní diagnostiku intenzity a vlnoplochy

Kde se používá počítačová grafika

VY_32_INOVACE_INF4_12. Počítačová grafika. Úvod

PROJEKT 3 2D TRAJEKTORIE KAMERY SEMESTRÁLNÍ PRÁCE DO PŘEDMĚTU MAPV

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Interní norma č /01 Průměr a chlupatost příze

Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.2487/2011

Počítačové zpracování obrazu Projekt Učíme se navzájem

Analýza a zpracování digitálního obrazu

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II

7. Analýza pohybu a stupňů volnosti robotické paže

OBRAZOVÁ ANALÝZA. Speciální technika a měření v oděvní výrobě

Počítače a grafika. Ing. Radek Poliščuk, Ph.D. Přednáška č.7. z předmětu

III/ 2 Inovace a zkvalitnění výuky prostřednictvím ICT

zdroj světla). Z metod transformace obrázku uvedeme warping a morfing, které se

Inteligentní analýza obrazu. Ing. Robert Šimčík

Fergusnova kubika, která je definována pomocí bodu P1, vektoru P1P2, bodu P3 a vektoru P3P4

Osvětlení StRojoVého Vidění

Reprezentace bodu, zobrazení

2010 Josef Pelikán, CGG MFF UK Praha

Křivky a plochy technické praxe

ÚVOD DO PROBLEMATIKY PIV

Dokumentace programu piskvorek

K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR

Ctislav Fiala: Optimalizace a multikriteriální hodnocení funkční způsobilosti pozemních staveb

Přednáška kurzu MPOV. Barevné modely

Text úlohy. Kolik je automaticky generovaných barev ve standardní paletě 3-3-2?

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

Spektrální charakteristiky

Světlo. Podstata světla. Elektromagnetické záření Korpuskulární charakter. Rychlost světla. Vlnová délka. Vlnění, foton. c = ,8 km/h

Full High Definition LCD projektor pro pokročilé domácí kino PT-AE1000

PRACOVNÍ NÁVRH VYHLÁŠKA. ze dne o způsobu stanovení pokrytí signálem televizního vysílání

Výpočet umělého osvětlení dle ČSN EN Wils , Copyright (c) , ASTRA 92 a.s., Zlín. Prostor 1. garáž

Digitální fotografie. Mgr. Milana Soukupová Gymnázium Česká Třebová

Skenery (princip, parametry, typy)

Rekonstrukce křivek a ploch metodou postupné evoluce

Náhodné signály. Honza Černocký, ÚPGM

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Kalibrační proces ve 3D

VOLBA BAREVNÝCH SEPARACÍ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ

Automatické zaostřování světlometu

ZÁKLADNÍ TERMINOLOGIE V COLOR MANAGEMENTU

Pružinový algoritmus a algoritmus úpravy hustoty pulsů ve 2D. Iva Bartůňková 3.ročník 2004/05

II. Úlohy na vložené cykly a podprogramy

Rekurzivní sledování paprsku

11 Zobrazování objektů 3D grafiky

Kristýna Bémová. 13. prosince 2007

L1942S POMĚR STRAN 4:3, ANALOGOVÝ VSTUP

David Buchtela. Monitory Monitory. David Buchtela. enýrství lská univerzita v Praze

Rozvoj tepla v betonových konstrukcích

Úloha 1. Text úlohy. Vyberte jednu z nabízených možností: NEPRAVDA. PRAVDA Úloha 2. Text úlohy

Moderní metody rozpoznávání a zpracování obrazových informací 15

Úvod do mobilní robotiky AIL028

BPC2E_C09 Model komunikačního systému v Matlabu

2.17 Webová grafika. Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Jiří Hort. Vyrobeno pro SOŠ a SOU Kuřim, s.r.o.

Š E D O T Ó N O V Á A B A R E V N Á K A L I B R A C E

Analýza obrazu II. Jan Macháček Ústav skla a keramiky VŠCHT Praha

SEMESTRÁLNÍ PROJEKT Y38PRO

Mezi jednotlivými rozhraními resp. na nosníkových prvcích lze definovat kontakty

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

VY_32_INOVACE_INF.10. Grafika v IT

Circular Harmonics. Tomáš Zámečník

Ukázkové snímky pořízené bleskem NIKON CORPORATION. V této příručce jsou představeny různé metody použití blesku SB-N7 a ukázkové snímky

Photoshop - tutoriály

Projektová dokumentace ANUI

Transkript:

Projekt do předmětu ZPO Sledování ruky pomocí aktivních kontur 13. května 2014 Autoři: Pavlík Vít, xpavli62@stud.fit.vutbr.cz Žerdík Jan, xzerdi00@stud.fit.vutbr.cz Doležal Pavel, xdolez08@stud.fit.vutbr.cz

1 Zadání Cílem projektu bylo implementovat sledování pohybu ruky v obraze s využitím aktivních kontur. Projekt je implementován jako konzolová aplikace v jazyce C++ s využitím knihovny OpenCV a jejího rozhraní HighGUI. 2 Detekce kůže v obraze Prvním krokem k úspěšné detekci jakékoli objektu v obraze pomocí aktivních kontur je získání prahovaného obrazu který popisuje jeho tvar. K tomuto účelu lze využít velké množství algoritmů které nejčastěji filtrují nastavený rozsah barev. V tomto případě bylo třeba nalézt ty části obrazu, které mohou mít barvu lidské kůže. Tento problém je obtížněji řešitelný než prostá detekce objektů výrazných barev jakými jsou například fixy nebo reflexní samolepky které se pro demonstrační účely často používají. Množina barev lidské kůže je závislá nejen na kvalitě kamery a osvětlení scény, ale logicky i na barvě pleti člověka. Pokud má výsledná aplikace fungovat pro většinu běžné populace, je třeba použít jiný než standardní barevný model. 2.1 Převod RGB do YCbCr Analýza dostupných řešení ukázala, že pro detekci kůže je vhodné převést vstupní obraz z kamery z barevného modelu RGB do složkového modelu YCbCr a definovat rozsah platných hodnot v něm. Model YCbCr byl mimo jiné používán pro přenos analogového televizního signálu. Složka Y nese informaci o jasu v obraze a bývá interpretována jako zelená barva, složky Cb a Cr určují její barevný posuv do modré a do červené. Nastavení velkého rozsahu jasové složky umožňuje nejen spolehlivější detekci kůže za rozdílných světelných podmínek, ale jako žádaný vedlejší efekt i toleranci vůči špatně nasvětleným lidem bílé a dobře nasvíceným lidem tmavé pleti. Obrázek 1: Převod barevného modelu z RGB do YCbCr a následné prahování To znamená že jasovou složku modelu YCbCr nelze pro detekci kůže použít. Základem úspěchu je vhodné nastavení akceptovatelných rozsahů složek Cb a Cr. Experimentováním s hodnotami jsme dospěli k rozsahům 0 255 pro Y 2

77 127 pro Cb 137 177 pro Cr Mírnou úpravou intervalů lze získat lehce lepší výsledky pro konktrétní kameru. Vetší míra exprimentování však vede téměř vždy k nepoužitelným výsledkům. Použité a zde uvedené hodnoty lze považovat za rozumný kompromis. 2.2 Prahování Prahovaný obraz je z modelu YCbCr získán pouze z příslušnosti pixelu do nastaveného intervalu. Zde vzniká problém, jakým způsobem se vypořádat s šumem a artefakty v obraze. Drobné artefakty lze efektivně odstranit mediánovým filtrem, větší jsou vyhlazeny pomocí Obrázek 2: Odstranění artefaktů v prahovaném obrazu gaussovského rozostření. Tím zároveň vznikne na okrajích objektu gradient který lze použít jako přesnější výpočet minimálních energií v samotném algoritmu snake. 3 Aktivní kontura a algoritmus snake Pod pojmem snake se rozumí parametrická křivka (splajn) tvořený množinou bodů které mají kromě svých souřadnic x a y definovánu hodnotu interní a externí enegie která jim umožňuje regulovat hladkost, pružnost, smrštitelnost a roztažnost křivky kterou tvoří. Základní vzorce pro aktivní kontury lze nalézt v slidech k předmětu ZPO [1] na stranách 40 44. 3.1 Interní energie Za interní energie považujeme síly, které udržují tvar křivky bez ohledu na hranice objektu který obepínají. V anglické literatuře se lze setkat s pojmy contour a curvature, případně tension a stiffness. Velikosti těchto energií jsou počítány ze vzáleností sousedních bodů kontury. Hladkost křivky je vyjádřena jako plocha vzniklá umocněním vzdálenosti mezi aktuálním a následujícím bodem na druhou. Pružnost jako absolutní hodnota rozdílu ploch mezi předchozí a následující dvojicí bodů. Princip výpočtu je znázorněn na obrázku 3. Nastevení koeficientů pro tyto síly určuje základní chování křivky v prostředí bez objektů. Pokud je vše správně nastaveno, bude se křivka zmenšovat směrem ke středu obrazu. 3

Obrázek 3: Interni energie vypočtené jako mocniny vzdáleností sousedních bodů 3.2 Externí energie Externí enegie jsou síly, které začínají působit v okamžiku, kdy smršt ující se křivka narazí na hranu detekovaného objektu. Přesné nastavení externích sil je potřeba k tomu, aby body nepropadávaly dovnitř objektu ale zároveň byly dostatečně silné na to, aby obepnuly i členité objekty. Popis parametrů externí síly ze slidů lze nalézt v [2] na straně 6. Obrázek 4: Snake sledující ruku ve videu z kamery. Základní varianta počítá se zastavením smršt ování na hranici objektu. Celková síla působící na daný bod je dána jako suma všech (interních i externích) sil. V okolí každého bodu pak hledáme místo s minimální energií. Přítomnost záporné externí energie v místě změny gradientu tak smršt ování zastaví. Pro úplné obepnutí libovolného objektu ale tato síla není dostačující. Jako příklad se často uvádí objekty tvaru písmene U. Proto je třeba definovat druhou externí energii označovanou jako flow nebo image která umožní ohnutí křivky dovnitř záhybů objektu. Spolehlivá implementace této síly není zcela snadný úkol, protože její činnost je prakticky v přímém rozporu s principem činnosti externích energií. Námi implementovaný snake je vybaven automatickým přidávání a odebírání bodů 4

křivky v případě potřeby. Množství bodů je upravováno podle konstant AUTOADAPT definovaných v souboru Snake.h. 4 Testování Chování implementovaného programu je velmi závislé na kvalitě kamery, typu pozadí a osvětlení snímané scény. Před prehováním obrazuje sice možné pomocí funkce capture.set() nastavit jas, kontrast, saturaci a další parametry, bohužel tato nastavení nemají vlik na automatické kompenzace obrazu prováděné samotnou kamerou. 4.1 Výběr vhodného pozadí Za obecně problematické lze označit jakékoli pozací obsahující objekty s lehkou příměsí červené barvy. To prakticky znemožňuje mít v pozadí scény jakýkoli dřevěný nábytek, podlahy, korkové nástěnky atp. Tento problém přisuzujeme definovanému intervalu složky Cr který je pro lidskou kůži velmi podobný jako pro uvedené objekty. Na základě této zkušenosti jsme předpokládali že je obdobný problém nastane u objektů s příměsí modré. Tento předpoklad se ale nepotvrdil. Pokud nebudeme uvažovat přepaly způsobené přesvícením kamery, pak modrá pozadí nezpůsobují problémy. Jako ideální pozadí se jeví jednolitá plocha zelené nebo šedé barvy. 4.2 Algoritmus snake Implementovaná verze algoritmu snake pracuje s dvojicí interních a dvojicí externích energií. Parametry algoritmu lze nastavit pomocí parametrů alfa, beta, gamma a delta na začátku zdrojového souboru Snake.cpp. Obecnou vlastností algoritmu snake je problematické obepínání vnitřních záhybů členitých objektů. Řešením by bylo použití varianty GVF snake (gradient vector flow) která před zpracováním každého snímku vytváří matici vektorů (počítá vektor pro každý bod v obraze). Bohužel i pro relativně nízké rozlišení jakým je 640 480 bodů není reálné tento výpočet stihnout v reálném čase. Po nečekaně dlouhém testování jsme se rozhodli obětovat obepnutí vnitřnívh částí objektů výměnou za stabilitu. 4.3 Detekce otevřené a zavřené ruky Na základě tvaru křivky program odhaduje, zda je ruka v obraze otevřená či zavřená. Respektive zda jsou prsty roztažené či nikoli. Děje se tak na základě výpočtu poměru mezi výškou a šířkou kontury. Detekce tak není závislá na vzdálenosti ruky od kamery. Aktuální stav je vypisován do konzole. Závěr Cílem projektu byla implementace sledování ruky v obraze pomocí aktivní kontury. Přestože výsledný algoritmus je pomalejší než jsme čekali, je za dobrých světelných podmínek 5

schopen ruku bezpečně sledovat. Rychlost pohybu je ovšem nutné přizpůsobit prodlevě při zpracování, která se pohybuje vzhledem k výkonu stroje na kterém je program spuštěn kolem 0,5 s. Přes nemalou snahu se nám bohužel nepodařilo zajistit spolehlivé obepnutí vnitřních záhybů trasovaného objektu (mezer mezi prsty) aniž by nedošlo k výraznému snížení spolehlivosti sledování hlavně při zvětšování objektu. Literatura [1] Slidy č. 8 předmětu zpracování obrazu. [Online], Duben 2014. URL <https://wis.fit.vutbr.cz/fit/st/course-files-st.php/course/ ZPO-IT/lectures/zpo_08_hrany.pdf> [2] M. Kass, D. T., A. Witkin: [Online], 1988. URL <http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1. 124.5318\&rep=rep1\&type=pdf> 6