Co vše lze poznat z obrázků?



Podobné dokumenty
Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU

Rozpoznávání v obraze

Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost

Klasifikace a rozpoznávání

Detekce obličeje v obraze s využitím prostředí MATLAB

Vojtěch Franc. Biometrie ZS 2016

Kybernetika a umělá inteligence, cvičení 10/11

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Úloha - rozpoznávání číslic

geekovo minimum počítačového Nadpis 1 Nadpis 2 Nadpis 3

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.

Jiří Matas. Detekce objektů pomocí scanning window

ON-LINE SLEDOVÁNÍ POHYBUJÍCÍHO SE PŘEDMĚTU S VYUŽITÍM DIGITÁLNÍ KAMERY ON-LINE TRACKING OF MOVING OBJECT USING DIGITAL CAMERA

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Vytěžování znalostí z dat

Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek

Roman Juránek. Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 30

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Měření dat Filtrace dat, Kalmanův filtr

Statistická teorie učení

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

ROZ1 CVIČENÍ VI. Geometrická registrace (matching) obrazů


Historie a vývoj umělé inteligence

Využití detektoru Viola-Jones pro lokalizaci obličeje a očí v barevných obrazech

Metody automatického texturování 3D modelu měst s využitím internetových fotoalb 3D town model for internet application

DIGITÁLNÍ FOTOGRAFIE

BOOSTING A EVOLUČNÍ ALGORITMY

Silná autentizace a detekce fraudu (nejen) ve finančním sektoru jak to udělat správně

Klasifikace předmětů a jevů

VY_32_INOVACE_06_Předpřítomný čas_03. Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace

Digitální zpracování obrazu počítačové vidění zakotvení

Pokročilé operace s obrazem

Výuka odborného předmětu z elektrotechniky na SPŠ Strojní a Elektrotechnické

Algoritmy a struktury neuropočítačů ASN - P11

Studentská tvůrčí a odborná činnost STOČ 2017

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Miroslav Čepek. Fakulta Elektrotechnická, ČVUT. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Vytěžování znalostí z dat

Jak bude zítra? Skoro jako dneska. Dan Lessner

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

Učící se klasifikátory obrazu v průmyslu

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

Inteligentní analýza obrazu. Ing. Robert Šimčík

Vytěžování znalostí z dat

Předzpracování dat. Lenka Vysloužilová

UČENÍ BEZ UČITELE. Václav Hlaváč

Kombinování klasifikátorů Ensamble based systems

Rozpoznávání captcha obrázků

Problematika disertační práce a současný stav řešení. Ing. Aneta Zatočilová

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Formální konceptuální analýza

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

biometrických systémů a testování jejich spolehlivosti Přehled drahan@fit.vutbr.cz) Martin Drahanský (drahan(

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha

Rozpoznávání objektů ve video sekvencích

- obvyklejší, výpočetně dražší - každé písmeno je definováno jako zakřivený nebo polygonální obrys

Lineární diskriminační funkce. Perceptronový algoritmus.

Třída: VI. A6 Mgr. Pavla Hamříková VI. B6 RNDr. Karel Pohaněl Schváleno předmětovou komisí dne: Podpis: Šárka Richterková v. r.

DETEKCE SKUPIN OSOB V DATABÁZI OBRAZŮ

BPC2E_C09 Model komunikačního systému v Matlabu

aneb jiný úhel pohledu na prvák

Mobilní malware na platformě Android Přednáška 2. Ing. Milan Oulehla

1. Perimeter Intrusion Detection (PID) Zóna vniknutí/vniknutí do vyhrazené zóny.

IT4Innovations Centre of Excellence

Digitalizace a zpracování obrazu

SHC-735. představte si Dokonalý obraz kdykoliv, kdekoliv SAMSUNG TECHWIN

PŘEDNÁŠKA KURZU MPOV

Automatické rozpoznávání dopravních značek

Neparametrické odhady hustoty pravděpodobnosti

Operační systémy. Tomáš Hudec.

Badatelsky orientované vyučování matematiky

Ochutnávka strojového učení

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.

Co když zmizí firemní pravidla, směrnice a procesy? Zdeněk Macháček

BOOK LEATHER COLLECTION 2015

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

Agilní metodiky vývoje softwaru

DATA MINING KLASIFIKACE DMINA LS 2009/2010

Úvod do optimalizace, metody hladké optimalizace

Geoinformační technologie

Content Aware Image Resizing

Úvodní slovo studentům informatických oborů

Trénování sítě pomocí učení s učitelem

Informace pro výběr bakalářského oboru

Mikrospektrofotometrie a její použití ve forenzní analýze

kupi.cz Michal Mikuš

Využití obrazové korelace leteckých měřických snímků pro potřeby aktualizace budov v ZABAGED

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Možnosti podpory plošné inventarizace kontaminovaných míst interpretací multi- a hyperspektrálního snímkování Jana Petruchová Lenka Jirásková

OBECNÉ METODY VYROVNÁNÍ

Transkript:

Co vše lze poznat z obrázků? Počítačové vidění - co umí, a co ještě ne Prof. Jiří Matas České vysoké učení technické Fakulta elektrotechnická Katedra kybernetiky Centrum strojového vnímání Praha, Česká Republika

Čím se počítačové vidění zabývá: Rozpoznáváním objektů ve obrázcích Rekonstrukcí 3D modelů světa z obrázků nebo videa. Sledovaní objektů ve videu. Určení polohy (měřením pohybu) kamery. Detekce změn mezi obrazy 2/56

Applications, applications, applications, 3/56

Tracking Applications. Team sports: game analysis, player statistics, video annotation, 4/56

Sport examples http://cvlab.epfl.ch/~lepetit/ http://www.dartfish.com/en/media-gallery/videos/index.htm 5/56

Tracking for Safe Dubbing (Technicolor) Technicolor, secure dubbing project video credit: Patrick Perez 6/56

Motto Počítačové vidění se změnilo za posledních 20 let z čistě teoretické disciplíny, která produkovala algoritmy fungující na několika málo obrázcích pečlivě vybraných autorem. Nyní je oborem, kde je cesta od článku na konferenci k úspěšné start up firmě překvapivě krátká. Firmy jako Google, Microsoft, Adobe a Amazon zaměstnávají desítky nebo dokonce stovky odborníků na tuto oblast. 7/56

Historie The Block World 8/56

Ballard and Brown, Computer Vision, 1982 9/56

D. Marr, Vision, 1982 Observed Image intensity changes Primal Sketch depth 2 1/2-D sketch 3-D Model 10/56

I. Biederman, Recognition-By-Components: A Theory of Human Image Understanding, Psychological Review, 1987 2-4 Geons needed for representation. Complex objects no harder than simple ones. Human recognition of line drawings and color images at similar speeds. 11/56

Geons and Their Relations The arrangement of primitives is necessary for representing a particular object Different arrangements of the same components can lead to different objects 12/56

Recognition by Geons S. Dickinson commented in the 1997 IVC paper: One of the most challenging tasks in building a geon based recognition system was finding geon-based objects to test it on!! In fact in early experiments we ended up constructing our own geons in order to build our own objects! 13/56

EigenFaces Represented a collection of images as a linear subspace Kirby, Sirovich, Application of Karhunen-Loeve procedure to Characterization of Human faces, PAMI 1990, (idea first published in 1987) about 900 citations 14/56

Turk, Pentland: Eigenfaces for Recogntion, J. of Cognitive Psychology, 1991 Training set 15/56

Appearance-Based Methods PCA Face detector [Turk & Pentland 91] Turk and Pentland, 1991 5000 citations. The trick: suggesting that PCA is robust to occlusion 16/56

Počítačové vidění po roce 2000 17/56

Rozpoznávaní: nalezení SPZ a její přečtení ~2003 Note the viewing angle Note the arabic numerals. Video 1(external viewer) Video 2(external viewer) In infrared images 18

Rozpoznávání objektů Příklad aplikace: Nalezení a rozpoznání dopravních značek v reálném čase (~ 2004) Video (external viewer) Video (external viewer) 19/56

Detekce tenkých objektů ~2006 video 20/56

etekce obličejů, rozpoznání věku a pohlaví, watchlist 2007 21/56

Award 3D Rekonstrukce ~ 2006 Re-creating a monument of US president W. Wilson destroyed in 1941 VRML model Output: a sparse model of the whole statue a precise digital model of the bust distances and sizes of key features 22

Na mobilu s Android-em ~ 2010 Nezávislé na fontu a jazyce! (Google Translate rozpoznaný text přeložil: Android for Education 23/56

Text Detection and Organization: Organization matters! Google example: DANGER FORTS COURANTS BAIGNADE TRAVERSEE INTERDITES DANGER SELLING CURRENT SWIMMING CROSSING BANNED DANGER FORTS COURANTS BAIGNADE TRAVERSEE INTERDITES DANGER STRONG CURRENTS SWIMMING PROHIBITED CROSSING DANGER FORTS COURANTS BAIGNADE TRAVERSEE INTERDITES DANGER STRONG CURRENTS SWIMMING THROUGH BANNED 24/56

Vyhledávání ve velkých databazích (živé demo) a 25/56

Sledování objektů ~2011 26

TLD a.k.a. PN Tracker a.k.a. The Predator Z. Kalal, K.Mikolajczyk, J. Matas: Tracking-Learning-Detection. IEEE T PAMI 34(7): 1409-1422 (2012) 27/56

28/56

29/56

Detekce obličejů Jak na to? 30/56

Proč mluvit o detektoru obličejů? I. 1. většina z vás už viděla v digitálním fotoaparátu funkční systém, a mohla se zamýšlet, jak se to vlastně dělá, je to jednoduše definovaný problém (ale uvidíme, že to není tak jednoduché ) 2. pro člověka jde o naprosto triviální úlohu a to svádí k vynalézání rychlých řešení. Člověk problém bez úsilí vyřeší, pro výzkum šlo o desítky let odolávající oříšek (čím to asi je?) 3. nefungují řešení na základě zdravého rozumu nebo naivní introspekce, tj. naprogramuji to tak, jak si myslím, že to dělá lidský mozek (jak to vlastně člověk dělá? co se o problému ví?) 4. výsledné řešení implementované ve fotoaparátech je v zásadě jednoduché, lze vysvětlit bez složité matematiky, ale bez hluboké teorie ho nelze nalézt ( message : teorie je velmi dobrý, možná nejlepší, způsob, jak nalézat řešení zcela praktických problémů) 31/56

Formulace úlohy Detekce obličejů I. 32/56

33/56

Definice obličeje: není to tak jednoduché 34/56

Co je ještě obličej 35/56

Chyby detektoru obličejů 1. detekce chybí (false negative) 2. detekce přebývá (false positive) 3. lokalizace Problémy: chyba lokalizace nebo 1. + 2., kde je hranice? co je to vlastně obličej??? 36/56

Detekce obličejů metodou Viola Jones (2001) Problém detekce obličejů implementován jako ověření všech čtvercových oken v obrázku, a přesto fungoval už v roce 2001 v reálném čase na standardním počítači! Do té doby jsem si myslel, že to není možné, neboť: { oken je hodně (odhadněte počet v 10 Mpix obrázku!) { v každém okně se vyhodnocuje složitá funkce, která musí rozpoznat všechna pozadí od všech obličejů V roce 2001 už bylo zřejmé, že vyučované klasifikátory dosahují lepších výsledků než ručně vytvořené algoritmy (vyučovaný klasifikátor nalézá rozhodovací funkci na základě příkladů) Už před rokem 2001 existoval velmi dobrý naučený detektor (Schneiderman-Kanade, 1998). Obrázek zpracovával přes noc, učil se měsíce. 37/56

Detekce obličejů metodou Viola Jones (2001) Průlom #1 VJ si uvědomili, že rychlost detektoru závisí na rychlosti klasifikace neobličejů, navrhli kaskádu klasifkátorů lze rozhodovat sekvenčně Stage 1 Stage 2 Input Signal (Image Window) 40% 1 Weak Classifier 60% 60% Class 2 (Non-Face) 40% 5 Weak Classifiers sekvenční klasifikace je známa od 40. let, ale nikdo sekvenční klasifikátory nevyučoval. Stage N 60% 36% 1200 Weak Classifiers Class 1 (Face) 38/56

Detekce obličejů metodou Viola Jones (2001) % Detection 0 100 Průlom #2 VJ učili složitější klasifikátory jen na příkladech, které prošly jednoduššími klasifikátory na počátku kaskády. Výsledek: kaskáda se mohla učit na řádově větším počtu příkladů V mnoha problémech platí: čím víc dat při učení máš, tím jsi lepší Receiver operating characteristic % False Pos 0 50 vs false neg determined by IMAGE SUB-WINDOW Classifier 1 T Classifier 2 T Classifier 3 T FACE F F F NON-FACE NON-FACE NON-FACE 39/56

Detekce obličejů metodou Viola Jones (2001) Průlom #3 Rozdíly jasů se používaly často, ale jako hladké funkce. VJ použili k popisu obličejů příznaky, které lze vypočítat extrémně rychle. Aproximace po částech konstantními funkcemi, tzv. Haar wavelety, je o několik řádů rychlejší, a jen o málo méně vhodné 1 0 t < ½, Ã(t) = -1 1/2 t < 1, 0 otherwise. Pro výřez 24x24 pixelů, existuje ~160,000 možných příznaků, které vybrat? 40/56

Rychlý výpočet Haar waveletů řádkový součet: s(x, y) = s(x 1, y) + i(x, y) Integralní obrázek : ss(x, y) = ss(x, y 1) + s(x, y) ss(x, y-1) s(x-1, y) MATLAB: ss = cumsum(cumsum(double(i)), 2); i(x, y) Obrázek 0 1 1 1 1 2 2 3 1 2 1 1 1 3 1 0 Integrální obrázek 0 1 2 3 1 4 7 11 2 7 11 16 3 11 16 21 41/56

Rychlý výpočet Haar waveletů Hodnoty A,B,C,D vyčteme z integrálního obrázku Součet hodnot jasů v původním obrázku lze vypočítat takto: sum = A B C + D D B Na každý obdélník potřebujeme jen 3 sčítání! C A 42/56

Detekce obličejů metodou Viola Jones (2001) Průlom #4 VJ použili moderní metodu strojového učení AdaBoost (Schapire a Freund, 1997), která učí klasifikátor a zároveň vybírá příznaky. Výhody AdaBoostu: Teoreticky podložený (dobrá generalizace) Velmi malá chyba v mnoha aplikacích Velice jednoduchý ( just 10 lines of code [R. Schapire]) R. Schapire and Y. Freund získali v roce 2003 Godelovu cenu: jedna z nejprestižnějších cen v teoretické počítačové vědě (informatika, computer science) Poznámky : odstup od výsledku v oblasti strojového učení k jeho použití v počítačovém vidění je velmi krátký k průlomu v počítačovém vidění došlo přenosem znalosti 43/56

AdaBoost - příklad Data 1 2 3 4 5 6 7 8 9 10 Třída + + + + + - - - - - D 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 Taken from A Tutorial on Boosting by Yoav Freund and Rob Schapire 44/56

AdaBoost - příklad Data 1 2 3 4 5 6 7 8 9 10 Třída + + + + + - - - - - D 2. Z 2 0.07 0.07 0.15 0.15 0.15 0.07 0.07 0.07 0.07 0.07 Z 2 = 0.92 ROUND 1 e vážený počet chybných 1 1 = ½ log (1-e 1 )/e 1 D 2 D 1 e 1 (1 e 1 ) D 2 D 1 (1 e 1 ) e 1 dobře špatně 45

AdaBoost - příklad Data 1 2 3 4 5 6 7 8 9 10 Třída + + + + + - - - - - D 3. Z 3 0.04 0.04 0.09 0.09 0.09 0.04 0.14 0.14 0.14 0.04 Z 3 = 0.82 ROUND 2 46

Vybrány dva klasifikátory Data 1 2 3 4 5 6 7 8 9 10 Třída + + + + + - - - - - D 3. Z 3 0.04 0.04 0.09 0.09 0.09 0.04 0.14 0.14 0.14 0.04 Z 3 = 0.82 47

Vybrány dva klasifikátory Data 1 2 3 4 5 6 7 8 9 10 Třída + + + + + - - - - - D 4. Z 4 0.11 0.11 0.04 0.04 0.04 0.11 0.07 0.07 0.07 0.02 Z 4 = 0.68 48

Výsledný klasifikátor 49

AdaBoost: Algoritmus Váhy nesprávně klasifikovaných příkladů jsou zvýšeny tak, aby se algoritmus zaměřil na těžké příklady v trénovací množině 50/56

Detector obličejů Adaboost První dva příznaky vybrané metodou Adaboost: Tyto dva příznaky mají 100% detekci a 50% falešných poplachů. 51/56

Diskretrizovaný prostor testovaných oken Klasifikátor okna lze naučit tak, že nemusím testovat každé okno Stačí přibližně: posun o 10% šířky okna zvětšení o 15% šířky okna rotovat o +- 15 stupňů Poznámka: o rychlosti (počtu oken) rozhoduje velikost nejmenšího detekovaného obličeje. Celkový čas je součet geometrické řady s q=1/1.15 2 ;s ¼ 4t 0 52/56

Detekce obličejů Jak na to? V roce 2001 byl publikován článek V-J. V roce 2009 je implementován (samozřejmě ve velmi vylepšené verzi) v mnoha digitálních fotoaparátech. Mezi vylepšení metody V-J patří algoritmus WaldBoost (vyvinutý v Center for Machine Perception, ČVUT Praha) který optimálně řeší kompromis mezi rychlostí a přesností u klasifikátoru typu AdaBoost. 53/56

macros.tex sfmath.sty cmpitemize.tex Děkuji za pozornost