Digitální zpracování obrazu počítačové vidění zakotvení



Podobné dokumenty
Počítačové vidění vs. digitální zpracování obrazu Digitální obraz a jeho vlastnosti

SENZORY PRO ROBOTIKU

Pokročilé operace s obrazem

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

Restaurace (obnovení) obrazu při známé degradaci

SYSTÉMOVÁ METODOLOGIE (VII) Kybernetika. Ak. rok 2011/2012 vbp 1

Moderní systémy pro získávání znalostí z informací a dat


Analýza a zpracování digitálního obrazu

Grafika na počítači. Bc. Veronika Tomsová

Autonomní roboty a zaměstnanost

Informace pro výběr bakalářského oboru

DIGITÁLNÍ OBRAZ. Obrázky (popř. slajdy) převzaty od

UČENÍ BEZ UČITELE. Václav Hlaváč

Základy umělé inteligence

Výrobní pracoviště budoucnosti

Automatizační a měřicí technika (B-AMT)

CHEMICKO-INŽENÝRSKÉ VZDĚLÁVÁNÍ VE STRUKTUROVANÉM STUDIU

Jasové transformace. Karel Horák. Rozvrh přednášky:

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

Programování LEGO MINDSTORMS s použitím nástroje MATLAB a Simulink

Obsah Předmluva Rekapitulace základních pojmů logiky a výrokové logiky Uvedení do predikátové logiky...17

Netradiční výklad tradičních témat

Buněčné automaty a mřížkové buněčné automaty pro plyny. Larysa Ocheretna

Geometrické transformace

František Pluháček Katedra optiky PřF UP v Olomouci

Ústav automatizace a měřicí techniky.

Vývoj vědeckého myšlení

BMII. B i o m e d i c a l D a t a P r o c e s s i n g G r o u p

DIGITÁLNÍ FOTOGRAFIE

Aplikace barevného vidění ve studiu elastohydrodynamického mazání

TECHNICKÁ UNIVERZITA V LIBERCI

PROGRAMOVÁNÍ ROBOTŮ LEGO MINDSTORM S VYUŽITÍM MATLABU

Úvod do zpracování obrazů. Petr Petyovský Miloslav Richter

Využití metod strojového učení v bioinformatice David Hoksza

Ústav technologie, mechanizace a řízení staveb. CW01 - Teorie měření a regulace 10.2 ZS 2010/2011. reg Ing. Václav Rada, CSc.

Kognitivní informatika očima studentů

Řečové technologie pomáhají překonávat bariéry

Výukové texty. pro předmět. Automatické řízení výrobní techniky (KKS/ARVT) na téma

Datová věda (Data Science) akademický navazující magisterský program

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Barvy a barevné modely. Počítačová grafika

H. Dreyfuss: What computers can t do, 1972 What computers still can t do, J. Weizenbaum. Computer power and human reason, 1976

Elektronická podpora výuky na ÚBMI

OBSAH. 1. ÚVOD il 3. MOZEK JAKO ORGÁNOVÝ ZÁKLAD PSYCHIKY POZORNOST 43

Kybernetika. Wiener 1948: Rok 2000:

Úloha - rozpoznávání číslic

Neparametrické odhady hustoty pravděpodobnosti

Detekce interakčních sil v proudu vozidel

Inteligentní systémy a neuronové sítě

Automatické rozpoznávání dopravních značek

Architektura počítačů

Neuronové sítě. Vlasta Radová Západočeská univerzita v Plzni katedra kybernetiky

Masarykova univerzita Filozofická fakulta. POČÍTAČOVÉ VIDĚNÍ seminární práce. Adriana Babincová

Informatika pro 2. stupeň

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

JAY WRIGHT FORRESTER. Tomáš Mrázek

Vzdělávací oblast: Umění a kultura. Vyučovací předmět: VÝTVARNÁ VÝCHOVA. Období: 1.

Využití přírodovědného pokusu na 1. stupni ZŠ z pohledu učitelů z praxe výzkumná sonda. Ondřej Šimik

Teoreticko-metodologický seminář. Zdeňka Jastrzembská

Ing. Jiří Fejfar, Ph.D. Dálkový průzkum Země

Analytické metody v motorsportu

Fyzika I. Něco málo o fyzice. Petr Sadovský. ÚFYZ FEKT VUT v Brně. Fyzika I. p. 1/20

7 Další. úlohy analýzy řeči i a metody

Umělá inteligence a rozpoznávání

Pravděpodobnost, náhoda, kostky

Obsah. Úvod Barevná kompozice Světlo Chromatická teplota světla Vyvážení bílé barvy... 20

Nikolić Aleksandra Matěj Martin

Zpracování digitalizovaného obrazu (ZDO) - Segmentace

Písemná komunikace. PhDr. Libuše Machačová Vědecká knihovna v Olomouci

Usuzování za neurčitosti

6. ročník. Výtvarná výchova

Bezpečnostní systémy - rychlostní kamery Identifikace SPZ a RZ.

Meo S-H: software pro kompletní diagnostiku intenzity a vlnoplochy

HDR obraz (High Dynamic Range)

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Matematická logika. Lekce 1: Motivace a seznámení s klasickou výrokovou logikou. Petr Cintula. Ústav informatiky Akademie věd České republiky

Algoritmy a struktury neuropočítačů ASN - P11

ŠKOLNÍ VZDĚLÁVACÍ PROGRAM ŠKOLA PLNÁ POHODY

(Umělé) osvětlování pro analýzu obrazu

Hierarchický model Josef Pelikán CGG MFF UK Praha. 1 / 16

Pedagogika I Zimní semestr Akademický rok 2014/15

Informatika 1-4. doc. Ing. Jan Skrbek, Dr. KIN. Spojení: Ing. Bc. Marian Lamr INN

Praktická geometrická optika

Logika a studijní předpoklady

Obecná psychologie. Kurz pro zájemce o psychologii 16/3/2013

Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

MATEMATIKA V MEDICÍNĚ

+ 1. doc. Ing. Jan Skrbek, Dr. - KIN. Konzultace: pondělí nebo dle dohody. Spojení:

Pravděpodobnost, náhoda, kostky

Příloha č. 9 VÝTVARNÁ VÝCHOVA

Principy počítačů I Netradiční stroje

Informatika a výpočetní technika 1. roč./1. sem. 1. roč./2. sem. 2. roč./3. sem. 1 kr. Povinné předměty pro obor IVT

Obsah. I. Objektivní pravděpodobnosti. 1. Pravděpodobnost a relativní četnosti... 23

ZPRACOVÁNÍ DAT DÁLKOVÉHO PRŮZKUMU

Transkript:

Digitální zpracování obrazu počítačové vidění zakotvení Václav Hlaváč České vysoké učení technické v Praze Fakulta elektrotechnická, katedra kybernetiky Centrum strojového vnímání http://cmp.felk.cvut.cz/ hlavac, hlavac@fel.cvut.cz Osnova přednášky: Digitální zpracování obrazů analýza obrazů počítačové vidění. Vidění vnímání. Proč je vidění těžké? Interpretace, význam pro obrazy.

Co je počítačové vidění? 2/19 Počítačové vidění je jak vědou tak i technologií usilující o vytváření strojů schopných vidět a vnímat. Vědecký obor: hledá teorie pro vytváření umělých systémů získávajících informace z obrazů. Technický obor: Počítačové vidění = kamera + počítač +? Obrazy (například): pohledy z více kamer, video sekvence, vícerozměrná data z lékařského skeneru, např. tomografu.

Proč studujeme zpracování obrazu, analýzu obrazu a počítačové vidění? 3/19 Počítačové vidění vyrostlo přinejmenším na čtyřech pilířích: (1) vědě o počítačích; (2) teorii signálů; (3) rozpoznávání; (4) porozumění lidskému vidění. Lidské vidění Zkoumání započala v 60. letech 20. století. Má bohatou metodologii. Rozpoznávání Počítačové vidění Počítačové vědy Poskytuje a využívá zajímavé mezioborové vazby. Poskytuje vhled do lidského vidění. Zpracování signálů Je důležitým zdrojem informace v moderní informační době.

Na co se používá počítačové vidění? Pro detekci, segmentaci, popisování, rozpoznávání (vzletněji: porozumění, vnímání) objektů, které nás zajímají ve 2D či 3D obrazech nebo sekvencích. Pro detekci událostí (např. při sledování bezpečnostními kamerami, počítání lidí, při detekci startující balistické rakety ze senzorů na družici). Pro uspořádání informace na základě obrazů (např. pro indexování obrazových databází nebo video sekvencí). Jako součást řídicích systému (např. u průmyslových robotů nebo autonomně jedoucích aut). Pro modelování objektů nebo okolního světa (např. při obrazové kontrole kvality výrobku v průmyslu, při analýze lékařských obrazů, při získávání 3D modelu ze série 2D obrazů). Pro interakci mezi člověkem a strojem (např. ovládání počítačové hry pomocí hloubkoměru Kinect). atd. 4/19

Vnímání 5/19 Postupy k upoutání pozornosti a/nebo porozumění informacím ze senzorů. Úloha je mnohem složitější, než si vědci byli schopni představit okolo let 1950 a 1960: Tehdy: Vytvoření strojů vnímat potrvá zhruba jedno desetiletí. Přitom jsme od tohoto cíle stále velmi vzdáleni. Pět Aristotelových smyslů: zrak, slyšení, hmat, čich a chuť. Vnímání předpokládá dynamický vztah mezi: reprezentaci světa v mozku na základě smyslů, bezprostředního okolního světa, paměti.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Poznámky k lidskému (vizuálnímu) vnímání Co vidíte na obrázku? 6/19 Vidění a vnímání je pro člověka a mnoho zvířat snadné a přirozené. Není to zadarmo: Asi 50 % šedé mozkové kůry u primátů se věnuje zpracování vizuální informace (Felleman-van Essen 1991). Lidský mozek spotřebovává asi 20 % veškeré energie v lidském těle. Aby počítač viděl a vnímal jako člověk, museli bychom vyřešit většinu úkolů umělé inteligence (což je velmi těžké, blízké k nemožnému). Využívá se znalost vyšší úrovně, sémantická informace a kontext.

Lidské vidění Část šedé kůry mozkové věnující se vidění zaobírá 50 % mozku makaka. 7/19 U člověka se větší část mozku věnuje vidění než jiným úkolům.

Lidské vidění na rozdíl od počítačového vidění 8/19 Vidění dovoluje člověku i zvířeti vnímat a porozumět světu, který je obklopuje. Kognitivní vědy zkoumají také vidění v biologických systémech: Hledají empirické modely popisující biologické vidění. Někdy popisují vidění, jako by šlo o výpočetní systém. Počítačové vidění usiluje o technická řešení, i když se někdy inspiruje v biologickém vidění: Biologické vidění zvládá úlohy, na něž je počítačové vidění stále krátké. Přesto poskytuje biologické vidění inspiraci i pro technická řešení. Technické požadavky na systémy počítačového vidění se často shodují s požadavky na biologické vidění. Varování: Napodobování biologického vidění nemusí být nejlepším příkladem řešení technické úlohy.

Příklady vstupních obrazů 9/19

Proč je počítačové vidění těžké? Najděme alespoň 6 příčin. 10/19

Proč je počítačové vidění těžké? Najděme alespoň 6 příčin. 10/19 3D 2D přináší ztrátu informace díky vlastnostem perspektivní transformace (matematická abstrakce, dírková komora). Měřený jas je dán složitým fyzikálním postupem vytváření obrazu. Zář (angl. radiance) ( jas) závisí na typu světelných zdrojů, jejich poloze, intenzitě, poloze pozorovatele, lokální geometrii povrchu a odrazivosti povrchu. Obrácená úloha je špatně podmíněna. Nevyhnutelná přítomnost šumu v každém měření ve skutečném světě. Příliš mnoho dat Stránka A4, 300 dpi, 8 bit per pixel = 8.5 Mbytes. Neprokládané video 512 768, RGB (24 bit) = 225 Mbits/sekundu. Nutnost zahrnout interpretaci (bude brzy diskutováno). Lokální okno v kontrastu s potřebou globálního pohledu.

Ilustrace nedostatečnosti lokálního pohledu 11/19

Ilustrace nedostatečnosti lokálního pohledu 11/19

Interpretace a její role, sémantika 12/19 Vyjádříme interpretaci jazykem mamtematiky jako zobrazení. Interpretace: pozorování model světa syntax sémantika Příklady: Pohled z okna {prší, neprší}. Jablko na běžícím pásu {třída 1, třída 2, třída 3}. Dopravní scéna vyhledávání čísla auta. Opora v teorii: matematická logika, teorie formálních jazyků. Hluboká teoretická potíž: Gödelovy věty o neúplnosti, neformálně: logický systém s kvantifikátory, nemůže být dokázán ani vyvrácen.

Od nízké k vyšší úrovni zpracování z hlediska využívané apriorní znalosti Nízká (až žádná) znalost digitální zpracování obrazu Obrazy se neinterpretují, a proto jsou postupy nezávislé na konkrétní aplikační oblasti. Používají se metody zpracování signálů, např. 2D Fourierova transformace. Střední znalost analýza obrazu Často jen 2D obrazy, např. obrazy buněk v optickém mikroskopu. Interpretace přináší důležitou dodatečnou znalost umožňující řešit i úlohy, které by jinak řešit nešly. Vyšší znalost počítačové vidění, porozumění obsahu 3D scény z obrazů a videí Nejobecnější formulace úloh, 3D svět, měnící se scéna (videosekvence). Složité, využívá se interpretace, zpětné vazby a techniky umělé inteligence. Příliš ambiciózní cíle. Často špatně podmíněné a příliš těžké úlohy. Obvykle se musí radikálně zjednodušit. 13/19

Role apriorní znalosti, protipříklad 14/19 Apriorní znalost našeho světa umožňuje člověku porozumět i mnohoznačným obrázkům. Ovšem, apriorní očekávání mohou také přivést k chybné interpretaci... Protipříklad: Amesova židle. Vidíme židle. nic

Role apriorní znalosti, protipříklad 15/19 Apriorní znalost našeho světa umožňuje člověku porozumět i mnohoznačným obrázkům. Ovšem, apriorní očekávání mohou také přivést k chybné interpretaci... Protipříklad: Amesova židle. Vidíme židle. nic Ve scéně židle nejsou.

Jsou úlohy počítačového vidění typickou inženýrskou úlohou? 16/19 Jednoduchá myšlenka... However, the idea needs only a refinement...

Jsou úlohy počítačového vidění typickou inženýrskou úlohou? 17/19 Jednoduchá myšlenka... Myšlenka potřebuje jen trochu doladit...

Ultrakrátká historie počítačového vidění 18/19 1966 M. Minsky zadává úlohu počítačového vidění bakalářskému studentovi jako prázdninový projekt. 1960 Interpretace v omezeném umělém světě, např. svět kostek robotu. 1970 Jistý pokrok v interpretaci obrazů v omezeném světě. 1980 Umělé neuronové sítě přišly a odešly; posun zájmu ke geometrii a rigoróznějšímu použití matematiky; inspirace biologickým viděním (D. Marr a spolupracovníci). 1990 Detekce a rozpoznávání lidských obličejů; růst popularity statistické analýzy; zájem o geometrické úlohy vidění. 2000 Rozpoznávání ve větším; k dispozici začínají být rozsáhlé anotované databáze; počátek prakticky použitelných metod analýzy videa.

Rozpoznávání na základě obrazů Hierarchie reprezentací 19/19 Objekt nebo scéna 2D obraz Digitální obraz od objektù k obrazùm od obrazù k pøíznakùm Oblasti Hrany Mìøítko Orientace Textura Obraz s pøíznaky od pøíznakù k objektùm Objekty porozumìní objektùm