RYCHLÁ DETEKCE PŘÍRODNÍCH OBJEKTŮ FAST DETECTION OF NATURAL OBJECTS
|
|
- Pavel Beneš
- před 6 lety
- Počet zobrazení:
Transkript
1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA RYCHLÁ DETEKCE PŘÍRODNÍCH OBJEKTŮ FAST DETECTION OF NATURAL OBJECTS BAKALÁŘSKÁ PRÁCE BACHELOR S THESIS AUTOR PRÁCE AUTHOR VEDOUCÍ PRÁCE SUPERVISOR MARTIN ZELINKA Ing. MARTIN ŠIMON BRNO 2016
2
3 Abstrakt Práce se zabývá detekcí a lokalizací psů v obraze. Rozebírá postupy počítačového vidění vhodné k řešení této problematiky. Je navrhnuto a následně implementováno řešení. V rámci vypracování práce je vytvořena datová sada obrázků reprezentující hledaný objekt a datová sada negativních obrázků. Výsledné řešení je nakonec podrobeno trénování za účelem zjištění nejlepších parametrů pro použité algoritmy. Výsledný program je součástí přiloženého DVD. Abstract Thesis deals with the detection and localization of dogs in the image. It analyzes computer vision techniques suitable for solving this problem. It is designed and then implemented solution. Data set of images representing the object of the search and the data set of negative images are created. The resulting solution is finally subjected to training in order to determine the best parameters for used algorithms. The resulting program is included in the attached DVD. Klíčová slova Počítačové vidění, Rozpoznávání, Přírodní objekty, Lokalizace Keywords Computer vision, Recognition, Natural objects, Lacalization Citace Martin Zelinka: Rychlá detekce přírodních objektů, bakalářská práce, Brno, FIT VUT v Brně, 2016
4 Rychlá detekce přírodních objektů Prohlášení Prohlašuji, že jsem tuto bakalářskou práci vypracoval samostatně pod vedením pana Ing. Martina Šimona. Dále prohlašuji, že jsem důsledně uvedl veškerou literaturu a další zdroje, ze kterých jsem čerpal Martin Zelinka 18. května 2016 Poděkování Tímto bych chtěl poděkovat vedoucímu bakalářské práce Ing. Martinu Šimonovi, který poskytoval cenné rady a odbornou pomoc, která ve velké míře pomohla k úspěšnému vypracování bakalářské práce. c Martin Zelinka, Tato práce vznikla jako školní dílo na Vysokém učení technickém v Brně, Fakultě informačních technologií. Práce je chráněna autorským zákonem a její užití bez udělení oprávnění autorem je nezákonné, s výjimkou zákonem definovaných případů.
5 Obsah 1 Úvod 2 2 Počítačové vidění Obrazové příznaky SIFT K-means shlukování Slovník vizuálních slov Support Vector Machines Sliding window Effective subwindow search Návrh řešení Obecný návrh Datová sada Implementace Použité vývojové prostředí OpenCV Rozhraní aplikace Přehled důležitých částí implementace Testování Meření přesnosti lokalizace Vyhodnocení výsledků Závěr 28 Literatura 29 Přílohy 30 Seznam příloh A Obsah DVD 32 1
6 Kapitola 1 Úvod Počítačové vidění umožňuje interpretovat obraz na vstupu a získávat z něj důležité informace, které donedávna byl schopen určit pouze člověk. Díky počítačovému vidění jsme schopni detekovat z obrazu známé objekty, jejich pozici, stav a další informace. K rozvoji tohoto oboru zároveň napomáhá snižování pořizovacích cen kamer a zvyšování výkonu současné techniky. Díky příznivým okolnostem může dnes počítačové vidění zlepšovat lidskou činnost, nebo ji dokonce úplně nahradit v některých činnostech. V praxi se využívá např. k automatizaci výrobních linek, monitorování okolí automobilu a detekování nebezpečí, či k autentizaci uživatele. Dalších možností využití je možné nalézt spoustu a rozsah činností počítačového vidění se do budoucna bude určitě dále rozšiřovat. Má práce se zabývá rychlou detekcí přírodních objektů. Konkrétněji je zaměřena na rozpoznání psů v obraze. Kromě detekce hledaného objektu je zapotřebí určit jeho lokalizaci. Práce může nalézt uplatnění v bezpečnostním kamerovém systému automobilu, který by při detekci psa ve vozovce byl schopen upozornit řidiče a v nevyhnutelné případě zasáhnout do řízení a zamezit kolizi. Další možnost využití je v bezpečnostním kamerovém systému, který monitoruje veřejný prostor, kde je zákaz vodění psů. V další kapitole 2 naleznete teoretický úvod do algoritmů počítačového vidění, které se dále využívají při řešení zadání. Následuje kapitola 4, kde je uveden způsob řešení a popis samotné implementace. Kapitola 5 se zabývá testování implementovaného řešení. Poslední kapitola 6 shrnuje dosažené výsledky práce. 2
7 Kapitola 2 Počítačové vidění Tato kapitola je teoretickým úvodem do technik a postupů počítačového vidění, které jsou zvažovány při řešení tématu práce. Jednotlivé podkapitoly poskytují nezbytné minimum pro pochopení výsledného způsobu řešení. Mezi uvedená témata podkapitol patří obrazové příznaky 2.1 dále jsou popsány základní klasifikátory 2.3 a v poslední části kapitoly je věnována pozornost možným způsobům lokalizace objektů v obraze Obrazové příznaky Vstupní obraz ve své původní podobě, kdy je reprezentovaný mřížkou pixelů je příliš nestrukturovaný a zašumělý pro účely strojového učení, proto existuje několik způsobů, díky kterým je možno reprezentovat obraz v podstatně menší velikosti, aniž by došle ke ztrátě důležitých informací, které jsou nezbytně nutné pro povahu dané úlohy kterou řešíme. Jedním ze způsobů získání důležitých informací z obrazu jsou lokální obrazové příznaky. Obrazové příznaky jsou základním stavebním prvkem mnoha algoritmů počítačového vidění. Jejich vyhodnocení se skládá z několika kroků. Zaprvé jsou detekovány klíčové body v obrazu. Klíčové body nalézají zajímavá místa v obraze - nejčastěji se jedná o rohy a hrany. Poté co jsou detekovány klíčové body, je nutno je převést do podoby vektoru (deskriptoru). Fáze převedení klíčového bodu na deskriptor se nazývá extrakce příznaku. Proces extrakce příznaku využívá hodnoty okolních pixelů daného klíčového bodu. Pro získání lokálních příznaků je možno použít několik algoritmů, kdy každý je vhodný do jiné situace, a proto je potřeba jejich volbu důkladně zvážit. 3
8 2.2 SIFT Populární algoritmus pro získání obrazových deskriptorů. Generované deskriptory jsou invariantní vůči změně velikosti, rotaci a jasu. Pro zjednodušení procesu získání výsledného deskriptoru je možné algoritmus rozdělit do pěti částí: Vytvoření scale-space pyramidy LoG aproximace Získání klíčových bodů Přiřazení orientace klíčovým bodům. Extrakce deskriptoru Obrázek 2.1: Znázornění scale-space pyramidy, která je vytvořena algoritmem SIFT. Převzato z [2] a upraveno. Prvním krokem je vytvoření scale-space pyramidy. Tato pyramida reprezentuje vstupní obrázek v několika rozlišeních (oktávách), kdy obraz následující oktávy je vždy polovičního rozlišení oproti předchozí vrstvě. V rámci jedné oktávy je vytvořena sekvence snímku tak, že postupně aplikujeme Gaussovský filtr se zvyšující hodnotou parametru σ, který udává míru rozmazanosti snímku. Míra nárůstu parametru σ je dána konstantou k. Grafická podoba pyramidy je znázorněna na obrázku 2.1. Rovnice 2.1 znázorňuje vytvoření snímku L jako konvoluci původního obrázku I s Gaussovským filtrem G. L(x, y, kσ) = G(x, y, kσ) * I(x, y) (2.1) V další fázi je proveden rozdíl dvou sousedních snímků (Rovnice 2.2). Tímto způsobem je získán rozdíl dvou Gaussiánu (DoG 1 ), který je považovaný za aproximaci filtru LoG 2. 1 Difference of Gaussians 2 Laplacian of Gaussian 4
9 Přímému použití filtru LoG se záměrně vyhýbáme, jelikož je výpočetně náročný při počítání druhých derivací. D(x, y, σ) = L(x, y, k i σ) L(x, y, k j σ)) (2.2) Jakmile nalezneme DoG snímky, tyto snímky prohledáme a zjistíme lokální minima a maxima, které prohlásíme za klíčové body. Jelikož je algoritmus SIFT invariantní vůči rotaci, je ke každému klíčovému bodu zjištěna jeho orientace pomocí histogramu gradientů (jeden bin je 10 z 360 ). Pro ilustraci je uveden obrázek 2.2, kde jsou znázorněny detekované klíčové body. Poslední krokem je získání deskriptoru klíčového bodu. Za tímto účelem vezmeme okolí 16x16 kolem klíčového bodu a dále jej rozdělíme na 16 buněk o velikost 4x4. Pro každou buňku vytvoříme histogram gradientů o osmi binech, takže celkově je pro jeden klíčový bod vytvořeno 128 binů (4x4x8). Jednotlivým histogramům jsou poté přiřazeny váhy tak, aby ty co jsou blíž ke klíčovému bodu měly vetší váhu než ty vytvořené z okrajových buněk. Tímto je zajištěna větší robustnost deskriptoru vůči obrazovým transformacím [10]. Obrázek 2.2: Detekované lokální příznaky pomocí SIFT algoritmu. 5
10 2.3 K-means shlukování Je technika sloužící k vytvoření k shluků v euklidovském prostoru pro SIFT deskriptory se jedná o 128 dimenzionální prostor. Každý bod je přiřazený ke klastru k němuž má nejblíže. Výsledná pozice klastrů je určená tak, aby součet vzdáleností bodů patřících k nejbližším klastrům, byl co nejmenší. Výsledná poloha klastrů je dána minimalizací rovnice (2.3) kde x je d-dimenzionální vektor patřící ke klastru S i, S je množina všech klastrů (S 1, S 2,..., S k ) a μ i je středem i-tého klastru. argmin S = k i=1 x S i x μ i 2 (2.3) 2.4 Slovník vizuálních slov Slovník vizuálních slov je zaužívaný český překlad pro algoritmus Bag of the word dále jen BoW. Základní jednotkou se kterou BoW pracuje jsou vizuální slova. Množina všech vytvořených vizuálních slov vytváří vizuální slovník. Vizuálním slovem je chápán shluk příznaků vytvořený např. pomocí techniky k-means. V praxi vizuální slova vytvořená z trénovací sady obrázků reprezentují charakteristické rysy objektu, který je obsažen v naší datové sadě. Obrázek 2.3: Názorně proces získání histogramů ze třech vstupních obrázků Obrázek, který je na vstupu je dále převeden na histogram četnosti vizuálních slov. V tomto histogramu reprezentuje jedena třída počet výskytů vizuálního slova. Je-li vizuální slovo obsažené ve vstupním obrázku je možno určit porovnáváním příznakového vektoru s daným vizuálním slovem. Porovnání počítá s určitou mírou aproximace - nikdy nenastane absolutní shoda. Poté co je vypočítán histogram, je provedena jeho normalizace. Celý postup je znázorněn na obrázku 2.3 6
11 2.5 Support Vector Machines Support Vector Machines je populární algoritmus strojového učení určený pro klasifikaci dat. Cílem SVM je nalézt nadrovinu v prostoru příznaků, která co nejlépe dokáže oddělit data dvou tříd. Výsledná nadrovina je lineární funkce w x b = 0 jak je znázorněno na obrázku 2.4. Aby byla výsledná nadrovina co nejspolehlivější pro klasifikaci, hledá se taková, která dosahuje největší vzdálenosti (margin) od nejbližších bodů. Body, které mají nejblíže k lineární nadrovině jsou označované jako podpůrné vekrory (support vectors), od čehož je odvozen název klasifikačního algoritmu. Trénovací data vstupující do algoritmu jsou ve formátu (x i, y i ), kde x i R d je příznakový vektor, y i značí příslušnost k jedné ze dvou tříd Y = { 1, +1} a i je pořadové označení trénovací dvojice v datové sadě o n vzorcích [3][5]. Obrázek 2.4: Nadrovina oddělující data dvou tříd - kolečka bíle, černé výplně Poté, co je nalezena nadrovina, je možné provést binární klasifikaci vstupního vektoru x. Výsledná třída y { 1, +1} vstupního vektoru je dána jako výsledek funkce w x b (2.4) (2.5). y = +1 pro w x b +1 (2.4) y = 1 pro w x b 1 (2.5) 7
12 Lineárně neseparovatelná data V určitých případech není možné využít lineární funkce k rozdělení dat dvou tříd a to ani za použití penalizace za špatně klasifikovaná data. Další možností je použití nelineárního SVM, které přidává datům další dimenzi. Poté co je zvýšena dimenzionalita, je vytvořen nový prostor dat, ve kterém se znovu hledá separující lineární funkce. Vše je znázorněno na obrázku 2.5, kde byla přidána třetí dimenze pro snadnější oddělení dat rozdílných tříd. Obrázek 2.5: Transformace prostoru pomocí funkce φ, která přidává datovým bodům další dimenzi za účelem lepší separace. Obrázek převzat [9] a upraven. Ke zvýšení dimenze prostoru jsou využity jádrové funkce. Mezi nejčastěji používané patří: Polynomicke jadro - K(x i, x j ) = exp(γ x T i x j + r) d ; γ > 0 Sigmoida - K(x i, x j ) = tanh(γx T i x j + r) RBF(Radial Base Function) - K(x i, x j ) = exp( γ x i x j ) 8
13 2.6 Sliding window Detekce a lokalizaci objektu lze provést jednoduchou a účinnou metodou Sliding window v českém překladu plovoucí okno. Pohyb plovoucího okna je znázorněn na obrázku níže 2.6. Tato metoda nalézá uplatnění v případě, kdy hledaný objekt má charakteristický vzhled a nedochází u něj k velkým deformacím tzn. lze natrénovat klasifikátor z positivních a negativních obrázků, který jej dokáže spolehlivě rozpoznat. Pozitivní obrázky jsou fixní velikosti (n m) a obsahují instanci hledaného objektu - nejlépe ve středu a v co největší velikosti. Negativní obrázky obsahují cokoliv, co není náš hledaný objekt - nejlépe časté útvary, které obklopují hledaný objekt. Jako klasifikátor bývá často využíván SVM uvedený výše 2.5. Δ x Δ y Obrázek 2.6: Sliding window - průchod obrazem. Za předpokladu, že máme natrénovaný binární klasifikátor můžeme přejít k samotné metodě sliding window - její jednotlivé fáze jsou znázorněny v diagramu 2.7. Prvním krokem je vytvoření množiny oken velikosti (n m), které získáme postupným posouváním klouzavého okna o x a y. Problém může nastat v případě, když se hledaný objekt vyskytuje ve více možných velikostech. Tuto situaci je možné řešit vytvořením Gaussovi pyramidy a provést hledání (n m) oken na všech vrstvách této pyramidy. Další řešení spočívá v postupném zvětšování délek hran klouzavého okna o konstantu s na (sn sm). V další fázi je pro každé okno, vytvořené z předešlé fáze posouváním klouzavého okénka, získána množina obrazových příznaků. Příznaky daného okna jsou dále vstupem do binárního klasifikátoru, který určí zdali je okno pozitivní, nebo negativní vůči výskytu hledaného objektu. V praxi často nastává situace, kdy je hledaný objekt vícekrát detekován - více oken kolem jednoho objektu. Nesprávným řešením by bylo uvažovat o vyladění klasifikátoru, který detekuje objekt pouze pokud je zarovnán přesně na střed okna (n m). Tento způsob by v praxi nefungoval, jelikož nikdy nejsme schopni zaručit, že střed klouzavého okna bude taktéž ve shodě se středem hledaného objektu. Problém více překrývajících se detekcí kolem jednoho objektu, je řešen hledáním lokálního maxima, které vybere okno s největší pozitivní odezvou z klasifikátoru a zbylá překrývající se okna jsou zahozena [4]. Metoda Sliding 9
14 Obrázek 2.7: Sliding window - jednotlivé fáze lokalizační metody. window je díky své jednoduchosti a spolehlivosti hojně využívaná. Vyhledání nedosahuje vysoké rychlosti, ale v ostatních ohledech se jedná o dodnes nepřekonaný přístup. Pro lepší představu je uveden algoritmus v pseudokódu 1. Algorithm 1 Sliding window Natrénování klasifikátoru na n m obrázcích. Nastav práh t a krok x a y ve směru x a y Konstrukce Gaussovy pyramidy for Pro každou vrstvu pyramidy do Aplikuj klasifikátor na každé okno n m s krokem x a y na dané úrovni a získej odezvu c. if c > t then Vlož odkaz na okno do seznamu L společně s hodnotou c end if end for for Pro každé okno W L - vybíráme od největší hodnoty odezvy c do Okna nalezená ve vyšší vrstvě pyramidy roztáhni na původní velikost for Pro okna U W do Vymaž okna, která se výrazně překrývají s W end for end for L nyní obsahuje seznam detekovaných objektů 10
15 2.7 Effective subwindow search Metoda Effective subwindow search dále jen ESS se zabývá efektivním vyhledáním objektu v obraze. V rozsáhlém množství možných kandidátních regionů (obrazových oken) se zaměřuje pouze na ty, které skutečně mohou obsahovat hledaný objekt. Namísto kompletního prohledání všech možností, je hledání zaměřeno na regiony s vysokým ohodnocením, které je získáno jako výstup funkce kvality regionu f. Regiony s nízkým skóre jsou ignorování, díky čemuž je zajištěna vyšší efektivita oproti sliding window 2.6. Další odlišností oproti metodě sliding window je způsob notace výřezu obrazu. Zatímco Sliding window pracuje s oknem, které má přesně dané souřadnice v osách x,y - horní, spodní a levý, pravý okraj (t,b,l,r), tak ESS používá u každého rozměru dvě hodnoty (nízkou a vysokou) resp. Low a High, díky tomuto vymezení intervalů u každé hrany pracuje ESS s množinou oken (regionem) namísto jednoho okna. Výsledná reprezentace regionu je daná enticí [T, B, L, R], kde T = [t lo, l hi ] atd. Pro lepší představu je uveden obrázek 2.8. L = [llo,lhi] R = [rlo,rhi] x T = [tlo,thi] Největší možný obdelník [t lo,b hi,l lo,r hi ] Nejmenší možný obdelník [t hi,b lo,l hi,r lo ] B = [blo,bhi] y Obrázek 2.8: Reprezentace regionu [T, B, L, R] v algoritmu ESS. Mezní funkce kvality Pro ohodnocení okna využíváme funkci kvality f - vyšší hodnota vetší pravděpodobnost výskytu hledaného objektu. ESS používá mezní funkci kvality ˆf, která udává maximální výstup funkce kvality f (Rovnice 2.6) v rámci regionu (množiny oken). Dále je jedno okno značené R a region oken R. Mezní funkce kvality musí splňovat následující podmínky: ˆf(R) max f(r) R R (2.6) ˆf(R) = f(r) když okno R je jediné v množině R (2.7) 11
16 Algorithm 2 Effective Subwindow Search Require: obrázek I R n m Require: mezní funkce kvality ˆf Ensure: (t max, b max, l max, r max ) = arg max R I f(r) initialize P Prázdná prioritní fronta [T, B, L, R] = [0, n] [0, n] [0, m] [0, m] repeat split [T, B, L, R] [T 1, B 1, L 1, R 1 ] [T 2, B 2, L 2, R 2 ] Nové regiony vložíme do prioritní fronty P spolu se skóre push ([T 1, B 1, L 1, R 1 ], ˆf([T 1, B 1, L 1, R 1 ])) into P push ([T 2, B 2, L 2, R 2 ], ˆf([T 2, B 2, L 2, R 2 ])) into P retrive top state [T, B, L, R] from P until [T, B, L, R] Až obsahuje pouze jeden obdelník (t max, b max, l max, r max ) = [T, B, L, R] Výsledná lokalizace Algoritmus Základním kostrou ESS metody je algoritmus 2 uspořádaného prohledávání založený na branch-and-bound [8]. Algoritmus v každém cyklu rozdělí aktuální region na dva disjunktní regiony, které jsou po ohodnocení mezní funkcí kvality zařazeny zpět do prioritní fronty - jako priorita je považovaný právě výstup z mezní funkce kvality ˆf(R). Samotné rozdělení regionu je provedeno v rozměru největšího intervalu jak je naznačeno na obrázku 2.9. Pro další průchod cyklem je z fronty vyjmut nejvíce prioritní region. Tímto způsobem je cyklus prováděn až do doby, kdy nejvíce prioritní region ve frontě obsahuje pouze jedno okno tzn. nelze dále dělit. V tom případě je nalezené okno globálním maximem jak znázorňuje rovnice 2.7 [7]. Konstrukce funkce kvality Funkce kvality vychází z BoW (Podkapitola 2.4) a SVM (Podkapitola 2.5) klasifikátoru se základním lineárním jádrem (Rovnice 2.8), kde vstupními daty jsou histogramy h i přes i trénovacích dat a.,. značí skalární součin v R K s histogramem h aktuálně hodnoceného okna R. Dále α i a β jsou natrénované parametry SVM klasifikátoru. Rovnice 2.8 lze převést na rovnici 2.9 díky linearitě skalárního součinu a použití vztahu w j = i α ih i j, který vytváří váhy w j pro každou třídu histogramu j. f(r) = β + i α i h, h i (2.8) f(r) = β + n w cj (2.9) Druhá rovnice 2.9 reprezentuje příspěvek každého klíčového bodu z okna R k celkové hodnotě funkce kvality. Zde je c j označení třídy do které patří detekovaný klíčový bod x j. V případě použití s BoW je třídou myšleno vizuální slovo, ke kterému je klíčový bod x j přiřazen na základě podobnosti. Celkový počet klíčových bodů je n. Uvedený přístup nám umožňuje vyhodnocovat funkci kvality u oken, které jsou výřezy původního obrazu (R I), díky tomu, že provádíme sumu pouze přes klíčové body nacházející se v dané podoblasti. j=1 12
17 Konstrukce mezní funkce kvality Pokud máme definovanou funkci kvality (Rovnice 2.9), konstrukce mezní funkce kvality ˆf už není složitá. Její definici je ˆf = f + + f, kde f + značí sumu přes klíčové body, které mají pozitivní váhu w cj (Rovnice 2.9) a naopak f je suma přes klíčové body s negativní váhou. Výsledná rovnice mezní funkce kvality má podobu: ˆf(R) = f + (R max ) + f (R min ) (2.10) R max a R min jsou největší a nejmenší okna z regionu R (Obrázek 2.8). V konečném důsledku je možné z funkce kvality odstranit konstantu β, jelikož na výsledek porovnání dvou mezních funkcí různých regionů nemá žádný vliv. L = [llo,lhi] R = [rlo,rhi] x T = [tlo,thi] Největší možný obdelník [t lo,b hi,l lo,r hi ] Nejmenší možný obdelník [t hi,b lo,l hi,r lo ] B = [blo,bhi] y L= [llo,lhi] R = [rlo,rhi] x L= [llo,lhi] L = [rlo,rhi] x T = [tlo,thi] Největší možný obdelník [t lo,b hi,l lo,r hi ] T = [tlo,thi] Největší možný obdelník [t lo,b hi,l lo,r hi ] Nejmenší možný obdelník [t hi,b lo,l hi,r lo ] Nejmenší možný obdelník [t hi,b lo,l hi,r lo ] B = [blo,bhi] y B = [blo,bhi] y Obrázek 2.9: Dělení regionů podél největšího okraje. 13
18 Vnitřní implementace mezní funkce kvality Pro rychlý výpočet mezní funkce kvality, je používán integrální obraz. Vstupem pro jeho konstrukci jsou detekované pozice vizuálních slov včetně jejich váhy, která je získaná po natrénování SVM. Je vytvořena matice o velikosti vstupního obrazu, kde je na pozici danou pozicí detekce vizuálního slova vložena jeho váha. Z takto vytvořená matice m je vypočten integrální obraz I podle rovnice 2.11, kde I (x) je pozice v integrálním obraze x = (x, y) [11]. i x j y I (x) = m(i, j) (2.11) i=0 j=0 Jinak řečeno integrální obraz na pozici (x, y) obsahuje součet vah, které jsou v obdélníku definovaném počátkem souřadnic (0, 0) a bodem (x, y). Pokud je takto vytvořen integrální obraz, je možné jej použít pro výpočet vah detekovaných vizuálních slov v rámci jakékoliv oblasti v obraze, jak je znázorněno na obrázku (0,0) x A B D - C - B + A C D Integrální obraz y Obrázek 2.10: Výpočet mezní funkce pro dané okno v obraze pomocí integrálního obrazu. 14
19 Kapitola 3 Návrh řešení Hlavním cílem této práce je vytvořit aplikaci, schopnou detekovat a lokalizovat psa ve fotografiích, které jsou předloženy na vstupu aplikace. V předešlé kapitole 2 byl uveden popis vybraných technik a postupů počítačového vidění, které jsou zvažovány jako možné řešení práce. Tato kapitola obsahuje návrh řešení, za použití výběru z postupů uvedených dříve. Navržené řešení se opírá o tyto algoritmy: BoW (Podkapitola 2.4), K-means (Podkapitola 2.3) a ESS (Podkapitola 2.7). Kapitola se dále zaobírá rozdělením navrhovaného řešení na několik vzájemně provázaných částí. V poslední podkapitole 3.2 je popsáno získání trénovací a lokalizační sady fotografií. 3.1 Obecný návrh Činnost aplikace je rozdělena do několik částí (fází). Klíčové je rozdělení činnosti aplikace na část starající se o trénování a část lokalizační, která využívá natrénovaných modelů z předešlé fáze k vyhledání cílového objektu v obraze. Část trénovací se dále dělí na fázi trénování slovníku vizuálních slov (BoW) a fázi trénování lokalizace. Níže jsou uvedeny všechny fáze, jako výčet položek, v pořadí jak následují za sebou pro správnou činnost aplikace. U jednotlivých fází je uvedena jejich funkce spolu s očekávanými vstupy a výstupy: Fáze trénování BoW (Obrázek 3.1) Vstup * Trénovací obrázky - positivní, negativní Funkce * Vytvoření BoW modelu * Ke každému trénovacímu obrázku je vytvořen histogram vizuálních slov Výstup * Slovník BoW * Histogramy vizuálních slov 15
20 Fáze trénování lokalizace (Obrázek 3.2) Vstup * Slovník BoW * Histogramy vizuálních slov * Obrázky určené k lokalizaci psa * Souřadnice výskytů psů v naší datové sadě Funkce * Natrénování SVM klasifikátoru * Extrahování obrazových příznaků ze vstupních obrázků * Přiřazení obrazového příznaku k nejbližšímu vizuálnímu slovu z BoW * Provedení ESS lokalizačního algoritmu * Výpočet přesnosti lokalizace Výstup * Zápis úspěšnosti lokalizace spolu s aktuálním nastavením parametrů do souboru výsledků Obrázek 3.1: Diagram fáze trénování BoW - slovníku vizuálních slov. 16
21 Obrázek 3.2: Diagram fáze trénování lokalizace. 17
22 Fáze lokalizace Vstup * Obrázky určené k lokalizaci psa Funkce * Použití nejpřesnějšího modelu z předešlé fáze * Vyhledá kde v obraze s největší pravděpodobností je pes Výstup * Vytvořena kopie vstupního obrázku se zaznačenou detekcí Výsledek práce má podobu jedné konzolové aplikace. Fází je v tomto případě myšleno spuštění konzolové aplikace s danými parametry. Výčet parametrů a jejich význam je popsán v další kapitole Datová sada Pro vytvoření slovníku vizuálních slov je potřeba patřičně velká datová sada obrázků. V případě, že detekujeme jeden objekt - v našem případě psa, je potřeba vytvořit dvě sady obrázků. Jedna sada obrázků se označuje jako pozitivní a obsahuje instance hledaného objektu. Druhá sada obrázků se nazývá negativní a obsahuje obrázky, které vyobrazují cokoliv jiného než hledaný objekt. Je vhodné zkonstruovat negativní datovou sadu tak, aby obsahovala obrázky okolí, ve kterém je typicky zasazen hledaný objekt. Hlavním zdrojem obrázků psů pro tuto práci je webový projekt kaggle vyhlašující klasifikační soutěže. U jedné konkrétní klasifikační soutěže [1], ve které je vyhlášena soutěž o nejlepší výsledek klasifikace mezi kočkami a psy, je volně dostupná datová sada čítající cca fotografií psů. Tyto obrázky nejsou použity přímo, ale jsou ještě dále upraveny. Posloupnost provedených úprav je zobrazena níže (Obrázek 3.6). Obrázek 3.3: Originální podoba. Obrázek 3.4: Převedení na stupně šedi. Obrázek 3.5: Oříznutí nadbytečného okolí. Obrázek 3.6: Posloupnost úprav pozitivních trénovacích fotografií 18
23 Negativní sada obrázků se skládá z fotografií přírody, městského prostředí a lidí. Většina fotografií je stažena z webového projektu imagenet 1, který zpřístupňuje rozsáhlou databází fotografií v různých kategorií. Poslední datová sada důležitá pro řešení práce je sada fotografií psů, kde není provedeno ořezání nadbytečného okolí, namísto toho je zapsáno umístění psa ve fotografii do souboru s lokacemi. Tato datová sada je uplatněna ve fázi trénování lokalizace, která vypočtenou lokaci porovnává s opravdovou, aby bylo možné dále ladit parametry modelu. Tabulka 3.1 pro přehlednost zobrazuje všechny použité datové sady obrázků spolu s umístěním v rámci složky Images a počtem obrázků. Datová sada Počet obrázků Umístění Pozitivní 861 Images\Train\Dog Negativní 1542 Images\Train\Other Lokalizační 100 Images\TestESS Tabulka 3.1: Tabulka všech použitých datových sad včetně počtu obrázků. Výběr obrazových příznaků Jelikož se vyskytuje hledaný objekt v datové sadě v různých velikostech a je různě natočen, byly vybrány jako obrazové příznaky SIFT a SURF, které odolávají obrazovým transformacím
24 Kapitola 4 Implementace Obsahem kapitoly je popis implementace, která vychází z návrhu uvedeného v předešlé kapitole 3. Výsledkem implementace je konzolová aplikace schopná detekce a lokalizace psa ve fotografii. Jednou ze základních součástí aplikace je knihovna počítačového vidění OpenCV. Za účelem seznámení se s možnostmi OpenCV byl použit jazyk Python, který umožňuje rychlí vývoj, avšak za cenu menší běhové rychlosti. Z důvodu potřeby zvýšit rychlost běhu aplikace byl následně zvolen jazyk C++, který kompiluje aplikaci do nativního kódu díky čemuž je o poznání rychlejší než za použití Pythonu. 4.1 Použité vývojové prostředí Jelikož je výsledná konzolová aplikace cílena pro Windows a je napsána v C++, bylo zvoleno jako vývojové prostředí Microsoft Visual Studio Community 1, které je zdarma pro samostatné vývojáře, opensource projekty, vědecký výzkum, vzdělávání a malé profesionální týmy. Mezi další možné alternativy vývojových prostředí umožňující vývoj v C++ na Windows patří např. Code::Blocks 2 a NetBeans 3. Mezi hlavní důvody výběru Microsoft Visual Studio Community patří kvalitní debugger, který v přehledné formě umožňuje přístup k aktuálním hodnotám proměnných po spuštění aplikace. Mezi další často využívanou funkci patří IntelliSense, které napomáhá správnému volání hlaviček funkcí a zápisu proměnných. 4.2 OpenCV OpenCV (Open source Computer Vision) je multiplatformní knihovna zaměřená na počítačové vidění a zpracování obrazu v reálném čase. OpenCV byla vyvinuta firmou Intel, jako iniciativa se záměrem zrychlit pokrok v počítačovém vidění a dopomoci při vývoji aplikací zpracovávající obraz. Knihovna je dostupná pod licencí BSD, což umožňuje její využití pro komerční i nekomerční účely. Knihovna samotná je napsaná v optimalizovaném C/C++ a při svém běhu dokáže využívat vícejádrové procesory. OpenCV disponuje několika rozhraními, díky kterým je umožněn vývoj v jazycích C, C++,Python, Java a to na několika platformách Windows, Linux, Mac OS, ios a Android. Knihovna obsahuje více než
25 algoritmů, které kromě počítačového vidění a zpracování obrazu zpřístupňují také algoritmy strojového učení [6]. 4.3 Rozhraní aplikace Výsledná aplikace je spustitelný soubor doglocalization.exe určený pro spuštění z příkazové řádky. Nastavením parametrů při spuštění definuje chování aplikace. Níže je uveden příklad spuštění v příkazové řádce systému Windows: doglocalization.exe [Parametry] Parametry V předešlé kapitole byly definovány tři fáze činnosti programu a to fáze trénování BoW, fáze trénování lokalizace a fáze lokalizace. V této kapitole je fáze chápána jako stav programu a je nastavena jedním z uvedených parametrů: Fáze trénování BoW nastavena parametrem -trainbow Fáze trénování lokalizace nastavena parametrem -trainlocalization Fáze lokalizace -localization nebo -localize Po nastavení parametru stavu je potřeba nastavit další parametry, které jsou specifické pro jednotlivé stavy. Výjimku tvoří poslední stav -localize, který pro svou činnost nevyžaduje žádné další parametry. Parametr Význam Stav trainbow -w [N1] [N2] Počet vizuálních slov modelu BoW, které se mají vytvořit. N1 počet pro třídu dog a N2 pro other -SIFT -SURF -SURFe Detekce obrazových příznaků pomocí SIFT algoritmu. Detekce obrazových příznaků pomocí SURF algoritmu. Detekce obrazových příznaků pomocí SURF algoritmu v rozšířené verze s deskriptorem velikosti 128b Tabulka 4.1: Tabulka parametrů kombinující se s parametrem -trainbow. Parametry stavu trainbow (Tabulka 4.1) jsou důležité pro specifikaci BoW modelu, který je výstupem tohoto spuštění programu. Parametr specifikující algoritmus detekce obrazových příznaků je vybrán pouze jeden. Další tabulka 4.2 zobrazuje parametry pro stav trainlocalization. V tomto stavu je načten z disku BoW model, vybraný parametry -w a příznakovým algoritmem. Po načtení BoW modelu, je natrénovaný SVM klasifikátor s penalizační konstantou danou parametrem c a je provedena lokalizace na testovací lokalizační sadě obrázků. 21
26 Parametr Význam Stav trainlocalization -w [N1] [N2] Specifikace parametrů modelu BoW, který bude načten ze souboru -SIFT -SURF -SURFe Detekce obrazových příznaků pomocí SIFT algoritmu. Detekce obrazových příznaků pomocí SURF algoritmu. Detekce obrazových příznaků pomocí SURF algoritmu v rozšířené verze s deskriptorem velikosti 128b -s nebo -show Zakreslit detekovanou lokalizaci do obrázku a uložit pro náhled. -c Penalizační parametr pro vytvoření SVM klasifikátoru Tabulka 4.2: Tabulka parametrů kombinující se s parametrem -trainbow. Zpracování parametrů je zajištěno voláním funkce getparams, která vrací zpracované parametry ve struktuře tparams. 4.4 Přehled důležitých částí implementace Detekce a extrakce příznaků K detekci a extrakci příznaků jsou využity prostředky z knihovny OpenCV. Zkompilovaná knihovna OpenCV 3.1, která je dostupná ke stažení, nabízí k použití pouze některé obrazové příznaky Pro účel této práce jsou potřeba obrazové příznaky SURF a SIFT, které je nutné začlenit do zdrojových kódů OpenCV a poté provést kompilaci celé knihovny vlastnoručně. K uložení obrázku do paměti se používá funkce imread(), která obrázek daný parametrem uloží do matice (Třída Mat). Matice je jedním ze základních datových typů OpenCV spolu s vectorem (cv:vec), bodem (cv:point) a dalšími. Detektor příznaků je vytvořen, ihned po tom co jsou zpracovány parametry příkazové řádky. Detektor reprezentuje třída FeatureDetector, která má metodu detect() pro získání pozic klíčových bodů ze vstupního obrázku. Poté co jsou detekovány klíčové body, je využita další funkce detektoru a to funkce compute(), která klíčové body převede na deskriptory. Výsledné deskriptory jsou vektory pevné délky, uloženy jako řádky do výsledné matice deskriptorů. Vytvoření Bag of Words reprezentace a trénovací histogramy Pro vytvoření BoW je využita třída z OpenCV BOWKMeansTrainer. Při vytváření instance této třídy, je nutné zadat počet vizuálních slov, kolik si jich přejeme vytvořit a metodu vytvoření vizuálních slov - v našem případě KMEANS_PP_CENTERS. Objekt třídy BOWKMeansTrainer obsahuje metodu add(), která přebírá matici deskriptorů a přidává ji k deskriptorům vloženým dříve. Poté, co vložíme deskriptory ze všech trénovacích obrázků do objekt BoW, je možné zavolat metodu cluster(), která za pomocí metody K-means vytvoří K středů v prostoru deskriptorů tzn. zadaný počet vizuálních slov. Volání metody cluster() vrátilo matici, kde každý řádek reprezentuje jedno vizuální slovo. Jelikož je jedním z parametrů aplikace počet vizuálních slov pro jednu a druhou klasifikační třídu, je 22
27 provedeno natrénování BoW dvakrát - pro každou třídu zvlášť. Nakonec jsou dvě matice deskriptorů spojeny a tím je vytvořen kompletní slovník vizuálních slov. Poté, co je vytvořený slovník vizuálních slov, je možné znovu projít všechny trénovací obrázky a vytvořit pro každý z nich histogram výskytu vizuálních slov. Vytvoření takových histogramů zajišťuje další třída OpenCV BOWImgDescriptorExtractor, která při vytváření instance vyžaduje stejný objekt detektoru FeatureDetector, jaký byl použit při vytváření deskriptorů pro BoW. Metodou setvocabulary() třídy BOWImgDescriptorExtractor je nastaven slovník vizuální slov získaný dříve. Nyní už tedy nastává další průchod přes trénovací obrázky, kdy je pro každý získán histogram pomocí metody compute(). Všechny vypočítané histogramy jsou ukládány jako řádky do jedné matice. Současně je provedeno vložení čísla - označující třídu trénovacího obrázku, do matice labels. Číslo v matici labels slouží k rozpoznání, ke které třídě patří histogram z daného řádku matice histogramů. Všechny tři matice - matice vizuálních slov, histogramů a matice labels, jsou uloženy do souboru. Název souboru je tvořen hodnotami parametrů s jakými byl vytvořen BoW. Celý popsaný proces je vykonán, je-li aplikace ve stavu trainbow. Vytvořený soubor je vstupem do aplikace spuštěné ve stavu trainlocalization popsané v další sekci. SVM klasifikátor Aplikace spuštěná ve stavu trainbow nám vytvoří všechny matice dat, které jsou nezbytné pro natrénování SVM klasifikátoru. Knihovna OpenCV obsahuje také algoritmy strojového učení, mezi které patří i SVM. Algoritmus SVM je dostupný pod stejnojmenným názvem třídy SVM. Po vytvoření objektu této třídy, je nastaven typ SVM na SVM::C_SVC a jádro SVM na lineární SVM::LINEAR. Jako Poslední je nastavena penalizační konstanta předaná jako parametr -c. Pro samotné natrénování je volaná metoda train() třídy SVM s maticí trénovacích histogramů a maticí labels. Obě matice jsou načtené ze souboru. Transformace dat pro ESS Transformace dat pro ESS následuje poté, co je provedeno natrénování SVM klasifikátoru. Na objektu třídy SVM není provedena standardní metoda predict() pro klasifikaci, ale celý objekt je vstupem do vlastní funkce getsvmweightvector(), která z natrénovaného SVM vyextrahuje váhový vektor, udávající váhy jednotlivých vizuálních slov z našeho BoW. Nyní nastává cyklus přes všechny obrázky v lokalizační sadě. V cyklu je pro každý obrázek volána funkce getdataforess(), která získá všechny potřebné data z obrázku pro provedení ESS lokalizace. Tělo funkce detekuje obrazové příznaky a následně je volána metoda compute() třídy BOWImgDescriptorExtractor, její výstup je dále upraven, za účelem získání nejbližšího vizuálního slova ke každému obrazovému příznaku. Pozice detekovaných obrazových příznaků spolu s přiřazeným klíčovým bodem a váhovým vektorem SVM klasifikátoru, jsou vstupme do funkce pyramid_search(), která provede ESS a vrací souřadnice konečné lokalizace ve struktuře Box. 23
28 Kapitola 5 Testování V této kapitole je uveden postup testování aplikace a zaznamenání výsledků, aby následně mohlo dojít k vybrání parametrů, při kterých je dosaženo nejlepších výsledků. 5.1 Meření přesnosti lokalizace Pro měření přesnosti lokalizace (Obrázek 5.1) je použita rovnice 5.1, kde A 1 je načtená správná oblast lokace psa, A 2 je detekovaná oblast, která je výstupem aktuálního modelu a s je výsledná přesnost, jejíž obor hodnoty je 0, 1. Výsledek s = 0 znamená, že nebyl vytvořen žádný průsečík s cílovým objektem, naproti tomu s = 1 značí absolutní shodu detekce s hledaným objektem. Někde mezi těmito extrémy leží práh t, který když není překročen hodnotou s (Rovnice 5.3) je daná detekce považovaná za neúspěšnou (false positive), jinak je detekce považována za úspěšnou (true positive). Nastavení prahu je na hodnotu t = 0.45, aby i částečné detekce byly brány jako úspěšné (Obrázek 5.2). s = A 1 A 2 A 1 A 2 (5.1) s t TP true positive (5.2) s < t FP false positive (5.3) Celková přesnost Celkové přesnost lokalizace na všech 100 obrázcích lokalizační datové sady je dána jako součet přesností lokalizací z každého obrázku. Celková přesnost je počítána při spuštění aplikace ve stavu trainlocalization. Po vypočtení je zaznamenána do CSV souboru results.csv spolu s parametry BoW a SVM. Pro lepší představu je níže uvedena tabulka 5.1, která znázorňuje obsah výstupního CSV souboru. VW Dogs VW Other Feature SVM C Score Precision SIFT SIFT SURF Tabulka 5.1: Tabulka znázorňující obsah CSV souboru result.csv. 24
29 Průnik Obrázek 5.1: Modře je znázorněná správná lokalizace a červeně je výstupní lokalizace. Sloupec score udává počet detekcí, které měly přesnost lokalizace vetší než 0, 5. První 4 sloupce jsou parametry modelu, které zadáváme při spouštění aplikace. Poslední sloupec precision je celková přesnost lokalizace. 5.2 Vyhodnocení výsledků Vyhodnocení výsledků se skládá ze zpracování souboru result.csv a nalezení největší dosahované přesnosti lokalizace. Mezi hledané parametry patří: Typ obrazových příznaků (SIFT, SURF 64b/128b) Počet vizuálních slov na jednu třídu pro BoW Penalizační parametr SVM klasifikátoru Z obsahu CSV souboru jsou vytvořeny tři grafy. Každý graf reprezentuje jeden typ obrazového příznaku. Na vodorovné ose jsou BoW modely s rozdílným počtem vizuálních slov na jednu třídu. Jako hodnota je vynesena největší celková přesnost, které bylo dosaženo u daného BoW při testování s různým penalizačního parametrem SVM. Obrázek 5.3 zobrazuje graf přesnosti lokalizace pro SIFT příznaky a obrázek 5.4 pro SURF příznaky - ve dvou verzích s 64b a 128b deskriptorem. Nejlepších výsledků bylo dosaženo s parametry: Počet vizuálních slov na třídu 350 Obrazový příznak Penalizační konstanta SVM 25 SIFT Práh přesnosti lokalizace 0,45 Průměrná rychlost lokalizace 0,679 ms Celková úspěšnost 47 % 25
30 Obrázek 5.2: Příklad výsledné lokalizace naší aplikací (červený rám) přesnost lokalizace Obrazový příznak SIFT 43 Součet přesností lokalizace Počet vizuálních slov na jednu třídu Obrázek 5.3: Trénování modelů za použití SIFT obrazových příznaků. 26
31 Součet přesností lokalizace 40 Obrazový příznak SURF 64bitů 39 Součet přesností lokalizace Počet vizuálních slov na jednu třídu 40 Obrazový příznak SURF 128bitů 39, , , , Počet vizuálních slov na jednu třídu Obrázek 5.4: Trénování modelů za použití SURF obrazových příznaků 27
32 Kapitola 6 Závěr Cílem této práce bylo seznámit se s principy detekce a lokalizace objektů v obraze a následně uplatnit nabyté znalosti, při návrhu a implementaci řešení zadaného tématu. Tématem práce byla Rychlá detekce přírodních objektů a nabízela k výběru ze spousty možných objektů k rozpoznávání. Nakonec byla jako cíl detekce a lokalizace zvolena zvířata - konkrétněji psi. Po nastudování možných způsobů řešení, byla zvolena metoda Bag of Words, vytvářející histogramy vizuálních slov, které jsou dále použity s SVM algoritmem k natrénování klasifikátoru. Dalším cílem práce bylo použití detekčního a lokalizačního algoritmu, který by svou rychlostí předčil často využívanou metodu Sliding Window (metoda klouzavého okénka). Z tohoto důvodu byl pro detekci a lokalizaci použit algoritmus Effective subwindow search, který při hledání objektu v obraze zaměřuje pozornost na ty regiony, kde je více pravděpodobný výskyt psa, díky tomu bylo dosaženo lepšího průchodu obrazem, než v případě Sliding Window a tedy i vyšší rychlosti. Současně byla vytvořena datová sada fotografií psů o velikosti 861 obrázků a další sada 100 fotografií, s údajem o pozici psa, určená k trénování přesnosti lokalizace. Z trénovací sady fotografií je patrné, že hledaný pes se může nacházet v různém rozlišení a různě natočený, proto byly zvoleny jako obrazové příznaky algoritmy SIFT a SURF, která disponují velkou robustností vůči obrazovým transformacím. Výsledné řešení má podobu konzolové aplikace. Průměrná rychlost detekce a lokalizace je 0,679 ms, což je uspokojivé. Maximální dosažená úspěšnost lokalizace psa v obraze je 47 %, zde je prostor pro další zlepšování. Do budoucna je vhodné najít další obrazové příznaky, které napomohou k vytvoření přesnějšího klasifikátoru. Dále by ke zlepšení výsledků přispělo rozšíření datové sady fotografií. 28
33 Literatura [1] Kaggle - Dogs vs. Cats. [online], [cit ]. URL [2] OpenCV - Introduction to SIFT. [online], [cit ]. URL [3] OpenCV - Introduction to Support Vector Machines. [online], [cit ]. URL introduction_to_svm.html [4] Forsyth, D. A.; Ponce, J.: Computer Vision: A Modern Approach. Pearson, druhé vydání, 2011, ISBN X, s. [5] Harrington, P.: Machine learning in action. Shelter Island, N.Y.: Manning Publications Co., c2012, ISBN , s. [6] Laganiére, R.: OpenCV 2 computer vision application programming cookbook. Brimmingham: Packt Publishing, 2011, ISBN [7] Lampert, C.; Blaschko, M.; Hofmann, T.: Efficient Subwindow Search: A Branch and Bound Framework for Object Localization. IEEE Transactions on Software Engineering, ročník 31, 2009: s , doi: /tpami [8] Lawler, E.; Wood, D.: Branch-and-bound methods: A survey. Operations Research, ročník 14, č. 4, 1966: s [9] Prateek, J.: Support Vector Machines. [online], [cit ]. URL [10] Rey Otero, I.; Delbracio, M.: Anatomy of the SIFT Method. Image Processing On Line, ročník 4, 2014: s [11] Wikipedia: Summed area table. [online], [cit ]. URL 29
34 Přílohy 30
35 Seznam příloh A Obsah DVD 32 31
36 Příloha A Obsah DVD Bin/ Dll/ Obsahuje spustitelný program včetně README.txt OpenCV knihovny Images/ Latex/ Datové sady fotografií Zdrojový kód bakalářské práce v L A TEXu Lib/ Pdf/ Instalaci OpenCV 3.1 a VS C++ Text bakalářské práce v pdf Source/ Tests/ Zdrojové soubory, projekt v Microsoft Visual Studio Community Soubory vygenerované při testování programu 32
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků lukas.mach@gmail.com Přílohy (videa, zdrojáky, ) ke stažení na: http://mach.matfyz.cz/sift Korespondence
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Trénování sítě pomocí učení s učitelem
Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup
Jasové transformace. Karel Horák. Rozvrh přednášky:
1 / 23 Jasové transformace Karel Horák Rozvrh přednášky: 1. Úvod. 2. Histogram obrazu. 3. Globální jasová transformace. 4. Lokální jasová transformace. 5. Bodová jasová transformace. 2 / 23 Jasové transformace
Lineární klasifikátory
Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout
Roman Juránek. Fakulta informačních technologíı. Extrakce obrazových příznaků 1 / 30
Extrakce obrazových příznaků Roman Juránek Ústav počítačové grafiky a multimédíı Fakulta informačních technologíı Vysoké Učení technické v Brně Extrakce obrazových příznaků 1 / 30 Motivace Účelem extrakce
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) 1 Obecný popis metody Particle Image Velocimetry, nebo-li zkráceně PIV, je měřící
Zobrazte si svazy a uspořádané množiny! Jan Outrata
LatVis Zobrazte si svazy a uspořádané množiny! Jan Outrata Motivace potřeba visualizovat matematické (algebraické) struktury rychle, přehledně a automaticky počítačovými prostředky ruční kreslení je zdlouhavé
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
Automatické rozpoznávání dopravních značek
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ Jiří Hofman Automatické rozpoznávání dopravních značek Semestrální práce z předmětu ITS 2012 Obsah 1. Automatické rozpoznávání dopravních značek (ATSR)...
Strojové učení se zaměřením na vliv vstupních dat
Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications
Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost
Rozpoznávání tváří I Vojtěch Franc Centrum strojového vnímání, ČVUT FEL Praha Biometrie ZS 2013 Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost Úlohy rozpoznávání tváří: Detekce Cíl: lokalizovat
12 Metody snižování barevného prostoru
12 Metody snižování barevného prostoru Studijní cíl Tento blok je věnován základním metodám pro snižování barevného rozsahu pro rastrové obrázky. Postupně zde jsou vysvětleny důvody k použití těchto algoritmů
TÉMATICKÝ OKRUH Softwarové inženýrství
TÉMATICKÝ OKRUH Softwarové inženýrství Číslo otázky : 24. Otázka : Implementační fáze. Postupy při specifikaci organizace softwarových komponent pomocí UML. Mapování modelů na struktury programovacího
Matematika pro informatiky
(FIT ČVUT v Praze) Konvexní analýza 13.týden 1 / 1 Matematika pro informatiky Jaroslav Milota Fakulta informačních technologíı České vysoké učení technické v Praze Letní semestr 2010/11 Extrémy funkce
DETEKCE OBJEKTŮ POMOCÍ KINECTU
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND
Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.
Optimální rozdělující nadplocha. Support vector machine. Adaboost. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Opakování Lineární diskriminační
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH Viktor Haškovec, Martina Mudrová Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Abstrakt Příspěvek je věnován zpracování biomedicínských
Úvod do optimalizace, metody hladké optimalizace
Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady
Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B. 1. úloha (4 body) Kolik existuje cest délky 4 v grafu K11? 2.
PŘIJÍMACÍ TEST Z INFORMATIKY A MATEMATIKY NAVAZUJÍCÍ MAGISTERSKÉ STUDIUM V OBORU APLIKOVANÁ INFORMATIKA FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITY HRADEC KRÁLOVÉ ČÁST A Oborové číslo Hodnocení - část
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND
Obsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
Iterační výpočty. Dokumentace k projektu č. 2 do IZP. 24. listopadu 2004
Dokumentace k projektu č. 2 do IZP Iterační výpočty 24. listopadu 2004 Autor: Kamil Dudka, xdudka00@stud.fit.vutbr.cz Fakulta Informačních Technologií Vysoké Učení Technické v Brně Obsah 1. Úvod...3 2.
Analýza a zpracování digitálního obrazu
Analýza a zpracování digitálního obrazu Úlohy strojového vidění lze přibližně rozdělit do sekvence čtyř funkčních bloků: Předzpracování veškerých obrazových dat pomocí filtrací (tj. transformací obrazové
13 Barvy a úpravy rastrového
13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody
Detekce obličeje v obraze s využitím prostředí MATLAB
Detekce obličeje v obraze s využitím prostředí MATLAB T. Malach, P. Bambuch, J. Malach EBIS, spol. s r.o. Příspěvek se zabývá detekcí obličeje ve statických obrazových datech. Algoritmus detekce a trénování
geekovo minimum počítačového Nadpis 1 Nadpis 2 Nadpis 3
geekovo minimum Nadpis 1 Nadpis 2 Nadpis 3 počítačového vidění Adam Herout (doc. Jméno Ing. Příjmení Ph.D.) Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Vysoké učení technické
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
5. Lokální, vázané a globální extrémy
5 Lokální, vázané a globální extrémy Studijní text Lokální extrémy 5 Lokální, vázané a globální extrémy Definice 51 Řekneme, že f : R n R má v bodě a Df: 1 lokální maximum, když Ka, δ Df tak, že x Ka,
LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015
LBP, HoG Ing. Marek Hrúz Ph.D. Plzeň Katedra kybernetiky 29. října 2015 1 LBP 1 LBP Tato metoda, publikovaná roku 1996, byla vyvinuta za účelem sestrojení jednoduchého a výpočetně rychlého nástroje pro
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Algoritmy a struktury neuropočítačů ASN P3
Algoritmy a struktury neuropočítačů ASN P3 SOM algoritmus s učitelem i bez učitele U-matice Vektorová kvantizace Samoorganizující se mapy ( Self-Organizing Maps ) PROČ? Základní myšlenka: analogie s činností
11 Zobrazování objektů 3D grafiky
11 Zobrazování objektů 3D grafiky Studijní cíl Tento blok je věnován základním algoritmům zobrazení 3D grafiky. Postupně budou probrány základní metody projekce kolmé promítání, rovnoběžné promítání a
Projektč.3dopředmětuIZP. Maticové operace
Projektč.3dopředmětuIZP Maticové operace 17. prosince 2006 Kamil Dudka, xdudka00@stud.fit.vutbr.cz Fakulta informačních technologií Vysoké Učení Technické v Brně Obsah 1 Úvod 1 2 Analýza problému 1 2.1
Support Vector Machines (jemný úvod)
Support Vector Machines (jemný úvod) Osnova Support Vector Classifier (SVC) Support Vector Machine (SVM) jádrový trik (kernel trick) klasifikace s měkkou hranicí (soft-margin classification) hledání optimálních
Popis zobrazení pomocí fuzzy logiky
Popis zobrazení pomocí fuzzy logiky diplomová práce Ján Fröhlich KM, FJFI, ČVUT 23. dubna 2009 Ján Fröhlich ( KM, FJFI, ČVUT ) Popis zobrazení pomocí fuzzy logiky 23. dubna 2009 1 / 25 Obsah 1 Úvod Základy
Využití tabulkového procesoru MS Excel
Semestrální práce Licenční studium Galileo srpen, 2015 Využití tabulkového procesoru MS Excel Ing Marek Bilko Třinecké železárny, a.s. Stránka 1 z 10 OBSAH 1. ÚVOD... 2 2. DATOVÝ SOUBOR... 2 3. APLIKACE...
Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu
Metoda Monte Carlo a její aplikace v problematice oceňování technologií Manuál k programu This software was created under the state subsidy of the Czech Republic within the research and development project
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Zpracování digitalizovaného obrazu (ZDO) - Popisy III
Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování
Algoritmizace. 1. Úvod. Algoritmus
1. Úvod Algoritmizace V dnešní době již počítače pronikly snad do všech oblastí lidské činnosti, využívají se k řešení nejrůznějších úkolů. Postup, který je v počítači prováděn nějakým programem se nazývá
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz IV. LINEÁRNÍ KLASIFIKACE PRINCIPY KLASIFIKACE pomocí diskriminačních funkcí funkcí,
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová 5. Statistica StatSoft, Inc., http://www.statsoft.com, http://www.statsoft.cz. Verze pro Mac i PC, dostupná
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý
Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika
WhyCon: Přesný, rychlý a levný lokalizační systém
WhyCon: Přesný, rychlý a levný lokalizační systém Tomáš Krajník, Matías Nitsche, Peter Lightbody ČVUT Praha Univ. of Buenos Aires, Argentina Univ. of Lincoln, UK Apr 2018 Krajník, Nitsche http://github.com/gestom/whycon-orig
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
Rozdělování dat do trénovacích a testovacích množin
Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném
Datové struktury 2: Rozptylovací tabulky
Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:
Rozpoznávání v obraze
Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd
PRODUKTY. Tovek Tools
jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných
Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje
jsou souborem klientských desktopových aplikací určených k indexování dat, vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci s velkým objemem textových
VZORCE A VÝPOČTY. Autor: Mgr. Dana Kaprálová. Datum (období) tvorby: září, říjen 2013. Ročník: sedmý
Autor: Mgr. Dana Kaprálová VZORCE A VÝPOČTY Datum (období) tvorby: září, říjen 2013 Ročník: sedmý Vzdělávací oblast: Informatika a výpočetní technika 1 Anotace: Žáci se seznámí se základní obsluhou tabulkového
VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu
VÝUKOVÝ MATERIÁL Identifikační údaje školy Vyšší odborná škola a Střední škola, Varnsdorf, příspěvková organizace Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632
Webové stránky. 16. Obrázky na webových stránkách, optimalizace GIF. Datum vytvoření: 12. 1. 2013. str ánk y. Vytvořil: Petr Lerch. www.isspolygr.
Webové stránky 16. Vytvořil: Petr Lerch www.isspolygr.cz Datum vytvoření: 12. 1. 2013 Webové Strana: 1/6 Škola Ročník Název projektu Číslo projektu Číslo a název šablony Autor Tématická oblast Název DUM
Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu
Excel - pokračování Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Př. Analýza prodeje CD základní jednoduché vzorce karta Domů Př. Skoky do dálky - funkce
Studentská tvůrčí a odborná činnost STOČ 2017
Studentská tvůrčí a odborná činnost STOČ 2017 Detekce a analýza pohybu osob založená na analýze obrazu Bc. Robin Antonič Mendelova univerzita v Brně, Zemědělská 1 20. dubna 2017 FAI UTB ve Zlíně Klíčová
Měření průtoku kapaliny s využitím digitální kamery
Měření průtoku kapaliny s využitím digitální kamery Mareš, J., Vacek, M. Koudela, D. Vysoká škola chemicko-technologická Praha, Ústav počítačové a řídicí techniky, Technická 5, 166 28, Praha 6 e-mail:
Microsoft Office. Excel vyhledávací funkce
Microsoft Office Excel vyhledávací funkce Karel Dvořák 2011 Vyhledávání v tabulkách Vzhledem ke skutečnosti, že Excel je na mnoha pracovištích používán i jako nástroj pro správu jednoduchých databází,
2. úkol MI-PAA. Jan Jůna (junajan) 3.11.2013
2. úkol MI-PAA Jan Jůna (junajan) 3.11.2013 Specifikaci úlohy Problém batohu je jedním z nejjednodušších NP-těžkých problémů. V literatuře najdeme množství jeho variant, které mají obecně různé nároky
Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně
Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších
Rosenblattův perceptron
Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného
REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB
62 REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB BEZOUŠKA VLADISLAV Abstrakt: Text se zabývá jednoduchým řešením metody nejmenších čtverců v prostředí Matlab pro obecné víceparametrové aproximační funkce. Celý postup
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ OBOR GEODÉZIE A KARTOGRAFIE KATEDRA VYŠŠÍ GEODÉZIE název předmětu úloha/zadání název úlohy Základy fyzikální geodézie 3/19 Legendreovy přidružené funkce
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM CÍLE KAPITOLY Využívat pokročilé možnosti formátování, jako je podmíněné formátování, používat vlastní formát čísel a umět pracovat s listy. Používat
[1] samoopravné kódy: terminologie, princip
[1] Úvod do kódování samoopravné kódy: terminologie, princip blokové lineární kódy Hammingův kód Samoopravné kódy, k čemu to je [2] Data jsou uložena (nebo posílána do linky) kodérem podle určitého pravidla
Interpolace, ortogonální polynomy, Gaussova kvadratura
Interpolace, ortogonální polynomy, Gaussova kvadratura Petr Tichý 20. listopadu 2013 1 Úloha Lagrangeovy interpolace Dán omezený uzavřený interval [a, b] a v něm n + 1 různých bodů x 0, x 1,..., x n. Nechť
Geometrické transformace
1/15 Předzpracování v prostoru obrazů Geometrické transformace Václav Hlaváč, Jan Kybic Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 40 regula Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague regula 1 2 3 4 5 regula 6 7 8 2 / 40 2 / 40 regula Iterační pro nelineární e Bud f reálná funkce
Automatické vyhledávání informace a znalosti v elektronických textových datech
Automatické vyhledávání informace a znalosti v elektronických textových datech Jan Žižka Ústav informatiky & SoNet RC PEF, Mendelova universita Brno (Text Mining) Data, informace, znalost Elektronická
NADSTAVBOVÝ MODUL MOHSA V1
NADSTAVBOVÝ MODUL MOHSA V1 Nadstavbový modul pro hierarchické shlukování se jmenuje Mod_Sh_Hier (MOHSA V1) je součástí souboru Shluk_Hier.xls. Tento soubor je přístupný na http://jonasova.upce.cz, a je
EXPERIMENTÁLNÍ METODY I. 2. Zpracování měření
FSI VUT v Brně, Energetický ústav Odbor termomechanik a technik prostředí prof. Ing. Milan Pavelek, CSc. EXPERIMENTÁLNÍ METODY I OSNOVA. KAPITOLY. Zpracování měření Zpracování výsledků měření (nezávislých
VYUŽITÍ MATLABU PRO VÝUKU NUMERICKÉ MATEMATIKY Josef Daněk Centrum aplikované matematiky, Západočeská univerzita v Plzni. Abstrakt
VYUŽITÍ MATLABU PRO VÝUKU NUMERICKÉ MATEMATIKY Josef Daněk Centrum aplikované matematiky, Západočeská univerzita v Plzni Abstrakt Současný trend snižování počtu kontaktních hodin ve výuce nutí vyučující
PÁS KARET. Autor: Mgr. Dana Kaprálová. Datum (období) tvorby: září, říjen 2013. Ročník: sedmý. Vzdělávací oblast: Informatika a výpočetní technika
Autor: Mgr. Dana Kaprálová PÁS KARET Datum (období) tvorby: září, říjen 2013 Ročník: sedmý Vzdělávací oblast: Informatika a výpočetní technika 1 Anotace: Žáci se seznámí se základní obsluhou tabulkového
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Semestrální práce Mozaika aneb Co všechno umí pan Voronoi
Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky Semestrální práce Mozaika aneb Co všechno umí pan Voronoi Plzeň, 2008 Aubrecht Vladimír Obsah 1 Zadání...
Vytěžování znalostí z dat
Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 8 1/26 Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec Department of Computer Systems Faculty of Information
OSTRAVSKÁ UNIVERZITA V OSTRAVĚ PŘÍRODOVĚDECKÁ FAKULTA
OSTRAVSKÁ UNIVERZITA V OSTRAVĚ PŘÍRODOVĚDECKÁ FAKULTA BAKALÁŘSKÁ PRÁCE 2002 SEDLÁK MARIAN - 1 - OSTRAVSKÁ UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA KATEDRA INFORMATIKY A POČÍTAČŮ Vizualizace principů výpočtu konečného
Matematické modelování dopravního proudu
Matematické modelování dopravního proudu Ondřej Lanč, Alena Girglová, Kateřina Papežová, Lucie Obšilová Gymnázium Otokara Březiny a SOŠ Telč lancondrej@centrum.cz Abstrakt: Cílem projektu bylo seznámení
Reranking založený na metadatech
České vysoké učení technické v Praze Fakulta informačních technologií Katedra softwarového inženýrství Reranking založený na metadatech MI-VMW Projekt IV - 1 Pavel Homolka Ladislav Kubeš 6. 12. 2011 1
Excel tabulkový procesor
Pozice aktivní buňky Excel tabulkový procesor Označená aktivní buňka Řádek vzorců zobrazuje úplný a skutečný obsah buňky Typ buňky řetězec, číslo, vzorec, datum Oprava obsahu buňky F2 nebo v řádku vzorců,
SignEditor 1 - návod k použití
SignEditor 1 - návod k použití Tomáš Ryba tryba@kky.zcu.cz Zdeněk Krňoul zdkrnoul@kky.zcu.cz Jakub Kanis jkanis@kky.zcu.cz 27. března 2012 1 Vznik za podpory projektu Pojabr - Potlačení jazykové bariéry
Klasifikace a rozpoznávání. Lineární klasifikátory
Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber
3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem
ČVUT FEL X36PAA - Problémy a algoritmy 3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem Jméno: Marek Handl Datum: 1. 1. 2009 Cvičení: Pondělí 9:00 Zadání Naprogramujte
POZNÁMKY K HODNOCENÍ SOUBORŮ ILUSTRAČNÍ TEST 2012
POZNÁMKY K HODNOCENÍ SOUBORŮ ILUSTRAČNÍ TEST 2012 Informatika - praktický subtest vyšší úroveň obtížnosti ITIVS12C0T01 Komentáře: Vstupní soubory některých úloh nemusejí být v souladu s typografickým a
Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner
Vysoká škola ekonomická v Praze Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner Dobývání znalostí z databází 4IZ450 XXXXXXXXXXX Přidělená data a jejich popis Data určená pro zpracování
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek
OCR systémy. Semestrální práce z předmětu Kartografická polygrafie a reprografie. Jakub Žlábek, Zdeněk Švec. Editor: Věra Peterová. Praha, květen 2010
Nejznámější Semestrální práce z předmětu Kartografická polygrafie a reprografie Autor: Editor: Věra Peterová Praha, květen 2010 Katedra mapování a kartografie Fakulta stavební ČVUT v Praze Nejznámější
Postupy práce se šablonami IS MPP
Postupy práce se šablonami IS MPP Modul plánování a přezkoumávání, verze 1.20 vypracovala společnost ASD Software, s.r.o. dokument ze dne 27. 3. 2013, verze 1.01 Postupy práce se šablonami IS MPP Modul
aneb jiný úhel pohledu na prvák
Účelná matematika aneb jiný úhel pohledu na prvák Jan Hejtmánek FEL, ČVUT v Praze 24. června 2015 Jan Hejtmánek (FEL, ČVUT v Praze) Technokrati 2015 24. června 2015 1 / 18 Outline 1 Motivace 2 Proč tolik
GEODETICKÉ VÝPOČTY I.
SPŠS Č.Budějovice Obor Geodézie a Katastr nemovitostí 2.ročník GEODETICKÉ VÝPOČTY I. TABELACE FUNKCE LINEÁRNÍ INTERPOLACE TABELACE FUNKCE Tabelace funkce se v minulosti často využívala z důvodu usnadnění
Vyhodnocení experimentálního měření kmitání vibrační třídičky pomocí optické metody
Vyhodnocení experimentálního měření kmitání vibrační třídičky pomocí optické metody Bc. Martin Machač, Ing. Jan Hoidekr ČVUT v Praze, Fakulta strojní, Ústav konstruování a částí stojů, Technická 4, 166