Efektivní vyhledávání v kolekcích obrázků tváří
|
|
- Olga Urbanová
- před 9 lety
- Počet zobrazení:
Transkript
1 Efektivní vyhledávání v kolekcích obrázků tváří Michal KRÁTKÝ, Tomáš SKOPAL, Václav SNÁŠEL Katedra informatiky, VŠB-Technická univerzita Ostrava 17. listopadu 15, Ostrava {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz Abstrakt. Významným problémem světa informačních technologií je uložení a efektivní dotazování velkých kolekcí multimediálních dokumentů. Oblast zabývající se touto problematikou se nazývá information retrieval, informační systémy řešící takové úlohy nazýváme Dokumentografické informační systémy. Tyto systémy pracují nejen s dokumenty textovými, ale i s obrázky, zvukovými či video záznamy. Jako databázové informační systémy i tyto systémy slouží pro ukládání a manipulaci s daty. Uložení dat musí být takové, aby bylo později možné s daty efektivně pracovat (např. vyhledávat), takové uložení dat nazýváme indexování. V tomto článku je prezentován přístup pro efektivní vyhledávání v kolekcích obrázků tváří. Přístup využívá pro rozpoznávání tváří analýzu hlavních komponent, která redukuje původní prostor obrázků a poskytuje velmi rozumnou extrakci rysů. Pro efektivní dotazování takto získaných vektorů je použita metrická datová struktura M-strom. Příspěvek tedy popisuje řešení problému efektivního vyhledávání v kolekcích tváří, od extrakce rysů až k vyhledávání. Snaží se ukázat řešení efektivního vyhledávání ve velkých kolekcích dat, které v současné době, při často používaném sekvenčním prohledávání kolekce, není možné realizovat. Klíčová slova: information retrieval, rozpoznávání obrázků tváří, indexování vícerozměrných dat, metrické datové struktury, zpracování obrazu, analýza hlavních komponent, M-strom 1 Úvod Významným problémem světa informačních technologií je uložení a efektivní dotazování velkých kolekcí multimediálních dokumentů. Oblast zabývající se touto problematikou se nazývá information retrieval [18,26,2,16]. Informační systémy řešící takovéto úlohy nazýváme Dokumentografické informační systémy. Tyto systémy nepracují pouze s dokumenty textovými, ale i s obrázky, zvukovými či video záznamy. Jako databázové informační systémy i tyto systémy slouží pro ukládání a manipulaci s daty. Uložení dat musí být takové, aby bylo později možné s daty efektivně pracovat (např. vyhledávat), takové uložení dat nazýváme indexování. Indexování multimediálních dat před nás staví celou řadu problémů, které nejsou klasickou databázovou (ať již relační, objektově-relační, či objektovou) technologií řešitelné a vyžadují speciální přístupy, datové struktury a algoritmy. Praktickou úlohou je identifikace osob dle zvoleného biometrického rysu [1], jako je oční duhovka, otisky prstů či rysy tváře. Příspěvek popisuje přístup pro efektivní Lubos Popelínský (ed.), DATAKON 2003, Brno, , pp
2 2 Efektivní vyhledávání v kolekcích obrázků tváří vyhledávání v rozsáhlých kolekcích obrázků tváří. Využíváme existujícího přístupu pro rozpoznávání tváří, kterým je analýza hlavních komponent (PCA) [14]. Získané redukované vektory jsou vloženy do metrické datové struktury M-strom [7], tak aby bylo možné efektivně vyhledávat ve velkých kolekcích obrázků. Snažíme se tedy o propojení dvou oblastí, rozpoznávání obrázků tváří [12] a indexování vícerozměrných dat [27,5]. V případě rozpoznávání tváří se autoři často zaměřují na samotné rozpoznávání tváří, problém efektivního vyhledání ve velkých kolekcích většinou není řešen. V existujících přístupech jsou často tváře hledány sekvenčním průchodem kolekcí, což je pro velké množství dat nerealizovatelné. Vezměme v úvahu úmysl vlády USA zálohovat fotky všech návštěvníků tohoto státu. Je nutné si uvědomit, že i kdyby se porovnání dvou obrázků provedlo za 10ms, sekvenční vyhledání vstupního obrázku v kolekci 10 8 obrázků by trvalo téměř 11.5dne. Naproti tomu, z pohledu vícerozměrných indexovacích struktur a algoritmů, je získání indexovací informace z indexovaného objektu (tzv. extrakce rysů [5]) nezajímavé. Výsledkem extrakce rysů je vektor prvek mnohorozměrného prostoru. V případě indexování obrázků je pro extrakci rysů často použit histogram, což je ovšem informace nerelevantní pro měření podobnosti obrázků. V tomto příspěvku využíváme pro extrakci rysů z obrázků tváří analýzu hlavních komponent, která redukuje původní vícerozměrný prostor obrázků. V kapitole 2 budou krátce popsány existující přístupy pro rozpoznávání tváří a především využití PCA k rozpoznávání tváří. Výstupem této metody jsou redukované vektory, jejichž vzdálenost (tedy podobnost původních obrázků) měříme pomocí metrik. Získané vektory můžeme tedy indexovat pomocí metrických datových struktur, jedna z těchto struktur M-strom je popsána v kapitole 3. V kapitole 4 je shrnut přístup pro efektivní vyhledávání ve velkých kolekcích obrázků. Kapitola 5 obsahuje výsledky experimentů provedených s použitím popisovaných přístupů. V závěru bude shrnut obsah článku a ukázány další možnosti budoucí práce. 2 Využití analýzy hlavních komponent pro rozpoznávání obrázků tváří 2.1 Rozpoznávání a detekce tváří Oblast detekce a rozpoznávání tváří [12] má za sebou mnohaletý vývoj, během kterého bylo vyvinuto mnoho přístupů. První přístupy se začaly objevovat již na počátku 70.let 20.století, jednalo se o jednoduché heuristické a antropometrické techniky. Tyto přístupy byly velmi závislé na podmínkách vzniku fotografie a často byly schopny pracovat pouze s typicky pasovými fotkami. Rozvoj této oblasti počítačových věd je datován na počátek 90.let 20.století. V [12] jsou přístupy pro detekci a rozpoznávání tváří rozděleny na přístupy založené na rysech tváře a přístupy založené na zpracování obrazu. Přístupy založené na rysech tváře Tyto přístupy byly často vyvinuty v raných dobách vývoje oblasti rozpoznávání tváří a proto existuje velké množství publikovaných článků. Využívají znalosti o obličeji a jeho rysech a aplikují různé metody pro získání těchto rysů, jako jsou např.
3 Vybraný příspěvek 3 nízko-úrovňová analýza provádějící segmentaci vizuálních rysů [6] či aktivní tvarové modely (tzv. snakes) [10]. Přístupy založené na zpracování obrazu Tyto přístupy chápou řešený problém jako obecný rozpoznávací problém (pattern recognition problem). Detekce obličeje pomocí přesného modelování rysů obličeje je nepředvídatelná právě kvůli možnému chování tváře a vlivu okolí (např. světlost, pozadí). Přístupy založené na zpracování obrazu často klasifikují tváře bez nutnosti hledání rysů a mohou tak řešit i složitější problémy, jako je např. detekce více tváří v silně nečistém prostředí. Mezi tyto přístupy patří např. vyhledávání šablon (template matching) [13], lineární podprostorové metody či neuronové sítě. Lineární podprostorové metody chápou kolekci obrázků tváří jako vektory podprostoru v prostoru všech obrázků, což umožňuje aplikovat rozmanité algebraické metody jako jsou analýza hlavních komponent (PCA) či analýza lineárních diskriminantů (LDA). 2.2 Analýza hlavních komponent V [19] je popsána metoda využívající analýzu hlavních komponent [14] k efektivní reprezentaci lidské tváře. Autoři v [23,24,15] popisují použití PCA pro rozpoznávání a detekci obrázků tváří, na tomto přístupu je založeno velmi mnoho později publikovaných technik pro rozpoznávání a detekci tváří. Pro zpracování velkých kolekcí dat je důležité, že tato metoda vykonává automatizovanou extrakci rysů. Získané vektory je potom možné využít pro vyhledávání ve velkých kolekcích dat s využitím vícerozměrných datových struktur (viz kapitola 3). Nechť je obrázek velikosti w h 2-rozměrné pole intenzit I(x,y), n-rozměrný vektor obrázku Γ (n = w h) můžeme vytvořit položením jednotlivých řádků obrázku za sebe. Kolekce obrázků je tak modelována jako množina bodů ve vysocedimenzionálním prostoru. Obrázky tváří jsou si ovšem podobné a proto nejsou náhodně distribuovány v tomto prostoru. Hlavní myšlenkou PCA (také Karhunen- Loeve expanze) je nalézt vektory, které nejlépe popisují distribuci obrázků tváří v celém prostoru obrázků. Tyto vektory dimenze n definují podprostor, který nazýváme prostor obrázků tváří (face space) a jsou lineární kombinací původních vektorů. Protože tyto vektory jsou vlastní vektory kovarianční matice korespondující k původním obrázkům a protože jsou podobné obrázkům tváří, nazýváme je eigenfaces (pozn. pojem vlastní tváře je nevhodný, proto budeme dále používat pojmu anglického). Podobnost redukovaných obrázků měříme Euklidovskou metrikou. Nechť máme kolekci obrázků Γ 1,Γ 2,...,Γ m. Průměrný obrázek tváře je spočítán takto: m 1 Ψ = Γ (1) m i= 1 Na obrázku 1(a) vidíme testovací kolekci obrázků tváří a na obrázku 1(b) průměrný obrázek této kolekce. Vektory Φ i získáme odečtením průměrného obrázku Ψ od obrázku Γ i : Φ i = ( Γi Ψ ) (2) Takto získaná množina vektorů je vstupem do analýzy hlavních komponent, která hledá množinu n ortonormálních vektorů u i, které nejlépe popisují distribuci dat. i
4 4 Efektivní vyhledávání v kolekcích obrázků tváří Vektory u k a skaláry λ k jsou vlastní vektory (též hlavní komponenty) resp. vlastní čísla kovarianční matice: 1 C = m m T 1 T Φ iφ i = AA (3) m i= 1 (a) (b) Obr. 1. (a) Testovací kolekce obrázků tváří. (b) Průměrný obrázek tváře. Matice A=[Φ 1 Φ 2...Φ m ] je řádu n m (je tvořena sloupcovými n-rozměrnými vektory Φ i, 1 i m). Matice C je řádu n n. Autoři uvádí, že výpočet vlastních čísel takovéto matice je nezvládnutelný, proto v [23] popisují techniku jejich výpočtu pomocí lineární kombinace vektorů získaných řešením výpočtu vlastních čísel matice řádu m m. Autoři ovšem předpokládají m << n, tedy že počet obrázků je daleko menší než dimenze prostoru. V tom případě by byl tento přístup nepoužitelný pro indexování velkých kolekcí obrázků, pro které se dá naopak předpokládat m >> n. V současné době je však výpočet vlastních čísel a vektorů matice n n výpočetně řešitelný. Jelikož je ale takový výpočet náročný, je významné že existují numerické metody jako je např. Lancoszova metoda [9], které počítají postupně vlastní vektory příslušející k vlastním číslům dle jejich velikosti. Můžeme proto vypočítat pouze relevantní vlastní vektory. k, k n, vybraných vlastních vektorů (příslušejících ke k největším vlastním číslům) nazýváme eigenfaces, tyto vektory tvoří bázi redukovaného prostoru obrázků. Po jejich vytvoření se úloha identifikace tváře stává úlohou rozpoznávání vzorů. Pomocí těchto n-rozměrných vektorů můžeme redukovat původní n-dimenzionální prostor obrázků na prostor k-rozměrný. Počet eigenfaces (tedy hodnotu k) je možné heuristiky určit dle hodnot vlastních čísel, malá vlastní čísla přispívají málo k popisu odchylek mezi obrázky a příslušné vlastní vektory můžeme tudíž ignorovat. Na obrázku 2 vidíme ukázku 200 prvních eigenfaces kolekce o větším počtu obrázků. Eigenfaces nám reprezentují významné (tedy společné) rysy obrázků (v tomto případě tváří). Zároveň vidíme význam použití vlastních vektorů příslušejících
5 Vybraný příspěvek 5 k největším vlastním číslům ty nejlépe charakterizují zpracovávanou sadu obrázků. Pomocí eigenfaces jsme schopni redukovat původní n-rozměrný prostor na k- rozměrný promítnutím n-rozměrného vektoru Γ do prostoru obrázků tváří (jinými slovy transformovat jej do eigenfaces komponent) výpočtem k skalárů: ω = ( Γ Ψ ), i = 1, K k (4) u T i i, T Ω = ω ω Kω ] (5) [ 1 2 k Obr. 2. Ukázka eigenfaces uspořádaných dle velikosti příslušných vlastních čísel. T Ω je redukovaný k-rozměrný vektor, který je nazýván vektor tvaru vah. Vektor vyjadřuje příspěvek každého vlastního vektoru pro reprezentaci obrázku, vlastní vektory tedy tvoří základní množinu kolekce obrázků tváří. Takto získaný vektor použijeme pro nalezení tváře uložené v databázi (pokud taková existuje) výpočtem Euklidovské vzdálenosti promítnutého vektoru od všech projekcí vektorů obrázků z databáze (jejich počet je m): 2 2 ε = Ω Ω, i = 1, K m (6) i i, Tvář z databáze je identifikována pokud je hodnota ε i minimální a zároveň ε i < θ ε (zvolená prahová hodnota). Jelikož mnoho obrázků odlišných od obrázků tváří je promítnuto na stejný redukovaný vektor, je vhodné vypočítat i tzv. DFFS (distance from face space): 2 2 DFFS = Φ Φ r (7) k Φ = ω u (8) r i= 1 DFFS (též rekonstrukční chyba) tedy vyjadřuje vzdálenost mezi obrázkem a jeho projekcí do redukovaného prostoru, můžeme ji chápat též jako vzdálenost obrázku od redukovaného prostoru tváří. Zatímco vektor tvaru vah je aproximací, DFFS umožňuje přesně rozpoznávat obrázek tváře (vektor Φ r je neredukovaný). Obou hodnot (ε i i DFFS) využijeme při rozpoznávání tváří, mohou nastat tyto čtyři případy: 1. Nějaký obrázek z databáze je blízký (podobný) - hodnota ε i, rovněž prostor je blízký hodnota DFFS vstupní obrázek je obrázkem tváře a byl identifikován v databázi. 2. Žádný obrázek není podobný, ale prostor je blízký vstupní obrázek je obrázkem tváře, který není v databázi. i i
6 6 Efektivní vyhledávání v kolekcích obrázků tváří 3. Nějaký obrázek z databáze je podobný, ale prostor je vzdálený vstupní obrázek není obrázkem tváře. Vidíme jak se tato metoda umí vypořádat s chybně rozpoznanými obrázky. 4. Žádný obrázek není podobný, rovněž prostor je vzdálený. Pro rozpoznání obrázků tváří musíme stanovit prahové hodnoty θ DFFS a θ ε. Hodnota θ DFFS určuje maximální hodnotu DFFS pro kterou budeme považovat vstupní obrázek za obrázek tváře. Rozpoznání obrázků probíhá tak, že vypočteme vzdálenosti všech redukovaných vektorů obrázků v databázi od redukovaného dotazovacího vektoru. Pokud nalezená minimální vzdálenost < θ ε pak je vstupní obrázek identifikován. Pro velké kolekce dat je takovýto postup nerealizovatelný, v kapitole 4 prezentujeme přístup pro efektivní vyhledávání obrázků ve velkých kolekcích dat. Autoři v [15] uvádí použití vlastních vektorů významných rysů tváře jako jsou oči, nos a ústa (které jsou nazvány eigeneyes, eigennose a eigenmouth, dohromady pak eigenfeatures) k rozpoznávání tváří. V tomto případě jsou schopni dokonce rozpoznat obličej se změněnou mimikou, plnovousem atd. V [8] autoři popisují techniku detekce jednotlivých rysů obličeje založenou právě na eigenfeatures. Dalším využitím algebraických metod redukce je přirozeně i ztrátová komprese. 3 Indexování vícerozměrných prostorů Vícerozměrné datové struktury slouží pro indexování vícerozměrných prostorů [27]. Rozlišujeme datové struktury pro indexování vektorových a metrických prostorů. Zjednodušeně řečeno máme v případě vektorových prostorů k dispozici kompletní informaci o umístění bodu v prostoru (tedy jeho souřadnici), v případě metrických prostorů rozlišujme pouze vzdálenost (podobnost) bodů, kterou měříme metrikou. Příkladem struktur pro indexování vektorových prostorů je např. R-strom [11] a UBstrom [3], strukturou pro indexování metrických prostorů je např. M-strom [7]. Jelikož při rozpoznávání obrázků tváří využíváme Euklidovské metriky počítáme vzdálenosti vektorů obrázků, pro efektivní vyhledávání obrázků využíváme metrické datové struktury M-strom. 3.1 M-strom Datová struktura M-strom představená v [7], využívá pro indexování objektů vlastností metrických prostorů. Vnitřní strukturou je to perzistentní stránkovaný strom, podobně jako klasický B-strom [25]. Rozdíl spočívá v obsahu uzlů a listů stromu. Indexované objekty (ground objects) jsou uloženy v listech stromu, nelistové uzly obsahují tzv. směrovací objekty (routing objects). Záznam směrovacího objektu O r v uzlu obsahuje: indexovaný objekt O r, odkaz ptr(t(o r )) na svůj podstrom T(O r ) tzv. pokrývající strom (covering tree), hodnotu r(o r ) - tzv. pokrývací poloměr (covering radius), hodnotu d(o r,p(o r )) - vzdálenost od rodičovského směrovacího objektu P(O r ).
7 Vybraný příspěvek 7 Záznam ground objektu vypadá podobně, ovšem místo odkazu na pokrývající strom a poloměru obsahuje oid(o j ) identifikátor celého objektu uloženého mimo M- strom v datovém souboru. Princip hierarchie M-stromu spočívá v rozdělení prostoru do metrických regionů (ty nemusí být nutně disjunktní). K tomu slouží směrovací objekty a to tak, že všechny ground objekty, které obsahuje pokrývající strom T(O r ) směrovacího objektu O r, jsou ve vzdálenosti maximálně r(o r ) od O r. Na obrázku 3 je schématicky znázorněna struktura stromu a vztahy mezi směrovacími objekty (regiony). Obr. 3. (a) Struktura M-stromu. (b) Odpovídající dělení metrického prostoru. Při operacích nad M-stromem počítáme se dvěma faktory složitosti. Prvním je klasický počet přístupů na diskové stránky (resp. počet prohledávaných regionů), druhým je počet výpočtů vzdáleností mezi objekty, což může být výpočetně náročná operace. Snahou je oba tyto faktory minimalizovat. Zajímavou vlastností M-stromů je fakt, že jimi lze indexovat prakticky cokoliv na čem může být nadefinována metrika. Použití ovšem není úplně univerzální, uvědomme si například jaká bude efektivita vyhledávání, pokud budou všechny indexované objekty ležet stejně daleko od sebe. Obecnost M-stromů je vykoupena dosti složitým managementem štěpení a slučování regionů při základních operacích tak, aby zůstala zachována vysoká efektivita. V metrických stromech se setkáváme se dvěma typy rozsahových dotazů. Dotazy na vzdálenost vyhledají ty objekty, které leží do určité vzdálenosti od dotazovaného objektu. Dotazy na k-nejbližších sousedů (k-nn - k-near neighbours query) zase vyhledají k dotazovanému objektu k jeho nejbližších sousedů. Pro zlepšení vlastností M-stromu (optimalizace překryvů regionů atd.) využíváme vlastních algoritmů publikovaných v [20]. 4 Efektivní vyhledávání v kolekcích obrázků tváří Při rozpoznávání tváří autoři často prochází sekvenčně celou kolekci, popř. provádí jednoduché shlukování [22], které ovšem není hierarchizováno a nesnižuje tedy příliš složitost vyhledávání. V našem přístupu využíváme strukturu M-strom, která hierarchizuje shluky do stromové struktury a poskytuje tak v ideálním případě složitost vyhledávání blízkou logaritmické. Celý proces vyhledávání je následující: 1. Využíváme pouze kanonického tvaru tváře [22], která obsahuje pouze významné rysy tváře: oči, ústa a nos. Takto potlačujeme nesignifikantní informace, především vliv okolí. Zároveň snížíme rozlišení obrázku, např. konvolucí
8 8 Efektivní vyhledávání v kolekcích obrázků tváří s gausiánem [21], takto jsou potlačeny nevýznamné vazby mezi pixely. Každá tvář je pak reprezentována obrázkem o velikosti pixelů. 2. Získané obrázky jsou podrobeny výše popsané metodě PCA. 3. Dle hodnot získaných vlastních čísel, je vybráno k vlastních vektorů. Původní 400-rozměrné vektory jsou transformovány na vektory k-rozměrné. Takto získané vektory jsou vloženy do datové struktury M-strom. 4. Vstupní obrázek je opět transformován na 400-rozměrný vektor a redukován. Pomocí hodnoty DFFS a prahové hodnoty θ DFFS nejprve zjistíme zda se jedná o obrázek tváře. Pokud ano, pomocí dotazu na jednoho nejbližšího souseda najdeme nejpodobnější obrázek tváře. Pokud je vzdálenost <θ ε, je tvář osoby ze vstupního obrázku identifikována v databázi. 5 Výsledky experimentů Experimenty byly provedeny s databází 230 obrázků tváří. Obrázky byly podrobeny metodě PCA. Pro výpočet kovarianční matice je významné, že rozdílová matice A je sice hustá, ale obsahuje asi 0.1% nulových hodnot. Kovarianční matice C je hustá. Výpočet 400 vlastních čísel kovarianční matice trval 3s (testováno na počítači Intel Pentium 4 2.4GHz, 512MB operační paměti). Testovací obrázky jsou prezentovány na obrázku 4. V případě obrázku (a), který není obrázkem tváře, získáme pro 90 vybraných vlastních vektorů náležících k největším vlastním číslům (k=90) hodnotu DFFS = V případě obrázků (b) a (c) získáme hodnoty resp Nastavením prahové hodnoty θ DFFS např. na hodnotu odhalíme, že obrázek (a) není obrázkem tváře. Redukované vektory byly vloženy do datové struktury M-strom, jejíž charakteristiku vidíme v tabulace 1. (a) (b) (c) Obr. 4. Dotazovací obrázky. Počet diskových přístupů a operací výpočtu metriky naměřených při vykonávání dotazů 4(b) a (c) je prezentován na obrázku 5. Počet diskových přístupů i počet operací v závislosti na dimenzi redukovaného prostoru (tedy počtu vybraných vlastních vektorů) je porovnáván se sekvenčním průchodem kolekcí. Pro každou dimenzi byl znovu vytvořen M-strom. Pro dotazovací obrázek 4(b), který je uložen v databázi, vidíme že počet diskových přístupů a operací při dotazu na 1 nejbližšího souseda je v porovnání se sekvenčním průchodem až 4 resp. 10 nižší. Tab. 1. Charakteristika vytvořeného M-stromu. dimenze: velikost uzlu [B]: utilizace: 62.4% 67.9% velikost položky [B]: arita: 7
9 Vybraný příspěvek 9 Nyní vezměme dotazovací obrázek 4(c), který je obrázkem osoby uložené v databázi, ale je mírně otočen. Metoda PCA je schopna nalezením závislostí mezi pixely rozpoznat i takové obrázky. Při velké redukci prostoru dostaneme jako nejbližšího souseda chybný vektor (tzv. špatný výběr). V tomto případě dostaneme správný výsledek pro dotazovací obrázek 4(c) až pro k = 90. Realizace tohoto dotazu v případě větší redukce musí být provedena širším dotazem hledáním k nejbližších sousedů, kde k > 1. Pravou osobu pak můžeme identifikovat výpočtem vzdáleností neredukovaných vektorů Φ r z rovnice 7 takto získané množiny vektorů. Přílišná redukce prostoru nám tedy zhoršuje přesnost, na druhou stranu vzrůstající dimenze zhoršuje efektivitu vyhledávání v metrické datové struktuře (vliv tzv. prokletí dimensionality [27]). Musíme tedy volit kompromis významnou redukci prostoru, ale takovou abychom mohli použít dotaz na menší počet nejbližších sousedů. Ovšem z výsledků experimentů vidíme, že efektivita vyhledávání v metrické datové struktuře je jednoznačně lepší než při sekvenčním průchodu kolekcí. (a) (b) Obr. 5. (a) Počet diskových přístupů při vykonávání dotazů. (b) Počet operací výpočtu metriky při vykonávání dotazů. 6 Závěr V tomto článku byl prezentován přístup pro vyhledávání tváří ve velkých kolekcích obrázků. V oblasti zpracování obrazu vznikla celá řada technik pro rozpoznávání a detekci tváří. Použitá analýza hlavních komponent redukuje původní mnohorozměrný prostor obrázků. V článku byla navržena metoda využívající metrické datové struktury pro indexování takto získaných redukovaných vektorů. Z experimentů vidíme, že použití metrické datové struktury pro rozpoznávání obrázků tváří poskytuje velmi dobré složitosti v porovnání se sekvenčním průchodem. Analýza hlavních komponent poskytuje velmi smysluplnou extrakci rysů sady obrázků, která je částečně odolná proti vnějším vlivům jako je např. natočení obrázku. V budoucí práci bychom chtěli zdokonalit samotné rozpoznávání tváří a extrakci rysů. Nabízí se celá řada algebraických metod pro redukci dimenze, jako např. singulární rozklad (Singular Value Decomposition - SVD) [9]. Singulární rozklad je již používán v
10 10 Efektivní vyhledávání v kolekcích obrázků tváří information retrieval pro redukci prostoru textových dokumentů jako jedna z metod indexování latentní sémantiky (Latent Semantic Index - LSI) [4]. Využití singulárního rozkladu pro rozpoznávání obrázků bylo publikováno v [17]. V naší budoucí práci chceme především testovat popsaný přístup na velké kolekci obrázků tváří. Námi prezentovaný přístup využívající robustní perzistentní datovou strukturu M-strom je určen právě pro takové kolekce. Literatura 1. Ashbourn, J.: Biometrics, Advanced Identity Verification. Springer Verlag, New York, ISBN , Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval. Addison Wesley, New York, Bayer, R.: The Universal B-Tree for multidimensional indexing: General Concepts. In: Proc. of World-Wide Computing and its Applications'97, WWCA'97, Tsukuba, Japan, Berry, M.W., Browne, M.: Understanding Search Engines, Mathematical Modeling and Text Retrieval. Siam, Böhm, C., Berchtold, S., Keim, D.A.: Searching in High-dimensional Spaces - Index Structures for Improving the Performance Of Multimedia Databases. ACM, Brunelli, R., Poggio, T.: Face recognition: Feature versus templates. In: Proc. of IEEE Trans. Pattern Anal. Mach. Intell, 15, pages , Ciaccia, P., Pattela, M., Zezula, P.: M-tree: An Efficient Access Method for Similarity Search in Metric Spaces. In: Proc. of 23rd International Conference on VLDB, Athens, Greece, pages , Demirel, H., Clarke, T. J., Cheung, P.J.K.: Adaptive automatic facial feature segmentation. In: Proc. 2nd International Conference on Automatic Face and Gesture Recognition, Vermont, pages , Golub, G.H., Van Loan, C.F.: Matrix Computations. Johns Hopkins, Gunn, S.R., Nixon, M.S.: A dual active contour for head and boundary extraction. In: Proc. IEEE Colloquium on Image Processing for Biometric Measurement, London, Great Britain, Guttman, A.: R-Trees: A Dynamic Index Structure for Spatial Searching. In: Proc. of ACM SIGMOD 1984, Annual Meeting, Boston, USA, June 1984, pages 47 57, ACM Press. 12. Hjelmås, E., Low, B.K.: Face Detection: A Survey. Computer Vision and Image Understanding, Volume 83, Issue 3, pages , Elsevier Science, Holst, G.: Face detection by facets: Combined bottom-up and top-down search using compound templates. In: Proc. of the 2000 International Conference on Image Processing, pages TA07.08, Hyvärinen, A., Karhunen, J., Oja, E.: Independent Component Analysis. Wiley- Interscience, ISBN X, 2001.
11 Vybraný příspěvek Pentland, A., Moghaddam, B., Starner, T.: View-based and Modular Eigenspaces for Face Recognition. In: Proc. of IEEE Conference on Computer Vision and Pattern Recognition (CVPR'94), Seattle, WA, June, Pokorný, J., Snášel, V., Húsek, D.: Dokumentografické informační systémy. Karolinum, Praha, Praks, P., Dvorský, J., Snášel, V.: Latent Semantic Indexing for Image Retrieval Systems. In: Proc. SIAM Conference on Applied Linear Algebra 2003, LA'03. Williamsburg, USA, The College of William and Mary, Salton, G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw Hill Publications, 1st edition, Sirovich L., Kirby, M.: Low-dimensional procedure for the characterization of human faces. Journal of Optical Society of America, pages , Skopal, T. Pokorný, J., Krátký, M., Snášel, V.: Revisiting M-tree Building Principles. In: Proc. of Advances in Databases and Information Systems, ADBIS 2003, 7th East European Conference, Dresden, Germany, Springer Verlag, Sojka, E.: Digitální zpracování obrazu a analýza obrazu a počítačového vidění. VŠB-Technická univerzita Ostrava, Sung, K.K., Poggio, T.: Example-Based Learning for View-Based Human Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(1), pages 39 51, Turk, M., Pentland, A.: Eigenfaces for recognition. Journal of Cognitive Neuroscience Volume 3, Number 1. pages 71 86, Turk, M., Pentland, A.: Face recognition using eigenfaces. In: Proc. IEEE Conference on Computer Vision and Pattern Recognition, Maui, Hawaii, Wirth, N.: Algorithms and Data Structures. Prentice Hall, Witten, I.H., Moffat, A., Bell, T.C.: Managing Gigabytes, Compressing and Indexing Documents and Images. Van Nostrand Reinhold, New York, USA, Yu, C.: High-Dimensional Indexing. Springer Verlag, LNCS 2341, Annotation: Efficient Searching in Face Collections A problem of storage and efficient searching in large multimedia document collections is solved in information retrieval. In the paper we present an approach for efficient searching in face image collections. The approach uses the principal component analysis for face recognition, which reduces original face space and provides useful feature extraction. Acquired vectors are inserted into M-tree metric data structure and the faces are searched with better complexity than linear. So the approach is suitable for efficient searching in large face collections.
Geometrické indexování a dotazování multimediálních dat
Geometrické indexování a dotazování multimediálních dat Tomáš Skopal, Michal Krátký, Václav Snášel Katedra informatiky, VŠB-Technická Univerzita Ostrava 17. listopadu 15, 708 33 Ostrava-Poruba {michal.kratky,
Metrické indexování vektorových modelů v oblasti information retrieval
Metrické indexování vektorových modelů v oblasti information retrieval Tomáš Skopal Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba Tomas.Skopal@vsb.cz
Využití LSI a M-stromu při indexování a vyhledávání obrázků
Využití LSI a M-stromu při indexování a vyhledávání obrázků Tomáš Skopal 1, Michal Kolovrat 2 a Václav Snášel 2 1 Katedra softwarového inženýrství, MFF UK Praha, Malostranské nám. 25, 118 00, Praha 2 Katedra
Vícerozměrný přístup pro netriviální vyhledávání termů
Vícerozměrný přístup pro netriviální vyhledávání termů Michal Krátký, Tomáš Skopal, Václav Snášel Katedra informatiky, FEI, VŠB Technická univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz
Využití SVD pro indexování latentní sémantiky
Využití SVD pro indexování latentní sémantiky Michal Krátký 1 Department of Computer Science, VŠB-Technical University of Ostrava, Czech Republic michal.kratky@vsb.cz Abstrakt Zpracováváním velkého množství
Datové struktury. Zuzana Majdišová
Datové struktury Zuzana Majdišová 19.5.2015 Datové struktury Numerické datové struktury Efektivní reprezentace velkých řídkých matic Lze využít při výpočtu na GPU Dělení prostoru a binární masky Voxelová
Prohledávání dokumentů ve vektorovém modelu
Prohledávání dokumentů ve vektorovém modelu Pavel Moravec 1 Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba pavel.moravec@vsb.cz Abstrakt. Information
Stromové struktury v relační databázi
Stromové struktury v relační databázi Stromové struktury a relační databáze Zboží Procesory Intel Pentium IV Celeron Paměti AMD Duron DDR DIMM Athlon http://interval.cz/clanky/metody-ukladani-stromovych-dat-v-relacnich-databazich/
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý
Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Klasifikační metody pro genetická data: regularizace a robustnost
Odd medicínské informatiky a biostatistiky Ústav informatiky AV ČR, vvi Práce vznikla za finanční podpory Nadačního fondu Neuron na podporu vědy Klasifikační metody pro genetická data Regularizovaná klasifikační
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků lukas.mach@gmail.com Přílohy (videa, zdrojáky, ) ke stažení na: http://mach.matfyz.cz/sift Korespondence
Klasifikace a rozpoznávání. Extrakce příznaků
Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám
Datové struktury 2: Rozptylovací tabulky
Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
Singulární rozklad aplikace v image deblurring
Singulární rozklad aplikace v image deblurring M. Plešinger, Z. Strakoš TUL, Fakulta mechatroniky, Liberec AV ČR, Ústav informatiky, Praha 1 Úvod Uvažujme obecnou reálnou matici Pak existuje rozklad A
Numerické metody a programování
Projekt: Inovace výuky optiky se zaměřením na získání experimentálních dovedností Registrační číslo: CZ.1.7/2.2./28.157 Numerické metody a programování Lekce 4 Tento projekt je spolufinancován Evropským
Robust 2014, 19. - 24. ledna 2014, Jetřichovice
K. Hron 1 C. Mert 2 P. Filzmoser 2 1 Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta, Univerzita Palackého, Olomouc 2 Department of Statistics and Probability Theory Vienna University
Zpracování digitalizovaného obrazu (ZDO) - Popisy III
Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování
Umělá inteligence a rozpoznávání
Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních
Extrakce a selekce příznaků
Extrakce a selekce příznaků Based on slides Martina Bachlera martin.bachler@igi.tugraz.at, Makoto Miwa And paper Isabelle Guyon, André Elisseeff: An Introduction to variable and feature selection. JMLR,
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Statistické modely tvaru a vzhledu
Kapitola 1 Statistické modely tvaru a vzhledu V této kapitole nastíním problematiku statistických modelů tvaru, jejich využití a metod potřebných pro jejich výpočet a použití. Existují dvě hlavní metody;
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d
KMA/PDB Prostorové databáze Karel Janečka Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d Sylabus předmětu KMA/PDB Úvodní přednáška Základní terminologie Motivace rozdíl klasické
Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT
Dolování dat z multimediálních databází Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Obsah prezentace Co jsou multimediální databáze Možnosti dolování dat v multimediálních databázích Vyhledávání fotografií
k-dimenzionálním prostoru. problém: Zkonstruovat strom, který rozděluje prostor polorovinami
kd-stromy (kd-trees) k čemu to je: ukládání vícerozměrných dat (k-dimenzionální data) vstup: Množina bodů (nebo složitějších geometrických objektů) v k-dimenzionálním prostoru. problém: Zkonstruovat strom,
Rozpoznávání v obraze
Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd
Numerické metody a programování. Lekce 4
Numerické metody a programování Lekce 4 Linarní algebra soustava lineárních algebraických rovnic a 11 a 12 x 2 a 1, N x N = b 1 a 21 a 22 x 2 a 2, N x N = b 2 a M,1 a M,2 x 2 a M,N x N = b M zkráceně A
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
NAIL072 ROZPOZNÁVÁNÍ VZORŮ
NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační
1 Projekce a projektory
Cvičení 3 - zadání a řešení úloh Základy numerické matematiky - NMNM20 Verze z 5. října 208 Projekce a projektory Opakování ortogonální projekce Definice (Ortogonální projekce). Uvažujme V vektorový prostor
Strojové učení se zaměřením na vliv vstupních dat
Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications
TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY
TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají
Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015
Příklady použití metod strojového učení v rozpoznávání tváří Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Stavební bloky systému
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Databázové a informační systémy Jana Šarmanová
Databázové a informační systémy Jana Šarmanová Obsah Úloha evidence údajů, způsoby evidování Databázové technologie datové modely, dotazovací jazyky. Informační systémy Datové sklady Metody analýzy dat
SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT
SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT Lukáš Fritsch ČVUT v Praze, Fakulta elektrotechnická, katedra radioelektroniky Abstrakt Obrazové kompresní algoritmy založené na Karhunen- Loeveho transformaci
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů
Tvorba informačních systémů 1/18 Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2008/2009 Tvorba informačních systémů 2/18 Úvod
APROXIMACE KŘIVEK V MATLABU NEWTONŮV INTERPOLAČNÍ POLYNOM CURVE FITTING IN MATLAB NEWTON INTERPOLATION POLYNOMIAL
APROXIMACE KŘIVEK V MATLABU NEWTONŮV INTERPOLAČNÍ POLYNOM CURVE FITTING IN MATLAB NEWTON INTERPOLATION POLYNOMIAL Jiří Kulička 1 Anotace: Článek se zabývá odvozením, algoritmizací a popisem konstrukce
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Vizualizace v Information Retrieval
Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby
ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ
ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ K. Nováková 1, J. Kukal 1,2 1 Fakulta jaderná a fyzikálně inženýrská, ČVUT v Praze 2 Ústav počítačové a řídicí techniky, VŠCHT Praha
Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)
..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY)
Michal Krátký, Miroslav Beneš
Databázové a informační systémy Michal Krátký, Miroslav Beneš Katedra informatiky VŠB Technická univerzita Ostrava 5.12.2005 2005 Michal Krátký, Miroslav Beneš Databázové a informační systémy 1/24 Obsah
Tvorba informačních systémů
Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2006/2007 c 2006 2008 Michal Krátký Tvorba informačních systémů 1/17 Úvod XML
Binární vyhledávací stromy pokročilé partie
Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald
Univerzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík,, CSc. NEURONOVÉ SÍTĚ otázky a odpovědi 1 AKD_predn4, slide 8: Hodnota výstupu závisí na znaménku funkce net i, tedy na tom, zda bude suma
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
SVD rozklad a pseudoinverse
SVD rozklad a pseudoinverse Odpřednesenou látku naleznete v kapitole 12 skript Abstraktní a konkrétní lineární algebra. Jiří Velebil: Lineární algebra 19.12.2016: SVD rozklad a pseudoinverse 1/21 Cíle
Michal Krátký. Úvod do programování. Cíl kurzu. Podmínky získání zápočtu III/III
Michal Krátký Úvod do programování Michal Krátký 1,Jiří Dvorský 1 1 Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programování, 2004/2005 tel.: +420 596 993 239 místnost: A1004 mail: michal.kratky@vsb.cz
13 Barvy a úpravy rastrového
13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody
ZPRACOVÁNÍ OBRAZU PRO VYHODNOCENÍ SEGREGACE DRÁTŮ
ZPRACOVÁNÍ OBRAZU PRO VYHODNOCENÍ SEGREGACE DRÁTŮ K. Horák Fakulta elektrotechniky a komunikačních technologií, Vysoké učení technické v Brně Abstrakt Zpracování obrazu se jako disciplína technické kybernetiky
Datové struktury pro prostorové vyhledávání
Datové struktury pro prostorové vyhledávání 1998-2011 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ SpatialData 2011 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1
Ing. Václav Eksler Ústav telekomunikací FEKT VUT v Brně
1 z 10 5.10.2010 9:16 Elektrorevue 2005/29-17.5.2005 Obsah Ing. Václav Eksler eksler@feec.vutbr.cz Ústav telekomunikací FEKT VUT v Brně Problematikou separace zdrojů naslepo nebo také separace signálů
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Databázové a informační systémy
Databázové a informační systémy doc. Ing. Miroslav Beneš, Ph.D. katedra informatiky FEI VŠB-TUO A-1007 / 597 324 213 http://www.cs.vsb.cz/benes Miroslav.Benes@vsb.cz Obsah Jak ukládat a efektivně zpracovávat
27.11.2012 Bezpečnostní seminář BIG DATA, Policejní akademie ČR v Praze
RNDr. Jakub Lokoč, Ph.D. Siret Research Group (www.siret.cz) Department of SW Engineering Faculty of Mathematics and Physics Charles University in Prague 1 2.1 billion Internet users worldwide http://royal.pingdom.com
VYHLEDÁNÍ NEJDELŠÍHO SHODNÉHO PREFIXU V FPGA
VYHLEDÁNÍ NEJDELŠÍHO SHODNÉHO PREFIXU V FPGA Jiří Tobola Výpočetní technika a informatika, 2. ročník, prezenční studium Školitel: Vladimír Drábek Fakulta informačních technologií, Vysoké učení technické
POKROČILÉ POUŽITÍ DATABÁZÍ
POKROČILÉ POUŽITÍ DATABÁZÍ Barbora Tesařová Cíle kurzu Po ukončení tohoto kurzu budete schopni pochopit podstatu koncepce databází, navrhnout relační databázi s využitím pokročilých metod, navrhovat a
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY
ROBUST 2004 c JČMF 2004 SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY Dušan Húsek, Hana Řezanková, Václav Snášel Klíčová slova: Výpočetní statistika, shlukování, rozsáhlé datové soubory, dokumentografické informační
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
Aplikace obrazové fúze pro hledání vad
Marek Vajgl, Irina Perfilieva, Petr Hurtík, Petra Hoďáková Národní superpočítačové centrum IT4Innovations Divize Ostravské univerzity Ústav pro výzkum a aplikaci fuzzy modelování Ostrava, Česká republika
Převedení okrajové úlohy na sled
Převedení okrajové úlohy na sled úloh počátečních 1 Jiří Taufer Abstrakt Tento příspěvek je věnován řešení okrajových problémů pro soustavu okrajových obyčejných diferenciálních lineárních rovnic metodami,
MODEL VÁRKOVÉ LINKY NA VÝROBU CHLORIDU ŽELEZNATÉHO PRO FARMACEUTICKÉ ÚČELY. Vladimír Hanta
MODEL VÁRKOVÉ LINKY NA VÝROBU CHLORIDU ŽELEZNATÉHO PRO FARMACEUTICKÉ ÚČELY Vladimír Hanta Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Klíčová slova: modelování a simulace,
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
Arnoldiho a Lanczosova metoda
Arnoldiho a Lanczosova metoda 1 Částečný problém vlastních čísel Ne vždy je potřeba (a někdy to není ani technicky možné) nalézt celé spektrum dané matice (velké řídké matice). Úloze, ve které chceme aproximovat
Marta Vomlelová marta@ktiml.mff.cuni.cz
Strojové učení Úvod, lineární regrese Marta Vomlelová marta@ktiml.mff.cuni.cz References [1] P. Berka. Dobývání znalostí z databází. Academia, 2003. [2] T. Hastie, R. Tishirani, and J. Friedman. The Elements
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Vlastní čísla a vlastní vektory
5 Vlastní čísla a vlastní vektor Poznámka: Je-li A : V V lineární zobrazení z prostoru V do prostoru V někd se takové zobrazení nazývá lineárním operátorem, pak je přirozeným požadavkem najít takovou bázi
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 12. září 2016 Jiří Dvorský (VŠB TUO) Vyhledávání 201 / 344 Osnova přednášky
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava Osobní údaje Uchazeč: Radim Bača Datum a místo narození: 9.9.1980 Adresa trvalého bydliště: Karla
Unstructured data pre-processing using Snowball language
Unstructured data pre-processing using Snowball language Předzpracování nestrukturovaných dat pomocí jazyka Snowball Bc. Pavel Řezníček, doc. Ing. František Dařena, PhD., Ústav informatiky, Provozně ekonomická
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU
Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU Lidová moudrost pohádek praví, že když chtěl princ požádat o ruku krásnou princeznu, neposlal jí zdvořilou žádost, ale svůj obraz. Na něm princezna
Formální konceptuální analýza
moderní metoda analýzy dat 14. října 2011 Osnova Informatika 1 Informatika 2 3 4 Co je to informatika? Co je to informatika? Computer science is no more about computers than astronomy is about telescopes.
Klasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
odlehlých hodnot pomocí algoritmu k-means
Chybějící a odlehlé hodnoty; odstranění odlehlých hodnot pomocí algoritmu k-means Návod ke druhému cvičení Matěj Holec, holecmat@fel.cvut.cz ZS 2011/2012 Úvod Cílem cvičení je připomenout důležitost předzpracování
Metody analýzy dat I. Míry a metriky - pokračování
Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:
Státnice odborné č. 20
Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází
1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,
AVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
Transformace obrazu Josef Pelikán KSVI MFF UK Praha
Transformace obrazu 99725 Josef Pelikán KSVI MFF UK Praha email: Josef.Pelikan@mff.cuni.cz WWW: http://cgg.ms.mff.cuni.cz/~pepca/ Transformace 2D obrazu dekorelace dat potlačení závislosti jednotlivých
Hierarchický model. 1995-2013 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ 1 / 16
Hierarchický model 1995-2013 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ 1 / 16 Hierarchie v 3D modelování kompozice zdola-nahoru složitější objekty se sestavují
Cvičná bakalářská zkouška, 1. varianta
jméno: studijní obor: PřF BIMAT počet listů(včetně tohoto): 1 2 3 4 5 celkem Cvičná bakalářská zkouška, 1. varianta 1. Matematická analýza Najdětelokálníextrémyfunkce f(x,y)=e 4(x y) x2 y 2. 2. Lineární
Využití RPS pro potlačování šumu v řečových signálech
Využití RPS pro potlačování šumu v řečových signálech Ing. Radek Zezula, Ph.D., Ing. Ivan Koula, Prof. Ing. Zdeněk Smékal, CSc. Ústav telekomunikací Vysoké učení technické v Brně Fakulta elektrotechniky