Efektivní vyhledávání v kolekcích obrázků tváří

Rozměr: px
Začít zobrazení ze stránky:

Download "Efektivní vyhledávání v kolekcích obrázků tváří"

Transkript

1 Efektivní vyhledávání v kolekcích obrázků tváří Michal KRÁTKÝ, Tomáš SKOPAL, Václav SNÁŠEL Katedra informatiky, VŠB-Technická univerzita Ostrava 17. listopadu 15, Ostrava {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz Abstrakt. Významným problémem světa informačních technologií je uložení a efektivní dotazování velkých kolekcí multimediálních dokumentů. Oblast zabývající se touto problematikou se nazývá information retrieval, informační systémy řešící takové úlohy nazýváme Dokumentografické informační systémy. Tyto systémy pracují nejen s dokumenty textovými, ale i s obrázky, zvukovými či video záznamy. Jako databázové informační systémy i tyto systémy slouží pro ukládání a manipulaci s daty. Uložení dat musí být takové, aby bylo později možné s daty efektivně pracovat (např. vyhledávat), takové uložení dat nazýváme indexování. V tomto článku je prezentován přístup pro efektivní vyhledávání v kolekcích obrázků tváří. Přístup využívá pro rozpoznávání tváří analýzu hlavních komponent, která redukuje původní prostor obrázků a poskytuje velmi rozumnou extrakci rysů. Pro efektivní dotazování takto získaných vektorů je použita metrická datová struktura M-strom. Příspěvek tedy popisuje řešení problému efektivního vyhledávání v kolekcích tváří, od extrakce rysů až k vyhledávání. Snaží se ukázat řešení efektivního vyhledávání ve velkých kolekcích dat, které v současné době, při často používaném sekvenčním prohledávání kolekce, není možné realizovat. Klíčová slova: information retrieval, rozpoznávání obrázků tváří, indexování vícerozměrných dat, metrické datové struktury, zpracování obrazu, analýza hlavních komponent, M-strom 1 Úvod Významným problémem světa informačních technologií je uložení a efektivní dotazování velkých kolekcí multimediálních dokumentů. Oblast zabývající se touto problematikou se nazývá information retrieval [18,26,2,16]. Informační systémy řešící takovéto úlohy nazýváme Dokumentografické informační systémy. Tyto systémy nepracují pouze s dokumenty textovými, ale i s obrázky, zvukovými či video záznamy. Jako databázové informační systémy i tyto systémy slouží pro ukládání a manipulaci s daty. Uložení dat musí být takové, aby bylo později možné s daty efektivně pracovat (např. vyhledávat), takové uložení dat nazýváme indexování. Indexování multimediálních dat před nás staví celou řadu problémů, které nejsou klasickou databázovou (ať již relační, objektově-relační, či objektovou) technologií řešitelné a vyžadují speciální přístupy, datové struktury a algoritmy. Praktickou úlohou je identifikace osob dle zvoleného biometrického rysu [1], jako je oční duhovka, otisky prstů či rysy tváře. Příspěvek popisuje přístup pro efektivní Lubos Popelínský (ed.), DATAKON 2003, Brno, , pp

2 2 Efektivní vyhledávání v kolekcích obrázků tváří vyhledávání v rozsáhlých kolekcích obrázků tváří. Využíváme existujícího přístupu pro rozpoznávání tváří, kterým je analýza hlavních komponent (PCA) [14]. Získané redukované vektory jsou vloženy do metrické datové struktury M-strom [7], tak aby bylo možné efektivně vyhledávat ve velkých kolekcích obrázků. Snažíme se tedy o propojení dvou oblastí, rozpoznávání obrázků tváří [12] a indexování vícerozměrných dat [27,5]. V případě rozpoznávání tváří se autoři často zaměřují na samotné rozpoznávání tváří, problém efektivního vyhledání ve velkých kolekcích většinou není řešen. V existujících přístupech jsou často tváře hledány sekvenčním průchodem kolekcí, což je pro velké množství dat nerealizovatelné. Vezměme v úvahu úmysl vlády USA zálohovat fotky všech návštěvníků tohoto státu. Je nutné si uvědomit, že i kdyby se porovnání dvou obrázků provedlo za 10ms, sekvenční vyhledání vstupního obrázku v kolekci 10 8 obrázků by trvalo téměř 11.5dne. Naproti tomu, z pohledu vícerozměrných indexovacích struktur a algoritmů, je získání indexovací informace z indexovaného objektu (tzv. extrakce rysů [5]) nezajímavé. Výsledkem extrakce rysů je vektor prvek mnohorozměrného prostoru. V případě indexování obrázků je pro extrakci rysů často použit histogram, což je ovšem informace nerelevantní pro měření podobnosti obrázků. V tomto příspěvku využíváme pro extrakci rysů z obrázků tváří analýzu hlavních komponent, která redukuje původní vícerozměrný prostor obrázků. V kapitole 2 budou krátce popsány existující přístupy pro rozpoznávání tváří a především využití PCA k rozpoznávání tváří. Výstupem této metody jsou redukované vektory, jejichž vzdálenost (tedy podobnost původních obrázků) měříme pomocí metrik. Získané vektory můžeme tedy indexovat pomocí metrických datových struktur, jedna z těchto struktur M-strom je popsána v kapitole 3. V kapitole 4 je shrnut přístup pro efektivní vyhledávání ve velkých kolekcích obrázků. Kapitola 5 obsahuje výsledky experimentů provedených s použitím popisovaných přístupů. V závěru bude shrnut obsah článku a ukázány další možnosti budoucí práce. 2 Využití analýzy hlavních komponent pro rozpoznávání obrázků tváří 2.1 Rozpoznávání a detekce tváří Oblast detekce a rozpoznávání tváří [12] má za sebou mnohaletý vývoj, během kterého bylo vyvinuto mnoho přístupů. První přístupy se začaly objevovat již na počátku 70.let 20.století, jednalo se o jednoduché heuristické a antropometrické techniky. Tyto přístupy byly velmi závislé na podmínkách vzniku fotografie a často byly schopny pracovat pouze s typicky pasovými fotkami. Rozvoj této oblasti počítačových věd je datován na počátek 90.let 20.století. V [12] jsou přístupy pro detekci a rozpoznávání tváří rozděleny na přístupy založené na rysech tváře a přístupy založené na zpracování obrazu. Přístupy založené na rysech tváře Tyto přístupy byly často vyvinuty v raných dobách vývoje oblasti rozpoznávání tváří a proto existuje velké množství publikovaných článků. Využívají znalosti o obličeji a jeho rysech a aplikují různé metody pro získání těchto rysů, jako jsou např.

3 Vybraný příspěvek 3 nízko-úrovňová analýza provádějící segmentaci vizuálních rysů [6] či aktivní tvarové modely (tzv. snakes) [10]. Přístupy založené na zpracování obrazu Tyto přístupy chápou řešený problém jako obecný rozpoznávací problém (pattern recognition problem). Detekce obličeje pomocí přesného modelování rysů obličeje je nepředvídatelná právě kvůli možnému chování tváře a vlivu okolí (např. světlost, pozadí). Přístupy založené na zpracování obrazu často klasifikují tváře bez nutnosti hledání rysů a mohou tak řešit i složitější problémy, jako je např. detekce více tváří v silně nečistém prostředí. Mezi tyto přístupy patří např. vyhledávání šablon (template matching) [13], lineární podprostorové metody či neuronové sítě. Lineární podprostorové metody chápou kolekci obrázků tváří jako vektory podprostoru v prostoru všech obrázků, což umožňuje aplikovat rozmanité algebraické metody jako jsou analýza hlavních komponent (PCA) či analýza lineárních diskriminantů (LDA). 2.2 Analýza hlavních komponent V [19] je popsána metoda využívající analýzu hlavních komponent [14] k efektivní reprezentaci lidské tváře. Autoři v [23,24,15] popisují použití PCA pro rozpoznávání a detekci obrázků tváří, na tomto přístupu je založeno velmi mnoho později publikovaných technik pro rozpoznávání a detekci tváří. Pro zpracování velkých kolekcí dat je důležité, že tato metoda vykonává automatizovanou extrakci rysů. Získané vektory je potom možné využít pro vyhledávání ve velkých kolekcích dat s využitím vícerozměrných datových struktur (viz kapitola 3). Nechť je obrázek velikosti w h 2-rozměrné pole intenzit I(x,y), n-rozměrný vektor obrázku Γ (n = w h) můžeme vytvořit položením jednotlivých řádků obrázku za sebe. Kolekce obrázků je tak modelována jako množina bodů ve vysocedimenzionálním prostoru. Obrázky tváří jsou si ovšem podobné a proto nejsou náhodně distribuovány v tomto prostoru. Hlavní myšlenkou PCA (také Karhunen- Loeve expanze) je nalézt vektory, které nejlépe popisují distribuci obrázků tváří v celém prostoru obrázků. Tyto vektory dimenze n definují podprostor, který nazýváme prostor obrázků tváří (face space) a jsou lineární kombinací původních vektorů. Protože tyto vektory jsou vlastní vektory kovarianční matice korespondující k původním obrázkům a protože jsou podobné obrázkům tváří, nazýváme je eigenfaces (pozn. pojem vlastní tváře je nevhodný, proto budeme dále používat pojmu anglického). Podobnost redukovaných obrázků měříme Euklidovskou metrikou. Nechť máme kolekci obrázků Γ 1,Γ 2,...,Γ m. Průměrný obrázek tváře je spočítán takto: m 1 Ψ = Γ (1) m i= 1 Na obrázku 1(a) vidíme testovací kolekci obrázků tváří a na obrázku 1(b) průměrný obrázek této kolekce. Vektory Φ i získáme odečtením průměrného obrázku Ψ od obrázku Γ i : Φ i = ( Γi Ψ ) (2) Takto získaná množina vektorů je vstupem do analýzy hlavních komponent, která hledá množinu n ortonormálních vektorů u i, které nejlépe popisují distribuci dat. i

4 4 Efektivní vyhledávání v kolekcích obrázků tváří Vektory u k a skaláry λ k jsou vlastní vektory (též hlavní komponenty) resp. vlastní čísla kovarianční matice: 1 C = m m T 1 T Φ iφ i = AA (3) m i= 1 (a) (b) Obr. 1. (a) Testovací kolekce obrázků tváří. (b) Průměrný obrázek tváře. Matice A=[Φ 1 Φ 2...Φ m ] je řádu n m (je tvořena sloupcovými n-rozměrnými vektory Φ i, 1 i m). Matice C je řádu n n. Autoři uvádí, že výpočet vlastních čísel takovéto matice je nezvládnutelný, proto v [23] popisují techniku jejich výpočtu pomocí lineární kombinace vektorů získaných řešením výpočtu vlastních čísel matice řádu m m. Autoři ovšem předpokládají m << n, tedy že počet obrázků je daleko menší než dimenze prostoru. V tom případě by byl tento přístup nepoužitelný pro indexování velkých kolekcí obrázků, pro které se dá naopak předpokládat m >> n. V současné době je však výpočet vlastních čísel a vektorů matice n n výpočetně řešitelný. Jelikož je ale takový výpočet náročný, je významné že existují numerické metody jako je např. Lancoszova metoda [9], které počítají postupně vlastní vektory příslušející k vlastním číslům dle jejich velikosti. Můžeme proto vypočítat pouze relevantní vlastní vektory. k, k n, vybraných vlastních vektorů (příslušejících ke k největším vlastním číslům) nazýváme eigenfaces, tyto vektory tvoří bázi redukovaného prostoru obrázků. Po jejich vytvoření se úloha identifikace tváře stává úlohou rozpoznávání vzorů. Pomocí těchto n-rozměrných vektorů můžeme redukovat původní n-dimenzionální prostor obrázků na prostor k-rozměrný. Počet eigenfaces (tedy hodnotu k) je možné heuristiky určit dle hodnot vlastních čísel, malá vlastní čísla přispívají málo k popisu odchylek mezi obrázky a příslušné vlastní vektory můžeme tudíž ignorovat. Na obrázku 2 vidíme ukázku 200 prvních eigenfaces kolekce o větším počtu obrázků. Eigenfaces nám reprezentují významné (tedy společné) rysy obrázků (v tomto případě tváří). Zároveň vidíme význam použití vlastních vektorů příslušejících

5 Vybraný příspěvek 5 k největším vlastním číslům ty nejlépe charakterizují zpracovávanou sadu obrázků. Pomocí eigenfaces jsme schopni redukovat původní n-rozměrný prostor na k- rozměrný promítnutím n-rozměrného vektoru Γ do prostoru obrázků tváří (jinými slovy transformovat jej do eigenfaces komponent) výpočtem k skalárů: ω = ( Γ Ψ ), i = 1, K k (4) u T i i, T Ω = ω ω Kω ] (5) [ 1 2 k Obr. 2. Ukázka eigenfaces uspořádaných dle velikosti příslušných vlastních čísel. T Ω je redukovaný k-rozměrný vektor, který je nazýván vektor tvaru vah. Vektor vyjadřuje příspěvek každého vlastního vektoru pro reprezentaci obrázku, vlastní vektory tedy tvoří základní množinu kolekce obrázků tváří. Takto získaný vektor použijeme pro nalezení tváře uložené v databázi (pokud taková existuje) výpočtem Euklidovské vzdálenosti promítnutého vektoru od všech projekcí vektorů obrázků z databáze (jejich počet je m): 2 2 ε = Ω Ω, i = 1, K m (6) i i, Tvář z databáze je identifikována pokud je hodnota ε i minimální a zároveň ε i < θ ε (zvolená prahová hodnota). Jelikož mnoho obrázků odlišných od obrázků tváří je promítnuto na stejný redukovaný vektor, je vhodné vypočítat i tzv. DFFS (distance from face space): 2 2 DFFS = Φ Φ r (7) k Φ = ω u (8) r i= 1 DFFS (též rekonstrukční chyba) tedy vyjadřuje vzdálenost mezi obrázkem a jeho projekcí do redukovaného prostoru, můžeme ji chápat též jako vzdálenost obrázku od redukovaného prostoru tváří. Zatímco vektor tvaru vah je aproximací, DFFS umožňuje přesně rozpoznávat obrázek tváře (vektor Φ r je neredukovaný). Obou hodnot (ε i i DFFS) využijeme při rozpoznávání tváří, mohou nastat tyto čtyři případy: 1. Nějaký obrázek z databáze je blízký (podobný) - hodnota ε i, rovněž prostor je blízký hodnota DFFS vstupní obrázek je obrázkem tváře a byl identifikován v databázi. 2. Žádný obrázek není podobný, ale prostor je blízký vstupní obrázek je obrázkem tváře, který není v databázi. i i

6 6 Efektivní vyhledávání v kolekcích obrázků tváří 3. Nějaký obrázek z databáze je podobný, ale prostor je vzdálený vstupní obrázek není obrázkem tváře. Vidíme jak se tato metoda umí vypořádat s chybně rozpoznanými obrázky. 4. Žádný obrázek není podobný, rovněž prostor je vzdálený. Pro rozpoznání obrázků tváří musíme stanovit prahové hodnoty θ DFFS a θ ε. Hodnota θ DFFS určuje maximální hodnotu DFFS pro kterou budeme považovat vstupní obrázek za obrázek tváře. Rozpoznání obrázků probíhá tak, že vypočteme vzdálenosti všech redukovaných vektorů obrázků v databázi od redukovaného dotazovacího vektoru. Pokud nalezená minimální vzdálenost < θ ε pak je vstupní obrázek identifikován. Pro velké kolekce dat je takovýto postup nerealizovatelný, v kapitole 4 prezentujeme přístup pro efektivní vyhledávání obrázků ve velkých kolekcích dat. Autoři v [15] uvádí použití vlastních vektorů významných rysů tváře jako jsou oči, nos a ústa (které jsou nazvány eigeneyes, eigennose a eigenmouth, dohromady pak eigenfeatures) k rozpoznávání tváří. V tomto případě jsou schopni dokonce rozpoznat obličej se změněnou mimikou, plnovousem atd. V [8] autoři popisují techniku detekce jednotlivých rysů obličeje založenou právě na eigenfeatures. Dalším využitím algebraických metod redukce je přirozeně i ztrátová komprese. 3 Indexování vícerozměrných prostorů Vícerozměrné datové struktury slouží pro indexování vícerozměrných prostorů [27]. Rozlišujeme datové struktury pro indexování vektorových a metrických prostorů. Zjednodušeně řečeno máme v případě vektorových prostorů k dispozici kompletní informaci o umístění bodu v prostoru (tedy jeho souřadnici), v případě metrických prostorů rozlišujme pouze vzdálenost (podobnost) bodů, kterou měříme metrikou. Příkladem struktur pro indexování vektorových prostorů je např. R-strom [11] a UBstrom [3], strukturou pro indexování metrických prostorů je např. M-strom [7]. Jelikož při rozpoznávání obrázků tváří využíváme Euklidovské metriky počítáme vzdálenosti vektorů obrázků, pro efektivní vyhledávání obrázků využíváme metrické datové struktury M-strom. 3.1 M-strom Datová struktura M-strom představená v [7], využívá pro indexování objektů vlastností metrických prostorů. Vnitřní strukturou je to perzistentní stránkovaný strom, podobně jako klasický B-strom [25]. Rozdíl spočívá v obsahu uzlů a listů stromu. Indexované objekty (ground objects) jsou uloženy v listech stromu, nelistové uzly obsahují tzv. směrovací objekty (routing objects). Záznam směrovacího objektu O r v uzlu obsahuje: indexovaný objekt O r, odkaz ptr(t(o r )) na svůj podstrom T(O r ) tzv. pokrývající strom (covering tree), hodnotu r(o r ) - tzv. pokrývací poloměr (covering radius), hodnotu d(o r,p(o r )) - vzdálenost od rodičovského směrovacího objektu P(O r ).

7 Vybraný příspěvek 7 Záznam ground objektu vypadá podobně, ovšem místo odkazu na pokrývající strom a poloměru obsahuje oid(o j ) identifikátor celého objektu uloženého mimo M- strom v datovém souboru. Princip hierarchie M-stromu spočívá v rozdělení prostoru do metrických regionů (ty nemusí být nutně disjunktní). K tomu slouží směrovací objekty a to tak, že všechny ground objekty, které obsahuje pokrývající strom T(O r ) směrovacího objektu O r, jsou ve vzdálenosti maximálně r(o r ) od O r. Na obrázku 3 je schématicky znázorněna struktura stromu a vztahy mezi směrovacími objekty (regiony). Obr. 3. (a) Struktura M-stromu. (b) Odpovídající dělení metrického prostoru. Při operacích nad M-stromem počítáme se dvěma faktory složitosti. Prvním je klasický počet přístupů na diskové stránky (resp. počet prohledávaných regionů), druhým je počet výpočtů vzdáleností mezi objekty, což může být výpočetně náročná operace. Snahou je oba tyto faktory minimalizovat. Zajímavou vlastností M-stromů je fakt, že jimi lze indexovat prakticky cokoliv na čem může být nadefinována metrika. Použití ovšem není úplně univerzální, uvědomme si například jaká bude efektivita vyhledávání, pokud budou všechny indexované objekty ležet stejně daleko od sebe. Obecnost M-stromů je vykoupena dosti složitým managementem štěpení a slučování regionů při základních operacích tak, aby zůstala zachována vysoká efektivita. V metrických stromech se setkáváme se dvěma typy rozsahových dotazů. Dotazy na vzdálenost vyhledají ty objekty, které leží do určité vzdálenosti od dotazovaného objektu. Dotazy na k-nejbližších sousedů (k-nn - k-near neighbours query) zase vyhledají k dotazovanému objektu k jeho nejbližších sousedů. Pro zlepšení vlastností M-stromu (optimalizace překryvů regionů atd.) využíváme vlastních algoritmů publikovaných v [20]. 4 Efektivní vyhledávání v kolekcích obrázků tváří Při rozpoznávání tváří autoři často prochází sekvenčně celou kolekci, popř. provádí jednoduché shlukování [22], které ovšem není hierarchizováno a nesnižuje tedy příliš složitost vyhledávání. V našem přístupu využíváme strukturu M-strom, která hierarchizuje shluky do stromové struktury a poskytuje tak v ideálním případě složitost vyhledávání blízkou logaritmické. Celý proces vyhledávání je následující: 1. Využíváme pouze kanonického tvaru tváře [22], která obsahuje pouze významné rysy tváře: oči, ústa a nos. Takto potlačujeme nesignifikantní informace, především vliv okolí. Zároveň snížíme rozlišení obrázku, např. konvolucí

8 8 Efektivní vyhledávání v kolekcích obrázků tváří s gausiánem [21], takto jsou potlačeny nevýznamné vazby mezi pixely. Každá tvář je pak reprezentována obrázkem o velikosti pixelů. 2. Získané obrázky jsou podrobeny výše popsané metodě PCA. 3. Dle hodnot získaných vlastních čísel, je vybráno k vlastních vektorů. Původní 400-rozměrné vektory jsou transformovány na vektory k-rozměrné. Takto získané vektory jsou vloženy do datové struktury M-strom. 4. Vstupní obrázek je opět transformován na 400-rozměrný vektor a redukován. Pomocí hodnoty DFFS a prahové hodnoty θ DFFS nejprve zjistíme zda se jedná o obrázek tváře. Pokud ano, pomocí dotazu na jednoho nejbližšího souseda najdeme nejpodobnější obrázek tváře. Pokud je vzdálenost <θ ε, je tvář osoby ze vstupního obrázku identifikována v databázi. 5 Výsledky experimentů Experimenty byly provedeny s databází 230 obrázků tváří. Obrázky byly podrobeny metodě PCA. Pro výpočet kovarianční matice je významné, že rozdílová matice A je sice hustá, ale obsahuje asi 0.1% nulových hodnot. Kovarianční matice C je hustá. Výpočet 400 vlastních čísel kovarianční matice trval 3s (testováno na počítači Intel Pentium 4 2.4GHz, 512MB operační paměti). Testovací obrázky jsou prezentovány na obrázku 4. V případě obrázku (a), který není obrázkem tváře, získáme pro 90 vybraných vlastních vektorů náležících k největším vlastním číslům (k=90) hodnotu DFFS = V případě obrázků (b) a (c) získáme hodnoty resp Nastavením prahové hodnoty θ DFFS např. na hodnotu odhalíme, že obrázek (a) není obrázkem tváře. Redukované vektory byly vloženy do datové struktury M-strom, jejíž charakteristiku vidíme v tabulace 1. (a) (b) (c) Obr. 4. Dotazovací obrázky. Počet diskových přístupů a operací výpočtu metriky naměřených při vykonávání dotazů 4(b) a (c) je prezentován na obrázku 5. Počet diskových přístupů i počet operací v závislosti na dimenzi redukovaného prostoru (tedy počtu vybraných vlastních vektorů) je porovnáván se sekvenčním průchodem kolekcí. Pro každou dimenzi byl znovu vytvořen M-strom. Pro dotazovací obrázek 4(b), který je uložen v databázi, vidíme že počet diskových přístupů a operací při dotazu na 1 nejbližšího souseda je v porovnání se sekvenčním průchodem až 4 resp. 10 nižší. Tab. 1. Charakteristika vytvořeného M-stromu. dimenze: velikost uzlu [B]: utilizace: 62.4% 67.9% velikost položky [B]: arita: 7

9 Vybraný příspěvek 9 Nyní vezměme dotazovací obrázek 4(c), který je obrázkem osoby uložené v databázi, ale je mírně otočen. Metoda PCA je schopna nalezením závislostí mezi pixely rozpoznat i takové obrázky. Při velké redukci prostoru dostaneme jako nejbližšího souseda chybný vektor (tzv. špatný výběr). V tomto případě dostaneme správný výsledek pro dotazovací obrázek 4(c) až pro k = 90. Realizace tohoto dotazu v případě větší redukce musí být provedena širším dotazem hledáním k nejbližších sousedů, kde k > 1. Pravou osobu pak můžeme identifikovat výpočtem vzdáleností neredukovaných vektorů Φ r z rovnice 7 takto získané množiny vektorů. Přílišná redukce prostoru nám tedy zhoršuje přesnost, na druhou stranu vzrůstající dimenze zhoršuje efektivitu vyhledávání v metrické datové struktuře (vliv tzv. prokletí dimensionality [27]). Musíme tedy volit kompromis významnou redukci prostoru, ale takovou abychom mohli použít dotaz na menší počet nejbližších sousedů. Ovšem z výsledků experimentů vidíme, že efektivita vyhledávání v metrické datové struktuře je jednoznačně lepší než při sekvenčním průchodu kolekcí. (a) (b) Obr. 5. (a) Počet diskových přístupů při vykonávání dotazů. (b) Počet operací výpočtu metriky při vykonávání dotazů. 6 Závěr V tomto článku byl prezentován přístup pro vyhledávání tváří ve velkých kolekcích obrázků. V oblasti zpracování obrazu vznikla celá řada technik pro rozpoznávání a detekci tváří. Použitá analýza hlavních komponent redukuje původní mnohorozměrný prostor obrázků. V článku byla navržena metoda využívající metrické datové struktury pro indexování takto získaných redukovaných vektorů. Z experimentů vidíme, že použití metrické datové struktury pro rozpoznávání obrázků tváří poskytuje velmi dobré složitosti v porovnání se sekvenčním průchodem. Analýza hlavních komponent poskytuje velmi smysluplnou extrakci rysů sady obrázků, která je částečně odolná proti vnějším vlivům jako je např. natočení obrázku. V budoucí práci bychom chtěli zdokonalit samotné rozpoznávání tváří a extrakci rysů. Nabízí se celá řada algebraických metod pro redukci dimenze, jako např. singulární rozklad (Singular Value Decomposition - SVD) [9]. Singulární rozklad je již používán v

10 10 Efektivní vyhledávání v kolekcích obrázků tváří information retrieval pro redukci prostoru textových dokumentů jako jedna z metod indexování latentní sémantiky (Latent Semantic Index - LSI) [4]. Využití singulárního rozkladu pro rozpoznávání obrázků bylo publikováno v [17]. V naší budoucí práci chceme především testovat popsaný přístup na velké kolekci obrázků tváří. Námi prezentovaný přístup využívající robustní perzistentní datovou strukturu M-strom je určen právě pro takové kolekce. Literatura 1. Ashbourn, J.: Biometrics, Advanced Identity Verification. Springer Verlag, New York, ISBN , Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval. Addison Wesley, New York, Bayer, R.: The Universal B-Tree for multidimensional indexing: General Concepts. In: Proc. of World-Wide Computing and its Applications'97, WWCA'97, Tsukuba, Japan, Berry, M.W., Browne, M.: Understanding Search Engines, Mathematical Modeling and Text Retrieval. Siam, Böhm, C., Berchtold, S., Keim, D.A.: Searching in High-dimensional Spaces - Index Structures for Improving the Performance Of Multimedia Databases. ACM, Brunelli, R., Poggio, T.: Face recognition: Feature versus templates. In: Proc. of IEEE Trans. Pattern Anal. Mach. Intell, 15, pages , Ciaccia, P., Pattela, M., Zezula, P.: M-tree: An Efficient Access Method for Similarity Search in Metric Spaces. In: Proc. of 23rd International Conference on VLDB, Athens, Greece, pages , Demirel, H., Clarke, T. J., Cheung, P.J.K.: Adaptive automatic facial feature segmentation. In: Proc. 2nd International Conference on Automatic Face and Gesture Recognition, Vermont, pages , Golub, G.H., Van Loan, C.F.: Matrix Computations. Johns Hopkins, Gunn, S.R., Nixon, M.S.: A dual active contour for head and boundary extraction. In: Proc. IEEE Colloquium on Image Processing for Biometric Measurement, London, Great Britain, Guttman, A.: R-Trees: A Dynamic Index Structure for Spatial Searching. In: Proc. of ACM SIGMOD 1984, Annual Meeting, Boston, USA, June 1984, pages 47 57, ACM Press. 12. Hjelmås, E., Low, B.K.: Face Detection: A Survey. Computer Vision and Image Understanding, Volume 83, Issue 3, pages , Elsevier Science, Holst, G.: Face detection by facets: Combined bottom-up and top-down search using compound templates. In: Proc. of the 2000 International Conference on Image Processing, pages TA07.08, Hyvärinen, A., Karhunen, J., Oja, E.: Independent Component Analysis. Wiley- Interscience, ISBN X, 2001.

11 Vybraný příspěvek Pentland, A., Moghaddam, B., Starner, T.: View-based and Modular Eigenspaces for Face Recognition. In: Proc. of IEEE Conference on Computer Vision and Pattern Recognition (CVPR'94), Seattle, WA, June, Pokorný, J., Snášel, V., Húsek, D.: Dokumentografické informační systémy. Karolinum, Praha, Praks, P., Dvorský, J., Snášel, V.: Latent Semantic Indexing for Image Retrieval Systems. In: Proc. SIAM Conference on Applied Linear Algebra 2003, LA'03. Williamsburg, USA, The College of William and Mary, Salton, G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw Hill Publications, 1st edition, Sirovich L., Kirby, M.: Low-dimensional procedure for the characterization of human faces. Journal of Optical Society of America, pages , Skopal, T. Pokorný, J., Krátký, M., Snášel, V.: Revisiting M-tree Building Principles. In: Proc. of Advances in Databases and Information Systems, ADBIS 2003, 7th East European Conference, Dresden, Germany, Springer Verlag, Sojka, E.: Digitální zpracování obrazu a analýza obrazu a počítačového vidění. VŠB-Technická univerzita Ostrava, Sung, K.K., Poggio, T.: Example-Based Learning for View-Based Human Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(1), pages 39 51, Turk, M., Pentland, A.: Eigenfaces for recognition. Journal of Cognitive Neuroscience Volume 3, Number 1. pages 71 86, Turk, M., Pentland, A.: Face recognition using eigenfaces. In: Proc. IEEE Conference on Computer Vision and Pattern Recognition, Maui, Hawaii, Wirth, N.: Algorithms and Data Structures. Prentice Hall, Witten, I.H., Moffat, A., Bell, T.C.: Managing Gigabytes, Compressing and Indexing Documents and Images. Van Nostrand Reinhold, New York, USA, Yu, C.: High-Dimensional Indexing. Springer Verlag, LNCS 2341, Annotation: Efficient Searching in Face Collections A problem of storage and efficient searching in large multimedia document collections is solved in information retrieval. In the paper we present an approach for efficient searching in face image collections. The approach uses the principal component analysis for face recognition, which reduces original face space and provides useful feature extraction. Acquired vectors are inserted into M-tree metric data structure and the faces are searched with better complexity than linear. So the approach is suitable for efficient searching in large face collections.

Geometrické indexování a dotazování multimediálních dat

Geometrické indexování a dotazování multimediálních dat Geometrické indexování a dotazování multimediálních dat Tomáš Skopal, Michal Krátký, Václav Snášel Katedra informatiky, VŠB-Technická Univerzita Ostrava 17. listopadu 15, 708 33 Ostrava-Poruba {michal.kratky,

Více

Metrické indexování vektorových modelů v oblasti information retrieval

Metrické indexování vektorových modelů v oblasti information retrieval Metrické indexování vektorových modelů v oblasti information retrieval Tomáš Skopal Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba Tomas.Skopal@vsb.cz

Více

Využití LSI a M-stromu při indexování a vyhledávání obrázků

Využití LSI a M-stromu při indexování a vyhledávání obrázků Využití LSI a M-stromu při indexování a vyhledávání obrázků Tomáš Skopal 1, Michal Kolovrat 2 a Václav Snášel 2 1 Katedra softwarového inženýrství, MFF UK Praha, Malostranské nám. 25, 118 00, Praha 2 Katedra

Více

Vícerozměrný přístup pro netriviální vyhledávání termů

Vícerozměrný přístup pro netriviální vyhledávání termů Vícerozměrný přístup pro netriviální vyhledávání termů Michal Krátký, Tomáš Skopal, Václav Snášel Katedra informatiky, FEI, VŠB Technická univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz

Více

Využití SVD pro indexování latentní sémantiky

Využití SVD pro indexování latentní sémantiky Využití SVD pro indexování latentní sémantiky Michal Krátký 1 Department of Computer Science, VŠB-Technical University of Ostrava, Czech Republic michal.kratky@vsb.cz Abstrakt Zpracováváním velkého množství

Více

Datové struktury. Zuzana Majdišová

Datové struktury. Zuzana Majdišová Datové struktury Zuzana Majdišová 19.5.2015 Datové struktury Numerické datové struktury Efektivní reprezentace velkých řídkých matic Lze využít při výpočtu na GPU Dělení prostoru a binární masky Voxelová

Více

Prohledávání dokumentů ve vektorovém modelu

Prohledávání dokumentů ve vektorovém modelu Prohledávání dokumentů ve vektorovém modelu Pavel Moravec 1 Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba pavel.moravec@vsb.cz Abstrakt. Information

Více

Stromové struktury v relační databázi

Stromové struktury v relační databázi Stromové struktury v relační databázi Stromové struktury a relační databáze Zboží Procesory Intel Pentium IV Celeron Paměti AMD Duron DDR DIMM Athlon http://interval.cz/clanky/metody-ukladani-stromovych-dat-v-relacnich-databazich/

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika

Více

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

Klasifikační metody pro genetická data: regularizace a robustnost

Klasifikační metody pro genetická data: regularizace a robustnost Odd medicínské informatiky a biostatistiky Ústav informatiky AV ČR, vvi Práce vznikla za finanční podpory Nadačního fondu Neuron na podporu vědy Klasifikační metody pro genetická data Regularizovaná klasifikační

Více

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků lukas.mach@gmail.com Přílohy (videa, zdrojáky, ) ke stažení na: http://mach.matfyz.cz/sift Korespondence

Více

Klasifikace a rozpoznávání. Extrakce příznaků

Klasifikace a rozpoznávání. Extrakce příznaků Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám

Více

Datové struktury 2: Rozptylovací tabulky

Datové struktury 2: Rozptylovací tabulky Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy

Více

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace

Více

Úlohy nejmenších čtverců

Úlohy nejmenších čtverců Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.

Více

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů

Více

Singulární rozklad aplikace v image deblurring

Singulární rozklad aplikace v image deblurring Singulární rozklad aplikace v image deblurring M. Plešinger, Z. Strakoš TUL, Fakulta mechatroniky, Liberec AV ČR, Ústav informatiky, Praha 1 Úvod Uvažujme obecnou reálnou matici Pak existuje rozklad A

Více

Numerické metody a programování

Numerické metody a programování Projekt: Inovace výuky optiky se zaměřením na získání experimentálních dovedností Registrační číslo: CZ.1.7/2.2./28.157 Numerické metody a programování Lekce 4 Tento projekt je spolufinancován Evropským

Více

Robust 2014, 19. - 24. ledna 2014, Jetřichovice

Robust 2014, 19. - 24. ledna 2014, Jetřichovice K. Hron 1 C. Mert 2 P. Filzmoser 2 1 Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta, Univerzita Palackého, Olomouc 2 Department of Statistics and Probability Theory Vienna University

Více

Zpracování digitalizovaného obrazu (ZDO) - Popisy III

Zpracování digitalizovaného obrazu (ZDO) - Popisy III Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování

Více

Umělá inteligence a rozpoznávání

Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních

Více

Extrakce a selekce příznaků

Extrakce a selekce příznaků Extrakce a selekce příznaků Based on slides Martina Bachlera martin.bachler@igi.tugraz.at, Makoto Miwa And paper Isabelle Guyon, André Elisseeff: An Introduction to variable and feature selection. JMLR,

Více

1 Linearní prostory nad komplexními čísly

1 Linearní prostory nad komplexními čísly 1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)

Více

Statistické modely tvaru a vzhledu

Statistické modely tvaru a vzhledu Kapitola 1 Statistické modely tvaru a vzhledu V této kapitole nastíním problematiku statistických modelů tvaru, jejich využití a metod potřebných pro jejich výpočet a použití. Existují dvě hlavní metody;

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d

KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d KMA/PDB Prostorové databáze Karel Janečka Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d Sylabus předmětu KMA/PDB Úvodní přednáška Základní terminologie Motivace rozdíl klasické

Více

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Dolování dat z multimediálních databází Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Obsah prezentace Co jsou multimediální databáze Možnosti dolování dat v multimediálních databázích Vyhledávání fotografií

Více

k-dimenzionálním prostoru. problém: Zkonstruovat strom, který rozděluje prostor polorovinami

k-dimenzionálním prostoru. problém: Zkonstruovat strom, který rozděluje prostor polorovinami kd-stromy (kd-trees) k čemu to je: ukládání vícerozměrných dat (k-dimenzionální data) vstup: Množina bodů (nebo složitějších geometrických objektů) v k-dimenzionálním prostoru. problém: Zkonstruovat strom,

Více

Rozpoznávání v obraze

Rozpoznávání v obraze Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd

Více

Numerické metody a programování. Lekce 4

Numerické metody a programování. Lekce 4 Numerické metody a programování Lekce 4 Linarní algebra soustava lineárních algebraických rovnic a 11 a 12 x 2 a 1, N x N = b 1 a 21 a 22 x 2 a 2, N x N = b 2 a M,1 a M,2 x 2 a M,N x N = b M zkráceně A

Více

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí: Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se

Více

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

NAIL072 ROZPOZNÁVÁNÍ VZORŮ NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační

Více

1 Projekce a projektory

1 Projekce a projektory Cvičení 3 - zadání a řešení úloh Základy numerické matematiky - NMNM20 Verze z 5. října 208 Projekce a projektory Opakování ortogonální projekce Definice (Ortogonální projekce). Uvažujme V vektorový prostor

Více

Strojové učení se zaměřením na vliv vstupních dat

Strojové učení se zaměřením na vliv vstupních dat Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications

Více

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají

Více

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Příklady použití metod strojového učení v rozpoznávání tváří Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Stavební bloky systému

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Databázové a informační systémy Jana Šarmanová

Databázové a informační systémy Jana Šarmanová Databázové a informační systémy Jana Šarmanová Obsah Úloha evidence údajů, způsoby evidování Databázové technologie datové modely, dotazovací jazyky. Informační systémy Datové sklady Metody analýzy dat

Více

SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT

SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT Lukáš Fritsch ČVUT v Praze, Fakulta elektrotechnická, katedra radioelektroniky Abstrakt Obrazové kompresní algoritmy založené na Karhunen- Loeveho transformaci

Více

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je

Více

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů Tvorba informačních systémů 1/18 Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2008/2009 Tvorba informačních systémů 2/18 Úvod

Více

APROXIMACE KŘIVEK V MATLABU NEWTONŮV INTERPOLAČNÍ POLYNOM CURVE FITTING IN MATLAB NEWTON INTERPOLATION POLYNOMIAL

APROXIMACE KŘIVEK V MATLABU NEWTONŮV INTERPOLAČNÍ POLYNOM CURVE FITTING IN MATLAB NEWTON INTERPOLATION POLYNOMIAL APROXIMACE KŘIVEK V MATLABU NEWTONŮV INTERPOLAČNÍ POLYNOM CURVE FITTING IN MATLAB NEWTON INTERPOLATION POLYNOMIAL Jiří Kulička 1 Anotace: Článek se zabývá odvozením, algoritmizací a popisem konstrukce

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Vizualizace v Information Retrieval

Vizualizace v Information Retrieval Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby

Více

ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ

ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ K. Nováková 1, J. Kukal 1,2 1 Fakulta jaderná a fyzikálně inženýrská, ČVUT v Praze 2 Ústav počítačové a řídicí techniky, VŠCHT Praha

Více

Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)

Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci) ..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY)

Více

Michal Krátký, Miroslav Beneš

Michal Krátký, Miroslav Beneš Databázové a informační systémy Michal Krátký, Miroslav Beneš Katedra informatiky VŠB Technická univerzita Ostrava 5.12.2005 2005 Michal Krátký, Miroslav Beneš Databázové a informační systémy 1/24 Obsah

Více

Tvorba informačních systémů

Tvorba informačních systémů Tvorba informačních systémů Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2006/2007 c 2006 2008 Michal Krátký Tvorba informačních systémů 1/17 Úvod XML

Více

Binární vyhledávací stromy pokročilé partie

Binární vyhledávací stromy pokročilé partie Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald

Více

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice 8. licenční studium chemometrie Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí

Více

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík,, CSc. NEURONOVÉ SÍTĚ otázky a odpovědi 1 AKD_predn4, slide 8: Hodnota výstupu závisí na znaménku funkce net i, tedy na tom, zda bude suma

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

11 Analýza hlavních komponet

11 Analýza hlavních komponet 11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu

Více

SVD rozklad a pseudoinverse

SVD rozklad a pseudoinverse SVD rozklad a pseudoinverse Odpřednesenou látku naleznete v kapitole 12 skript Abstraktní a konkrétní lineární algebra. Jiří Velebil: Lineární algebra 19.12.2016: SVD rozklad a pseudoinverse 1/21 Cíle

Více

Michal Krátký. Úvod do programování. Cíl kurzu. Podmínky získání zápočtu III/III

Michal Krátký. Úvod do programování. Cíl kurzu. Podmínky získání zápočtu III/III Michal Krátký Úvod do programování Michal Krátký 1,Jiří Dvorský 1 1 Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programování, 2004/2005 tel.: +420 596 993 239 místnost: A1004 mail: michal.kratky@vsb.cz

Více

13 Barvy a úpravy rastrového

13 Barvy a úpravy rastrového 13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody

Více

ZPRACOVÁNÍ OBRAZU PRO VYHODNOCENÍ SEGREGACE DRÁTŮ

ZPRACOVÁNÍ OBRAZU PRO VYHODNOCENÍ SEGREGACE DRÁTŮ ZPRACOVÁNÍ OBRAZU PRO VYHODNOCENÍ SEGREGACE DRÁTŮ K. Horák Fakulta elektrotechniky a komunikačních technologií, Vysoké učení technické v Brně Abstrakt Zpracování obrazu se jako disciplína technické kybernetiky

Více

Datové struktury pro prostorové vyhledávání

Datové struktury pro prostorové vyhledávání Datové struktury pro prostorové vyhledávání 1998-2011 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ SpatialData 2011 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1

Více

Ing. Václav Eksler Ústav telekomunikací FEKT VUT v Brně

Ing. Václav Eksler Ústav telekomunikací FEKT VUT v Brně 1 z 10 5.10.2010 9:16 Elektrorevue 2005/29-17.5.2005 Obsah Ing. Václav Eksler eksler@feec.vutbr.cz Ústav telekomunikací FEKT VUT v Brně Problematikou separace zdrojů naslepo nebo také separace signálů

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

Databázové a informační systémy

Databázové a informační systémy Databázové a informační systémy doc. Ing. Miroslav Beneš, Ph.D. katedra informatiky FEI VŠB-TUO A-1007 / 597 324 213 http://www.cs.vsb.cz/benes Miroslav.Benes@vsb.cz Obsah Jak ukládat a efektivně zpracovávat

Více

27.11.2012 Bezpečnostní seminář BIG DATA, Policejní akademie ČR v Praze

27.11.2012 Bezpečnostní seminář BIG DATA, Policejní akademie ČR v Praze RNDr. Jakub Lokoč, Ph.D. Siret Research Group (www.siret.cz) Department of SW Engineering Faculty of Mathematics and Physics Charles University in Prague 1 2.1 billion Internet users worldwide http://royal.pingdom.com

Více

VYHLEDÁNÍ NEJDELŠÍHO SHODNÉHO PREFIXU V FPGA

VYHLEDÁNÍ NEJDELŠÍHO SHODNÉHO PREFIXU V FPGA VYHLEDÁNÍ NEJDELŠÍHO SHODNÉHO PREFIXU V FPGA Jiří Tobola Výpočetní technika a informatika, 2. ročník, prezenční studium Školitel: Vladimír Drábek Fakulta informačních technologií, Vysoké učení technické

Více

POKROČILÉ POUŽITÍ DATABÁZÍ

POKROČILÉ POUŽITÍ DATABÁZÍ POKROČILÉ POUŽITÍ DATABÁZÍ Barbora Tesařová Cíle kurzu Po ukončení tohoto kurzu budete schopni pochopit podstatu koncepce databází, navrhnout relační databázi s využitím pokročilých metod, navrhovat a

Více

Kybernetika a umělá inteligence, cvičení 10/11

Kybernetika a umělá inteligence, cvičení 10/11 Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu

Více

0.1 Úvod do lineární algebry

0.1 Úvod do lineární algebry Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde

Více

SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY

SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY ROBUST 2004 c JČMF 2004 SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY Dušan Húsek, Hana Řezanková, Václav Snášel Klíčová slova: Výpočetní statistika, shlukování, rozsáhlé datové soubory, dokumentografické informační

Více

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: 3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...

Více

Aplikace obrazové fúze pro hledání vad

Aplikace obrazové fúze pro hledání vad Marek Vajgl, Irina Perfilieva, Petr Hurtík, Petra Hoďáková Národní superpočítačové centrum IT4Innovations Divize Ostravské univerzity Ústav pro výzkum a aplikaci fuzzy modelování Ostrava, Česká republika

Více

Převedení okrajové úlohy na sled

Převedení okrajové úlohy na sled Převedení okrajové úlohy na sled úloh počátečních 1 Jiří Taufer Abstrakt Tento příspěvek je věnován řešení okrajových problémů pro soustavu okrajových obyčejných diferenciálních lineárních rovnic metodami,

Více

MODEL VÁRKOVÉ LINKY NA VÝROBU CHLORIDU ŽELEZNATÉHO PRO FARMACEUTICKÉ ÚČELY. Vladimír Hanta

MODEL VÁRKOVÉ LINKY NA VÝROBU CHLORIDU ŽELEZNATÉHO PRO FARMACEUTICKÉ ÚČELY. Vladimír Hanta MODEL VÁRKOVÉ LINKY NA VÝROBU CHLORIDU ŽELEZNATÉHO PRO FARMACEUTICKÉ ÚČELY Vladimír Hanta Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Klíčová slova: modelování a simulace,

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

Arnoldiho a Lanczosova metoda

Arnoldiho a Lanczosova metoda Arnoldiho a Lanczosova metoda 1 Částečný problém vlastních čísel Ne vždy je potřeba (a někdy to není ani technicky možné) nalézt celé spektrum dané matice (velké řídké matice). Úloze, ve které chceme aproximovat

Více

Marta Vomlelová marta@ktiml.mff.cuni.cz

Marta Vomlelová marta@ktiml.mff.cuni.cz Strojové učení Úvod, lineární regrese Marta Vomlelová marta@ktiml.mff.cuni.cz References [1] P. Berka. Dobývání znalostí z databází. Academia, 2003. [2] T. Hastie, R. Tishirani, and J. Friedman. The Elements

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Vlastní čísla a vlastní vektory

Vlastní čísla a vlastní vektory 5 Vlastní čísla a vlastní vektor Poznámka: Je-li A : V V lineární zobrazení z prostoru V do prostoru V někd se takové zobrazení nazývá lineárním operátorem, pak je přirozeným požadavkem najít takovou bázi

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 12. září 2016 Jiří Dvorský (VŠB TUO) Vyhledávání 201 / 344 Osnova přednášky

Více

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal

Více

Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava

Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava Osobní údaje Uchazeč: Radim Bača Datum a místo narození: 9.9.1980 Adresa trvalého bydliště: Karla

Více

Unstructured data pre-processing using Snowball language

Unstructured data pre-processing using Snowball language Unstructured data pre-processing using Snowball language Předzpracování nestrukturovaných dat pomocí jazyka Snowball Bc. Pavel Řezníček, doc. Ing. František Dařena, PhD., Ústav informatiky, Provozně ekonomická

Více

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci

Více

Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU

Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU Lidová moudrost pohádek praví, že když chtěl princ požádat o ruku krásnou princeznu, neposlal jí zdvořilou žádost, ale svůj obraz. Na něm princezna

Více

Formální konceptuální analýza

Formální konceptuální analýza moderní metoda analýzy dat 14. října 2011 Osnova Informatika 1 Informatika 2 3 4 Co je to informatika? Co je to informatika? Computer science is no more about computers than astronomy is about telescopes.

Více

Klasická a robustní ortogonální regrese mezi složkami kompozice

Klasická a robustní ortogonální regrese mezi složkami kompozice Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x

Více

odlehlých hodnot pomocí algoritmu k-means

odlehlých hodnot pomocí algoritmu k-means Chybějící a odlehlé hodnoty; odstranění odlehlých hodnot pomocí algoritmu k-means Návod ke druhému cvičení Matěj Holec, holecmat@fel.cvut.cz ZS 2011/2012 Úvod Cílem cvičení je připomenout důležitost předzpracování

Více

Metody analýzy dat I. Míry a metriky - pokračování

Metody analýzy dat I. Míry a metriky - pokračování Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:

Více

Státnice odborné č. 20

Státnice odborné č. 20 Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází 1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,

Více

AVDAT Mnohorozměrné metody metody redukce dimenze

AVDAT Mnohorozměrné metody metody redukce dimenze AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak

Více

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Transformace obrazu Josef Pelikán KSVI MFF UK Praha Transformace obrazu 99725 Josef Pelikán KSVI MFF UK Praha email: Josef.Pelikan@mff.cuni.cz WWW: http://cgg.ms.mff.cuni.cz/~pepca/ Transformace 2D obrazu dekorelace dat potlačení závislosti jednotlivých

Více

Hierarchický model. 1995-2013 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ 1 / 16

Hierarchický model. 1995-2013 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ 1 / 16 Hierarchický model 1995-2013 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ 1 / 16 Hierarchie v 3D modelování kompozice zdola-nahoru složitější objekty se sestavují

Více

Cvičná bakalářská zkouška, 1. varianta

Cvičná bakalářská zkouška, 1. varianta jméno: studijní obor: PřF BIMAT počet listů(včetně tohoto): 1 2 3 4 5 celkem Cvičná bakalářská zkouška, 1. varianta 1. Matematická analýza Najdětelokálníextrémyfunkce f(x,y)=e 4(x y) x2 y 2. 2. Lineární

Více

Využití RPS pro potlačování šumu v řečových signálech

Využití RPS pro potlačování šumu v řečových signálech Využití RPS pro potlačování šumu v řečových signálech Ing. Radek Zezula, Ph.D., Ing. Ivan Koula, Prof. Ing. Zdeněk Smékal, CSc. Ústav telekomunikací Vysoké učení technické v Brně Fakulta elektrotechniky

Více