Využití LSI a M-stromu při indexování a vyhledávání obrázků
|
|
- Marie Mašková
- před 9 lety
- Počet zobrazení:
Transkript
1 Využití LSI a M-stromu při indexování a vyhledávání obrázků Tomáš Skopal 1, Michal Kolovrat 2 a Václav Snášel 2 1 Katedra softwarového inženýrství, MFF UK Praha, Malostranské nám. 25, , Praha 2 Katedra informatiky, FEI, VŠB Technická Univerzita Ostrava, 17. listopadu 15, , Ostrava-Poruba tomas@skopal.net, {michal.kolovrat,vaclav.snasel}@vsb.cz Abstrakt. Při práci s multimediálními dokumenty musíme často řešit problém, jak v nich efektivně a rychle vyhledávat. Multimediální dokumenty většinou reprezentujeme vektory ve vysokodimenzionálním prostoru, neboť v takto modelované kolekci dokumentů lze jednodušeji definovat sémantiku i mechanismus samotného vyhledávání. V tomto příspěvku prezentujeme vytváření vektorů obrázků (extrakci vlastností z obrázků) v modelu LSI (resp. pomocí singulárního rozkladu). Současně ukážeme vliv takové extrakce na efektivitu indexování/vyhledávání pomocí datové struktury M-strom. Vzhledem k aplikaci modelu LSI na obrázky poukážeme rovněž na některé zajímavé souvislosti, které při klasickém použití LSI na textových kolekcích nejsou přímo patrné. Klíčová slova: LSI, podobnostní vyhledávání obrázků, M-strom 1 Úvod V současné době, s nárůstem informačních technologií, vzniká obrovské množství multimediálních dat mezi tato data patří zejména textové, obrazové a zvukové dokumenty. Multimediální data je potřeba nějakým způsobem vhodně reprezentovat a organizovat, aby v nich následně šlo jednoduše a rychle vyhledávat [6]. Jednotlivé multimediální dokumenty většinou reprezentujeme vektory ve vysokodimenzionálním prostoru, neboť v takto modelované kolekci dokumentů lze jednodušeji definovat sémantiku i mechanismus samotného vyhledávání podle obsahu (content-based search). V současnosti se stále ve velké míře používá sekvenční způsob vyhledávání, kdy je celá kolekce dokumentů (resp. její reprezentace, tj. kolekce vektorů) postupně sekvenčně načtena a hledané dokumenty jsou nacházeny pomocí vzájemného porovnáváním všech dokumentů v kolekci s dotazovým dokumentem (pomocí nějaké funkce podobnosti, definované pro dva vektory dokumentů). Tento způsob vyhledávání však již v současné době není možný, neboť kolekce dokumentů jsou velmi rozsáhlé a sekvenční průchod takovou kolekcí by trval neúnosně dlouho. Proto byly navrženy přístupy a metody, které nejdříve
2 kolekci předzpracují do předem navržené struktury indexu. Cílem indexování je tedy umožnit rychlé vyhodnocení uživatelského dotazu pomocí indexu. Na Obr. 1 uvádíme vzorek z experimentální kolekce 730 obrázků budov (posléze transformovaných do velikosti pixelů v 256 odstínech šedi). Obr. 1. Vzorek z kolekce obrázků budov. 2 Extrakce vektorů vlastností pomocí LSI Metod pro extrakci vlastností z obrázků (a tím vytvoření jejich vektorové reprezentace) existuje celá řada. Nejčastěji jsou používány různé histogramy barev [3], textur [17], apod. Pro doménově specifické kolekce (např. otisky prstů, oční duhovky, obličeje) pak existuje mnoho speciálních přístupů. Pro přehled současných metod extrakce vlastností z obrázků odkazujeme na [13]. V našem příspěvku jsme použili jiný přístup [11, 12], kdy je celý obrázek velikosti x y (resp. jasy/stupně šedi všech jeho pixelů) předeven na vektor dimenze x y. Transformace obrázku do vektoru je provedena zcela triviálně, a to naskládáním řádků obrázku za sebe, čímž vznikne vysokodimenzionální jasový vektor obrázku. V této fázi reprezentace obrázku ještě nejde o extrakci vlastností, podle kterých by se dalo posléze smysluplně vyhledávat, obrázek (resp. jeho jasová verze) lze bezezbytku zrekonstruovat z jasového vektoru. Nicméně díky tomu, že obrázky jsou reprezentovány jasovými vektory, můžeme celou kolekci obrázků (o velikosti n) reprezentovat maticí A řádu x y n, kde jednotlivé vektory obrázků tvoří sloupce matice (viz Obr. 2, x = 80, y = 60, n = 730, tj. matice A je řádu ).
3 A = Obr. 2. Transformace obrázku do vektoru jasů a jeho umístění v matici A. 2.1 Klasické LSI jako rozšíření vektorového modelu DIS V oblasti Dokumentografických informačních systémů (Information Retrieval) [1, 10] se s modelem LSI (latent semantics indexing) setkáváme v kontextu reprezentace a indexování textových dokumentů ve vektorovém modelu [7, 2]. Textová kolekce obsahuje dohromady m unikátních termů, přičemž m-rozměrné vektory dokumentů (sloupce matice A) reprezentují frekvence/váhy jednotlivých termů v textových dokumentech. Pomocí singulárního rozkladu (SVD) matice A: A = UΣV T se v textové kolekci naleznou tzv. vektory konceptů (levé singulární vektory sloupce v U), které lze interpretovat jako jednotlivá témata přítomná v kolekci. Vektory konceptů tvoří bázi v původním vysokodimenzionálním prostoru a jsou to v zásadě lineární kombinace termů (termy jsou nezávislé). Důležitou vlastností singulárního rozkladu je fakt, že vektory konceptů jsou uspořádány podle důležitosti (důležitost vyjadřují hodnoty singulárních čísel σ i, uložené sestupně v diagonální matici Σ) podle toho, v jaké míře a v kolika dokumentech se (ne)vyskytují. Tím je určeno, které koncepty jsou vzhledem ke kolekci sémanticky důležité (odtud indexování latentní (skryté) sémantiky), a které nedůležité, ty působí jako statistický šum. Sloupce matice ΣV T obsahují vektory dokumentů (tzv. vektory pseudo-dokumentů), které jsou ale nyní vyjádřené v bázi U, tj. v bázi konceptů. Jeden vektor pseudo-dokumentu odpovídá nějaké lineární kombinaci všech nalezených vektorů konceptů, tj. příslušný dokument v nějaké míře (třeba i nulové nebo záporné) obsahuje každý z konceptů.
4 Vzhledem k tomu, že pouze prvních k konceptů lze považovat za sémanticky důležité (příslušná singulární čísla jsou vysoká), můžeme původní rozklad aproximovat jako A U k Σ k V T k kde v U k je prvních k nejdůležitějších vektorů konceptů, v Σ k jsou příslušná singulární čísla a ve Σ k Vk T vektory pseudo-dokumentů vyjádřené pouze pomocí prvních k vektorů konceptů (viz Obr. 3). Jinými slovy, SVD promítá původní m- rozměrné vektory dokumentů do prostoru dimenze k (k m). Aproximace SVD rozkladu (rank-k SVD) matice A lze dosáhnout tak, že buď provedeme úplný SVD rozklad a posléze příslušné matice ořežeme, anebo zvolíme některou z časově méně náročných numerických metod, která počítá přímo redukovaný rozklad (např. Lanczos, Arnoldi). Pokud chceme v kolekci dokumentů vyhledávat, Obr. 3. Aproximace SVD rozkladu (rank-k SVD). porovnáváme vektory pseudo-dokumentů s vektorem pseudo-dotazu na základě nějaké míry podobnosti (v klasickém vektorovém modelu DIS i v modelu LSI pro textové kolekce je to např. kosinová míra). Abychom mohli porovnávat vektory pseudo-dokumentů, potřebujeme z klasického vektoru dotazu q (reprezentovaného stejným způsobem jako jsou vektory dokumentů v A) zkonstruovat jeho projekci do U k, tj. U T k q 2.2 LSI pro kolekce obrázků Vzhledem k tomu, že SVD rozklad můžeme aplikovat na libovolnou matici, je model LSI aplikovatelný na libovolné typy dat. Interpretace matice A jako matice termů v dokumentech je pouze předmětem aplikace, tj. aplikace LSI jako rozšíření klasického vektorového modelu DIS. Obecně tedy můžeme model LSI adaptovat pro indexování libovolné multimediální kolekce, kterou lze reprezentovat sadou vektorů shodné dimenze. Přitom nezáleží na konkrétním způsobu extrakce vlastností z dokumentů, jedinou podmínkou je sestavení matice A tak, aby vektory vlastností dokumentů tvořily sloupce. V našem případě nic nebrání sestavit matici A z jasových vektorů obrázků, jak bylo popsáno na začátku této kapitoly. Pomocí SVD matici A rozložíme stejně jako při klasickém použití LSI, tj. získáme aproximaci rozkladu A U k Σ k V T k.
5 Obr. 4. Bázové obrázky (vizualizace konceptů, resp. singulárních vektorů) s příslušným pořadím singulárních čísel σ i. Zajímavá je interpretace a zejména vizualizace vektorů konceptů (báze U), které přestavují jakési bázové obrázky, ze kterých je každý obrázek v kolekci složen (viz Obr. 4). Jinými slovy, vhodnou kombinací bázových obrázků dostaneme libovolný obrázek z kolekce (čím vyšší k, tím přesnější rekonstrukce obrázku). Je zde jistá spojitost s diskrétní kosinovou transformací (DCT), využívanou při kompresi JPEG, kde je používáno např. 64 bázových obrázků pro obrazové segmenty velikosti 8 8, ovšem těchto 64 bázových obrázků je konstantních (jedná se o kombinace diskrétních kosinových funkcí s různou frekvencí) a dají se vygenerovat nezávisle na kolekci. Na Obr. 4 vidíme několik nejdůležitějších bázových obrázků ty můžeme interpretovat následovně. První bázový obrázek tvoří průměr jasu v celé kolekci (průměrný jas budovy), další báze reprezentují hrubé tvary (obrysy budov, rozhraní budov a pozadí) a báze s nejnižšími singulárními čísly σ i (resp. s vyšším pořadím i) postupně popisují čím dál méně frekventované detaily v různých obrázcích (např. konkrétní tvary oken a dveří na budovách). Rekonstrukce obrázků. Abychom získali vizuální představu o tom, jak velké (resp. malé) k je ještě dostačující pro popis obsahu obrázku, můžeme obrázky zpětně rekonstruovat tak, že pro dané k provedeme rozklad a matici A rekonstruujeme jako A U k Σ k Vk T. Na Obr. 5a vidíme původní obrázky, resp. obrázky, které byly rekonstruované plným rozkladem A = UΣV T (kde k je rovno hodnosti matice U T ). Naopak, pro velmi malá k je rekonstrukce velmi nedokonalá, viz Obr. 5b, kde k = 15. Přesto lze i z takto hrubě reprezentovaných obrázků rozeznat tvary původních budov. Uvědomme si, že rekonstruovaný obrázek je kombinací pouze 15 bázových ob-
6 Obr. 5. (a) Původní obrázky. Rekonstrukce obrázků z aproximace A U k Σ k Vk T (b) k = 15, (c) k = 50, (d) k = 250. pro rázků, tj. namísto 4800 hodnot jasu pixelů je potřeba pouze 15 vah konceptů! V případě k = 50 (viz Obr. 5c) je rekonstrukce dokonalejší, lze rozeznat přítomnost některých hrubých detailů, např. oken. Pro k = 250 je již rekonstrukce na takové úrovni, že původní budovy lze jednoznačně rozpoznat (viz Obr. 5d). Z uvedeného příkladu lze usoudit, že pokud budeme chtít vyhledávat v kolekci obrázků podle hrubých obrysů, bude výhodnější použít pouze několik málo souřadnic vektorů pseudo-obrázků, naopak v případě, že budeme vyhledávat objekty také podle detailů, zvolíme větší počet souřadnic, tj. vyšší k. Poznámka: Z příkladu lze rovněž usoudit, že celá metoda by mohla být využita pro kompresi celých kolekcí obrázků výhodou oproti kompresi JPEG, resp. použití DCT, jsou bázové obrázky šité na míru dané kolekci (ne pouhé kombinace kosinů), což by se mělo projevit menším počtem bázových obrázků potřebných pro dostatečně kvalitní rekonstrukci. Nevýhodou je fakt, že spolu s vektory pseudo-obrázků potřebujeme uchovávat i bázové obrázky kolekce. 2.3 Funkce podobnosti pro porovnávání obrázků Po provedení SVD rozkladu obdržíme kolekci vektorů pseudo-obrázků, které je potřeba nějak porovnávat s vektorem pseudo-dotazu (vzniklým transformací dotazového obrázku). Obecně se v oblasti vyhledávání v obrazových kolekcích používá mnoho nejrůznějších podobnostních měr, některé z nich nemají ani analytické vyjádření (např. ohodnocení natrénovanou neuronovou sítí). V případě reprezentace obrázků histogramy barev/jasů se pro jejich porovnávání často používá kvadratická forma [8, 14], ve které je možné příbuznost
7 barev zachytit korelačními váhami mezi jednotlivými barvami (obecně souřadnicemi vektoru). Kvadratická forma je vlastně zobecněním Euklidovské vzdálenosti (kde neexistují korelace mezi souřadnicemi, všechny dimenze jsou považovány za nezávislé). Jelikož v případě modelování obrázku vektorem pseudo-obrázku jsou souřadnice nekorelované (souřadnice obsahují váhy vektorů konceptů, které tvoří bázi a tudíž jsou lineárně nezávislé), postačí, když použijeme pro porovnání vektorů obyčejnou Euklidovskou vzdálenost, nebo jinou Minkowského metriku (L p metriku). Podobnost modelovaná vzdáleností je interpretována tak, že čím vzdálenější jsou oba vektory, tím méně podobné jsou si obrázky. Nulovou vzdálenost mají identické obrázky (resp. jejich vektory). Výhoda Euklidovské vzdálenosti spočívá také v tom, že je to metrika, a proto lze celou kolekci obrázků (jejich vektorovou reprezentaci) indexovat pomocí metrických přístupových metod (metric access methods [4]), což posléze umožňuje v kolekci rychle vyhledávat. Rychlost vyhledávání je dána dvěma typy nákladů spořebovaných během vyhodnocování dotazu. Je to jednak počet diskových přístupů a jednak počet aplikací dané metriky (množství výpočtů vzdáleností). 3 M-strom Jednou z metrických přístupových metod je M-strom [5, 9, 16], umožňující indexovat kolekci dokumentů modelovaných objekty metrického prostoru M = (U, d), kde U je univerzum objektů (např. vektorů dokumentů) a d je metrika. Podobně jako mnoha struktur v jiných oblastech indexování, i struktura M-stromu je založena na myšlence B + -stromu, tj. je vyvážená, dynamická a stránkovaná (umožňující efektivní perzistenci). Konkrétní index M-stromu představuje hierarchii metrických regionů (každý uzel představuje jeden region), respektive hierarchii shluků objektů v těchto regionech. 3.1 Struktura Listy M-stromu obsahují záznamy grnd(o i ) (ground entries) samotných indexovaných objektů O i, zatímco vnitřní uzly obsahují tzv. směrovací záznamy rout(o j ) (routing entries). Směrovací záznamy popisují tzv. metrické regiony, které vymezují v metrickém prostoru oblast, v níž se nacházejí objekty uložené v listech příslušného podstromu. Metrický region je popsán hyper-koulí se středem v nějakém objektu a příslušným pokrývajícím poloměrem (covering radius). Příklad hierarchie metrických regionů (pro Euklidovskou vzdálenost a 2D prostor) a příslušného M-stromu je uveden na Obr Vyhodnocování dotazů na podobnost Indexování objektů v M-stromu je realizováno pouze pomocí dané metriky d. Díky tomu je snadné implementovat dva základní typy dotazů na podobnost. Je to jednak rozsahový dotaz, který slouží k nalezení takových objektů, pro které
8 Obr. 6. Hierarchie regionů v metrickém prostoru a příslušný M-strom. je vzdálenost od objektu dotazu menší než daná prahová hodnota a dále dotaz na h nejbližších sousedů 1 (h-nn dotaz), kterým získáme prvních h nejméně vzdálených objektů od objektu dotazu. Vyšší efektivita (rychlost) vyhledávání v M-stromu (vůči např. prostému sekvenčnímu průchodu množiny objektů) spočívá v postupném odfiltrování těch větví M-stromu, které obsahují (vzhledem k dotazu) irelevantní objekty. Korektnost filtrování zaručuje zejména axiom trojúhelníkové nerovnosti metriky, což je klíčová vlastnost využívaná všemi metrickými přístupovými metodami. 3.3 Použití M-stromu pro indexování obrázků Do M-stromu lze zaindexovat libovolnou kolekci reprezentovanou objekty v metrickém prostoru, můžeme jej tedy použít k indexování vektorů pseudo-obrázků podle vzdálenosti zvolili jsme Euklidovskou vzdálenost. Podobnostní vyhledávání v kolekci obrázků provádíme pomocí rozsahových dotazů nebo dotazů na h nejbližších sousedů. 4 Experimenty S výchozí kolekcí 730 obrázků budov jsme provedli dva druhy experimentů. Z hlediska přesnosti a úplnosti (precision and recall) jsme zkoumali úspěšnost samotné metody extrakce vlastností z obrázků pomocí LSI, z hlediska efektivity jsme pak testovali náklady na vyhodnocení dotazu pomocí M-stromu. 4.1 Kvalita vyhledávání Vzhledem k tomu, že kolekce byla složena ze skupin po pěti obrázcích zobrazujících stejnou budovu z různých pohledů (viz Obr. 7), rozhodli jsme se pro úlohu 1 Obvykle se uvádí parametr k, tj. dotaz na k nejbl. sousedů (k-nn dotaz). Parametr k jsme již zavedli u SVD, proto u dotazů budeme používat h, aby nedošlo k záměně.
9 identifikace budovy (jedna z nejtěžších úloh vyhledávání podle podobnosti). Zaindexovaná byla samozřejmě celá kolekce 730 obrázků, členění na skupiny uvnitř kolekce bylo pouze logické. Obr. 7. Skupina obrázků téže budovy z různých pohledů. Testování probíhalo tak, že jsme náhodně vybrali 50 skupin obrázků, přičemž z každé skupiny jsme dále náhodně vybrali jeden obrázek, položili 4-NN dotaz k tomuto obrázku a očekávávali, zda ve výsledku dotazu obdržíme zbývající 4 obrázky z dané skupiny. Pokud byly nalezeny všechny 4 obrázky, byla přesnost odpovědi 100%, pro 3 správně nalezené obrázky byla přesnost 75%, atd. Ačkoliv pořadí obrázků v odpovědi určuje míru podobnosti k dotazovému obrázku, pro stanovení přesnosti nám na pořadí nezáleželo vzhledem k malému počtu obrázků v odpovědi. Úplnost odpovědi v tomto případě odpovídala přesnosti, neboť velikost odpovědi se rovnala počtu relevantních obrázků v kolekci, tj. 4. Obr. 8. Odpověd na první dotaz. Na Obr. 8 vidíme příklad dotazu a odpovědí pro různá k (tj. pro popis obrázků pomocí k bázových obrázků). Přesnost odpovědí byla 50%, pro k = 50 a k = 250 navíc hledaná budova obsadila první dvě místa v odpovědi. Na Obr. 9 vidíme 4-NN dotaz pro jiný obrázek. Přesnost odpovědí byla pro k = 15 opět 50%, pro k = 50 a k = 250 pouze 25%. Tento výsledek je zdánlivě v rozporu s faktem, že pro vyšší k získáme přesnější rekonstrukci obrázků, a tedy
10 by měla být i vyšší přesnost vyhledávání. Taková představa je ale mylná, protože, jak jsme podotkli v kap. 2.2, důležitější (frekventované) koncepty reprezentují hrubé tvary, kdežto méně důležité (tj. méně frekventované) koncepty popisují různé detaily. V uvedeném příkladu zřejmě došlo k situaci, kdy dotazování na příliš velké detaily dotazového obrázku použitím vyššího k způsobilo vyhledání irelevantních obrázků, které měly (ačkoliv to není přímo vizuálně patrné v samotných obrázcích) vyšší zastoupení detailů přítomných v obrázku dotazu. Naopak, relevantní obrázek (při vyhledání zařazený až na 4. místo) měl díky jinému pohledu na budovu poněkud odlišné detaily. Obr. 9. Odpověď na druhý dotaz. Zhodnocení. Pro 50 4-NN dotazů bylo dosaženo průměrné přesnosti 43% (tj. v každé odpovědi byly v průměru 1 2 správné obrázky), přičemž jako nejvýhodnější se ukázalo použití k = 15. Vzhledem k tomu, že jednotlivé obrázky v rámci skupin představovaly budovu z různých pohledů, často i velmi odlišných, lze považovat přesnost 43% jako velmi dobrou. Z toho lze také usoudit, že uvedená metoda LSI pro obrázky je poměrně odolná vůči prostorovým transformacím. Pokud bychom ještě zmírnili identifikační požadavek tak, že stačí, aby se ve 4 vyhledaných obrázcích vyskytoval alespoň jeden správný, dosáhli bychom identifikace téměř každé budovy. 4.2 Rychlost vyhledávání V druhé skupině experimentů jsme testovali náklady na vyhledávání obrázků pomocí indexů M-stromu. Pro parametry k = 15, k = 50, k = 250, tj. pro každou sadu k-rozměrných vektorů, byl sestaven jeden index. Konstrukce probíhala metodou MinMax + MultiWay, detaily viz [16, 15]. Výsledky efektivity dotazování jsou uvedeny v Tabulce 1. Kapacita uzlů M-stromu byla stanovena na 10
11 objektů, přičemž průměrná naplněnost uzlů (v tabulce označeno jako UTIL) dosahovala cca 70%. Při dotazování jsme sledovali počet diskových přístupů k uzlům (v tabulce označeno jako I/O) a počet aplikací metriky (v tabulce označeno COMP). Náklady jsou vyjádřeny procentuelně jako (a) podíl přístupů/aplikací vzhledem k velikosti indexu M-stromu, resp. počtu záznamů v indexu M-stromu (b) podíl přístupů/aplikací vzhledem k velikosti sekvenčního souboru, resp. počtu obrázků. Sledovány byly průměrné, maximální a minimální hodnoty nákladů (bylo provedeno 50 4-NN dotazů). Tabulka 1. Efektivita vyhledávání v M-stromu. Parametr UTIL 4-NN dotazy k % I/O COMP I/O COMP % M-stromu % M-stromu % sekv. % sekv. Avg Min Max Avg Min Max Avg Min Max Avg Min Max k = k = k = Zhodnocení. Z tabulky můžeme usoudit, že nejlepších výsledků bylo dosaženo pro k = 15, kdy bylo potřeba načíst polovinu indexu M-stromu, tj. ekvivalent 93% sekvenčního souboru. Počet aplikací metriky byl nižší, v přepočtu 48% aplikací nutných pro sekvenční vyhodnocení. Uvedené výsledky nejsou zcela přesvědčivé z hlediska výhodnosti M-stromu oproti sekvenčnímu zpracování dotazu, nicméně je třeba podotknout, že experimenty byly prováděny na velmi malé kolekci (pouze 730 obrázků). V budoucnu bychom chtěli metodu vyzkoušet na kolekcích o deseti- až statisících obrázků, kde by se měl potenciál M-stromu projevit v podstatně větší míře. 5 Závěr V tomto příspěvku jsme popsali specifika použití modelu LSI pro reprezentaci obrázků spolu s využitím M-stromu jako indexovací struktury pro efektivní vyhledávání. Díky aplikaci LSI na obrázky jsme také vizualizovali některé aspekty LSI, které nejsou při klasickém použití ve vektorovém modelu DIS přímo patrné. Tento výzkum je částečně podporován grantem GAČR 201/05/P036. Reference 1. R. A. Baeza-Yates and B. Ribeiro-Neto. Modern Information Retrieval. Addison- Wesley Longman Publishing Co., Inc., M. W. Berry and M. Browne. Understanding search engines: mathematical modeling and text retrieval. Society for Industrial and Applied Mathematics, 1999.
12 3. C. Carson, M. Thomas, S. Belongie, J. M. Hellerstein, and J. Malik. Blobworld: A system for region-based image indexing and retrieval. In Third International Conference on Visual Information Systems. Springer, E. Chávez, G. Navarro, R. Baeza-Yates, and J. L. Marroquín. Searching in metric spaces. ACM Compututing Surveys, 33(3): , P. Ciaccia, M. Patella, and P. Zezula. M-tree: An Efficient Access Method for Similarity Search in Metric Spaces. In Proceedings of the 23rd Athens Intern. Conf. on VLDB, pages Morgan Kaufmann, S. Deb. Multimedia Systems and Content-Based Image Retrieval. Information Science Publishing, S. C. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, and R. A. Harshman. Indexing by latent semantic analysis. Journal of the American Society of Information Science, 41(6): , C. Faloutsos, R. Barber, M. Flickner, J. Hafner, W. Niblack, D. Petkovic, and W. Equitz. Efficient and effective querying by image content. Journal of Intelligent Information Systems (JIIS), 3(3/4): , M. Patella. Similarity Search in Multimedia Databases. PhD thesis, Dipartmento di Elettronica Informatica e Sistemistica, Bologna, J. Pokorný, V. Snášel, and D. Húsek. Dokumentografické informační systémy. Karolinum, Praha, P. Praks, J. Dvorský, and V. Snášel. Latent Semantic Indexing for Image Retrieval Systems. In SIAM Conference on Applied Linear Algebra (LA03), The College of William and Mary, Williamsburg, USA, P. Praks, L. Machala, and V. Snášel. Iris Recognition Using the SVD-Free Latent Semantic Indexing. In Workshop on Multimedia Data Mining (MDM/KDD 2004), Seattle, WA, USA, Y. Rui, T. S. Huang, and S.-F. Chang. Image retrieval: current techniques, promising directions and open issues. Journal of Visual Communication and Image Representation, 10(4):39 62, T. Seidl and H.-P. Kriegel. Efficient user-adaptable similarity search in large multimedia databases. In Proceedings of the 23rd International Conference on Very Large Data Bases (VLDB), pages , T. Skopal. Metric Indexing in Information Retrieval. PhD thesis, Technical University of Ostrava, T. Skopal, J. Pokorný, M. Krátký, and V. Snášel. Revisiting M-tree Building Principles. In Proceedings of the 7th East-European conference on Advances in Databases and Informations Systems (ADBIS), LNCS 2798, Springer-Verlag, Dresden, Germany, pages , H. Tamura, S. Mori, and T. Yamawaki. Textual features corresponding to visual perception. IEEE Transactions on Systems, Man, and Cybernetics, 8(6), Annotation: An Application of LSI and M-tree in Image Retrieval In this paper we present a method of LSI-based image feature extraction and, simultaneously, we demonstrate how such an extraction can be used for image retrieval using the M-tree. Moreover, we show several interesting properties, which are not directly visible when using the LSI on text collections.
Geometrické indexování a dotazování multimediálních dat
Geometrické indexování a dotazování multimediálních dat Tomáš Skopal, Michal Krátký, Václav Snášel Katedra informatiky, VŠB-Technická Univerzita Ostrava 17. listopadu 15, 708 33 Ostrava-Poruba {michal.kratky,
Metrické indexování vektorových modelů v oblasti information retrieval
Metrické indexování vektorových modelů v oblasti information retrieval Tomáš Skopal Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba Tomas.Skopal@vsb.cz
Efektivní vyhledávání v kolekcích obrázků tváří
Efektivní vyhledávání v kolekcích obrázků tváří Michal KRÁTKÝ, Tomáš SKOPAL, Václav SNÁŠEL Katedra informatiky, VŠB-Technická univerzita Ostrava 17. listopadu 15, 708 33 Ostrava {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
Využití SVD pro indexování latentní sémantiky
Využití SVD pro indexování latentní sémantiky Michal Krátký 1 Department of Computer Science, VŠB-Technical University of Ostrava, Czech Republic michal.kratky@vsb.cz Abstrakt Zpracováváním velkého množství
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky
Modely a sémantika Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky Úvod Existující problémy Prudký nárůst množství informací na webu Kognitivní přetížení Ztráta v informačním prostoru
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2
Výpočet transformačních koeficinetů vybraných 2D transformací Jan Ježek červen 2008 Obsah Odvození transformačního klíče vybraných 2D transformací 2 Meto vyrovnání 2 2 Obecné vyjádření lineárních 2D transformací
Prohledávání dokumentů ve vektorovém modelu
Prohledávání dokumentů ve vektorovém modelu Pavel Moravec 1 Katedra informatiky, FEI, VŠB - Technická Univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba pavel.moravec@vsb.cz Abstrakt. Information
Vizualizace v Information Retrieval
Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby
AMPHORA - NÁSTROJ PRO INDEXOVÁNÍ WEBOVÝCH STRÁNEK.
AMPHORA - NÁSTROJ PRO INDEXOVÁNÍ WEBOVÝCH STRÁNEK. Václav Snášel, Jiří Dvorský, Petr Šaloun, Daniela Ďuráková VŠB Technická univerzita, 17. listopadu 15, 708 33 Ostrava Abstract Textová databáze AmphorA
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Dobývání znalostí z textů text mining
Dobývání znalostí z textů text mining Text mining - data mining na nestrukturovaných textových dokumentech 2 možné přístupy: Předzpracování dat + běžné algoritmy pro data mining Speciální algoritmy pro
Datové struktury. Zuzana Majdišová
Datové struktury Zuzana Majdišová 19.5.2015 Datové struktury Numerické datové struktury Efektivní reprezentace velkých řídkých matic Lze využít při výpočtu na GPU Dělení prostoru a binární masky Voxelová
SVD rozklad a pseudoinverse
SVD rozklad a pseudoinverse Odpřednesenou látku naleznete v kapitole 12 skript Abstraktní a konkrétní lineární algebra. Jiří Velebil: Lineární algebra 19.12.2016: SVD rozklad a pseudoinverse 1/21 Cíle
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
Matice přechodu. Pozorování 2. Základní úkol: Určete matici přechodu od báze M k bázi N. Každou bázi napíšeme do sloupců matice, např.
Matice přechodu Základní úkol: Určete matici přechodu od báze M k bázi N. Každou bázi napíšeme do sloupců matice, např. u příkladu 7 (v ) dostaneme: Nyní bychom mohli postupovat jako u matice homomorfismu
Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda
Předmět: MA 4 Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda Četba: Text o lineární algebře v Příručce přežití na webových
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Jaroslav Tuma. 8. února 2010
Semestrální práce z předmětu KMA/MM Odstraňování šumu z obrazu Jaroslav Tuma 8. února 2010 1 1 Zpracování obrazu Zpracování obrazu je disciplína zabývající se zpracováním obrazových dat různého původu.
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
27.11.2012 Bezpečnostní seminář BIG DATA, Policejní akademie ČR v Praze
RNDr. Jakub Lokoč, Ph.D. Siret Research Group (www.siret.cz) Department of SW Engineering Faculty of Mathematics and Physics Charles University in Prague 1 2.1 billion Internet users worldwide http://royal.pingdom.com
Charakterizují kvantitativně vlastnosti předmětů a jevů.
Měřicí aparatura 1 / 34 Fyzikální veličiny Charakterizují kvantitativně vlastnosti předmětů a jevů. Můžeme je dělit: Podle rozměrů: Bezrozměrné (index lomu, poměry) S rozměrem fyzikální veličiny velikost
Numerické metody a programování
Projekt: Inovace výuky optiky se zaměřením na získání experimentálních dovedností Registrační číslo: CZ.1.7/2.2./28.157 Numerické metody a programování Lekce 4 Tento projekt je spolufinancován Evropským
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY Jan Krejčí 31. srpna 2006 jkrejci@physics.ujep.cz http://physics.ujep.cz/~jkrejci Obsah 1 Přímé metody řešení soustav lineárních rovnic 3 1.1 Gaussova eliminace...............................
1 Základní funkce pro zpracování obrazových dat
1 Základní funkce pro zpracování obrazových dat 1.1 Teoretický rozbor 1.1.1 Úvod do zpracování obrazu v MATLABu MATLAB je primárně určen pro zpracování a analýzu numerických dat. Pro analýzu obrazových
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU
Image search: kde slova nestačí Petra Budíková, ÚVT a FI MU Lidová moudrost pohádek praví, že když chtěl princ požádat o ruku krásnou princeznu, neposlal jí zdvořilou žádost, ale svůj obraz. Na něm princezna
Název práce: DIAGNOSTIKA KONTAKTNĚ ZATÍŽENÝCH POVRCHŮ S VYUŽITÍM VYBRANÝCH POSTUPŮ ZPRACOVÁNÍ SIGNÁLU AKUSTICKÉ EMISE
Ing. 1 /12 Název práce: DIAGNOSTIKA KONTAKTNĚ ZATÍŽENÝCH POVRCHŮ S VYUŽITÍM VYBRANÝCH POSTUPŮ ZPRACOVÁNÍ SIGNÁLU AKUSTICKÉ EMISE Školitel: doc.ing. Pavel Mazal CSc Ing. 2 /12 Obsah Úvod do problematiky
stránkách přednášejícího.
Předmět: MA 4 Dnešní látka Iterační metoda Jacobiova iterační metoda Gaussova-Seidelova iterační metoda Superrelaxační metoda (metoda SOR) Metoda sdružených gradientů Četba: Text o lineární algebře v Příručce
2. Schurova věta. Petr Tichý. 3. října 2012
2. Schurova věta Petr Tichý 3. října 2012 1 Podobnostní transformace a výpočet vlastních čísel Obecný princip: Úloha: Řešíme-li matematickou úlohu, je často velmi vhodné hledat její ekvivalentní formulaci
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:
Vícerozměrný přístup pro netriviální vyhledávání termů
Vícerozměrný přístup pro netriviální vyhledávání termů Michal Krátký, Tomáš Skopal, Václav Snášel Katedra informatiky, FEI, VŠB Technická univerzita Ostrava, 17. listopadu 15, 708 33, Ostrava-Poruba {michal.kratky,tomas.skopal,vaclav.snasel}@vsb.cz
Tvar dat a nástroj přeskupování
StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
2. Určete jádro KerL zobrazení L, tj. nalezněte alespoň jednu jeho bázi a určete jeho dimenzi.
Řešené příklady z lineární algebry - část 3 Typové příklady s řešením Příklad 3.1: Zobrazení L: P 3 R 23 je zobrazení z prostoru P 3 všech polynomů do stupně 3 (včetně nulového polynomu) do prostoru R
1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
Modelování a simulace Lukáš Otte
Modelování a simulace 2013 Lukáš Otte Význam, účel a výhody MaS Simulační modely jsou nezbytné pro: oblast vědy a výzkumu (základní i aplikovaný výzkum) analýzy složitých dyn. systémů a tech. procesů oblast
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava
Návrh na zahájení habilitačního řízení Ing. Radima Bači, Ph.D. v oboru Informatika na FEI VŠB-TU Ostrava Osobní údaje Uchazeč: Radim Bača Datum a místo narození: 9.9.1980 Adresa trvalého bydliště: Karla
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Singulární rozklad aplikace v image deblurring
Singulární rozklad aplikace v image deblurring M. Plešinger, Z. Strakoš TUL, Fakulta mechatroniky, Liberec AV ČR, Ústav informatiky, Praha 1 Úvod Uvažujme obecnou reálnou matici Pak existuje rozklad A
Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava luk76/la1
Lineární algebra 5. přednáška: Báze a řešitelnost soustav Dalibor Lukáš Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava email: dalibor.lukas@vsb.cz http://homel.vsb.cz/ luk76/la1 Text
Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT
Dolování dat z multimediálních databází Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Obsah prezentace Co jsou multimediální databáze Možnosti dolování dat v multimediálních databázích Vyhledávání fotografií
Numerické metody a programování. Lekce 4
Numerické metody a programování Lekce 4 Linarní algebra soustava lineárních algebraických rovnic a 11 a 12 x 2 a 1, N x N = b 1 a 21 a 22 x 2 a 2, N x N = b 2 a M,1 a M,2 x 2 a M,N x N = b M zkráceně A
Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s
Kapitola 13 Kvadratické formy Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru f(x 1,..., x n ) = a ij x i x j, kde koeficienty a ij T. j=i Kvadratická forma v n proměnných
Lokační referenční metody a jejich interpretace ve standardech
Lokační referenční metody a jejich interpretace ve standardech Jiří Plíhal Tento příspěvek by rád na konkrétním příkladu standardu přiblížil referenční metody stanovení polohy a zejména jejich dynamickou
2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC
.6. VLASTNÍ ČÍSLA A VEKTORY MATIC V této kapitole se dozvíte: jak jsou definována vlastní (charakteristická) čísla a vektory čtvercové matice; co je to charakteristická matice a charakteristický polynom
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků
SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků lukas.mach@gmail.com Přílohy (videa, zdrojáky, ) ke stažení na: http://mach.matfyz.cz/sift Korespondence
transformace je posunutí plus lineární transformace má svou matici vzhledem k homogenním souřadnicím [1]
[1] Afinní transformace je posunutí plus lineární transformace má svou matici vzhledem k homogenním souřadnicím využití například v počítačové grafice Evropský sociální fond Praha & EU. Investujeme do
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY
NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY Stanislav Vítek, Petr Páta, Jiří Hozman Katedra radioelektroniky, ČVUT FEL Praha, Technická 2, 166 27 Praha 6 E-mail: svitek@feld.cvut.cz, pata@feld.cvut.cz, hozman@feld.cvut.cz
2. RBF neuronové sítě
2. RBF neuronové sítě Kapitola pojednává o neuronových sítích typu RBF. V kapitole je popsána základní struktura tohoto typu neuronové sítě. Poté následuje definice a charakteristika jednotlivých radiálně
Microsoft Office. Excel vyhledávací funkce
Microsoft Office Excel vyhledávací funkce Karel Dvořák 2011 Vyhledávání v tabulkách Vzhledem ke skutečnosti, že Excel je na mnoha pracovištích používán i jako nástroj pro správu jednoduchých databází,
Znalostní systém nad ontologií ve formátu Topic Maps
Znalostní systém nad ontologií ve formátu Topic Maps Ladislav Buřita, Petr Do ladislav.burita@unob.cz; petr.do@unob.cz Univerzita obrany, Fakulta vojenských technologií Kounicova 65, 662 10 Brno Abstrakt:
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární
4EK213 Lineární modely. 4. Simplexová metoda - závěr
4EK213 Lineární modely 4. Simplexová metoda - závěr 4. Simplexová metoda - závěr Konečnost simplexové metody Degenerace Modifikace pravidla pro volbu vstupující proměnné Blandovo pravidlo Kontrola výpočtu
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
OSA. maximalizace minimalizace 1/22
OSA Systémová analýza metodika používaná k navrhování a racionalizaci systémů v podmínkách neurčitosti vyšší stupeň operační analýzy Operační analýza (výzkum) soubor metod umožňující řešit rozhodovací,
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly.
Kapitola Reprezentace grafu V kapitole?? jsme se dozvěděli, co to jsou grafy a k čemu jsou dobré. rzo budeme chtít napsat nějaký program, který s grafy pracuje. le jak si takový graf uložit do počítače?
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
Vícerozměrné statistické metody
Vícerozměrné statistické metody Podobnosti a vzdálenosti ve vícerozměrném prostoru, asociační matice II Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Práce s asociační maticí Vzdálenosti
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) 1 Obecný popis metody Particle Image Velocimetry, nebo-li zkráceně PIV, je měřící
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
TELEGYNEKOLOGIE TELEGYNECOLOGY
TELEGYNEKOLOGIE TELEGYNECOLOGY Račanská E. 1, Huser M. 1, Schwarz D. 2, Šnábl I. 2, Ventruba P. 1 1) Gynekologicko porodnická klinika LF MU a FN Brno 2) Institut biostatistiky a analýz LF a PřF MU Abstrakt
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
Uspořádanou n-tici reálných čísel nazveme aritmetický vektor (vektor), ā = (a 1, a 2,..., a n ). Čísla a 1, a 2,..., a n se nazývají složky vektoru
1 1. Lineární algebra 1.1. Lineární závislost a nezávislost vektorů. Hodnost matice Aritmetické vektory Uspořádanou n-tici reálných čísel nazveme aritmetický vektor (vektor), ā = (a 1, a 2,..., a n ).
Metody analýzy dat I. Míry a metriky - pokračování
Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:
KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d
KMA/PDB Prostorové databáze Karel Janečka Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d Sylabus předmětu KMA/PDB Úvodní přednáška Základní terminologie Motivace rozdíl klasické
Podobnostní transformace
Schurova věta 1 Podobnostní transformace a výpočet vlastních čísel Obecný princip: Úloha: Řešíme-li matematickou úlohu, je často velmi vhodné hledat její ekvivalentní formulaci tak, aby se řešení úlohy
Dynamika vázaných soustav těles
Dynamika vázaných soustav těles Většina strojů a strojních zařízení, s nimiž se setkáváme v praxi, lze považovat za soustavy těles. Složitost dané soustavy závisí na druhu řešeného případu. Základem pro
Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý
Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika
Algoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
AVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.
VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:
PROGRAM GEOGEBRA VE VÝUCE LINEÁRNÍ ALGEBRY
PROGRAM GEOGEBRA VE VÝUCE LINEÁRNÍ ALGEBRY Veronika Havelková FZŠ Táborská Abstrakt: Příspěvek se zabývá možnostmi využití programu GeoGebra ve výuce lineární algebry. Pozornost je zaměřena na soustavy
Výběr báze. u n. a 1 u 1
Výběr báze Mějme vektorový prostor zadán množinou generátorů. To jest V = M, kde M = {u,..., u n }. Pokud je naším úkolem najít nějakou bázi V, nejpřímočařejším postupem je napsat si vektory jako řádky
vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).
Řešené příklady z lineární algebry - část 6 Typové příklady s řešením Příklad 6.: Kvadratickou formu κ(x) = x x 6x 6x x + 8x x 8x x vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
V tomto článku popíšeme zajímavou úlohu (inspirovanou reálnou situací),
L i t e r a t u r a [1] Calábek, P. Švrček, J.: Úvod do řešení funkcionálních rovnic. MFI, roč. 10 (2000/01), č. 3. [2] Engel, A.: Problem-Solving Strategies. Springer-Verlag, New York, Inc., 1998. [3]
SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY
ROBUST 2004 c JČMF 2004 SHLUKOVÁNÍ A TEXTOVÉ DOKUMENTY Dušan Húsek, Hana Řezanková, Václav Snášel Klíčová slova: Výpočetní statistika, shlukování, rozsáhlé datové soubory, dokumentografické informační
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,
Vektorový prostor Příklady: Př.1. R 2 ; R 3 ; R n...aritmetický n-rozměrný prostor Dvě operace v R n : součet vektorů u = (u 1,...u n ) a v = (v 1,...v n ) je vektor u + v = (u 1 + v 1,...u n + v n ),
Univerzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Databázové a informační systémy
Databázové a informační systémy doc. Ing. Miroslav Beneš, Ph.D. katedra informatiky FEI VŠB-TUO A-1007 / 597 324 213 http://www.cs.vsb.cz/benes Miroslav.Benes@vsb.cz Obsah Jak ukládat a efektivně zpracovávat
Rosenblattův perceptron
Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného
BPC2E_C09 Model komunikačního systému v Matlabu
BPCE_C9 Model komunikačního systému v Matlabu Cílem cvičení je vyzkoušet si sestavit skripty v Matlabu pro model jednoduchého komunikačního systému pro přenos obrázků. Úloha A. Sestavte model komunikačního
Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012
Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Matematicko-statistická metoda používaná zejména při zpracování nepřesných dat (typicky experimentálních empirických
KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.
1/24 KOMPRESE OBRAZŮ Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/ hlavac KOMPRESE OBRAZŮ, ÚVOD 2/24 Cíl:
Úvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
11. Skalární součin a ortogonalita p. 1/16
11. Skalární součin a ortogonalita 11. Skalární součin a ortogonalita p. 1/16 11. Skalární součin a ortogonalita p. 2/16 Skalární součin a ortogonalita 1. Definice skalárního součinu 2. Norma vektoru 3.
4. Trojúhelníkový rozklad p. 1/20
4. Trojúhelníkový rozklad 4. Trojúhelníkový rozklad p. 1/20 4. Trojúhelníkový rozklad p. 2/20 Trojúhelníkový rozklad 1. Permutační matice 2. Trojúhelníkové matice 3. Trojúhelníkový (LU) rozklad 4. Výpočet