Klasifikace a rozpoznávání
|
|
- Kryštof Sedlák
- před 6 lety
- Počet zobrazení:
Transkript
1 Klasifikace a rozpoznávání Prezentace přednášek M. Španěl, 2009 Ústav počítačové grafiky a multimédií
2 Téma přednášky Unsupervised techniky
3 Obsah: Literatura Úvod do shlukování Metriky, základní přístupy, dendrogram, Hierarchické přístupy K-means Vektorová kvantizace Další metody Fuzzy C-Means, GMMs, Mean Shift Grafové metody Jak poznat dobré shlukování? Optimální počet shluků IKR'08: Unsupervised techniky 3
4 Doporučená literatura Duda, R. O., et al.: Pattern Classification, 2 nd Ed., Sonka M., Hlavac, V., Boyle, R.: Image Processing, Analysis and Machine Vision, 3rd Ed., Webb, A.: Statistical Pattern Recognition, 2 nd Ed., Další podklady pro přednášku Černocký, J.: Statistické rozpoznávání vzorů, SRE. Buhmann, J.: Data Clustering, Tutorial at CVPR Fung, G.: Lecture Note 4: Clustering, INFS, Univ. of Queensland. IKR'08: Unsupervised techniky 4
5 Téma přednášky Klasifikace vs. shlukování
6 Statistické rozpoznávání vzorů Zařazuje objekty/události do předem známých kategorií. Příznakový vektor (feature vector) výsledek pozorování a měření. Bod v příznakovém prostoru (feature space). y x x M 1 2 x n = x Klasifikátor na základě pozorování a měření (příznakového vektoru) zařazuje vzory do tříd. q : X Y IKR'08: Unsupervised techniky 6
7 Technicky Sensors and preprocessing Segmentation Feature extraction Classifier Class Pattern Teacher Learning algorithm Učení bez učitele (unsupervised learning) Dělení vzorů do tříd podle zadaného kritéria kvality (též. clustering). Jak optimalizovat kritérium? Učení s učitelem (supervised learning) Rozdělení vzorů do tříd je dáno učitelem (classification). Jak generalizovat klasifikaci pro nové objekty? IKR'08: Unsupervised techniky 7
8 Příklad využití shlukování Kategorizace dokumentů, web stránek, obrázků, apod. IKR'08: Unsupervised techniky 8
9 Téma přednášky Shlukování
10 Co je to shlukování? Není k dispozici informace od učitele (non-supervised learning). Nekompletní trénovací data. Dělení vzorů do tříd podle zadaného kritéria. Data patřící jedné třídě jsou si podobnější než data z různých tříd. Jaké kritérium zvolit? IKR'08: Unsupervised techniky 10
11 IKR'08: Unsupervised techniky 11 Kritéria podobnosti vzorů (vzdálenost) Similarity measures vzdálenost v prostoru Euclidian distance Manhattan distance Cosine distance = = N i p i q i Q P d 1 2 ) ( ), ( = ), ( i i i i q p q p Q P s = = N i p i q i Q P m 1 ), (
12 Aplikace Segmentace obrazu Dolování v datech (Data Mining) Analýza dat Kategorizace dokumentů Hledání duplikátů Komprese dat IKR'08: Unsupervised techniky 12
13 Základní přístupy Hierarchical clustering vytváří stromové struktury Tzv. dendrogram Agglomerative na začátku tvoří každý vzorek samostatný shluk, vybíráme nejbližší a spojujeme Divisive jeden shluk, dělíme na menší Partitional clustering statistické přístupy, K-Means Rekurzivní aplikace -> hierarchický clustering IKR'08: Unsupervised techniky 13
14 Podobnost shluků (angl. inter-cluster similarity) Min (Single-linkage) Max (Complete-linkage) Group average Vzdálenost centroidů apod. IKR'08: Unsupervised techniky 14
15 Podobnost shluků, pokr. Min podobnost (vzdálenost) dvou nejvíce podobných (nejbližších) vzorků. Max podobnost dvou nejméně podobných vzorků. IKR'08: Unsupervised techniky 15
16 Podobnost shluků, pokr. Group average průměr ze všech možných dvojic. Vzdálenost centroidů IKR'08: Unsupervised techniky 16
17 Min kritérium + Neeliptické tvary - Citlivé na šum IKR'08: Unsupervised techniky 17
18 Max kritérium + Méně citlivé na šum - Problémy s velkými shluky IKR'08: Unsupervised techniky 18
19 Hierarchické přístupy +/- Nemusíme znát počet shluků -> lze určit z dendrogramu Jakmile jednou spojíme shluky, není cesta zpět! Problémy se Šumem a outliers Různě velkými shluky IKR'08: Unsupervised techniky 19
20 Identifikace outliers IKR'08: Unsupervised techniky 20
21 Téma přednášky Non-Hierarchical Clustering
22 K-Means algoritmus (metoda nejbližších středů) N-dimenzionální příznakové vektory x i Každý shluk reprezentován středem (centroid) µ i Kritériem je minimální vzdálenost od středu shluků N 1,..., y N, µ 1,..., µ k ) = xi yi i= 1 H ( y µ y i {1,, k } přiřazení do shluků. 2 1D varianta shlukování 2D varianta IKR'08: Unsupervised techniky 22
23 K-Means algoritmus, pokr. 1. Náhodně inicializuj středy regionů µ i. 2. Klasifikuj vektory x i vždy do nejbližšího shluku: y = arg min x µ i k {1,.., K} i k 2 3. Vypočti nové středy regionů: µ' k = 1 N y = k i: y i i = k x i 4. Opakuj kroky (2) a (3), dokud se středy shluků mění. IKR'08: Unsupervised techniky 23
24 K-Means algoritmus, pokr. Dělí data do kompaktních shluků. IKR'08: Unsupervised techniky 24
25 Demo č.1 K-Means v Matlabu Černocký, J.: ZRE IKR'08: Unsupervised techniky 25
26 Problémy K-Means Rozdílná velikost shluků IKR'08: Unsupervised techniky 26
27 Problémy K-Means, pokr. Rozdílná hustota IKR'08: Unsupervised techniky 27
28 Problémy K-Means, pokr. Nekulaté shluky IKR'08: Unsupervised techniky 28
29 Možné řešení? Použít více shluků -> je nutné sloučit! IKR'08: Unsupervised techniky 29
30 Demo č.2 K-Means v Matlabu IKR'08: Unsupervised techniky 30
31 Vector Quantization (VQ) Kódování a zpracování P-dimenzionálních vektorů je velmi náročné (P x float). Skalární kvantování není ideální. VQ ~ nalezení kódových vektorů, na které zaokrouhlujeme IKR'08: Unsupervised techniky 31
32 Trénování kódových vektorů N trénovacích vzorů. Chceme kódovou knihu (codebook) o velikosti K. Trénování ~ clustering Kódování přiřazení vektorů ke shlukům Nejčastěji K-Means Vyhodnocení kvality kódové knihy totální vzdálenost, zkreslení N 1 D = d( pi, Q[ pi ]) N i= 1 iterujeme dokud se D významně mění IKR'08: Unsupervised techniky 32
33 Linde-Buzo-Gray Reší problémy s inicializací K-Means (nahodný výběr?) LBG postupně dělí shluky v kódové knize Po každém dělení necháme proběhnout K-Means Hierarchický přístup ( top-down ) IKR'08: Unsupervised techniky 33
34 LBG, pokr. IKR'08: Unsupervised techniky 34
35 Demo č.3 K-Means v Matlabu Černocký, J.: ZRE IKR'08: Unsupervised techniky 35
36 Varianty VQ dlouhé vektory, velké N Split VQ vektor rozdělen na několik menších (více codebooků). Algebraická VQ kódové vektory jsou rozmístěny libovolně, ale pozice jsou deterministické (není nutné porovnávat vstup se všemi). Multi-stage VQ 2 codebooky, druhý kvantuje chybu prvního, při dekódování se sčítají. Tree-structured VQ pamatujeme si generace, vektor v k generaci může v k+1 generaci příslušet pouze dětičkám (suboptimální řešeni, ale méně porovnání). IKR'08: Unsupervised techniky 36
37 Téma přednášky Další metody shlukování
38 IKR'08: Unsupervised techniky 38 Fuzzy C-Means algoritmus Jim Bezdek, 1981 Každý bod x patří s určitou pravděpodobností u(x) do všech shluků (~ fuzzy logic). Střed shluku průměr všech bodů x i váhovaný pravděpodobností s jakou do shluku náleží 1 ) ( 1 = = K k u k x = = = N n m n k N n n m n k k x u x x u 1 1 ) ( ) ( µ
39 Hard vs. Soft Classifier Pevné přiřazení do shluku (K-Means) FCM IKR'08: Unsupervised techniky 39
40 IKR'08: Unsupervised techniky 40 Fuzzy C-Means algoritmus, pokr. Pravděpodobnost u k (x), že bod x patří do k-tého shluku je úměrná převrácené hodnotě vzdálenosti od středu shluku. po normalizaci a fuzzifikaci m ~ 1 degraduje na k-means = = K j m j k k x d x d x u 1 1) 2/( ), ( ), ( 1 ) ( µ µ ), ( 1 ) ( x d x u k k µ =
41 Příklad č. Fuzzy C-Means Obraz s nehomogenní m osvětlením a šumem. Segmentovaný obraz (bez potlačení vlivu osvětlení). Segmentovaný obraz, adaptivní FCM algoritmus. IKR'08: Unsupervised techniky 41
42 Gaussian Mixture Models (GMMs) Každá třída popsána jednou Gaussovkou! Neznáme přířazení vektorů y k do tříd, ani parametry Gaussovek. Obdoba GMM v rozpoznávání (~jedna třída, ale několik neznámých Gaussovek). IKR'08: Unsupervised techniky 42
43 Gaussian Mixture Models, pokr. Data modelujeme směsí Gaussových (normálních) rozložení pravděpodobnosti. p( x ω ) = α N( x; µ, Σ kde α ij jsou váhy jednotlivých Gaussovek (Σ=1). i= 1 Celková log-likelihood pro všechna data: ln p( D Θ) = j n M (b) S maximalizací máme problém (příliš parametrů, suma v logaritmu) iterativní EM algoritmus. M ji ln k = 1 i= 1 α jin ( x k ji ; µ ji ji ), Σ ji ) IKR'08: Unsupervised techniky 43
44 Příklad č. GMMs IKR'08: Unsupervised techniky 44
45 Demo č.4 Ukázka GMM pro shlukování IKR'08: Unsupervised techniky 45
46 Mean Shift algoritmus Předpoklad, že hustota bodů x i v prostoru roste směrem ke středu shluku. IKR'08: Unsupervised techniky 46
47 IKR'08: Unsupervised techniky 47 Mean Shift algoritmus, pokr. Hustotu f() lze vyhodnotit lokálně: k(x) gaussian kernel = = N i i d h k Nh f 1 1 ) ( x x x = exp 2 1 ) ( σ µ π σ x x k
48 IKR'08: Unsupervised techniky 48 Mean Shift algoritmus, pokr. Hledáme trajektorii pohybu tzv. mean shift vectors + Je schopen analyzovat podlouhlé shluky. x x x x x x x = = = N i i N i i i h k h k m ) 1 ( ) 1 ( ) (
49 Příklad č. Mean Shift algoritmus Comanciu D., Meer. P: Mean Shift: A Robust Approach Toward Feature Space Analysis, IKR'08: Unsupervised techniky 49
50 Příklad č. Segmentace Mean Shift algoritmem IKR'08: Unsupervised techniky 50
51 Demo č.5 Mean Shift v Matlabu IKR'08: Unsupervised techniky 51
52 Téma přednášky Grafové metody
53 Shlukování na základě spojitosti Vektory ve stejném shluku Existuje cesta s malými rozdíly. Vektory v různých shlucích Všechny cesty obsahují alespoň jeden velký rozdíl. Single linkage Začíná s N shluky (N počet vektorů). V každém kroku spoj dva shluky, které jsou k sobě nejblíže. IKR'08: Unsupervised techniky 53
54 Shlukování na základě spojitosti, pokr. Problém: jaké zvolit kritérium spojitosti, aby bylo odolné vůči izolovaným bodům a šumu? k-means Single linkage IKR'08: Unsupervised techniky 54
55 Path-based clustering Body v prostoru jsou popsány vzájemnou rozdílností (dissimilarity). Matice rozdílností všech vektorů x i se označuje D. Funkce y: X {1,,M} přiřazuje každému vektoru index třídy. Rozdílnost dvou bodů: D ij min max D p Pij ( y) 1 h p 1 = p h ph+ 1 P ij (y) množina všech možných cest z bodu x i do x j v rámci stejné třídy. IKR'08: Unsupervised techniky 55
56 Path-based clustering Minimalizace účelové funkce M 1 H ( y; D) = D ( y; D) ij k = 1 Nk i, j: y = y = k All-Pairs-Shortest-Path problem (např. Floyd-Warshall algoritmus). Fisher, B., Buhmann, J. M.: Data Resampling for Path Based Clustering, i j IKR'08: Unsupervised techniky 56
57 Příklad č. Path-based clustering IKR'08: Unsupervised techniky 57
58 Téma přednášky Jak určit optimální počet shluků?
59 Cluster validity Shluková analýza zavádí strukturu do dat. Nesprávný počet shluků Nesprávný model tříd Jak ověřit, že model dat je správný? Jak zjistit optimální počet tříd? IKR'08: Unsupervised techniky 59
60 Complexity-based validity Vyber co nejjednodušší model, který dobře popisuje data. Záporná log-likelihood neustále klesá s rostoucím počtem tříd korekce penalizační funkcí. Např.: MDL (Minimum Description Length) a BIC (Bayesian Information Criterion). IKR'08: Unsupervised techniky 60
61 Cross Validated Likelihood Aplikuje se klasická cross validace. Natrénuj model na jednéčásti dat a vyhodnoť neg. loglikelihood na druhé části. Vyber takový počet tříd, pro který byl průměr přes několik pokusů nejmenší. Vhodné zejména pro GMMs. + Snadné na implementaci. Výpočetně náročné. IKR'08: Unsupervised techniky 61
62 Stability-based validation Idea: Natrénované modely by na dvou skupinách dat ze stejného zdroje měly být stejné. Stabilita míra shody obou modelů. IKR'08: Unsupervised techniky 62
63 Stability-based validation, pokr. V praxi máme pouze jednu trénovací sadu: -> Vyhodnoť stabilitu řešení pro různé počty shluků na podvzorkovaných datech. Jak vyhodnotit stabilitu? Míra rozdílnosti (dissimilarity) = počet různě klasifikovaných vzorů. Problémy: Jak vyhodnotit na disjunktních množinách dat? Silně závislé na počtu tříd. 50% hrůza pro k = 2, ale dobré pro k = 10 IKR'08: Unsupervised techniky 63
64 Disjunktní množiny datové sady Rozšířenířešení z množiny A do B: 1. Natrénovat na množině A. 2. Otestovat na množině B. 3. Porovnat výsledky obou řešení nad B. IKR'08: Unsupervised techniky 64
65 Příklad č. Stability-based validation IKR'08: Unsupervised techniky 65
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
VíceUČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
VíceAVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza
AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Shluková analýza Cílem shlukové analýzy je nalézt v datech podmnožiny
VíceSRE 03 - Statistické rozpoznávání
SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget ÚPGM FIT VUT Brno, burget@fit.vutbr.cz FIT VUT Brno SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget, ÚPGM FIT VUT Brno, 2006/07 1/29 Opakování
VíceAlgoritmy a struktury neuropočítačů ASN P3
Algoritmy a struktury neuropočítačů ASN P3 SOM algoritmus s učitelem i bez učitele U-matice Vektorová kvantizace Samoorganizující se mapy ( Self-Organizing Maps ) PROČ? Základní myšlenka: analogie s činností
VíceSupport Vector Machines (jemný úvod)
Support Vector Machines (jemný úvod) Osnova Support Vector Classifier (SVC) Support Vector Machine (SVM) jádrový trik (kernel trick) klasifikace s měkkou hranicí (soft-margin classification) hledání optimálních
VíceLineární klasifikátory
Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
VíceÚloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
VíceStátnice odborné č. 20
Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin
VíceAlgoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
VíceFakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
VíceProjekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma
Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky
VíceKlasifikace a rozpoznávání. Lineární klasifikátory
Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber
Více4. Učení bez učitele. Shlukování. K-means, EM. Hierarchické shlukování. Kompetitivní učení. Kohonenovy mapy.
GoBack 4. Učení bez učitele. Shlukování., EM. Hierarchické.. Kohonenovy mapy. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 29 Aplikace umělé inteligence 1 / 53 Obsah P. Pošík c 29 Aplikace umělé
VíceImplementace Bayesova kasifikátoru
Implementace Bayesova kasifikátoru a diskriminačních funkcí v prostředí Matlab J. Havlík Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 166 27 Praha 6
VíceÚvod do optimalizace, metody hladké optimalizace
Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady
VíceObsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
VíceMetody analýzy dat I. Míry a metriky - pokračování
Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:
VíceVytěžování znalostí z dat
Pavel Kordík (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 10 1/50 Vytěžování znalostí z dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical
VíceKlasifikace a rozpoznávání. Bayesovská rozhodovací teorie
Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce p íznaků Granáty Četnost Jablka Váha [dkg] Pravděpodobnosti - diskrétní p íznaky Uvažujme diskrétní p íznaky váhové kategorie Nechť tabulka
VíceNG C Implementace plně rekurentní
NG C Implementace plně rekurentní neuronové sítě v systému Mathematica Zdeněk Buk, Miroslav Šnorek {bukz1 snorek}@fel.cvut.cz Neural Computing Group Department of Computer Science and Engineering, Faculty
VíceInstance based learning
Učení založené na instancích Instance based learning Charakteristika IBL (nejbližších sousedů) Tyto metody nepředpokládají určitý model nejsou strukturované a typicky nejsou příliš užitečné pro porozumění
VíceAlgoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
VíceMetody analýzy dat II
Metody analýzy dat II Detekce komunit MADII 2018/19 1 Zachary s club, Collaboration network in Santa Fe Institute, Lusseau s network of Bottlenose Dolphins 2 Web Pages, Overlaping communities of word associations
VíceNásledující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen
11. Klasifikace V této kapitole se seznámíme s účelem, principy a jednotlivými metodami klasifikace dat, jež tvoří samostatnou rozsáhlou oblast analýzy dat. Klasifikace umožňuje určit, do které skupiny
VíceJan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno
SRE 2 - Statistické rozpoznávání vzorů Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno SRE 2 - Statistické rozpoznávání vzorů Jan Černocký, ÚPGM FIT VUT Brno, 25/6 1/6 Plán... SRE 2
Víceoddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
VíceTrénování sítě pomocí učení s učitelem
Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup
VícePřednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
VíceOdečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý
Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika
VíceÚvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
VíceShlukování. Zpracováno s využitím skvělého tutoriálu autorů Eamonn Keogh, Ziv Bar-Joseph a Andrew Moore
Shlukování Zpracováno s využitím skvělého tutoriálu autorů Eamonn Keogh, Ziv Bar-Joseph a Andrew Moore Motivace Míra vzdálenosti Osnova přednášky Hierarchické shlukování Hodnocení kvality rozkladu Shlukování
VíceAlgoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
VíceUmělé neuronové sítě
Umělé neuronové sítě 17. 3. 2018 5-1 Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce 5-2 Neuronové aktivační
VíceRozdělování dat do trénovacích a testovacích množin
Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném
VíceProfilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
VíceApriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
VíceOptimální rozdělující nadplocha 4. Support vector machine. Adaboost.
Optimální rozdělující nadplocha. Support vector machine. Adaboost. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Opakování Lineární diskriminační
VíceKatedra kybernetiky, FEL, ČVUT v Praze.
Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz posnova přednášek Přednáška Učitel Obsah 1. J. Kléma Úvod do předmětu, učení s a bez učitele.
VíceModerní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
VíceNěkteré potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze
Některé potíže s klasifikačními modely v praxi Nikola Kaspříková KMAT FIS VŠE v Praze Literatura J. M. Chambers: Greater or Lesser Statistics: A Choice for Future Research. Statistics and Computation 3,
VíceRozpoznávání v obraze
Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd
Vícepřetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat
Zkouška ISR 2013 přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat 1. Rozdílné principy u induktivního a deduktivního
VíceMetody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování
Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování Základní (strukturální) vlastnosti sítí Stupně vrcholů a jejich
VíceFakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:
Fakulta informačních technologií VUT Brno Předmět: Projekt: SRE Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: 9.12.2006 Zadání Vyberte si jakékoliv 2 klasifikátory, např. GMM vs. neuronová
VícePokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační
VíceKlasifikace a rozpoznávání. Bayesovská rozhodovací teorie
Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce příznaků 3 25 2 Granáty Jablka Četnost 15 1 5 2 3 4 5 6 7 8 Váha [dkg] Pravděpodobnosti - diskrétní příznaky Uvažujme diskrétní příznaky
Více5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015
Umělé neuronové sítě 5. 4. 205 _ 5- Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce _ 5-2 Neuronové aktivační
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Shluková analýza Shluková analýza je souhrnným názvem pro celou řadu výpočetních algoritmů, jejichž cílem
VíceKOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.
1/25 KOMPRESE OBRAZŮ Václav Hlaváč, Jan Kybic Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/ hlavac KOMPRESE OBRAZŮ, ÚVOD
VíceTSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY
TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají
VíceRobustní odhady statistických parametrů
Robustní odhady statistických parametrů ěkdy pracují dobře, jinde ne. Typická data - pozorování BL Lac 100 mag 40 0 0.41 0.40 JD date 0.39 0.38 0.38223-1.586 0.017 0.40550-1.530 0.019 0.39453-1.610 0.024
VíceZpracování digitalizovaného obrazu (ZDO) - Segmentace II
Zpracování digitalizovaného obrazu (ZDO) - Segmentace II Další metody segmentace Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování digitalizovaného
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceRozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005
Rozpoznávání písmen Jiří Šejnoha Rudolf Kadlec (c) 2005 Osnova Motivace Popis problému Povaha dat Neuronová síť Architektura Výsledky Zhodnocení a závěr Popis problému Jedná se o praktický problém, kdy
VíceNAIL072 ROZPOZNÁVÁNÍ VZORŮ
NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceUž bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely
Učení bez učitele Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely Klastrování Kohonenovy mapy LVQ (Učení vektorové kvantizace) Zbývá: Hybridní modely (kombinace učení bez učitele
Více1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
VíceIDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
Více9. listopadu Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/
9. listopadu 212 Rozvoj aplikačního potenciálu (RAPlus) CZ.1.7/2.4./17.117 Používané postupy Lord D., Mannering F.: The Statistical Analysis of Crash-Frequency Data: A Review and Assessment of Methodological
VíceKlasifikace a rozpoznávání. Extrakce příznaků
Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám
VíceKatedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
VíceAnalýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce
Analýza dat v GIS Dotazy na databáze Prostorové Atributové Překrytí Overlay Mapová algebra Vzdálenostní funkce Euklidovské vzdálenosti Oceněné vzdálenosti Funkce souvislosti Interpolační funkce Topografické
VíceNeparametrické odhady hustoty pravděpodobnosti
Neparametrické odhady hustoty pravděpodobnosti Václav Hlaváč Elektrotechnická fakulta ČVUT Katedra kybernetiky Centrum strojového vnímání 121 35 Praha 2, Karlovo nám. 13 hlavac@fel.cvut.cz Statistické
VíceSTATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION
STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION Anna Čermáková Michael Rost Abstrakt Cílem příspěvku bylo
VíceUmělá inteligence II
Umělá inteligence II 11 http://ktiml.mff.cuni.cz/~bartak Roman Barták, KTIML roman.bartak@mff.cuni.cz Dnešní program! V reálném prostředí převládá neurčitost.! Neurčitost umíme zpracovávat pravděpodobnostními
VíceÚloha: Verifikace osoby pomocí dynamického podpisu
Cvičení z předmětu Biometrie Úloha: Verifikace osoby pomocí dynamického podpisu Jiří Wild, Jakub Schneider kontaktní email: schnejak@fel.cvut.cz 5. října 2015 1 Úvod Úloha má za cíl seznámit vás s metodami
VíceShluková analýza, Hierarchické, Nehierarchické, Optimum, Dodatek. Učení bez učitele
1 Obsah přednášy 1. Shluová analýza 2. Podobnost objetů 3. Hierarchicé shluování 4. Nehierarchicé shluování 5. Optimální počet shluů 6. Další metody 2 Učení bez učitele není dána výstupní lasifiace (veličina
VíceDálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU
Dálkový průzkum Země Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU Klasifikace obrazu Klasifikaci můžeme obecně definovat jako seskupování vzájemně si podobných prvků (entit) do
VíceZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
VíceANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík,, CSc. NEURONOVÉ SÍTĚ otázky a odpovědi 1 AKD_predn4, slide 8: Hodnota výstupu závisí na znaménku funkce net i, tedy na tom, zda bude suma
VíceANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
VíceZpětnovazební učení Michaela Walterová Jednoocí slepým,
Zpětnovazební učení Michaela Walterová Jednoocí slepým, 17. 4. 2019 V minulých dílech jste viděli Tři paradigmata strojového učení: 1) Učení s učitelem (supervised learning) Trénovací data: vstup a požadovaný
VíceVytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
VícePokročilé neparametrické metody. Klára Kubošová
Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení
VíceZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
VíceMay 26, 2016 DATA SCIENCE LABORATORY D T. Fakulta informačních technologíı. Reference. Motivace Data a jejich. Hidden Markov Model
České Vysoké Učení Technické v Praze Fakulta informačních technologíı May 26, 2016 D T DATA SCIENCE LABORATORY Presentation Outline 1 2 3 4 Proč modelovat? Hlavní myšlenka: Rozdíly v chovaní zvířat jsou
VíceÚstav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí
Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
VíceShluková analýza dat a stanovení počtu shluků
Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu
VíceBinární vyhledávací stromy pokročilé partie
Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald
VíceKlasifikace předmětů a jevů
Klasifikace předmětů a jevů 1. Úvod Rozpoznávání neboli klasifikace je základní znak lidské činnosti. Rozpoznávání (klasifikace) předmětů a jevů spočívá v jejich zařazování do jednotlivých tříd. Třídou
VíceMiroslav Čepek
Vytěžování Dat Přednáška 4 Shluková analýza Miroslav Čepek Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti 14.10.2014 Miroslav Čepek
VíceVyužití strojového učení k identifikaci protein-ligand aktivních míst
Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita
VíceStatistické vyhodnocení zkoušek betonového kompozitu
Statistické vyhodnocení zkoušek betonového kompozitu Thákurova 7, 166 29 Praha 6 Dejvice Česká republika Program přednášek a cvičení Výuka: Středa 10:00-11:40, C -204 Přednášky a cvičení: Statistické vyhodnocení
VíceGrafové algoritmy. Programovací techniky
Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být
VíceChybějící atributy a postupy pro jejich náhradu
Chybějící atributy a postupy pro jejich náhradu Jedná se o součást čištění dat Čistota dat je velmi důležitá, neboť kvalita dat zásadně ovlivňuje kvalitu výsledků, které DM vyprodukuje, neboť platí Garbage
VíceStrojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
VíceDálkový průzkum Země. Klasifikace obrazu
Dálkový průzkum Země Klasifikace obrazu Neřízená klasifikace v IDRISI Modul CLUSTER (Image Processing / Hard Classifiers) využívá techniku histogramových vrcholů pásma pro klasifikaci výsledný obraz volba
VíceRosenblattův perceptron
Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného
VíceKLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ
KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ Marie Richterová 1, David Juráček 2 1 Univerzita obrany, Katedra KIS, 2 PČR MŘ Brno Abstrakt Článek se zabývá rozpoznáváním analogových a diskrétních
VíceROBUST 2014 Jetřichovice ledna
ROBUST 2014 Jetřichovice 19. 24. ledna Jitka Bartošová katedra exaktních metod Vysoká škola ekonomická v Praze Fakulta managementu Jindřichův Hradec Abstrakt Snahy o modelování velkých náhodných výběrů
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceAlgoritmy a struktury neuropočítačů ASN - P2. Topologie neuronových sítí, principy učení Samoorganizující se neuronové sítě Kohonenovy mapy
Algoritmy a struktury neuropočítačů ASN - P2 Topologie neuronových sítí, principy učení Samoorganizující se neuronové sítě Kohonenovy mapy Topologie neuronových sítí (struktura, geometrie, architektura)
VíceVyužití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
VícePravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
VíceKompresní metody první generace
Kompresní metody první generace 998-20 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ Stillg 20 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca / 32 Základní pojmy komprese
Více