Klasifikace a rozpoznávání

Rozměr: px
Začít zobrazení ze stránky:

Download "Klasifikace a rozpoznávání"

Transkript

1 Klasifikace a rozpoznávání Prezentace přednášek M. Španěl, 2009 Ústav počítačové grafiky a multimédií

2 Téma přednášky Unsupervised techniky

3 Obsah: Literatura Úvod do shlukování Metriky, základní přístupy, dendrogram, Hierarchické přístupy K-means Vektorová kvantizace Další metody Fuzzy C-Means, GMMs, Mean Shift Grafové metody Jak poznat dobré shlukování? Optimální počet shluků IKR'08: Unsupervised techniky 3

4 Doporučená literatura Duda, R. O., et al.: Pattern Classification, 2 nd Ed., Sonka M., Hlavac, V., Boyle, R.: Image Processing, Analysis and Machine Vision, 3rd Ed., Webb, A.: Statistical Pattern Recognition, 2 nd Ed., Další podklady pro přednášku Černocký, J.: Statistické rozpoznávání vzorů, SRE. Buhmann, J.: Data Clustering, Tutorial at CVPR Fung, G.: Lecture Note 4: Clustering, INFS, Univ. of Queensland. IKR'08: Unsupervised techniky 4

5 Téma přednášky Klasifikace vs. shlukování

6 Statistické rozpoznávání vzorů Zařazuje objekty/události do předem známých kategorií. Příznakový vektor (feature vector) výsledek pozorování a měření. Bod v příznakovém prostoru (feature space). y x x M 1 2 x n = x Klasifikátor na základě pozorování a měření (příznakového vektoru) zařazuje vzory do tříd. q : X Y IKR'08: Unsupervised techniky 6

7 Technicky Sensors and preprocessing Segmentation Feature extraction Classifier Class Pattern Teacher Learning algorithm Učení bez učitele (unsupervised learning) Dělení vzorů do tříd podle zadaného kritéria kvality (též. clustering). Jak optimalizovat kritérium? Učení s učitelem (supervised learning) Rozdělení vzorů do tříd je dáno učitelem (classification). Jak generalizovat klasifikaci pro nové objekty? IKR'08: Unsupervised techniky 7

8 Příklad využití shlukování Kategorizace dokumentů, web stránek, obrázků, apod. IKR'08: Unsupervised techniky 8

9 Téma přednášky Shlukování

10 Co je to shlukování? Není k dispozici informace od učitele (non-supervised learning). Nekompletní trénovací data. Dělení vzorů do tříd podle zadaného kritéria. Data patřící jedné třídě jsou si podobnější než data z různých tříd. Jaké kritérium zvolit? IKR'08: Unsupervised techniky 10

11 IKR'08: Unsupervised techniky 11 Kritéria podobnosti vzorů (vzdálenost) Similarity measures vzdálenost v prostoru Euclidian distance Manhattan distance Cosine distance = = N i p i q i Q P d 1 2 ) ( ), ( = ), ( i i i i q p q p Q P s = = N i p i q i Q P m 1 ), (

12 Aplikace Segmentace obrazu Dolování v datech (Data Mining) Analýza dat Kategorizace dokumentů Hledání duplikátů Komprese dat IKR'08: Unsupervised techniky 12

13 Základní přístupy Hierarchical clustering vytváří stromové struktury Tzv. dendrogram Agglomerative na začátku tvoří každý vzorek samostatný shluk, vybíráme nejbližší a spojujeme Divisive jeden shluk, dělíme na menší Partitional clustering statistické přístupy, K-Means Rekurzivní aplikace -> hierarchický clustering IKR'08: Unsupervised techniky 13

14 Podobnost shluků (angl. inter-cluster similarity) Min (Single-linkage) Max (Complete-linkage) Group average Vzdálenost centroidů apod. IKR'08: Unsupervised techniky 14

15 Podobnost shluků, pokr. Min podobnost (vzdálenost) dvou nejvíce podobných (nejbližších) vzorků. Max podobnost dvou nejméně podobných vzorků. IKR'08: Unsupervised techniky 15

16 Podobnost shluků, pokr. Group average průměr ze všech možných dvojic. Vzdálenost centroidů IKR'08: Unsupervised techniky 16

17 Min kritérium + Neeliptické tvary - Citlivé na šum IKR'08: Unsupervised techniky 17

18 Max kritérium + Méně citlivé na šum - Problémy s velkými shluky IKR'08: Unsupervised techniky 18

19 Hierarchické přístupy +/- Nemusíme znát počet shluků -> lze určit z dendrogramu Jakmile jednou spojíme shluky, není cesta zpět! Problémy se Šumem a outliers Různě velkými shluky IKR'08: Unsupervised techniky 19

20 Identifikace outliers IKR'08: Unsupervised techniky 20

21 Téma přednášky Non-Hierarchical Clustering

22 K-Means algoritmus (metoda nejbližších středů) N-dimenzionální příznakové vektory x i Každý shluk reprezentován středem (centroid) µ i Kritériem je minimální vzdálenost od středu shluků N 1,..., y N, µ 1,..., µ k ) = xi yi i= 1 H ( y µ y i {1,, k } přiřazení do shluků. 2 1D varianta shlukování 2D varianta IKR'08: Unsupervised techniky 22

23 K-Means algoritmus, pokr. 1. Náhodně inicializuj středy regionů µ i. 2. Klasifikuj vektory x i vždy do nejbližšího shluku: y = arg min x µ i k {1,.., K} i k 2 3. Vypočti nové středy regionů: µ' k = 1 N y = k i: y i i = k x i 4. Opakuj kroky (2) a (3), dokud se středy shluků mění. IKR'08: Unsupervised techniky 23

24 K-Means algoritmus, pokr. Dělí data do kompaktních shluků. IKR'08: Unsupervised techniky 24

25 Demo č.1 K-Means v Matlabu Černocký, J.: ZRE IKR'08: Unsupervised techniky 25

26 Problémy K-Means Rozdílná velikost shluků IKR'08: Unsupervised techniky 26

27 Problémy K-Means, pokr. Rozdílná hustota IKR'08: Unsupervised techniky 27

28 Problémy K-Means, pokr. Nekulaté shluky IKR'08: Unsupervised techniky 28

29 Možné řešení? Použít více shluků -> je nutné sloučit! IKR'08: Unsupervised techniky 29

30 Demo č.2 K-Means v Matlabu IKR'08: Unsupervised techniky 30

31 Vector Quantization (VQ) Kódování a zpracování P-dimenzionálních vektorů je velmi náročné (P x float). Skalární kvantování není ideální. VQ ~ nalezení kódových vektorů, na které zaokrouhlujeme IKR'08: Unsupervised techniky 31

32 Trénování kódových vektorů N trénovacích vzorů. Chceme kódovou knihu (codebook) o velikosti K. Trénování ~ clustering Kódování přiřazení vektorů ke shlukům Nejčastěji K-Means Vyhodnocení kvality kódové knihy totální vzdálenost, zkreslení N 1 D = d( pi, Q[ pi ]) N i= 1 iterujeme dokud se D významně mění IKR'08: Unsupervised techniky 32

33 Linde-Buzo-Gray Reší problémy s inicializací K-Means (nahodný výběr?) LBG postupně dělí shluky v kódové knize Po každém dělení necháme proběhnout K-Means Hierarchický přístup ( top-down ) IKR'08: Unsupervised techniky 33

34 LBG, pokr. IKR'08: Unsupervised techniky 34

35 Demo č.3 K-Means v Matlabu Černocký, J.: ZRE IKR'08: Unsupervised techniky 35

36 Varianty VQ dlouhé vektory, velké N Split VQ vektor rozdělen na několik menších (více codebooků). Algebraická VQ kódové vektory jsou rozmístěny libovolně, ale pozice jsou deterministické (není nutné porovnávat vstup se všemi). Multi-stage VQ 2 codebooky, druhý kvantuje chybu prvního, při dekódování se sčítají. Tree-structured VQ pamatujeme si generace, vektor v k generaci může v k+1 generaci příslušet pouze dětičkám (suboptimální řešeni, ale méně porovnání). IKR'08: Unsupervised techniky 36

37 Téma přednášky Další metody shlukování

38 IKR'08: Unsupervised techniky 38 Fuzzy C-Means algoritmus Jim Bezdek, 1981 Každý bod x patří s určitou pravděpodobností u(x) do všech shluků (~ fuzzy logic). Střed shluku průměr všech bodů x i váhovaný pravděpodobností s jakou do shluku náleží 1 ) ( 1 = = K k u k x = = = N n m n k N n n m n k k x u x x u 1 1 ) ( ) ( µ

39 Hard vs. Soft Classifier Pevné přiřazení do shluku (K-Means) FCM IKR'08: Unsupervised techniky 39

40 IKR'08: Unsupervised techniky 40 Fuzzy C-Means algoritmus, pokr. Pravděpodobnost u k (x), že bod x patří do k-tého shluku je úměrná převrácené hodnotě vzdálenosti od středu shluku. po normalizaci a fuzzifikaci m ~ 1 degraduje na k-means = = K j m j k k x d x d x u 1 1) 2/( ), ( ), ( 1 ) ( µ µ ), ( 1 ) ( x d x u k k µ =

41 Příklad č. Fuzzy C-Means Obraz s nehomogenní m osvětlením a šumem. Segmentovaný obraz (bez potlačení vlivu osvětlení). Segmentovaný obraz, adaptivní FCM algoritmus. IKR'08: Unsupervised techniky 41

42 Gaussian Mixture Models (GMMs) Každá třída popsána jednou Gaussovkou! Neznáme přířazení vektorů y k do tříd, ani parametry Gaussovek. Obdoba GMM v rozpoznávání (~jedna třída, ale několik neznámých Gaussovek). IKR'08: Unsupervised techniky 42

43 Gaussian Mixture Models, pokr. Data modelujeme směsí Gaussových (normálních) rozložení pravděpodobnosti. p( x ω ) = α N( x; µ, Σ kde α ij jsou váhy jednotlivých Gaussovek (Σ=1). i= 1 Celková log-likelihood pro všechna data: ln p( D Θ) = j n M (b) S maximalizací máme problém (příliš parametrů, suma v logaritmu) iterativní EM algoritmus. M ji ln k = 1 i= 1 α jin ( x k ji ; µ ji ji ), Σ ji ) IKR'08: Unsupervised techniky 43

44 Příklad č. GMMs IKR'08: Unsupervised techniky 44

45 Demo č.4 Ukázka GMM pro shlukování IKR'08: Unsupervised techniky 45

46 Mean Shift algoritmus Předpoklad, že hustota bodů x i v prostoru roste směrem ke středu shluku. IKR'08: Unsupervised techniky 46

47 IKR'08: Unsupervised techniky 47 Mean Shift algoritmus, pokr. Hustotu f() lze vyhodnotit lokálně: k(x) gaussian kernel = = N i i d h k Nh f 1 1 ) ( x x x = exp 2 1 ) ( σ µ π σ x x k

48 IKR'08: Unsupervised techniky 48 Mean Shift algoritmus, pokr. Hledáme trajektorii pohybu tzv. mean shift vectors + Je schopen analyzovat podlouhlé shluky. x x x x x x x = = = N i i N i i i h k h k m ) 1 ( ) 1 ( ) (

49 Příklad č. Mean Shift algoritmus Comanciu D., Meer. P: Mean Shift: A Robust Approach Toward Feature Space Analysis, IKR'08: Unsupervised techniky 49

50 Příklad č. Segmentace Mean Shift algoritmem IKR'08: Unsupervised techniky 50

51 Demo č.5 Mean Shift v Matlabu IKR'08: Unsupervised techniky 51

52 Téma přednášky Grafové metody

53 Shlukování na základě spojitosti Vektory ve stejném shluku Existuje cesta s malými rozdíly. Vektory v různých shlucích Všechny cesty obsahují alespoň jeden velký rozdíl. Single linkage Začíná s N shluky (N počet vektorů). V každém kroku spoj dva shluky, které jsou k sobě nejblíže. IKR'08: Unsupervised techniky 53

54 Shlukování na základě spojitosti, pokr. Problém: jaké zvolit kritérium spojitosti, aby bylo odolné vůči izolovaným bodům a šumu? k-means Single linkage IKR'08: Unsupervised techniky 54

55 Path-based clustering Body v prostoru jsou popsány vzájemnou rozdílností (dissimilarity). Matice rozdílností všech vektorů x i se označuje D. Funkce y: X {1,,M} přiřazuje každému vektoru index třídy. Rozdílnost dvou bodů: D ij min max D p Pij ( y) 1 h p 1 = p h ph+ 1 P ij (y) množina všech možných cest z bodu x i do x j v rámci stejné třídy. IKR'08: Unsupervised techniky 55

56 Path-based clustering Minimalizace účelové funkce M 1 H ( y; D) = D ( y; D) ij k = 1 Nk i, j: y = y = k All-Pairs-Shortest-Path problem (např. Floyd-Warshall algoritmus). Fisher, B., Buhmann, J. M.: Data Resampling for Path Based Clustering, i j IKR'08: Unsupervised techniky 56

57 Příklad č. Path-based clustering IKR'08: Unsupervised techniky 57

58 Téma přednášky Jak určit optimální počet shluků?

59 Cluster validity Shluková analýza zavádí strukturu do dat. Nesprávný počet shluků Nesprávný model tříd Jak ověřit, že model dat je správný? Jak zjistit optimální počet tříd? IKR'08: Unsupervised techniky 59

60 Complexity-based validity Vyber co nejjednodušší model, který dobře popisuje data. Záporná log-likelihood neustále klesá s rostoucím počtem tříd korekce penalizační funkcí. Např.: MDL (Minimum Description Length) a BIC (Bayesian Information Criterion). IKR'08: Unsupervised techniky 60

61 Cross Validated Likelihood Aplikuje se klasická cross validace. Natrénuj model na jednéčásti dat a vyhodnoť neg. loglikelihood na druhé části. Vyber takový počet tříd, pro který byl průměr přes několik pokusů nejmenší. Vhodné zejména pro GMMs. + Snadné na implementaci. Výpočetně náročné. IKR'08: Unsupervised techniky 61

62 Stability-based validation Idea: Natrénované modely by na dvou skupinách dat ze stejného zdroje měly být stejné. Stabilita míra shody obou modelů. IKR'08: Unsupervised techniky 62

63 Stability-based validation, pokr. V praxi máme pouze jednu trénovací sadu: -> Vyhodnoť stabilitu řešení pro různé počty shluků na podvzorkovaných datech. Jak vyhodnotit stabilitu? Míra rozdílnosti (dissimilarity) = počet různě klasifikovaných vzorů. Problémy: Jak vyhodnotit na disjunktních množinách dat? Silně závislé na počtu tříd. 50% hrůza pro k = 2, ale dobré pro k = 10 IKR'08: Unsupervised techniky 63

64 Disjunktní množiny datové sady Rozšířenířešení z množiny A do B: 1. Natrénovat na množině A. 2. Otestovat na množině B. 3. Porovnat výsledky obou řešení nad B. IKR'08: Unsupervised techniky 64

65 Příklad č. Stability-based validation IKR'08: Unsupervised techniky 65

Kybernetika a umělá inteligence, cvičení 10/11

Kybernetika a umělá inteligence, cvičení 10/11 Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o

Více

UČENÍ BEZ UČITELE. Václav Hlaváč

UČENÍ BEZ UČITELE. Václav Hlaváč UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení

Více

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Shluková analýza Cílem shlukové analýzy je nalézt v datech podmnožiny

Více

SRE 03 - Statistické rozpoznávání

SRE 03 - Statistické rozpoznávání SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget ÚPGM FIT VUT Brno, burget@fit.vutbr.cz FIT VUT Brno SRE 03 - Statistické rozpoznávání vzorů II Lukáš Burget, ÚPGM FIT VUT Brno, 2006/07 1/29 Opakování

Více

Algoritmy a struktury neuropočítačů ASN P3

Algoritmy a struktury neuropočítačů ASN P3 Algoritmy a struktury neuropočítačů ASN P3 SOM algoritmus s učitelem i bez učitele U-matice Vektorová kvantizace Samoorganizující se mapy ( Self-Organizing Maps ) PROČ? Základní myšlenka: analogie s činností

Více

Support Vector Machines (jemný úvod)

Support Vector Machines (jemný úvod) Support Vector Machines (jemný úvod) Osnova Support Vector Classifier (SVC) Support Vector Machine (SVM) jádrový trik (kernel trick) klasifikace s měkkou hranicí (soft-margin classification) hledání optimálních

Více

Lineární klasifikátory

Lineární klasifikátory Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

Státnice odborné č. 20

Státnice odborné č. 20 Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky

Více

Klasifikace a rozpoznávání. Lineární klasifikátory

Klasifikace a rozpoznávání. Lineární klasifikátory Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber

Více

4. Učení bez učitele. Shlukování. K-means, EM. Hierarchické shlukování. Kompetitivní učení. Kohonenovy mapy.

4. Učení bez učitele. Shlukování. K-means, EM. Hierarchické shlukování. Kompetitivní učení. Kohonenovy mapy. GoBack 4. Učení bez učitele. Shlukování., EM. Hierarchické.. Kohonenovy mapy. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 29 Aplikace umělé inteligence 1 / 53 Obsah P. Pošík c 29 Aplikace umělé

Více

Implementace Bayesova kasifikátoru

Implementace Bayesova kasifikátoru Implementace Bayesova kasifikátoru a diskriminačních funkcí v prostředí Matlab J. Havlík Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 166 27 Praha 6

Více

Úvod do optimalizace, metody hladké optimalizace

Úvod do optimalizace, metody hladké optimalizace Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

Metody analýzy dat I. Míry a metriky - pokračování

Metody analýzy dat I. Míry a metriky - pokračování Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 10 1/50 Vytěžování znalostí z dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical

Více

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce p íznaků Granáty Četnost Jablka Váha [dkg] Pravděpodobnosti - diskrétní p íznaky Uvažujme diskrétní p íznaky váhové kategorie Nechť tabulka

Více

NG C Implementace plně rekurentní

NG C Implementace plně rekurentní NG C Implementace plně rekurentní neuronové sítě v systému Mathematica Zdeněk Buk, Miroslav Šnorek {bukz1 snorek}@fel.cvut.cz Neural Computing Group Department of Computer Science and Engineering, Faculty

Více

Instance based learning

Instance based learning Učení založené na instancích Instance based learning Charakteristika IBL (nejbližších sousedů) Tyto metody nepředpokládají určitý model nejsou strukturované a typicky nejsou příliš užitečné pro porozumění

Více

Algoritmy pro shlukování prostorových dat

Algoritmy pro shlukování prostorových dat Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň

Více

Metody analýzy dat II

Metody analýzy dat II Metody analýzy dat II Detekce komunit MADII 2018/19 1 Zachary s club, Collaboration network in Santa Fe Institute, Lusseau s network of Bottlenose Dolphins 2 Web Pages, Overlaping communities of word associations

Více

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen 11. Klasifikace V této kapitole se seznámíme s účelem, principy a jednotlivými metodami klasifikace dat, jež tvoří samostatnou rozsáhlou oblast analýzy dat. Klasifikace umožňuje určit, do které skupiny

Více

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno SRE 2 - Statistické rozpoznávání vzorů Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno SRE 2 - Statistické rozpoznávání vzorů Jan Černocký, ÚPGM FIT VUT Brno, 25/6 1/6 Plán... SRE 2

Více

oddělení Inteligentní Datové Analýzy (IDA)

oddělení Inteligentní Datové Analýzy (IDA) Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {

Více

Trénování sítě pomocí učení s učitelem

Trénování sítě pomocí učení s učitelem Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý

Odečítání pozadí a sledování lidí z nehybné kamery. Ondřej Šerý Odečítání pozadí a sledování lidí z nehybné kamery Ondřej Šerý Plán Motivace a popis úlohy Rozdělení úlohy na tři části Detekce pohybu Detekce objektů Sledování objektů Rozbor každé z částí a nástin několika

Více

Úvod do zpracování signálů

Úvod do zpracování signálů 1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování

Více

Shlukování. Zpracováno s využitím skvělého tutoriálu autorů Eamonn Keogh, Ziv Bar-Joseph a Andrew Moore

Shlukování. Zpracováno s využitím skvělého tutoriálu autorů Eamonn Keogh, Ziv Bar-Joseph a Andrew Moore Shlukování Zpracováno s využitím skvělého tutoriálu autorů Eamonn Keogh, Ziv Bar-Joseph a Andrew Moore Motivace Míra vzdálenosti Osnova přednášky Hierarchické shlukování Hodnocení kvality rozkladu Shlukování

Více

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN - P11 Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova

Více

Umělé neuronové sítě

Umělé neuronové sítě Umělé neuronové sítě 17. 3. 2018 5-1 Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce 5-2 Neuronové aktivační

Více

Rozdělování dat do trénovacích a testovacích množin

Rozdělování dat do trénovacích a testovacích množin Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Apriorní rozdělení. Jan Kracík.

Apriorní rozdělení. Jan Kracík. Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.

Více

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost. Optimální rozdělující nadplocha. Support vector machine. Adaboost. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Opakování Lineární diskriminační

Více

Katedra kybernetiky, FEL, ČVUT v Praze.

Katedra kybernetiky, FEL, ČVUT v Praze. Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz posnova přednášek Přednáška Učitel Obsah 1. J. Kléma Úvod do předmětu, učení s a bez učitele.

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze Některé potíže s klasifikačními modely v praxi Nikola Kaspříková KMAT FIS VŠE v Praze Literatura J. M. Chambers: Greater or Lesser Statistics: A Choice for Future Research. Statistics and Computation 3,

Více

Rozpoznávání v obraze

Rozpoznávání v obraze Rozpoznávání v obraze AdaBoost a detekce objektů IKR, 2013 Roman Juránek www.fit.vutbr.cz/~ijuranek/personal Detekce objektů Úloha - v daném obraze nalézt objekty určitých tříd

Více

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat Zkouška ISR 2013 přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat 1. Rozdílné principy u induktivního a deduktivního

Více

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování Základní (strukturální) vlastnosti sítí Stupně vrcholů a jejich

Více

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: Fakulta informačních technologií VUT Brno Předmět: Projekt: SRE Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: 9.12.2006 Zadání Vyberte si jakékoliv 2 klasifikátory, např. GMM vs. neuronová

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie Klasifikace a rozpoznávání Bayesovská rozhodovací teorie Extrakce příznaků 3 25 2 Granáty Jablka Četnost 15 1 5 2 3 4 5 6 7 8 Váha [dkg] Pravděpodobnosti - diskrétní příznaky Uvažujme diskrétní příznaky

Více

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015 Umělé neuronové sítě 5. 4. 205 _ 5- Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce _ 5-2 Neuronové aktivační

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Shluková analýza Shluková analýza je souhrnným názvem pro celou řadu výpočetních algoritmů, jejichž cílem

Více

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. 1/25 KOMPRESE OBRAZŮ Václav Hlaváč, Jan Kybic Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/ hlavac KOMPRESE OBRAZŮ, ÚVOD

Více

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají

Více

Robustní odhady statistických parametrů

Robustní odhady statistických parametrů Robustní odhady statistických parametrů ěkdy pracují dobře, jinde ne. Typická data - pozorování BL Lac 100 mag 40 0 0.41 0.40 JD date 0.39 0.38 0.38223-1.586 0.017 0.40550-1.530 0.019 0.39453-1.610 0.024

Více

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II Zpracování digitalizovaného obrazu (ZDO) - Segmentace II Další metody segmentace Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování digitalizovaného

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005 Rozpoznávání písmen Jiří Šejnoha Rudolf Kadlec (c) 2005 Osnova Motivace Popis problému Povaha dat Neuronová síť Architektura Výsledky Zhodnocení a závěr Popis problému Jedná se o praktický problém, kdy

Více

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

NAIL072 ROZPOZNÁVÁNÍ VZORŮ NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely

Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely Učení bez učitele Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely Klastrování Kohonenovy mapy LVQ (Učení vektorové kvantizace) Zbývá: Hybridní modely (kombinace učení bez učitele

Více

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních

Více

IDENTIFIKACE BIMODALITY V DATECH

IDENTIFIKACE BIMODALITY V DATECH IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti

Více

9. listopadu Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

9. listopadu Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/ 9. listopadu 212 Rozvoj aplikačního potenciálu (RAPlus) CZ.1.7/2.4./17.117 Používané postupy Lord D., Mannering F.: The Statistical Analysis of Crash-Frequency Data: A Review and Assessment of Methodological

Více

Klasifikace a rozpoznávání. Extrakce příznaků

Klasifikace a rozpoznávání. Extrakce příznaků Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce

Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce Analýza dat v GIS Dotazy na databáze Prostorové Atributové Překrytí Overlay Mapová algebra Vzdálenostní funkce Euklidovské vzdálenosti Oceněné vzdálenosti Funkce souvislosti Interpolační funkce Topografické

Více

Neparametrické odhady hustoty pravděpodobnosti

Neparametrické odhady hustoty pravděpodobnosti Neparametrické odhady hustoty pravděpodobnosti Václav Hlaváč Elektrotechnická fakulta ČVUT Katedra kybernetiky Centrum strojového vnímání 121 35 Praha 2, Karlovo nám. 13 hlavac@fel.cvut.cz Statistické

Více

STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION

STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION Anna Čermáková Michael Rost Abstrakt Cílem příspěvku bylo

Více

Umělá inteligence II

Umělá inteligence II Umělá inteligence II 11 http://ktiml.mff.cuni.cz/~bartak Roman Barták, KTIML roman.bartak@mff.cuni.cz Dnešní program! V reálném prostředí převládá neurčitost.! Neurčitost umíme zpracovávat pravděpodobnostními

Více

Úloha: Verifikace osoby pomocí dynamického podpisu

Úloha: Verifikace osoby pomocí dynamického podpisu Cvičení z předmětu Biometrie Úloha: Verifikace osoby pomocí dynamického podpisu Jiří Wild, Jakub Schneider kontaktní email: schnejak@fel.cvut.cz 5. října 2015 1 Úvod Úloha má za cíl seznámit vás s metodami

Více

Shluková analýza, Hierarchické, Nehierarchické, Optimum, Dodatek. Učení bez učitele

Shluková analýza, Hierarchické, Nehierarchické, Optimum, Dodatek. Učení bez učitele 1 Obsah přednášy 1. Shluová analýza 2. Podobnost objetů 3. Hierarchicé shluování 4. Nehierarchicé shluování 5. Optimální počet shluů 6. Další metody 2 Učení bez učitele není dána výstupní lasifiace (veličina

Více

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU Dálkový průzkum Země Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU Klasifikace obrazu Klasifikaci můžeme obecně definovat jako seskupování vzájemně si podobných prvků (entit) do

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík,, CSc. NEURONOVÉ SÍTĚ otázky a odpovědi 1 AKD_predn4, slide 8: Hodnota výstupu závisí na znaménku funkce net i, tedy na tom, zda bude suma

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.

Více

Zpětnovazební učení Michaela Walterová Jednoocí slepým,

Zpětnovazební učení Michaela Walterová Jednoocí slepým, Zpětnovazební učení Michaela Walterová Jednoocí slepým, 17. 4. 2019 V minulých dílech jste viděli Tři paradigmata strojového učení: 1) Učení s učitelem (supervised learning) Trénovací data: vstup a požadovaný

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

May 26, 2016 DATA SCIENCE LABORATORY D T. Fakulta informačních technologíı. Reference. Motivace Data a jejich. Hidden Markov Model

May 26, 2016 DATA SCIENCE LABORATORY D T. Fakulta informačních technologíı. Reference. Motivace Data a jejich. Hidden Markov Model České Vysoké Učení Technické v Praze Fakulta informačních technologíı May 26, 2016 D T DATA SCIENCE LABORATORY Presentation Outline 1 2 3 4 Proč modelovat? Hlavní myšlenka: Rozdíly v chovaní zvířat jsou

Více

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

Shluková analýza dat a stanovení počtu shluků

Shluková analýza dat a stanovení počtu shluků Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu

Více

Binární vyhledávací stromy pokročilé partie

Binární vyhledávací stromy pokročilé partie Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald

Více

Klasifikace předmětů a jevů

Klasifikace předmětů a jevů Klasifikace předmětů a jevů 1. Úvod Rozpoznávání neboli klasifikace je základní znak lidské činnosti. Rozpoznávání (klasifikace) předmětů a jevů spočívá v jejich zařazování do jednotlivých tříd. Třídou

Více

Miroslav Čepek

Miroslav Čepek Vytěžování Dat Přednáška 4 Shluková analýza Miroslav Čepek Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti 14.10.2014 Miroslav Čepek

Více

Využití strojového učení k identifikaci protein-ligand aktivních míst

Využití strojového učení k identifikaci protein-ligand aktivních míst Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita

Více

Statistické vyhodnocení zkoušek betonového kompozitu

Statistické vyhodnocení zkoušek betonového kompozitu Statistické vyhodnocení zkoušek betonového kompozitu Thákurova 7, 166 29 Praha 6 Dejvice Česká republika Program přednášek a cvičení Výuka: Středa 10:00-11:40, C -204 Přednášky a cvičení: Statistické vyhodnocení

Více

Grafové algoritmy. Programovací techniky

Grafové algoritmy. Programovací techniky Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být

Více

Chybějící atributy a postupy pro jejich náhradu

Chybějící atributy a postupy pro jejich náhradu Chybějící atributy a postupy pro jejich náhradu Jedná se o součást čištění dat Čistota dat je velmi důležitá, neboť kvalita dat zásadně ovlivňuje kvalitu výsledků, které DM vyprodukuje, neboť platí Garbage

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

Dálkový průzkum Země. Klasifikace obrazu

Dálkový průzkum Země. Klasifikace obrazu Dálkový průzkum Země Klasifikace obrazu Neřízená klasifikace v IDRISI Modul CLUSTER (Image Processing / Hard Classifiers) využívá techniku histogramových vrcholů pásma pro klasifikaci výsledný obraz volba

Více

Rosenblattův perceptron

Rosenblattův perceptron Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného

Více

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ Marie Richterová 1, David Juráček 2 1 Univerzita obrany, Katedra KIS, 2 PČR MŘ Brno Abstrakt Článek se zabývá rozpoznáváním analogových a diskrétních

Více

ROBUST 2014 Jetřichovice ledna

ROBUST 2014 Jetřichovice ledna ROBUST 2014 Jetřichovice 19. 24. ledna Jitka Bartošová katedra exaktních metod Vysoká škola ekonomická v Praze Fakulta managementu Jindřichův Hradec Abstrakt Snahy o modelování velkých náhodných výběrů

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Algoritmy a struktury neuropočítačů ASN - P2. Topologie neuronových sítí, principy učení Samoorganizující se neuronové sítě Kohonenovy mapy

Algoritmy a struktury neuropočítačů ASN - P2. Topologie neuronových sítí, principy učení Samoorganizující se neuronové sítě Kohonenovy mapy Algoritmy a struktury neuropočítačů ASN - P2 Topologie neuronových sítí, principy učení Samoorganizující se neuronové sítě Kohonenovy mapy Topologie neuronových sítí (struktura, geometrie, architektura)

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti

Více

Kompresní metody první generace

Kompresní metody první generace Kompresní metody první generace 998-20 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ Stillg 20 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca / 32 Základní pojmy komprese

Více