Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti:

Podobné dokumenty
Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

uvedení do problematiky i Bezpečnostní kódy: detekční kódy = kódy zjišťující chyby samoopravné kódy = kódy opravující chyby příklady kódů:

Vícerozměrné statistické metody

Shluková analýza. Jiří Militky. Analýza experimentálních dat V. Červeně označené slide jsou jen pro doplnění informací a nezkouší se.

Úloha - rozpoznávání číslic

Shluková analýza dat a stanovení počtu shluků

Cvičná bakalářská zkouška, 1. varianta

Vícerozměrné statistické metody

ANALÝZA A KLASIFIKACE DAT. Institut biostatistiky a analýz

Metody založené na analogii

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

ANALÝZA A KLASIFIKACE DAT

Rasterizace je proces při kterém se vektorově definovaná grafika konvertuje na. x 2 x 1

Státnice odborné č. 20

Klasifikace podle nejbližších sousedů Nearest Neighbour Classification [k-nn]

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

ÚLOHY S POLYGONEM. Polygon řetězec úseček, poslední bod je totožný s prvním. 6 bodů: X1, Y1 až X6,Y6 Y1=X6, Y1=Y6 STANOVENÍ PLOCHY JEDNOHO POLYGONU

Rosenblattův perceptron

Cyklickékódy. MI-AAK(Aritmetika a kódy)

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA

Pseudospektrální metody

Kybernetika a umělá inteligence, cvičení 10/11

Algoritmy a struktury neuropočítačů ASN P3

Instance based learning

Vytyčení polohy bodu polární metodou

Informační systémy pro podporu rozhodování

DĚLENÍ SE ZBYTKEM (DĚLITEL 6, 7, 8, 9)


Aproximace funkcí. x je systém m 1 jednoduchých, LN a dostatečně hladkých funkcí. x c m. g 1. g m. a 1. x a 2. x 2 a k. x k b 1. x b 2.

Detekce neznámých typů mutantů na základě odlišnosti kinetiky fluorescence

Klasifikace a rozpoznávání. Lineární klasifikátory

1 Mnohočleny a algebraické rovnice

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

[1] Determinant. det A = 0 pro singulární matici, det A 0 pro regulární matici

UČENÍ BEZ UČITELE. Václav Hlaváč

Algoritmizace prostorových úloh

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

Univerzita Pardubice 8. licenční studium chemometrie

Lineární klasifikátory


M{ZD{ CX MME_CX-5_COVER_12R1_V2.indd 1 30/01/ :27

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Příklady použití tenkých vrstev Jaromír Křepelka

1 Vektorové prostory.

kamerou. Dle optických parametrů objektivu mohou v získaném obraze nastat geometrická

Metody zpracování a analýzy medicínských obrazových dat: možnosti využití v neurovědním výzkumu

Rozdělování dat do trénovacích a testovacích množin

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky

Tento výukový materiál byl vytvořen v rámci projektu MatemaTech Matematickou cestou k technice. Cyklistický převod výpočet rychlosti pohybu cyklisty

NADSTAVBOVÝ MODUL MOHSA V1

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Algoritmy pro shlukování prostorových dat

Hammingovy kódy. dekódování H.kódů. konstrukce. šifrování. Fanova rovina charakteristický vektor. princip generující a prověrková matice

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Nehierarchické shlukování

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Trénování sítě pomocí učení s učitelem

øada LS Koncové spínaèe Popis Konstrukce Technické údaje Dostupnost vybraných typù

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Strojové učení Marta Vomlelová

Informace v počítači. Výpočetní technika I. Ing. Pavel Haluza ústav informatiky PEF MENDELU v Brně haluza@mendelu.cz

Čebyševovy aproximace

Cvičení 11. Klasifikace. Jan Přikryl. 14. března 2018 ČVUT FD

Kombinatorická minimalizace

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Zada ní 1. Semina rní pra ce z pr edme tu Matematický software (KI/MSW)

Dálkový průzkum Země. Klasifikace obrazu

Naučte se víc... Microsoft Office Excel 2007 PŘÍKLADY

Varianta Pravděpodobnost Výnos A 1 Výnos A 2 1 0,1 1% 0,1 3% 0,3 2 0,2 12% 2,4 28% 5,6 3 0,3 6% 1,8 14% 4,2

Determinant. Definice determinantu. Permutace. Permutace, vlastnosti. Definice: Necht A = (a i,j ) R n,n je čtvercová matice.

Přednáška 13 Redukce dimenzionality

Klasifikace předmětů a jevů

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

Náhodný vektor a jeho charakteristiky

PROSTOROVÉ HIERARCHICKÉ SHLUKOVÁNÍ

Odhad stavu matematického modelu křižovatek

Interpolace obrazu pro experimentální měřiče plošného teplotního rozložení

13 Barvy a úpravy rastrového

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

= cos sin = sin + cos = 1, = 6 = 9. 6 sin 9. = 1 cos 9. = 1 sin cos 9 = 1 0, ( 0, ) = 1 ( 0, ) + 6 0,

Věra Keselicová. březen 2013

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Odpřednesenou látku naleznete v kapitole 3.3 skript Diskrétní matematika.

SYLABUS PŘEDNÁŠKY 10 Z GEODÉZIE 1

Program Denoiser v1.4 ( )

SF2 Podklady pro cvičení

Návod na cvičení VoIP Hodnocení kvality řeči neintrusivní metodou

11 Analýza hlavních komponet

cv3.tex. Vzorec pro úplnou pravděpodobnost

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

20. května Abstrakt V následujícím dokumentu je popsán způsob jakým analyzovat problém. výstřelu zasáhnout bod na zemi v definované vzdálenosti.

Autor: Ing. Martin Varga


rovnic), Definice y + p(x)y = q(x), Je-li q(x) = 0 na M, nazývá se y + p(x)y =

Popis metod CLIDATA-GIS. Martin Stříž

Iterační výpočty. Dokumentace k projektu č. 2 do IZP. 24. listopadu 2004

3. Reálná čísla. většinou racionálních čísel. V analytických úvahách, které praktickým výpočtům

Transkript:

Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti: Postup: I) zvolení metriky pro výpočet vzdáleností dvou bodů II) zvolení metriky pro určení vzdálenosti mezi dvěma množinami bodů Předpoklad: budeme shlukovací algoritmy využívat jako neučící se algoritmy (klasifikátor natrénujeme na celé trénovací množině a pak už pouze klasifikujeme nové subjekty (např. už nepřepočítáváme centroid po zařazení každého nového subjektu či objektu apod.)) 1.1 Metoda k nejbližších sousedů + Euklidova metrika: Znázornění výpočtu vzdálenosti dvou bodů pomocí Euklidovy metriky je uvedeno na Obr. 1. 1 1 1 2 1 2 Obr.1: Ilustrace výpočtu vzdálenosti dvou bodů pomocí Euklidovy metriky (vlevo) a znázornění klasifikace podle nejbližšího souseda (vpravo). Modře je vyznačena množina bodů, které mají od testovacího subjektu stejnou vzdálenost. d E (x 1, x 0 ) = (x x 01 ) 2 + (x x 02 ) 2 = (2,) 2 + ( ) 2 = 2,2 + =, d E (x 2, x 0 ) = (x 21 x 01 ) 2 + (x 22 x 02 ) 2 = (,) 2 + ( ) 2 = 0,2 + 1 = 1, d E (x, x 0 ) = (x 1 x 01 ) 2 + (x 2 x 02 ) 2 = (,) 2 + ( ) 2 = 0,2 + 1 = 1, d E (x, x 0 ) = (x 1 x 01 ) 2 + (x 2 x 02 ) 2 = (,) 2 + ( ) 2 = 2,2 + = 2, d E (x, x 0 ) = (x 1 x 01 ) 2 + (x 2 x 02 ) 2 = (,) 2 + ( ) 2 = 0,2 d E (x, x 0 ) = (x 1 x 01 ) 2 + (x 2 x 02 ) 2 = (,) 2 + ( ) 2 = 0,2 + 1 =,0 d E (x, x 0 ) < d E (x 2, x 0 ) d E (x, x 0 ) < d E (x, x 0 ) < d E (x 1, x 0 ) < d E (x, x 0 ) 1

pro k = 1: nejbližší soused bodu x 0 je bod x, protože d E (x, x 0 ) je nejmenší ; lze rovněž zapsat jako: d NN (D, x 0 ) = min d E (x i, x 0 ) = 1,, kde i = 1,2,, a d NN (H, x 0 ) = min d E (x i, x 0 ), kde i =,,; protože d NN (H, x 0 ) < d NN (D, x 0 ), pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou 2 a 1 pro k = : nelze rozhodnout pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou a 2 y pro k = : nelze rozhodnout Poznámka: je nutné volit liché k Poznámka 2: závisí na volbě k, kam subjekt zařadíme (tzn., pro různá k se zařazení může lišit např. v tomto případě pro k = 1 subjekt zařazen do třídy kontrolních subjektů a pro k = a k = subjekt zařazen do třídy pacientů) 1.2 Metoda průměrné vazby + Euklidova metrika: d GG (D, x 0 ) = d E(x 1,x 0 )+d E (x 2,x 0 )+d E (x,x 0 ) d GG (H, x 0 ) = d E(x,x 0 )+d E (x,x 0 )+d E (x,x 0 ) =,+1,+1, = 2,+0,+,0 = 1, = 2, Protože d GG (D, x 0 ) < d GG (H, x 0 ), bude zařazen do třídy pacientů. 1. Centroidová metoda + Euklidova metrika: x D = 1 n D 1 n x n i1 D D i=1 x n i2 D i=1 = 1 (2 + + ) 1 ( + + ) = [ ] centroid pacientů x H = 1 n H 1 n x n i1 H i=1 H x n i2 H i=1 = 1 ( + + ) 1 ( + + ) = [ ] centroid kontrol d CC (D, x 0 ) = d E (x D, x 0 ) = (,) 2 + ( ) 2 = 0,2 + 1 = 1, d CC (H, x 0 ) = d E (x H, x 0 ) = (,) 2 + ( ) 2 = 0,2 + = 2,0 Protože d CC (D, x 0 ) < d CC (H, x 0 ), bude zařazen do třídy pacientů. Znázornění klasifikace testovacího subjektu pomocí centroidové metody, přičemž vzdálenosti testovacího subjektu od centroidů skupin jsou počítány pomocí Euklidovy metriky, je na Obr. 2. Medoid (odvozen vizuálně spočítal by se tak, že by se našel nejbližší bod k centroidu u dané skupiny nebo jako bod s nejmenší sumou vzdáleností od ostatních bodů) medoid pro pacienty: x D = x 2 = [ ] medoid pro : x H = x = [ ] d CCC (D, x 0 ) = d E (x D, x 0 ) = d E (x 2, x 0 ) = (,) 2 + ( ) 2 = 0,2 + 1 = 1, d CCC (H, x 0 ) = d E (x H, x 0 ) = d E (x, x 0 ) = (,) 2 + ( ) 2 = 2,2 + = 2, Protože d CCC (D, x 0 ) < d CCC (H, x 0 ), bude zařazen do třídy pacientů. 2

1 centroid pacientů centroid kontrol 1 2 Obr. 2: Ilustrace klasifikace testovacího subjektu pomocí centroidové metody, přičemž vzdálenosti testovacího subjektu od centroidů skupin jsou počítány pomocí Euklidovy metriky. Je patrné, že subjekt bude zařazen do třídy pacientů, protože jeho Euklidova vzdálenost od centroidu pacientů je menší než od centroidu kontrol. 2.1 Metoda k nejbližších sousedů + Hammingova (manhattanská) metrika: Znázornění výpočtu vzdálenosti dvou bodů pomocí Hammingovy (manhattanské) metriky je uvedeno na Obr.. d H (x 1, x 0 ) = x x 01 + x x 02 = 2, + = 1, + =, d H (x 2, x 0 ) = x 21 x 01 + x 22 x 02 =, + + 1 = 1, d H (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + 1 = 1, d H (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + = 1, + 2 =, d H (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + 0 d H (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + =, d H (x, x 0 ) < d H (x 2, x 0 ) d H (x, x 0 ) < d H (x, x 0 ) < d H (x 1, x 0 ) d E (x, x 0 ) pro k = 1: nejbližší soused bodu x 0 je bod x, protože d H (x, x 0 ) je nejmenší pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou 2 a 1 pro k = : nelze rozhodnout pro k = : nelze rozhodnout pro k = : nelze rozhodnout

1 1 1 2 1 2 Obr. : Ilustrace výpočtu vzdálenosti dvou bodů pomocí Hammingovy (manhattanské) metriky (vlevo) a znázornění klasifikace podle nejbližšího souseda (vpravo). Modře je vyznačena množina bodů, které mají od testovacího subjektu stejnou vzdálenost. 2.2 Metoda průměrné vazby + Hammingova (manhattanská) metrika: d GG (D, x 0 ) = d H(x 1,x 0 )+d H (x 2,x 0 )+d H (x,x 0 ) d GG (H, x 0 ) = d H(x,x 0 )+d H (x,x 0 )+d H (x,x 0 ) =,+1,+1, =,+0,+, = 2, = 2, Protože d GG (D, x 0 ) < d GG (H, x 0 ), bude zařazen do třídy pacientů. 2. Centroidová metoda + Hammingova (manhattanská) metrika: d CC (D, x 0 ) = d H (x D, x 0 ) =, + + 1 = 1, d CC (H, x 0 ) = d H (x H, x 0 ) =, + + 2 = 2, Protože d CC (D, x 0 ) < d CC (H, x 0 ), bude zařazen do třídy pacientů. Znázornění klasifikace testovacího subjektu pomocí centroidové metody, přičemž vzdálenosti testovacího subjektu od centroidů skupin jsou počítány pomocí Hammingovy (manhattanské) metriky, je na Obr.. d CCC (D, x 0 ) = d H (x D, x 0 ) = d H (x 2, x 0 ) =, + + 1 = 1, d CCC (H, x 0 ) = d H (x H, x 0 ) = d H (x, x 0 ) =, + = 1, + 2 =, Protože d CCC (D, x 0 ) < d CCC (H, x 0 ), bude zařazen do třídy pacientů.

1 centroid pacientů centroid kontrol 1 2 Obr. : Ilustrace klasifikace testovacího subjektu pomocí centroidové metody, přičemž vzdálenosti testovacího subjektu od centroidů skupin jsou počítány pomocí Hammingovy (manhattanské) metriky. Je patrné, že subjekt bude zařazen do třídy pacientů, protože jeho Hammingova (manhattanská) vzdálenost od centroidu pacientů je menší než od centroidu kontrol..1 Metoda k nejbližších sousedů + Čebyševova metrika: d C (x 1, x 0 ) = max( x x 01 ; x x 02 ) = max( 2, ; ) = max(1,; ) = d C (x 2, x 0 ) = max( x 21 x 01 ; x 22 x 02 ) = max(, ; ) = max(0,; 1) = 1 d C (x, x 0 ) = max( x 1 x 01 ; x 2 x 02 ) = max(, ; ) = max(0,; 1) = 1 d C (x, x 0 ) = max( x 1 x 01 ; x 2 x 02 ) = max(, ; ) = max(1,; 2) = 2 d C (x, x 0 ) = max( x 1 x 01 ; x 2 x 02 ) = max(, ; ) = max(0,; 0) d C (x, x 0 ) = max( x 1 x 01 ; x 2 x 02 ) = max(, ; ) = max(0,; ) = d C (x, x 0 ) < d C (x 2, x 0 ) d C (x, x 0 ) < d C (x, x 0 ) < d C (x 1, x 0 ) < d C (x, x 0 ) pro k = 1: nejbližší soused bodu x 0 je bod x, protože d C (x, x 0 ) je nejmenší pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou 2 a 1 pro k = : nelze rozhodnout pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou a 2 y pro k = : nelze rozhodnout.2 Metoda průměrné vazby + Čebyševova metrika: d GG (D, x 0 ) = d C(x 1,x 0 )+d C (x 2,x 0 )+d C (x,x 0 ) = +1+1 = 1,

d GG (H, x 0 ) = d C(x,x 0 )+d C (x,x 0 )+d C (x,x 0 ) = 2+0,+ = 2,1 Protože d GG (D, x 0 ) < d GG (H, x 0 ), bude zařazen do třídy pacientů.. Centroidová metoda + Čebyševova metrika: d CC (D, x 0 ) = d C (x D, x 0 ) = max(, ; ) = max(0,; 1) = 1 d CC (H, x 0 ) = d C (x H, x 0 ) = max (, ; ) = max(0,; 2) = 2 Protože d CC (D, x 0 ) < d CC (H, x 0 ), bude zařazen do třídy pacientů. d CCC (D, x 0 ) = d C (x D, x 0 ) = d C (x 2, x 0 ) = max(, ; ) = max(0,; 1) = 1 d CCC (H, x 0 ) = d C (x H, x 0 ) = d C (x, x 0 ) = max(, ; ) = max(1,; 2) = 2 Protože d CCC (D, x 0 ) < d CCC (H, x 0 ), bude zařazen do třídy pacientů..1 Metoda k nejbližších sousedů + Canberrská metrika: d CC (x 1, x 0 ) = x x 01 + x x 02 = 2, + = 1, + = 0,2 x + x 01 x + x 02 2 +, +, 21 d CC (x 2, x 0 ) = x 21 x 01 + x 22 x 02 =, + + 1 = 0, x 21 + x 01 x 22 + x 02 +, +, 1 d CC (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + 1 = 0,1 x 1 + x 01 x 2 + x 02 +, +, 1 d CC (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + = 1, + 2 = 0,0 x 1 + x 01 x 2 + x 02 +, +, 1 d CC (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + 0 = 0,0 x 1 + x 01 x 2 + x 02 +, +, 1 d CC (x, x 0 ) = x 1 x 01 + x 2 x 02 =, + + x 1 + x 01 x 2 + x 02 +, +, 1 d CC (x, x 0 ) < d CC (x 2, x 0 ) < d CC (x, x 0 ) < d CC (x, x 0 ) < d CC (x, x 0 ) < d CC (x 1, x 0 ) pro k = 1: nejbližší soused bodu x 0 je bod x, protože d CC (x, x 0 ) je nejmenší pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou 2 a 1 pro k = : nelze rozhodnout pro k = : subjekt zařazen do třídy kontrolních subjektů, protože mezi nejbližšími sousedy jsou 2 a y pro k = : nelze rozhodnout.2 Metoda průměrné vazby + Canberrská metrika: d GG (D, x 0 ) = d CC(x 1,x 0 )+d CC (x 2,x 0 )+d CC (x,x 0 ) d GG (H, x 0 ) = d CC(x,x 0 )+d CC (x,x 0 )+d CC (x,x 0 ) = 0,2+0,+0,1 = 0,0+0,0+0, = 0,2 = 0,2 Protože d GG (D, x 0 ) < d GG (H, x 0 ), bude zařazen do třídy pacientů.

. Centroidová metoda + Canberrská metrika: d CC (D, x 0 ) = d CC (x D, x 0 ) =, + + 1 = 0,1 +, +, 1 d CC (H, x 0 ) = d CC (x H, x 0 ) =, + + 2 = 0,1 +, +, 1 Protože d CC (D, x 0 ) < d CC (H, x 0 ), bude zařazen do třídy pacientů. d CCC (D, x 0 ) = d CC (x D, x 0 ) = d CC (x 2, x 0 ) =, + + 1 = 0, +, +, 1 d CCC (H, x 0 ) = d CC (x H, x 0 ) = d CC (x, x 0 ) =, + = 1, + 2 = 0,0 +, +, 1 Protože d CCC (D, x 0 ) < d CCC (H, x 0 ), bude zařazen do třídy pacientů..1 Metoda k nejbližších sousedů + Mahalanobisova metrika: Nejprve je potřeba vypočítat výběrové kovarianční matice pro třídu pacientů a kontrol, tzn. S D = 1 1 1 a S H = 1 1 (výpočet výběrových kovariančních matic lze nalézt ve Cvičení 1) 1 a jejich inverzi její inverzi S 1 D = 1 1 1 a S H 1 = 1 1 1. d MM (x 1, x 0 ) = (x 1 x 0 ) T S 1 D (x 1 x 0 ) = [2, ] 1, 2 = 1, 1 1 d MM (x 2, x 0 ) = (x 2 x 0 ) T S 1 D (x 2 x 0 ) = [, ] 1, 1 1 = 1 d MM (x, x 0 ) = (x x 0 ) T S 1 D (x x 0 ) = [, ] 1, 1 1 = 1 d MM (x, x 0 ) = (x x 0 ) T S 1 H (x x 0 ) = [, ] 1, = 1, 1 1 d MM (x, x 0 ) = (x x 0 ) T S 1 H (x x 0 ) = [, ] 1, 1 1 d MM (x, x 0 ) = (x x 0 ) T S 1 H (x x 0 ) = [, ] 1, = 2,0 1 1 d MM (x, x 0 ) < d MM (x 2, x 0 ) d MM (x, x 0 ) < d MM (x, x 0 ) < d MM (x 1, x 0 ) < d MM (x, x 0 ) pro k = 1: nejbližší soused bodu x 0 je bod x, protože d CC (x, x 0 ) je nejmenší pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou 2 a 1

pro k = : nelze rozhodnout pro k = : subjekt zařazen do třídy pacientů, protože mezi nejbližšími sousedy jsou a 2 y pro k = : nelze rozhodnout.2 Metoda průměrné vazby + Mahalanobisova metrika: d GG (D, x 0 ) = d MM(x 1,x 0 )+d MM (x 2,x 0 )+d MM (x,x 0 ) d GG (H, x 0 ) = d MM(x,x 0 )+d MM (x,x 0 )+d MM (x,x 0 ) = 1,+1+1 = 1,2 = 1,0 Protože d GG (D, x 0 ) < d GG (H, x 0 ), bude zařazen do třídy pacientů.. Centroidová metoda + Mahalanobisova metrika: = 1,+0,+2,0 d CC (D, x 0 ) = d MM (x D, x 0 ) = [, ] 1, 1 1 d CC (H, x 0 ) = d CC (x H, x 0 ) = [, ] 1, 1 1 = 1 Protože d CC (D, x 0 ) < d CC (H, x 0 ), bude zařazen do třídy pacientů. d CCC (D, x 0 ) = d MM (x D, x 0 ) = d MM (x 2, x 0 ) = 1 d CCC (H, x 0 ) = d MM (x H, x 0 ) = d MM (x, x 0 ) = 1, Protože d CCC (D, x 0 ) < d CCC (H, x 0 ), bude zařazen do třídy pacientů. Výsledky uspořádáme do tabulky: metrika Euklidova Hammingova Čebyševova Canberrská Mahalanobisova NN H H H H H -NN D D D D D -NN D - D H D GA D D D D D CE-centroid D D D D D CE-medoid D D D D D Je patrné, že výsledek klasifikace se může lišit při použití různých metrik vzdálenosti.