Nehierarchické shlukování

Podobné dokumenty
Vícerozměrné statistické metody

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

Shluková analýza dat a stanovení počtu shluků

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Algoritmy pro shlukování prostorových dat

Vícerozměrné statistické metody

Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR

Shluková analýza. Jiří Militky. Analýza experimentálních dat V. Červeně označené slide jsou jen pro doplnění informací a nezkouší se.

Státnice odborné č. 20

I N V E S T I C E D O R O Z V O J E V Z D Ě L Á V Á N Í

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Prostorová variabilita

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti:

Úvodem Dříve les než stromy 3 Operace s maticemi

PRACOVNÍ LISTY K PRAKTICKÝM CVIČENÍM Z BIOLOGIE ZVÍŘAT

Univerzita Pardubice 8. licenční studium chemometrie

Shluková analýza vícerozměrných dat v programu R

Pokročilé neparametrické metody. Klára Kubošová

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

UČENÍ BEZ UČITELE. Václav Hlaváč

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Cvičná bakalářská zkouška, 1. varianta

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Jaký typ chrupu (podle skusné plochy stoliček) mají rejsci? Jak se liší od hlodavců?

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION

Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je L. Sinkulová

9. listopadu Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

vzorek vzorek

OPTIMALIZACE. (přehled metod)

Popisná statistika kvantitativní veličiny

Vytěžování znalostí z dat

Numerické metody a programování. Lekce 4

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Přednáška 13 Redukce dimenzionality

Národní informační středisko pro podporu kvality

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB

Modifikace algoritmu FEKM

Miroslav Čepek

VYUŽITÍ MATLABU PRO VÝUKU NUMERICKÉ MATEMATIKY Josef Daněk Centrum aplikované matematiky, Západočeská univerzita v Plzni. Abstrakt

Vícerozměrné statistické metody

Normální (Gaussovo) rozdělení

Numerické metody a programování

Normální (Gaussovo) rozdělení

STATISTICKÉ ODHADY Odhady populačních charakteristik

Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

GIS Geografické informační systémy

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

13 Barvy a úpravy rastrového

StatSoft Shlukování podobných

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

IAJCE Přednáška č. 8. double tprumer = (t1 + t2 + t3 + t4 + t5 + t6 + t7) / 7; Console.Write("\nPrumerna teplota je {0}", tprumer);

Robust 2014, ledna 2014, Jetřichovice

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

ADA Semestrální práce. Harmonické modelování signálů

KAPITOLA 5 - POKROČILÉ ZPRACOVÁNÍ TEXTU

Návrh a vyhodnocení experimentu

4EK213 LINEÁRNÍ MODELY

Jednofaktorová analýza rozptylu

Metody analýzy dat I. Míry a metriky - pokračování

Titulní stránka popisuje techniku shlukování a typ vzdálenosti. 2. Tvorba shluků a zařazení objektů do shluků:

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Digitální učební materiál

xrays optimalizační nástroj

ANALÝZA A KLASIFIKACE DAT

Moderní systémy pro získávání znalostí z informací a dat

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

OPTIMALIZAČNÍ ÚLOHY. Modelový příklad problém obchodního cestujícího:

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

APLIKACE SHLUKOVÉ ANALÝZY V EKOLOGII

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Užití země v České republice v letech 1994 až 2012 Karel Matějka IDS, Na Komořsku 2175/2a, Praha 4, Česká republika matejka@infodatasys.

UNIVEZITA PARDUBICE FAKULTA EKONOMICKO SPRÁVNÍ. Předzpracování ekonomických dat pomocí metod shlukové analýzy. Pavel Novák

Základní spádové metody

Genetické programování 3. část

9. přednáška z předmětu GIS1 Digitální model reliéfu a odvozené povrchy. Vyučující: Ing. Jan Pacina, Ph.D.

SSOS_ZD_3.01 Ústní dutina

NADSTAVBOVÝ MODUL MOHSA V1

Zobrazování barev Josef Pelikán CGG MFF UK Praha.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

(supervizovaného učení), jako je regrese a klasifikace. V takové situaci pozorujeme jak soubor vlastností

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

ANALÝZA A KLASIFIKACE DAT

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Kalkulace závažnosti komorbidit a komplikací pro CZ-DRG

Protonační rovnováhy léčiv faktorovou analýzou a nelineární regresí absorbanční responzní plochy

Dynamické datové struktury III.

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Rozdělování dat do trénovacích a testovacích množin

Transkript:

Základní informace Následující text je součástí učebních textů předmětu Vícerozměrné statistické metody a je určen zejména pro studenty Matematické biologie. Může být ovšem přínosný i pro další studenty biologických oborů - zejména botaniky, zoologie a antropologie. U studentů se předpokládá znalost biostatistiky. Dále by studenti měli mít znalosti o metrikách, vzdálenostech a podobnostech ve vícerozměrném prostoru. Nehierarchické shlukovací metody navazují na hierarchické metody shlukové analýzy, se kterými by měly být studenti již obeznámeni. Výstupy z výuky Shlukové nehierarchické analýzy Zvládnutí učebního textu umožní studentům: definovat princip nehierarchického shlukování, popsat výpočet u metody k-průměrů, x-průměrů a k-medoidů, aplikovat metodu k-průměrů na konkrétním příkladě modelových dat. Nehierarchické shlukování Často se setkáme s případy, kdy není výhodné používat hierarchickou shlukovou analýzu, protože data nevykazují hierarchickou strukturu. V takových případech může být vhodnější použití nehierarchického shlukování, při němž jsou vytvořeny skupiny stejného řádu. Skupiny by měly být uvnitř co nejvíc homogenní a mezi sebou co nejvíce odlišné. Nehierarchické metody shlukování jsou vhodné pro velmi objemná data. Mezi nehierarchické metody shlukování patří metoda k-průměrů, metoda x-průměrů a metoda k-medoidů. 1 Metoda k-průměrů Nejběžnější nehierarchickou metodou je metoda k-průměrů. Hlavním cílem metody je nalezení takových skupin v mnohorozměrném prostoru, kdy vnitroskupinová podobnost je co největší. Princip vytvoření shluků je stejný jako při Wardově metodě: minimalizace celkové sumy čtverců vzdáleností uvnitř skupin. Výsledkem je vytvoření k skupin, které jsou od sebe co nejvíce odděleny. Algoritmus metody je následující: 1. Zvolíme počáteční rozklad do k shluků, nejčastěji náhodně. Podkladem ovšem může být také např. výsledek již provedeného shlukování, který chceme zlepšit. 2. Určíme centroidy pro všechny shluky v aktuálním rozkladu. 3. Postupně zhodnotíme pozici všech objektů. Pokud má objekt nejblíže k vlastnímu centroidu, neměníme jeho přiřazení ke shluku, jinak jej přiřadíme ke shluku, k jehož centroidu má nejblíže. 4. Centroidy každého z k shluků jsou přepočítány. 5. Body 3 a 4 se opakují do té doby, kdy už žádný další přesun nezlepší kritéria. Tímto způsobem se v k skupinách objekty přesouvají tak, aby se minimalizovala variabilita uvnitř skupin a maximalizovala variabilita mezi skupinami (jde o relokační proceduru). Proces je tedy iterativní. Tento algoritmus je základní, existuje ovšem i několik modifikací: 1

Proces lze zahájit s k vybranými objekty, které jsou zvoleny jako centroidy, místo počátečního rozkladu. Pak se dostáváme rovnou ke kroku č. 3. Další postup je již stejný. Přepočet centroidů lze provést po každém přesunu objektu (nikoli tedy jen po každém cyklu). Průběh shlukování a výsledek je pak závislý také na pořadí objektů, ve kterém vstupují do 3. kroku. Nevýhodou metody k-průměrů je, že pracuje se čtverci Euklidovských vzdáleností. To může být v některých případech problém, zejména při výskytu odlehlých objektů. Metoda k-průměrů je citlivá na odlehlé hodnoty. Další nevýhodou metody je nutnost definovat počet skupin k předem. Je potřebné si uvědomit, že takto můžeme získat pouze lokální extrém, o kterém nemáme jistotu, že je zároveň extrémem globálním (Obr. 1). Proto je vhodné provést analýzu pro několik různých počtů skupin k a následně např. určit poměr vnitroskupinové a meziskupinové variability pro všechny analýzy (všechny k) a určit takový počet shluků k, při kterém je poměr vnitroskupinové a meziskupinové variability nejmenší. Existuje řada dalších validačních metod pro určení optimálního počtu shluků, jimž se bude věnovat další kapitola. y y x x Obr. 1 Ukázka rozdělení objektů do shluků nehierarchickou metodou k-průměrů. Výsledek je ovlivněn volbou počtu shluků. Vlevo: počet shluků k = 3 je dobrá volba; vpravo: počet shluků k = 2 je špatná volba. Příklad 1 Metodu k-průměrů představíme na příkladě 32 druhů savců a jejich zubních vzorců. Cílem úlohy je rozdělit savce do shluků právě podle jejich zubních vzorců (Tabulka 1). Analýzu jsme provedli v softwaru Statistica pro různé hodnoty k, konkrétně k = 2, 3, 4,..., 9. Tabulka 1 Zubní vzorce 32 druhů savců. hč = horní čelist, dč = dolní čelist. Incisivi (řezáky) Canini (špičáky) 2 Praemolares (třenové z.) Molares (stoličky) I hč I dč C hč C dč P hč P dč M hč M dč Krtek 3 2 1 0 3 3 3 3 Netopýr hnědavý 2 3 1 1 3 3 3 3 Netopýr stříbřitý 2 3 1 1 2 3 3 3 Netopýr skvrnitý 2 3 1 1 2 2 3 3 Netopýr hnědý 2 3 1 1 1 2 3 3

Netopýr rudohnědý 1 3 1 1 1 2 3 3 Pišťucha 2 1 0 0 2 2 3 3 Králik 2 1 0 0 3 2 3 3 Bobr 1 1 0 0 2 1 3 3 Svišť 1 1 0 0 2 1 3 3 Veverka 1 1 0 0 1 1 3 3 Myš domácí 1 1 0 0 0 0 3 3 Dikobraz 1 1 0 0 1 1 3 3 Vlk 3 3 1 1 4 4 2 3 Medvěd 3 3 1 1 4 4 2 3 Mýval 3 3 1 1 4 4 3 2 Kuna 3 3 1 1 4 4 1 2 Lasice 3 3 1 1 3 3 1 2 Rosomák 3 3 1 1 4 4 1 2 Jezevec 3 3 1 1 3 3 1 2 Vydra severoamerická 3 3 1 1 4 3 1 2 Vydra mořská 3 2 1 1 3 3 1 2 Jaguár americký 3 3 1 1 3 2 1 1 Puma americká 3 3 1 1 3 2 1 1 Lachtan antarktický 3 2 1 1 4 4 1 1 Lachtan kalifornský 3 2 1 1 4 4 1 1 Tuleň kuželozubý 3 2 1 1 3 3 2 2 Rypouš 2 1 1 1 4 4 1 1 Sob 0 4 1 0 3 3 3 3 Wapiti 0 4 1 0 3 3 3 3 Jelen 0 4 0 0 3 3 3 3 Los 0 4 0 0 3 3 3 3 Výsledkem metody k-průměrů je zařazení jednotlivých druhů savců do dvou shluků v případě volby k = 2, do tří shluků pro k = 3, atd. až do devítí shluků pro k = 9 (Tabulka 2). Tabulka 2 Zařazení druhů savců do shluků vytvořených metodou k-průměrů pro k = 2, k = 3,... k = 9. Výsledky jednotlivých analýz jsou uvedeny v příslušných sloupcích. Hodnoty v tabulce označují pořadové číslo shluku. k = 2 k = 3 k = 4 k = 5 k = 6 k = 7 k = 8 k = 9 Krtek 1 3 1 1 3 1 4 1 Netopýr hnědavý 1 2 1 1 3 1 2 1 Netopýr stříbřitý 1 3 1 1 5 4 4 1 Netopýr skvrnitý 1 3 1 1 5 4 4 1 Netopýr hnědý 1 3 1 1 5 4 4 1 Netopýr rudohnědý 1 3 1 1 5 4 4 1 Pišťucha 1 1 2 3 1 2 2 2 Králik 1 1 2 3 1 2 2 2 Bobr 1 1 2 3 1 3 3 2 Svišť 1 1 2 3 1 3 3 2 3

Veverka 1 1 2 3 1 3 3 5 Myš domácí 1 1 2 3 1 3 3 5 Dikobraz 1 1 2 3 1 3 3 5 Vlk 2 2 3 4 3 1 1 4 Medvěd 2 2 3 4 3 1 1 4 Mýval 2 2 3 4 3 1 1 4 Kuna 2 2 3 4 2 5 1 4 Lasice 2 2 3 2 2 5 5 3 Rosomák 2 2 3 4 2 5 1 4 Jezevec 2 2 3 2 2 5 5 3 Vydra severoamerická 2 2 3 2 2 5 5 3 Vydra mořská 2 2 3 2 2 5 5 3 Jaguár americký 2 2 3 2 4 5 5 6 Puma americká 2 2 3 2 4 5 5 6 Lachtan antarktický 2 2 3 4 2 5 8 7 Lachtan kalifornský 2 2 3 4 2 5 8 7 Tuleň kuželozubý 2 2 3 2 2 5 5 3 Rypouš 2 2 3 4 2 5 8 7 Sob 1 3 4 5 6 6 6 8 Wapiti 1 3 4 5 6 6 6 8 Jelen 1 3 4 5 6 7 7 9 Los 1 3 4 5 6 7 7 9 Při první analýze s definovanými dvěma shluky byl soubor savců rozdělen na dravce a ostatní savce. Při dělení souboru na tři shluky je jeden shluk tvořený dravci, druhý shluk kopytníky spolu s netopýry a třetí shluk ostatními savci. Velice vhodné se jeví rozdělení souboru na čtyři shluky - dravce, kopytníky, hmyzožravce (netopýry a krtek) a ostatní savce (hlodavci a zajícovci). Při nastavení s pěti shluky zůstává rozdělení savců do skupin stejné jako v případě čtyř shluků až na shluk dravců, který se rozdělil na dva shluky. Dělení souboru do šesti a více skupin je ze subjektivního pohledu zoologa již zbytečné a např. zařazení krtka s vlkem a medvědem do společného shluku těžko interpretovatelné. Samozřejmě subjektivní názor na počet shluků není dostatečný a proto je možno využít různé metody validace optimálního počtu shluků. Software Statistica poskytuje kromě zařazení objektů do shluků i hodnoty vzdálenosti objektů od centroidů a vzdálenosti mezi centroidy shluků, které mohou být užitečné pro spočítání validačního kriteria. Jako nejvhodnějším podkladem pro rozhodnutí o počtu shluků k se jeví použití některé z validačních metod pro stanovení optimálního počtu shluků v kombinaci s odbornými znalostmi a zkušenostmi vědce. 2 Metoda x-průměrů Jak již bylo uvedeno výše, u nejrozšířenější nehierarchické shlukovací metody k-průměrů nastávají dva hlavní problémy: 1. počet shluků k musí být definován uživatelem a 2. hledání k shluků podléhá lokálnímu minimu. Řešení prvního problému a částečně i druhého problému nabízí metoda x-průměrů. V algoritmu metody x-průměrů se počet shluků vypočítá dynamicky, přičemž je uživatelem zadávána pouze dolní a horní hranice pro k. Algoritmus je tvořen dvěma kroky, které se opakují. 4

1. V prvním kroku je aplikována tradiční metoda k-průměrů pro k shluků (k je nejprve rovno dolní hranici určené uživatelem). 2. V druhém kroku se zjišťuje, zda a kde se má objevit nový centroid, nový shluk. Toho je dosaženo tím, že se některé shluky nechají rozpadnout na dva. Proces začíná tak, že se každý centroid shluku (nazveme jej rodičovský centroid) rozdělí na dva centroidy (dceřiné centroidy) v opačném směru podél náhodně zvoleného vektoru. Poté se pro každou rodičovskou oblast, čili pro každý pár dceřiných centroidů, vypočítá lokální metoda k-průměru pro dva shluky. Hranice rodičovských oblastí se nemění. Srovnáním Bayesovského informačního kriteria (BIC) pro model s dceřinými centroidy a model s rodičovským centroidem se rozhodne o výsledné struktuře. Podle výsledku testu je buď zachován rodičovský centroid (a tedy rodičovský shluk), nebo je nahrazen dceřinými centroidy (tj. dvěma dceřinými shluky). Když k k max (horní hranice určena uživatelem), proces se ukončí a vyhodnotí se nejlepší model v průběhu hledání, tj. sada centroidů s nejlepší hodnotou testového kriteria. Jinak se pokračuje znovu krokem 1. Jako kritérium pro dělení shluku na dva dceřiné shluky může být kromě BIC použito i jiné, např. Akaikovo informační kriterium (AIC). Výhodou tohoto postupu je také fakt, že regionální metoda k-průměrů s pouze dvěma shluky je méně citlivá na lokální minima. 3 Metoda k-medoidů Metoda k-medoidů je velice podobná metodě k-průměrů, s tím rozdílem, že zástupcem středu shluku není centroid, ale tzv. reprezentativní objekt medoid. Další rozdíl mezi metodami k-průměrů a k-medoidů je v metrice (čtverec Euklidovské vzdálenosti u metody k-průměrů, jakákoliv metrika vzdálenosti u metody k-medoidů), kterou se hodnotí vzdálenost objektů od středu shluku, tj. centroidů v metodě k-průměrů a medoidů v metodě k-medoidů. Princip metody k-medoidů je v hledání k reprezentativních objektů, které nazýváme medoidy. Medoid je definován jako objekt shluku, jehož průměrná nepodobnost ke všem objektům v shluku je minimální, tj. je to nejcentrálněji umístěný bod v daném datovém souboru. Shluk je pak definován jako soubor objektů, které jsou přiřazeny ke stejnému medoidu. Metodu k-medoidů můžeme považovat za robustnější obdobu metody k-průměrů. Nejčastější realizací shlukování k-medoidů je algoritmus PAM Partitioning around medoids: 1. Postupně je selektováno k reprezentativních objektů. První objekt je ten, pro který je suma nepodobností ke všem dalším objektům co nejmenší. Tento objekt je umístěn nejvíce centrálně v sadě objektů. Postupně je v každé iteraci vybrán další objekt, který snižuje sumu (přes všechny objekty) nepodobností k nejpodobnějšímu vybranému objektu co nejvíce. Proces pokračuje, až dokud není nalezeno k reprezentativních objektů medoidů. 2. Všechny objekty jsou spojeny s nejbližším medoidem. Míra nepodobnosti/vzdálenosti je definována jakoukoliv platnou metrikou vzdálenosti, nejčastěji Euklidovskou vzdáleností, Manhattanskou vzdáleností, Minkowského vzdáleností, 1 korelace. 3. V druhé fázi algoritmu se zlepšuje sada medoidů a tedy shlukování. To se děje srovnáním všech párů objektů, kde jeden z nich je medoidem a druhý ne. Pro každý medoid m a postupně pro každý objekt o, který není medoidem, se vymění pozice m a o a zjišťuje se hodnota kriteria shlukování pro tuto konfiguraci. Když se zlepší kriterium shlukování, testovaný objekt se stane medoidem místo původního 5

medoidu. Tato procedura se opakuje, dokud již nedochází k žádnému dalšímu zlepšení. Výhody metody k-medoidů: Metoda nevyžaduje původní data, může být aplikována také přímo na matici nepodobnosti. Shlukování je možné na základě jakékoliv metriky vzdálenosti, co může být důležité např. v biologických aplikacích, kdy se může jednat např. o shlukování korelovaných prvků. Medoidy jsou robustními představiteli středů shluků, jsou méně citlivé k odlehlým pozorováním než centroidy v metodě k-průměrů (tato robustnost je důležitá, když objekty nepatří jasně k žádnému shluku). Shlukování není závislé na pořadí objektů v datové matici (s výjimkou případů, kdy existují ekvivalentní řešení, což je velice zřídka). Nevýhodou metody k-medoidů je stejně jako u metody k-průměrů potřeba definovat počet shluků předem. Tento problém lze řešit pomocí koeficientu siluety (silhouette coefficient) nebo jiných metod pro určení optimálního počtu shluků. 4 Seznam použité literatury [1] Hebák, P., Hustopecký, J., Pecáková, I., Průša, M., Řezanková, H., Svobodová, A., Vlach, P. Vícerozměrné statistické metody (3). 2. přepracované vydání, Informatorium, Praha, ISBN 9788073330019 (2007) [2] Lepš, J., Šmilauer, P. Multivariate analysis of ecological data. Faculty of Biological Sciences, University of South Bohemia, České Budějovice. (1999) [3] Podani, J. 2001. SYN-TAX Computer program for data analysis in ecology and systematics. User's Manual. Scientia Publishing, Budapest. (2000) [4] StatSoft, Inc. STATISTICA (data analysis software system), version 7.1. www.statsoft.com. (2005) [5] Urban, D.L. Multivariate analysis in ecology. Nonhierarchical agglomeration. http://www.env.duke.edu/lel/env358/mv_kmeans.pdf (2000) [6] van der Lann, M. J., Pollard, K. S., Bryan, J. A New Partitioning Around Medoids Algorithm. Journal of Statistical Computation and Simulation 73: 575 584. (2002) 5 Další doporučené zdroje [7] Digby, P.G.N., Kempton, R.A. Multivariate analysis of ecological communities. Chapman and Hall, London New York. (1987) [8] Jongman, R.H., ter Braak, C.J.F., van Tongeren, O.F.R. Data analysis in community and landscape ecology. Pudoc, Wageningen. (1987) 6

Obsah Shluková nehierarchická analýza... Chyba! Záložka není definována. Základní informace... 1 Výstupy z výuky Shlukové nehierarchické analýzy... 1 Nehierarchické shlukování... 1 1 Metoda k-průměrů... 1 2 Metoda x-průměrů... 4 3 Metoda k-medoidů... 5 4 Seznam použité literatury... 6 5 Další doporučené zdroje... 6 7