Vytěžování znalostí z dat



Podobné dokumenty
Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Vytěžování znalostí z dat

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Mnohorozměrná statistika

Cvičení 1,2 Osnova studie strategie ICT

Dopravní plánování a modelování (11 DOPM )

Miroslav Čepek

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Self Organizing Map. Michael Anděl. Praha & EU: Investujeme do vaší budoucnosti. 1 / 10 Slef Organizing Map

StatSoft Shlukování podobných

Shluková analýza příklad

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

Vytěžování znalostí z dat

Další příklady. Katedra softwarového inženýrství. Katedra teoretické informatiky, Fakulta informačních technologii, ČVUT v Praze. Karel Müller, 2011

Fakulta chemicko-technologická Faculty of Chemical Technology

Úvod do RapidMineru. Praha & EU: Investujeme do vaší budoucnosti. 1 / 23 Úvod do RapidMineru

V ukázce jsou zalomení řádku signalizována znakem a konce odstavců znakem. Nástroje Vkládání odrážek a číslování v nabídce DOMŮ v sekci ODSTAVEC.

Vícerozměrné statistické metody

Normal mission real time system

Vytěžování znalostí z dat

Martin Flusser. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague. December 7, 2016

Státnice odborné č. 20

Interpretace zkoušek a vytvoření geologického modelu

1 Animace. Kapitola 7: Animace 7

František Hudek. srpen 2012

PREZENTACE DAT: JEDNODUCHÉ GRAFY

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Rezonance v obvodu RLC

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

Polovodičový usměrňovač

Úkoly: 1. Zapojte a nakonfigurujte bezdrátové připojení podle následujícího schématu:

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

VBA: VYTVOŘENÍ OBJEKTU GRAF (CHART) Deklarace proměnné typu Chart. Pro vytvoření nového grafu použijeme kolekci ChartObjects a její metodu Add.

Aplikovaná statistika v R

Řízení robota senzorem teploty II. Tematický celek: Termodynamika. Komplexní úloha - 2. část:

Předzpracování dat. Cvičení 2: Import a příprava dat v Matlabu MI-PDD, 09/2011. Pavel Kordík MI-POA

Miroslav Čepek

Rezonance v obvodu RLC

ORGANIZAČNÍ ŘÁD ČVUT FD

Základní datové struktury III: Stromy, haldy

RELATIONAL DATA ANALYSIS

Vyšetření charakteristik velmi malého povodí v ArcGIS

ORGANIZAČNÍ ŘÁD ČVUT FD

ZPRÁVA Z PRŮMYSLOVÉ PRAXE

Fyzikální praktikum FJFI ČVUT v Praze

František Hudek. srpen 2012

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

Mission ctitical real time system

Cvičná bakalářská zkouška, 1. varianta

CAD_Inventor -cvičení k modelování a tvorbě technické obrazové dokumentace Vytváření sestavy

Autor: Jan Hošek

Vytěžování znalostí z dat

VŠB Technická univerzita Ostrava Fakulta strojní Katedra pružnosti a pevnosti (339) Metoda konečných prvků MKP I (Návody do cvičení)

SOFTWARE PRO ANALÝZU LABORATORNÍCH MĚŘENÍ Z FYZIKY

Nápověda ke cvičení 5

GeoGebra známá i neznámá

Modifikace algoritmu FEKM

JAN JUREK SBĚR DAT V MĚŘÍCÍ TECHNICE. 1) C x - Elyt 10000µF; 25V; TGL 39681;40/085/56;Typ IA. 2) Tranzistor - MOSFET MTP12N10E Vyučující: Ing.

NG C Implementace plně rekurentní

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

9. listopadu Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

Název: Dostředivé zrychlení a dostředivá síla I. Tematický celek: Dynamika hmotného bodu. Úkol:

Semestrální práce Mozaika aneb Co všechno umí pan Voronoi

REZISTIVNÍ DOTYKOVÉ OBRAZOVKY A VYUŽITÍ V UNIVERZÁLNÍM REGULÁTORU Resistive Touch Screens and Usage in a Universal Controller

Soubory. Hung Hoang Dieu. Department of Mathematics Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 7

Facility management audit: nástroj jak udržet společnost konkurence schopnou

Testování a spolehlivost. 4. Laboratoř Spolehlivostní modely 1

Pracovní text a úkoly ke cvičením MF002

Systém eprojekty Příručka uživatele

Nastavení parametrů PID a PSD regulátorů

Local Interconnect Network - LIN

Digitální učební materiál

MODAM Mgr. Zuzana Morávková, Ph.D.

Klepnutím lze upravit styl předlohy. Klepnutím lze upravit styl předlohy. nadpisů. nadpisů. Aleš Křupka.

Cvičení z logiky II.

Základy programování (IZP)

DYNAMICKÉ PROGRAMOVÁNÍ A PROBLÉM BATOHU

Jak vytvořit vlastní ikonu bloku a faceplate v PCS7 V6.x a 7.x

Semestrální práce z KIV/PRO. Využití Voroného diagramu pro inicializaci K-means

Projekt, prezentace, rétorika

CAD_Inventor -cvičení k modelování a tvorbě technické obrazové dokumentace Spirála

František Hudek. červenec 2012

Shluková analýza dat a stanovení počtu shluků

Zápis z 1. zasedání AS FIT ČVUT v Praze

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA

Tlumené a vynucené kmity

Uživatelem řízená navigace v univerzitním informačním systému

Klasifikace a rozpoznávání

Transkript:

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 1/21 Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Cvičení 10: Shlukování BI-VZD, 09/2011 MI-POA Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 2/21 K-means Hierarchické shlukování Osnova cvičení

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 3/21 Načteme si Iris data K-Means K-Means Vložíme K-meansoperátor Nastavíme K=2

K-Means Zapojíme a prohlédneme si výsledky shlukování Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 4/21

K-Means Pro zobrazení dat a jejich příslišnostido clusterů použijeme graf Scatter 3D color Osy budou atributy a1,a3,a4 a barva hodnota atributu cluster Porovnáme hodnoty získané shlukováním s atributem label Vyzkoušíme pro různé hodnoty k: 2,3,4,5 Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 5/21

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 6/21 K=2 K-Means

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 7/21 K=3 K-Means

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 8/21 K=4 K-Means

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 9/21 K-Means Zhodnocení shlukování Pomocí operátoru Cluster Distance Performance spočítáme průměrnou vzdálenost bodu k centroidua Davies Bouldin index

K-Means Úkol Použijte data vygenerovaná operátorem GenerateData s následujícími parametry: Spočítejte within cluster distance (WCD) a Davies Bouldin index (DBI) pro všechny hodnoty K od 2 do 15 Zobrazte graf hodnot WCD a DBI v závislosti na K Jaká je nejlepší hodnota K? Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 10/21

K-Means Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 11/21 Nápověda Použijte operátory Loopparameters, Log a Cluster Distance Performance Pro zobrazení dat z logu použijte typ grafu Series Multiple

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 12/21 Zapojení K-Means Výsledek

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 13/21 K-Means Výsledek

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 14/21 K-Means Výsledek

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 15/21 Hierarchické shlukování Hierarchické shlukování Načteme Iris data Přidáme operátor AglomerativeClustering Zobrazíme dendrogram:

Hierarchické shlukování Vybereme počet shluků a data rozdělíme podle výsledného hierarchického shlukování To odpovídá říznutí dendrogramu v určité hloubce K tomu slouží operátor Flatten Clustering Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 16/21

Postupně nastavíme parametr mode operátoru Aglomerative Clustering na: Single Link Hierarchické shlukování Complete Link Average Link Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 17/21

Hierarchické shlukování Jak se změní dendrogramy? Jak se změní výsledné shlukování pro K=3? Zobrazte jako Scatter 3D Color plot Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 18/21

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 19/21 Hierarchické shlukování Single link

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 20/21 Hierarchické shlukování Completelink

Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2011, Cvičení 10 21/21 Hierarchické shlukování Averagelink