Shluková analýza příklad

Podobné dokumenty
Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

Multivariátní porovnání dat - klastrová (shluková) analýza

DUM VY_52_INOVACE_12CH01

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Anorganické sloučeniny opakování Smart Board

Vícerozměrné statistické metody

Hygienické zabezpečení - desinfekce

Hygienické zabezpečení - desinfekce

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Složení balených vod Státní zdravotní ústav, Praha, 2016

Environmentální výchova

Gymnázium Jana Pivečky a Střední odborná škola Slavičín Mgr. Veronika Prchlíková III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

NÁZVOSLOVÍ SOLÍ. Autor: Mgr. Stanislava Bubíková. Datum (období) tvorby: Ročník: osmý

Fakulta chemicko technologická Katedra analytické chemie

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA

Vytěžování znalostí z dat

Protože je v novém dokumentu kapitola o ochranných nápojích zcela přepracovaná, nabízíme čtenářům návrh části navrženého textu k informaci:

BALNEOLOGIE. Mgr. Jana Stávková Mgr. Jana Petrová

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

DUM VY_52_INOVACE_12CH19


Pitný režim v roce 2010

Žák na základě zjištěných informací dokáže vyslovit argumenty pro pití vody z kohoutku nebo balené vody. Chemický rozbor vody.

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

Vícerozměrné statistické metody

StatSoft Shlukování podobných

SOLI VZNIK PROJEKT EU PENÍZE ŠKOLÁM OPERAČNÍ PROGRAM VZDĚLÁVÁNÍ PRO KONKURENCESCHOPNOST

Vícerozměrné statistické metody

Tabulka 1. Výběr z datové tabulky

Složení a výživové hodnoty

DISPARITY KRAJŮ ČR. Pavla Jindrová Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav matematiky

Solné rekordy. Úkol 1a: Na obrázku 1 jsou zobrazeny nejdůležitější soli. Napiš vzorce kyselin, od nichž se tyto soli odvozují.

SHLUKOVACÍ METODY V DATA MININGU

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

3. HYDROLOGICKÉ POMĚRY

PROSTOROVÉ HIERARCHICKÉ SHLUKOVÁNÍ

II. Chemické názvosloví

HYDROSFÉRA 0,6% 2,14% 97,2%

STATISTICKÉ NÁSTROJE A JEJICH VYUŽITÍ PŘI SEGMENTACI TRHU STATISTICAL TOOLS AND THEIR UTILIZATION DURING THE PROCESS OF MARKETING SEGMENTATION

Gymnázium a Střední odbornáškola, Rokycany, Mládežníků 1115

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Periodická tabulka řádek = perioda sloupec = skupina

Seminář z chemie. RNDr. Jana Fauknerová Matějčková místnost: 617,

NÁZEV ŠKOLY: Základní škola Javorník, okres Jeseník REDIZO: NÁZEV:VY_32_INOVACE_102_Soli AUTOR: Igor Dubovan ROČNÍK, DATUM: 9.,

VĚKOVÁ STRUKTURA OBYVATEL JIHOMORAVSKÉHO KRAJE A JEJÍ ZMĚNY

Příklady oxidy, soli, kyseliny

Vyšší odborná škola, Obchodní akademie a Střední odborná škola EKONOM, o. p. s. Litoměřice, Palackého 730/1

Algoritmy pro shlukování prostorových dat

DUM VY_52_INOVACE_12CH07

Jméno autora: Mgr. Ladislav Kažimír Datum vytvoření: Číslo DUMu: VY_32_INOVACE_18_Ch_OB Ročník: I. Vzdělávací oblast: Přírodovědné

název soli tvoří podstatné a přídavné jméno

Analýzy regionálního trhu práce v České republice Analysis of regional labour market in Czech Republic

Svaz minerálních vod z. s. Celostátní konference Potraviny v hysterii

Názvosloví. Názvosloví binárních sloučenin. Struktura prezentace: DOPORUČENÍ OXIDAČNÍ ČÍSLA. Při cvičení se vzorci a názvy si vždy pište

Oxidační číslo je rovno náboji, který by atom získal po p idělení všech vazebných elektronových párů atomům s větší elektronegativitou.

FYZIKÁLNÍ A CHEMICKÝ ROZBOR PITNÉ VODY

NEALKOHOLICKÉ NÁPOJE. Nealkoholické nápoje

ŘEŠENÍ KONTROLNÍHO TESTU ŠKOLNÍHO KOLA

SOLI. Autor: Mgr. Stanislava Bubíková. Datum (období) tvorby: Ročník: osmý

Anorganické látky v buňkách - seminář. Petr Tůma některé slidy převzaty od V. Kvasnicové

Benchmarking Říčany. projekt Systémová podpora rozvoje meziobecní spolupráce v ČR v rámci území správních obvodů obcí s rozšířenou působností

Kuchyňská sůl = chlorid sodný. Modrá skalice = síran měďnatý SO 4. Potaš = uhličitan draselný K 2 CO 3

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

PROTOKOL O PROVEDENÍ LABORATORNÍ PRÁCE. Pomůcky: Doplňte všechny části plamene kahanu a uveďte, jakou mají teplotu.

Názvosloví anorganických sloučenin

Vodní hospodářství jaderných energetických zařízení

Funkce vody v lidské těle (45-75 %):

Klasifikace obchodních partnerů s využitím metod shlukové analýzy

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Dopravní společnost Zlín - Otrokovice, s.r.o.

Chemické názvosloví anorganických sloučenin 2

NADSTAVBOVÝ MODUL MOHSA V1


Návod k laboratornímu cvičení. Kovy a elektrochemická(beketovova) řada napětí kovů

1.08 Tvrdost vody. Projekt Trojlístek

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

NÁZVOSLOVÍ ANORGANICKÝCH SLOUČENIN

E: Analýza regionálních rozdílů

Názvosloví anorganických sloučenin

10 % DPH + 21 % DPH Receptury vaků all-in-one pro domácí parenterální isokalorickou výživu - cca 1500 ml

Ministerstvo životního prostředí stanoví podle 5 odst. 6 a 30 odst. 4 zákona č. 201/2012 Sb., o ochraně ovzduší (dále jen zákon ):

UNIVERZITA PARDUBICE

1) BEZKYSLÍKATÉ KYSELINY:

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

PROUDĚNÍ PODZEMNÍ VODY. V = k. I

Názvosloví anorganických sloučenin

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Návrhy dalších možností statistického zpracování aktualizovaných dat

Vyšší odborná škola, Obchodní akademie a Střední odborná škola EKONOM, o. p. s. Litoměřice, Palackého 730/1

ZÁKLADNÍ CHEMICKÉ POJMY A ZÁKONY

Vyšší odborná škola, Obchodní akademie a Střední odborná škola EKONOM, o. p. s. Litoměřice, Palackého 730/1

Nealkoholické nápoje

Acidobazická rovnováha 11

KONTROLA A MONITORING CIZORODÝCH LÁTEK V ZEMĚDĚLSKÉ PŮDĚ A VSTUPECH DO PŮDY

Příloha 1/B. Vyhodnocení experimentálních dat Ostravsko


Popisná statistika. Komentované řešení pomocí MS Excel

13. Kolik molů vodíku vznikne reakcí jednoho molu zinku s kyselinou chlorovodíkovou?

Střední průmyslová škola strojnická Vsetín Číslo projektu. Druh učebního materiálu prezentace Pravidla pro tvorbu vzorců a názvů kyselin a solí

Transkript:

Shluková analýza příklad K dispozici jsou údaje o složení vybraných přírodních a minerálních vod. Pracujeme s následujícím seznamem proměnných: Dané hodnoty vznikly tak, že byl zjištěn u všech vod celkový obsah dané látky a vypočítán aritmetický průměr. Tím pak byla dělena každá hodnota příslušné proměnné.

Procedura v SGP: Describe Multivariate Methods Cluster Analysis... Použitá metoda: Metoda nejvzdálenějšího souseda (Kritériem pro spojování shluků je maximum z celkového počtu možných mezishlukových vzdáleností objektů.) Míra vzdálenosti: čtverec euklidovské vzdálenosti Cluster Analysis Data variables: Na (kationty sodne) K (kationty draselne) Mg (kationty horecnate) Ca (kationty vapenate) Cl (anionty chloridove) SO4 (anionty siranove) HCO3 (anionty hydrogenuhlicitanove) Number of complete cases: 13 Clustering: observations Standardized: yes Cluster Summary Cluster Members Percent 1 13 100,00 Centroids Cluster Na K Mg Ca Cl SO4 HCO3 1 1,0 1,00077 1,00077 1,00077 1,0 0,999231 1,0 Centroids průměrná hodnota pro každou proměnnou v každém shluku.

Agglomeration Schedule Combined Combined Previous Stage Previous Stage Next Stage Cluster 1 Cluster 2 Distance Cluster 1 Cluster 2 Stage 1 3 10 0,141088 0 0 4 2 2 11 0,289719 0 0 5 3 5 6 0,483247 0 0 9 4 1 3 0,693114 0 1 6 5 2 12 1,25072 2 0 8 6 1 7 1,86357 4 0 8 7 8 9 2,70437 0 0 11 8 1 2 3,33252 6 5 10 9 5 13 3,90763 3 0 10 10 1 5 10,0024 8 9 12 11 4 8 17,2127 0 7 12 12 1 4 48,2397 10 11 0 Tato tabulka ukazuje, která pozorování byla spojena v každém stupni seskupovacího procesu. Např. v prvním stupni bylo spojeno 3. pozorování s 10., tj. byly seskupeny vody Evian a Rajec. Vzdálenost mezi skupinami byla 0,141088. Poslední sloupec tabulky ukazuje, že další stupeň, ve kterém tato sloučená skupina byla dále sloučena s dalším objektem, je 4. stupeň. 50 Dendrogram Furthest Neighbor Method,Squared Euclidean 40 30 20 10 0 Bonaqua Evian Rajec Ondrasovka Distance Dobra voda Toma Natura Valvert Korunni Mattoni Vittel acka kyselka Podebradka odebradka PL Výstupy z předcházející tabulky jsou graficky znázorněny na výše uvedeném dendrogramu. Ukazuje se zde sloučení všech pozorování až do podoby jednoho shluku. Z výše uvedené tabulky a grafu plyne, že nejprve byly spojeny vody Evian a Rajec, potom Dobrá voda a Toma Natura, ve 3. stupni Korunní a Mattoni, ve 4. stupni byla do shluku, ve kterém je Evian přidána Bonaqua atd.

Podle uvedených hodnot by se mohlo zdát, že by bylo vhodné vytvořit 2 shluky. Agglomeration Schedule Combined Combined Previous Stage Previous Stage Next Stage Cluster 1 Cluster 2 Distance Cluster 1 Cluster 2 Stage 1 3 10 0,141088 0 0 4 2 2 11 0,289719 0 0 5 3 5 6 0,483247 0 0 9 4 1 3 0,693114 0 1 6 5 2 12 1,25072 2 0 8 6 1 7 1,86357 4 0 8 7 8 9 2,70437 0 0 11 8 1 2 3,33252 6 5 10 9 5 13 3,90763 3 0 10 10 1 5 10,0024 8 9 0 11 4 8 17,2127 0 7 0 18 Dendrogram Furthest Neighbor Method,Squared Euclidean 15 12 9 6 3 0 Bonaqua Evian Rajec Ondrasovka Distance Dobra voda Toma Natura Valvert Korunni Mattoni Vittel acka kyselka Podebradka odebradka PL Membership Table Row Label Cluster 1 Bonaqua 1 2 Dobra voda 1 3 Evian 1 4 Hanacka kyselka 2 5 Korunni 1 6 Mattoni 1 7 Ondrasovka 1 8 Podebradka 2 9 Podebradka PL 2 10 Rajec 1 11 Toma Natura 1 12 Valvert 1 13 Vittel 1

Je zřejmé, že první shluk je tvořen vodami Bonaqua, Evian, Rajec, Ondrášovka, Dobrá voda, Toma Natura, Valvert, Korunní, Mattoni a Vittel. Druhý shluk obsahuje vody Hanácká kyselka, Poděbradka a Poděbradka ProLinie. Podíváme-li se na původní hodnoty všech proměnných u jednotlivých vod, vidíme, že vody ve druhém shluku se oproti ostatním výrazně odlišují v hodnotách všech ukazatelů jejich složení. Jiná možnost řešení: Pokud projdeme různé možnosti řešení a podrobně prostudujeme složení vod, dojdeme k závěru, že ideální počet shluků je 5. Cluster Analysis Data variables: Na (kationty sodne) K (kationty draselne) Mg (kationty horecnate) Ca (kationty vapenate) Cl (anionty chloridove) SO4 (anionty siranove) HCO3 (anionty hydrogenuhlicitanove) Number of complete cases: 13 Clustering: observations Standardized: yes Cluster Summary Cluster Members Percent 1 7 53,85 2 1 7,69 3 2 15,38 4 2 15,38 5 1 7,69 Centroids Cluster Na K Mg Ca Cl SO4 HCO3 1 0,0685714 0,152857 0,601429 0,511429 0,0428571 0,328571 0,507143 2 2,68 1,14 2,39 3,02 2,26 0,01 2,84 3 0,88 1,475 0,93 0,975 0,135 1,505 1,04 4 4,005 3,755 1,94 1,72 5,06 2,34 2,04 5 0,07 0,34 0,67 1,02 0,05 2,99 0,45 = Podmíněné průměry pro jednotlivé proměnné. Agglomeration Schedule Combined Combined Previous Stage Previous Stage Next Stage Cluster 1 Cluster 2 Distance Cluster 1 Cluster 2 Stage 1 3 10 0,141088 0 0 4 2 2 11 0,289719 0 0 5 3 5 6 0,483247 0 0 0 4 1 3 0,693114 0 1 6 5 2 12 1,25072 2 0 8 6 1 7 1,86357 4 0 8 7 8 9 2,70437 0 0 0 8 1 2 3,33252 6 5 0

Dendrogram Furthest Neighbor Method,Squared Euclidean 4 3 2 1 0 Bonaqua Evian Rajec Ondrasovka Dobra voda Toma Natura Valvert acka kyselka Korunni Distance Mattoni Podebradka odebradka PL Vittel Membership Table Row Label Cluster 1 Bonaqua 1 2 Dobra voda 1 3 Evian 1 4 Hanacka kyselka 2 5 Korunni 3 6 Mattoni 3 7 Ondrasovka 1 8 Podebradka 4 9 Podebradka PL 4 10 Rajec 1 11 Toma Natura 1 12 Valvert 1 13 Vittel 5 1. shluk: Bonaqua, Dobrá voda, Evian, Ondrášovka, Rajec, Toma Natura, Valvert. 2. shluk: Hanácká kyselka. 3. shluk: Korunní a Mattoni. 4. shluk: Poděbradka a Poděbradka ProLinie. 5. shluk: Vittel. Při pohledu na tabulku s podmíněnými průměry pro jednotlivé proměnné (Centroids), kterými jsou jednotlivé shluky charakterizovány, vidíme, že u prvního shluku jsou typické podprůměrné hodnoty všech zjišťovaných proměnných, u látek Na a Cl jsou hodnoty dokonce velmi nízké. Doplňme, že průměr získaný na základě všech objektů je roven 1. U druhého shluku je hodnota SO 4 2- hodně nízká, hodnota K je blízká průměru a ostatní hodnoty jsou výrazně nadprůměrné.

Třetí shluk vykazuje nízkou hodnotu Cl, mírně nadprůměrné hodnoty u látek K a SO 4 2-, hodnoty zbývajících 4 látek se pohybují kolem průměrné hodnoty. Pro čtvrtý shluk je charakteristické, že hodnoty všech sledovaných látek jsou výrazně nadprůměrné. Pátý shluk se vyznačuje nízkými hodnotami u proměnných Na a Cl a výrazně nadprůměrnou hodnotou proměnné SO 4 2-.