Počítačová analýza vícerozměrných dat

Podobné dokumenty
3.4 Určení vnitřní struktury analýzou vícerozměrných dat

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Fakulta chemicko technologická Katedra analytické chemie

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

PŘÍKLAD 4.5 Chromatografická analýza farmakologických sloučenin Byly měřeny hodnoty R F pro 20 sloučenin s 18 eluenty. Žádné eluční činidlo však nepro

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium

Kvantily a písmenové hodnoty E E E E-02

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

vzorek vzorek

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

S E M E S T R Á L N Í

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Statistika (KMI/PSTAT)

Kanonická korelační analýza

Semestrální práce. 3.1 Matematické principy analýzy vícerozměrných dat

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Korelace. Komentované řešení pomocí MS Excel

Univerzita Pardubice 8. licenční studium chemometrie

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 2. semestr

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

S E M E S T R Á L N Í

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Faktorová analýza (FACT)

Statistická analýza jednorozměrných dat

Úvodem Dříve les než stromy 3 Operace s maticemi

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Modul Základní statistika

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistická analýza. jednorozměrných dat

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Semestrální práce. 2. semestr

Porovnání dvou výběrů

Úloha 1: Lineární kalibrace

KORELACE. Komentované řešení pomocí programu Statistica

Regresní a korelační analýza

Porovnání dvou reaktorů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kalibrace a limity její přesnosti

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Kalibrace a limity její přesnosti

Lineární regrese. Komentované řešení pomocí MS Excel

Optimalizace parametrů hmotnostního detektoru (MS/MS) s využitím vícerozměrných statistických analýz

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

You created this PDF from an application that is not licensed to print to novapdf printer (

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Regresní a korelační analýza

Cvičná bakalářská zkouška, 1. varianta

Analýza rozptylu ANOVA

Klasifikace analýzou vícerozměrných dat

Statistická analýza jednorozměrných dat

S E M E S T R Á L N Í

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE

Reologie tavenin polystyrenových plastů. Závěrečná práce LS Pythagoras

Klasifikace podzemních vod diskriminační analýzou

Příloha č. 1 Grafy a protokoly výstupy z adstatu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Státnice odborné č. 20

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Diagnostika regrese pomocí grafu 7krát jinak

Kalibrace a limity její přesnosti

Ilustrační příklad odhadu LRM v SW Gretl

Statistická analýza jednorozměrných dat

Shluková analýza dat a stanovení počtu shluků

SEMESTRÁLNÍ PRÁCE. Klasifikace analýzou vícerozměrných dat. Ing. Pavel Bouchalík

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

Seminární práce Vypracoval: Ing.Jiří Raška

Obsah: Zadání 3 Průzkumová analýza 5 Symbolové grafy 8 Odhalení struktury ve znacích a objektech 11 Metoda hlavních komponent 16 Shluková analýza 22 Závěr 27 2

Zadání: Při výrobě hyaluronátu sodného pro farmaceutické použití (SH) bylo v roce 23 vyrobeno několik desítek šarží SH. Z tohoto počtu bylo vybráno 83 šarží SH, u kterých je cílem provést jejich podrobnou statistickou analýzu. Data: Zdrojová matice dat má rozměr m = 83, n = 8. Obsahuje hodnoty, které byly stanoveny různými analytickými metodami. Za vypovídající byly zvoleny znaky:, která je stanovena gravimetricky;,5 % vodného roztoku (), které je stanoveno potenciometricky; obsah bílkovin (bílkoviny) stanoveno spektrofotometricky; obsah uronových kyselin (UK) a hyaluronátu sodného () stanoveno spektrofotometricky; kinematická viskozita,5 % vodného roztoku (kin.visk.) stanoveno viskozimetricky na Ubbelohdeho kapilárním viskozimetru; molekulová hmotnost (MW) stanoveno HPLC s detekcí rozptylu světla; obsah nukleových kyselin (nukl.kys.) stanoveno spektrofotometricky. Objekty jsou označeny čísly žádanek o analýzu používaných v analytické laboratoři. objekt [%] bílkoviny [%] UK [%] [%] kin.visk. [cst] MW [MDa] nukl.kys. 61 3,6 6,2,26 46,5 96,1 1,77 1,125,87 62 6,3 6,3,44 46,4 95,9 2,37 1,628,84 63 6,8 6,2,37 46,1 95,2 2,3 1,5,189 64 8,2 5,8,42 48,2 99,6 2,36 1,62,146 65 8,2 6,2,38 48,1 99,4 2,37 1,63,134 66 9,2 6,3,29 48,6,5 2,29 1,573,139 67 6,5 6,3,27 47,6 98,4 2,26 1,552,94 68 5,5 6,3,54 48, 99,2 1,99 1,34,148 69 4,3 6,2,58 47,5 98,1 1,57,89,219 7 3,2 6,2,38 47,9 98,9 1,42,6,219 71 4,5 6,4,39 47,4 98, 1,74 1,9,16 72 7,1 6,2,53 46,3 95,6 2,31 1,587, 74 6, 7,4,35 46, 95,1 2,11 1,44,147 75 9,5 6,5,14 46, 95,1 2,38 1,64, 76 11,6 6,3,47 46,5 96, 2,5 1,71,49 77 3,9 8,9,36 47,9 99,1 2,16 1,4,92 78 5,5 6,4,3 47,8 98,7 2,18 1,49,151 79 1,9 5,4, 46,2 95,5 2,17 1,49,137 12, 6,1,71 47,3 97,8 2,55 1,74,199 81 8,2 6,1,35 45,9 95, 2,46 1,69,229 82 5,2 5,9,67 46,4 96, 2,43 1,67,199 83 8,5 6,3,93 48,1 99,5 2,38 1,64,161 84 5,1 6,2,7 46,1 95,3 2,16 1,478,186 85 6,5 9,3,35 47,5 98,1 1,52,824,229 86 3,6 6,5,34 46,9 96,9 2,5 1,39,157 87 3,3 6,1,86 46,3 95,8 2,37 1,63,139 88 4,5 6,5,32 46,5 96,1 1,5,797,259 89 6,2 7,1,4 46,4 95,9 2,51 1,72,234 91 3,1 6,1,83 48,7,7 1,97 1,31,164 92 4,9 6,1,69 48,3 99,9 2,45 1,6,172 93 2,9 6,4,58 46,9 96,9 2,23 1,53,148 3

objekt [%] bílkoviny [%] UK [%] [%] kin.visk. [cst] MW [MDa] nukl.kys. 94 5,4 6,,92 47,1 97,3 2,5 1,39, 95 9,5 6,,65 47,7 98,6 2,38 1,64,118 96 5,8 6,,18 47,2 97,5 1,52,82,82 97 6,2 6,,37 46,8 96,8 2,1 1,43,117 98 3,9 6,3,27 47,3 97,8 1,46,74,265 8,2 6,4,37 46,1 95,4 2,27 1,56,88 11 7,5 6,3,48 46,4 95,9 2,39 1,64,116 12 8,6 6,5,2 46,9 96,9 2,37 1,63,96 13 6,5 7,7,38 45,9 95, 1,75 1,14,39 14 6,8 7,8,22 47, 97,1 1,85 1,28,192 15 5,5 8,2,43 46,5 96,2 1,68 1,25,295 16 6, 5,9,68 46,3 95,6 1,88 1,24,143 17 5,8 7,2,47 47, 97,1 1,42,6,389 18 4,4 5,9,68 46,3 95,6 1,82 1,178,143 19 2,7 6,6,13 46,6 96,2 2,8 1,42,15 11 5,5 6,7,35 46,9 97, 1,71 1,6,116 113 3,6 6,4,31 46,9 96,9 1,85 1,28,21 114 1,5 6,3,34 46,3 95,7 1,39,641,262 115 7,2 6,6,37 48,4, 2,24 1,538,21 116 1,3 6,,6 46,1 95,2 1,31,52,26 117 9,2 6,2,6 46,3 95,7 2,15 1,47,81 118 4,5 6,1,62 46,7 96,5 2,27 1,559,65 119 19,5 6,6,3 49,8 12,9 2,6 1,398,151 1,8 6,7,49 49,2 11,6 1,88 1,237,256 121 3,7 6,,78 47,9 99,1 1,21,37,443 122 3,6 6,1,71 46,6 96,3 2,39 1,641,2 123 5,7 6,8,75 47,9 98,9 2,39 1,641,99 124 5,1 6,7,48 47,2 97,2 2,22 1,523,89 125 7,1 6,9,47 46,1 95,2 2,29 1,573,88 126 4,1 6,8,3 47,8 98,8 2,43 1,668,49 127 4,1 6,5,63 46, 95,1 2,2 1,51,92 128 9, 5,9,54 47,3 97,7 2,45 1,6,76 129 7, 5,9,39 47,7 98,6 2,26 1,55,115 13 6,2 6,6,64 47,8 98,8 2,27 1,559,121 131 3,5 6,7,35 46,3 95,8 2,19 1,5,85 133 8,3 6,4,95 49,4 12,1 2,3 1,373,144 134 7,6 6,1,16 46,2 95,4 2,19 1,5,145 135 7,1 6,2,12 47,4 98, 2,26 1,552,94 136 8,6 6,1,72 48, 99,3 2,2 1,365,15 137 6, 6,1,67 47,6 98,4 2,32 1,594,15 138 2,9 6,1,92 47,4 98,1 1,26,45,388 139 7,6 6,3,87 48,4, 1,29,49,529 14 3,8 6,1,72 46,7 96,5 1,43,7,254 141 4,1 6,1, 46,7 96,5 1,43,7,265 142 1,5 5,9,62 47,3 97,9 1,44,71,231 143 2,7 6,4,38 47,1 97,3 1,5,797,146 144 3,6 6,5,45 46,4 96, 1,83 1,188,66 145 5,3 6,6,22 46, 95,1 1,76 1,11,15 146 7, 5,5,76 47,6 98,5 2,1 1,356,81 149 5,5 6,5,9 47,6 98,4 2,46 1,69,62 15 4,6 6,6,11 48,6,4 2,55 1,74, 152 4,5 6,4,53 47,3 97,9 2,63 1,79,15 4

Průzkumová analýza: Pro vyšetření statistických zvláštností každého znaku (jako jsou např. symetrie rozdělení, normalita, vybočující hodnoty a homogenita rozdělení) byly zvoleny diagnostiky průzkumové analýzy jednorozměrných dat, a to: histogram, jádrový odhad hustoty, pravděpodobnosti, krabicový graf, graf symetrie. Obr.1a: Statistické diagnostiky průzkumové analýzy dat SH (shora) histogram, jádrový odhad hustoty pravděpodobnosti, krabicový graf a graf symetrie pro znaky (zleva) ztráta sušením,, bílkoviny, UK. 5

Obr.1b: Statistické diagnostiky průzkumové analýzy dat SH (shora) histogram, jádrový odhad hustoty pravděpodobnosti, krabicový graf a graf symetrie pro znaky (zleva), kin.visk., MW, nukl.kys.. Z jednotlivých diagnostik vyplývá, že ve znacích,, MW a nukl.kys. nebyla indikována normalita. Zároveň ve znacích, a nukl.kys. byla zamítnuta homogenita, protože byly nalezeny vybočující body (VB), a to: 1 VB pro znak, 6 VB pro znak a 2 VB pro znak nukl.kys.. Skoro u všech znaků byly také indikovány veliké odchylky od nuly pro šikmost a od tří pro špičatost, což svědčí o asymetričnosti daných znaků. Pro prvotní odhad informací uložených v datech byl sestrojen maticový graf pro všechny párové kombinace znaků. ztrata s bilkovin UK kin.visk MW nukl.kys Obr.2: Maticový graf znaků zdrojové matice SH 6

Vztahy mezi jednotlivými znaky byly vyčísleny lineární regresí výpočtem korelačních koeficientů. Tabulka 1: Korelační matice bílkoviny UK kin.visk. MW,32 bílkoviny -,147 -,315 UK,337,2,223,334,1,229,999 kin.visk.,387 -,97,26,15,15 MW,392 -,73 -,11,6,6,991 nukl.kys. -,147,19,175,73,78 -,627 -,673 Z maticového grafu a hodnot korelačních koeficientů vyplývá, že jediné znaky, které spolu korelují, jsou obsah UK a a další dvojici znaků tvoří kin.visk. a MW. U této dvojice znaků pravděpodobně není vhodné nalezenou závislost prokládat přímkou, ale polynomem, jak vyplývá i z maticového grafu. Ostatní znaky jsou tvořeny nahodilými mraky bodů (tvořených objekty). Pro vystihnutí proměnlivosti každého znaku v objektech byl sestrojen krabicový graf všech znaků, který je uveden na obr.3. Protože znaky mají různá měřítka, bylo potřeba před vlastním sestrojením grafu provést standardizaci dat. Byla zvolena metoda škálování sloupcovým rozsahem. Boxplots Data on - 1 Scale 1..5. ztrata s bílkovin UK kin.visk MW nukl.kys Obr.3: Krabicové grafy pro všechny znaky při použití standardizovaných dat 7

Z obr.3 vyplývá, že největší proměnlivost vykazují znaky bílkoviny, UK,, kin.visk. a MW. Naopak nejmenší proměnlivost vykazuje znak, u kterého však bylo nalezeno 6 vybočujících bodů. Symbolové grafy Pro zobrazení vícerozměrných dat byla zvolena metoda symbolových grafů, kdy jednotlivé znaky jsou kódovány s ohledem na jejich konkrétní hodnoty do určitých geometrických tvarů či symbolů. V tomto případě byl použit: graf tváří (Chernoffovy obličeje znaků), hvězdičkový graf, sluníčkový graf, čárový graf a sloupcový graf. Ikonov ý graf 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 79 81 82 83 84 85 86 87 88 89 91 92 93 94 95 96 97 98 11 12 13 14 15 16 17 18 19 11 113 114 115 116 117 118 119 121 122 123 124 125 126 127 128 129 13 131 133 134 135 136 137 138 139 14 141 142 143 144 145 146 149 15 152 tv ář/šíř = ucho/úrov = polov ina tv áře/v ýš = bílkov iny horní tv ář/exc = UK dolní tv ář/exc = nos/dél = kin.v isk. ústa/stř = MW ústa/zakř = nukl.ky s. Obr.4: Chernoffovy obličeje znaků Z grafu tváří uvedeného na obr.4 lze vypozorovat první podobnosti, ale i rozdílnosti mezi jednotlivými objekty. Např. lze najít jistou podobnost mezi objekty 61, 68, 71 a jinými. Na druhou stranu lze nalézt vyloženě vybočující objekty jako např. 133, 119, které se odlišují svými hodnotami UK, a ztrátou sušením. Podobně je tomu i na dalších symbolových grafech, které jsou uvedeny na následujících obrázcích. 8

Ikonov ý graf (hy aluronát sodný) 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 79 81 82 83 84 85 86 87 88 89 91 92 93 94 95 96 97 98 SH 12 13 14 15 16 17 18 19 11 113 114 115 116 117 118 119 121 122 123 124 125 126 127 128 129 13 131 133 134 135 136 137 138 139 14 141 142 143 144 145 146 149 15 152 Prav otočiv ě: bílkov iny UK kin.v isk. MW nukl.ky s. Obr.5: Hvězdičkový graf Ikonov ý graf (hy aluronát sodný) 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 79 81 82 83 84 85 86 87 88 89 91 92 93 94 95 96 97 98 SH 12 13 14 15 16 17 18 19 11 113 114 115 116 117 118 119 121 122 123 124 125 126 127 128 129 13 131 133 134 135 136 137 138 139 14 141 142 143 144 145 146 149 15 152 Prav otočiv ě: bílkov iny UK kin.v isk. MW nukl.ky s. Obr.6: Sluníčkový graf 9

Ikonov ý graf (hy aluronát sodný) 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 79 81 82 83 84 85 86 87 88 89 91 92 93 94 95 96 97 98 SH 12 13 14 15 16 17 18 19 11 113 114 115 116 117 118 119 121 122 123 124 125 126 127 128 129 13 131 133 134 135 136 137 138 139 14 141 142 143 144 145 146 149 15 152 Zlev a doprav a: bílkov iny UK kin.v isk. MW nukl.ky s. Obr.7: Čárový graf Ikonov ý graf (hy aluronát sodný) 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 79 81 82 83 84 85 86 87 88 89 91 92 93 94 95 96 97 98 SH 12 13 14 15 16 17 18 19 11 113 114 115 116 117 118 119 121 122 123 124 125 126 127 128 129 13 131 133 134 135 136 137 138 139 14 141 142 143 144 145 146 149 15 152 Zlev a doprav a: bílkov iny UK kin.v isk. MW nukl.ky s. Obr.8: Sloupcový graf 1

Odhalení struktury ve znacích a objektech Vnitřní párové vztahy mezi znaky vyšetřovaného souboru byly vyšetřeny za použití rozptylových diagramů a ostatních diagnostik. K tomu bylo potřeba vyšetřit různé kombinace dvou znaků. Některé z vyšetřovaných kombinací jsou uvedeny na obr.9 14. Bodový graf (hyaluronát sodný) 19,5 119 1,8 9, 7,5 6, 4,4 2,9 1,3 76 75 95 117 128 66 12 13683 81 6564 134 SH 139 125 72 135 63 14 146 129 115 13 62 85 67 74 16 89 97 17 96 137 13 15 11 78123 145 68 84 82 94 149 124 92 18 88 118 152 71 15 127 141 69 98 126 77 13144 6112214 113 86 121 87 7 93 91 19 143 138 79 116 114 142 133 95, 95,7 96,5 97,2 97,9 98,6 99,3,,7 11,6 12,9 :: r =,334; p =,2 Obr.9: Rozptylový diagram znaků a Bodový graf (hyaluronát sodný) 9,3 85 8,9 77 8,2 15 7,7 13 14 7,4 7,1 6,7 6,4 6,1 5,8 74 17 89 125 126 123 131 11124 145 19 13 115 15 127 75 144 88 12 86 149 113 93 143 152 71 78 114SH 6276 98 67 68 83 139 66 6384 72 117 61 135 69 7 65 81 134 87 122118 14 141 138137 136 92 91 116 97 9496 95 121 16 18 82 128142 129 64 133 119 5,4 79 146 95, 95,7 96,5 97,2 97,9 98,6 99,3,,7 11,6 12,9 :: r =,1; p =,993 Obr.1: Rozptylový diagram znaků a 11

Bodový graf (hyaluronát sodný),11 15 79 bílkoviny,95,86,76,67,58,47,38,3,22,12 72 125 SH76 62 144 15 89 1363 81 74 114 131 88 134 75 87 84 12214 16 18 82 127 118 116 117 93 145 61 19 141 94 17 124 97 143 86 11 113 14 12 71 85 129 7 77 78 126 67 83 121 146 123 136 137 9513 142 69 128 152 68 96 98 138 149 135 64 65 139 92 115 66 91 133 119 95, 95,7 96,5 97,2 97,9 98,6 99,3,,7 11,6 12,9 :bílkov iny : r =,2287; p =,376 Obr.11: Rozptylový diagram znaků bílkoviny a Bodový graf (hyaluronát sodný) 49,8 119 49,2 133 UK 48,6 48,3 48, 47,7 47,4 47,1 46,8 46,5 46,2 45,9 91 15 66 115 139 92 64 6583 68 136 123 7121 77 78 126 129 95 13 137 149 67 146 69 85 135 71 138 128 98 142 152 124 96 143 94 14 17 12 113 86 93 11 97 118 14 141 19 122 761 88 15 SH 62 89 144 82 16 18 72 114 117 131 87 134 79 116 125 6384 127 145 74 75 13 81 95, 95,7 96,5 97,2 97,9 98,6 99,3,,7 11,6 12,9 :UK: r =,9991; p =, Obr.12: Rozptylový diagram znaků UK a 12

Bodový graf (hyaluronát sodný),529 139,443 121,388 17 138 nukl.kys.,2,229,186,134,89,49 13 15 122 114 88 141 98 14 81 89 14285 69 7 116 82 113 115 63 84 14 92 86 71 83 91 145 74 134 93 78 68 64 79 16 1887 143 65 66 75 72 SH 9711 94 129 95 13 19 152 137 127 12 67 123 136 125 77 117 131 6261 124 135 15 96128 146 144 118 149 76 126 133 119 95, 95,7 96,5 97,2 97,9 98,6 99,3,,7 11,6 12,9 :nukl.ky s.: r =,779; p =,4838 Obr.13: Rozptylový diagram znaků nukl.kys. a Bodový graf (hyaluronát sodný) MW 1,69 1,56 1,44 1,31 1,178 1,25 16 14 18 144 113 61 71 13 145 11 15 76 89 15 126 82 128 92 149 81 62 63 64 12 65 87 75 83 95 122 123 SH 67 6672 93 115 118 125 137 129 135 13 124 117 778 84 79 131 134 127 19 97 74 86 94 119 136 133 68 146 91 152,797,641 69 85 143 88 96 98 17 7 14 141 142 114,49 116 138 139,37 121 1,21 1,39 1,52 1,68 1,82 1,97 2,1 2,22 2,36 2,5 2,63 kin.v isk.:mw: r =,999; p =, kin.v isk. Obr.14: Rozptylový diagram znaků MW a kin.visk. Závěry zjištěné již při průzkumové analýze dat se potvrdily i při sestrojení rozptylových diagramů. Silnou korelaci vykazuje dvojice znaků UK a a dvojice znaků kin.visk. a MW. Vysoké korelační koeficienty pohybující se nad hodnotou,99 svědčí o úzkém vztahu mezi těmito znaky. Z obr.12 vyplývá, že čím vyšší obsah UK tím vyšší obsah byl nalezen. Toto zjištění má svou logické opodstatnění, protože hyaluronát sodný je glykosaminoglykan, který se skládá z jednotek kyseliny D-glukuronové a z (N ) 13

acetylglykosamindisacharidových jednotek. Kyselina D-glukuronová se řadí mezi uronové kyseliny, a proto čím bude větší obsah UK v SH, tím musí být i vyšší obsah v SH. Mezi znaky kin.visk. a MW byla také nalezena silná korelace a i v tomto případě lze najít vztah mezi těmito znaky. Protože SH je polysacharid musí tedy vykazovat jistou závislost mezi kinematickou viskozitou a svou molekulovou hmotností. Jak již bylo řečeno, nalezená závislost by bylo vhodnější proložit polynomem než přímkou. I toto tvrzení má své opodstatnění, protože přímková závislost mezi kin.visk. a MW je typická pro newtonské látky, zatímco SH je tzv. nenewtonská látka, pro kterou je typický polynomický průběh závislosti MW na kin.visk.. Pro úplnost byly vytvořeny i 3D rozptylové grafy aby byla odhalena možná korelace mezi trojicemi znaků. Některé z těchto grafů jsou uvedeny na obr.15-17. 3D bodov ý graf (hy aluronát sodný) 85 77 14 15 119 133 15 115 123126 17 13 91 66 13 74 139 83 92 68 78 149 124 89 7 65 67 152 11 71 121 136 137 69138 98 143 113 8693 131 19 125 12 135 88 95 64 142 144 129 145 114 9694 118122 141 14 6127 128 97 62 75 SH 87 76 146117 72 84 63 116 134 82 16 18 81 79 Obr.15: Rozptylový 3D diagram pro trojici znaků,, 14

3D bodov ý graf (hy aluronát sodný) 15 119 133 79 83 138 149 94 139 87 91 141 146 121 123 136 14 122 84 92 8216 18 95 137 142 13 118 116 127 117 69 93 68 128 152 72 12476 SH 62 144 125 17 64 129 7197 143 63 81 657 114131 89 115 113 86 1188 78 67126 98 61 66 14577 96 12134 7514 135 19 15 74 13 85 Obr.16: Rozptylový 3D diagram pro trojici znaků, UK, bílkoviny 3D bodov ý graf (hy aluronát sodný) 15 152 92 66 119 149 126 12365 83 64 128 95 115 133 137 13 89 76 67 129 12 135 7877 91 82 122 SH 124 81 87 62 93 136 118 68 75 72 146 125 63 9794 131 86 127 134 79 11719 84 74 113 14 71 16 144 11 69 1861 85 7 139 15 96 143142 98 13 145 17 121 8814 141 138 116 114 Obr.17: Rozptylový 3D diagram pro trojici znaků, UK, kin.visk. 15

U 3D grafů nebyla nalezena korelace mezi žádnou trojicí znaků. Např. u obr.17 lze vypozorovat jistou závislost, která je ale vytvořena korelací mezi znaky UK a. Možný příspěvek znaku kin.visk. k celkové korelaci je tedy zanedbatelný. Metoda hlavních komponent K odhalení struktury ve znacích byla použita metoda hlavních komponent (PCA). Počet potřebných hlavních komponent byl zjištěn vyšetřením vlastních čísel v Cattelově indexovém grafu úpatí vlastních čísel. Ten je zobrazen na obr.18. 3.5 Vlastní čísla korelační matice Pouze aktiv. proměnné 3 34,35% 2.5 27,79% 2 Vlast. číslo 1.5 16,79% 1 9,7% 8,11%.5 3,78%,8%,1% -.5 1 2 3 4 5 6 7 8 9 1 Pořadí vl. čísla Obr.18: Cattelův indexový graf úpatí vlastních čísel Datový výstup indexového grafu je uveden v tabulce 2. Tabulka 2: Vlastní čísla korelační matice a související statistiky Pořadí vl. čísla vl. číslo % celk. Kumulativ. vl. číslo Kumulativ. % 1 2,74833 34,35412 2,74833 34,3541 2 2,223431 27,79288 4,971761 62,147 3 1,343555 16,79444 6,315315 78,9414 4,725788 9,7235 7,4113 88,138 5,648698 8,1873 7,6892 96,1225 6,32572 3,78216 7,992374 99,947 7,6727,848 7,99911 99,9888 8,899,1124 8,, 16

Ze zjištěných výsledků vyplývá, že první zlom lze indikovat až u indexu 4 což by ale vyžadovalo veliký počet hlavních komponent (PC). Z tabulky 2 vyplývá, že při použití 4 hlavních komponent tyto první 4 hlavní komponenty objasňují 88 % z celkového rozptylu. Protože však 4. hlavní komponenta má vlastní číslo,726, které je nižší než hodnota 1, která je doporučována jako nejnižší přípustná hodnota pro volbu PC, bylo pro metodu PCA použito prvních tří PC (PC1, PC2, PC3). Tyto PC objasňují kolem 79 % celkového rozptylu, což je dostačující. Další pomůckou k odhalení struktury ve znacích je graf komponentních vah (zátěží). Komponentní váhy pro hlavní komponenty jsou uvedeny na obr.19 21. Projekce proměnných do faktorové rov iny ( 1 x 2) 1.5 Faktor 2 : 27,79% kin.v MWisk. bílkov iny nukl.ky s. -.5-1 UK -1 -.5.5 1 Faktor 1 : 34,35% Aktiv. Obr.19: Graf komponentních vah 1 a 2 Projekce proměnných do faktorové rov iny ( 1 x 3) 1.5 Faktor 3 : 16.79% MW kin.v isk. UK nukl.ky s. -.5 bílkov iny -1-1 -.5.5 1 Faktor 1 : 34.35% Aktiv. Obr.2: Graf komponentních vah 1 a 3 17

Projekce proměnných do faktorové rov iny ( 2 x 3) 1.5 Faktor 3 : 16.79% UK nukl.ky s. MW kin.v isk. -.5 bílkov iny -1-1 -.5.5 1 Faktor 2 : 27.79% Aktiv. Obr.21: Graf komponentních vah 2 a 3 Z obr.19 vyplývá, že vysoce důležité znaky jsou kin.visk., MW, UK a. Tyto znaky mají nejdelší průvodiče a leží nejdále od středu. Nejmenší důležitost má znak. I v tomto případě bylo zjištěno, že dvojice znaků kin.visk., MW a UK a jsou silně pozitivně korelovány. Mezi průvodiči znaků kin.visk. (nebo MW) a bílkoviny se nachází úhel blízký 1, a proto by se dalo říci, že by se mezi těmito znaky dala nalézt negativní korelace. Obdobným způsobem lze popsat i další grafy PC. Sestrojením rozptylového diagramu komponentního skóre lze usuzovat na rozlišení jednotlivých objektů. Tento graf je zobrazen na obr.22. 4 Projekce případů do faktorové rov iny ( 1 x 2) 3 Faktor 2: 27.79% 2 1-1 -2 75 74 125 81 63 131 127 145 134 19 62 7289 84 79 14461 SH 87 76 117 11882 1618 12 979312286 124 14 11 113 152 135 96 128 126 67 71 78 77 94 149 137 129 95 12313146 65 68 64 92 115 136 6683 15 91 13 114 116 15 88 143 14 141 98 142 69 85 17 7 138 121-3 -4 119 133 139-5 -6-7 -5-4 -3-2 -1 1 2 3 4 5 6 Faktor 1: 34.35% Obr.22: Rozptylový diagram komponentního skóre Aktiv. 18

Z obr.22 je patrná jedna podstatná skutečnost. Objekty nejsou rovnoměrně rozptýleny po celé ploše diagramu, což je patrně způsobeno přítomností silně odlehlých objektů v diagramu. Pravděpodobně nejvlivnějšími body jsou objekty 119, 133,, 91, 139, 121, 138. Protože přítomnost těchto silně vybočujících bodů může způsobit zborcení celého rozptylového diagramu komponentního skóre, je vhodnější tyto objekty z testovaného souboru vyloučit. Po jejich odstranění byl získán nový rozptylový diagram komponentního skóre, který je uveden na obr.23. 5 Projekce případů do faktorové rov iny ( 1 x 2) 4 Faktor 2: 23,2% 3 2 1-1 -2-3 15 75 81 76 125 134 63 127 11 117 6272 74 84 82 8789 131 145 79 12 16 118 19 13 144 18 97 122 61 128 152 93 135 124 86 116 94 11113 88 95 67 14 15 114 149 126 137 129 96 146 141 14 64 65 123 13 78 71 143 83 136 6877 98 17 69 92 142 66 115 85 7-4 -5-5 -4-3 -2-1 1 2 3 4 5 6 Faktor 1: 37,12% Aktiv. Obr.23: Rozptylový diagram komponentního skóre po vyloučení silně vlivných objektů V tomto novém diagramu je jasně vidět, že body jsou již lépe rozptýleny po celé ploše diagramu. Z tohoto grafu lze tak vypozorovat některé souvislosti a vztahy v objektech. Jedná se zejména o tyto vztahy: Lze nalézt shluky dat, nacházející se blízko počátku Objekty blízko u sebe (např. 85, 98, 142) jsou si velmi podobné a naopak objekty daleko od sebe (např. 76, 145, 114) jsou si nepodobné Lze nalézt minimálně 4 shluky dat, pro které platí, že objekty umístěné v těchto shlucích jsou si podobné a vzájemně odlišně od objektů v jiných shlucích Osamělé a odlehlé objekty (např. 76) mohou být pravděpodobně vybočující objekty nepodobné ostatním objektům. Pro takto upravený soubor dat (bez vlivných bodů) je tedy vhodné znovu zkonstruovat grafy komponentních vah. Tyto jsou uvedeny na obr.24 26. 19

Projekce proměnných do faktorové rov iny ( 1 x 2) 1,,5 kin.v MWisk. Faktor 2 : 23,2%, bílkov iny nukl.ky s. -,5 UK -1, -1, -,5,,5 1, Faktor 1 : 37,12% Aktiv. Obr.24: Graf komponentních vah 1, 2 po vyloučení silně vlivných objektů Z obr.24 lze vyčíst, že došlo ke zvýšení korelace mezi znaky kin.visk., MW a ztráta sušením. V původních neupravených datech obsahujících i vlivné body byl korelační koeficient mezi znaky kin.visk. a roven hodnotě, 387, zatímco v datech zbavených vlivných objektů se korelace zvýšila na hodnotu,51 a stejně tak je tomu i pro znaky MW a. Tyto hodnoty sice neznamenají nijak silnou korelaci, ale postačují ke konstatování, že došlo ke změně (vzrůstu) korelace mezi zmiňovanými znaky. Původní znak však přispívá do PC2 daleko menší měrou než původní znaky kin.visk. a MW. Projekce proměnných do faktorové rov iny ( 1 x 3) 1,,5 Faktor 3 : 16,3%, UK kin.v MW isk. nukl.ky s. -,5 bílkov iny -1, -1, -,5,,5 1, Faktor 1 : 37,12% Aktiv. Obr.25: Graf komponentních vah 1, 3 po vyloučení silně vlivných objektů 2

second component Projekce proměnných do faktorové rov iny ( 2 x 3) 1,,5 Faktor 3 : 16,3%, UK nukl.ky s. kin.v MWisk. -,5 bílkov iny -1, -1, -,5,,5 1, Faktor 2 : 23,2% Aktiv. Obr.26: Graf komponentních vah 2, 3 po vyloučení silně vlivných objektů I u dalších dvou grafů komponentních vah došlo ke znatelným změnám, což je způsobeno odstraněním vlivných objektů ze souboru dat. Protože bylo prokázáno, že odstranění vlivných objektů je vhodnější, byly následující analýzy provedeny s takto upraveným souborem dat. Sestrojením dvojného grafu tzv. Biplotu lze získat cenné informace o vztazích mezi jednotlivými znaky a objekty. Biplot je zobrazen na obr.27. Principal Components Biplot 2 1-1 -2 75 14 2 15 36 56 633 58 372 51 12 23 62 2126 28 18 13 38 42 52 45 7144 34 53 1 59 kin.visk MW 19 76 ztrata s 3 55 25 64 bilkovin 31 46 47 nukl.kys 4 32 7 74 66 576 33 73 5 54 61 17 UK 11 4 22 65 29 8 16 9 6 49 72 7 24 1 39 27 41 68 67 35 69 43 5 48-3 -3-2 -1 1 first component 2 3 4 Obr.27: Dvojný graf (Biplot) po vyloučení silně vlivných objektů 21

Pro číselné značení objektů v Biplotu sestrojeného v programu SCAN bylo použito tohoto kódování: SCAN 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 žádanka 61 62 63 64 65 66 67 68 69 7 71 72 74 75 76 77 78 SCAN 18 19 2 21 22 23 24 25 26 27 28 29 3 31 32 33 34 žádanka 79 81 82 83 84 85 86 87 88 89 92 93 94 95 96 97 SCAN 35 36 37 38 39 4 41 42 43 44 45 46 47 48 49 5 51 žádanka 98 11 12 13 14 15 16 17 18 19 11 113 114 115 116 117 SCAN 52 53 54 55 56 57 58 59 6 61 62 63 64 65 66 67 68 žádanka 118 122 123 124 125 126 127 128 129 13 131 134 135 136 137 14 141 SCAN 69 7 71 72 73 74 75 76 žádanka 142 143 144 145 146 149 15 152 Z Biplotu je zřetelně vidět, které znaky spolu korelují a které nikoliv. Nejen úhel mezi průvodiči, ale i délka těchto průvodičů přináší cenné informace o jednotlivých komponentních vahách, čili příspěvcích původních znaků do hlavní komponenty. Tak např. je vidět, že objekt s číslem 17 (žádanka č.78) obsahuje obrovský podíl znaku UK a, protože je v bezprostřední blízkosti tohoto znaku a je s ním v interakci. Stejně tak objekty s čísly 4, 46, 47 (žádanky č. 14, 11, 113) obsahují veliký podíl znaku nukl.kys. Podobně lze i ostatním objektům přiřadit příslušné podíly odpovídajících znaků. Shluková analýza Pro nalezení vazeb a struktury v objektech byla zvolena shluková analýza (CLU). Protože tato analýza je velmi citlivá na přítomnost odlehlých objektů, které bortí strukturu dat a mohou způsobit, že nalezené shluky nebudou odrážet skutečnou strukturu analyzovaného souboru, byl pro CLU použit soubor dat po vyloučení silně vlivných objektů. Pro CLU bylo zvoleno metody zobrazení formou vývojového stromu dendrogramu. Pro korelaci mezi znaky byl sestrojen dendrogram podobnosti znaků. Protože znaky mají různé měřítka, byly všechny znaky standardizovány do svého Z skóre (odečtením svého průměru a vydělením svou směrodatnou odchylkou). Dendrogram podobnosti znaků je zobrazen na obr.28. Tento graf odhaluje dvojice znaků, které spolu korelují a jsou si podobné. Tak např. existuje korelace mezi dvojicí znaků kin.visk., MW a dvojicí UK,. K těmto dvojicím znaků pak lze nalézt znaky, které vykazují velmi slabou korelaci ke zmiňovaným dvojicím znaků. 22

14 Str. diagram pro 8 Proměnné Jednoduché spojení Euklid. v zdálenosti 12 1 Vzdálen. spojení 8 6 4 2 nukl.ky s. UK bilkov iny MW kin.v isk. Obr.28: Dendrogram podobnosti znaků standardizovaných do svého Z skóre po vyloučení silně vlivných objektů Pro podobnost objektů byl sestrojen dendrogram podobnosti objektů. Protože v tomto případě je vhodné identifikovat shluky podle vzdálenosti, není standardizace objektů vhodná. K sestrojení dendrogramů podobností objektů byly použity čtyři metody, a to metoda nejbližšího souseda, metoda nejvzdálenějšího souseda, metoda průměrné vzdálenosti a Wardova metoda. Tyto dendrogramy podobnosti objektů jsou uvedeny na obr.29 33. Str. diagram pro 76 případů Jednoduché spojení Euklid. v zdálenosti (dspoj/dmax)* 6 4 2 76 77 85 116 114 79 15 66 115 12 128 95 136 83 65 64 142 7 14 126 15 92 135 146 129 13 123 149 78 68 137 67 98 71 69 143 117 75 152 13 74 97 96 11 17 124 94 125 81 134 11 72 63 16 89 62 127 18 145 84 82 118 19 93 113 86 141 14 88 122 87 131 144 61 Obr.29: Dendrogram objektů vytvořený metodou nejbližšího souseda 23

Str. diagram pro 76 případů Úplné spojení Euklid. vzdálenosti (dspoj/dmax)* 6 4 2 12 128 95 76 115 66 136 83 65 64 81 117 75 134 11 72 125 63 13 74 16 145 84 89 62 77 7 98 71 69 15 92 152 126 13 123 149 78 68 15 14 85 11 17 97 96 124 94 135 146 129 137 67 143 142 116 114 79 141 14 88 127 18 118 82 19 93 113 86 122 87 131 144 61 Obr.3: Dendrogram objektů vytvořený metodou nejvzdálenějšího souseda Str. diagram pro 76 případů Nevážený průměr skupin dvojic Euklid. v zdálenosti (dspoj/dmax)* 6 4 2 76 85 77 15 92 15 14 97 11 17 96 124 94 135 146 129 13 123 149 78 68 137 67 12 128 95 66 115 136 83 65 64 117 75 81 134 11 72 125 63 13 74 89 62 116 114 79 143 142 7 152 126 98 71 69 127 18 16 145 84 118 82 141 14 88 93 113 86 19 122 87 131 144 61 Obr.31: Dendrogram objektů vytvořený metodou párového průměru 24

Str. diagram pro 76 případů Vážený průměr skupin dvojic Euklid. v zdálenosti (dspoj/dmax)* 6 4 2 76 85 77 15 92 152 126 7 98 71 69 97 11 17 96 124 94 13 123 149 78 68 135 146 129 137 67 115 66 136 83 65 64 12 128 95 117 75 81 134 11 72 125 63 15 14 13 74 16 145 84 89 62 116 114 79 143 142 141 14 88 127 18 118 82 19 93 113 86 122 87 131 144 61 Obr.32: Dendrogram objektů vytvořený metodou skupinového průměru Str. diagram pro 76 případů Wardova metoda Euklid. v zdálenosti (dspoj/dmax)* 6 4 2 15 92 77 152 126 7 98 71 69 13 123 149 78 68 135 146 129 137 67 12 128 95 76 66 115 136 83 65 64 81 117 75 134 11 72 125 63 11 17 97 96 124 94 15 14 85 13 74 16 145 84 89 62 143 142 116 114 79 141 14 127 18 88 118 82 19 93 113 86 131 122 87 144 61 Obr.33: Dendrogram objektů vytvořený Wardovou metodou 25

Pozn.: Protože není k dispozici program NCSS2, není možno spočítat koeficient kofenetické korelace a kritérium delta, které by vypovídaly o vhodnosti použitých dendrogramů. K nejlepšímu dendrogramu obvykle vede metoda průměrová, a proto i v tomto případě bude brána jako nejvhodnější. Z dendrogramu objektů vytvořeného metodou skupinového průměru lze odhadnout řadu shluků: první shluk obsahuje 16 objektů 141, 14, 88, 127, 18, 118, 82, 19, 93, 113, 86, 122, 87, 131, 144, 61 druhý shluk obsahuje 5 objektů 116, 114, 79, 143, 142 třetí shluk obsahuje 9 objektů 15, 14, 13, 74, 16, 145, 84, 89, 62 čtvrtý shluk obsahuje 12 objektů 12, 128, 95, 117, 75,, 81, 134, 11, 72, 125, 63 pátý shluk obsahuje 6 objektů 115, 66, 136, 83, 65, 64 šestý shluk obsahuje 1 objektů 13, 123, 149, 78, 68, 135, 146, 129, 137, 67 sedmý shluk obsahuje 6 objektů 97, 11, 17, 96, 124, 94 osmý shluk obsahuje 8 objektů 15, 92, 152, 126, 7, 98, 71, 69 devátý shluk obsahuje 2 objekty 85, 87 desátý shluk obsahuje 2 objekty, 76 Str. diagram pro 83 případů Vážený průměr skupin dvojic Euklid. v zdálenosti (dspoj/dmax)* 6 4 2 119 133 139 115 66 136 83 65 64 76 12 128 95 117 75 81 134 11 72 125 63 15 92 91 85 77 97 11 17 96 124 94 13 123 149 78 68 135 146 129 137 67 15 14 13 74 16 145 84 89 62 142 143 138 152 126 121 7 98 71 69 116 114 79 141 14 88 127 18 118 82 19 93 113 86 122 87 131 144 61 Obr.34: Dendrogram objektů vytvořený metodou skupinového průměru pro soubor dat obsahujících vlivné body 26

Pro úplnost byl sestrojen i dendrogram objektů vytvořený metodou skupinového průměru ze všech objektů, tedy ze souboru dat obsahujících i vlivné body. Ten je uveden na obr.34. Z něj jasně vyplývá jak vlivné body dokáží zbortit celou strukturu dendrogramu. Zejména silně odlehlý objekt 119, který není podobný žádnému z dalších objektů. Tento dendrogram tedy pravděpodobně nevystihuje skutečnou strukturu analyzovaného souboru. Závěr Byla provedena vícerozměrná analýza souboru dat, která za pomoci průzkumové analýzy vícerozměrných dat, metody hlavních komponent a shlukové analýzy dokázala roztřídit objekty do podobných shluků, nalézt korelaci mezi jednotlivými znaky a najít strukturu ve znacích i objektech. 27