Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

Rozměr: px
Začít zobrazení ze stránky:

Download "Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat"

Transkript

1 Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Statistické zpracování dat Semestrální práce Klasifikace analýzou vícerozměrných dat (Diskriminační analýza, Logistická regrese, Vícerozměrného škálování a Korespondenční analýzu) 2007 Jindřich Freisleben

2 OBSAH 1. KLASIFIKACE OBJEKTŮ PODZEMNÍCH VOD NA ZÁKLADĚ HODNOT ANALYZOVANÝCH UKAZATELŮ ZADÁNÍ KRITIKA DAT NALEZENÍ DISKRIMINAČNÍHO MODELU (Z ANALYZOVANÉHO VÝBĚRU) KLASIFIKACE OBJEKTŮ ZÁVĚR NALEZENÍ STATISTICKY VÝZNAMNÝCH UKAZATELŮ PŘISPÍVAJÍCÍCH K SEPARACI OBJEKTŮ PODZEMNÍCH VOD DO 2 SKUPIN ZADÁNÍ KRITIKA DAT NALEZENÍ LOGISTICKÉHO MODELU VLASTNÍ KLASIFIKACE OBJEKTŮ PREDIKOVANÉ HODNOTY ZÁVĚR POROVNÁNÍ VYBRANÝCH STÁTŮ EVROPSKÉ UNIE NA ZÁKLADĚ HODNOT ZÁKLADNÍCH UKAZATELŮ ZNEČIŠTĚNÍ OVZDUŠÍ ZADÁNÍ KLASICKÉ METRICKÉ VÍCEROZMĚRNÉ ŠKÁLOVÁNÍ (CMDS) NEMETRICKÉ VÍCEROZMĚRNÉ ŠKÁLOVÁNÍ (NNMDS) KORESPONDENČNÍ ANALÝZA (CA) ZÁVĚR LITERATURA A SOFTWARE PŘÍLOHY

3 1. Klasifikace objektů podzemních vod na základě hodnot analyzovaných ukazatelů 1.1 Zadání V rámci monitoringu jakosti podzemních vod existují 3 základní kategorie sledovaných objektů (prameny, mělké vrty a hluboké vrty). Pokusíme se s využitím metody diskriminační analýzy (DA) zjistit u nezařazených analytických rozborů základních ukazatelů nejpravděpodobnější typ objektu podzemních vod, kde byly vzorky odebrány Data Data (viz. Příloha) jsou rozděleny na dva stejně velké výběry: Analyzovaný výběr (slouží k návrhu modelu) a klasifikovaný výběr (slouží k otestování navrženého modelu). Závisle proměnná: Typ objektu (TO) může nabývat 3 hodnot (0 = pramen, 1 = mělký vrt, 2 = hluboký vrt) 16 nezávisle proměnných (znaků, diskriminátorů): ph. ph vody v laboratoři K konduktivita v laboratoři [ms/m] T teplota vody [ C] R oxidačně redukční potenciál [mv] A absorbance (254nm,1cm) M celková mineralizace [mg/l] O2 kyslík rozpuštěný [mg/l] CHSKMn chemická spotřeba kyslíku manganistanem [mg/l] KNK4,5 kyselinová neutralizační kapacita do ph 4,5 [mmol/l] ZNK8,3 zásadová neutralizační kapacita do ph 8,3 [mmol/l] NH4 amonné ionty [mg/l] NO2 dusitany [mg/l] NO3 dusičnany [mg/l] PO4 fosforečnany [mg/l] Cl chloridy [mg/l] SO4 sírany [mg/l] 3

4 1.2 Kritika dat Průzkumová analýza diskriminátorů Tabulka 1: Základní charakteristiky diskriminátorů [2] aritmetický průměr směrodat. odchylka medián šikmost špičatost počet objektů TO ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 P MV HV P MV HV P MV HV P MV HV P MV HV P MV HV Základním předpokladem diskriminační analýzy (DA) je platnost vícerozměrné normality v rámci tříd, nutnou (ne však postačující) podmínkou je normální rozdělení dat pro jednotlivé diskriminátory. Normální rozdělení v rámci základních charakteristik se projevuje blízkými hodnotami aritmetického průměru a mediánu, šikmost blízká 0 popř. špičatost blízká 3. Z tohoto hlediska není normalita splněna u všech znaků. Nejmarkantnější odchylky od normality se objevují u těchto ukazatelů: A, NH4, NO2, NO3, PO4, Cl a SO4. Z ohledem na to je nutné si uvědomit, že data v této úloze by bylo vhodné zpracovat jinou metodou např. Logistickou regresí. Dalším předpokladem DA je podobnost kovariačních matic tříd. Z tohoto vyplývá předpoklad přibližně stejně velkých směrodatných odchylek v rámci jednotlivých tříd. Větší rozdíly jsou u znaků: K, M, Cl a SO4. Nejdůležitější vlastností diskriminátoru je zda dostatečně přispívá k separaci objektů mezi třídami. To lze předpokládat na základě rozdílných hodnot průměrů v rámci jednotlivých tříd. Z ohledem na tuto vlastnost lze předběžně za nevhodné diskriminátory označit: ph, T, CHSKMn, PO4, ale ani další se nejeví ideálně. Zdá se, že lze docílit dobré separace mezi třídou MV (mělké vrty) a ostatními, ale pravděpodobnost pro správné zařazení objektů mezi třídami P (prameny) a HV (hluboké vrty) bude zřejmě nižší. 4

5 1.2.2 Korelace Tabulka 2: Korelační matice znaků [2] ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 ph 1 K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Dalším důležitým předpokladem pro metodu diskriminační analýzy je, že v datech není multikolinearita, tedy 2 a více diskriminátorů nejsou silně korelovány. Jinak totiž lze predikovat jeden diskriminátor z jiného. Není vhodné zejména při užití krokové metody. Silná korelace je mezi diskriminátory: M, K, KNK4.5 M, K a SO4 K a Cl A a CHSKMn Středně silná korelace je mezi diskriminátory: R a O2 A a PO4 M a Cl CHSKMn a ZNK8.3 CHSKMn a PO4 5

6 Graf 1: Maticový diagram silně korelované diskriminátory [2] Maticový graf jen potvrzuje naše hodnocení dat a diskriminátorů u předchozích dvou tabulek. Sledované znaky K, M, KNK4.5, SO4 a Cl lze nahradit jediným z důvodu silné korelace mezi nimi. Stejně tak dvojici znaků A a CHSKMn lze nahradit ze stejného důvodu jediným. U žádného z bodových grafů nelze pozorovat dělení mraku bodů na více shluků, tedy nelze předpokládat že by mezi nimi byl diskriminátor s dobrou separační schopností objektů do tříd. Zároveň tvary většiny histogramů ukazují spíše na rozdělení log-normální. 6

7 Graf 2: Maticový diagram ostatní diskriminátory [2] V maticovém diagramu znaků s nižšími korelacemi se jeví jako nejvhodnější diskriminátor O2, v histogramu je patrné bimodální rozdělení a v bodových grafech kombinací znaků O2 s ph a O2 s ZNK8.3 se mrak bodů trhá na více shluků. Naproti tomu rozdělení znaků NH4, NO2 a NO3 vykazuje jasné zešikmení k nižším hodnotám, což nás vede k závěru o jejich nevhodnosti pro užití v metodě diskriminační analýzy Závěr ke kritice dat Vzhledem k silné korelaci mezi některými znaky a výraznému zešikmení rozdělení u některých dalších, zredukujeme jejich počet. V další analýze budeme již využívat pouze tyto diskriminátory: K, CHSKMn, ph, T, R, O2, ZNK8.3 a NO3. 7

8 1.3 Nalezení diskriminačního modelu (z analyzovaného výběru) Vyšetření vlivu diskriminátorů Tabulka 3: Výběr vhodných diskriminátorů[2] Wilks. Lambda Parc. Lambda F na vyj (2,223) Úroveň p Toler. 1-toler. R^2 O K R CHSKMn NO ph T ZNK krok 6, počet proměnných v modelu: 6; grupovací proměnná: TO (3 skupiny); Wilks. lambda: přibliž F (12,446)= p< V rámci diskriminační analýzy byla užita kroková analýza dopředná. V šesti krocích byly nalezeny znaky s dostatečnou diskriminační silou. Vyřazení znaků, které nenáleží do modelu se provádí s využitím Wilkova kritéria λ, které nabývá hodnot od 0 (výborná diskriminační síla) do 1 (žádná diskriminační síla). Wilkova λ v tabulce odpovídají hodnotě při vypuštění daného znaku, pokud jsou větší než je příslušná hodnota Wilkova kritéria λ (v této analýze ) znamená to, že vypuštěný diskriminátor patří do modelu. Znaky s dostatečnou diskriminační silou jsou: O2, K, R, CHSKMn, NO3 a ph Klasifikační funkce Tabulka 4: Klasifikační funkce [2] G_1:0 (prameny) p = G_2:1 (mělké vrty) p = G_3:2 (hluboké vrty) p = O K R CHSKMn NO ph absolutní člen Tabulka obsahuje odhady neznámých diskriminačních koeficientů klasifikační funkce, která slouží k zařazování nových objektů do tříd. Veličina p je apriorní pravděpodobnost, to je pravděpodobnost, že bude objekt zařazen do dané třídy. 8

9 1.4 Klasifikace objektů Klasifikační matice Tabulka 5: Klasifikační matice [2] % správně zařazených objektů G_1:0 (prameny) G_2:1 (mělké vrty) G_3:2 (hluboké vrty) G_1:0 (prameny) G_2:1 (mělké vrty) G_3:2 (hluboké vrty) Celkem Ověření navržené diskriminační funkce se provádí klasifikací objektů u nichž víme do jaké třídy náleží (klasifikovaný výběr). Z ohledem na hodnoty procentuálního vyjádření správně zařazených objektů v jednotlivých třídách je navržený model nejméně účinný při klasifikaci objektů mělkých vrtů. Naopak nejnižší procento chybně zařazených objektů je v třídě pramenů Chybně zařazené objekty Tabulka 6: Přehled chybně zařazených objektů - Mahalanobisovy vzdálenosti [2] typ objektu prameny mělké vrty hluboké vrty typ objektu prameny mělké vrty hluboké vrty PO0016 pramen VP0635 mělký vrt PO1835 pramen VP0651 mělký vrt PO4006 pramen VP0672 mělký vrt PP0053 pramen VP0692 mělký vrt PP0111 pramen VP0714 mělký vrt PP0115 pramen VP1324 mělký vrt PP0148 pramen VP1576 mělký vrt PP0331 pramen VP1601 mělký vrt PP0378 pramen VP1721 mělký vrt PP0434 pramen VP1724 mělký vrt PP0462 pramen VP1942 mělký vrt PP0496 pramen VP1966 mělký vrt PP0513 pramen VP7005 hluboký vrt PP0540 pramen VP7012 hluboký vrt VB0031 mělký vrt VP7016 hluboký vrt VB0078 mělký vrt VP7215 hluboký vrt VB0095 mělký vrt VP7304 hluboký vrt VB0117 mělký vrt VP7510 hluboký vrt VB0236 mělký vrt VP7524 hluboký vrt VB0271 mělký vrt VP7614 hluboký vrt VB0295 mělký vrt VP7618 hluboký vrt VB0322 mělký vrt VP7710 hluboký vrt VB0401 mělký vrt VP7716 hluboký vrt VB9754 hluboký vrt VP7718 hluboký vrt VO0005 mělký vrt VP7720 hluboký vrt VO0016 mělký vrt VP7722 hluboký vrt VO0089 mělký vrt VP7727 hluboký vrt VP0007 mělký vrt VP7800 hluboký vrt VP0094 mělký vrt VP8206 hluboký vrt VP0119 mělký vrt VP8419 hluboký vrt VP0210 mělký vrt VP8456 hluboký vrt VP0326 mělký vrt VP8503 hluboký vrt VP0478 mělký vrt VP9500 hluboký vrt VP0485 mělký vrt VP9506 hluboký vrt

10 Tabulka obsahuje Mahalanobisovy vzdálenosti klasifikovaných objektů od Z skóre jednotlivých tříd. Objekt je zařazen do třídy, ke které je nejblíže. Vlivem toho že shluky objektů v rámci jednotlivých tříd se částečně prolínají, dochází k chybným zařazením objektů z jedné třídy, které jsou blíže k centru (Z-skóre) třídy jiné. Tabulka 7: Přehled chybně zařazených objektů - Aposteriorní pravděpodobnosti [2] typ objektu prameny mělké vrty hluboké vrty typ objektu prameny mělké vrty hluboké vrty PO0016 pramen VP0635 mělký vrt PO1835 pramen VP0651 mělký vrt PO4006 pramen VP0672 mělký vrt PP0053 pramen VP0692 mělký vrt PP0111 pramen VP0714 mělký vrt PP0115 pramen VP1324 mělký vrt PP0148 pramen VP1576 mělký vrt PP0331 pramen VP1601 mělký vrt PP0378 pramen VP1721 mělký vrt PP0434 pramen VP1724 mělký vrt PP0462 pramen VP1942 mělký vrt PP0496 pramen VP1966 mělký vrt PP0513 pramen VP7005 hluboký vrt PP0540 pramen VP7012 hluboký vrt VB0031 mělký vrt VP7016 hluboký vrt VB0078 mělký vrt VP7215 hluboký vrt VB0095 mělký vrt VP7304 hluboký vrt VB0117 mělký vrt VP7510 hluboký vrt VB0236 mělký vrt VP7524 hluboký vrt VB0271 mělký vrt VP7614 hluboký vrt VB0295 mělký vrt VP7618 hluboký vrt VB0322 mělký vrt VP7710 hluboký vrt VB0401 mělký vrt VP7716 hluboký vrt VB9754 hluboký vrt VP7718 hluboký vrt VO0005 mělký vrt VP7720 hluboký vrt VO0016 mělký vrt VP7722 hluboký vrt VO0089 mělký vrt VP7727 hluboký vrt VP0007 mělký vrt VP7800 hluboký vrt VP0094 mělký vrt VP8206 hluboký vrt VP0119 mělký vrt VP8419 hluboký vrt VP0210 mělký vrt VP8456 hluboký vrt VP0326 mělký vrt VP8503 hluboký vrt VP0478 mělký vrt VP9500 hluboký vrt VP0485 mělký vrt VP9506 hluboký vrt Jiným způsobem klasifikace objektů do tříd je využití hodnot aposteriorních pravděpodobností. Objekt je přidělen ke třídě, pro níž je hodnota pravděpodobnosti vyšší. Je zajímavé, že oba uvedené způsoby klasifikace vedly k chybnému zařazení týchž objektů, přestože u některých došlo k zařazení do odlišné nesprávné třídy Zařazení neznámých objektů Tabulka 8: Klasifikace neznámých objektů - Mahalanobisovy vzdálenosti [2] klasifikace prameny mělké vrty hluboké vrty 1 pramen pramen pramen pramen pramen hluboký vrt hluboký vrt mělký vrt mělký vrt mělký vrt hluboký vrt mělký vrt hluboký vrt mělký vrt

11 1.5 Závěr Data z chemických analýz nebyla shledána jako vhodná pro dostatečně přesné přiřazení objektů podzemních vod s využitím metody lineární diskriminační analýzy (LDA) ke třem základním skupinám. Zvláště procento správně zařazených objektů v rámci třídy mělkých vrtů je dost nízké (pouze 58 %). Příčina může být jednak v tom, že monitorované ukazatele nemají dostatečnou diskriminační sílu a rovněž to že většina z nich vykazuje jiné než normální rozdělení. 11

12 2. Nalezení statisticky významných ukazatelů přispívajících k separaci objektů podzemních vod do 2 skupin 2.1 Zadání Užitím metody logistické regrese určete, u kterých stanovovaných ukazatelů chemického rozboru vody lze výši jejich hodnot pro dva základní typy objektů podzemních vod (prameny a vrty) považovat za statisticky významně rozdílné Data Data v příloze: Tabulka I: Analyzovaný výběr objekty podzemních vod Závisle proměnná: Typ objektu (TO2) může nabývat 2 hodnot (P = pramen, V = vrt) 16 nezávisle proměnných (znaků, diskriminátorů): ph. ph vody v laboratoři K konduktivita v laboratoři [ms/m] T teplota vody [ C] R oxidačně redukční potenciál [mv] A absorbance (254nm,1cm) M celková mineralizace [mg/l] O2 kyslík rozpuštěný [mg/l] CHSKMn chemická spotřeba kyslíku manganistanem [mg/l] KNK4,5 kyselinová neutralizační kapacita do ph 4,5 [mmol/l] ZNK8,3 zásadová neutralizační kapacita do ph 8,3 [mmol/l] NH4 amonné ionty [mg/l] NO2 dusitany [mg/l] NO3 dusičnany [mg/l] PO4 fosforečnany [mg/l] Cl chloridy [mg/l] SO4 sírany [mg/l] 12

13 2.2 Kritika dat Korelace Tabulka 9: Korelační matice prediktorů [2] Abs. 1 Abs. ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Většina metod vícerozměrné analýzy je založena na platnosti různých předpokladů o datech, což snižuje věrohodnost výsledků při zpracování dat, která taková omezení nesplňují. Výhodou metody logistické regrese je, že nemusí být splněny určité předpoklady o datech zejména o jejich rozdělení (tedy ani obvyklá podmínka vícerozměrné normality). Z tohoto důvodu je logistická regrese v určitých případech alternativou k metodě nejmenších čtverců či diskriminační analýze. To nám ovšem nebrání v tom, abychom si prohlédly, které prediktory spolu silněji korelují. 13

14 2.3 Nalezení logistického modelu Iterační přiblížení odhadů parametrů prediktorů Tabulka 10: Iterační výsledky [2] Iterace 0 Iterace 1 Iterace 2 Iterace 3 Iterace 4 Iterace 5 Iterace 6 Iterace 7 Iterace 8 Iterace 9 Abs.člen ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Věrohodnost Zjemňování odhadů parametrů v průběhu iteračního postupu vede ke zvyšování hodnoty věrohodnosti Krokové zavádění prediktorů do logistického regresního modelu Tabulka 11: Věrohodnostní test typu 1 [2] Stupně volnosti Ln- věrohod. Chí- kvadrát p Abs. člen ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO

15 Tabulka 12: Věrohodnostní test typu 3 [2] Stupně volnosti Ln- věrohod. Chí- kvadrát p ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Tabulka 13: Waldův test významnosti odhadů parametrů [2] Stupně volnosti Wald. Stat. p Abs. člen ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Waldův test významnosti prediktorů je považován za nejlepší pro velké výběry dat (tj. optimálně alespoň 20 objektů na 1 testovaný prediktor, minimálně 10 objektů na 1 prediktor), což v našem případě platí, proto vezmeme za rozhodující výsledky Waldova testu. Waldova statistika představuje čtverec poměru odhadu regresního koeficientu a jeho směrodatné odchylky. Pro významné parametry platí, že hodnota pravděpodobnosti p je nižší než hladina 0.05, s kterou počítáme. Statisticky významné prediktory jsou: R (oxidačně-redukční potenciál) A (absorbance při λ 256 nm) O2 (kyslík rozpuštěný) CHSKMn (Chemická spotřeba kyslíku manganistanem) Cl (chloridy) 15

16 Tabulka 14: odhady parametrů a intervaly spolehlivosti odhadů [2] Odhad Dolní LS 95. % Horní LS 95. % Standard chyba Abs.člen ph K T R A M O CHSKMn KNK ZNK NH NO NO PO Cl SO Pokud mezi horní a dolní mezí intervalu spolehlivosti odhadů parametrů leží 0, pak je parametr statisticky nevýznamný. Pokud interval spolehlivosti 0 neobsahuje je parametr významný. Závěry o významnosti parametrů v této tabulce se dobře shodují s výsledky Waldova testu Těsnost proložení logistickým modelem Tabulka 15: Testy těsnosti proložení [2] SV Stat. Stat/sv deviance Deviance v měřítku Pearsonův chí^ P. chí^2 v měř Log-věrohodnost

17 2.4 Vlastní klasifikace objektů predikované hodnoty Klasifikace Tabulka 16: Chybně klasifikované známé objekty [2] Odezva '1' = P Před. Hodnota Lineár. Před. Směrod. Chyba Dolní LS 95. % Horní LS 95. % PB PO PP PP PP PP PP PP PP VP VP VP VP VP VP VP VP VP VP VP VP Odezva představuje skutečnou příslušnost objektu do dané třídy (1 = P tedy pramen a 0 = V tedy vrt) a Před. Hodnota je vypočtená hodnota závisle proměnné, pokud je mezi 0 až 0.5 pak je objekt přiřazen do třídy 0 (vrt), pokud je mezi 0.5 až 1, pak je objekt zařazen do třídy 1 (pramen). Z 69 pramenů bylo chybně zařazeno 9. Ze 162 vrtů bylo chybně zařazeno 12. Graf 3: P-graf reziduí [2] 17

18 V ideálním případě leží body v P-grafu rezidují těsně na přímce. Pokud tomu tak není je to důkaz toho, že nalezený model je přeurčený (redundantní), tedy obsahuje více proměnných než potřebujeme. 2.5 Závěr Metodou Logistické regrese byl nalezen model: TO2 = 7, ,279 ph + 0,239 K 0,052 T + + 0,013 R 56,245 A 0,0046 M + 0,495 O2 + 1,355 CHSKMn 1,571 KNK ,522 ZNK8.3 3,896 NH4 10,008 NO2 2,169 PO4 0,1302 Cl 0,021 SO4. Jako statisticky významné byly na základě Waldova testu shledány tyto parametry: R, A, O2, CHSKMn a Cl. Klasifikací známých objektů bylo chybně přiřazeno 21 ze 321 objektů (tj. 6,5 %) 18

19 3. Porovnání vybraných států Evropské unie na základě hodnot základních ukazatelů znečištění ovzduší 3.1 Zadání Aplikací metod vícerozměrného škálování (MDS) a korespondenční analázy (CA) nalezněte podobnost mezi vybranými státy EU s ohledem na míru znečišťujících látek v ovzduší a spotřebu primárních energetických zdrojů v roce Data Tabulka 17: Data [3] CZ SK PL HU AT DE BE PT EU15 sox nox nh co tzl data odpovídají roku 2003 sox nox nh3 co2 tzl CZ SK PL HU AT DE BE PT EU15 emise oxidů síry [kg/obyvatele] emise oxidů dusíky [kg/obyvatele] emise amoniaku [kg/obyvatele] emise skleníkových plynů [t/obyvatele] tuhé znečišťující látky [kg/obyvatele] Česká republika Slovensko Polsko Maďarsko Rakousko Dánsko Belgie Portugalsko průměr první 15 členů EU 19

20 3.2 Klasické metrické vícerozměrné škálování (CMDS) Nalezení počtu souřadnic (dimenzí) Tabulka 18: Vyšetření vlastních čísel [4] Pořadové číslo Jednotlivé Kumulativní Čárový diagram dimenze Vlastní číslo procento procento vlastních čísel IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII III I I Součet 2.73 Nejostřejší zlom v čárovém diagramu vlastních čísel je u druhé dimenze, tedy otimální počet dimenzí (souřadnic) jsou 2. První 2 dimenze vysvětlují 96,28 % proměnlivosti v datech. Což je zcela postačující Optimalizace výpočtu vzdáleností a těsnost proložení Tabulka 19: Vyčíslení kritéria stress [4] Počet Čtverec dimenzí reziduí Stress Pseudo R Počet vzdáleností 36 Průměr vzdáleností Suma čtverců vzdáleností Suma čtverců vzdáleností okolo jejich průměru Hodnota kritéria stress ukazuje na kvalitu proložení dat modelem. Kvalita proložení je dobrá, jestliže stress < 0,05 a výborná pro stress < 0,01. Pseudo R 2 ukazuje na procento sumy čtverců vzdáleností pro příslušný počet dimenzí. Hodnota vyšší než 80 % je velmi dobrá. Hodnoty stress a Pseudo R 2 pro vybrané 2 dimenze dávají předpoklad výborného proložení modelem. 20

21 Tabulka 20: Těsnost proložení statistickou analýzou reziduí [4] Skutečná Vypočtená Relativní Řádek Sloupec vzdálenost vzdálenost Rezidum rezidum [%] 7 BE 9 EU PL 4 HU AT 6 DE CZ 9 EU CZ 7 BE SK 8 PT CZ 8 PT CZ 2 SK PL 8 PT DE 7 BE AT 7 BE HU 8 PT AT 9 EU DE 9 EU SK 3 PL SK 4 HU PT 9 EU SK 9 EU SK 7 BE BE 8 PT CZ 5 AT CZ 6 DE CZ 3 PL CZ 4 HU SK 6 DE SK 5 AT PL 9 EU HU 9 EU AT 8 PT PL 7 BE HU 7 BE DE 8 PT PL 6 DE PL 5 AT HU 5 AT HU 6 DE Počet dimenzí 2 Suma čtverců vzdáleností Suma čtverců reziduí Stress Pseudo R Kvalita proložení je dána skutečnou vzdáleností vycházející z hodnot v matici proximity (vytvořená z tabulky dat před započetím vlastní analýzy) a vypočtenou vzdálenost s ohledem na vybraný počet dimenzí. Na základě znalosti vzdáleností zjistíme hodnotu kritéria stress a tím i hodnotu pro posouzení těsnosti proložení Mapa objektů Tabulka 21: Tabelární podoba mapy objektů [4] Proměnné Dimenze1 Dimenze2 Dimenze3 Dimenze4 CZ SK PL HU AT DE BE PT EU

22 Tabulka obsahuje hodnoty souřadnic (dimenzí) pro jednotlivé objekty a je vlastně cílem analýzy metodou vícerozměrného škálování. Pro porovnávání podobnosti objektů však je z hlediska názornosti lepší graf mapy objektů. Graf 4: Grafická podoba mapy objektů [4] Již z původních dat je patrné, že Česká republika nelichotivě obsazuje přední místa v rámci hodnocení plynných emisí v EU. Tím více je překvapující, že se však příliš neodlišujeme od průměru původních 15 států unie, jemuž prakticky odpovídají emise v Belgii. Pozitivně ovlivňuje průměr EU Rakousko a Dánsko. Je zajímavé, že oba státy toho dosahují diametrálně odlišným postojem k jaderné energetice. Dánsko využívá jadernou energii na obdobné úrovni jako Česká republika. Naopak negativně ovlivňuje průměr EU Portugalsko a má k němu dále než ČR. Nejpodobnější Portugalsku je Slovensko. Nepodobné ostatním jsou si blízké Polsko s Maďarskem, kteří vedou nelichotivou statistiku emisí oxidů síry. 22

23 3.3 Nemetrické vícerozměrné škálování (NNMDS) Optimalizace výpočtu pořadí vzdáleností a těsnost proložení Tabulka 22: Vyčíslení kritéria stress [4] Počet Percent Rank Proč Čárový graf dimenzí Maintained Stress ukončeno pro stress Min Stress Min Stress Max Iterations Min Stress Min Stress Oproti klasické metodě MDS založené na vzdálenosti mezi objekty, vychází neparametrická MDS z uspořádaných pořadových čísel seřazených vzdáleností mezi objekty. Z ohledem na výsledek čárového diagramu vlastních čísel z analýzy CMDS byly opět použity 2 dimenze. Opět bylo dosaženo velmi nízké hodnoty kritéria stress. Tabulka 23: Porovnání pořadí seřazených skutečných vzdáleností s vypočtenými [4] Skutečná Vypočtená Řádek Sloupec vzdálenost vzdálenost 7 BE 9 EU PL 4 HU AT 6 DE CZ 9 EU CZ 7 BE SK 8 PT CZ 8 PT CZ 2 SK PL 8 PT DE 7 BE AT 7 BE HU 8 PT AT 9 EU DE 9 EU SK 3 PL SK 4 HU PT 9 EU SK 9 EU SK 7 BE BE 8 PT CZ 5 AT CZ 6 DE CZ 3 PL CZ 4 HU SK 6 DE SK 5 AT PL 9 EU HU 9 EU AT 8 PT PL 7 BE HU 7 BE DE 8 PT PL 6 DE PL 5 AT HU 5 AT HU 6 DE

24 Dissimilarities U metody NNMDS nelze porovnávat rezidua v jednotkách vzdálenosti, protože metoda vychází z pořadových čísel a vypočtené vzdálenosti mohou být dost odlišné od zadaných. Cílem NNMDS je optimalizovat vypočítané pořadí vzdáleností, tak aby se co nejvíce blížilo zadanému. Graf 5: Skutečná vs. vypočítaná vzdálenost [4] 1.50 Dissimilarity Fit Plot Distance V grafu jsou patrné 4 shluky bodů reprezentující podobné hodnoty vypočítaných vzdáleností, což v následujícím grafu mapy objektů se projevilo v existenci 4 shluků podobných si objektů Mapa objektů Tabulka 24: Tabelární podoba mapy objektů [4] Proměnné Dimenze1 Dimenze2 CZ SK PL HU AT DE BE PT EU

25 Dim2 Graf 6: Grafická podoba mapy objektů [4] NNMDS Map 0.10 BE EU15 CZ SK PT AT DE PL HU Dim1 Mapa objektů pro metodu NNMDS potvrzuje závěry o podobnosti objektů vyřčené na základě výsledků CMDS. Podobnost států z hlediska emisních ukazatelů znečištění ovzduší: Rakousko a Dánsko, Průměr evropské 15 a Belgie s Českou republikou, Slovensko s Portugalskem, Polsko s Maďarskem. Přehlednost mapy se však zhoršuje, protože podobné objekty se překrývají. 25

26 3.4 Korespondenční analýza (CA) Data Tabulka 25: Data [3] sox nox nh3 co2 tzl CZ SK PL HU AT DE BE PT EU Tabulka dat pro korespondenční analýzu obsahuje totožná data s tabulkou dat pro vícerozměrné škálování, ale je transponovaná, protože CA vyžaduje mít objekty v řádcích a sledované znaky (proměnné) ve sloupcích Profily Tabulka 26: Řádkové profily v % [4] sox nox nh3 co2 tzl Total CZ SK PL HU AT DE BE PT EU Total Tabulka 27: Sloupcové profily v % [4] sox nox nh3 co2 tzl Total CZ SK PL HU AT DE BE PT EU Total

27 3.4.3 Hledání počtu projekčních dimenzí Tabulka 28: Čárový diagram vlastních čísel [4] Počet Individuální Kumulativní dimenzí vlastní číslo % %, Inercie Bar Chart IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII IIIIII II I Suma Počet dimenzí podle čárového diagramu jsou 2. Kumulativní procento je 95,8. Pokud by byla inercie nižší než 50 pro první 2 dimenze, pak by CA nebyla vhodnou metodou pro daná data Příspěvek do inercie a hlavní komponenty Tabulka 29: Zobrazení řádkového profilu a příspěvku inercie [4] Osa Osa Kategorie Kvalita Mass Inercie Souřadnice COR CTR Souřadnice COR CTR 1 CZ SK PL HU AT DE BE PT EU Tabulka 30: První hlavní komponenta na ose 1 [4] Kategorie Mass Inercie Vzdálenost Souřadnice COR CTR Úhel Vlastní číslo 1 CZ SK PL HU AT DE BE PT EU Tabulka 31: Druhá hlavní komponenta na ose 2 [4] Kategorie Mass Inercie Vzdálenost Souřadnice COR CTR Úhel Vlastní číslo 1 CZ SK PL HU AT DE BE PT EU

28 Factor2 (8%) Kvalita je suma hodnot COR obou os a je to díl variability v daném profilu reprodukovaném oběma osami. Hodnota kvality pro SK je menší než u ostatních. Je to jen 0,491 (tedy 49,1 %), což může vést ke zkreslení bodu v grafu. Mass je poměr řádkové a celkové četnosti tabulky. CTR je příspěvek daného profilu do inercie celé osy. COR je koeficient korelace mezi daným profilem a osou. Úhel značí úhel mezi osou a profilem Diagnostické grafy CA Graf 7: Řádkové profily [4] Correspondence Plot DE Legend Rows Columns SK PL 0.03 EU15 HU AT BE CZ PT Factor1 (88%) Jak z grafu řádkových profilů vyplývá metoda CA nedávat zcela shodné výsledky s metodou MDS. Shody s MDS: Belgie má blízko k Evropské 15 a k České republice. Dánsko je vzdáleno od ostatních. Polsko je blízko Maďarsku. Portugalsko je vzdáleno EU15 více než ČR. Rozdíly od MDS: Zejména postavení Slovenska daleko od Portugalska a blízko EU15 je dost odlišné. Také Rakousko je blíže EU15 a Belgii a daleko od Dánska. 28

29 Factor2 (8%) Graf 8: Řádkové a sloupcové profily [4] Correspondence Plot DE tzl Legend Rows Columns co2 SK PL 0.03 nh3 EU15 sox HU AT BE nox CZ PT Factor1 (88%) Vynést řádkové a sloupcové profily do jednoho grafu je zdánlivě nelogické, protože obě skupiny jsou do nové roviny promítnuty z nestejně rozměrných prostorů, proto je nutné nepřikládat poměrům vzdáleností mezi objekty a znaky zásadní význam. Ovšem obecně se dá říci, že objekt blízký některému znaku s ním pravděpodobně souvisí. I v tomto grafu jsou patrné některé oprávněně malé vzdálenosti mezi objekty a znaky: ČR má nejvyšší emise oxidů dusíku z uvedených států. Maďarsko má vysoké emise oxidů síry. Rakousko má v porovnání s ostatními státy nízké emise, ale s výjimkou oxidů dusíku k nimž má v grafu nejblíže. Totéž platí o Dánsko má vyšší hodnoty skleníkových plynů a tuhých znečišťujících látek a k oběma ukazatelům má také nejblíže. Polsko je mezi body označující emise amoniaku, oxidů síry a tuhých znečišťujících látek, což odpovídám vysokých hodnotám těchto druhů emisí pro tento stát. Portugalsko je mezi body pro oxidy síry a dusíku, to rovněž souhlasí s uvedenými daty. 3.5 Závěr Klasické i nemetrické řešení metody vícerozměrného škálování dávaly výsledky v podstatě shodné, ovšem závěry z provedené korespondenční analýzy již zcela totožné nejsou. Přesto je vhodné provádět na stejných datech více analýz s cílem získání ucelenějších informací v nich skrytých. 29

30 Literatura a software [1] ČHMÚ databáze jakosti vody ( [2] STATISTICA 7.0 ( [3] Statistická ročenka životního prostředí České republiky MŽP ČR, Praha [4] NCSS 2000 ( [5] Meloun M., Militký J., Hill M.: Počítačová analýza vícerozměrných dat v příkladech. Academia, Praha [6] Pytela O.: Chemometrie pro organické chemiky. Univerzita Pardubice, skripta, Pardubice

31 Přílohy Tabulka I: Analyzovaný výběr objekty podzemních vod [1] Objekt TO2 TO ph K T R A M O2 CHSKMn KNK4.5 ZNK8.3 NH4 NO2 NO3 PO4 Cl SO4 1 PB0016 P PB0030 P PB0075 P PB0094 P PB0113 P PB0148 P PB0174 P PB0285 P PB0337 P PB0365 P PB0371 P PB0393 P PB0415 P PB0464 P PB0472 P PO0011 P PO0017 P PO0027 P PO1804 P PO3003 P PO4008 P PO4015 P PP0026 P PP0051 P PP0056 P PP0091 P PP0114 P PP0121 P PP0157 P PP0164 P PP0191 P PP0210 P PP0232 P PP0261 P PP0271 P PP0277 P PP0285 P PP0292 P PP0300 P PP0319 P PP0327 P PP0346 P PP0360 P PP0368 P PP0379 P PP0402 P PP0427 P PP0437 P PP0456 P PP0466 P PP0477 P PP0491 P PP0498 P PP0525 P PP0533 P PP0539 P PP0542 P PP0565 P PP0574 P PP0744 P PP0754 P PP0782 P PP0789 P PP0845 P PP0848 P PP0850 P PP0853 P PP0873 P PP0880 P VB0014 V VB0044 V VB0071 V VB0090 V VB0103 V VB0147 V VB0173 V

Klasifikace podzemních vod diskriminační analýzou

Klasifikace podzemních vod diskriminační analýzou Klasifikace podzemních vod diskriminační analýzou Prof. RNDr. Milan Meloun, DrSc., Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice, milan.meloun@upce.cz, a Jindřich Freisleben Český hydrometeorologický

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA

Více

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE LICENČNÍ STUDIUM - STATISTICKÉ ZPRACOVÁNÍ DAT SEMESTRÁLNÍ PRÁCE Ing. Věra Fialová BIOPHARM VÝZKUMNÝ ÚSTAV BIOFARMACIE A VETERINÁRNÍCH

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KLASIFIKACE

Více

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce z 5. soustředění Předmět: 3.5 Klasifikace

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro

Více

SEMESTRÁLNÍ PRÁCE. Klasifikace analýzou vícerozměrných dat. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Klasifikace analýzou vícerozměrných dat. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Klasifikace analýzou vícerozměrných dat Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce je písemným vypracováním zkouškových otázek z okruhu Klasifikace analýzou vícerozměrných dat.

Více

Klasifikace analýzou vícerozměrných dat

Klasifikace analýzou vícerozměrných dat Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Klasifikace analýzou vícerozměrných dat Zdravotní ústav se sídlem v

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Statistické zpracování dat Semestrální práce Interpolace, aproximace a spline 2007 Jindřich Freisleben Obsah

Více

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Interpretují rozdíly mezi předem stanovenými třídami Cílem je klasifikace objektů do skupin Hledáme

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce ze 6. soustředění Předmět: 3.3 Tvorba nelineárních

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Tvorba nelineárních regresních

Tvorba nelineárních regresních Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Tvorba nelineárních regresních modelů v analýze dat Zdravotní ústav

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Kalibrace a limity její přesnosti Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Kalibrace a limity její přesnosti Vedoucí licenčního studia Prof. RNDr. Milan Meloun,

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Semestrální práce Licenční studium Galileo Předmět Nelineární regrese Jiří Danihlík Olomouc, 2016 Obsah... 1 Hledání vhodného

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Plánování experimentu

Plánování experimentu Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu

Více

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy Prof. RNDr. Milan Meloun, DrSc, Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice, milan. meloun@upce.

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium GALILEO a limity její přesnosti Seminární práce Monika Vejpustková leden 2016 OBSAH Úloha 1. Lineární kalibrace...

Více

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

3.4 Určení vnitřní struktury analýzou vícerozměrných dat 3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková

Více

Monitoring vod. Monitoring podzemní voda:

Monitoring vod. Monitoring podzemní voda: Monitoring vod Monitoring podzemní voda:...1 Předprovozní monitoring:...1 Monitoring v rámci provozu...2 Vyhodnocení monitoringu podzemních vod...3 Monitoring povrchová voda:...5 Profil Dubenecký potok

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Univerzita Pardubice SEMESTRÁLNÍ PRÁCE Tvorba lineárních regresních modelů 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Úloha 1 Porovnání regresních přímek u jednoduchého lineárního regresního modelu Porovnání

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství 1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

Statistická analýza. jednorozměrných dat

Statistická analýza. jednorozměrných dat Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v

Více

Kanonická korelační analýza

Kanonická korelační analýza Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle

Více

Tvorba nelineárních regresních modelů v analýze dat

Tvorba nelineárních regresních modelů v analýze dat Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Tvorba nelineárních regresních

Více

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie KALIBRACE A LIMITY JEJÍ PŘESNOSTI Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2016

Více

Tvorba nelineárních regresních modelů v analýze dat

Tvorba nelineárních regresních modelů v analýze dat Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Tvorba nelineárních regresních modelů v analýze dat Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza

Více

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor

Více

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.1 Matematické principy vícerozměrných metod statistické analýzy

Více

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT V OSTRAVĚ 20.3.2006 MAREK MOČKOŘ PŘÍKLAD Č.1 : ANALÝZA VELKÝCH VÝBĚRŮ Zadání: Pro kontrolu

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Semestrální práce. 2. semestr

Semestrální práce. 2. semestr Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet

Více

http: //meloun.upce.cz,

http: //meloun.upce.cz, Porovnání rozlišovací schopnosti regresní analýzy spekter a spolehlivosti Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Chemickotechnologická fakulta, Univerzita Pardubice, nám. s. Legií 565,

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody Prof. RNDr. Milan Meloun, DrSc, Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice, milan.

Více

Vodohospodářské laboratoře, s.r.o.

Vodohospodářské laboratoře, s.r.o. Protokol o zkoušce vody č.1522/12 Vzorkoval : Zdeněk Šulíček Ing. dne 22.5.12-12:05 Datum zahájení/ukončení zkoušek : 22.5.12 / 25.5.12 Typ místa odběru : vodovod Typ rozboru : A3.opakované rozbory Místo

Více

Úloha 1: Lineární kalibrace

Úloha 1: Lineární kalibrace Úloha 1: Lineární kalibrace U pacientů s podezřením na rakovinu prostaty byl metodou GC/MS měřen obsah sarkosinu v moči. Pro kvantitativní stanovení bylo nutné změřit řadu kalibračních roztoků o různé

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce KALIBRACE

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza

Více

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální

Více

Tvorba grafů v programu ORIGIN

Tvorba grafů v programu ORIGIN LICENČNÍ STUDIUM GALILEO STATISTICKÉ ZPRACOVÁNÍ DAT SEMESTRÁLNÍ PRÁCE Tvorba grafů v programu ORIGIN doc.dr.ing.vladimír Pata Univerzita Tomáše Bati ve Zlíně Fakulta technologická Ústav výrobních technologií

Více

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Autor: Přednášející: Prof. RNDr. Milan Meloun, DrS 1. VÝPOČET OBSAHU

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat. 3.5 Klasifikace analýzou vícerozměrných dat

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat. 3.5 Klasifikace analýzou vícerozměrných dat Univerzita Pardubice Fakulta chemicko-technologická Licenční studium Statistické zpracování dat 3.5 Klasifikace analýzou vícerozměrných dat RNDr. Lada Kovaříková České technologické centrum pro anorganické

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice 8. licenční studium chemometrie Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Využití tabulkového procesoru jako laboratorního deníku Vedoucí licenčního studia Prof.

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program: Příklad 2: Obsah PCB v játrech zemřelých lidí Zadání: V rámci Monitoringu zdraví byly měřeny koncentrace polychlorovaných bifenylů vjátrech lidí zemřelých náhodnou smrtí ve věku 40 let a více. Sedm vybraných

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality RNDr. Alena Mikušková FN Brno Pracoviště dětské medicíny, OKB amikuskova@fnbrno.cz Analytické znaky laboratorní metody

Více