Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie



Podobné dokumenty
Semestrální práce. 3.1 Matematické principy analýzy vícerozměrných dat

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Statistická analýza jednorozměrných dat

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

6. Lineární regresní modely

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Partial Least Squares regrese (PLS-R)

Regresní analýza 1. Regresní analýza

Úlohy k přednášce NMAG 101 a 120: Lineární algebra a geometrie 1 a 2,

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

Regresní a korelační analýza

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Univerzita Pardubice 8. licenční studium chemometrie

Regresní a korelační analýza

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

NALG 001 Lineární algebra a geometrie 1, zimní semestr MFF UK Doba řešení: 3 hodiny

11 Analýza hlavních komponet

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

AVDAT Vektory a matice

UNIVERZITA PARDUBICE

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika 1 MA1. 1 Analytická geometrie v prostoru - základní pojmy. 4 Vzdálenosti. 12. přednáška ( ) Matematika 1 1 / 32

AVDAT Geometrie metody nejmenších čtverců

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

U Úvod do modelování a simulace systémů

UNIVERZITA PARDUBICE

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování

Základy popisné statistiky

Podobnostní transformace

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Tvorba nelineárních regresních modelů v analýze dat

Učební texty k státní bakalářské zkoušce Matematika Vlastní čísla a vlastní hodnoty. študenti MFF 15. augusta 2008

vzorek vzorek

Předmět: 1.1 Využití tabulkového procesu jako laboratorního deníku Přednášející: Doc. Ing. Stanislava Šimonová, Ph.D., Doc. Ing. Milan Javůrek, CSc.

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Vícerozměrné statistické metody

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Měření závislosti statistických dat

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Základy maticového počtu Matice, determinant, definitnost

AVDAT Mnohorozměrné metody metody redukce dimenze

Fakulta chemicko technologická Katedra analytické chemie

Všechno, co jste kdy chtěli vědět o maticích, ale báli jste se zeptat

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

PPEL_3_cviceni_MATLAB.txt. % zadat 6 hodnot mezi cisly 2 a 8 % linspace (pocatek, konec, pocet bodu)

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Teorie náhodných matic aneb tak trochu jiná statistika

Tvorba grafů a diagramů v ORIGIN

6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje

Vzorová prezentace do předmětu Statistika

Gymnázium Jiřího Ortena, Kutná Hora

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

PPEL_4_cviceni_MATLAB.txt. % 4. cvičení z předmětu PPEL - MATLAB. % Lenka Šroubová, ZČU, FEL, KTE %

SEMESTRÁLNÍ PRÁCE UNIVERZITA PARDUBICE. Fakulta chemicko - technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Aplikovaná statistika v R

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (8 10 hodin týdně celkem)

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Matematika I 12a Euklidovská geometrie

2. Schurova věta. Petr Tichý. 3. října 2012

Vlastní čísla a vlastní vektory

Bodové a intervalové odhady parametrů v regresním modelu

Determinant matice řádu 5 budeme počítat opakovaným použitím rozvoje determinantu podle vybraného řádku nebo sloupce. Aby byl náš výpočet

Matematika PRŮŘEZOVÁ TÉMATA

Lineární algebra. Matice, operace s maticemi

4EK213 Lineární modely. 5. Dualita v úlohách LP

Soustava m lineárních rovnic o n neznámých je systém

KTE / PPEL Počítačová podpora v elektrotechnice

9.1 Definice a rovnice kuželoseček

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

4EK213 Lineární modely. 4. Simplexová metoda - závěr

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Čtvercové matice. Čtvercová matice je taková matice, jejíž počet řádků je roven počtu jejích sloupců

Interpolace pomocí splajnu

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Plánování experimentu

Tvorba nelineárních regresních modelů v analýze dat

1 Analytické metody durace a konvexita aktiva (dluhopisu) $)*

Transkript:

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.1 Matematické principy vícerozměrných metod statistické analýzy Semestrální práce 2010 RNDr. Markéta Vaňková, Ph.D. Endokrinologický ústav Národní 8, 116 94 Praha 1

Otázka 1 Najděte vlastní (charakteristická) čísla a vlastní vektory, determinant, stopu a odmocninu od této matice 1 2 3 2 8 2 3 2 10 Řešení: matematický software Matlab Odmocnina matice A A=[1 2 3; 2 8 2; 3 2 10] >> sqrtm(a) ans = 0.3214 + 0.3439i 0.5699-0.0625i 0.8379-0.0894i 0.5699-0.0625i 2.7586 + 0.0114i 0.2636 + 0.0162i 0.8379-0.0894i 0.2636 + 0.0162i 3.0393 + 0.0232i Toto je řešení komplexní matice velikosti 3x3. odmocnina je A^(1/2)= suma_{k=1}^3 sqrt(lambda_k) U_kU_k^T kde lambda_k, k=1,...3 jsou vlastní čísla U_k, k=1,...3 jsou odpovídající normované vlastní vektory (sloupce matice U níže) "^T" je operátor transpozice Odmocnina bude opět symetrická matice, zde ovšem Hermitovsky symetrická. Bude splňovat vlastnost A^(1/2)A^(1/2)=A. Stopa matice se většinou značí tr(a) a determinant jako det(a). tr(a)=19, det(a)=-12 Stopa je soucčt prvků na diagonále tj. 19, determinant je -12, 2

Vlastní čísla jsou řešením kubické rovnice jejich numerické řešení je -0.1433 6.7657 12.3776 Vlastní vektory lze též snadno dopočítat. A=[1 2 3; 2 8 2; 3 2 10] [E L]=eig(A) E = -0.9532-0.0143 0.3020 0.1733-0.8444 0.5069 0.2478 0.5355 0.8074 L = -0.1433 0 0 0 6.7657 0 0 0 12.3776 E obsahuje vlastní vektory a L vlastní čísla na diagonále. 3

Otázka 2 Pro typická data z pracoviště, minimálně 4 rozměrná, určete projekci do prvních dvou komponent, dvojný graf a diskutujte jeho význam. Data Soubor 332 žen, sledované parametry: věk Rohrer index poměr porodní hmotnosti a délky BMI body mass index; poměr tělesné hmotnosti v kg na tělesnou výšku v m 2 poměr sval/tuk poměr hmotnosti svaloviny v kg na hmotnost podkožního tuku v kg soubor v excelu: uloha_3.1b.xls program: QCExpert 3.1 Původní data neměla normální rozdělení, byla proto transformována. Byl využit postup založený na kombinaci jedno- a vícerozměrné průzkumové analýzy dat a parametrické transformace s použitím funkcí hledání řešení a řešitel v tabulkovém procesoru Excel, dále došlo k identifikaci vícerozměrných outliers a jejich následnému vyloučení (autor automatizovaného postupu ing. M. Hill). Grafický výstup Graf vysvětleného rozptylu, relativní variabilita vysvětlená jednotlivými komponentami. Komponenty jsou vždy seřazeny tak, že první komponenta vysvětluje největší díl variability, poslední komponenta nejmenší díl. Na ose x jsou pořadová čísla komponenty, na ose y jsou procenta rozptylu vztažená na celkový rozptyl. Čísla nad sloupci udávají rozptyl a kumulativní rozptyl v procentech. První dvě komponenty vysvětlují 72,3 % variability rozptylu. 4

Grafické vyjádření zátěží pro jednotlivé komponenty. Zátěže udávají strukturu jednotlivých komponent. Někdy vystihují komponenty různé rysy dat určené jednou nebo několika proměnnými. Tyto proměnné pak mají v dané komponentě výrazně vyšší absolutní hodnotu zátěže. V první komponentě mají nejvyšší absolutní hodnotu zátěže parametry BMI a poměr sval/tuk, nejmenší pak Rohrerův index. Ve druhé komponentě má parametr Rohrerův index obrovskou převahu nad zbylými parametry. Ve třetí komponentě má nejvyšší absolutní hodnotu parametr věk. Ve čtvrté komponentě mají nejvyšší absolutní hodnotu parametry BMI a poměr sval/tuk. 5

Grafy hlavních komponent jsou rozptylové grafy pro všechny kombinace komponent. Mohou sloužit k posouzení homogenity dat. Biplot je projekce vícerozměrných dat do plochy. Body reprezentují řádky, paprsky odpovídají sloupcům. Při interpretaci grafu se vychází z toho, že aproximace původních dat úměrná vektorovému součinu jednotlivých bodů a úseček (bod reprezentuje konec vektoru s počátkem v bodě (0,0)). Blízké vektory řádků (body) nebo sloupců (paprsky) budou zřejmě vzájemně korelované. Vektory řádků, ležící ve směru některého vektoru sloupce budou mít v tomto sloupci vyšší, resp. nižší hodnoty. Znaménko (smysl vektoru) při tom nehraje roli. Největší korelace je mezi BMI a poměrem sval/tuk, což se v grafu promítá tím, že oba parametry leží na společné přímce a každá z nich směřuje na opačnou stranu. Další významné korelace jsou mezi věkem a BMI a věkem a poměrem sval/tuk. Rohrerův index se zdá být nezávislým parametrem. 6

Závěr První dvě komponenty popisují 72,3 % variability, spolu se třetí komponentou pak 92,5 % variability. Do první komponenty nejvíce prispívají antropometrické parametry jako je BMI a poměr sval/tuk a také věk, který významně koreluje s těmito parametry. Do druhé komponenty nejvíce přispívá Rohrerův index, který vypovídá o porodní velikosti. Porodní velikost (malá nebo naopak velká) je často dávána do souvislosti s nejvyšší dosaženou hmotností v dospělosti a dále také s rizikem rozvoje některých metabolických onemocnění jako je např. diabetes 2 typu. 7