Vícerozměrná geometrická analýza dat

Rozměr: px
Začít zobrazení ze stránky:

Download "Vícerozměrná geometrická analýza dat"

Transkript

1 Motto: Všechno není jinak Vícerozměrná geometrická analýza dat Jiří Militký Katedra textilních materiálů Technická Universita Liberec,

2 Obsah Jsou popsány základní problémy vznikající v důsledku použití vícerozměrných dat. Je pojednáno o vybraných projekcích pro obecně korelovaná ádata Jsou uvedeny některé možnosti Jsou uvedeny některé možnosti snižování dimense ve statistické analýze vícerozměrných dat.

3 Problém rozměrnosti I setosa versicolor Základní rys vícerozměrných dat je jejich rozměr (dimense), která komplikuje jak jejich statistickou tak i průzkumovou analýzu. Redukce proměnných řada proměnných má variabilitu na úrovní šumu takže jsou s ohledem na statistickou analýzu nadbytečná. vdatechexistují výrazné lineární vazby (korelace), které jsou způsobeny buď použitím redundantních proměnných nebo vazbami vyplývajícím i z jejich podstaty. Tt Tyto proměnnéě lze častot bez újmy na přesnosti nahradit podstatně menším počtem proměnných, které jsou již nekorelované. virginica

4 Problém rozměrnosti II Prokletí vícerozměrnosti (multivariate curse), které se projevuji již v tom, že počet dat potřebných k zachování stejné přesnosti při odhadu funkce několika proměnných je exponenciálně rostoucí funkcí jejich počtu. Problém tzv. prázdného prostoru, který klade další nároky na zvětšování velikosti výběru. Problém vyjádření vzdálenosti, vd eos, která je třeba pro řadu metod jak průzkumové tak i konfirmativní statistické analýzy dat.

5 Primární data matice (pole) X (n x m) Každý sloupec X představuje jeden znak (proměnnou) Každý řádek X představuje jeden objekt (t.j. měření jako jeden bod v čase, osobu, kus atd.) Objekty řádky Y Data jsou uložena do jedné X Znaky sloupce DATOVÁ MATICE (n x m)

6 Vícerozměrná data Je k dispozici pro n objektů (bodů) celkem m znaků (proměnných) vyjádřených v kardinální škále. Zdrojová matice X má rozměr n m, kde standardně platí, že n je podstatně vyšší než m. Veličina m definuje dimensi problému (určující počet znaků). x.. x Úkoly x x x j 1m x.. x n1 n nj nm.. x... (a) posoudit podobnost objektů resp. jejich tendenci ke shlukování, (b) nalézt vybočující objekty, resp. jejich znaky, (c) stanovit, zda lze použít předpoklad lineárních vazeb, (d) ověřit předpoklady o datech (normalitu, nekorelovanost, homogenitu).

7 Přístupy Standardní analýza vícerozměrných dat je založena na analýze matice dat X. Podobně jako u jednorozměrných výběrů se zde provádí standardní statistická analýza založená na parametrech polohy (vektoru průměrů) a rozptýlení (kovarianční respektive korelační matici). Geometrická analýza vícerozměrných dat nahrazuje již od začátku čísla geometrickými objekty (body, čáry, roviny, obrazce) v definovaném zobrazení. Začíná se představou dat jako shluku bodů v Euklidově m rozměrném prostoru E m. Nejde přitom pouze o zobrazení dat ale zejména kvantitativní zkoumání vzájemných vazeb a souvislostí. Základem je tzv. Euklidovský shluk, což je vlastně matice X vyjádřena jako shluk bodů v Euklidově prostoru.

8 Postup analýzy I Před vlastní aplikací vhodné metody vícerozměrné statistické analýzy je třeba vždy provést étexploratorní (průzkumovou) ů analýzu dat, která umožňuje (a) posoudit podobnost objektů pomocí rozptylových a symbolových grafů. (b) nalézt vybočující objekty, resp. jejich znaky, (c) stanovit, zda lze použít předpoklad lineárních vazeb, (d) ověřit předpoklady o datech (normalitu, nekorelovanost, homogenitu). Jednotlivé techniky k určení vzájemných vazeb se dále dělí podle toho, zda se hledají (a) struktura a vazby ve znacích nebo (b) struktura a vazby v objektech:

9 Postup analýzy II 1) Struktury ve znacích v metrické škále:faktorová analýza FA, analýza hlavních komponent PCA a shluková analýza analýza hlavních komponent PCA a shluková analýza. () Struktury v objektech v metrické škále: shluková analýza. (3) Struktury v objektech v metrické i v nemetrické škále: vícerozměrné škálování. (4) Struktury v objektech v nemetrické škále: korespondenční analýza. Většina metod vícerozměrné statistické analýzy umožňuje zpracování lineárních vícerozměrných modelů, kde závisle proměnné se uvažují jako lineární kombinace nezávisle proměnných, resp. vazby mezi proměnnými jsou lineární. V řadě případů se také uvažuje normalita metrických proměnných.

10 Předzpracování dat I Lineární transformace centrování, škálování, standardizace (z skóre) x μ x / σ Omezuje vliv různých jednotek uznaků Nelineární - logaritmická transformace 1. Omezení vlivu extrémních dat ( x μ ) / σ. Omezení vlivu sešikmení rozdělení k vyšším hodnotám 3. Stabilizace rozptylu (omezení heteroskedasticity) Pořadová transformace - (hodnoty jsou nahrazeny pořadími).

11 Lineární transformace I Standardní PCA využívá sloupcové škálování dat (kovarianční matice). Standardizace vede k ke korelační matici R. Diference souvisí s různým vážením. Pro centrovaná data jsou sloupce X váženy " úměrně jejich délce (směrodatná odchylka v původních datech). Pro standardizovaná data jsou sloupce X váženy " na jednotkovou délku. Centrování se volí pro případ různých ů ýhjd jednotek tk jednotlivých znaků.

12 Lineární transformace II Centrování odstraňuje absolutní člen a snižuje tak počet č fk faktorů. ů Konfigurace dat se nemění. Posouvá se pouze počátek. Standardizace odstraňuje závislost na jednotkách a odstraňuje heteroskedasticitu. Má vliv na odhady parametrů (vážená metoda nejmenších čtverců). Je nevhodná pokud jsou některé znaky na úrovni šumu (zvyšuje se jejich význam). centrovaná data normovaná data

13 Lineární transformace III Centrování. Standardizace

14 Vícerozměrné zobrazení Techniky umožňujících grafické zobrazení ve dvourozměrném resp. třírozměrném souřadnicovém systému Identifikace objektů nebo jejich složek, které se jeví jako vybočující Indikace různých struktur v datech, které ukazují na ht heterogenitu použitého výběru nebo přítomnost bodů s odlišným chováním.

15 Vícerozměrná průzkumová analýza Většina metod zobrazení vícerozměrných dat patří do jedné ze dvou základních skupin: zobecněné rozptylové diagramy symbolové grafy.

16 Objekty Profily Každý objekt x i je charakterizován m vertikálními i úsečkami nebo sloupci. Jejich velikost je úměrná hodnotě Znaky odpovídající složky x ij j = 1,..., m. Na x-ovou osu se vynáší index dané složky j. Profil vzniká spojením koncových bodů těchto úseček. Je vhodné použít škálované znaky Profily jsou jednoduché a snadno lze tedy identifikovat vybočující složku objektu, respektive skupiny objektů, s prakticky shodným chováním.

17 Latentní proměnné První hlavní komponenta Směr odpovídá maximu variability Ke zjednodušení interpretace a omezení artefaktů se používá rozptylových grafů v modifikovaných souřadnicích, které souvisí se zavedením tzv. latentních proměnných Často jsou využívány techniky založené na metodě hlavních komponent, která je vhodná pro případy, kdy jsou sloupce matice X silně korelovány. Druhá hlavní komponenta

18 Latentní proměnné II Vhodné jsou dynamické grafy hlavních komponent umožňující rotaci a otáčení.

19 Vícerozměrná geometrie Představa že data leží v hyper-krychli na diagonálním vektoru v vycházejícím ze středu a končícím v jejím rohu. Úhel mezi tímto vektorem a souřadnicovou osou e i je roven cosθ = i v * e i ± 1 = v * e m Pro dostatečně vysoké m vyjde tento kosínus přibližně roven nule a tedy, diagonální vektory budou přibližně kolmé na všechny souřadné osy. Při použití rozptylových diagramů se pak shluky bodů ležících ve směru těchto diagonálních vektorů promítnou do počátku a nebude je možné je identifikovat. i

20 Koncentrace objemu Fenomén koncentrace objemu není zřejmý z klasického 3 dimensionální geometrie. Objem hyper-koule poloměru r v m rozměrném m / prostoru Vk π = r Γ( m / + 1) Objem hyper krychle o velikosti strany r m m Vh = * r Hyper- koule vepsaná do hyper-krychle. Poměr objemů je roven m / Vk = π 0 pro Vh Γ m + m m * ( / 1) Objem hyper-krychle se koncentruje v rozích a střední část je málo obsazená m

21 Poměr objemů Vliv dimense prostoru na poměr objemů krychle a vepsané koule. Je patrné, že už pro m = 8 je objem koule zanedbatelně malý vůči objemu krychle. Data ve vícerozměrném prostoru se bd budou koncentrovat tspíše v oblasti konců než středu a bude potřeba mít dostatečně veliké výběry aby se data významnou měrou vyskytovala i o oblastech blízko módu.

22 Vícerozměrné normální rozdělení I Dobře je to patrné při použití vícerozměrného normálního rozdělení s nulovým vektorem středních hodnot a jednotkovou kovarianční maticí. Na obrázku je znázorněna závislost velikosti distribuční funkce vícerozměrného stadardizovaného normálního rozdělení v místě x= (1, 1,1.1) na velikosti m.

23 Vícerozměrné normální rozdělení II V centrální oblasti se výrazně snižuje pravděpodobnost db výskytu náhodné veličiny Naopak, v oblasti konců rozdělení tato pravděpodobnost výrazně roste. Na obrázku je znázorněna závislost velikosti distribuční funkce vícerozměrného stadardizovaného normálního rozdělení v místě x= (,,.). Je opět patrný pokles pravděpodobnosti s růstem m, který demonstruje, že se objem hromadí v oblasti krajů.

24 Vícerozměrné normální rozdělení III Zpředpokladů nezávislých složek náhodného vektoru x majícího standardizované vícerozměrné normální rozdělení resultuje známý výsledek, že součet čtverců složek má chí kvadrát rozdělení. x m = i= 1 x i Protožejestřední hodnota rovna nulovému vektoru definuje tato norma čtverec vícerozměrné vzdálenosti. Pro výpočet pravděpodobnosti výskytu vícerozměrné náhodné veličiny v hyper kouli s počátkem v nule a poloměrem r pak platí, že. P ( x χ m m r ) = P ( χ r )

25 Vícerozměrné normální rozdělení IV Na obrázku je závislost výskytu vícerozměrné ě normálně ě rozdělené náhodné veličiny v oblasti o poloměru 3 na dimensi náhodné veličiny. Je patrný rychlý pokles směrem k nule. To ukazuje, že pro případy od m=8bude třeba počítat s tím, že výskyt hodnot jednotlivých objektů v oblastí středu je málo pravděpodobný. Může se tedy snadno stát, zejména pro menší m, že celý výběr bude ležet v oblasti konců. Proti běžné intuici zde tedy dochází k výraznému posílení vlivu konců rozdělení na úkor centra. Paradoxy rozměrnosti

26 Redukce proměnných V řadě případů lze zjistit, že rozměrnost vektoru objektu je silně ovlivněna šumy, nepřesnostmi a nevýznamnými znaky. Pak je logické hledat redukovanou velikost m, tedy omezený počet č znaků. Pro případ zobrazení dat se spíše hledá vhodná projekce resp. se původní znaky nahrazují latentními proměnnými, které jsou jejich lineární kombinací ale jsou vzájemně nezávislé

27 Lineární projekce D vektory X v jednotkové kružnici s vektorem průměrů (1,1). Transformace typu Y = A*X, A (x) matice Y Y = a a a a * X X 1 Dochází ke škálování a rotaci. Vzdálenosti mezi vektory se mění: y 1 -yy x 1 -xx

28 Projekce dat (PCA) x α cos α = cos α = x T z ((x T x)*(z T z)) 1/ (x T x) (p T p) p=k*z Obyčejně se pro D projekci volí první dvě hlavní komponenty, Výhodou je, že tyto projekce zachovávají vzdálenosti a úhly mezi jednotlivými objekty. Nevýhodou hlavních komponent je fakt, že není nikterak zohledněna potřeba optimální projekce s ohledem na odkrytí struktur v datech. Tuto nevýhodu odstraňují techniky lineární projekce vícerozměrných dat (projection pursuit), optimalizující zvolený index projekce IP(C i ). Formálně se tedy hledají vektory projekce C i, maximalizující funkci IP(C i )přiomezení C it C i =1. Projekce na tyto vektory je pak C it X. x, cos( α ) = c yc d( x )* d( y ) = c c r z

29 3 Projekce dat (PP) Index IP, odpovídající metodě - hlavních h komponentje T T IP( C) = max( Ci SCi ) pro Ci Ci = 1-3 S je výběrová kovarianční matice. Možná robustní varianta. C i splňující podmínku maxima je vlastním vektorem matice S kterému odpovídá i-té největší vlastní číslo λ i, i =1,. Navíc jsou C 1 a C ortogonální. Index IP(C) odpovídá minimu ze všech projekcí C maxima logaritmu věrohodnostníě funkce pro normálně ě rozdělená data. N(c T μ, c T Cc). Za předpokladu normality dat je statisticky odvoditelná jako optimální projekce do prvních dvou hlavních komponent

30 3 Projekce 1 dat (SA) Častým požadavkem bývá vyhledávání -3 shluků v projekci Jednoduchý index je poměr mezi průměrnou mezi objektovou vzdáleností D a průměrnou ů ě vzdáleností nejbližších sousedů d. Řada indexů využívá odhadu hustoty rozdělení dat v projekci f P (x). IP ( C ) = f p ( x ) dx Jako odhad f P (x) ) se obyčejně volí jádrový odhad hustoty Odchylky od normality, vyjádřené hustotou pravděpodobnosti φ(x) postihuje index IP ( C ) = φ ( x )[ f p ( x ) φ ( x )] dx

31 PCA PP PCA vs. PP PCA vertikální čára (není rozdělení dat) PCA..vertikální čára (není rozdělení dat) PP.. Horizontální čára (dva shluky)

32 PCA vs. PP I Metoda nemenších čtverců (PCA) Oddělitelnost skupin (PP) 5 Minimální chyba rekonstrukce Maximální oddělitelnost obrazců

33 Nelineární projekce Sammonův algoritmus provádí projekci jkizpůvodníhoů díh prostoru do prostoru menšího rozměru tak, aby byly pokud možno zachovány vzdálenosti mezi objekty. Pokud jsou d * ij vzdálenosti mezi dvěma objekty v původním prostoru a d ij vzdálenosti v redukovaném prostoru je cílová funkce E (která má být minimální) ii álí) ve tvaru * 1 ( dij - dij ) E = * * d d ij i< j i< j Pro minimalizaci se používá iterativní Newtonova metoda nebo řada heuristických optimalizačních postupů p ij

34 Porovnání projekcí

35 3 1 Příklad Ia 0-1 Třírozměrné normální rozdělení vektor středních hodnot -4-3 mi = (0,0,0), kovarianční 1 matice jednotková E 0. vektor středních hodnot -1 mi = (0,4,0), kovarianční - -3 matice jednotková E

36 3 1 0 Příklad Ib -1 - Třírozměrné normální rozdělení vektor středních hodnot 0 mi = (0,0,0), kovarianční -1 matice jednotková E -. vektor středních hodnot mi = (0,4,0), kovarianční matice jednotková E

37 x1 Příklad Ic x Třírozměrné normální rozdělení 8 1. vektor středních hodnot 6 mi = (0,0,0), kovarianční 4 matice jednotková E. vektor středních hodnot mi = (0,4,0), kovarianční matice jednotková E rews Function And x3 Andrews Curves Theta

38 Vzdálenost Mahalanobisova vzdálenost d i = ( x i x A ) T S 1 ( x i x A ) Eukleidova vzdálenost d i = ( x i x A ) T ( x i x A )

39 Vybočující objekty I Pojem vybočující objekty (body) evokuje představu, že jde o body, které lze vizuálně určit na základě vhodného zobrazení. To platí pro jednorozměrné výběry, kdy vybočující znamená také odlehlé. Ve vícerozměrných případech p jsou vybočující hodnoty buď odlehlé co do hodnot od ostatních nebo neodpovídající strukturám v ostatních datech. Pro vybočující body obecně platí, že: zkreslují výsledky nelíbí se vypadají nepatřičně zhoršují přesnost neumožňují selekci modelu

40 Vybočující objekty II Pro identifikaci odlehlých měření je obecně třeba: definovat čistá data určit pravděpodobnostní model dat (a často i vybočujících bodů) odhadnout d parametry tohoto modelu dl Při analýze vybočujících bodů se množina indexů I = (1,,3, N) rozkládá na podmnožinu potenciálně dobrých dat D a potenciálně vybočujících bodů V. Tedy I = (D,V). Počet potenciálně dobrých dat je ND a počet potenciálně vybočujících bodů je NV. Podíl vybočujících bodů je pak e = NV/N. Rozdělení podílu 1 - e dobrých bodů je charakterizováno distribuční funkcí G μ 0, Σ ),vektor středních hodnot μ 0, kovarianční matice Σ 0 ( 0

41 Vybočující objekty III Rozdělení podílu e potenciálních vybočujících bodů je H ( μ + μ0, Ω ) s vektorem středních hodnot μ + μ0 a kovarianční maticí Ω Očekávaná hodnota výběrového průměru x p ze všech dat je pak E( x ) = μ + e μ p 0 Očekávaná hodnota výběrové kovarianční matice S je T E( S) = (1 e) Σ + e Ω+ e (1 e) μμ 0 Výběrové průměry a kovarianční matice ze všech dat jsou závislé jak na podílu vybočujících bodů tak i na jejich parametrech.. Nejhorší je případ, kdy obě kovarianční matice mají stejný tvar. Tento typ vybočujících bodů se označuje jako posunuté vybočující body.

42 Vybočující objekty IV Pro indikaci vybočujících měření se často s výhodou používá definice zobecněné vzdálenosti d = ( x x ) *[w(d,p)* S ] *( x x ) T 1 i i AD D i AD kde x AD a S D jsou vektor aritmetických průměrů a kovarianční matice pro potenciálně dobrá data. Korekční faktor w(d,p) p + 1 w( D, p) = N D p N D p Metody pro indikaci vybočujících bodů vychází z představy vícerozměrné normality, kdy H( μ+ μ, Ω) = N( μ+ e μ,k Ω) G( μ, Σ ) = N( μ, Σ )

43 Vybočující objekty V Existují dvě mezní situace: Vybočující č í měření je chybné. To je třeba. ř případ, kdy vznikne chyba přiměření, resp. zpracování dat (např. místo 0.74 je použita hodnota 74). Vybočující měření je správné. To je případ, kdy byl použit nesprávný předpoklad o rozdělení dat (např. normalita pro případ, že reálné rozdělení je silně zešikmené) nebo jde o tzv. řídké jevy (které se u malých výběrů mohou jevit jako vybočující). V realitě nelze často rozhodnout, o který případ se vlastně jedná. Problém je také v tom, co s vybočujícími hodnotami dělat. Přímá možnost, ttjjjih tj. jejich odstranění dt ě íje nebezpečná. č ájd Jednotný týpostup zde neexistuje

44 Vybočující objekty VI Techniky indikace vybočujících bdů bodů jsou citlivé na tzv. maskování, kdy vybočující se jeví jako korektní (díky zvětšení kovarianční matice) nebo překryt, kdy přítomnost vybočujících měření způsobí, že některá správná měření leží mimo akceptovatelnou t oblast.(díky zkreslení kovarianční matice).

45 Vybočující objekty VII Jako vybočující se identifikují ty body, pro které je d i > c( p, N, α N ) Pro případ vícerozměrného normálního rozdělení a velké výběry je c( p, N, α N ) dáno kvantilem chí kvadrát rozdělení c( p, N, α N ) = χ (1 α / p N)

46 Vybočující objekty VIII Aby bylo možno použít zobecněné vzdálenosti pro identifikaci vlivných bodů, je třeba určit čisté odhady x A a S. Pro robustní odhad d kovarianční č matice se častovolí: t - M odhady - S odhady minimalizující det C s omezením - Odhady minimalizující objem konfidenčního elipsoidu Při průzkumové analýze se vlastně očekává, že vybočující body budou výrazné na grafech, ale zkreslení hlavních komponent jako souřadnicového systému je nežádané.

47 Jednoduché řešení Stanovení čisté podmnožiny dat 1.Výběr základní podmnožiny bud na základě - Mahalanobisovy vzdálenosti a uřezání podezřelých dat - Vzdálenosti od mediánu Výsledkem je podmnožina čistých dat s parametry x Ac S c. Výpočet reziduí d = ( x x T 1 ) S ( x x ) i i AC C i AC 3. doplnění čisté podmnožiny o body s reziduem menším než c * χ α, kde c = max(0,( ( h r ) /( h + r )) h = ( n + p +1) / 1 r c = 1+ ( p + 1) /( n p) + /( n 1 3p) c=c+c c 1 4. Skončení procesu v okamžiku, kdy se již nic nepřidává ani neubírá

48

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

MOCNINNÁ TRANSFORMACE VÍCEROZMĚRNÝCH DAT

MOCNINNÁ TRANSFORMACE VÍCEROZMĚRNÝCH DAT MOCNINNÁ TRANSFORMACE VÍCEROZMĚRNÝCH DAT JIŘÍ MILITKÝ, Katedra textilních materiálů, Technická universita v Liberci, Hálkova 6 461 17 Liberec, e- mail: jiri.miliky@vslib.cz Motto: Transformuj ale ověřuj

Více

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT 4 SAISICKÁ ANALÝZA VÍCEROZMĚRNÝCH DA V technické biologické ale také lékařské praxi se často vedle informací obsažených v náhodném skaláru ξ vyskytují i informace obsažené v náhodném vektoru ξ s m složkami

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy

Více

Matematika I 12a Euklidovská geometrie

Matematika I 12a Euklidovská geometrie Matematika I 12a Euklidovská geometrie Jan Slovák Masarykova univerzita Fakulta informatiky 3. 12. 2012 Obsah přednášky 1 Euklidovské prostory 2 Odchylky podprostorů 3 Standardní úlohy 4 Objemy Plán přednášky

Více

Náhodné vektory a matice

Náhodné vektory a matice Náhodné vektory a matice Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Symbolika A B Jev jistý S (nastane

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

IDENTIFIKACE BIMODALITY V DATECH

IDENTIFIKACE BIMODALITY V DATECH IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

3.4 Určení vnitřní struktury analýzou vícerozměrných dat 3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková

Více

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice 8. licenční studium chemometrie Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Analýza hlavních komponent

Analýza hlavních komponent Analýza hlavních komponent Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Analýza

Více

AVDAT Mnohorozměrné metody metody redukce dimenze

AVDAT Mnohorozměrné metody metody redukce dimenze AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak

Více

Faktorová analýza (FACT)

Faktorová analýza (FACT) Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27 úvod Na sledovaných objektech

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu

Více

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Vícerozměrná rozdělení

Vícerozměrná rozdělení Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Shluková analýza dat a stanovení počtu shluků

Shluková analýza dat a stanovení počtu shluků Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu

Více

Kvantily a písmenové hodnoty E E E E-02

Kvantily a písmenové hodnoty E E E E-02 Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT)

MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) 1. Číselné obory 1.1 Přirozená čísla provádět aritmetické operace s přirozenými čísly rozlišit prvočíslo

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Úvod do problematiky měření

Úvod do problematiky měření 1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek

Více

Základy matematiky pro FEK

Základy matematiky pro FEK Základy matematiky pro FEK 2. přednáška Blanka Šedivá KMA zimní semestr 2016/2017 Blanka Šedivá (KMA) Základy matematiky pro FEK zimní semestr 2016/2017 1 / 20 Co nás dneska čeká... Závislé a nezávislé

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Základy navrhování průmyslových experimentů DOE

Základy navrhování průmyslových experimentů DOE Základy navrhování průmyslových experimentů DOE cílová hodnota V. Vícefaktoriální experimenty Gejza Dohnal střední hodnota cílová hodnota Vícefaktoriální návrhy experimentů počet faktorů: počet úrovní:

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

MATURITNÍ TÉMATA Z MATEMATIKY

MATURITNÍ TÉMATA Z MATEMATIKY MATURITNÍ TÉMATA Z MATEMATIKY 1. Základní poznatky z logiky a teorie množin Pojem konstanty a proměnné. Obor proměnné. Pojem výroku a jeho pravdivostní hodnota. Operace s výroky, složené výroky, logické

Více

Řízení jakosti 2. Užitná hodnota I. JiříMilitký. Užitná hodnota Regulační diagramy Jakost textilních útvarů

Řízení jakosti 2. Užitná hodnota I. JiříMilitký. Užitná hodnota Regulační diagramy Jakost textilních útvarů TQ Řízení jakosti JiříMilitký Užitná hodnota Regulační diagramy Jakost textilních útvarů Užitná hodnota I Znaky jakosti jsou vyjádřené tzv. užitnými vlastnostmi, které jsou jednoduše měřitelné (pevnost,

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Linearní algebra příklady

Linearní algebra příklady Linearní algebra příklady 6. listopadu 008 9:56 Značení: E jednotková matice, E ij matice mající v pozici (i, j jedničku a jinak nuly. [...]... lineární obal dané soustavy vektorů. Popište pomocí maticového

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Semestrální projekt Vyhodnocení přesnosti sebelokalizace Vedoucí práce: Ing. Tomáš Jílek Vypracovali: Michaela Homzová,

Více

Mgr. Ladislav Zemánek Maturitní okruhy Matematika 2013-2014. 1. Obor reálných čísel

Mgr. Ladislav Zemánek Maturitní okruhy Matematika 2013-2014. 1. Obor reálných čísel Mgr. Ladislav Zemánek Maturitní okruhy Matematika 2013-2014 1. Obor reálných čísel - obor přirozených, celých, racionálních a reálných čísel - vlastnosti operací (sčítání, odčítání, násobení, dělení) -

Více

NÁHODNÝ VEKTOR. 4. cvičení

NÁHODNÝ VEKTOR. 4. cvičení NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.

Více

Statistická analýza. jednorozměrných dat

Statistická analýza. jednorozměrných dat Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v

Více

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Prof. RNDr. Milan Meloun, DrSc. (Univerzita Pardubice, Pardubice) 20.-24. června 2011 Tato prezentace je spolufinancována

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika)

Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika) Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika) Kartézská soustava souřadnic je dána počátkem O a uspořádanou trojicí bodů E x,

Více

Gymnázium Jiřího Ortena, Kutná Hora

Gymnázium Jiřího Ortena, Kutná Hora Předmět: Náplň: Cvičení z matematiky geometrie (CZMg) Systematizace a prohloubení učiva matematiky Planimetrie, Stereometrie, Analytická geometrie, Kombinatorika, Pravděpodobnost a statistika Třída: 4.

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT 8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní

Více

Stavební fakulta Katedra mechaniky. Jaroslav Kruis, Petr Štemberk

Stavební fakulta Katedra mechaniky. Jaroslav Kruis, Petr Štemberk České vysoké učení technické v Praze Stavební fakulta Katedra mechaniky Fuzzy množiny, fuzzy čísla a jejich aplikace v inženýrství Jaroslav Kruis, Petr Štemberk Obsah Nejistoty Teorie pravděpodobnosti

Více

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy Prof. RNDr. Milan Meloun, DrSc, Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice, milan. meloun@upce.

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity) 4 Lineární zobrazení Definice: Nechť V a W jsou vektorové prostory Zobrazení A : V W (zobrazení z V do W nazýváme lineárním zobrazením, pokud pro všechna x V, y V a α R platí 1 A(x y = A(x A(y (vlastnost

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Klasifikace a rozpoznávání. Extrakce příznaků

Klasifikace a rozpoznávání. Extrakce příznaků Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám

Více

Požadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků

Požadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků Maturitní zkouška z matematiky 2012 požadované znalosti Zkouška z matematiky ověřuje matematické základy formou didaktického testu. Test obsahuje uzavřené i otevřené úlohy. V uzavřených úlohách je vždy

Více

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický

Více

Maturitní témata z matematiky

Maturitní témata z matematiky Maturitní témata z matematiky G y m n á z i u m J i h l a v a Výroky, množiny jednoduché výroky, pravdivostní hodnoty výroků, negace operace s výroky, složené výroky, tabulky pravdivostních hodnot důkazy

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

9. Je-li cos 2x = 0,5, x 0, π, pak tgx = a) 3. b) 1. c) neexistuje d) a) x ( 4, 4) b) x = 4 c) x R d) x < 4. e) 3 3 b

9. Je-li cos 2x = 0,5, x 0, π, pak tgx = a) 3. b) 1. c) neexistuje d) a) x ( 4, 4) b) x = 4 c) x R d) x < 4. e) 3 3 b 008 verze 0A. Řešeními nerovnice x + 4 0 jsou právě všechna x R, pro která je x ( 4, 4) b) x = 4 c) x R x < 4 e) nerovnice nemá řešení b. Rovnice x + y x = je rovnicí přímky b) dvojice přímek c) paraboly

Více

Porovnání dvou reaktorů

Porovnání dvou reaktorů Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.

Více

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.1 Matematické principy vícerozměrných metod statistické analýzy

Více

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Univerzita Pardubice SEMESTRÁLNÍ PRÁCE Tvorba lineárních regresních modelů 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Úloha 1 Porovnání regresních přímek u jednoduchého lineárního regresního modelu Porovnání

Více