Vícerozměrná geometrická analýza dat
|
|
- Dominik Vávra
- před 7 lety
- Počet zobrazení:
Transkript
1 Motto: Všechno není jinak Vícerozměrná geometrická analýza dat Jiří Militký Katedra textilních materiálů Technická Universita Liberec,
2 Obsah Jsou popsány základní problémy vznikající v důsledku použití vícerozměrných dat. Je pojednáno o vybraných projekcích pro obecně korelovaná ádata Jsou uvedeny některé možnosti Jsou uvedeny některé možnosti snižování dimense ve statistické analýze vícerozměrných dat.
3 Problém rozměrnosti I setosa versicolor Základní rys vícerozměrných dat je jejich rozměr (dimense), která komplikuje jak jejich statistickou tak i průzkumovou analýzu. Redukce proměnných řada proměnných má variabilitu na úrovní šumu takže jsou s ohledem na statistickou analýzu nadbytečná. vdatechexistují výrazné lineární vazby (korelace), které jsou způsobeny buď použitím redundantních proměnných nebo vazbami vyplývajícím i z jejich podstaty. Tt Tyto proměnnéě lze častot bez újmy na přesnosti nahradit podstatně menším počtem proměnných, které jsou již nekorelované. virginica
4 Problém rozměrnosti II Prokletí vícerozměrnosti (multivariate curse), které se projevuji již v tom, že počet dat potřebných k zachování stejné přesnosti při odhadu funkce několika proměnných je exponenciálně rostoucí funkcí jejich počtu. Problém tzv. prázdného prostoru, který klade další nároky na zvětšování velikosti výběru. Problém vyjádření vzdálenosti, vd eos, která je třeba pro řadu metod jak průzkumové tak i konfirmativní statistické analýzy dat.
5 Primární data matice (pole) X (n x m) Každý sloupec X představuje jeden znak (proměnnou) Každý řádek X představuje jeden objekt (t.j. měření jako jeden bod v čase, osobu, kus atd.) Objekty řádky Y Data jsou uložena do jedné X Znaky sloupce DATOVÁ MATICE (n x m)
6 Vícerozměrná data Je k dispozici pro n objektů (bodů) celkem m znaků (proměnných) vyjádřených v kardinální škále. Zdrojová matice X má rozměr n m, kde standardně platí, že n je podstatně vyšší než m. Veličina m definuje dimensi problému (určující počet znaků). x.. x Úkoly x x x j 1m x.. x n1 n nj nm.. x... (a) posoudit podobnost objektů resp. jejich tendenci ke shlukování, (b) nalézt vybočující objekty, resp. jejich znaky, (c) stanovit, zda lze použít předpoklad lineárních vazeb, (d) ověřit předpoklady o datech (normalitu, nekorelovanost, homogenitu).
7 Přístupy Standardní analýza vícerozměrných dat je založena na analýze matice dat X. Podobně jako u jednorozměrných výběrů se zde provádí standardní statistická analýza založená na parametrech polohy (vektoru průměrů) a rozptýlení (kovarianční respektive korelační matici). Geometrická analýza vícerozměrných dat nahrazuje již od začátku čísla geometrickými objekty (body, čáry, roviny, obrazce) v definovaném zobrazení. Začíná se představou dat jako shluku bodů v Euklidově m rozměrném prostoru E m. Nejde přitom pouze o zobrazení dat ale zejména kvantitativní zkoumání vzájemných vazeb a souvislostí. Základem je tzv. Euklidovský shluk, což je vlastně matice X vyjádřena jako shluk bodů v Euklidově prostoru.
8 Postup analýzy I Před vlastní aplikací vhodné metody vícerozměrné statistické analýzy je třeba vždy provést étexploratorní (průzkumovou) ů analýzu dat, která umožňuje (a) posoudit podobnost objektů pomocí rozptylových a symbolových grafů. (b) nalézt vybočující objekty, resp. jejich znaky, (c) stanovit, zda lze použít předpoklad lineárních vazeb, (d) ověřit předpoklady o datech (normalitu, nekorelovanost, homogenitu). Jednotlivé techniky k určení vzájemných vazeb se dále dělí podle toho, zda se hledají (a) struktura a vazby ve znacích nebo (b) struktura a vazby v objektech:
9 Postup analýzy II 1) Struktury ve znacích v metrické škále:faktorová analýza FA, analýza hlavních komponent PCA a shluková analýza analýza hlavních komponent PCA a shluková analýza. () Struktury v objektech v metrické škále: shluková analýza. (3) Struktury v objektech v metrické i v nemetrické škále: vícerozměrné škálování. (4) Struktury v objektech v nemetrické škále: korespondenční analýza. Většina metod vícerozměrné statistické analýzy umožňuje zpracování lineárních vícerozměrných modelů, kde závisle proměnné se uvažují jako lineární kombinace nezávisle proměnných, resp. vazby mezi proměnnými jsou lineární. V řadě případů se také uvažuje normalita metrických proměnných.
10 Předzpracování dat I Lineární transformace centrování, škálování, standardizace (z skóre) x μ x / σ Omezuje vliv různých jednotek uznaků Nelineární - logaritmická transformace 1. Omezení vlivu extrémních dat ( x μ ) / σ. Omezení vlivu sešikmení rozdělení k vyšším hodnotám 3. Stabilizace rozptylu (omezení heteroskedasticity) Pořadová transformace - (hodnoty jsou nahrazeny pořadími).
11 Lineární transformace I Standardní PCA využívá sloupcové škálování dat (kovarianční matice). Standardizace vede k ke korelační matici R. Diference souvisí s různým vážením. Pro centrovaná data jsou sloupce X váženy " úměrně jejich délce (směrodatná odchylka v původních datech). Pro standardizovaná data jsou sloupce X váženy " na jednotkovou délku. Centrování se volí pro případ různých ů ýhjd jednotek tk jednotlivých znaků.
12 Lineární transformace II Centrování odstraňuje absolutní člen a snižuje tak počet č fk faktorů. ů Konfigurace dat se nemění. Posouvá se pouze počátek. Standardizace odstraňuje závislost na jednotkách a odstraňuje heteroskedasticitu. Má vliv na odhady parametrů (vážená metoda nejmenších čtverců). Je nevhodná pokud jsou některé znaky na úrovni šumu (zvyšuje se jejich význam). centrovaná data normovaná data
13 Lineární transformace III Centrování. Standardizace
14 Vícerozměrné zobrazení Techniky umožňujících grafické zobrazení ve dvourozměrném resp. třírozměrném souřadnicovém systému Identifikace objektů nebo jejich složek, které se jeví jako vybočující Indikace různých struktur v datech, které ukazují na ht heterogenitu použitého výběru nebo přítomnost bodů s odlišným chováním.
15 Vícerozměrná průzkumová analýza Většina metod zobrazení vícerozměrných dat patří do jedné ze dvou základních skupin: zobecněné rozptylové diagramy symbolové grafy.
16 Objekty Profily Každý objekt x i je charakterizován m vertikálními i úsečkami nebo sloupci. Jejich velikost je úměrná hodnotě Znaky odpovídající složky x ij j = 1,..., m. Na x-ovou osu se vynáší index dané složky j. Profil vzniká spojením koncových bodů těchto úseček. Je vhodné použít škálované znaky Profily jsou jednoduché a snadno lze tedy identifikovat vybočující složku objektu, respektive skupiny objektů, s prakticky shodným chováním.
17 Latentní proměnné První hlavní komponenta Směr odpovídá maximu variability Ke zjednodušení interpretace a omezení artefaktů se používá rozptylových grafů v modifikovaných souřadnicích, které souvisí se zavedením tzv. latentních proměnných Často jsou využívány techniky založené na metodě hlavních komponent, která je vhodná pro případy, kdy jsou sloupce matice X silně korelovány. Druhá hlavní komponenta
18 Latentní proměnné II Vhodné jsou dynamické grafy hlavních komponent umožňující rotaci a otáčení.
19 Vícerozměrná geometrie Představa že data leží v hyper-krychli na diagonálním vektoru v vycházejícím ze středu a končícím v jejím rohu. Úhel mezi tímto vektorem a souřadnicovou osou e i je roven cosθ = i v * e i ± 1 = v * e m Pro dostatečně vysoké m vyjde tento kosínus přibližně roven nule a tedy, diagonální vektory budou přibližně kolmé na všechny souřadné osy. Při použití rozptylových diagramů se pak shluky bodů ležících ve směru těchto diagonálních vektorů promítnou do počátku a nebude je možné je identifikovat. i
20 Koncentrace objemu Fenomén koncentrace objemu není zřejmý z klasického 3 dimensionální geometrie. Objem hyper-koule poloměru r v m rozměrném m / prostoru Vk π = r Γ( m / + 1) Objem hyper krychle o velikosti strany r m m Vh = * r Hyper- koule vepsaná do hyper-krychle. Poměr objemů je roven m / Vk = π 0 pro Vh Γ m + m m * ( / 1) Objem hyper-krychle se koncentruje v rozích a střední část je málo obsazená m
21 Poměr objemů Vliv dimense prostoru na poměr objemů krychle a vepsané koule. Je patrné, že už pro m = 8 je objem koule zanedbatelně malý vůči objemu krychle. Data ve vícerozměrném prostoru se bd budou koncentrovat tspíše v oblasti konců než středu a bude potřeba mít dostatečně veliké výběry aby se data významnou měrou vyskytovala i o oblastech blízko módu.
22 Vícerozměrné normální rozdělení I Dobře je to patrné při použití vícerozměrného normálního rozdělení s nulovým vektorem středních hodnot a jednotkovou kovarianční maticí. Na obrázku je znázorněna závislost velikosti distribuční funkce vícerozměrného stadardizovaného normálního rozdělení v místě x= (1, 1,1.1) na velikosti m.
23 Vícerozměrné normální rozdělení II V centrální oblasti se výrazně snižuje pravděpodobnost db výskytu náhodné veličiny Naopak, v oblasti konců rozdělení tato pravděpodobnost výrazně roste. Na obrázku je znázorněna závislost velikosti distribuční funkce vícerozměrného stadardizovaného normálního rozdělení v místě x= (,,.). Je opět patrný pokles pravděpodobnosti s růstem m, který demonstruje, že se objem hromadí v oblasti krajů.
24 Vícerozměrné normální rozdělení III Zpředpokladů nezávislých složek náhodného vektoru x majícího standardizované vícerozměrné normální rozdělení resultuje známý výsledek, že součet čtverců složek má chí kvadrát rozdělení. x m = i= 1 x i Protožejestřední hodnota rovna nulovému vektoru definuje tato norma čtverec vícerozměrné vzdálenosti. Pro výpočet pravděpodobnosti výskytu vícerozměrné náhodné veličiny v hyper kouli s počátkem v nule a poloměrem r pak platí, že. P ( x χ m m r ) = P ( χ r )
25 Vícerozměrné normální rozdělení IV Na obrázku je závislost výskytu vícerozměrné ě normálně ě rozdělené náhodné veličiny v oblasti o poloměru 3 na dimensi náhodné veličiny. Je patrný rychlý pokles směrem k nule. To ukazuje, že pro případy od m=8bude třeba počítat s tím, že výskyt hodnot jednotlivých objektů v oblastí středu je málo pravděpodobný. Může se tedy snadno stát, zejména pro menší m, že celý výběr bude ležet v oblasti konců. Proti běžné intuici zde tedy dochází k výraznému posílení vlivu konců rozdělení na úkor centra. Paradoxy rozměrnosti
26 Redukce proměnných V řadě případů lze zjistit, že rozměrnost vektoru objektu je silně ovlivněna šumy, nepřesnostmi a nevýznamnými znaky. Pak je logické hledat redukovanou velikost m, tedy omezený počet č znaků. Pro případ zobrazení dat se spíše hledá vhodná projekce resp. se původní znaky nahrazují latentními proměnnými, které jsou jejich lineární kombinací ale jsou vzájemně nezávislé
27 Lineární projekce D vektory X v jednotkové kružnici s vektorem průměrů (1,1). Transformace typu Y = A*X, A (x) matice Y Y = a a a a * X X 1 Dochází ke škálování a rotaci. Vzdálenosti mezi vektory se mění: y 1 -yy x 1 -xx
28 Projekce dat (PCA) x α cos α = cos α = x T z ((x T x)*(z T z)) 1/ (x T x) (p T p) p=k*z Obyčejně se pro D projekci volí první dvě hlavní komponenty, Výhodou je, že tyto projekce zachovávají vzdálenosti a úhly mezi jednotlivými objekty. Nevýhodou hlavních komponent je fakt, že není nikterak zohledněna potřeba optimální projekce s ohledem na odkrytí struktur v datech. Tuto nevýhodu odstraňují techniky lineární projekce vícerozměrných dat (projection pursuit), optimalizující zvolený index projekce IP(C i ). Formálně se tedy hledají vektory projekce C i, maximalizující funkci IP(C i )přiomezení C it C i =1. Projekce na tyto vektory je pak C it X. x, cos( α ) = c yc d( x )* d( y ) = c c r z
29 3 Projekce dat (PP) Index IP, odpovídající metodě - hlavních h komponentje T T IP( C) = max( Ci SCi ) pro Ci Ci = 1-3 S je výběrová kovarianční matice. Možná robustní varianta. C i splňující podmínku maxima je vlastním vektorem matice S kterému odpovídá i-té největší vlastní číslo λ i, i =1,. Navíc jsou C 1 a C ortogonální. Index IP(C) odpovídá minimu ze všech projekcí C maxima logaritmu věrohodnostníě funkce pro normálně ě rozdělená data. N(c T μ, c T Cc). Za předpokladu normality dat je statisticky odvoditelná jako optimální projekce do prvních dvou hlavních komponent
30 3 Projekce 1 dat (SA) Častým požadavkem bývá vyhledávání -3 shluků v projekci Jednoduchý index je poměr mezi průměrnou mezi objektovou vzdáleností D a průměrnou ů ě vzdáleností nejbližších sousedů d. Řada indexů využívá odhadu hustoty rozdělení dat v projekci f P (x). IP ( C ) = f p ( x ) dx Jako odhad f P (x) ) se obyčejně volí jádrový odhad hustoty Odchylky od normality, vyjádřené hustotou pravděpodobnosti φ(x) postihuje index IP ( C ) = φ ( x )[ f p ( x ) φ ( x )] dx
31 PCA PP PCA vs. PP PCA vertikální čára (není rozdělení dat) PCA..vertikální čára (není rozdělení dat) PP.. Horizontální čára (dva shluky)
32 PCA vs. PP I Metoda nemenších čtverců (PCA) Oddělitelnost skupin (PP) 5 Minimální chyba rekonstrukce Maximální oddělitelnost obrazců
33 Nelineární projekce Sammonův algoritmus provádí projekci jkizpůvodníhoů díh prostoru do prostoru menšího rozměru tak, aby byly pokud možno zachovány vzdálenosti mezi objekty. Pokud jsou d * ij vzdálenosti mezi dvěma objekty v původním prostoru a d ij vzdálenosti v redukovaném prostoru je cílová funkce E (která má být minimální) ii álí) ve tvaru * 1 ( dij - dij ) E = * * d d ij i< j i< j Pro minimalizaci se používá iterativní Newtonova metoda nebo řada heuristických optimalizačních postupů p ij
34 Porovnání projekcí
35 3 1 Příklad Ia 0-1 Třírozměrné normální rozdělení vektor středních hodnot -4-3 mi = (0,0,0), kovarianční 1 matice jednotková E 0. vektor středních hodnot -1 mi = (0,4,0), kovarianční - -3 matice jednotková E
36 3 1 0 Příklad Ib -1 - Třírozměrné normální rozdělení vektor středních hodnot 0 mi = (0,0,0), kovarianční -1 matice jednotková E -. vektor středních hodnot mi = (0,4,0), kovarianční matice jednotková E
37 x1 Příklad Ic x Třírozměrné normální rozdělení 8 1. vektor středních hodnot 6 mi = (0,0,0), kovarianční 4 matice jednotková E. vektor středních hodnot mi = (0,4,0), kovarianční matice jednotková E rews Function And x3 Andrews Curves Theta
38 Vzdálenost Mahalanobisova vzdálenost d i = ( x i x A ) T S 1 ( x i x A ) Eukleidova vzdálenost d i = ( x i x A ) T ( x i x A )
39 Vybočující objekty I Pojem vybočující objekty (body) evokuje představu, že jde o body, které lze vizuálně určit na základě vhodného zobrazení. To platí pro jednorozměrné výběry, kdy vybočující znamená také odlehlé. Ve vícerozměrných případech p jsou vybočující hodnoty buď odlehlé co do hodnot od ostatních nebo neodpovídající strukturám v ostatních datech. Pro vybočující body obecně platí, že: zkreslují výsledky nelíbí se vypadají nepatřičně zhoršují přesnost neumožňují selekci modelu
40 Vybočující objekty II Pro identifikaci odlehlých měření je obecně třeba: definovat čistá data určit pravděpodobnostní model dat (a často i vybočujících bodů) odhadnout d parametry tohoto modelu dl Při analýze vybočujících bodů se množina indexů I = (1,,3, N) rozkládá na podmnožinu potenciálně dobrých dat D a potenciálně vybočujících bodů V. Tedy I = (D,V). Počet potenciálně dobrých dat je ND a počet potenciálně vybočujících bodů je NV. Podíl vybočujících bodů je pak e = NV/N. Rozdělení podílu 1 - e dobrých bodů je charakterizováno distribuční funkcí G μ 0, Σ ),vektor středních hodnot μ 0, kovarianční matice Σ 0 ( 0
41 Vybočující objekty III Rozdělení podílu e potenciálních vybočujících bodů je H ( μ + μ0, Ω ) s vektorem středních hodnot μ + μ0 a kovarianční maticí Ω Očekávaná hodnota výběrového průměru x p ze všech dat je pak E( x ) = μ + e μ p 0 Očekávaná hodnota výběrové kovarianční matice S je T E( S) = (1 e) Σ + e Ω+ e (1 e) μμ 0 Výběrové průměry a kovarianční matice ze všech dat jsou závislé jak na podílu vybočujících bodů tak i na jejich parametrech.. Nejhorší je případ, kdy obě kovarianční matice mají stejný tvar. Tento typ vybočujících bodů se označuje jako posunuté vybočující body.
42 Vybočující objekty IV Pro indikaci vybočujících měření se často s výhodou používá definice zobecněné vzdálenosti d = ( x x ) *[w(d,p)* S ] *( x x ) T 1 i i AD D i AD kde x AD a S D jsou vektor aritmetických průměrů a kovarianční matice pro potenciálně dobrá data. Korekční faktor w(d,p) p + 1 w( D, p) = N D p N D p Metody pro indikaci vybočujících bodů vychází z představy vícerozměrné normality, kdy H( μ+ μ, Ω) = N( μ+ e μ,k Ω) G( μ, Σ ) = N( μ, Σ )
43 Vybočující objekty V Existují dvě mezní situace: Vybočující č í měření je chybné. To je třeba. ř případ, kdy vznikne chyba přiměření, resp. zpracování dat (např. místo 0.74 je použita hodnota 74). Vybočující měření je správné. To je případ, kdy byl použit nesprávný předpoklad o rozdělení dat (např. normalita pro případ, že reálné rozdělení je silně zešikmené) nebo jde o tzv. řídké jevy (které se u malých výběrů mohou jevit jako vybočující). V realitě nelze často rozhodnout, o který případ se vlastně jedná. Problém je také v tom, co s vybočujícími hodnotami dělat. Přímá možnost, ttjjjih tj. jejich odstranění dt ě íje nebezpečná. č ájd Jednotný týpostup zde neexistuje
44 Vybočující objekty VI Techniky indikace vybočujících bdů bodů jsou citlivé na tzv. maskování, kdy vybočující se jeví jako korektní (díky zvětšení kovarianční matice) nebo překryt, kdy přítomnost vybočujících měření způsobí, že některá správná měření leží mimo akceptovatelnou t oblast.(díky zkreslení kovarianční matice).
45 Vybočující objekty VII Jako vybočující se identifikují ty body, pro které je d i > c( p, N, α N ) Pro případ vícerozměrného normálního rozdělení a velké výběry je c( p, N, α N ) dáno kvantilem chí kvadrát rozdělení c( p, N, α N ) = χ (1 α / p N)
46 Vybočující objekty VIII Aby bylo možno použít zobecněné vzdálenosti pro identifikaci vlivných bodů, je třeba určit čisté odhady x A a S. Pro robustní odhad d kovarianční č matice se častovolí: t - M odhady - S odhady minimalizující det C s omezením - Odhady minimalizující objem konfidenčního elipsoidu Při průzkumové analýze se vlastně očekává, že vybočující body budou výrazné na grafech, ale zkreslení hlavních komponent jako souřadnicového systému je nežádané.
47 Jednoduché řešení Stanovení čisté podmnožiny dat 1.Výběr základní podmnožiny bud na základě - Mahalanobisovy vzdálenosti a uřezání podezřelých dat - Vzdálenosti od mediánu Výsledkem je podmnožina čistých dat s parametry x Ac S c. Výpočet reziduí d = ( x x T 1 ) S ( x x ) i i AC C i AC 3. doplnění čisté podmnožiny o body s reziduem menším než c * χ α, kde c = max(0,( ( h r ) /( h + r )) h = ( n + p +1) / 1 r c = 1+ ( p + 1) /( n p) + /( n 1 3p) c=c+c c 1 4. Skončení procesu v okamžiku, kdy se již nic nepřidává ani neubírá
48
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceProfilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VíceMOCNINNÁ TRANSFORMACE VÍCEROZMĚRNÝCH DAT
MOCNINNÁ TRANSFORMACE VÍCEROZMĚRNÝCH DAT JIŘÍ MILITKÝ, Katedra textilních materiálů, Technická universita v Liberci, Hálkova 6 461 17 Liberec, e- mail: jiri.miliky@vslib.cz Motto: Transformuj ale ověřuj
Více4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT
4 SAISICKÁ ANALÝZA VÍCEROZMĚRNÝCH DA V technické biologické ale také lékařské praxi se často vedle informací obsažených v náhodném skaláru ξ vyskytují i informace obsažené v náhodném vektoru ξ s m složkami
VícePRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy
VíceMatematika I 12a Euklidovská geometrie
Matematika I 12a Euklidovská geometrie Jan Slovák Masarykova univerzita Fakulta informatiky 3. 12. 2012 Obsah přednášky 1 Euklidovské prostory 2 Odchylky podprostorů 3 Standardní úlohy 4 Objemy Plán přednášky
VíceNáhodné vektory a matice
Náhodné vektory a matice Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Symbolika A B Jev jistý S (nastane
VíceFakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
VíceIDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceDefinice spojité náhodné veličiny zjednodušená verze
Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f
VíceNormální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
VíceZáklady teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Více3.4 Určení vnitřní struktury analýzou vícerozměrných dat
3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková
VíceUniverzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné
VícePřednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceAnalýza hlavních komponent
Analýza hlavních komponent Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Analýza
VíceAVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
VíceFaktorová analýza (FACT)
Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceFaktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27 úvod Na sledovaných objektech
VíceS E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
VíceSPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky
SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost
VíceÚloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )
Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceVícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
VíceTéma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
VíceShluková analýza dat a stanovení počtu shluků
Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu
VíceKvantily a písmenové hodnoty E E E E-02
Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
VíceMATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT)
MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) 1. Číselné obory 1.1 Přirozená čísla provádět aritmetické operace s přirozenými čísly rozlišit prvočíslo
Více1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.
VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
VíceAVDAT Náhodný vektor, mnohorozměrné rozdělení
AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární
VíceÚvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
VíceZáklady matematiky pro FEK
Základy matematiky pro FEK 2. přednáška Blanka Šedivá KMA zimní semestr 2016/2017 Blanka Šedivá (KMA) Základy matematiky pro FEK zimní semestr 2016/2017 1 / 20 Co nás dneska čeká... Závislé a nezávislé
VíceChyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
VíceZáklady navrhování průmyslových experimentů DOE
Základy navrhování průmyslových experimentů DOE cílová hodnota V. Vícefaktoriální experimenty Gejza Dohnal střední hodnota cílová hodnota Vícefaktoriální návrhy experimentů počet faktorů: počet úrovní:
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceX = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
VíceMATURITNÍ TÉMATA Z MATEMATIKY
MATURITNÍ TÉMATA Z MATEMATIKY 1. Základní poznatky z logiky a teorie množin Pojem konstanty a proměnné. Obor proměnné. Pojem výroku a jeho pravdivostní hodnota. Operace s výroky, složené výroky, logické
VíceŘízení jakosti 2. Užitná hodnota I. JiříMilitký. Užitná hodnota Regulační diagramy Jakost textilních útvarů
TQ Řízení jakosti JiříMilitký Užitná hodnota Regulační diagramy Jakost textilních útvarů Užitná hodnota I Znaky jakosti jsou vyjádřené tzv. užitnými vlastnostmi, které jsou jednoduše měřitelné (pevnost,
VíceZáklady popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
VíceANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
VícePrůzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceLinearní algebra příklady
Linearní algebra příklady 6. listopadu 008 9:56 Značení: E jednotková matice, E ij matice mající v pozici (i, j jedničku a jinak nuly. [...]... lineární obal dané soustavy vektorů. Popište pomocí maticového
VíceP13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
VíceSemestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Semestrální projekt Vyhodnocení přesnosti sebelokalizace Vedoucí práce: Ing. Tomáš Jílek Vypracovali: Michaela Homzová,
VíceMgr. Ladislav Zemánek Maturitní okruhy Matematika 2013-2014. 1. Obor reálných čísel
Mgr. Ladislav Zemánek Maturitní okruhy Matematika 2013-2014 1. Obor reálných čísel - obor přirozených, celých, racionálních a reálných čísel - vlastnosti operací (sčítání, odčítání, násobení, dělení) -
VíceNÁHODNÝ VEKTOR. 4. cvičení
NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.
VíceStatistická analýza. jednorozměrných dat
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v
VícePočítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd
Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Prof. RNDr. Milan Meloun, DrSc. (Univerzita Pardubice, Pardubice) 20.-24. června 2011 Tato prezentace je spolufinancována
VíceDefinice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně
7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností
VíceEukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika)
Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika) Kartézská soustava souřadnic je dána počátkem O a uspořádanou trojicí bodů E x,
VíceGymnázium Jiřího Ortena, Kutná Hora
Předmět: Náplň: Cvičení z matematiky geometrie (CZMg) Systematizace a prohloubení učiva matematiky Planimetrie, Stereometrie, Analytická geometrie, Kombinatorika, Pravděpodobnost a statistika Třída: 4.
VíceMatematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace
Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední
VíceS E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza
VíceMěření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
VíceStřední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceObsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
VíceAnalýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
VíceStatistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
VíceMATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT
8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní
VíceStavební fakulta Katedra mechaniky. Jaroslav Kruis, Petr Štemberk
České vysoké učení technické v Praze Stavební fakulta Katedra mechaniky Fuzzy množiny, fuzzy čísla a jejich aplikace v inženýrství Jaroslav Kruis, Petr Štemberk Obsah Nejistoty Teorie pravděpodobnosti
VíceOdhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy
Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy Prof. RNDr. Milan Meloun, DrSc, Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice, milan. meloun@upce.
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceLineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)
4 Lineární zobrazení Definice: Nechť V a W jsou vektorové prostory Zobrazení A : V W (zobrazení z V do W nazýváme lineárním zobrazením, pokud pro všechna x V, y V a α R platí 1 A(x y = A(x A(y (vlastnost
VícePředpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2
Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VíceKlasifikace a rozpoznávání. Extrakce příznaků
Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám
VícePožadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků
Maturitní zkouška z matematiky 2012 požadované znalosti Zkouška z matematiky ověřuje matematické základy formou didaktického testu. Test obsahuje uzavřené i otevřené úlohy. V uzavřených úlohách je vždy
VíceÚvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)
Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický
VíceMaturitní témata z matematiky
Maturitní témata z matematiky G y m n á z i u m J i h l a v a Výroky, množiny jednoduché výroky, pravdivostní hodnoty výroků, negace operace s výroky, složené výroky, tabulky pravdivostních hodnot důkazy
Více1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Více9. Je-li cos 2x = 0,5, x 0, π, pak tgx = a) 3. b) 1. c) neexistuje d) a) x ( 4, 4) b) x = 4 c) x R d) x < 4. e) 3 3 b
008 verze 0A. Řešeními nerovnice x + 4 0 jsou právě všechna x R, pro která je x ( 4, 4) b) x = 4 c) x R x < 4 e) nerovnice nemá řešení b. Rovnice x + y x = je rovnicí přímky b) dvojice přímek c) paraboly
VícePorovnání dvou reaktorů
Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.
VíceMĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS
VíceUniverzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.
VíceUniverzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie
Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.1 Matematické principy vícerozměrných metod statistické analýzy
VíceUniverzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.
Univerzita Pardubice SEMESTRÁLNÍ PRÁCE Tvorba lineárních regresních modelů 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Úloha 1 Porovnání regresních přímek u jednoduchého lineárního regresního modelu Porovnání
Více