VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH
|
|
- Alžběta Vaňková
- před 4 lety
- Počet zobrazení:
Transkript
1 VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta Pardubce, Pardubce Motto: Všechno je jnak Abstrakt: Jsou popsány základní postupy pro určování odlehlých měření ve vícerozměrných datech, které jsou modfkací postupů pro jednorozměrná data. Jsou vybrány především metody, které př své jednoduchost umožňují zpracovat výběry obsahující skupny vlvných bodů, kde se může projevt jak maskování tak nesprávné zařazení korektních bodů. Jsou uvedeny jednoduché grafy pro dentfkac skupn vlvných bodů. 1.Úvod Jednou ze základních úloh analytcké cheme je smultánní montorování úrovně různých látek v materálech, ovzduší, vodě a půdě. Cílem je často zjštění, zda dané látky (celkem p nepřekračují zadané úrovně. Standardně se vychází z vícerozměrných výběrů obsahujících měření ( Vektor j j pro j té měření obsahuje složky ( j1, j jp. Výsledkem měření je tedy matce dat X řádu p obsahující řádků (měření a p sloupců (látek. Účelem je v nejjednodušším případě stanovení vhodného odhadu vektoru středních hodnot µ a porovnání se zadaným úrovněm µ o. S ohledem na varabltu měření je vhodné ověřt, zda vektor µ o padne do oblast spolehlvost CI vektoru parametrů µ č nkolv. Tato úloha může být komplkována jak nestejným rozptyly tak vzájemnou korelací mez látkam (sloupc matce X. Také celá řada dalších úloh z oblast analytcké cheme vede na zpracování vícerozměrných výběrů. Problém komplkuje to, že data z oblast analytcké cheme mají standardně některé specfcké zvláštnost: (a rozsahy zpracovávaných dat nejsou obyčejně velké, (b v datech se vyskytují výrazné nelnearty, neadtvty a struktury, které je třeba dentfkovat a popsat,
2 (c rozdělení dat jen zřídka odpovídá normálnímu běžně předpokládanému ve standardní statstcké analýze, (d v datech se vyskytují vybočující měření a různé heterogenty, (e statstcké modely se často tvoří na základě předběžných nformací z dat (datově orentované přístupy, (f parametry statstckých modelů mají mnohdy defnovaný fyzkální význam, a musí proto vyhovovat velkostí, znaménkem nebo vzájemným poměrem, (g estuje jstá neurčtost př výběru modelu, popsujícího chování dat. Z hledska použtí statstckých metod je proto žádoucí mít možnost zkoumat statstcké zvláštnost dat (průzkumová analýza, ověřovat základní předpoklady o datech a hodnott kvaltu výsledků s ohledem na základní schéma "data - model - statstcká metoda" Toto schéma se považuje za základ nteraktvní tvorby statstckých modelů všeho druhu. Př jeho praktckém použtí však nastávají problémy s tzv. vybočujícím hodnotam (body a to nejen s jejch ndkací, ale zejména nterpretací a omezením jejch vlvu. Všeobecně se soudí, že většna statstckých metod je výrazně negatvně ovlvněna přítomností vybočujících bodů. Ve skutečnost záleží na tom, o jaké vybočující body jde, a kde se vyskytují. ( např. v regresní analýze mohou vybočující body jak zvětšovat tak zmenšovat korelační koefcent. V některých případech je třeba rozhodnout, zda podezřelé hodnoty považovat za správné (a pracovat např. se zeškmeným rozdělením nebo za chybné a jejch vlv elmnovat. Toto rozhodnutí nelze učnt bez znalost způsobu získávání dat a realzace epermentů. esprávné rozhodnutí může mít katastrofcké důsledky s ohledem na nterpretac výsledků a praktcké závěry. V této prác popsány postupy pro určování odlehlých měření ve vícerozměrných datech, které jsou modfkací postupů pro jednorozměrná data. Jsou uvedeny jednoduché grafy pro dentfkac skupn vlvných bodů.. Vybočující body Pojem vybočující body evokuje představu, že jde o body, které lze vzuálně určt na základě vhodného zobrazení. To platí pro jednorozměrné výběry, kdy vybočující znamená také odlehlé. Ve vícerozměrných případech jsou vybočující hodnoty buď odlehlé co do hodnot od ostatních nebo neodpovídající strukturám v ostatních datech. Pro vybočující body obecně platí, že: - zkreslují výsledky - nelíbí se vypadají nepatřčně - zhoršují přesnost - neumožňují selekc modelu
3 Pro dentfkac odlehlých měření je obecně třeba: - defnovat čstá data - určt pravděpodobnostní model dat (a často vybočujících bodů - odhadnout parametry tohoto modelu Př analýze vybočujících bodů se množna ndeů I = (1,,3, rozkládá na podmnožnu potencálně dobrých dat D a potencálně vybočujících bodů V. Tedy I = (D,V. Počet potencálně dobrých dat je D a počet potencálně vybočujících bodů je V. Podíl vybočujících bodů je pak e = V /. echť je rozdělení podílu 1 - e dobrých bodů charakterzováno dstrbuční funkcí G( µ 0, Σ 0 s vektorem středních hodnot µ 0 a kovaranční matcí Σ 0 a rozdělení podílu e potencálních vybočujících bodů je µ+µ 0 H ( µ+ µ 0, Ω s vektorem středních hodnot a kovaranční matcí Ω. Očekávaná hodnota výběrového průměru p ze všech dat je pak = 0 E( p µ + e µ a očekávaná hodnota výběrové kovaranční matce S je E ( S = (1 e Σ 0 + e Ω + e (1 e µ Je tedy patrné, že výběrové průměry a kovaranční matce ze všech dat jsou závslé jak na podílu vybočujících bodů tak na jejch parametrech. To může vést k stuac, kdy se z odhadů získaných ze všech dat nedají určt vybočující body. ejhorší stuace z hledska ndkace vybočujících bodů je případ, kdy obě kovaranční matce mají stejný tvar. Tento typ vybočujících bodů se označuje jako posunuté vybočující body. Pro ndkac vybočujících měření se často s výhodou používá defnce zobecněné vzdálenost T µ d = ( AD T *[ w( D, p * S D ] 1 * ( AD kde AD a S D jsou vektor artmetckých průměrů a kovaranční matce pro potencálně dobrá data. Korekční faktor w(d,p byl zaveden ve tvaru [4] p + 1 w( D, p = D p D p
4 Většna metod pro ndkac vybočujících bodů vychází z představy vícerozměrné normalty, kdy a G ( µ 0, Σ 0 = ( µ 0, Σ 0 H µ + µ, Ω = ( µ + e µ, k. ( 0 0 Ω Tato představa je potřebná pro určení krtckých mezí oddělujících dobrá a špatná data. Podíl e ovlvňuje také špčatost rozdělení měření. Pro jednorozměrné výběry asymptotcky (pro s / D s V platí, že špčatost g je dána vztahem g = e 3 + (1 e e (1 e 3 Pro e = 0,5 je g = 1 (mnmum a pro e blízké nule je g rostoucí nade všechny meze. ejmenší počet e dobrých bodů je e = nt[( + p +1 / ] Technky ndkace vybočujících bodů jsou ctlvé na tzv. maskování, kdy vybočující jeví jako korektní (díky zvětšení kovaranční matce. Dalším problémem je překryt, kdy přítomnost vybočujících měření způsobí, že některá správná měření leží mmo akceptovatelnou oblast.(díky zkreslení kovaranční matce [1]. Schematcky jsou tyto stuace znázorněny na obr. 1 (vybočující body jsou tmavé. A. maskování B. překryt Obr. 1 Příklad maskování (A a překrytu (B
5 Znázornění na obr 1. vychází z faktu, že čtverce zobecněných vzdáleností mají χ p rozdělení (elpsa je tedy hranční oblast oddělující dobrá (D a vybočující (V data. Řada metod pro dentfkac vybočujících bodů funguje jen pro některé stuace nebo modely datových struktur. Příkladem jsou technky uvažující pouze jedno vybočující měření (testy založené na odchylkách od průměru atd. nebo specální metody pro regresní modely. Samostatným problémem je nterpretace vybočujících hodnot. Estují dvě mezní stuace: A. Vybočující měření je chybné. To je třeba. případ, kdy vznkne chyba př měření, resp. zpracování dat (např. místo 0.74 je použta hodnota 74. B. Vybočující měření je správné. To je případ, kdy byl použt nesprávný předpoklad o rozdělení dat (např. normalta pro případ, že reálné rozdělení je slně zeškmené nebo jde o tzv. řídké jevy (které se u malých výběrů mohou jevt jako vybočující. V realtě nelze často rozhodnout, o který případ se vlastně jedná. Problém je také v tom, co s vybočujícím hodnotam dělat. Přímá možnost, tj. jejch odstranění je nebezpečná ze dvou důvodů: a data se upravují tak, aby vyhovovala předpokládanému modelu a nelze tedy dobře posoudt jeho vhodnost, b varablta dat vyjde etrémně nízká, což se může negatvně projevt př porovnání s novým daty, resp. nformacem Jednotný postup zde neestuje a záleží na epermentátorov, resp. zpracovatel jakou varantu zvolí.vzhledem k tomu, že vybočující body jsou většnou etrémně vlvné vede zde nevhodná manpulace ke ztrátě nformací a nesprávným závěrům. V souvslost s vybočujícím body je možné defnovat tyto základní paradoy: 1. známe - l rozdělení dat a model můžeme určt vybočující hodnoty. Model a rozdělení dat se však hledá.. pro posouzení vybočujících měření potřebujeme znát čstá data. Robustním metodam však dostaneme data čstá s ohledem na základní model
6 3. e vše co vypadá jako vybočující skutečně vybočuje a naopak (maskování, překryt 4. Platí, že co je vybočující pro jeden model může být akceptovatelné pro jný model 3. Jednorozměrné výběry Standardní způsob zpracování jednorozměrných výběrů spočívá ve výpočtu artmetckého průměru A a výběrového rozptylu s. Je známo, že pokud zpracovávaný výběr velkost prochází z ne - normálního rozdělení se střední hodnotou µ a rozptylem σ (< má náhodná velčna Z = * ( A µ /σ (1 asymptotcky normální rozdělení. Pokud není σ známo, nahrazuje se výběrovou směrodatnou odchylkou s. Pak má tzv. Studentova náhodná velčna t * ( A µ / s = ( Studentovo rozdělení s ( - 1 stupn volnost. Asymptotcká normalta velčny Z resp. Studentovo rozdělení velčny t umožňuje konstrukc ntervalu spolehlvost střední hodnoty µ. Př tzv. frekventstckém přístupu je 100 (1 - α % na nterval spolehlvost CI defnován vztahem ( CID µ CIH = 1 α P (3 Symbol P (. označuje pravděpodobnost a α je tzv. hladna významnost. Obyčejně se volí α = 0.05 nebo α = 0.01 s tím, že čím je α menší, tím je nterval (CID, CIH šrší. Př znalost rozptylu σ je možno nterval spolehlvost CI vyjádřt ve tvaru s α / µ A z A z1 * α / * (4 kde z1 α / = zα / jsou kvantly normovaného normálního rozdělení. Pokud není σ známo lze použít vztah s A s t1 / ( 1 * A t / ( 1 * α µ α (5 s
7 t t kde 1 α / ( 1 = α / ( 1 jsou kvantly Studentova rozdělení s -1 stupn volnost. Pro případ normálního rozdělení mají ntervaly (4 resp. (5 přesně 100(1-α % ní pokrytí střední hodnoty.to znamená, že jen v 100α/ % případů je střední hodnota menší než CI (nejstota P zprava a v 100α/ % případů je větší než CI (nejstota L zleva.pro případ ne-normálního rozdělení platí tyto ntervaly pouze asymptotcky tedy pro dostatečně vysoká. Dostatečná velkost závsí slně na škmost g1( rozdělení z kterého data pocházejí [3]. Pro kvantfkac vlvu škmost na rozdělení náhodné velčny Z defnované rov. (1 je možno použít prvního členu Edgeworthova rozvoje pro, který platí P( Z g1( * ( 1 = Fn ( f n ( (6 6 Zde F n ( je dstrbuční funkce normovaného normálního rozdělení a f n ( je odpovídající hustota pravděpodobnost. Škmost náhodné velčny Z je dána vztahem g Z g ( / 1 ( = 1 (7 Čím je g 1 (Z blíže k nule, tím je rozdělení velčny Z blžší normálnímu. Z rov. (6 je patrné, že pro rozdělení dat zeškmené k vyšším hodnotám (tj. g 1 ( kladné, je také rozdělení náhodné velčny Z zeškmené k vyšším hodnotám (tj. g 1 (Z kladné. Interval spolehlvost (4 pak má vyšší horní mez CIH a vyšší dolní mez CID než odpovídá reálnému rozdělení statstky Z. apř. pro výběr rozsahu =10 ze standardzovaného eponencálního rozdělení, kdy je g 1 (=, je 97.5 % ní kvantl rozdělení velčny Z určený z rov. (6 roven.4 a odpovídající kvantl normovaného normálního rozdělení je pouze Podobně lze určt, že.5 % ní kvantl Z je pouze 1.65 oprot odpovídajícímu kvantlu normovaného normálního rozdělení Interval spolehlvost defnovaný rov. (4 je tedy celý posunut doprava oprot skutečnému [3]. Také pro kvantfkac vlvu škmost na rozdělení náhodné velčny t defnované rov. ( je možno použít prvního členu Edgeworthova rozvoje P( t g1( * ( + 1 = Fn ( + f n ( (8 6 Zde je opět F n ( dstrbuční funkce normovaného normálního rozdělení a f n ( je odpovídající hustota pravděpodobnost. Př porovnání s rov. (6, je patrné
8 opačné znaménko korekčního členu, což znamená, že pro rozdělení dat zeškmené k vyšším hodnotám (tj. g 1 ( kladné, je rozdělení náhodné velčny t zeškmené k nžším hodnotám (tj. g 1 (t záporné. Interval spolehlvost (5 pak má nžší horní mez CIH a nžší dolní mez CID než odpovídá reálnému rozdělení statstky t. Interval spolehlvost defnovaný rov. (5 je tedy celý posunut doleva oprot skutečnému [3]. To je zvláště nepříjemné u dat slně zeškmených vpravo a vede to k přehnaně optmstckým závěrům. Př testování hypotéz o střední hodnotě se používá statstka ( A µ 0 t( s = (9 Zde je uvažováno jako poslední hodnota ve výběru tj. =. Obecně přjímaný předpoklad je, že stačí přítomnost jednoho vybočujícího bodu aby došlo ke zvýšení t( a tedy zamítnutí nulové hypotézy H o : µ = µ 0 je nesprávný. a obr. je zakreslen průběh funkce t( pro výběr V = (10, 10, 11,11, pro = 5,6, 50. Hvězdčkam je znázorněna krtcká hodnota Studentova rozdělení t1 α ( 1 =.1318 pro α = 0.05 a = 5, která platí pro alternatvní hypotézu H A : µ> µ 0..5 t krtcke 1.5 t( 1 t( Obr. Vlv velkost posledního bodu výběru (10,10,11,11, na velkost t(
9 Je patrné, že pouze malá oblast nad hvězdčkam vede k přjetí alternatvní hypotézy a slně vybočující bod naopak podporuje hypotézu nulovou o shodě střední hodnoty s. Dá se také ukázat, že [5] µ 0 = 10 lm t( = ± 1 ± Snadno lze také odvodt, jakému odpovídá mamum t(. Zaveďme označení 1 a = a b 1 =. Pak v případě, že a ( 1 µ 0 nabývá t( = 1 = 1 nejvyšší hodnoty pro c rovno [5] c = b aµ 0 a ( 1 µ 0 Je tedy patrné, že slně vybočující měření vede k poklesu t(. Pokud je a = ( 1 µ 0 je t(.monotónně rostoucí od 1 do 1. Příklad Mějme čstá data D1= (10, 10, 11, 11, 1 a µ 0 = 10. Pak t( =,138. Pro data s vybočujícím měřením D = (10,10,11,11,18 je však t( = 1,318. Tedy hypotéza Ho: µ 0 = 10 je pravděpodobnější. Mamálnímu t( odpovídá hodnota c = 11. Pro dentfkac vybočujících hodnot se používá řady testů založených na defnc standardzované mamální odchylky od artmetckého průměru (počítaného bez etrémní hodnoty. Jednoduchá momentová metoda předpokládá, že vybočující je takové j,pro které je A * K. s * j c kde K c [ 0.8. g * 1.log( /10] = *, s*... čsté odhadnuty střední hodnoty a směrodatné odchylky A (bez podezřelého bodu j. g *... odhad špčatost bez vybočujícího bodu
10 g * =. ( 4 [ ( ] Postup je vhodný pro 0. Pro = 0 vyjde pro různá rozdělení: ormální rozdělení g = 3 K c = 1.89 Rovnoměrné rozdělení g = 1.8 K c = 1.77 Laplaceovo rozdělení g = 6 K c =.09 V případě více vybočujících měření se postupně vylučují podezřelé body na základě výše uvedeného krtéra nebo se smultánně určují všechny vybočující hodnoty pro různé kombnace podezřelých bodů. Obecně je tedy třeba řešt tyto úlohy: A. Výběr vhodného rozdělení dat B. určení čstých odhadů ze všech bodů, nebo podmnožny čstých bodů C. nalezení krtcké hodnoty pro selekc vybočujících bodů Jako vhodné rozdělení dat (A se většnou uvažuje rozdělení normální, protože umožňuje jednoduché nalezení krtckých hodnot (C. Pro určení čstých odhadů se používají především různé robustní metody. Pro nalezení čstých bodů se používá dvou přístupů: Brute force kdy se zkouší všechny možné kombnace podvýběrů. Tento postup vede k cíl ale je časově náročný. Clean subset kdy se hledají data, která jsou určtě čstá a nezkreslí odhady střední hodnoty a rozptylu. Je snahou nalézt takové metody, které nevyžadují přílš komplkované výpočty a přtom jsou dostatečně spolehlvé. Obecně lze tento přístup použít pro lbovolně rozměrná data. 4. Vícerozměrná data Předpokládejme pro jednoduchost, že nestrukturovaná data mají p rozměrné normální rozdělení ( µ, Σ, kde µ je vektor středních hodnot a Σ je kovaranční matce. Vybočující měření leží v oblast out( α p T 1 ( R : ( µ Σ ( µ χ µ, Σ = > 1 α 1 α
11 Tato oblast pokrývá celý prostor E p s vyloučením vícerozměrného elpsodu kolem vektoru středních hodnot. Vybočující body jsou tedy přílš vzdáleně od střední hodnoty. Oblast vybočujících bodů OR pro výběr velkost je určena výrazem p T 1 ( R : ( S ( c( p,, α OR ( α α, = >, 1 A A kde α = ( 1 α pro α = 0.05, Vše co leží v OR je vybočující. Oblast vybočujících bodů úzce souvsí se zobecněnou (Mahalanobsovou vzdáleností resp. jejch čtvercem d = ( A T S 1 ( A Jako vybočující se pak dentfkují ty body, pro které je d > c( p,, α Pro případ vícerozměrného normálního rozdělení a velké výběry je ( p,, α dáno kvantlem chí kvadrát rozdělení c c( p,, α = χ p (1 α / Pro malé výběry je lépe použít modfkovaný koefcent c( p,, α = p * ( 1 * ( n p 1+ * F p, p 1 p * F p, p 1 (1 α / (1 α / Je zajímavé, že pro případ jednoho vybočujícího měření neroste zobecněná vzdálenost nade všechny meze, ale je ohrančená hodnotou d ma ( 1 Wlks použl pro určení jednoho vybočujícího bodu ve vícerozměrných datech statstku R = det( S det( S
12 kde S je odhad kovaranční matce s vynecháním -tého bodu a S je odhad kovaranční matce ze všech bodů. Mnmální R ndkuje potencální vybočující bod. Dá se ukázat, že R souvsí se čtvercem zobecněné vzdálenost vztahem R = 1 ( 1 d Aby bylo možno použít zobecněné vzdálenost pro dentfkac vlvných bodů, je třeba určt čsté odhady A a S. Pro robustní odhady se často volí [1]: - M odhady - S odhady mnmalzující det S s omezením - Odhady mnmalzující objem konfdenčního elpsodu Pro stanovení čsté podmnožny dat se doporučuje BACO algortmus, složený z těchto kroků: 1. určení základní podmnožny m > p čstých dat. odhady parametrů předpokládaného modelu M a nalezení rezduí pro všechny body 3. doplnění základní podmnožny o data s malým rezdu a vyloučení dat s velkým rezdu 4. terace kroků a 3 až se překročí pravdlo ukončení 5. body, které nejsou v základní podmnožně jsou vybočující BACO pro vícerozměrná data (bez struktury se skládá z těchto kroků: 1.Výběr základní podmnožny bud na základě - Mahalanobsovy vzdálenost a uřezání podezřelých dat - Vzdálenost od medánu Výsledkem je podmnožna čstých dat s parametry Ac S c. Výpočet rezduí d = ( AC T S 1 C ( AC 3. doplnění čsté podmnožny o body s rezduem menším než c * χ α, kde c 1 = ma(0, ( h r /( h + r ; h = ( n + p + 1 / c = 1+ ( p + 1 /( n p + /( n 1 3p c = c 1 +c
13 4. Skončení procesu v okamžku, kdy se jž nc nepřdává an neubírá Poměrně jednoduchá je metoda využívající kombnace dentfkace potencálně vybočujících bodů a uřezaných odhadů. V té terac se určí uřezané odhady RC a S C, kde se uřezává defnované procento ( obyčejně 30% bodů s nejvyšším zobecněným vzdálenostm z vektoru d -1 vypočítaného v -1 té terac. Z takto získaných odhadů se vypočte vektor opravených zobecněných vzdáleností d a přechází se na +1 ní terac. Proces je ukončen, když se ve dvou následujících teracích nemění odhady parametrů RC a S C (mamální rozdíl je menší než Grafcká nterpretace výsledků Př dentfkac skupn vybočujících bodů se s výhodou volí různé typy grafů. Mez základní patří: A. Indeový graf pro Mahalanobsovy vzdálenost. Vynáší se d ( prot a krtcká úroveň. Vybočující body leží nad touto úrovní (0.5 B. Q-Q graf funkcí d p, p. Vynáší se y = d ( prot = Fp, p ( + 1 F medan( d možné také volt klascký Q-Q graf, kdy se vynáší pořádkové statstky d ( (tj. vzestupně uspořádané čtverce vzdáleností prot kvantlům χ p rozdělení.. Poměr y / > ndkuje vybočující body. Je C. Úhlová metoda založená na jednorozměrné projekc dat. Je známo, že 1 pro elptcké rozdělení X = Σ * y + µ má y = S ( m crkulární rozdělení a = má vícerozměrné rovnoměrné u y / rozdělení. Pro zvolené u o má pak velčna rovnoměrné rozdělení. u0 u y w 1 = cos ( u T 0 u Zde u o je blízké směrům, kde nabývá špčatost mama resp. mnma.
14 Konstruuje se tedy Q-Q graf pro rovnoměrné rozdělení, kdy se vynáší w ( vs. P = /(+1 w ( f 5. Program EXMUL Pro dentfkac vybočujících bodů ve vícerozměrných datech byl sestaven program EXMUL v jazyce MATLAB. Program obsahuje tyto část: - Eploratorní grafy pro vícerozměrná data [1] - Robustní odhad A a S využívající elptcké vícerozměrné uřezání Indeový graf pro d - Q-Q graf pro funkc d - Úhlový graf Pro lustrac čnnost tohoto programu byla použta Hockngova syntetcká data určená pro regresní dagnostku. =6, p = 4 Model: Y = a0 + a1*1 + a* + a3*3 Generace dat : y= 0 + 3*1 - * + eps1 eps1...náhodná čísla z (0,.5 multkolnearta: *3 = 60-3*1-1.5* + eps, eps... náhodná čísla z (0,.16 Vybočující body : č.11,17,18. Etrém : č.4 (leží mmo rovnu multkolnearty Data byla zpracována jako nestrukturalzovaná. Výstupy jsou na obr. 3-9.
15 100 Andrews Curves Andrews Functon Obr. 3 Andrewsův graf Theta Obr. 4 Paralelní souřadnce Obr. 5 Hvězdy
16 Obr. 6 Zobecněné vzdálenost (Mahalanobsovy pro odhady středních hodnot a kovaranční matce ze všech dat (momenty Obr. 7 Zobecněné vzdálenost (Mahalanobsovy pro robustní odhady středních hodnot a kovaranční matce (30% uřezání.
17 Obr. 8 Q-Q graf pro funkc d Obr. 9 Úhlová metoda Je patrné, že: 1. ejvíce vlvný je bod č.. Vybočující jsou body 11, 17, 18 ale také. 3. Robustní Mahalanobsova vzdálenost je vhodná pro vícerozměrná data 4. Indeový graf je jednoduchý a přehledný př postačující schopnost dentfkovat skupny vybočujících bodů
18 Stále platí, že je třeba nejen dentfkovat potencální vybočující hodnoty ale také rozhodnout co s nm dále 8. Závěr Je patrné, že statstcké zpracování dat v analytcké chem má celou řadu specfckých zvláštností. V řadě případů je třeba ve zdánlvě jednoduchých stuacích používat poměrně komplkované metody. Formální aparát statstky resp. přzpůsobení dat potřebám statstcké analýzy bez hlubšího rozboru zde může vést ke katastrofckým závěrům. Poděkování: Tato práce vznkla s podporou výzkumného centra Tetl L00B Lteratura [1] Meloun M., Mltký J.: Zpracování epermentálních dat, East Publshng Praha 1998 [] Barnett V., Lews T.: Outlers n statstcal data, 3rd. Ed., Wley, Chcheter 1994 [3] Campbell.A.: Appl. Statst. 9, 31 (1980 [4] Had A. S.: J. R. Stat. Soc. B56, 393 (1994 [5] Grmmet D.R., Rdenhorn J.R.: Amer. Statst. 50, 145 (1996 [6] Hockng R.R.,Pendleton O.J.: Commun.Statst. A1,497 (1983
6 LINEÁRNÍ REGRESNÍ MODELY
1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů
VíceVĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT
VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v
VíceANALÝZA ROZPTYLU (Analysis of Variance ANOVA)
NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než
VíceREGRESNÍ ANALÝZA. 13. cvičení
REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká
VíceAnalýza závislosti veličin sledovaných v rámci TBD
Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá
Více6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu
6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a
VíceTransformace dat a počítačově intenzivní metody
Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta
Více4.4 Exploratorní analýza struktury objektů (EDA)
4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk
VíceANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
Více3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina
3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních
VíceRegresní a korelační analýza
Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska
VíceČísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)
. NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou
Více9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese
cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování
VíceMODELOVÁNÍ A SIMULACE
MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký
Vícen lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů.
PROSTOROVÁ AUTOKORELACE V ANALYTICKÉ CHEMII JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, 46 7 Lberec MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Autokorelace
VíceEnergie elektrického pole
Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný
VícePŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ
PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
VíceObsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2
Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1
Více7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM
7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané
VíceJiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace
Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu
VíceSimulační metody hromadné obsluhy
Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro
VíceSTATISTIKA (pro navazující magisterské studium)
Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU
Vícepodle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y
4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.
VíceNumerické metody optimalizace
Numercké metody optmalzace Numercal optmzaton methods Bc. Mloš Jurek Dplomová práce 2007 Abstrakt Abstrakt česky Optmalzační metody představují vyhledávání etrémů reálných funkcí jedné nebo více reálných
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VícePřednáška č. 11 Analýza rozptylu při dvojném třídění
Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané
VíceMetody matematické statistiky (NMAI 061)
Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné
VíceANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha
ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl
VíceMatematika I A ukázkový test 1 pro 2018/2019
Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete
VíceNeparametrické metody
Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady
VíceVLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ
VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje
VíceIDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
VíceAplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček
Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU
AALÝZA RIZIKA A JEHO CITLIVOSTI V IVESTIČÍM PROCESU Jří Marek ) ABSTRAKT Príspevek nformuje o uplatnene manažmentu rzka v nvestčnom procese. Uvádza príklad kalkulace rzka a analýzu jeho ctlvost. Kľúčové
VíceÚloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )
Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v
VíceSIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10
SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním
VíceStaré mapy TEMAP - elearning
Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost
VíceVyužití logistické regrese pro hodnocení omaku
Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost
VíceTento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i
: ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru
Více2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran
Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz
VíceANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceTéma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny
0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí
Více2. Definice pravděpodobnosti
2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceOtto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522
Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS
VíceANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST
Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy
VíceProces řízení rizik projektu
Proces řízení rzk projektu Rzka jevy a podmínky, které nejsou pod naší přímou kontrolou a ovlvňují cíl projektu odcylky, předvídatelná rzka, nepředvídatelná rzka, caotcké vlvy Proces řízení rzk sled aktvt,
VíceLokace odbavovacího centra nákladní pokladny pro víkendový provoz
Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená
VíceZápadočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky
Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou
VíceNumerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První
Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá
VíceAplikace simulačních metod ve spolehlivosti
XXVI. ASR '2001 Semnar, Instruments and Control, Ostrava, Aprl 26-27, 2001 Paper 40 Aplkace smulačních metod ve spolehlvost MARTINEK, Vlastml Ing., Ústav automatzace a nformatky, FSI VUT v Brně, Techncká
VíceKorelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d
Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří
VícePOUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ
5. Odborná konference doktorského studa s meznárodní účastí Brno 003 POUŽITÍ METODY PERT PŘI ŘÍZEÍ PROJEKTŮ A USAGE OF PERT METHOD I PROJECT MAAGEMET Vladslav Grycz 1 Abstract PERT Method and Graph theory
VíceAproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
VíceIterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2
Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...
VíceURČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU
URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU Rudolf Kampf ÚVOD Pro marketng, management a vůbec pro člověka je jstě důležté vědět, jak se bude vyvíjet stuace v ekonomce, stuace v určtém státě z hledska
VíceSolventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová
2. část Solventnost II Standardní vzorec pro výpočet solventnostního kaptálového požadavku Iva Justová Osnova Úvod Standardní vzorec Rzko selhání protstrany Závěr Vstupní údaje Vašíčkovo portfolo Alternatvní
VíceANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jří Holčík, CSc. INVESTICE Insttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a analýz IV - pokračování KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI METRIKY PRO URČENÍ VZDÁLENOSTI
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Více7. Analýza rozptylu jednoduchého třídění
7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky
Víceina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)
Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.
VíceVícerozměrná geometrická analýza dat
Motto: Všechno není jinak Vícerozměrná geometrická analýza dat Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Obsah Jsou popsány základní problémy vznikající v důsledku použití
VíceMOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD
XV. konference absolventů studa technckého znalectví s meznárodní účastí MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD Zdeněk Mrázek 1 1. Ř ešení stř etu u fngovaných
VíceMETODA HLAVNÍCH KOMPONENT A EXPLORATORNÍ ANALÝZA VÍCEROZMĚRNÝCH DAT
MEODA HLAVÍCH KOMPOE A EXPLORAORÍ AALÝZA VÍCEROZMĚRÝCH DA JIŘÍ MILIKÝ, Katedra textlních materálů, echncká unversta v Lberc, Hálkova 6 46 7 Lberec, e- mal: r.mlky@vslb.cz Motto: c není unversální MILA
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE
ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE Jana Valečková 1 1 Vysoká škola báňská-techncká unverzta Ostrava, Ekonomcká fakulta, Sokolská
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Více4EK211 Základy ekonometrie
4EK Základy ekonometre Zobecněná MNČ Cvčení 8 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(u u T ) = σ I n konečný a konstantní
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VíceCHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.
CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt
VíceNormální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
VíceEKONOMICKO-MATEMATICKÉ METODY
. přednáška EKONOMICKO-MATEMATICKÉ METODY Ekonomcko matematcké metody (též se užívá název operační analýza) sou metody s matematckým základem, využívané především v ekonomcké oblast, v oblast řízení a
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceIntervalové Odhady Parametrů II Testování Hypotéz
Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení
VíceMEZNÍ STAVY A SPOLEHLIVOST OCELOVÝCH KONSTRUKCÍ LIMIT STATES AND RELIABILITY OF STEEL STRUCTURES
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta stavební Ústav stavební mechanky Doc. Ing. Zdeněk Kala, Ph.D. MEZNÍ STAVY A SPOLEHLIVOST OCELOVÝCH KONSTRUKCÍ LIMIT STATES AND RELIABILITY OF STEEL STRUCTURES TEZE
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
VíceASYMPTOTICKÉ VLASTNOSTI ODHADŮ S MINIMÁLNÍ KOLMOGOROVSKOU VZDÁLENOSTÍ
ASYMPTOTICKÉ VLASTNOSTI ODHADŮ S MINIMÁLNÍ KOLMOGOROVSKOU VZDÁLENOSTÍ Bc. Jtka Hanousková 1 Abstrakt: Příspěvek se zabývá postačujícím podmínkam pro konzstenc odhadů s mnmální Kolmogorovskou vzdáleností
VícePOČÍTAČOVĚ INTENZIVNÍ METODY VE ZPRACOVÁNÍ VÝSLEDKŮ ANALYTICKÝCH MĚŘENÍ
POČÍTAČOVĚ INTENZIVNÍ METODY VE ZPRACOVÁNÍ VÝSLEDKŮ ANALYTICKÝCH MĚŘENÍ JIŘÍ MILITKÝ, Katedra textilních materiálů, Technická universita v Liberci, 46 7 Liberec MILAN MELOUN, Katedra analytické chemie,
VícePRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
VíceVícekriteriální rozhodování. Typy kritérií
Vícekrterální rozhodování Zabývá se hodnocením varant podle několka krtérí, přčemž varanta hodnocená podle ednoho krtéra zpravdla nebývá nelépe hodnocená podle krtéra ného. Metody vícekrterálního rozhodování
VíceSTATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
VíceSÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G.
SÍŤOVÁ ANALÝZA Využívá grafcko-analytcké metody pro plánování, řízení a kontrolu složtých návazných procesů. yto procesy se daí rozložt na dílčí a organzačně spolu souvseící čnnost. yto procesy se nazývaí
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceVýběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
VíceL8 Asimilace dat II. Oddělení numerické předpovědi počasí ČHMÚ 2007
L8 Asmlace dat II Oddělení numercké předpověd počasí ČHMÚ 007 Plán přednášky Úvod do analýzy Optmální odhad v meteorolog D případ: demonstrace metod; mult-dmensonální případ; Zavedení předběžného pole;
VíceTepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má
Tepelná kapacta C x = C V = ( ) dq ( ) du Dulong-Pettovo pravdlo: U = 3kT N C V = 3kN x V = T ( ) ds x Tepelná kapacta mřížky Osclátor s kvantovanou energí E n = ( n + 2) hν má střední hodnotu energe (po
Víceu (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo
Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)
VíceRegulační diagramy (RD)
Regulační diagramy (RD) Control Charts Patří k základním nástrojům vnitřní QC laboratoře či výrobního procesu (grafická pomůcka). Pomocí RD lze dlouhodobě sledovat stabilitu (chemického) měřícího systému.
Více