VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

Rozměr: px
Začít zobrazení ze stránky:

Download "VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH"

Transkript

1 VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta Pardubce, Pardubce Motto: Všechno je jnak Abstrakt: Jsou popsány základní postupy pro určování odlehlých měření ve vícerozměrných datech, které jsou modfkací postupů pro jednorozměrná data. Jsou vybrány především metody, které př své jednoduchost umožňují zpracovat výběry obsahující skupny vlvných bodů, kde se může projevt jak maskování tak nesprávné zařazení korektních bodů. Jsou uvedeny jednoduché grafy pro dentfkac skupn vlvných bodů. 1.Úvod Jednou ze základních úloh analytcké cheme je smultánní montorování úrovně různých látek v materálech, ovzduší, vodě a půdě. Cílem je často zjštění, zda dané látky (celkem p nepřekračují zadané úrovně. Standardně se vychází z vícerozměrných výběrů obsahujících měření ( Vektor j j pro j té měření obsahuje složky ( j1, j jp. Výsledkem měření je tedy matce dat X řádu p obsahující řádků (měření a p sloupců (látek. Účelem je v nejjednodušším případě stanovení vhodného odhadu vektoru středních hodnot µ a porovnání se zadaným úrovněm µ o. S ohledem na varabltu měření je vhodné ověřt, zda vektor µ o padne do oblast spolehlvost CI vektoru parametrů µ č nkolv. Tato úloha může být komplkována jak nestejným rozptyly tak vzájemnou korelací mez látkam (sloupc matce X. Také celá řada dalších úloh z oblast analytcké cheme vede na zpracování vícerozměrných výběrů. Problém komplkuje to, že data z oblast analytcké cheme mají standardně některé specfcké zvláštnost: (a rozsahy zpracovávaných dat nejsou obyčejně velké, (b v datech se vyskytují výrazné nelnearty, neadtvty a struktury, které je třeba dentfkovat a popsat,

2 (c rozdělení dat jen zřídka odpovídá normálnímu běžně předpokládanému ve standardní statstcké analýze, (d v datech se vyskytují vybočující měření a různé heterogenty, (e statstcké modely se často tvoří na základě předběžných nformací z dat (datově orentované přístupy, (f parametry statstckých modelů mají mnohdy defnovaný fyzkální význam, a musí proto vyhovovat velkostí, znaménkem nebo vzájemným poměrem, (g estuje jstá neurčtost př výběru modelu, popsujícího chování dat. Z hledska použtí statstckých metod je proto žádoucí mít možnost zkoumat statstcké zvláštnost dat (průzkumová analýza, ověřovat základní předpoklady o datech a hodnott kvaltu výsledků s ohledem na základní schéma "data - model - statstcká metoda" Toto schéma se považuje za základ nteraktvní tvorby statstckých modelů všeho druhu. Př jeho praktckém použtí však nastávají problémy s tzv. vybočujícím hodnotam (body a to nejen s jejch ndkací, ale zejména nterpretací a omezením jejch vlvu. Všeobecně se soudí, že většna statstckých metod je výrazně negatvně ovlvněna přítomností vybočujících bodů. Ve skutečnost záleží na tom, o jaké vybočující body jde, a kde se vyskytují. ( např. v regresní analýze mohou vybočující body jak zvětšovat tak zmenšovat korelační koefcent. V některých případech je třeba rozhodnout, zda podezřelé hodnoty považovat za správné (a pracovat např. se zeškmeným rozdělením nebo za chybné a jejch vlv elmnovat. Toto rozhodnutí nelze učnt bez znalost způsobu získávání dat a realzace epermentů. esprávné rozhodnutí může mít katastrofcké důsledky s ohledem na nterpretac výsledků a praktcké závěry. V této prác popsány postupy pro určování odlehlých měření ve vícerozměrných datech, které jsou modfkací postupů pro jednorozměrná data. Jsou uvedeny jednoduché grafy pro dentfkac skupn vlvných bodů.. Vybočující body Pojem vybočující body evokuje představu, že jde o body, které lze vzuálně určt na základě vhodného zobrazení. To platí pro jednorozměrné výběry, kdy vybočující znamená také odlehlé. Ve vícerozměrných případech jsou vybočující hodnoty buď odlehlé co do hodnot od ostatních nebo neodpovídající strukturám v ostatních datech. Pro vybočující body obecně platí, že: - zkreslují výsledky - nelíbí se vypadají nepatřčně - zhoršují přesnost - neumožňují selekc modelu

3 Pro dentfkac odlehlých měření je obecně třeba: - defnovat čstá data - určt pravděpodobnostní model dat (a často vybočujících bodů - odhadnout parametry tohoto modelu Př analýze vybočujících bodů se množna ndeů I = (1,,3, rozkládá na podmnožnu potencálně dobrých dat D a potencálně vybočujících bodů V. Tedy I = (D,V. Počet potencálně dobrých dat je D a počet potencálně vybočujících bodů je V. Podíl vybočujících bodů je pak e = V /. echť je rozdělení podílu 1 - e dobrých bodů charakterzováno dstrbuční funkcí G( µ 0, Σ 0 s vektorem středních hodnot µ 0 a kovaranční matcí Σ 0 a rozdělení podílu e potencálních vybočujících bodů je µ+µ 0 H ( µ+ µ 0, Ω s vektorem středních hodnot a kovaranční matcí Ω. Očekávaná hodnota výběrového průměru p ze všech dat je pak = 0 E( p µ + e µ a očekávaná hodnota výběrové kovaranční matce S je E ( S = (1 e Σ 0 + e Ω + e (1 e µ Je tedy patrné, že výběrové průměry a kovaranční matce ze všech dat jsou závslé jak na podílu vybočujících bodů tak na jejch parametrech. To může vést k stuac, kdy se z odhadů získaných ze všech dat nedají určt vybočující body. ejhorší stuace z hledska ndkace vybočujících bodů je případ, kdy obě kovaranční matce mají stejný tvar. Tento typ vybočujících bodů se označuje jako posunuté vybočující body. Pro ndkac vybočujících měření se často s výhodou používá defnce zobecněné vzdálenost T µ d = ( AD T *[ w( D, p * S D ] 1 * ( AD kde AD a S D jsou vektor artmetckých průměrů a kovaranční matce pro potencálně dobrá data. Korekční faktor w(d,p byl zaveden ve tvaru [4] p + 1 w( D, p = D p D p

4 Většna metod pro ndkac vybočujících bodů vychází z představy vícerozměrné normalty, kdy a G ( µ 0, Σ 0 = ( µ 0, Σ 0 H µ + µ, Ω = ( µ + e µ, k. ( 0 0 Ω Tato představa je potřebná pro určení krtckých mezí oddělujících dobrá a špatná data. Podíl e ovlvňuje také špčatost rozdělení měření. Pro jednorozměrné výběry asymptotcky (pro s / D s V platí, že špčatost g je dána vztahem g = e 3 + (1 e e (1 e 3 Pro e = 0,5 je g = 1 (mnmum a pro e blízké nule je g rostoucí nade všechny meze. ejmenší počet e dobrých bodů je e = nt[( + p +1 / ] Technky ndkace vybočujících bodů jsou ctlvé na tzv. maskování, kdy vybočující jeví jako korektní (díky zvětšení kovaranční matce. Dalším problémem je překryt, kdy přítomnost vybočujících měření způsobí, že některá správná měření leží mmo akceptovatelnou oblast.(díky zkreslení kovaranční matce [1]. Schematcky jsou tyto stuace znázorněny na obr. 1 (vybočující body jsou tmavé. A. maskování B. překryt Obr. 1 Příklad maskování (A a překrytu (B

5 Znázornění na obr 1. vychází z faktu, že čtverce zobecněných vzdáleností mají χ p rozdělení (elpsa je tedy hranční oblast oddělující dobrá (D a vybočující (V data. Řada metod pro dentfkac vybočujících bodů funguje jen pro některé stuace nebo modely datových struktur. Příkladem jsou technky uvažující pouze jedno vybočující měření (testy založené na odchylkách od průměru atd. nebo specální metody pro regresní modely. Samostatným problémem je nterpretace vybočujících hodnot. Estují dvě mezní stuace: A. Vybočující měření je chybné. To je třeba. případ, kdy vznkne chyba př měření, resp. zpracování dat (např. místo 0.74 je použta hodnota 74. B. Vybočující měření je správné. To je případ, kdy byl použt nesprávný předpoklad o rozdělení dat (např. normalta pro případ, že reálné rozdělení je slně zeškmené nebo jde o tzv. řídké jevy (které se u malých výběrů mohou jevt jako vybočující. V realtě nelze často rozhodnout, o který případ se vlastně jedná. Problém je také v tom, co s vybočujícím hodnotam dělat. Přímá možnost, tj. jejch odstranění je nebezpečná ze dvou důvodů: a data se upravují tak, aby vyhovovala předpokládanému modelu a nelze tedy dobře posoudt jeho vhodnost, b varablta dat vyjde etrémně nízká, což se může negatvně projevt př porovnání s novým daty, resp. nformacem Jednotný postup zde neestuje a záleží na epermentátorov, resp. zpracovatel jakou varantu zvolí.vzhledem k tomu, že vybočující body jsou většnou etrémně vlvné vede zde nevhodná manpulace ke ztrátě nformací a nesprávným závěrům. V souvslost s vybočujícím body je možné defnovat tyto základní paradoy: 1. známe - l rozdělení dat a model můžeme určt vybočující hodnoty. Model a rozdělení dat se však hledá.. pro posouzení vybočujících měření potřebujeme znát čstá data. Robustním metodam však dostaneme data čstá s ohledem na základní model

6 3. e vše co vypadá jako vybočující skutečně vybočuje a naopak (maskování, překryt 4. Platí, že co je vybočující pro jeden model může být akceptovatelné pro jný model 3. Jednorozměrné výběry Standardní způsob zpracování jednorozměrných výběrů spočívá ve výpočtu artmetckého průměru A a výběrového rozptylu s. Je známo, že pokud zpracovávaný výběr velkost prochází z ne - normálního rozdělení se střední hodnotou µ a rozptylem σ (< má náhodná velčna Z = * ( A µ /σ (1 asymptotcky normální rozdělení. Pokud není σ známo, nahrazuje se výběrovou směrodatnou odchylkou s. Pak má tzv. Studentova náhodná velčna t * ( A µ / s = ( Studentovo rozdělení s ( - 1 stupn volnost. Asymptotcká normalta velčny Z resp. Studentovo rozdělení velčny t umožňuje konstrukc ntervalu spolehlvost střední hodnoty µ. Př tzv. frekventstckém přístupu je 100 (1 - α % na nterval spolehlvost CI defnován vztahem ( CID µ CIH = 1 α P (3 Symbol P (. označuje pravděpodobnost a α je tzv. hladna významnost. Obyčejně se volí α = 0.05 nebo α = 0.01 s tím, že čím je α menší, tím je nterval (CID, CIH šrší. Př znalost rozptylu σ je možno nterval spolehlvost CI vyjádřt ve tvaru s α / µ A z A z1 * α / * (4 kde z1 α / = zα / jsou kvantly normovaného normálního rozdělení. Pokud není σ známo lze použít vztah s A s t1 / ( 1 * A t / ( 1 * α µ α (5 s

7 t t kde 1 α / ( 1 = α / ( 1 jsou kvantly Studentova rozdělení s -1 stupn volnost. Pro případ normálního rozdělení mají ntervaly (4 resp. (5 přesně 100(1-α % ní pokrytí střední hodnoty.to znamená, že jen v 100α/ % případů je střední hodnota menší než CI (nejstota P zprava a v 100α/ % případů je větší než CI (nejstota L zleva.pro případ ne-normálního rozdělení platí tyto ntervaly pouze asymptotcky tedy pro dostatečně vysoká. Dostatečná velkost závsí slně na škmost g1( rozdělení z kterého data pocházejí [3]. Pro kvantfkac vlvu škmost na rozdělení náhodné velčny Z defnované rov. (1 je možno použít prvního členu Edgeworthova rozvoje pro, který platí P( Z g1( * ( 1 = Fn ( f n ( (6 6 Zde F n ( je dstrbuční funkce normovaného normálního rozdělení a f n ( je odpovídající hustota pravděpodobnost. Škmost náhodné velčny Z je dána vztahem g Z g ( / 1 ( = 1 (7 Čím je g 1 (Z blíže k nule, tím je rozdělení velčny Z blžší normálnímu. Z rov. (6 je patrné, že pro rozdělení dat zeškmené k vyšším hodnotám (tj. g 1 ( kladné, je také rozdělení náhodné velčny Z zeškmené k vyšším hodnotám (tj. g 1 (Z kladné. Interval spolehlvost (4 pak má vyšší horní mez CIH a vyšší dolní mez CID než odpovídá reálnému rozdělení statstky Z. apř. pro výběr rozsahu =10 ze standardzovaného eponencálního rozdělení, kdy je g 1 (=, je 97.5 % ní kvantl rozdělení velčny Z určený z rov. (6 roven.4 a odpovídající kvantl normovaného normálního rozdělení je pouze Podobně lze určt, že.5 % ní kvantl Z je pouze 1.65 oprot odpovídajícímu kvantlu normovaného normálního rozdělení Interval spolehlvost defnovaný rov. (4 je tedy celý posunut doprava oprot skutečnému [3]. Také pro kvantfkac vlvu škmost na rozdělení náhodné velčny t defnované rov. ( je možno použít prvního členu Edgeworthova rozvoje P( t g1( * ( + 1 = Fn ( + f n ( (8 6 Zde je opět F n ( dstrbuční funkce normovaného normálního rozdělení a f n ( je odpovídající hustota pravděpodobnost. Př porovnání s rov. (6, je patrné

8 opačné znaménko korekčního členu, což znamená, že pro rozdělení dat zeškmené k vyšším hodnotám (tj. g 1 ( kladné, je rozdělení náhodné velčny t zeškmené k nžším hodnotám (tj. g 1 (t záporné. Interval spolehlvost (5 pak má nžší horní mez CIH a nžší dolní mez CID než odpovídá reálnému rozdělení statstky t. Interval spolehlvost defnovaný rov. (5 je tedy celý posunut doleva oprot skutečnému [3]. To je zvláště nepříjemné u dat slně zeškmených vpravo a vede to k přehnaně optmstckým závěrům. Př testování hypotéz o střední hodnotě se používá statstka ( A µ 0 t( s = (9 Zde je uvažováno jako poslední hodnota ve výběru tj. =. Obecně přjímaný předpoklad je, že stačí přítomnost jednoho vybočujícího bodu aby došlo ke zvýšení t( a tedy zamítnutí nulové hypotézy H o : µ = µ 0 je nesprávný. a obr. je zakreslen průběh funkce t( pro výběr V = (10, 10, 11,11, pro = 5,6, 50. Hvězdčkam je znázorněna krtcká hodnota Studentova rozdělení t1 α ( 1 =.1318 pro α = 0.05 a = 5, která platí pro alternatvní hypotézu H A : µ> µ 0..5 t krtcke 1.5 t( 1 t( Obr. Vlv velkost posledního bodu výběru (10,10,11,11, na velkost t(

9 Je patrné, že pouze malá oblast nad hvězdčkam vede k přjetí alternatvní hypotézy a slně vybočující bod naopak podporuje hypotézu nulovou o shodě střední hodnoty s. Dá se také ukázat, že [5] µ 0 = 10 lm t( = ± 1 ± Snadno lze také odvodt, jakému odpovídá mamum t(. Zaveďme označení 1 a = a b 1 =. Pak v případě, že a ( 1 µ 0 nabývá t( = 1 = 1 nejvyšší hodnoty pro c rovno [5] c = b aµ 0 a ( 1 µ 0 Je tedy patrné, že slně vybočující měření vede k poklesu t(. Pokud je a = ( 1 µ 0 je t(.monotónně rostoucí od 1 do 1. Příklad Mějme čstá data D1= (10, 10, 11, 11, 1 a µ 0 = 10. Pak t( =,138. Pro data s vybočujícím měřením D = (10,10,11,11,18 je však t( = 1,318. Tedy hypotéza Ho: µ 0 = 10 je pravděpodobnější. Mamálnímu t( odpovídá hodnota c = 11. Pro dentfkac vybočujících hodnot se používá řady testů založených na defnc standardzované mamální odchylky od artmetckého průměru (počítaného bez etrémní hodnoty. Jednoduchá momentová metoda předpokládá, že vybočující je takové j,pro které je A * K. s * j c kde K c [ 0.8. g * 1.log( /10] = *, s*... čsté odhadnuty střední hodnoty a směrodatné odchylky A (bez podezřelého bodu j. g *... odhad špčatost bez vybočujícího bodu

10 g * =. ( 4 [ ( ] Postup je vhodný pro 0. Pro = 0 vyjde pro různá rozdělení: ormální rozdělení g = 3 K c = 1.89 Rovnoměrné rozdělení g = 1.8 K c = 1.77 Laplaceovo rozdělení g = 6 K c =.09 V případě více vybočujících měření se postupně vylučují podezřelé body na základě výše uvedeného krtéra nebo se smultánně určují všechny vybočující hodnoty pro různé kombnace podezřelých bodů. Obecně je tedy třeba řešt tyto úlohy: A. Výběr vhodného rozdělení dat B. určení čstých odhadů ze všech bodů, nebo podmnožny čstých bodů C. nalezení krtcké hodnoty pro selekc vybočujících bodů Jako vhodné rozdělení dat (A se většnou uvažuje rozdělení normální, protože umožňuje jednoduché nalezení krtckých hodnot (C. Pro určení čstých odhadů se používají především různé robustní metody. Pro nalezení čstých bodů se používá dvou přístupů: Brute force kdy se zkouší všechny možné kombnace podvýběrů. Tento postup vede k cíl ale je časově náročný. Clean subset kdy se hledají data, která jsou určtě čstá a nezkreslí odhady střední hodnoty a rozptylu. Je snahou nalézt takové metody, které nevyžadují přílš komplkované výpočty a přtom jsou dostatečně spolehlvé. Obecně lze tento přístup použít pro lbovolně rozměrná data. 4. Vícerozměrná data Předpokládejme pro jednoduchost, že nestrukturovaná data mají p rozměrné normální rozdělení ( µ, Σ, kde µ je vektor středních hodnot a Σ je kovaranční matce. Vybočující měření leží v oblast out( α p T 1 ( R : ( µ Σ ( µ χ µ, Σ = > 1 α 1 α

11 Tato oblast pokrývá celý prostor E p s vyloučením vícerozměrného elpsodu kolem vektoru středních hodnot. Vybočující body jsou tedy přílš vzdáleně od střední hodnoty. Oblast vybočujících bodů OR pro výběr velkost je určena výrazem p T 1 ( R : ( S ( c( p,, α OR ( α α, = >, 1 A A kde α = ( 1 α pro α = 0.05, Vše co leží v OR je vybočující. Oblast vybočujících bodů úzce souvsí se zobecněnou (Mahalanobsovou vzdáleností resp. jejch čtvercem d = ( A T S 1 ( A Jako vybočující se pak dentfkují ty body, pro které je d > c( p,, α Pro případ vícerozměrného normálního rozdělení a velké výběry je ( p,, α dáno kvantlem chí kvadrát rozdělení c c( p,, α = χ p (1 α / Pro malé výběry je lépe použít modfkovaný koefcent c( p,, α = p * ( 1 * ( n p 1+ * F p, p 1 p * F p, p 1 (1 α / (1 α / Je zajímavé, že pro případ jednoho vybočujícího měření neroste zobecněná vzdálenost nade všechny meze, ale je ohrančená hodnotou d ma ( 1 Wlks použl pro určení jednoho vybočujícího bodu ve vícerozměrných datech statstku R = det( S det( S

12 kde S je odhad kovaranční matce s vynecháním -tého bodu a S je odhad kovaranční matce ze všech bodů. Mnmální R ndkuje potencální vybočující bod. Dá se ukázat, že R souvsí se čtvercem zobecněné vzdálenost vztahem R = 1 ( 1 d Aby bylo možno použít zobecněné vzdálenost pro dentfkac vlvných bodů, je třeba určt čsté odhady A a S. Pro robustní odhady se často volí [1]: - M odhady - S odhady mnmalzující det S s omezením - Odhady mnmalzující objem konfdenčního elpsodu Pro stanovení čsté podmnožny dat se doporučuje BACO algortmus, složený z těchto kroků: 1. určení základní podmnožny m > p čstých dat. odhady parametrů předpokládaného modelu M a nalezení rezduí pro všechny body 3. doplnění základní podmnožny o data s malým rezdu a vyloučení dat s velkým rezdu 4. terace kroků a 3 až se překročí pravdlo ukončení 5. body, které nejsou v základní podmnožně jsou vybočující BACO pro vícerozměrná data (bez struktury se skládá z těchto kroků: 1.Výběr základní podmnožny bud na základě - Mahalanobsovy vzdálenost a uřezání podezřelých dat - Vzdálenost od medánu Výsledkem je podmnožna čstých dat s parametry Ac S c. Výpočet rezduí d = ( AC T S 1 C ( AC 3. doplnění čsté podmnožny o body s rezduem menším než c * χ α, kde c 1 = ma(0, ( h r /( h + r ; h = ( n + p + 1 / c = 1+ ( p + 1 /( n p + /( n 1 3p c = c 1 +c

13 4. Skončení procesu v okamžku, kdy se jž nc nepřdává an neubírá Poměrně jednoduchá je metoda využívající kombnace dentfkace potencálně vybočujících bodů a uřezaných odhadů. V té terac se určí uřezané odhady RC a S C, kde se uřezává defnované procento ( obyčejně 30% bodů s nejvyšším zobecněným vzdálenostm z vektoru d -1 vypočítaného v -1 té terac. Z takto získaných odhadů se vypočte vektor opravených zobecněných vzdáleností d a přechází se na +1 ní terac. Proces je ukončen, když se ve dvou následujících teracích nemění odhady parametrů RC a S C (mamální rozdíl je menší než Grafcká nterpretace výsledků Př dentfkac skupn vybočujících bodů se s výhodou volí různé typy grafů. Mez základní patří: A. Indeový graf pro Mahalanobsovy vzdálenost. Vynáší se d ( prot a krtcká úroveň. Vybočující body leží nad touto úrovní (0.5 B. Q-Q graf funkcí d p, p. Vynáší se y = d ( prot = Fp, p ( + 1 F medan( d možné také volt klascký Q-Q graf, kdy se vynáší pořádkové statstky d ( (tj. vzestupně uspořádané čtverce vzdáleností prot kvantlům χ p rozdělení.. Poměr y / > ndkuje vybočující body. Je C. Úhlová metoda založená na jednorozměrné projekc dat. Je známo, že 1 pro elptcké rozdělení X = Σ * y + µ má y = S ( m crkulární rozdělení a = má vícerozměrné rovnoměrné u y / rozdělení. Pro zvolené u o má pak velčna rovnoměrné rozdělení. u0 u y w 1 = cos ( u T 0 u Zde u o je blízké směrům, kde nabývá špčatost mama resp. mnma.

14 Konstruuje se tedy Q-Q graf pro rovnoměrné rozdělení, kdy se vynáší w ( vs. P = /(+1 w ( f 5. Program EXMUL Pro dentfkac vybočujících bodů ve vícerozměrných datech byl sestaven program EXMUL v jazyce MATLAB. Program obsahuje tyto část: - Eploratorní grafy pro vícerozměrná data [1] - Robustní odhad A a S využívající elptcké vícerozměrné uřezání Indeový graf pro d - Q-Q graf pro funkc d - Úhlový graf Pro lustrac čnnost tohoto programu byla použta Hockngova syntetcká data určená pro regresní dagnostku. =6, p = 4 Model: Y = a0 + a1*1 + a* + a3*3 Generace dat : y= 0 + 3*1 - * + eps1 eps1...náhodná čísla z (0,.5 multkolnearta: *3 = 60-3*1-1.5* + eps, eps... náhodná čísla z (0,.16 Vybočující body : č.11,17,18. Etrém : č.4 (leží mmo rovnu multkolnearty Data byla zpracována jako nestrukturalzovaná. Výstupy jsou na obr. 3-9.

15 100 Andrews Curves Andrews Functon Obr. 3 Andrewsův graf Theta Obr. 4 Paralelní souřadnce Obr. 5 Hvězdy

16 Obr. 6 Zobecněné vzdálenost (Mahalanobsovy pro odhady středních hodnot a kovaranční matce ze všech dat (momenty Obr. 7 Zobecněné vzdálenost (Mahalanobsovy pro robustní odhady středních hodnot a kovaranční matce (30% uřezání.

17 Obr. 8 Q-Q graf pro funkc d Obr. 9 Úhlová metoda Je patrné, že: 1. ejvíce vlvný je bod č.. Vybočující jsou body 11, 17, 18 ale také. 3. Robustní Mahalanobsova vzdálenost je vhodná pro vícerozměrná data 4. Indeový graf je jednoduchý a přehledný př postačující schopnost dentfkovat skupny vybočujících bodů

18 Stále platí, že je třeba nejen dentfkovat potencální vybočující hodnoty ale také rozhodnout co s nm dále 8. Závěr Je patrné, že statstcké zpracování dat v analytcké chem má celou řadu specfckých zvláštností. V řadě případů je třeba ve zdánlvě jednoduchých stuacích používat poměrně komplkované metody. Formální aparát statstky resp. přzpůsobení dat potřebám statstcké analýzy bez hlubšího rozboru zde může vést ke katastrofckým závěrům. Poděkování: Tato práce vznkla s podporou výzkumného centra Tetl L00B Lteratura [1] Meloun M., Mltký J.: Zpracování epermentálních dat, East Publshng Praha 1998 [] Barnett V., Lews T.: Outlers n statstcal data, 3rd. Ed., Wley, Chcheter 1994 [3] Campbell.A.: Appl. Statst. 9, 31 (1980 [4] Had A. S.: J. R. Stat. Soc. B56, 393 (1994 [5] Grmmet D.R., Rdenhorn J.R.: Amer. Statst. 50, 145 (1996 [6] Hockng R.R.,Pendleton O.J.: Commun.Statst. A1,497 (1983

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

4.4 Exploratorní analýza struktury objektů (EDA)

4.4 Exploratorní analýza struktury objektů (EDA) 4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů.

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů. PROSTOROVÁ AUTOKORELACE V ANALYTICKÉ CHEMII JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, 46 7 Lberec MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Autokorelace

Více

Energie elektrického pole

Energie elektrického pole Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný

Více

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2 Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu

Více

Simulační metody hromadné obsluhy

Simulační metody hromadné obsluhy Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Numerické metody optimalizace

Numerické metody optimalizace Numercké metody optmalzace Numercal optmzaton methods Bc. Mloš Jurek Dplomová práce 2007 Abstrakt Abstrakt česky Optmalzační metody představují vyhledávání etrémů reálných funkcí jedné nebo více reálných

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Přednáška č. 11 Analýza rozptylu při dvojném třídění Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané

Více

Metody matematické statistiky (NMAI 061)

Metody matematické statistiky (NMAI 061) Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

IDENTIFIKACE BIMODALITY V DATECH

IDENTIFIKACE BIMODALITY V DATECH IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti

Více

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU AALÝZA RIZIKA A JEHO CITLIVOSTI V IVESTIČÍM PROCESU Jří Marek ) ABSTRAKT Príspevek nformuje o uplatnene manažmentu rzka v nvestčnom procese. Uvádza príklad kalkulace rzka a analýzu jeho ctlvost. Kľúčové

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

Staré mapy TEMAP - elearning

Staré mapy TEMAP - elearning Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i : ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST Abstrakt ANALÝZA ZKA A CTLOST JAKO SOUČÁST STUDE POVEDTELNOST 1. ČÁST Jří Marek Úspěšnost nvestce závsí na tom, jaké nejstoty ovlvní její předpokládaný žvotní cyklus. Pomocí managementu rzka a analýzy

Více

Proces řízení rizik projektu

Proces řízení rizik projektu Proces řízení rzk projektu Rzka jevy a podmínky, které nejsou pod naší přímou kontrolou a ovlvňují cíl projektu odcylky, předvídatelná rzka, nepředvídatelná rzka, caotcké vlvy Proces řízení rzk sled aktvt,

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Aplikace simulačních metod ve spolehlivosti

Aplikace simulačních metod ve spolehlivosti XXVI. ASR '2001 Semnar, Instruments and Control, Ostrava, Aprl 26-27, 2001 Paper 40 Aplkace smulačních metod ve spolehlvost MARTINEK, Vlastml Ing., Ústav automatzace a nformatky, FSI VUT v Brně, Techncká

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří

Více

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ 5. Odborná konference doktorského studa s meznárodní účastí Brno 003 POUŽITÍ METODY PERT PŘI ŘÍZEÍ PROJEKTŮ A USAGE OF PERT METHOD I PROJECT MAAGEMET Vladslav Grycz 1 Abstract PERT Method and Graph theory

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU

URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU URČOVÁNÍ TRENDŮ A JEJICH VÝZNAM PRO EKONOMIKU Rudolf Kampf ÚVOD Pro marketng, management a vůbec pro člověka je jstě důležté vědět, jak se bude vyvíjet stuace v ekonomce, stuace v určtém státě z hledska

Více

Solventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová

Solventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová 2. část Solventnost II Standardní vzorec pro výpočet solventnostního kaptálového požadavku Iva Justová Osnova Úvod Standardní vzorec Rzko selhání protstrany Závěr Vstupní údaje Vašíčkovo portfolo Alternatvní

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jří Holčík, CSc. INVESTICE Insttut DO bostatstky ROZVOJE VZDĚLÁVÁNÍ a analýz IV - pokračování KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI METRIKY PRO URČENÍ VZDÁLENOSTI

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

Vícerozměrná geometrická analýza dat

Vícerozměrná geometrická analýza dat Motto: Všechno není jinak Vícerozměrná geometrická analýza dat Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Obsah Jsou popsány základní problémy vznikající v důsledku použití

Více

MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD

MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD XV. konference absolventů studa technckého znalectví s meznárodní účastí MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD Zdeněk Mrázek 1 1. Ř ešení stř etu u fngovaných

Více

METODA HLAVNÍCH KOMPONENT A EXPLORATORNÍ ANALÝZA VÍCEROZMĚRNÝCH DAT

METODA HLAVNÍCH KOMPONENT A EXPLORATORNÍ ANALÝZA VÍCEROZMĚRNÝCH DAT MEODA HLAVÍCH KOMPOE A EXPLORAORÍ AALÝZA VÍCEROZMĚRÝCH DA JIŘÍ MILIKÝ, Katedra textlních materálů, echncká unversta v Lberc, Hálkova 6 46 7 Lberec, e- mal: r.mlky@vslb.cz Motto: c není unversální MILA

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE Jana Valečková 1 1 Vysoká škola báňská-techncká unverzta Ostrava, Ekonomcká fakulta, Sokolská

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometre Zobecněná MNČ Cvčení 8 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(u u T ) = σ I n konečný a konstantní

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

EKONOMICKO-MATEMATICKÉ METODY

EKONOMICKO-MATEMATICKÉ METODY . přednáška EKONOMICKO-MATEMATICKÉ METODY Ekonomcko matematcké metody (též se užívá název operační analýza) sou metody s matematckým základem, využívané především v ekonomcké oblast, v oblast řízení a

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Intervalové Odhady Parametrů II Testování Hypotéz

Intervalové Odhady Parametrů II Testování Hypotéz Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení

Více

MEZNÍ STAVY A SPOLEHLIVOST OCELOVÝCH KONSTRUKCÍ LIMIT STATES AND RELIABILITY OF STEEL STRUCTURES

MEZNÍ STAVY A SPOLEHLIVOST OCELOVÝCH KONSTRUKCÍ LIMIT STATES AND RELIABILITY OF STEEL STRUCTURES VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta stavební Ústav stavební mechanky Doc. Ing. Zdeněk Kala, Ph.D. MEZNÍ STAVY A SPOLEHLIVOST OCELOVÝCH KONSTRUKCÍ LIMIT STATES AND RELIABILITY OF STEEL STRUCTURES TEZE

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

ASYMPTOTICKÉ VLASTNOSTI ODHADŮ S MINIMÁLNÍ KOLMOGOROVSKOU VZDÁLENOSTÍ

ASYMPTOTICKÉ VLASTNOSTI ODHADŮ S MINIMÁLNÍ KOLMOGOROVSKOU VZDÁLENOSTÍ ASYMPTOTICKÉ VLASTNOSTI ODHADŮ S MINIMÁLNÍ KOLMOGOROVSKOU VZDÁLENOSTÍ Bc. Jtka Hanousková 1 Abstrakt: Příspěvek se zabývá postačujícím podmínkam pro konzstenc odhadů s mnmální Kolmogorovskou vzdáleností

Více

POČÍTAČOVĚ INTENZIVNÍ METODY VE ZPRACOVÁNÍ VÝSLEDKŮ ANALYTICKÝCH MĚŘENÍ

POČÍTAČOVĚ INTENZIVNÍ METODY VE ZPRACOVÁNÍ VÝSLEDKŮ ANALYTICKÝCH MĚŘENÍ POČÍTAČOVĚ INTENZIVNÍ METODY VE ZPRACOVÁNÍ VÝSLEDKŮ ANALYTICKÝCH MĚŘENÍ JIŘÍ MILITKÝ, Katedra textilních materiálů, Technická universita v Liberci, 46 7 Liberec MILAN MELOUN, Katedra analytické chemie,

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

Vícekriteriální rozhodování. Typy kritérií

Vícekriteriální rozhodování. Typy kritérií Vícekrterální rozhodování Zabývá se hodnocením varant podle několka krtérí, přčemž varanta hodnocená podle ednoho krtéra zpravdla nebývá nelépe hodnocená podle krtéra ného. Metody vícekrterálního rozhodování

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G.

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G. SÍŤOVÁ ANALÝZA Využívá grafcko-analytcké metody pro plánování, řízení a kontrolu složtých návazných procesů. yto procesy se daí rozložt na dílčí a organzačně spolu souvseící čnnost. yto procesy se nazývaí

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

L8 Asimilace dat II. Oddělení numerické předpovědi počasí ČHMÚ 2007

L8 Asimilace dat II. Oddělení numerické předpovědi počasí ČHMÚ 2007 L8 Asmlace dat II Oddělení numercké předpověd počasí ČHMÚ 007 Plán přednášky Úvod do analýzy Optmální odhad v meteorolog D případ: demonstrace metod; mult-dmensonální případ; Zavedení předběžného pole;

Více

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má Tepelná kapacta C x = C V = ( ) dq ( ) du Dulong-Pettovo pravdlo: U = 3kT N C V = 3kN x V = T ( ) ds x Tepelná kapacta mřížky Osclátor s kvantovanou energí E n = ( n + 2) hν má střední hodnotu energe (po

Více

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)

Více

Regulační diagramy (RD)

Regulační diagramy (RD) Regulační diagramy (RD) Control Charts Patří k základním nástrojům vnitřní QC laboratoře či výrobního procesu (grafická pomůcka). Pomocí RD lze dlouhodobě sledovat stabilitu (chemického) měřícího systému.

Více