VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

Rozměr: px
Začít zobrazení ze stránky:

Download "VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT"

Transkript

1 VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, Pardubce, 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v exploratorní analýze dat vyšetřují statstcké zvláštnost, jako je lokální koncentrace dat, tvarové zvláštnost rozdělení dat a přítomnost podezřelých hodnot. Odhalí se tak anomále a odchylky rozdělení výběru od předpokládaného symetrckého rozdělení Gaussova, (obr. 1). Příkladem asymetrckého rozdělení je log-normální rozdělení (obr. ). V druhém kroku se ověří základní předpoklady, kladené na výběr, jako jsou nezávslost prvků, homogenta výběru, dostatečný rozsah výběru a rozdělení výběru. Jsou-l závěry tohoto kroku optmstcké, následuje vyčíslení klasckých odhadů polohy a rozptýlení, tj. artmetckého průměru a rozptylu ve kroku čtvrtém. Sem patří konstrukce ntervalů spolehlvost a případně testování hypotéz. V opačném případě následuje pokus o třetí krok, obsahující symetrzující transformac dat. Ve třetím kroku se provádí mocnnná a Boxova-Coxova transformace, které mohou vést k symetrčtějšímu rozdělení výběru a umožňují provedení korektnějšího odhadu polohy a rozptýlení. Transformace je vhodná především př nekontantnost rozptylu a př asymetr rozdělení původních dat. Ve čtvrtém kroku se v konfrmatorní analýze nabízí paleta rozlčných odhadů polohy, rozptýlení a tvaru, jež lze rozdělt do skupn: klascké odhady a robustní odhady (nectlvé na odlehlé prvky výběru, resp. další předpoklady o datech). Z nabídky odhadů parametrů vybírá užvatel uvážlvě ty, jež mají statstcký smysl a odpovídají závěrům průzkumové analýzy dat a závěrům ověření předpokladů o výběru.. Průzkumová analýza dat (EDA).1 Dagnostcké grafy Prvním krokem v analýze jednorozměrných dat je průzkumová analýza. Vychází se z pořádkových statstk výběru tj. z prvků výběru, uspořádaných vzestupně x # x #... # x. Platí, že střední (1) () (n) hodnota -té pořádkové statstky x () je rovna 100P procentnímu kvantlu výběrového rozdělení Q(P ) a symbol P. /(n + 1) označuje pořadovou pravděpodobnost. V průzkumové analýze se - často používá specálních kvantlů L pro pořadové pravděpodobnost P =, = 1,,..., které se nazývají písmenové hodnoty. Kromě medánu exstují vždy dvojce kvantlů, defnujících dolní - - a horní písmenové hodnoty L D a L H, např. F D pro P = a F H pro P = tý kvantl 1 Medán -1 =1 / Kvartly - = 1 / 4 3 Oktly -3 = 1 / 8 4 Sedecly -4 = 1 / 16 Pořadová Písmenová pravděpodobnost P hodnota L Počet praktcky určtelných písmenových hodnot ve výběru velkost n L závsí na jeho rozsahu n, a to dle vzorce n L ln(n % 1). M F E D

2 Dagram rozptýlení (osa x: hodnoty x, osa y: lbovolná úroveň, např. y = 0). Představuje jednorozměrnou projekc kvantlového grafu do osy x. I př své jednoduchost ukazuje na lokální koncentrace dat a ndkuje podezřelá a vybočující měření. Rozmítnutý dagram rozptýlení (osa x: hodnoty x, osa y: nterval náhodných čísel). Dagram představuje projekc kvantlového grafu, body jsou však vhodně rozmítnuté ve směru osy y. Krabcový graf (osa x: úměrná hodnotám x, osa y: lbovolný nterval). Pro částečnou sumarzac dat lze využít krabcového grafu, který umožňuje znázornění robustního odhadu polohy, medánu M, dále posouzení symetre v okolí kvartlů, posouzení symetre u konců rozdělení, a konečně dentfkac odlehlých dat. Krabcový graf je obdélník o délce R F= F H - FD s vhodně zvolenou šířkou, která je úměrná hodnotě n. V místě medánu M je vertkální čára a úsečky obou krabcových fousů jsou ukončeny vntřním hradbam B H, B,dle D B H ' F H % 1.5 R F, B D ' F D & 1.5 R F Prvky výběru mmo nterval vntřních hradeb [B H, B,] D jsou považovány za podezřelé (obvykle vybočující body), což je v grafu znázorněno kroužky. Kvantlový graf (osa x: pořadová pravděpodobnost P, osa y: pořádková statstka x ()). Umožňuje přehledně znázornt data a snadněj rozlšt tvar rozdělení, který může být symetrcký, seškmený k vyšším nebo nžším hodnotám. Ke snadnějšímu porovnání s normálním rozdělením se do tohoto grafu zakreslují kvantlové funkce, N P = ˆµ + ˆσ u pro 0 # P # 1: (1) klasckých P, odhadů parametrů polohy a rozptýlení, tj. artmetckého průměru a směrodatné odchylky ˆµ = x a ˆσ = s, a dále () robustních odhadů, tj. medánu M, ˆµ = M a ˆσ = R F/1.349, kde R F= F H - FD je nterkvartlové rozpětí. Graf polosum (osa x: pořádkové statstky x, osa y: Z = 0.5 (x + x )). Pro symetrcké () (n + 1 -) () rozdělení je grafem horzontální přímka, určená rovncí y = M a body osclují okolo ní a vykazují náhodný shluk (mrak). Asymetrcké rozdělení vykazuje nenáhodný trend. Graf symetre (osa x: M - x (), osa y: x (n+1-) - M). Pro případ symetrckého rozdělení resultuje lneární závslost s nulovým úsekem a jednotkovou směrncí. Graf špčatost (osa x : u P / pro P ' /(n % 1), osa y : ln(x (n%1&) & x () )/(&u P ). Pro normální rozdělení je grafem horzontální přímka s nulovou směrncí. Pokud body leží na přímce s nenulovou směrncí je tato směrnce odhadem parametru špčatost. Graf rozptýlení s kvantly (osa x: P, osa y: x ()). Základem je odhad kvantlové funkce výběru, který se získá spojením bodů {x(), P} lneárním úseky. Pro symetrcká rozdělení má kvantlová funkce sgmodální tvar. Pro rozdělení seškmená k vyšším hodnotám je konvexně rostoucí a pro rozdělení seškmená k nžším hodnotám konkávně rostoucí. Do grafu se zakreslují tř obdélníky: kvartlový obdélník F: na y ose kvartly F a F a na ose x pořadové pravděpodob- - - nost P = = 0.5 a 1 - = 0.75 a analogcky další dva obdélníky, oktlový obdélník E a sedeclový obdélník D. Graf umožnuje určení dagnóz: 1. Symetrcké unmodální rozdělení výběru obsahuje vždy obdélníky symetrcky uvntř sebe.. Nesymetrcká rozdělení mají pro rozdělení seškmené k vyšším hodnotám vzdálenost mez dolním hranam obdélníků F, E a D výrazně kratší než mez jejch horním hranam. 3. Odlehlá pozorování jsou ndkována tím, že na kvantlové funkc mmo obdélník D se objeví náhlý vzrůst, kdy hodnota směrnce roste nade všechny meze. 4. Vícemodální rozdělení jsou ndkována tím, že na kvantlové funkc uvntř obdélníku F je několk úseků s téměř nulovým směrncem. Hstogram (osa x: proměnná x, osa y: uměrná hustotě pravděpodobnost). Jde o obrys sloupcového grafu, kde jsou na ose x jednotlvé třídy, defnující šířky sloupců, a výšky sloupců odpovídají emprckým hustotám pravděpodobnost. Kvaltu hstogramu ovlvňuje ve značné míře volba počtu tříd L a všech délek ntervalů x. Pro přblžně symetrcká rozdělení výběru lze j D H

3 počítat L podle vztahu L = nt( n), kde funkce nt(x) označuje celočíselnou část čísla x a v šrokém rozmezí velkostí výběrů n užjeme výraz L ' nt(.46 (n & 1) 0.4 ). Jádrový odhad hustoty pravděpodobnost (osa x: x, osa y: hustota pravděpodobnost). Pro malé a střední výběry se konstruují jádrové odhady hustoty podle vztahu ˆ f(x) ' y ' g(x) ' 1 nh j n '1 K (x & x j ) h kde šířka pásu h určuje stupeň vyhlazení. Jádrová funkce K(x) je symetrcká kolem nuly a má všechny vlastnost hustoty pravděpodobnost. O kvaltě odhadu hustoty pravděpodobnost rozhoduje volba parametru h. Pro výběry velkost n z přblžně normálního rozdělení se známým rozptylem σ je optmální šířka pásu h opt '.34 σ n &0.. Kvantl-kvantlový graf (graf Q-Q) (osa x: Q (P), osa y: x ). Umožňují posoudt shodu S () výběrového rozdělení, jež je charakterzováno kvantlovou funkcí Q (P) s kvantlovou funkcí E zvoleného teoretckého rozdělení Q(P). Jako odhad kvantlové funkce výběru se využívají T pořádkové statstky x (). Př shodě výběrového rozdělení se zvoleným teoretckým rozdělením platí přblžná rovnost kvantlů x (). Q T (P ), kde P je pořadová pravděpodobnost a závslost x () na Q(P) je přblžně přímka. Korelační koefcent r je pak krtérem těsnost proložení této přímky T xy př hledání typu neznámého rozdělení. Pro porovnání rozdělení výběru s rozdělením normálním se Q-Q graf nazývá graf ranktový. Pravděpodobnostní graf (P-P graf), (osa x: P, osa y: F T (S()). Pravděpodobnostní grafy jsou alternatvou ke Q-Q grafům. Slouží k porovnání dstrbuční funkce výběru, vyjádřené přes pořadovou pravděpodobnost, se standardzovanou dstrbuční funkcí zvoleného teoretckého rozdělení. Standardzovaná proměnná je zde defnována vztahem S () ' (x () & Q)/R, kde Q je parametr polohy nebo prahová hodnota a R je parametr rozptýlení nebo-l parametr měřítka. Kruhový graf slouží k vzuálnímu ověření hypotézy, že výběr pochází ze symetrckého (nejčastěj Gaussova) rozdělení. V takovém případě je grafem regulární, konvexní polygon, blízký kružnc. Odchylky od kružnce ukazují na jné než symetrcké rozdělení výběru: (a) protáhlý elpsovtý tvar s hlavní osou, umístěnou úhlopříčně ukazuje na asymetrcké rozdělení, (b) elpsovtý tvar podél x-ové osy ukazuje na rovnoměrné rozdělení.. Ověření předpokladů o datech V prax se nejčastěj předpokládá náhodný výběr o velkost n, tj. {x}, = 1,..., n. Reprezentatvní náhodný výběr je charakterzován třem důležtým předpoklady, které je třeba před vlastní analýzou ověřt. Jsou to nezávslost, homogenta a případná normalta výběru..3 Transformace dat Pokud se na základě analýzy dat zjstí, že rozdělení výběru dat se systematcky odlšuje od rozdělení normálního, vznká problém, jak data vůbec vyhodnott. Pak je často vhodná transformace dat, která vede ke stablzac rozptylu, zesymetrčtění rozdělení a někdy k normaltě. Zesymetrčtění rozdělení výběru je možné provést užtím jednoduché (prosté) mocnnné transformace x λ λ >0 lnx pro λ ' 0 &x & λ λ <0 Mocnnná transformace však nezachovává měřítko, není vzhledem k hodnotě λ všude spojtá a hodí se pouze pro kladná data. Optmální odhad exponentu λ se hledá s ohledem na optmalzac,.

4 charakterstk asymetre, (škmost) a špčatost. K určení optmálního λ lze užít selekčního grafu dle Hnese a Hnesové. Hnesové-Hnesův selekční graf (osa x: x 0.5/x 1-P, osa y: x P/ x 0.5). Vychází z požadavků x P / x λ &λ symetre jednotlvých kvantlů kolem medánu 0.5 % x 0.5 / x 1 &P ', kde jako kvantly jsou obvykle voleny písmenové hodnoty. Podle umístění expermentálních bodů v okolí teoretckých křvek selekčního grafu lze odhadovat velkost λ a posuzovat kvaltu transformace v různých vzdálenostech od medánu. Pro přblížení rozdělení výběru k rozdělení normálnímu vzhledem k škmost a špčatost se užívá Boxovy-Coxovy transformace y ' g(x) ' x λ & 1 λ (λ 0) lnx (λ ' 0) Boxova-Coxova transformace je použtelná pouze pro kladná data. Rozšíření této transformace na oblast, kdy rozdělení dat začíná od prahové hodnoty x 0, spočívá v náhradě x rozdílem (x - x 0), který je vždy kladný. Graf logartmu věrohodnostní funkce (osa x: λ, osa y: ln L). Pro odhad λ v Boxově-Coxově transformac lze užít metodu maxmální věrohodnost s tím, že pro λ = ˆλ je rozdělení transformované velčny y normální, N(µ y, σ (y)). Po úpravách bude logartmus věrohodnostní funkce ve tvaru ln L(λ) ' & n ln s (y) % (λ & 1) j n kde s (y) je výběrový rozptyl transformovaných dat y. Průběh věrohodnostní funkce ln L = f(λ) lze znázornt ve zvoleném ntervalu např. -3 # λ # 3 a dentfkovat maxmum křvky, jehož x-ová souřadnce ndkuje ˆλ. Dva průsečíky křvky ln L(λ) s rovnoběžkou s x-ovou osou ndkují 100(1- α)%ní nterval spolehlvost parametru λ. Čím bude tento nterval spolehlvost šrší, tím je mocnnná Boxova-Coxova transformace méně výhodná. Pokud obsahuje tento nterval hodnotu λ = 1, není transformace ze statstckého hledska přínosem. Zpětná transformace: po vhodné transformac určíme ȳ, s (y) a potom pomocí zpětné transformace s využtím Taylorova rozvoje v okolí ȳ odhadneme retransformované parametry x R a s ( x R ) původních dat. Uvedený postup vede vesměs k lepším odhadům polohy a rozptylu zvláště v případech asymetrckého rozdělení. 3. Průběh průzkumové analýzy dat Průběh vlastní průzkumové, exploratorní analýzy dat (EDA) je možné lbovolně kombnovat. Předpokládá se, že rozdělení dat je normální a data as splňují předpoklady nezávslost a homogenty. Účelem je a) testování nezávslost prvků výběru - autokorelace, b) testování homogenty výběru, c) testování normalty rozdělení výběru. Z grafckých metod se k předběžné analýze rutnních dat nejčastěj užívá ranktových grafů a grafů rozptýlení s kvantly. Nejsou-l však o rozdělení dat dostupné žádné nformace nebo očekává-l se výrazně nenormální rozdělení, je vhodné provést a) průzkumovou analýzu dat s využtím grafckých dagnostk, b) určení výběrového rozdělení a jeho konstrukc. Pokud nebylo nalezeno vhodné aproxmující rozdělení, provádí se vždy mocnnná transformace nebo Boxova-Coxova transformace, která by měla zlepšt rozdělení dat. Kombnace metod závsí na konkrétních datech a konkrétních požadavcích analýzy. '1 ln x

5 4. Ilustratvní příklad Na příkladu kontroly obsahu ergosternu v calcferolu ukážeme využtí postupu průzkumové analýzy dat a vyčíslení střední hodnoty. Obsah ergosternu [%]: 0.10, 0.188, 0.680, 0.140, 0.4, 0.000, 0.31, 0.050, 0.066, 0.670, 0.55, 0.318, 0.077, 0.150, 0.10, 0.03, 0.340, 0.150, 0.410, 0.074, 0.169, 0.301, 0.080, 0.100, 0.043, 0.30, 0.151, 0.094, 0.045, 0.140, 0.130, 0.130, 0.000, 0.160, 0.90, 0.058, 0.033, 0.00, 0.490, 0.000, 0.183, 0.069, Řešení: 1. Zkoumání zvláštností dat: grafcké dagnostky ndkují vedle stupně symetre a špčatost rozdělení také odlehlé body. (a) Odhalení stupně symetre a špčatost rozdělení: celkem 1 grafckých dagnostk ndkuje symetr a špčatost rozdělení s těmto závěry: Dagram rozptýlení a rozmítnutý dagram rozptýlení Krabcový graf Kvantlový graf Graf polosum Graf symetre Graf špčatost Graf rozptýlení s kvantly Hstogram

6 Graf hustoty pravděpodobnost Ranktový Q-Q graf k vyšetření normalty P-P graf Kruhový graf 1. Dagram rozptýlení a rozmítnutý dagram rozptýlení: ukazuje na 4 až 6 odlehlých bodů v horní část dagramu.. Krabcový (vrubový) graf: v horní část je detekováno 6 odlehlých bodů. Krabce je rozdělena na dvě část medánem. Je vyznačen nterval spolehlvost medánu. 3. Kvantlový graf: je patrný velký rozdíl mez symetrckým Gaussovým a emprckým rozdělením. Tvar křvky je charakterstcký pro asymetrcké rozdělení, slně seškmené k vyšším hodnotám. 4. Graf polosum: ndkuje značnou část bodů jako vybočujících ze symetrckého rozdělení. Body ležící na medánové rovnoběžce s x-ovou osou pocházejí ze symetrckého rozdělení, ostatní body nkolv. 5. Graf symetre: ndkuje valnou část bodů jako vybočujících ze symetrckého rozdělení nebo body patřící do asymetrckého rozdělení. 6. Graf špčatost: většna bodů neleží na rovnoběžce s x-ovou osou pro symetrcké rozdělení, a proto je ndkováno rozdělení asymetrcké. 7. Graf rozptýlení s kvantly: asymetre kvantlových obdélníků obdélníků dokazuje slně asymetrcké rozdělení. Body ležící vně sedeclového obdélníka ndkuje tato pomůcka jako body odlehlé. 8. Hstogram: zřetelně ukazuje na asymetrcké rozdělení seškmené k vyšším hodnotám. 9. Jádrový odhad hustoty pravděpodobnost: ve srovnání s Gaussovým rozdělením je u emprcké křvky patrné slné seškmení k vyšším hodnotám. Emprckou křvku nelze aproxmovat symetrckým Gaussovým rozdělením. 10. Ranktový Q-Q graf: jelkož většna bodů neleží na přímce Gaussova rozdělení jde o asymetrcké rozdělení. 11. Pravděpodobnostní P-P graf: emprcká křvka nesouhlasí s žádnou křvkou symetrckého rozdělení (normálního, rovnoměrného a Laplaceova). Rozdělení je proto asymetrcké. 1. Kruhový graf: tvar elpsy dokazuje slně asymetrcké rozdělení seškmené k vyšším hodnotám. V exploratorní analýze dat umožňují kvantly a písmenové hodnoty posoudt jednak symetr výběrového rozdělení a jednak procento prvků ve výběru, např. pro procento 45 je kvantl , což znamená, že pod hodnotou leží 45% a nad 55% prvků výběru.

7 (b) Indkace lokální koncentrace dat a rozdělení výběru: aktuální výběrové rozdělení je asymetrcké, s dlouhým horním koncem s větší koncentrací bodů ve spodní část hodnot. Z analýzy kvantl-kvantlového Q-Q grafu vyplývá, že nejvyšší hodnoty korelačního koefcentu r xy = je dosaženo pro exponencální rozdělení. Určení výběrového rozdělení na základě Q-Q grafu (ADSTAT) Lnearta kvantl-kvantlovém (Q-Q) grafu y = β 0 + β 1 x: Rozdělení Směrnce β0 Úsek β1 Korelační koefcent rxy Laplaceovo E E E-01 Normální E E E-01 Exponencální E E E-01 Rovnoměrné E E E-01 Lognormální E E E-01 (c) Nalezení vybočujících prvků ve výběru: z grafckých dagnostk průzkumové (exploratorní) analýzy výběru byly nalezeny 3 až 6 podezřelých bodů, které by mohly být chápany v symetrckém rozdělení jako odlehlé. Jelkož však jde o asymetrcké rozdělení exponencální, nemá smyslu ndkovat odlehlé body.. Ověření předpokladů o datech: Reprezentatvní náhodný výběr je charakterzován třem důležtým předpoklady, které je třeba před vlastní analýzou ověřt. Z klasckých odhadů byl vyčíslen odhad artmetckého průměru x = a odhad směrodatné odchylky s = Odhad škmost ĝ 1 = 1.54 a odhad špčatost je ĝ = 5.36 ukazoval na seškmené rozdělení. (a) Ověření normalty rozdělení: Na předpokladu normalty je založena celá statstcká analýza dat. Test kombnace výběrové škmost a špčatost ukázal, že normalta výběrového rozdělení je zamítnuta na vypočtené hladně významnost 1.654E-08. (b) Ověření nezávslost prvků výběru: K dentfkac časové závslost prvků výběru nebo jné vntřní závslost se testuje významnost autokorelačního koefcentu prvního řádu podle von Neumannova testovacího krtéra t n = , které bylo nžší než krtcká hodnota t 1-α/(n+1) =.0141, a proto nezávslost prvků ve výběru byla prokázána. (c) Ověření homogenty rozdělení výběru: Homogenní výběr znamená, že všechny jeho prvky pocházejí ze stejného rozdělení s konstantním rozptylem. Vybočující měření slně zkreslují odhady polohy a zejména rozptylu s, takže zcela znehodnocují další statstckou analýzu. Testování vybočujících měření bez doplňkových nformací průzkumové analýzy dat je málo spolehlvé. Krtérum vntřních mezí určlo odlehlé body, a to bod č. 14 a 3. Doplněním nformací z průzkumové analýzy lze dentfkovat exponencální rozdělení výběru, které jž odlehlé body mít nebude, takže toto vyloučení dvou bodů nemá statstcký smysl. (d) Určení mnmálního rozsahu výběru: Uvažujeme-l 5% relatvní chybu směrodatné odchylky, bude mnmální rozsah výběru n = 18, pro 10% relatvní chybu směrodatné odchylky pak n = 110 a pro 5% relatvní chybu směrodatné odchylky bude n = Transformace dat: Jelkož se na základě průzkumové analýzy dat zjstlo, že rozdělení výběru dat se slně odlšuje od rozdělení normálního, vyvstává zde problém, jak vůbec vyhodnott odhad střední hodnoty, když nelze použít artmetcký průměr. V takovém případě je vhodná transformace dat, která vede ke stablzac rozptylu, zesymetrčtění rozdělení a v případě Box- Coxovy transformace k normaltě.

8 (a) Mocnnná transformace: Zesymetrčtění rozdělení výběru je možné provést užtím jednoduché (prosté) mocnnné transformace. Pro odhad exponentu λ se hledají optmální hodnoty charakterstk asymetre (škmost) a špčatost. K určení optmálního λ lze ale také užít orentační grafcké metody, selekčního grafu dle Hnese a Hnesové. Podle umístění expermentálních bodů v okolí teoretckých křvek selekčního grafu byla odhadnuta velkost exponentu 0.5. (b) Box-Coxova transformace: Pro přblížení rozdělení normálnímu vzhledem k škmost a špčatost se užívá Boxovy-Coxovy transformace. Pro odhad parametru λ v Boxově-Coxově transformac lze užít metodu maxmální věrohodnost s tím, že pro λ = ˆλ je rozdělení transformované velčny y nejblíže normálnímu, N(µ y, σ (y)). Průběh věrohodnostní funkce ln L = f(λ) lze znázornt ve zvoleném ntervalu např. -3 # λ # 3 a dentfkovat maxmum křvky v grafu logartmu věrohodnostní funkce tak, že x-ová souřadnce ndkuje nejlepší odhad ˆλ. Dva průsečíky křvky věrohodnostní funkce ln L(λ) s rovnoběžkou s x-ovou osou ndkují 100(1-α)%ní nterval spolehlvost parametru λ, tj. +λ D, λ H,. Jelkož tento nterval spolehlvost neobsahuje číslo +1, je mocnnná a Boxova-Coxova transformace ze statstckého hledska výhodná a má smyl j užívat. Po vhodné transformac se určí ȳ, s (y) a potom pomocí zpětné transformace s využtím Taylorova rozvoje v okolí ȳ = se odhadne retransformované parametry x R = a s R = původních dat. Uvedený postup vede vesměs k lepším odhadům polohy a rozptylu a je vhodný zvláště v případech takového asymetrckého rozdělení výběru. Mocnnná a Box-Coxova transformace (ADSTAT) Prostá mocnnná transformace, a Box-Coxova transformace (dává stejné výsledky): Odhad optmálního exponentu ˆλ 0.53 Opravený odhad průměru původních dat x R Opravený odhad směrodatné odchylky původních dat sr Spodní mez ntervalu spolehlvost původních dat LD 0.10 Horní mez mez ntervalu spolehlvost původních dat LH Závěr: Pro asymetrcké rozdělení nelze užít za odhad střední hodnoty artmetcký průměr x = se směrodatnou odchylkou s = Protože výběr pochází z exponencálního rozdělení, je nejlepším odhadem střední hodnoty retransformovaný průměr x R = s retransformovanou směrodatnou odchylkou s R = Konečně 95%ní nterval spolehlvost retransformovaného průměru bude L D= 0.10 a L H = Tomuto rgoróznímu odhadu střední hodnoty se nejvíce blíží jeho robustní odhad, a to medán = x Doporučená lteratura [1] Meloun M., Mltký J.: Statstcké zpracování expermentálních dat, PLUS Praha 1994, ISBN [] Meloun M., Mltký J.: Statstcké zpracování expermentálních dat - Sbírka úloh s dsketou, Unverzta Pardubce 1997, ISBN [3] Kupka K.: Statstcké řízení jakost, Trlobyte Pardubce 1998, ISBN X. [4] Mltký J.: Moderní statstcké metody pro žvotní prostředí, PHARE, Svazek 15, Vysoká škola báňská, Ostrava 1996, ISBN

9 Obr. 1 Přehled EDA dagnostk př analýze výběru normálního rozdělení N(10, 0.1), SPlus

10 Obr.. Přehled EDA dagnostk př analýze výběru logartmcko-normálního rozdělení LN(5, ), SPlus

Kvantily a písmenové hodnoty E E E E-02

Kvantily a písmenové hodnoty E E E E-02 Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Expermentální data se v analytcké laboratoř často vyznačují nekonstantním rozptylem, malou četností, asymetrckým rozdělením a porušením základních předpokladů, kladených

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ

Více

Nejlepší odhady polohy a rozptýlení chemických dat

Nejlepší odhady polohy a rozptýlení chemických dat Nejlepší odhady polohy a rozptýlení chemických dat Prof. RNDr. Milan Meloun, DrSc., Katedra analytické chemie, Univerzita Pardubice, 532 10 Pardubice email: milan.meloun@upce.cz, http://meloun.upce.cz

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

Statistická analýza. jednorozměrných dat

Statistická analýza. jednorozměrných dat Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza

Více

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT V OSTRAVĚ 20.3.2006 MAREK MOČKOŘ PŘÍKLAD Č.1 : ANALÝZA VELKÝCH VÝBĚRŮ Zadání: Pro kontrolu

Více

Porovnání dvou reaktorů

Porovnání dvou reaktorů Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.

Více

Analýza závislosti veličin sledovaných v rámci TBD

Analýza závislosti veličin sledovaných v rámci TBD Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá

Více

4.4 Exploratorní analýza struktury objektů (EDA)

4.4 Exploratorní analýza struktury objektů (EDA) 4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova 6 461 17 Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

Exploratorní analýza dat

Exploratorní analýza dat 2. kapitola Exploratorní analýza dat Řešení praktických úloh z Kompendia, str. 81. Načtení dat po F3. Načtená data úlohy B201 je možné v editoru ještě opravovat. Volba statistické metody v červeném menu.

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Licenční studium Galileo: Statistické zpracování dat Analýza velkých výběrů Hornův postup analýzy malých výběrů Statistické testování Statistická analýza jednorozměrných dat Semestrální práce Lenka Husáková

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných

Více

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

Metody matematické statistiky (NMAI 061)

Metody matematické statistiky (NMAI 061) Plán přednášky Metody matematcké statstky (NMAI 061) Zdeněk Hlávka Opakování: rozdělení náhodné velčny. Normální rozdělení, centrální lmtní věta. Odhady, testování hypotéz (t-test). Regresní analýza. Mnohorozměrné

Více

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno

Více

Statistická šetření a zpracování dat.

Statistická šetření a zpracování dat. Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Staré mapy TEMAP - elearning

Staré mapy TEMAP - elearning Staré mapy TEMAP - elearnng Modul 4 Kartometrcké analýzy Ing. Markéta Potůčková, Ph.D., 2013 Přírodovědecká fakulta UK v Praze Katedra aplkované geonformatky a kartografe Kartometre a kartometrcké vlastnost

Více

Postup statistického zpracování výsledků stopové analýzy při použití transformace dat

Postup statistického zpracování výsledků stopové analýzy při použití transformace dat Postup statistického zpracování výsledků stopové analýzy při použití transformace dat Milan Meloun Katedra analytické chemie, Univerzita Pardubice, 53 10 Pardubice milan.meloun@upce.cz a Jiří Militký Katedra

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i : ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství 1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometre Specální případy použtí MNČ Cvčení 8 Zuzana Dlouhá Specální případy použtí MNČ cvčení 1 7 = ekonometrcký model, který byl lneární v proměnných v parametrech MNČ můžeme použít,

Více

Modul Základní statistika

Modul Základní statistika Modul Základní statistika Menu: QCExpert Základní statistika Základní statistika slouží k předběžné analýze a diagnostice dat, testování předpokladů (vlastností dat), jejichž splnění je nutné pro použití

Více

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj. Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.

Více

Přednáška č. 11 Analýza rozptylu při dvojném třídění

Přednáška č. 11 Analýza rozptylu při dvojném třídění Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometre Specální případy použtí MNČ Cvčení 9 Zuzana Dlouhá Specální případy použtí MNČ cvčení 1 8 = ekonometrcký model, který byl lneární v proměnných v parametrech MNČ můžeme použít,

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor

Více

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)

Více

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2 Závěrečná zpráva o výsledcích expermentu shodnost ZČB 2013/2 Obsah Úvod a důležté kontakty... 2 Postupy statstcké analýzy expermentu shodnost... 4 2.1 Numercký postup zjšťování odlehlých hodnot... 4 2.1.1

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Kalibrace a limity její přesnosti Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015

Více

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU

ANALÝZA RIZIKA A JEHO CITLIVOSTI V INVESTIČNÍM PROCESU AALÝZA RIZIKA A JEHO CITLIVOSTI V IVESTIČÍM PROCESU Jří Marek ) ABSTRAKT Príspevek nformuje o uplatnene manažmentu rzka v nvestčnom procese. Uvádza príklad kalkulace rzka a analýzu jeho ctlvost. Kľúčové

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

Digitální přenosové systémy a účastnické přípojky ADSL

Digitální přenosové systémy a účastnické přípojky ADSL ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechncká LABORATORNÍ ÚLOHA Č. 2 Dgtální přenosové systémy a účastncké přípojky ADSL Vypracoval: Jan HLÍDEK & Lukáš TULACH V rámc předmětu: Telekomunkační

Více

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů.

n lokální působení různých vnějších faktorů ovlivňujících růst a zánik živých organismů n lokální variace vnitřních proměnných biologických systémů. PROSTOROVÁ AUTOKORELACE V ANALYTICKÉ CHEMII JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, 46 7 Lberec MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Autokorelace

Více

PRŮZKUMOVÁ ANALÝZA DAT (EDA)

PRŮZKUMOVÁ ANALÝZA DAT (EDA) PRŮZKUMOVÁ ANALÝZA DAT (EDA) 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č.

Více

Teorie efektivních trhů (E.Fama (1965))

Teorie efektivních trhů (E.Fama (1965)) Teore efektvních trhů (E.Fama (965)) Efektvní efektvní zpracování nových nformací Efektvní trh trh, který rychle a přesně absorbuje nové nf. Ceny II (akcí) náhodná procházka Předpoklady: na trhu partcpuje

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015 UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce ANOVA 2015

Více

Určení tlouštky folie metodou konvergentního elektronového svazku (TEM)-studijní text.

Určení tlouštky folie metodou konvergentního elektronového svazku (TEM)-studijní text. Určení tlouštky fole metodou konverentního elektronového svazku (TEM)-studjní text. Pracovní úkol: 1) Nastavte a vyfotorafujte snímek dfrakce elektronů v konverentním svazku, který je vhodný pro určení

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE Jana Valečková 1 1 Vysoká škola báňská-techncká unverzta Ostrava, Ekonomcká fakulta, Sokolská

Více

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2 Dokumentace k projektu pro předměty IZP a IUS Iterační výpočty projekt č.. lstopadu 1 Autor: Mlan Setler, setl1@stud.ft.vutbr.cz Fakulta Informačních Technologí Vysoké Učení Techncké v Brně Obsah 1 Úvod...

Více

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček Aplkace L-Ma metody na scntgrafcké vyšetření příštítných tělísek P. Karhan, P. Fala, J. Ptáček Vyšetření příštítných tělísek dagnostka hyperparatyreózy: lokalzace tkáně příštítných tělísek neexstence radofarmaka

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Příklady - Bodový odhad

Příklady - Bodový odhad Příklady - odový odhad 5. října 03 Pražské metro Přijdu v pražském metru na nástupiště a tam zjistím, že metro v mém směru jelo před :30 a metro v opačném směru před 4:0. Udělejte bodový odhad, jak dlouho

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více